Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 9 dokumen yang sesuai dengan query
cover
Lucy Kung-Shankleman
Jakarta: Radio 68H, 2003
070.92 LUC i
Buku Teks SO  Universitas Indonesia Library
cover
Oemar Syarief Wibisono
"Beras merupakan makanan pokok mayoritas masyarakat Indonesia. Jika dibandingkan dengan konsumsi tahun 2019, konsumsi beras nasional meningkat sekitar 4,67 persen pada tahun 2021. Hal ini menunjukan bahwa setiap tahun konsumsi beras nasional akan meningkat karena seiring dengan pertumbuhan jumlah penduduk Indonesia. Sehingga dibutuhkan data produksi beras yang akurat dan tepat waktu untuk dapat menjaga ketersediaan stok beras nasional. Data citra satelit bisa menjadi alternatif untuk memprediksi produksi padi dikarenakan kekurangan yang dimiliki oleh metode survei yang dilakukan oleh BPS yaitu biaya yang cukup tinggi dan terdapat tenggang waktu diseminasi data. Gabungan citra SAR dan Optik dapat meningkatkan akurasi dari model yang dibangun. Selain itu penggunaan model deep learning memiliki akurasi yang lebih baik jika dibandingkan metode machine learning konvensional salah satunya kombinasi CNN dan Bi-LSTM yang mampu mengekstraksi fitur serta memiliki kemampuan untuk memodelkan data temporal dengan baik. Output yang diperoleh dengan menggunakan metode CNNBiLSTM untuk mengklasifikasikan fase pertumbuhan padi, menghasilkan akurasi yang terbaik dengan nilai akurasi 79,57 pada data testing dan 98,20 pada data training serta F1-score 79,78. Dengan menggunakan kombinasi data citra sentinel 1 dan 2 akurasi dari model LSTM dapat ditingkatkan. Selanjutnya akurasi yang didapatkan untuk model regresi produktivitas padi masih kurang baik. Akurasi terbaik dihasilkan oleh model random forest dengan nilai MAPE 0.1336, dan RSME 0,6871.

Rice is the staple food of the majority of Indonesian people. When compared to consumption in 2019, national rice consumption will increase by around 4.67 percent in 2021. This shows that every year rice consumption will increase in line with the growth of Indonesia's population. So that accurate and timely rice production data is needed to be able to maintain the availability of national rice stocks. Satellite imagery data can be an alternative for predicting rice production due to the drawbacks of the survey method conducted by BPS, which relatively high cost and the time span for data dissemination. The combination of SAR and Optical images can increase the accuracy of the model built. In addition, the use of deep learning models has better accuracy when compared to classical machine learning methods, one of them is the combination of CNN and Bi-LSTM which are able to extract features and have the ability to model temporal data properly. The output obtained using the CNNBiLSTM method to classify rice growth phases, produces the best accuracy with an accuracy value of 79.57 on testing data and 98.20 on training data and an F1-score of 79.78. By using a combination of sentinel 1 and 2 image data, the accuracy of the LSTM model can be improved. Furthermore, the accuracy obtained for the rice production regression model is still not good. The best accuracy was produced by the random forest model with a MAPE value of 0.1336 and RSME of 0.6871."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Arief Saferman
"

Selama masa pandemi COVID-19, teknologi Automatic Speech Recognition (ASR) menjadi salah satu fitur yang sering digunakan pada komputer untuk mencatat di kelas online secara realtime. Teknologi ini akan bekerja dimana setiap suara yang muncul akan langsung dikenali dan dicatat pada halaman terminal. Dalam penelitian ini, model ASR Wav2Letter akan digunakan menggunakan CNN (Convolution Neural Network) dengan loss function CTC (Connectionist Temporal Classification) dan ASG (Auto Segmentation Criterion). Selama proses pembuatannya, berbagai hyperparameter acoustic model dan language model dari model ASR Wav2Letter terkait dengan implementasi batch normalization¸ learning-rate, window type, window size, n-gram language model, dan konten language model diuji pengaruh variasinya terhadap performa model Wav2Letter. Dari pengujian tersebut, ditemukan bahwa model ASR Wav2Letter menunjukkan performa paling baik ketika acoustic model menggunakan metode ASG dengan learning-rate 9 × 10−5 , window size 0.1, window type Blackman, serta 6-gram language model. Berdasarkan hasil akurasi WER CTC unggul 1,2% dengan 40,36% berbanding 42,11% dibandingkan ASG, namun jika dilihat lamanya epoch dan ukuran file model, loss function ASG memiliki keunggulan hampir dua kalinya CTC, dimana ASG hanya membutuhkan setengah dari jumlah epoch yang dibutuhkan oleh CTC yakni 24 epoch berbanding dengan 12 epoch dan ukuran file model ASG setengah lebih kecil dibandingkan CTC yakni 855,2 MB berbanding dengan 427,8 MB. Pada pengujian terakhir, model ASR Wav2Letter dengan loss function ASG mendapatkan hasil terbaik dengan nilai WER 29,30%. Berdasarkan hasil tersebut, model ASR Wav2Letter dengan loss function ASG menunjukkan perfoma yang lebih baik dibandingkan dengan CTC.


During the COVID-19 pandemic, Automatic Speech Recognition technology (ASR) became one of features that most widely used in computer to note down online class in real-time. This technology works by writing down every word in terminal from voice that is recognized by the system. ASR Wav2Letter model will use CNN (Convolutional Neural Network) with loss function CTC (Connectionist Temporal Classification) and ASG (Auto Segmentation Criterion). While developing Wav2Letter, various hyperparameter from acoustic model and language model is implemented such as batch normalization, learning rate, window type, window size, n-gram language model, and the content of language model are examined against the performance of Wav2Letter model. Based on those examination, Wav2Letter shows best performance when it uses ASG loss function learning rate 9 × 10−5 , window size 0.1, window type Blackman, and 6-gram language model. With that configuration, WER of CTC outplay ASG around 1.2% with 40.36% compare to 42,11%, but another parameter shows ASG are way more superior than CTC with less time epoch training which are 24 epoch for CTC against 12 epoch for ASG and the size of memory model shows CTC has bigger size than ASG with 855.2 MB against 427.8 MB. In the last test, ASR Wav2Letter model with ASG loss function get the best WER value around 29.3%. Based on those results, ASR Wav2Letter Model shows its best performance with ASG loss function than CTC.

"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Maulana Nurhendronoto
"Emosi adalah perasaan yang muncul dalam diri seseorang sebagai respon dari situasi tertentu. Perasan ini dapat memengaruhi pikiran, perilaku, dan persepsi seseorang terhadap suatu peristiwa. Klasifikasi emosi adalah bagian dari analisis sentimen yang bertujuan untuk menganalisis dan memperoleh emosi dari suatu data. Penelitian klasifikasi emosi berbasis teks perlu dilakukan karena dapat diimplementasikan pada berbagai bidang, seperti kesehatan dan pendidikan. Bahasa Indonesia menduduki peringkat 11 bahasa dengan penutur terbanyak di dunia dengan 200 juta penutur. Namun, penelitian klasifikasi emosi berbasis teks bahasa Indonesia masih sedikit dilakukan. Algoritma machine learning dapat digunakan untuk mengatasi berbagai tantangan dalam penelitian klasifikasi emosi seperti memahami emosi dan menganalisis emosi dari data yang tidak terstruktur. Penelitian ini berfokus pada pengembangan model machine learning dengan teknik convolutional neural network (CNN), long short-term memory (LSTM), dan bidirectional encoder representation from transformer (BERT). Berdasarkan pengujian yang dilakukan, metode convolutional neural network (CNN) mendapatkan F1 score sebesar 84,2%, metode long short term memory mendapatkan F1 score sebesar 82%, metode BERT en uncased mendapatkan F1 score sebesar 22%, dan metode BERT multi cased mendapatkan F1 score sebesar 32%. Hasil pengujian ini menandakan metode CNN merupakan metode dengan hasil pengujian terbaik dan BERT en uncased merupakan metode dengan hasil pengujian terburuk dibanding ketiga metode lainnya.

Emotions are feelings that arise within a person in response to a particular situation. These feelings can affect a person's thoughts, behavior, and perception of an event. Emotion classification is a part of sentiment analysis that aims to analyze and derive emotions from data. Text-based emotion classification research needs to be done because it can be implemented in various fields, such as health and education. Indonesian is ranked the 11th most spoken language in the world with 200 million speakers. However, there is still little research on Indonesian text-based emotion classification. Machine learning algorithms can be used to overcome various challenges in emotion classification research such as understanding emotions and analyzing emotions from unstructured data. This research focuses on developing machine learning models with convolutional neural network (CNN), long short-term memory (LSTM), and bidirectional encoder representation from transformer (BERT) techniques. Based on the tests conducted, the convolutional neural network (CNN) method gets an F1 score of 84,2%, the long short term memroy method gets an F1 score of 82%, the BERT en uncased method gets an F1 score of 22%, and the BERT multi cased method gets an F1 score of 32%. These results indicate that the CNN is the bets method while the BERT en uncased is the worst method compared to the three other methods."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faris Ali Yafie
"Jenis pisang di Indonesia sangat beragam dan tingkat konsumsi buah ini sangat tinggi untuk konsumsi mingguan menningkat 198,44%, untuk konsumsi tahunan meningkat 18,30%, dan dari segi produksi daya ekspornya meningkat 26,65% selama 5 tahun terakhir dari 2014-2018. Pisang banyak manfaatnya terutama saat mulai terdapat bintik hitam karena bintik ini memiliki manfaat mencegah tumbuhnya sel-sel kanker dan meningkatkan sistem kekebalan tubuh. Pisang dengan bintik hitam maupun pisang yang tidak layak konsumsi ini dapat diprediksi dengan model machine learning, seperti CNN, DenseNet, dan GoogleNet. Convolutional Neural Network (CNN) adalah pendekatan deep learning yang banyak digunakan untuk memecahkan masalah yang kompleks. Sedangkan, DenseNet adalah algoritma yang mempertimbangkan satu gambar yang dilewatkan melalui jaringan konvolusi dimana arsitekturnya memiliki konektivitas yang padat/dense connectivity. Terakhir GoogleNet adalah algoritma ini dirancang untuk bekerja dengan baik bahkan di bawah batasan yang memori yang ketat dan biaya komputasi yang terbatas. Tulisan ini menggunakan tiga pendekatan dalam percobaan perbandingan. Pendekatan pertama menjalankan model yang dibangun dengan algoritma CNN. Kedua dengan model yang dibangun dengan algoritma DenseNet. Ketiga dengan model yang dibangun dengan algoritma GoogleNet. Model terbaik digunakan untuk memprediksi dataset Kaggle dan baru, tetapi pada dataset baru terdapat noise pada data training yang berdampak negatif pada kinerja model ini sehingga hasilnya terjadi overfitting. Hasil dari model terbaik yang memuaskan diperoleh dari semua pengujian adalah model GoogleNet pada batch size 32 dan optimizer Adam dengan hasil rata-rata pada training loss di 0,0264 dan training accuracy di 99,19%, validation loss di 0,03876, validation accuracy di 99,59%, testing loss di 0,01316, dan testing accuracy di 99,66% terhadap dataset kaggle yang digunakan.

Type of bananas in Indonesia are very diverse and consumption level of this fruit is very high, for weekly consumption it increased by 198,44%, for annual consumption it increased by 18,30%, and for export production it increased 26,65% over the last 5 years from 2014-2018. Banana have many benefits, especially when dark spots begin to appear because these spots have benefit to preventing the growth of cancer cells and increasing immune system. Bananas with black spots and bananas that are not fit for consumption can be predicted by machine learning models, such as CNN, DenseNet, dan GoogleNet. Convolutional Neural Network (CNN) is a deep learning approach that is widely used to solve complex problems. Meanwhile, DenseNet is an algorithm that considers a single image that is passed through a convolution network where the architecture has dense connectivity. And GoogleNet's algorithm is designed to work well even under strict memory constraints and limited computational costs. This paper uses three approaches in a comparative experiment. The first approach is to run the model built with the CNN algorithm. The second is a model built with the DenseNet algorithm. Third with a model built with the GoogleNet algorithm. The best model is used to predict Kaggle and new datasets, but in the new dataset there is noise in the training data which has a negative impact on this model performance so that results are overfitting. The best model obtained from all tests is GoogleNet model on batch size 32 and Adam optimizer with average results on training loss at 0,0264 and training accuracy at 99,19%, validation loss at 0,03876, validation accuracy at 99, 59%, testing loss at 0,01316, and testing accuracy at 99,66% for kaggle dataset used."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Pardede, Maria Angel Margareth
"Bahasa isyarat umumnya dilakukan oleh tuna rungu dan tuna wicara yang menimbulkan kesenjangan dalam berkomunikasi khususnya saat melamar pekerjaan. Ada hambatan komunikasi yang dirasakan saat proses pencarian kerja dimana pada tahun 2020 menyebutkan bahwa penyandang disabilitas yang bekerja sebanyak 7,67 juta orang (5,98% dari total pekerja di Indonesia) dibandingkan dengan jumlah pekerja dengan disabilitas di Indonesia mencapai 720.748 orang (0,53% dari total pekerja di Indonesia) pada tahun 2022 menurut BPS (Badan Pusat Statistik). Penurunan persentase dalam lapangan kerja sebagian besar disebabkan oleh praktik perekrutan yang diskriminatif oleh banyak perusahaan. Jadi, dibutuhkan sistem deteksi bahasa isyarat yang dapat mempermudah dalam penerjemahan bahasa isyarat supaya kesempatan pengguna bahasa isyarat sama dengan semua orang dalam proses pelamaran kerja dan mendapatkan pekerjaan yang layak. Skenario pengambilan data adalah dengan 2 skenario, yaitu data non augmented dan augmented. Proses training dengan dataset yang terdiri atas 348 citra training yang lalu diaugmentasi sehingga berjumlah 1.044 citra training. Hasil pengujian dengan real-time testing dilakukan dengan evaluasi model menggunakan parameter akurasi sistem (confidence score), precision, recall, dan F1 Score untuk setiap model dimana nilai confidence score model Faster R-CNN dan RetinaNet adalah 96,67% : 93,33%. Selain itu, perbandingan nilai F1 Score untuk model Faster R-CNN dan RetinaNet adalah 0,98 : 0,97, tingkat akurasi mAP Faster R-CNN dan RetinaNet yang non augmented adalah 95,3% : 90,6%, sedangkan mAP Faster R-CNN dan RetinaNet yang augmented adalah 92,1% : 88,2%. Melalui hasil tersebut diperoleh bahwa kedua model memiliki presisi yang lebih rendah saat sudah diaugmentasi. Maka dari itu, algoritma Faster R-CNN memiliki hasil presisi lebih akurat dibandingkan algoritma RetinaNet.

Sign language is generally used by the deaf and speech impaired which causes errors in communication, especially when applying for jobs. There are communication barriers that are felt during the job search process where in 2020 it is stated that 7,67 million people with disabilities work (5,98% of total workers in Indonesia) compared to the number of workers with disabilities in Indonesia reaching 720,748 people (0,53% of total workers in Indonesia) in 2022 according to BPS (Badan Pusat Statistik). The percentage decline in employment is largely due to discriminatory hiring practices by many companies. So, a sign language detection system is needed that can make it easier to translate sign language so that sign language users have the same opportunities as everyone else in the job application process and getting a decent job. The data collection scenario is with 2 scenarios, namely non-augmented and augmented data. The training process uses a dataset consisting of 348 training images which are then augmented so that the total is 1.044 training images. Test results using real-time testing were carried out by evaluating the model using system accuracy parameters (confidence score), precision, recall, and F1 Score for each model where the Confidence Score value for the Faster R-CNN and RetinaNet models was 96,67% : 93,33%. In addition, the comparison of the F1 Score values​​for the Faster R-CNN and RetinaNet models is 0,98 : 0,97, the accuracy level of the non-augmented mAP Faster R-CNN and RetinaNet is 95,3% : 90,6%, while the mAP Faster R-CNN and augmented RetinaNet are 92,1% : 88,2%. From these results, it was found that the two models had lower precision when they were augmented. Therefore, the Faster R-CNN algorithm has more accurate precision results than the RetinaNet algorithm."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Radyatama Nugraha
"Skripsi ini merupakan pengembangan dari teknologi video surveillance system atau sistem pengawasan video. Video surveillance system yang selama ini diterapkan untuk tujuan deteksi objek menggunakan suatu metode umum yaitu dual background model. Model tersebut bekerja dengan memisahkan latar depan dan latar belakang dari suatu video frame dan memposisikan target deteksi di latar depan sebagai output. Salah satu tujuan dari skripsi ini adalah melakukan pengembangan dari sistem tersebut agar dapat mengklasifikasikan objek yang terdeteksi menjadi abandoned, stolen, dan ghost region. Untuk mencapai tujuan tersebut, digunakan metode pemelajaran mesin Mask R – CNN yang dapat melakukan segmentasi objek berbasis pemaskeran. Selain dari Mask R – CNN, terdapat model pemelajaran mesin lain yang cukup umum digunakan untuk deteksi objek dan segmentasi objek yaitu model YOLACT. Penelitian ini menggunakan video situasi natural di tempat umum seperti stasiun atau jalanan yang akan diproses menggunakan dual background model dan kemudian disegmentasi menggunakan Mask R – CNN atau YOLACT. Hasil penelitian ini diharapkan bisa membuka wawasan tentang penggunaan model pemelajaran mesin dalam aplikasi object detection, sekaligus menganalisis model mana yang paling efektif dan efisien berupa hasil kuantitatif yaitu Frame Rate per Seccond ( FPS ), waktu segmentasi, serta Intersection Over Union ( IOU ).

This thesis is an advancement in video surveillance technology. The existing video surveillance system commonly employs a dual background model for object detection. This model functions by separating the foreground and background within a video frame and positions the detected target in the foreground as the output. One of the goals of this thesis is to enhance this system to classify detected objects into abandoned, stolen, and ghost regions. To achieve this, the Mask R-CNN machine learning method is used, which can perform object segmentation based on masking. Apart from Mask R-CNN, another commonly used machine learning model for object detection and segmentation is the YOLACT model. This research utilizes natural situation videos in public places like stations or streets, processed using the dual background model and then segmented using Mask R-CNN or YOLACT. The anticipated outcome of this study is to broaden insights into the use of machine learning models in object detection applications while analyzing which model is most effective and efficient for similar applications.
"
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Singh, Vishakha
"ABSTRAK
A machine learning approach has been used in this work to categorize jewelry images into five different classes. This classification was achieved by using the convolutional neural network (CNN). The objective was to find different approaches that can be competent for the image classification and recognition. The images used in this work are drawn directly from the jewelry industries and companies. The first technique uses support vector machine along with the features that were extracted from the input images using AlexNet. The second method involves the use of Inception v3 model for performing the same. Upon experimenting, it was derived that both the approaches performed well, however, Inception v3 was found to be more successful by 0.9%. The Inception v3 was then further taken to train the dataset from scratch which resulted in better consistency."
Pathum Thani: Thammasat University, 2018
607 STA 23:4 (2018)
Artikel Jurnal  Universitas Indonesia Library
cover
Femilia Hardina Caryn
"Salah satu faktor manusia yang dapat menyebabkan kecelakaan lalu lintas adalah pengemudi yang mengantuk dan tidak fokus pada jalan yang ada di hadapannya. Tanda-tanda pengemudi yang mengantuk dapat diamati berdasarkan tiga pengukuran, yaitu uji kinerja, uji fisiologis, dan uji perilaku. Karena uji fisiologis dan kinerja cukup sulit dan mahal untuk dilaksanakan, maka uji perilaku masih menjadi pilihan yang baik untuk digunakan dalam mendeteksi rasa kantuk sejak dini. Salah satu perilaku manusia yang bisa diamati untuk mendeteksi kantuk adalah gerakan mata. Oleh karena itu, penelitian ini akan merancang suatu model untuk mendeteksi rasa kantuk pengemudi secara otomatis berdasarkan uji perilaku yang menganalisis aktivitas mata. Model yang diusulkan akan mendeteksi area mata dan kedipan berdasarkan citra wajah pengemudi menggunakan model deep learning Mask Region Convolutional Neural Network (Mask R-CNN). Kemudian, data kedipan dari masing-masing urutan gambar akan dikalkulasi menggunakan Percentage of Eyelid Closure (PERCLOS) untuk mendeteksi apakah pengemudi dalam keadaan mengantuk atau waspada. Hasil dari penelitian ini menunjukkan hasil akurasi sebesar 0,70. Selain itu, diperoleh nilai precision, recall, dan F1 score dari model Mask R-CNN yaitu 0,667 untuk precision, 0,80 untuk recall, serta 0,727 untuk F1 score.

One of the human factors that can cause traffic accidents are the drowsy drivers that do not focus on the road before them. The signs of a drowsy driver can be observed based on three measurements; performance test, physiological test, and behavioural test. Since the physiological and performance test are quite difficult and expensive to implement, the behavioural test is still a good choice to use for detecting early drowsiness. One of the human behaviours that can be observed is the eye movement. Therefore, this study will design a model for automatically detecting driver drowsiness based on a behavioural test, which analyses the eye activity. The proposed model will detect the eye area and state based on drivers’ face images using Mask Region Convolutional Neural Network (Mask R-CNN) deep learning model. Then, the blink data from each image sequence will be calculated using Percentage of Eyelid Closure (PERCLOS) to detect whether the driver is in a drowsy or alert state. The result of this research shows an accuracy score of 0,70. Besides that, the precision, recall, and F1 score are also obtained from the Mask R-CNN model, namely 0,667 for precision, 0,80 for recall, and 0,727 for F1 score."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library