Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Bayu Satria Persada
"Perkembangan Artificial Intelligence (AI) sudah berkembang pesat. Dari ketiga arah pengembangan AI yakni computer vision, speech processing dan natural language processing. Speech processing memiliki tren paling rendah di antara ketiga pengembangan tersebut. Meskipun begitu pengembangan di bidang speech processing seperti speech recognition dan keyword spotting sudah banyak di implementasikan seperti model keyword spotting menggunakan Convolutional Neural Network (CNN) di microcontroller, mobile device dan perangkat lainnya. Namun CNN saja belum tentu menghasilkan akurasi yang tinggi maka dicoba Depthwise Separable Convolutional Neural Network (DSCNN) untuk mendapatkan hasil dengan akurasi yang lebih tinggi. Pengembangan model keyword spotting belum banyak diimplementasikan di edge device lainnya, yang dimaksud dengan edge device yaitu perangkat sederhana di sisi pengguna yang kemampuan komputasinya terbatas. Dengan menggunakan DSCNN menunjukkan nilai F1 score yang dibandingkan dengan model CNN. Model DSCNN menghasilkan model dengan nilai F1 score paling optimal dengan 4 layer konvolusi depthwise separable, menggunakan filter konvolusi sebanyak 256 dengan jumlah filter konvolusi depthwise 512 menggunakan optimizer RMSprop dan menggunakan batch size berukuran 126. Dari hasil pengujian dapat diketahui bahwa secara umum DSCNN menghasilkan F1 score yang lebih baik dibandingkan CNN yaitu sebesar 31,8% dengan CNN sebesar 28,35%. Namun DSCNN menggunakan sumber daya yang lebih banyak dan lebih lama waktu responsnya.
......The development of Artificial Intelligence (AI) has grown rapidly. Of the three directions of AI development, namely computer vision, speech processing, and natural language processing. Speech processing has the lowest trend among the three developments. However, many developments in speech processing such as speech recognition and keyword spotting have been implemented, such as the keyword spotting model using the Convolutional Neural Network (CNN) in microcontrollers, mobile devices, and other devices. However, CNN alone does not necessarily produce high accuracy, so a Depthwise Separable Convolutional Neural Network (DSCNN) is used to get results with higher accuracy. The development of the keyword spotting model has not been widely implemented in other edge devices, which is meant by edge devices, namely simple devices on the user's side with limited computing capabilities. Using DSCNN shows the F1 score which is compared with the CNN model. The DSCNN model produces a model with the most optimal F1 score with 4 layers of convolution depthwise separable, using a convolution filter of 256 with a convolution depthwise filter of 512 using the RMSprop optimizer and using a batch size of 126. From the test results, in general DSCNN produces F1 score which is better than CNN, which is 31,8% with CNN at 28,35%. However, DSCNN uses more resources and a longer response time."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anandwi Ghurran Muhajjalin Arreto
"Artificial Intelligence (AI) telah berkembang sangat pesat sehingga sudah sering terlihat dan digunakan secara umum oleh masyarakat. Salah satu jenis AI yang sering digunakan adalah speech recognition terutama keyword spotting yang disebabkan karena pandemi COVID-19. Implementasi keyword spotting dapat diterapkan pada lift sebagai sistem navigasi agar para pengguna lift tidak perlu melakukan kontak pada tombol, melainkan dapat menggerakkan lift hanya dengan mengucapkan lantai yang dituju. Metode untuk melakukan implementasi keyword spotting pada sistem lift dapat dilakukan dengan banyak metode, namun pada skripsi ini, metode yang diujikan adalah CNN (Convolutional Neural Network) dan MHAtt RNN (Multihead Attention Recurrent Neural Network). Penelitian yang dilakukan memiliki batasan untuk setiap metode agar dapat melakukan klasifikasi enam keyword dan melihat performa kedua metode dalam berbagai skenario yang dapat terjadi dalam lift. Dalam pembentukan model dari MHAtt RNN, dapat diketahui bahwa model memiliki performa terbaik ketika dibentuk dengan jumlah head untuk attention sebesar 8 dan LSTM dengan jumlah unit sebanyak 32. Pelatihan pada model dilakukan menggunakan optimizer Adam dengan learning rate sebesar 0.001 dan decay 0.005 agar pelatihan dapat menghasilkan model yang paling baik. Setelah melakukan pengujian pada berbagai skenario yang dapat terjadi di dalam sebuah lift, didapatkan hasil bahwa secara keseluruhan model CNN memiliki performa yang lebih baik dibandingkan model MHAtt RNN karena memiliki nilai F1-score dan precision yang lebih tinggi.
......Artificial Intelligence (AI) has grown so rapidly that it has often been seen and used in general by the public. One type of AI that is often used is speech recognition, especially keyword spotting caused by the COVID-19 pandemic. The implementation of keyword spotting can be applied to elevators as a navigation system so that elevator users do not need to make contact with buttons but can move the elevator just by saying the intended floor. There are many methods to implement keyword spotting in elevator systems, but in this thesis, the methods tested are CNN (Convolutional Neural Network) and MHAtt RNN (Multihead Attention Recurrent Neural Network). The research conducted has limitations for each method in order to be able to classify six keywords and see the performance of both methods in various scenarios that can occur in an elevator. In forming the model from MHAtt RNN, it can be seen that the model has the best performance when it is formed with the number of heads for attention of 8 and the LSTM with the number of units of 32. The training on the model is carried out using the Adam optimizer with a learning rate of 0.001 and a decay of 0.005 so that the training can produce the best models. After testing on various scenarios that can occur in an elevator, the results show that the CNN model overall has better performance than the MHAtt RNN model because it has a higher F1-score and precision."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library