Hasil Pencarian

Ditemukan 31 dokumen yang sesuai dengan query

The effect of sound masking on speech recognition

"In the current study, two experiments are reported that investigated the effects of simple white noise and mixture of white noise and other sounds on perception of speech. In both experiments, university students were recruited to listen to short sentences under various sound masking conditions. Experiment 1, where standard sets of speakers were used for both speech and masking stimuli, has shown that, compared to baseline where there was no masking sound, the participants had significantly greater difficulties in understanding the sentences where the average level of understanding was 28% for the white noise condition and 20% for the mixed noise condition in which white noise was mixed with pink noise and sounds of running water. In Experiment 2, a test model of the specially designed sound masking speaker was used to present the masking noise. Further, sounds of tweeting birds and healing music were added to the mixed noise from Experiment 1 to create the three masking noise conditions. The average level of understanding for the mixed noise condition was 14%, while that for the bird and music conditions were 24% and 30% respectively. The higher understanding rates for the latter conditions were due to lower volume of the mixed white noise in order to keep the overall volume including the birds and music at 55dB. There were also significant effects of sentence type and reading voice gender, suggesting that auditory legibility does not solely depend on the speech-to-noise sound level ratio, but also on other variables, such as, predictability of the sentences, and clarity of the speech. Feedback at the end of the sessions revealed that the participants found mixed noise less irritating than pure white noise, and they preferred mixed noise with bird tweeting or music even better. Thus, it was concluded that mixed noise with occasional sounds of tweeting birds, was the most suitable masking sound for commercial use, being efficient and not unpleasant."

WAGLFOR

Artikel Jurnal Universitas Indonesia Library

Li, Qia

Speaker authentication

"This book examines use of the voice as a biometric measure for personal authentication, offering an overview of advances in speaker authentication, and including useful algorithms and techniques for improving overall system robustness and performance."

Berlin: [Springer-Verlag, ], 2012

e20397868

eBooks Universitas Indonesia Library

Perancangan sistem akses basis data melalui perintah lisan bahasa indonesia Herry Sujaini,Arif B.Putra N.,Fitri Imansyah

Artikel Jurnal Universitas Indonesia Library

Analisis performansi recognition experimental system (RES) untuk Bahasa Indonesia

"Sistem pengenalan ucapan atau Speech Recognition merupakan salah satu teknologi yang dapat mempermudah cara manusia berinteraksi dengan mesin/komputer melalui ucapan. Recognition Experimental System (RES) merupakan sebuah sistem aplikasi Speech Recognition yang menerapkan metode HMM dalam mengenali ucapan man usia. Untuk mendapatkan kemampuan yang ideal dari sistem tersebut terdapat beberapa faktor yang berpengaruh terhadap sistem pengenalan ucapan yaitu faktor jumlah file pelatihan, dialek pembicara, jumlah parameter ekstraksi yang dapat merepresentasikan ciri dari sebuah ucapan serta arsitektur Hidden Markov Model (HMM) yang digunakan. Penelitian ini merupakan pengembangan dari penelitian terdahulu, yang menitikberatkan pada model Bahasa Indonesia yang diterapkan di sistem pengenalan ucapan RES. Dikarenakan banyak dialek bahasa daerah di Indonesia yang berpengaruh terhadap pengucapan Bahasa Indonesia baku, sehingga penelitian ini fokus pada analisis terhadap pengaruh dialek pembicara dalam sistem pengenalan ucapan yang diujikan pad a 4 model HMM yang berbeda. Berdasarkan hasil pengujian, menunjukkan bahwa variasi parameter- parameter yang diekstrak, model HMM yang digunakan serta jumlah state HMM yang optimal berpengaruh terhadap tingkat keberhasilan sistem dalam mengenali ucapan berbahasa Indonesia."

620 JURTEL 15:2 (2010)

Artikel Jurnal Universitas Indonesia Library

Amalia Zahra

Penyusunan kamus fonetik dalam pengembangan sistem pengenalan suara otomatis untuk bahasa Indonesia

"Dengan adanya internet, media televisi, dan radio, data yang tersedia sangat banyak, termasuk data suara. Oleh karena itu, dibutuhkan suatu cara untuk mengorganisasikannya, yakni dengan mengubah data suara menjadi teks terlebih dahulu. Pengolahan selanjutnya cukup dilakukan terhadap teks. Proses konversi data suara menjadi teks inilah yang dikenal dengan sistem pengenalan suara (SPS) otomatis.

Saat ini, SPS untuk berbagai bahasa di dunia telah berkembang pesat, seperti Bahasa Inggris, Perancis, Jepang, Thai, dan lain-lain, sedangkan penelitian SPS untuk Bahasa Indonesia sudah dimulai, namun masih dalam tahap awal. Adanya kebutuhan akan SPS dan perkembangan SPS bahasa lain yang pesat memotivasi penulis untuk melakukan penelitian SPS untuk Bahasa Indonesia.

Fokus penelitian ini adalah pembuatan model akustik yang berkaitan erat dengan kamus fonetik yang digunakan. Oleh karena itu, penulis melakukan eksperimen menggunakan enam jenis kamus fonetik, yaitu IPA, SAMPA, ARPABET, Lestari [LEST06], Sakti [SAKT08], dan kamus yang dikembangkan oleh penulis (kamus Zahra). Eksperimen terbagi menjadi dua proses besar, yaitu pelatihan, dengan menggunakan 1.000 data suara rekaman telepon, dan pengujian terhadap 250 data suara rekaman telepon.

Hasil eksperimen menunjukkan bahwa akurasi SPS tertinggi diperoleh saat menggunakan kamus Zahra, yakni sebesar 73,5%. Dengan menggunakan kamus fonetik yang sama, pengujian terhadap 100 berkas rekaman berita RRI menghasilkan akurasi maksimum sebesar 71,6% dengan OOV (Out of Vocabulary) sebesar 8,92%. Kamus tersebut merupakan kamus fonetik yang paling tepat untuk mendefinisikan bunyi dalam Bahasa Indonesia, dengan total simbol yang digunakan adalah 33 simbol."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Fadhilah Siti Shalihah

Pengembangan Sistem Penilaian Ujian Lisan (SIPENILAI) dalam Bahasa Jepang Menggunakan Algoritma Latent Semantic Analysis (LSA) = The Development of the Oral Examination Assessment System (SIPENILAI) in Japanese Using Latent Semantic Analysis (LSA) Algorithm

" E-learning dalam dunia pendidikan sudah banyak diterapkan untuk meningkatkan mutu pendidikan salah satunya adalah penggunaan e-learning pada pengujian akademis baik ujian pilihan ganda, esai, dan lisan. Proses penilaian jawaban ujian mahasiswa masih secara manual maka dari itu, penilitian membahas pengembangan Sistem Penilaian Ujian Lisan atau SIPENILAI dalam bahasa Jepang dengan menerapkan API google speech recognition dan metode LSA. SIPENILAI merupakan sistem yang dikembangkan oleh Departemen Teknik Elektro yang bertujuan untuk menilai ujian lisan secara otomatis. Speech recognition yang akan diterapkan memakai API google speech recognition yang merupakan API yang digunakan untuk mendeteksi suara yang kemudian diubah menjadi teks. Algoritma LSA merupakan metode yang digunakan untuk menganalisa kemiripan antara kalimat dengan dokumen jawaban dari pengajar. Kata dalam kalimat akan disusun menjadi matriks kemudian diproses dengan SVD (Singular Value Decomposition) dan diukur kemiripan antara kalimat dengan dokumen jawaban menggunakan Frobenius Norm. Dari pengujian yang telah dilakukan SIPENILAI dapat mencapai rata-rata akurasi sebesar 83.64% untuk pengguna fasih dan 76.89% untuk pengguna tidak fasih.

E-learning in the world of education has been widely applied to improve the quality of education one of which is the use of e-learning in academic testing both multiple choice exams, essays, and oral. The process of evaluating student exam answers is still manual and therefore the research, discussing the development of the Oral Examination Assessment System or SIPENILAI in Japanese by implementing Google API speech recognition and LSA methods. SIPENILAI is a system developed by the Department of Electrical Engineering which aims to assess oral examinations automatically. Speech recognition that will be implemented using Google API speech recognition which is an API that is used to detect sound which is then converted into text. LSA algorithm is a method used to analyze the similarity between sentences and the document answers from the teacher. The words in the sentence will be arranged into a matrix and then processed with SVD (Singular Value Decomposition) and measured the similarity between the sentence with the answer document using Frobenius Norm. From testing that has been done, SIPENILAI can reach an average accuracy of 83.64% for fluent users and 76.89% for non-fluent users."

Depok: Fakultas Teknik Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Armando Yonathan

Perolehan informasi dokumen suara pembicaraan berdasarkan hasil dari sistem pengenalan suara untuk bahasa indonesia

"Informasi yang terdapat saat ini tidak hanya terbatas disimpan dalam bentuk dokumen teks saja, tetapi banyak juga dalam bentuk dokumen suara. Banyaknya informasi yang disimpan dalam bentuk dokumen suara menyebabkan diperlukannya teknik perolehan informasi yang dapat diterapkan kepada koleksi dokumen tersebut. Pendekatan yang banyak dilakukan adalah dengan menggunakan hasil pengenalan suara oleh Sistem Pengenalan Suara Otomatis (SPSO). Tetapi, hasil pengenalan suara oleh SPSO tidak sepenuhnya benar sehingga menurunkan tingkat akurasi perolehan informasi dokumen suara. Pada penelitian ini penulis mencoba empat jenis hasil pengenalan suara untuk melakukan perolehan informasi dokumen suara, yaitu 1-best output, n-best word output, n-best pronounciation output, word posterior lattice. Selain itu, penulis juga mencoba tiga jenis kueri pada penelitian ini, yaitu kueri satu kata, kueri frase dua kata dan kueri kalimat. Hasil yang didapat pada penelitian ini menyimpulkan bahwa penggunaan 1-best output pada perolehan informasi dokumen suara menghasilkan kinerja yang lebih baik dibandingkan penggunaan hasil pengenalan suara yang lain. Mean Average Precision (MAP) hasil eksperimen dengan 1-best output lebih besar 0.64% dibandingkan penggunaan n-best output , 8,88% lebih besar dibandingkan penggunaan word posterior lattice dan lebih besar 92.68% dibandingkan penggunaan n-best pronounciation output. Pada eksperimen dengan kueri frase, sistem dengan akurasi terbaik adalah sistem yang menggunakan word posterior lattice. Pada eksperimen dengan kueri satu kata dan kueri kalimat, sistem yang menggunakan n-best word output menghasilkan kinerja terbaik.

The information today is not only limited in the form of text documents, but also in the form of spoken documents. The growing number of those spoken documents requires the information retrieval techniques to make the retrieval process easier. The approach for spoken documents retrieval is using automatic speech recognition (ASR). However, the results of the speech recognition by ASR are not entirely correct, so reduce the level of accuracy of information retrieval of spoken documents. This experiment uses four types results of the speech recognition by ASR, the 1-best output, n-best output, n-best pronunciation output, word posterior lattice. In addition, this experiment also investigates the effect of the use of query types (phrase, single word and sentence). Results obtained from this experiment concluded that the use of 1-best output on spoken document retrieval produces better performance results than the use of other results of the speech recognition. Mean Average Precision (MAP) results of experiments with 1-best output is 0.64% higher than the use of n-best output, 8.88% higher than the use of word posterior lattice and 92.68% higher than the use of n-best pronunciation output. In phrase based query experiment, the best accuracy is word posterior lattice while the best accuracy in single word query and sentence query is n-best word output."

Depok: Universitas Indonesia, 2009

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Siahaan, Edison Pardengganan

Segmentasi dokumen teks berbahasa Indonesia menggunakan metode text tiling

"Penelitian yang dilakukan pada tesis ini dimotivasi oleh adanya kebutuhan untuk dapat melakukan pengelolaan informasi pada dokumen suara khususnya berita berbahasa Indonesia. Informasi pada dokumen suara berita berbahasa Indonesia dapat diubah menjadi informasi berbentuk dokumen teks, dengan menggunakan perangkat lunak Automatic Speech Recognition (ASR). Pada penelitian ini perangkat ASR yang digunakan adalah perangkat ASR Sphinx 4.

Penggunaan perangkat Sphinx 4 ini didasari telah dilakukannya penelitian tentang transkripsi dokumen suara berbahasa Indonesia menggunakan perangkat ini. Hasil keluaran dari ASR berupa dokumen teks yang tidak memiliki batasan akhir dan tidak tersegmentasi secara jelas, tentu menyulitkan dalam pengolahan data teks tersebut. Dalam kerangka itu, maka penelitian yang dilakukan pada tesis ini ditujukan untuk mengetahui metode yang efektif dalam melakukan segmentasi hasil transkripsi berita suara berbahasa Indonesia. Metode yang akan diuji pada penelitian ini adalah metode TextTiling berbasis perbandingan blok dengan pembobotan TF-IDF-Mutual Information, TF-IDFMutual Information-Word Similarity, TF-IDF-Word Frequency, TF-IDF, Latent Semantic Analysis dan metode TextTiling berbasis Vocabulary Introduction. Segmentasi dilakukan untuk berita teks dan dokumen teks hasil transkripsi berita suara yang telahdikatagorikan menjadi 5 topik yaitu topik politik, sosial budaya, ekonomi, hukum dan olah raga. Hasil pengujian terhadap masing-masing teknik pembobotan menunjukkan bahwa metode segmentasi TextTiling dengan teknik pembobotan TF-IDF-Word Frequency merupakan metode segmentasi yang paling baik untuk dipakai dalam melakukan segmentasi hasil transkripsi dari perangkat pengenal suara (Automatic Speech Recognition). Pada penelitian ini telah dibuktikan bahwa teknik pembobotan TF-IDF-Word Frequency memiliki ketepatan segmentasi lebih tinggi baik pada dokumen teks hasil transkripsi (81,4%) ataupun pada dokumen berita teks (73,3%). Metode segmentasi yang dilakukan pada penelitian ini dapat terus dikembangkan menggunakan teknik-teknik lain dalam menunjang proses segmentasi hasil transkripsi berita berberbahasa Indonesia, seperti mempergunakan metode-metode optimalisasi dalam memperoleh urutan batas segmen yang optimal."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009

T-804

UI - Tesis Membership Universitas Indonesia Library

Kondo, Kazuhiro

Subjective quality measurement of speech: its evaluation, estimation and applications

"This practical hands-on book shows speech intelligibility measurement methods so that the readers can start measuring or estimating speech intelligibility of their own system. The book also introduces subjective and objective speech quality measures, and describes in detail speech intelligibility measurement methods. It introduces a diagnostic rhyme test which uses rhyming word-pairs, and includes : an investigation into the effect of word familiarity on speech intelligibility. Speech intelligibility measurement of localized speech in virtual 3-D acoustic space using the rhyme test. Estimation of speech intelligibility using objective measures, including the ITU standard PESQ measures, and automatic speech recognizers."

Berlin: [, Springer], 2012

e20398888

eBooks Universitas Indonesia Library

Elmahdy, Mohamed

Novel techniques for dialectal Arabic speech recognition

"Novel techniques for dialectal Arabic speech describes approaches to improve automatic speech recognition for dialectal Arabic. Since speech resources for dialectal Arabic speech recognition are very sparse, the authors describe how existing Modern Standard Arabic (MSA) speech data can be applied to dialectal Arabic speech recognition, while assuming that MSA is always a second language for all Arabic speakers. "

New York: [, Springer], 2012

e20418294

eBooks Universitas Indonesia Library

<< 1 2 3 4 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian