Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 88050 dokumen yang sesuai dengan query
cover
Ananda Budi Prasetya
"Perolehan informasi Web adalah cabang perolehan informasi yang mengkhususkan pencarian informasi terhadap dokumen Web. Dokumen yang terdapat pada lingkungan Web memiliki struktur yang berbeda dengan dokumen teks biasa, sehingga menyebabkan pendekatan perolehan informasi pada dokumen Web berbeda dengan dokumen biasa. Pada penelitian ini digunakan koleksi dokumen EuroGOV yangmerupakan koleksi dokumen Web multibahasa yang digunakan pada WebCLEF, dan kueri atau topik yang digunakan adalah kueri yang diberikan pihak WebCLEF. Koleksi dokumen dan kueri yang digunakan terdiri dari 15 bahasa Eropa. Pada penelitian ini dipelajari pengaruh berbagai teknik perolehan informasi, yaitu operator kedekatan kata, umpan balik relevan semu, pendeteksian bahasa, analisis pranala, PageRank, dan pengelompokan dokumen, terhadap hasil perolehan informasi Web multi bahasa yang dihasilkan teknik-teknik tersebut. Selain itu pada penelitian ini juga dipelajari kemampuan dari sistem perolehan informasi Indri Search Engine dalam mencari dan memperoleh dokumen Web multibahasa.
Penelitian ini menemukan bahwa dengan melakukan evaluasi secara umum tanpa melihat bahasa, kenaikan nilai perolehan hanya didapatkan dengan menggunakan teknik pendeteksian bahasa sebesar 0.72% dan teknik umpan balik relevan semu sebesar 1.02% - 1.61%. Sedangkan pada teknik analisis pranala, PageRank, dan pengelompokan dokumen, nilai perolehan informasi yang didapatkan menurun sebesar -46.3431% - -0.60%. Dengan melakukan evaluasi berdasarkan bahasa, didapatkan bahwa setiap teknik yang diteliti dan dipelajari memiliki keunggulan masing-masing berdasarkan bahasa. Untuk teknik pengurutan ulang pendeteksian bahasa, peningkatan nilai perolehan informasi terdapat pada 6 bahasa sebesar 0.1478% - 27.1431%, dan penurunan terdapat pada 10 bahasa sebesar -0.7066% - -0.0156%. Untuk teknik analisis pranala dalam, peningkatan nilai perolehan informasi terdapat pada 4 bahasa sebesar 6.5585% - 77.1804%, dan penurunan terdapat pada 4 bahasa sebesar -60.9202% - -0.3339%, dan untuk analisis pranala luar terdapat kenaikan pada 9 bahasa sebesar 0.7151% - 134.9881%, dan penurunan terdapat pada 6 bahasa sebesar -23.2941% - -1.6330%, sedangkan untuk kombinasi analisis pranala dalam dan luar terdapat pada 5 bahasa sebesar 0.2809% - 100%, dan penurunan terdapat pada 10 bahasa sebesar -92.0830% - -3.1030%. Untuk teknik PageRank, peningkatan nilai informasi masi terdapat pada 4 bahasa sebesar 5.1083% - 77.1804%,dan penurunan terdapat pada 10 bahasa sebesar -96.4844% - -2.6968%. Dan untuk pengelompokan berdasarkan bahasa, peningkatan nilai informasi terdapat pada 3 bahasa sebesar 3.6440% - 38.7337%, dan penurunan terdapat pada 9 bahasa sebesar -53.6322% - -1.6715%. Untuk pengelompokan berdasarkan topik, peningkatan tertinggi terdapat pada satu bahasa, yaitu Spanyol sebesar 12.4754% dan penurunan terdapat pada 5 bahasa sebesar -97.5600% - -35.6133%. Untuk teknik umpan balik relevan semu, peningkatan nilai perolehan informasi terdapat pada 7 bahasa sebesar 0.0472% - 5.1523%, penurunan hanya terdapat pada dua bahasa sebesar -4.2597% - -0.2760%. Berdasarkan penelitian ini disimpulkan bahwa sistem perolehan in- formasi Indri Search Engine dapat mencari dan memperoleh dokumen Web multibahasa dengan baik, dan teknik perolehan Web standar dapat diterapkan juga pada koleksi dokumen Web multibahasa."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Arvin Christian
"ABSTRAK
Salah satu hal yang dibutuhkan user dalam memudahkan melakukan adalah dengan menggunakan mesin pencarian atau yang disebut search engine. Search engine didesain agar dapat membantu pengguna dalam melakukan pencarian data. Fitur yang dapat digunakan dalam membantu pencarian data adalah Text Suggestion dan Text Correction. Text Suggestion dapat membantu pengguna dalam memperkirakan keyword apa yang akan ditulis untuk menemukan data yang paling sesuai. Text Correction adalah fitur untuk memperbaiki kesalahan penulisan, sehingga diharapkan dapat memperbaiki hasil pencarian. Levenshtein Distance, dapat digunakan untuk fitur Text Suggestion dan Correction dengan menghitung maksimum LD dengan variasi range dari satu sampai lima. Tujuan penelitian ini adalah menguji keakuratan Levenshtein Distance dalam membuat sistem Text Suggestion dan Text Correction. Metode yang digunakan adalah dengan menghitung tingkat kemiripan keyword dengan daftar referensi yang ada pada basis data, dan mengambil kata tersebut untuk dijadikan sebagai text suggestion maupun text correction. Dari hasil penelitian ini, akan didapatkan bahwa sebuah batasan maksimum Levenshtein Cost dapat mempengaruhi keakuratan hasil text correction dan text suggestion. Maksimum LD juga berpengaruh pada performa waktu baik pada Text suggestion dan Text Correction, dengan eksekusi waktu Text Correction lebih cepat dibanding Text Suggestion.Nilai maksimum LD yang optimal adalah dua atau tiga.

ABSTRACT
One of the things required by the user in facilitating the search for data contained on the internet is to use a search engine or so-called search engines. Search engines must also be designed in order to assist users in searching data. Features that can be used in assisting data retrieval are Text Suggestion and Text Correction. Text Suggestion can help users in predicting what keywords will be written to find the most appropriate data. Text Correction is a feature to correct writing errors, so it is expected to improve search results. By utilizing Levenshtein Distance, it can be used for Text Suggestion feature by calculating maximum LD with variation range from one to five. The purpose of this research is to test the accuracy of Levenshtein Distance algorithm in making Text Suggestion and Text Correction system. The method used is to calculate the level of similarity of the keyword with a list of references in the database, and take the word to be used as a text suggestion or text correction. From the results of this study, it will be found that a maximum limit Levenshtein Cost can affect the accuracy of the results of text correction and text suggestion.The optimum of Maximum LD is two or three."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rama Rizki
"Tema sentral dari penelitian ini adalah ?Perolehan Informasi Lintas Bahasa? yang merupakan salah satu cabang dari perolehan informasi yang berhubungan dengan masalah dalam menyajikan suatu kueri dari satu bahasa dan memperoleh dokumen dalam satu bahasa ataupun beberapa bahasa yang lain. Penelitian ini mempelajari pengaruh teknik-teknik perolehan informasi lintas bahasa pada proses penerjemahan kueri. Teknik tersebut digunakan untuk mengurangi keambiguan pada kueri terjemahan sehingga dapat mendekati proses perolehan informasi satu bahasa. Teknik yang digunakan terdiri dari teknik perbaikan kueri sebelum penerjemahan, perbaikan terjemahan oleh kamus, dan pengelompokan dokumen, serta teknik perbaikan kueri dengan melakukan perluasan. Teknik perbaikan kueri sebelum penerjemahan menggunakan teknik pengelompokan kata. Teknik perbaikan terjemahan kamus terdiri dari penerjemahan langsung, penerjemahan dengan menggunakan terjemahan yang muncul berulangkali pada setiap kamus, dan teknik pengelompokan dokumen. Teknik perluasan kueri menggunakan umpan balik relevan semu. Teknik-teknik tersebut berbasiskan teknik perolehan informasi lintas bahasa Inggris-Indonesia menggunakan kamus dwi-bahasa. Teknik-teknik yang diterapkan untuk perolehan informasi lintas bahasa Inggris-Indonesia tidak dapat mendekati hasil perolehan informasi satu bahasa (Indonesia). Secara keseluruhan, hasil yang dicapai pada teknik untuk mengurangi keambiguan terjemahan mencapai hanya 63.84% terhadap perolehan informasi satu bahasa. Sedangkan penerapan teknik perluasan kueri hanya mencapai 47.56% terhadap perolehan informasi satu bahasa. Penerapan teknik perbaikan terjemahan mempergunakan kamus dwi-bahasa Inggris-Indonesia hanya dapat menghasilkan nilai hasil perolehan informasi tertinggi sebesar 60.80% terhadap hasil perolehan informasi satu bahasa (Indonesia). Pada penerapan teknik perbaikan kueri sebelum penerjemahan yang dikombinasikan dengan teknik perbaikan terjemahan oleh kamus, dapat ditemukan peningkatan nilai hasil perolehan informasi antara 2.63% - 2.84% bila dibandingkan dengan hasil perolehan informasi untuk teknik perbaikan terjemahan oleh kamus. Pada penerapan perluasan kueri menggunakan teknik umpan balik relevan semu terhadap hasil penerjemahan dengan teknik-teknik lain, dapat ditemukan bahwa teknik ini tidak dapat menaikkan hasil perolehan informasi. Hasil terbaik yang diperoleh pada perluasan kueri adalah pada teknik yang menggunakan kombinasi perluasan kueri pada perbaikan kueri sebelum penerjemahan dan perluasan kueri pada perbaikan hasil penerjemahan yang mencapai hasil perolehan informasi sebesar 47.56% terhadap perolehan informasi satu bahasa."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Sutanto Sugii Joji
"Semakin banyaknya dokumen pembicaraan menimbulkan kebutuhan untuk melakukan pencarian terhadap dokumen pembicaraan. Akan tetapi, metode perolehan informasi untuk dokumen teks tidak dapat langsung diterapkan pada dokumen pembicaraan. Isi dari dokumen pembicaraan adalah sinyal suara. Sinyal suara ini harus diproses terlebih dahulu agar didapat isi dari pembicaraan. Proses ini dinamakan pengenalan pembicaraan. Sistem perolehan informasi pembicaraan adalah sebuah sistem yang mengimplementasi teknik-teknik perolehan informasi dan menerapkannya kepada dokumen pembicaraan. Sinyal suara yang ada pada dokumen pembicaraan diproses terlebih dahulu dengan proses pengenalan pembicaraan agar didapat teks transkripsi pembicaraan. Sistem perolehan informasi pembicaraan melakukan pembuatan indeks berdasarkan teks pembicaraan hasil pengenalan pembicaraan.
Penelitian ini menggunakan tiga koleksi dokumen. Koleksi pertama berisi 250 dokumen pembicaraan yang didapat dari pembicaraan telepon. Koleksi ini telah dibersihkan dari noise. Koleksi kedua berisi 100 dokumen pembicaraan yang didapat dari pembicaraan radio Pro3 Radio Republik Indonesia. Koleksi ketiga berisi 29.575 dokumen yang berasal dari pembicaraan telepon. Koleksi ketiga tidak dibersihkan dari noise. Word Error Rate dari tiap-tiap koleksi adalah 26.50%, 28.40%, dan 74.20%. Teknik-teknik yang diujicobakan adalah pembuatan indeks dengan masukan hasil pengenalan pembicaraan (Transkripsi), lima alternatif kata hasil pengenalan (Transkripsi-5), alternatif kata hasil pengenalan dengan probabilitas tinggi (Transkripsi-AB), pemetaan kata hasil pengenalan terhadap kamus pengucapan untuk mendapatkan rangkaian fonem (Transkripsi-Fonem), dan rangkaian fonem 3-gram (Transkripsi-3-gram). Selain dengan pengenalan pembicaraan, penelitian ini juga mencoba memberikan variasi pembuatan indeks dengan masukan dari hasil pengenalan pembicaraan yang telah dimodifikasi agar dapat mengenali fonem (Fonem). Setelah mendapatkan hasil fonem, rangkaian 3-gram juga dibuat dari hasil fonem yang didapat (Fonem-3-gram). Penelitian ini juga melakukan eksperimen dengan cara penggabungan indeks kata dan indeks."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Riama Flora L.M.
"Penelitian mengenai pengindeksan pada Google telah dilakukan dari bulan Januari hingga Agustus 2003. Tujuannya adalah untuk mengetahui cara Google mengindeks halaman web yang muncul pada pencarian dengan menggunakan kata kunci bidang pembangunan ekonomi dan sosial.Pengumpulan data dilakukan dengan menggunakan teknik eksperimen dan observasi. Eksperimen dilakukan dengan mengadakan pengujian bertingkat terhadap hasil pencarian di Google. Eksperimen dilakukan untuk mengetahui bahasa indeks dan sistem pengindeksan yang diterapkan pada search engine Google.Hasil penelitian menunjukkan bahwa Google menggunakan bahasa indeks alamiah dan sistem pengindeksan pasca-koordinasi. Hasil ini menunjukkan beberapa kelemahan pada pencarian di Google. Penulis mencoba memberikan beberapa solusi untuk memperbaiki kelemahan tersebut."
Depok: Universitas Indonesia, 2003
S15559
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anisa Hasna Nabila
"Manajemen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) memiliki kebutuhan akan data alumni dalam jumlah yang cukup besar. Data yang dibutuhkan juga beragam dan ditujukan untuk berbagai kepentingan, diantaranya adalah kepentingan akreditasi akademik serta kerja sama akademik. Sayangnya, data alumni yang tersimpan pada Sistem Informasi Akademik NextGeneration (SIAKNG) sebagai sumber data utama sudah tidak lagi up-to-date dan tidak dapat diperbarui secara mandiri oleh alumni terkait. Untuk mengatasi masalah tersebut, sebuah sistem alumni berbasis website bernama ILUNI12 Channel dikembangkan. Akan tetapi, berdasarkan wawancara yang dilakukan kepada Manajemen Fasilkom UI, saat ini sistem masih memiliki kekurangan dan belum dapat memenuhi kebutuhan mereka. Selain Manajemen Fasilkom UI, pengurus ILUNI Fasilkom UI dan para alumni sendiri juga mengalami kesulitan dalam memperoleh data alumni untuk kebutuhan mereka. Penelitian ini ditujukan untuk mengembangkan solusi atas permasalahan yang dialami dengan menggunakan agile methodology sebagai metodologi penelitian. Penelitian ini mengidentifikasi masalah dan kebutuhan menggunakan metode kualitatif. Masalah yang diidentifikasi dikelompokkan menjadi dua masalah utama, yaitu masalah terkait data gathering dan data retrieval. Berdasarkan masalah-masalah tersebut, penelitian ini mengajukan proposal solusi serta rancangan solusi dari aspek teknis. Melalui rancangan solusi tersebut, penelitian ini berhasil mengimplementasi solusi berupa fitur-fitur data gathering dan data retrieval pada sistem ILUNI12 Channel. Penelitian ini kemudian mengevaluasi solusi dengan melakukan usability testing serta user acceptance testing kepada satu pihak manajemen dan lima orang alumni. Hasil kuesioner system usability scale memiliki nilai rata-rata 85.83 dengan grade scale B. Grade ini menunjukkan bahwa desain dari fitur-fitur yang diimplementasi sudah dapat diterima dengan baik oleh pengguna. Selain itu, responden penelitian juga menyatakan bahwa fitur-fitur yang diimplementasi sudah dapat memenuhi kebutuhan dan menyelesaikan masalah yang dihadapi.

The Management of the Faculty of Computer Science, University of Indonesia (Fasilkom UI) has a need for a large amount of alumni data. The data required are varied and are intended for various purposes, including the interests of academic accreditation and academic cooperation. Unfortunately, the alumni data stored in the NextGeneration Academic Information System (SIAK-NG) as the main data source are no longer up-to-date and cannot be updated independently by the alumni. To solve this problem, a website-based alumni system called ILUNI12 Channel was developed. However, based on interviews conducted with Management of Fasilkom UI, the current system still has shortcomings and has not been able to meet their needs. Apart from Management of Fasilkom UI, ILUNI Fasilkom UI administrators and alumni themselves also experienced difficulties in obtaining alumni data for their needs. This research is aimed at developing solutions to the problems experienced by using agile methodology as a research methodology. This study identifies problems and needs using qualitative methods. The identified problems are grouped into two main problems, namely problems related to data gathering and data retrieval. Based on these problems, this research proposes a solution proposal as well as a solution design from the technical aspect. Through this solution design, this research succeeded in implementing a solution in the form of data gathering and data retrieval features on the ILUNI12 Channel system. This research then evaluates the solution by conducting usability testing and user acceptance testing on one management and five alumni. The results of the system usability scale questionnaire have an average score of 85.83 with a B grade scale. This grade indicates that the design of the implemented features has been well received by users. In addition, research respondents also stated that the features that were implemented were able to solve the problems at hand."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Anisa Hasna Nabila
"Manajemen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) memiliki kebutuhan akan data alumni dalam jumlah yang cukup besar. Data yang dibutuhkan juga beragam dan ditujukan untuk berbagai kepentingan, diantaranya adalah kepentingan akreditasi akademik serta kerja sama akademik. Sayangnya, data alumni yang tersimpan pada Sistem Informasi Akademik NextGeneration (SIAK-NG) sebagai sumber data utama sudah tidak lagi up-to-date dan tidak dapat diperbarui secara mandiri oleh alumni terkait. Untuk mengatasi masalah tersebut, sebuah sistem alumni berbasis website bernama ILUNI12 Channel dikembangkan. Akan tetapi, berdasarkan wawancara yang dilakukan kepada Manajemen Fasilkom UI, saat ini sistem masih memiliki kekurangan dan belum dapat memenuhi kebutuhan mereka. Selain Manajemen Fasilkom UI, pengurus ILUNI Fasilkom UI dan para alumni sendiri juga mengalami kesulitan dalam memperoleh data alumni untuk kebutuhan mereka. Penelitian ini ditujukan untuk mengembangkan solusi atas permasalahan yang dialami dengan menggunakan agile methodology sebagai metodologi penelitian. Penelitian ini mengidentifikasi masalah dan kebutuhan menggunakan metode kualitatif. Masalah yang diidentifikasi dikelompokkan menjadi dua masalah utama, yaitu masalah terkait data gathering dan data retrieval. Berdasarkan masalah-masalah tersebut, penelitian ini mengajukan proposal solusi serta rancangan solusi dari aspek teknis. Melalui rancangan solusi tersebut, penelitian ini berhasil mengimplementasi solusi berupa fitur-fitur data gathering dan data retrieval pada sistem ILUNI12 Channel. Penelitian ini kemudian mengevaluasi solusi dengan melakukan usability testing serta user acceptance testing kepada satu pihak manajemen dan lima orang alumni. Hasil kuesioner system usability scale memiliki nilai rata-rata 85.83 dengan grade scale B. Grade ini menunjukkan bahwa desain dari fitur-fitur yang diimplementasi sudah dapat diterima dengan baik oleh pengguna. Selain itu, responden penelitian juga menyatakan bahwa fitur-fitur yang diimplementasi sudah dapat memenuhi kebutuhan dan menyelesaikan masalah yang dihadapi.

The Management of the Faculty of Computer Science, University of Indonesia (Fasilkom UI) has a need for a large amount of alumni data. The data required are varied and are intended for various purposes, including the interests of academic accreditation and academic cooperation. Unfortunately, the alumni data stored in the NextGeneration Academic Information System (SIAK-NG) as the main data source are no longer up-to-date and cannot be updated independently by the alumni. To solve this problem, a website-based alumni system called ILUNI12 Channel was developed. However, based on interviews conducted with Management of Fasilkom UI, the current system still has shortcomings and has not been able to meet their needs. Apart from Management of Fasilkom UI, ILUNI Fasilkom UI administrators and alumni themselves also experienced difficulties in obtaining alumni data for their needs. This research is aimed at developing solutions to the problems experienced by using agile methodology as a research methodology. This study identifies problems and needs using qualitative methods. The identified problems are grouped into two main problems, namely problems related to data gathering and data retrieval. Based on these problems, this research proposes a solution proposal as well as a solution design from the technical aspect. Through this solution design, this research succeeded in implementing a solution in the form of data gathering and data retrieval features on the ILUNI12 Channel system. This research then evaluates the solution by conducting usability testing and user acceptance testing on one management and five alumni. The results of the system usability scale questionnaire have an average score of 85.83 with a B grade scale. This grade indicates that the design of the implemented features has been well received by users. In addition, research respondents also stated that the features that were implemented were able to solve the problems at hand."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Anisa Hasna Nabila
"Manajemen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) memiliki kebutuhan akan data alumni dalam jumlah yang cukup besar. Data yang dibutuhkan juga beragam dan ditujukan untuk berbagai kepentingan, diantaranya adalah kepentingan akreditasi akademik serta kerja sama akademik. Sayangnya, data alumni yang tersimpan pada Sistem Informasi Akademik NextGeneration (SIAKNG) sebagai sumber data utama sudah tidak lagi up-to-date dan tidak dapat diperbarui secara mandiri oleh alumni terkait. Untuk mengatasi masalah tersebut, sebuah sistem alumni berbasis website bernama ILUNI12 Channel dikembangkan. Akan tetapi, berdasarkan wawancara yang dilakukan kepada Manajemen Fasilkom UI, saat ini sistem masih memiliki kekurangan dan belum dapat memenuhi kebutuhan mereka. Selain Manajemen Fasilkom UI, pengurus ILUNI Fasilkom UI dan para alumni sendiri juga mengalami kesulitan dalam memperoleh data alumni untuk kebutuhan mereka. Penelitian ini ditujukan untuk mengembangkan solusi atas permasalahan yang dialami dengan menggunakan agile methodology sebagai metodologi penelitian. Penelitian ini mengidentifikasi masalah dan kebutuhan menggunakan metode kualitatif. Masalah yang diidentifikasi dikelompokkan menjadi dua masalah utama, yaitu masalah terkait data gathering dan data retrieval. Berdasarkan masalah-masalah tersebut, penelitian ini mengajukan proposal solusi serta rancangan solusi dari aspek teknis. Melalui rancangan solusi tersebut, penelitian ini berhasil mengimplementasi solusi berupa fitur-fitur data gathering dan data retrieval pada sistem ILUNI12 Channel. Penelitian ini kemudian mengevaluasi solusi dengan melakukan usability testing serta user acceptance testing kepada satu pihak manajemen dan lima orang alumni. Hasil kuesioner system usability scale memiliki nilai rata-rata 85.83 dengan grade scale B. Grade ini menunjukkan bahwa desain dari fitur-fitur yang diimplementasi sudah dapat diterima dengan baik oleh pengguna. Selain itu, responden penelitian juga menyatakan bahwa fitur-fitur yang diimplementasi sudah dapat memenuhi kebutuhan dan menyelesaikan masalah yang dihadapi.

The Management of the Faculty of Computer Science, University of Indonesia (Fasilkom UI) has a need for a large amount of alumni data. The data required are varied and are intended for various purposes, including the interests of academic accreditation and academic cooperation. Unfortunately, the alumni data stored in the NextGeneration Academic Information System (SIAK-NG) as the main data source are no longer up-to-date and cannot be updated independently by the alumni. To solve this problem, a website-based alumni system called ILUNI12 Channel was developed. However, based on interviews conducted with Management of Fasilkom UI, the current system still has shortcomings and has not been able to meet their needs. Apart from Management of Fasilkom UI, ILUNI Fasilkom UI administrators and alumni themselves also experienced difficulties in obtaining alumni data for their needs. This research is aimed at developing solutions to the problems experienced by using agile methodology as a research methodology. This study identifies problems and needs using qualitative methods. The identified problems are grouped into two main problems, namely problems related to data gathering and data retrieval. Based on these problems, this research proposes a solution proposal as well as a solution design from the technical aspect. Through this solution design, this research succeeded in implementing a solution in the form of data gathering and data retrieval features on the ILUNI12 Channel system. This research then evaluates the solution by conducting usability testing and user acceptance testing on one management and five alumni. The results of the system usability scale questionnaire have an average score of 85.83 with a B grade scale. This grade indicates that the design of the implemented features has been well received by users. In addition, research respondents also stated that the features that were implemented were able to solve the problems at hand."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ezra Pasha Ramadhansyah
"Sistem perolehan pertanyaan serupa diimplementasikan pada banyak situs tanya jawab, khususnya pada forum tanya jawab kesehatan. Implementasi dari sistem pencarian pertanyaan serupa dapat beragam seperti text based retriever dan neural ranker. Permasalahan utama dari neural ranker adalah kurangnya penelitian dalam bahasa indonesia untuk modelnya, khususnya untuk yang menggunakan BERT sebagai model untuk deteksi pertanyaan serupa. Pada penelitian ini akan dicari tahu sejauh apa neural re-ranker BERT dapat memperbaiki kualitas ranking dari text-based retriever jika diterapkan fine-tuning pada model. Model yang digunakan oleh penelitian berupa BERT dan test collection yang digunakan merupakan dataset forum kesehatan yang disusun oleh Nurhayati (2019). Untuk mengetahui sejauh mana model berbasis BERT dapat berguna untuk re-ranking, eksperimen dilakukan pada model pre-trained multilingualBERT, indoBERT, stevenWH, dan distilBERT untuk melihat model yang terbaik untuk di-fine-tune. Penelitian juga mengusulkan dua metode fine-tuning yakni attention mask filter dengan IDF dan freezed layer dengan melakukan freezing pada beberapa layer di dalam BERT. Model dan metode ini kemudian diuji pada beberapa skenario yang telah ditentukan. Hasil dari eksperimen menunjukkan bahwa re-ranker dapat meningkatkan kualitas text based retriever bila di-fine-tune dengan metode dan skenario tertentu.
Beberapa model memberikan hasil yang lebih baik dengan dataset forum kesehatan dan dengan text based retriever BM25 dan TF-IDF. Model multilingualBERT dan metode fine-tuning layer freezing memberikan hasil yang terbaik dari semua kombinasi. Kenaikan tertinggi terdapat pada kombinasi BM25 dan multilingualBERT dengan layer freezing dengan kenaikan sebesar 0.051 dibandingkan BM25.

The system of acquiring similar questions is implemented on many Question and Answering sites, including health forums. Implementations of similar question search systems can vary, such as text-based retrievers and neural rankers. The main issue with neural rankers is the lack of research in Indonesian language for neural ranker models, especially those using BERT. This study aims to investigate how far BERT as a neural re-ranker can improve the ranking quality of a text-based retriever when applied with fine-tuning. The model used in this research is BERT, and the test collection used is a health forum dataset compiled by Nurhayati (2019). To answer the research question, experiments were conducted on multiple pre-trained models: multilingual BERT, IndoBERT, stevenWH, and distilBERT to identify the best model for fine-tuning. This study also proposes two new fine-tuning methods: attention mask filter with IDF threshholding and frozen layer by freezing some layers within BERT. These models and methods were then tested under predefined scenarios. The experiment results show that the re-ranker can enhance the quality of the text-based retriever when fine-tuned with specific methods and scenarios. These models perform especially well using the health form dataset aswell as using the text based retrievers BM25 and TF-IDF. Out of all models, multilingulBERT performed the best with freezed layer fine-tuning performing as the best fine-tuning method. The most significant increase of all combinations is the combination of BM25 and multilingualBERT with freezed layer fine-tuning with a 0.051 increase compared to the baseline BM25."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Armando Yonathan
"Informasi yang terdapat saat ini tidak hanya terbatas disimpan dalam bentuk dokumen teks saja, tetapi banyak juga dalam bentuk dokumen suara. Banyaknya informasi yang disimpan dalam bentuk dokumen suara menyebabkan diperlukannya teknik perolehan informasi yang dapat diterapkan kepada koleksi dokumen tersebut. Pendekatan yang banyak dilakukan adalah dengan menggunakan hasil pengenalan suara oleh Sistem Pengenalan Suara Otomatis (SPSO). Tetapi, hasil pengenalan suara oleh SPSO tidak sepenuhnya benar sehingga menurunkan tingkat akurasi perolehan informasi dokumen suara. Pada penelitian ini penulis mencoba empat jenis hasil pengenalan suara untuk melakukan perolehan informasi dokumen suara, yaitu 1-best output, n-best word output, n-best pronounciation output, word posterior lattice. Selain itu, penulis juga mencoba tiga jenis kueri pada penelitian ini, yaitu kueri satu kata, kueri frase dua kata dan kueri kalimat. Hasil yang didapat pada penelitian ini menyimpulkan bahwa penggunaan 1-best output pada perolehan informasi dokumen suara menghasilkan kinerja yang lebih baik dibandingkan penggunaan hasil pengenalan suara yang lain. Mean Average Precision (MAP) hasil eksperimen dengan 1-best output lebih besar 0.64% dibandingkan penggunaan n-best output , 8,88% lebih besar dibandingkan penggunaan word posterior lattice dan lebih besar 92.68% dibandingkan penggunaan n-best pronounciation output. Pada eksperimen dengan kueri frase, sistem dengan akurasi terbaik adalah sistem yang menggunakan word posterior lattice. Pada eksperimen dengan kueri satu kata dan kueri kalimat, sistem yang menggunakan n-best word output menghasilkan kinerja terbaik.

The information today is not only limited in the form of text documents, but also in the form of spoken documents. The growing number of those spoken documents requires the information retrieval techniques to make the retrieval process easier. The approach for spoken documents retrieval is using automatic speech recognition (ASR). However, the results of the speech recognition by ASR are not entirely correct, so reduce the level of accuracy of information retrieval of spoken documents. This experiment uses four types results of the speech recognition by ASR, the 1-best output, n-best output, n-best pronunciation output, word posterior lattice. In addition, this experiment also investigates the effect of the use of query types (phrase, single word and sentence). Results obtained from this experiment concluded that the use of 1-best output on spoken document retrieval produces better performance results than the use of other results of the speech recognition. Mean Average Precision (MAP) results of experiments with 1-best output is 0.64% higher than the use of n-best output, 8.88% higher than the use of word posterior lattice and 92.68% higher than the use of n-best pronunciation output. In phrase based query experiment, the best accuracy is word posterior lattice while the best accuracy in single word query and sentence query is n-best word output."
Depok: Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>