Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 105171 dokumen yang sesuai dengan query
cover
Joshua Kurniawan Djafar
"Penerapan dari pengolahan bahasa alami ini telah banyak dilaksanakan dengan tujuan tertentu. Salah satu tujuannya adalah aplikasi basis data yang dikembangkan oleh program ini. Pada dasarnya program ini akan mengolah bentuk dari kalimat-kalimat query dalam bahasa Indonesia dan merubahnya menjadi bentuk SQL standar. SQL standar inilah yang akan diinterpretasikan oleh suatu RDBMS (Oracle, Informix,dan sebagainya). Kelemahan utama dari pengolahan bahasa alami ini adalah keterbatasan dari semantik kalimat yang disebabkan oleh keterbatasan yang ada pada SQL ini sendiri. Suatu kalimat membutuhkan suatu bentuk tata bahasa. Bagaimanapun alaminya suatu kalimat bahasa, kalimat tersebut pasti akan mengikuti kaidah umum yang ada pada suatu struktur tata bahasa. Penyusunan dari tata bahasa inilah yang merupakan hal yang terpenting dalam pengolahan bahasa alami. Tata bahasa semantik adalah tata bahasa yang disusun bukan berdasarkan pada sintak kalimat, tetapi disusun berdasarkan pada arti kata penyusun kalimat. Kebutuhan akan pembentukan tata bahasa semantic ini membutuhkan penelitian tersendiri untuk memperoleh struktur umum dari kalimat-kalimat yang akan digunakan oleh pemakai."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 1992
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rani Aulia Hidayat
"Makanan merupakan salah satu kebutuhan penting bagi masyarakat, sehingga pencarian mengenai informasi yang berkaitan dengan makanan banyak dilakukan. Sering kali informasi yang dibutuhkan adalah informasi spesifik yang dapat direpresentasikan sebagai entitas. Sehingga saat seseorang melakukan pencarian menggunakan suatu kueri, hasil yang diharapkan dari proses pencarian tersebut berupa entitas yang relevan. Sistem yang dapat menangani tugas tersebut disebut sebagai sistem temu balik entitas.
Penelitian ini bertujuan untuk membangun sistem temu balik entitas makanan dengan memanfaatkan informasi relasi antar entitas, teknik ekstraksi entitas, document retrieval, dan word embedding pada korpus dokumen berbahasa Indonesia. Dokumen yang digunakan pada penelitian ini adalah dokumen resep, artikel terkait informasi kuliner, dan Wikipedia berbahasa Indonesia. Sebanyak tujuh kategori entitas terkait makanan didapatkan dari proses ekstraksi entitas.
Pendekatan rule-based dan lexicon-based digunakan untuk mengekstrak entitas dari dokumen. Aturan-aturan untuk pendekatan rule-based dibangun untuk masing-masing jenis dokumen berdasarkan sampel dokumen yang dipilih secara acak. Sebanyak tiga skenario eksperimen diujikan terhadap 14 kueri yang dikelompokkan ke dalam tujuh kategori. Setiap skenario dievaluasi menggunakan nilai rata-rata precision berdasarkan k entitas yang dikembalikan (AP@k).
Berdasarkan hasil evaluasi menggunakan seluruh kueri uji, skenario ketiga dengan menggunakan informasi relasi entitas menunjukkan performa terbaik dibandingkan dengan skenario lainnya. Nilai AP@15 tertinggi yang didapatkan menggunakan skenario eksperimen ketiga ini adalah sebesar 76,67% untuk kategori kueri hidangan dengan bahan dasar tertentu.

Food is known as one of the most important needs so that many people search for food-related information. The information that is needed is often specific information that can be represented as an entity. So that when someone performs a search from a certain query, the expected results are entities that are considered relevant. The task to solve this problem is known as entity retrieval.
This research aims to build a food entity retrieval model by utilizing information on relationships between entities, entity extraction techniques, document retrieval, and word embedding in the Indonesian document corpus. The documents used in this research are recipes, food-related articles, and articles of Wikipedia in Indonesian. A total of seven food-related categories of entities were obtained from the entity extraction process.
The approaches that are used in this study to extract entities from the documents are the rule-based and lexicon-based approaches. The rules in the rule-based approach are developed for each document category based on the sample documents that have been chosen randomly. The three experiments that were conducted were tested against 14 queries which were grouped into seven categories. Each scenario is evaluated using the average precision score based on k entities given as the result of entity retrieval (AP@k).
Based on the evaluation results using all the test queries, the third scenario that used entity-relationship information shows the best performance compared to other scenarios. The highest AP@15 value obtained when using this third experimental scenario is 76.67% for the query category dish based on certain ingredients.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ade Melani
"Perolehan informasi merupakan suatu bidang yang berusaha mengatasi permasalahan yang dihadapi pencari informasi dalam upaya memperoleh informasi yang dibutuhkan. Ketersediaan informasi dalam jumlah besar menyebabkan pencari informasi kesulitan dalam mendapatkan informasi yang diinginkannya. Hal itu juga menyebabkan pencari informasi harus meluangkan banyak waktu untuk membaca dokumen yang diperoleh. Oleh karena itu, salah satu pendekatan yang digunakan dalam bidang perolehan informasi untuk mempermudah dan mempersingkat waktu adalah dengan menggunakan ringkasan yang dihasilkan secara otomatis. Metode yang digunakan dalam menghasilkan ringkasan secara otomatis adalah metode query-biased. Sebab ringkasan yang dihasilkan dengan metode ini dapat merefleksikan informasi yang dibutuhkan oleh pencari informasi, yaitu ringkasan yang hasilnya sesuai dengan query yang diberikan. Dengan demikian, pencari informasi dapat menggunakan ringkasan tersebut untuk menentukan apakah suatu dokumen memuat informasi yang dicarinya. Dalam penerapannya, metode ini digunakan untuk meringkas dokumen dalam Bahasa Indonesia. Penulis melakukan evaluasi untuk mengetahui manfaat ringkasan yang dihasilkan dengan metode query-biased. Evaluasi tersebut dilaksanakan dengan membandingkan manfaat antara ringkasan yang dihasilkan dengan metode query-biased dengan ringkasan yang dihasilkan dengan metode statis, yaitu metode yang menggunakan beberapa kalimat di awal dokumen sebagai ringkasan. Dari hasil evaluasi diketahui bahwa ringkasan yang dihasilkan dengan metode query‐biased lebih bermanfaat dalam proses pencarian dokumen yang sesuai dengan query bila dibandingkan dengan ringkasan yang dihasilkan melalui metode statis."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Heidi Renata Halim
"Seiring dengan majunya teknologi di Indonesia, banyak layanan kesehatan online yang bermunculan. Pengguna bisa bertanya langsung pada tenaga medis profesional tiap mereka memiliki masalah kesehatan ringan yang tidak membutuhkan janji temu langsung dengan dokter. Sebagai pengguna, tentunya mereka mengharapkan respon yang cepat dari situs yang mereka gunakan, hal ini kedengarannya mustahil dilakukan karena tidak semua tenaga medis profesional yang bekerja pada layanan medis tersebut ada setiap saat memantau semua pertanyaan yang masuk. Namun, hal ini bisa dilakukan dengan cara mencocokan pertanyaan yang baru dimasukkan dan mencari pertanyaan yang sudah pernah ditanyakan di masa lalu yang memiliki persamaan dengan pertanyaan yang baru dimasukkan. Secara singkat, kita bisa mencari duplikat dari pertanyaan yang ditanyakan oleh pengguna dan mengembalikan jawaban dari pertanyaan duplikat tersebut daripada menunggu jawaban langsung dari dokter. Penelitian ini akan menggunakan pendekatan temu balik informasi dalam mendeteksi pertanyaan duplikat yang pernah ditanyakan di masa lalu. Selain itu, penelitian ini juga akan mengkombinasikan ekspansi kata yang dilakukan kepada kueri, dokumen, serta filter kata-kata stopword untuk meningkatkan skor reciprocal-rank dan recall dari model yang digunakan. Hasil penelitian ini menyimpulkan bahwa ekspansi kata yang dilakukan pada kueri serta dokumen tidak menghasilkan skor reciprocal rank dan recall yang lebih baik. Penggunaan word embedding untuk memperbanyak kata stopword yang dihapus dari data mampu menghasilkan skor reciprocal rank yang lebih tinggi meskipun nilainya belum signifikan.

With the advancement of technology and internet in Indonesia, many online healthcare services have emerged where users can directly consult with medical professionals if they have minor health issues that do not require an in-person appointment with a doctor. As users, they naturally expect quick responses from the sites they use. This seems impossible to do as not all medical professionals working who are working on these services are always available to monitor every incoming question. However, this can be achieved by matching newly submitted questions with previously asked questions that have similarities. In short, we can search for duplicates of the questions asked by users and return answers from those duplicate questions instead of waiting for a direct response from a doctor. This research will use an information retrieval approach to detect duplicate questions that have been asked in the past. Additionally, this study will combine query expansion, document expansion, and stopwords filtering to improve the reciprocal-rank and recall scores of the model used. This research concludes that query and document expansion do not yield better reciprocal rank and recall scores. On the other hand, using
word embedding to expand the stopwords list removed from the data can help achieve higher reciprocal rank scores, although the improvement displays are still not significant enough to be categorized as a major change."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Popi Puspitasari
Depok: Fakultas Teknik Universitas Indonesia, 2002
S39084
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ageng Anugrah Wardoyo Putra
"

Walaupun belum semaju dan sekomprehensif bahasa-bahasa lainnya, penelitian NLP bahasa Indonesia telah mengalami perkembangan yang cukup signifikan. Penelitian NLP tersebut mencakup POS-Tagging, Named Entity Recognition, dependency parsing, coreference resolution, dan lain sebagainya. Dari penelitian-penelitian NLP bahasa Indonesia yang telah ada, perlu dilakukan validasi dan verifikasi apakah modul NLP pada penelitian tersebut masih relevan atau tidak. Hal tersebut perlu dilakukan karena mungkin saja terjadi kesalahan pada penelitian sebelumnya atau terdapat model yang lebih baik dari penelitian tersebut. Proses tersebut dapat dilakukan melalui evaluasi intrinsik maupun ekstrinsik. Evaluasi intrinsik dapat dilakukan dari reproduksi atau replikasi penelitian yang telah ada, sementara itu evaluasi ekstrinsik dilakukan dengan membangun sistem tanya jawab dari modul-modul NLP tersebut. Hasilnya, didapatkan beberapa modul seperti POS-Tagging dan NER masih cukup relevan dan memiliki dataset yang berkualitas. Namun, beberapa modul lain seperti coreference resolution, constituency parsing, dan dependency parsing masih perlu perkembangan lebih lanjut. Berdasarkan hasil evaluasi, sistem yang dibangun memiliki performa terbaik untuk metrik exact match dan F1 berturut-turut di angka 0,108 dan 0,151 untuk dataset SQuAD, 0,063 dan 0,191 untuk dataset TyDiQA, serta 0,127 dan 0,173 untuk dataset IDK-MRC. Dari evaluasi tersebut diketahui juga bahwa sistem tanya jawab yang dibangun menggunakan pipeline modul-modul NLP tidak sebaik model tanya jawab end-to-end menggunakan BERT yang telah di-finetuning. Meskipun begitu, dari hasil penelitian ini ditunjukkan bahwa kita dapat membangun suatu sistem tanya jawab berdasarkan modul-modul NLP bahasa Indonesia yang tersedia.


Although not as advanced and comprehensive as in other languages, research in Indonesian NLP has experienced significant development. This NLP research encompasses POS-Tagging, Named Entity Recognition, dependency parsing, coreference resolution, and other related areas. From the existing NLP studies conducted in the Indonesian language, it is essential to validate and verify whether the NLP modules used in the research are still relevant. This is important because there might have been errors in previous research or there might be better models available. This process can be accomplished through both intrinsic and extrinsic evaluations. Intrinsic evaluation can be conducted by reproducing or replicating existing research, while extrinsic evaluation involves building a question answering system using these NLP modules. The results show that some modules, such as POS-Tagging and NER, are still quite relevant and have high-quality datasets. However, other modules like coreference resolution, constituency parsing, and dependency parsing still require further development. Based on the evaluation results, the constructed system performs best in terms of exact match and F1 metrics, with scores of 0.108 and 0.151 for the SQuAD dataset, 0.063 and 0.191 for the TyDiQA dataset, and 0.127 and 0.173 for the IDK-MRC dataset, respectively. The evaluation also reveals that the question-answering system built using a pipeline of NLP modules does not perform as well as the end-to-end question-answering model using fine-tuned BERT. Nevertheless, this research demonstrates the feasibility of building a question-answering system based on the available Indonesian NLP modules.

"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"RDF database systems is a cutting-edge guide that distills everything you need to know to effectively use or design an RDF database. This book starts with the basics of linked open data and covers the most recent research, practice, and technologies to help you leverage semantic technology. With an approach that combines technical detail with theoretical background, this book shows how to design and develop semantic web applications, data models, indexing and query processing solutions.
"
Waltham, MA: Morgan Kaufmann, 2015
e20427683
eBooks  Universitas Indonesia Library
cover
Syandra Sari
"Perolehan informasi lintas bahasa adalah bidang perolehan informasi yang semakin berkembang seiring dengan pesatnya perkembangan Internet di seluruh dunia. Perolehan informasi lintas bahasa adalah sistem perolehan informasi yang memungkinkan pengguna memberikan query dalam bahasa yang berbeda dengan bahasa dokumen. Dalam perolehan informasi lintas bahasa, masalah perbedaan bahasa diatasi dengan proses penerjemahan dokumen atau penerjemahan query. Sumber daya bahasa yang digunakan untuk proses penerjemahan pada perolehan informasi lintas bahasa dapat berupa kamus dwi bahasa, mesin penerjemah atau korpus paralel. Penelitian ini mengembangkan sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel. Padanan kata dalam bahasa Indonesia-Inggris diperoleh dengan menggunakan dua metoda yaitu informasi mutual dan similarity thesaurus. Selanjutnya untuk meningkatkan hasil perolehan dokumen berdasarkan korpus paralel, maka diterapkan teknik perluasan query yaitu pseudo-relevance feedback. Kinerja terbaik dari metoda informasi mutual dan penerapan teknik perluasan query mencapai 41,86 % dari kinerja perolehan informasi lintas bahasa monolingual; 80,5 % dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan kamus; serta mencapai 54% dari kinerja sistem perolehan informasi lintas bahasa Indonesia-Inggris menggunakan mesin penerjemah Transtool. Sedangkan kinerja terbaik dari metoda similarity thesaurus dan penerapan teknik perluasan query mencapai 55,61 % dari kinerja perolehan informasi lintas bahasa monolingual; mencapai 107% dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan kamus; serta mencapai 71% dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan mesin penerjemah Transtool. Berdasarkan hasil tersebut diatas, terlihat bahwa perluasan query dengan teknik pseudo-relevance feedback yang diterapkan pada sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel dengan metoda informasi mutual dan similarity thesaurus dapat meningkatkan kinerja sampai dengan 25 % dibanding tanpa proses perluasan query. Kemudian, dari hasil tersebut diatas juga dapat diambil kesimpulan umum bahwa sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel dapat menjadi alternatif bagi pengembangan sistem perolehan informasi lintas bahasa Indonesia-Inggris. Dan penelitian lebih lanjut mengenai metoda berdasarkan korpus paralel yang lebih baik serta usaha perbaikan kualitas korpus paralel perlu terus dilakukan bagi peningkatan kinerja sistem perolehan informasi lintas bahasa Indonesia-Inggris di masa yang akan datang."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Achmad Fatchuttamam Abka
"Natural Language Generation (NLG) merupakan salah satu topik dalam bidang Natural Language Processing (NLP) yang hingga sekarang penelitiannya masih banyak dilakukan. Tugas dari NLG adalah menghasilkan bahasa natural (manusia) dari data non-linguistik. Secara umum, sistem NLG melibatkan tahapan-tahapan utama yaitu document planning, microplanning, dan surface realisation.
Penelitian yang dilakukan adalah mengembangkan sistem NLG yang menggunakan konsep inference dalam prosesnya menghasilkan dokumen. Selain itu sistem juga diharapkan mampu memanfaatkan informasi yang sifatnya historis dalam proses menghasilkan dokumen tersebut. Pengembangan terutama dilakukan pada subbagian perencanaan (document planning dan microplanning) dengan domain yang dipilih adalah sepak bola. Implementasi dilakukan dengan menggunakan prolog. Prolog dipilih karena sangat cocok digunakan untuk proses inference. Evaluasi sistem dilakukan dengan cara melakukan pengujian unit untuk setiap komponen, terutama komponen yang melakukan inference.
Hasilnya menunjukkan bahwa sistem berjalan sebagaimana mestinya yaitu mengeluarkan output yang benar sesuai dengan permintaan pada input (query). Selain itu, dilakukan juga evaluasi oleh manusia dengan cara menyebarkan kuesioner penilaian terhadap laporan yang dihasilkan oleh sistem NLG dibandingkan dengan laporan hasil buatan manusia. Hasilnya menunjukkan bahwa laporan buatan manusia masih lebih baik, namun laporan hasil dari sistem juga memperoleh penilaian yang cukup baik.

Natural Language Generation (NLG) is one of the topics in the field of Natural Language Processing (NLP), which until now is still a lot of research done. Task of NLG is to generate natural (human) language from non-linguistic data. In general, the NLG system involves main phases namely document planning, microplanning, and surface realisation.
This research is to develop NLG system which uses the concept of inference in the process of generating document. Furthermore, the system also expected to use historical information in the process of producing the document. Development is mainly on planning phase (document planning and microplanning) with selected domain is football. Implementation is done by using prolog. Prolog selected because it is suitable for inference process. Evaluation of the system is done by doing a unit testing for each component, especially for component which perform inference.
The result shows that the system is running as it should be that is gives correct output according to the request on the input (query). In addition, the evaluation was also conducted by distributing questionnaires to compare the reports generated by the NLG system with man-made reports. The results show that man-made report is still better, but the report generated by the NLG system also obtain a fairly good assessment.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2013
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Vidya Mara
"Bahasa memegang peranan penting dalam komunikasi. Dengan bahasa, orang dapat menyampaikan pikiran maupun peraaaannya kepada orang lain. Dengan bahasa pula, orang dapat mewarisi, menerima atau menyampaikan pengalaman dan pengetahuan. Bahasa adalah salah satu unsur kebudayaan. Karena di dunia ini tidak ada kebudayaan yang sama, maka tidak pula dijumpai dua bahasa yang seragam benar. Bahasa ber_beda karena sistemnya berbeda, artinya bentuk atau pole bahasa yang satu belum tentu terdapat pada bahasa yang lain (Weinreich, 1967:1-2). Meskipun bentuk atau pola bahasa yang satu berbeda dengan bentuk atau pola bahasa yang lain, seringkali pesan yang disampaikan adalah sama. Misalnya dapat dilihat pada contoh bahasa Prancis dan bahasa Indonesia berikut ini. Dalam bahasa Indonesia (selanjutnya disebut BI) ki-ta mengatakan Saya merindukan ibu, dan untuk menyampai_kan pesan yang sama dalam bahasa Prancis (selanjutnya disebut BP) kita akan mengatakan Ma mere me mangue. Pe_san kedua kalimat di atas sama, tapi cara mengungkapkannya berbeda. Dalam BI yang ditonjolkan adalah saya, se_dangkan dalam BP yang ditonjolkan adalah ibu (Ma mare. Dari contoh di atas jelaslah bahwa BP dan BI adalah dua bahasa yang masing-masing mempunyai sistem maupun strukturnya sendiri. Dalam BP dan BI sering dijumpai adanya bentuk kali_mat negatif, baik dalam bahasa lisan maupun dalam bahasa tulisan. Di atas telah dikatakan bahwa BP dan BI memi_liki sistem maupun strukturnya masing-masing, demikian pula halnya dengan struktur kalimat negatif kedua bahasa tersebut. Pada kalimat negatif BP di atas kita lihat bahwa unsur negatifnya ada dua, yaitu ne dan pas yang mengapit verbs. Sedangkan pada kalimat negatif BI terlihat bahwa unsur negatifnya hanya satu, yaitu tidak, yang berada di muka verba."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 1981
S14547
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>