Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 41221 dokumen yang sesuai dengan query
cover
Hapnes Toba
"Sebuah sistem tanya jawab (STJ) adalah sebuah sistem komputer yang dirancang untuk mencari jawaban yang paling tepat terhadap sebuah pertanyaan yang diajukan dalam sebuah bahasa alami. Penelitian terkait STJ telah dilakukan sejak awal tahun 60-an, dan mengalami perkembangan yang pesat sejak diadakannya forum-forum evaluasi STJ sejak tahun 90-an sampai saat ini. Bidang-bidang penelitian dalam ilmu komputer yang memberikan kontribusi besar dalam perkembangan STJ meliputi antara lain: temu balik informasi, pemrosesan bahasa alami, dan kecerdasan buatan.
Secara khusus dalam riset doktoral ini dilakukan eksplorasi terhadap komponen validasi jawaban. Riset bertujuan untuk menghasilkan metode baru yang dapat meningkatkan relevansi cuplikan teks dan mencari strategi untuk melakukan ekstraksi jawaban dengan mengkombinasikan pendekatan statist ik dan simbolik. Terdapat dua usulan yang diberikan guna mencapai tujuan riset. Usul yang pertama adalah penggunaan model kualitas jawaban yang dikembangkan dari STJ berbasis komunitas sebagai alat untuk melakukan pengurutan ulang cuplikan teks. Usul yang kedua adalah pembentukan model jawaban melalui pembelajaran frasa pengandung jawaban terkecil dan terlengkap (least generalized answer bearing phrase/ABP-LG) sebagai sarana untuk memprediksi bagian kalimat yang paling memungkinkan mengandung jawaban. Model ABPLG memanfaatkan informasi struktur kalimat pada pertanyaan dan cuplikan teks sebagai indikator yang menentukan peluang kandungan jawaban dalam sebuah bagian kalimat.
Hasil eksperimen dengan berbagai koleksi data memperlihatkan bahwa kombinasi model ABP-LG dengan sistem berbasis pola mampu memberikan kontribusi untuk perbaikan hasil ekstraksi jawaban secara signifikan untuk tipe pertanyaan faktoid maupun kompleks (tipe lain-lain). Keunggulan model ABP-LG jika dibandingkan dengan STJ berbasis entitas bernama ataupun kamus adalah kemampuannya untuk mempelajari indikasi 'cara menjawab' dan portabilitasnya untuk diterapkan dalam domain pertanyaan yang berbeda-beda, khususnya untuk tipe-tipe pertanyaan yang dapat mencakup konteks apapun, seperti dalam tipe 'other' (lain-lain). Kelemahan model ABP-LG yang teramati selama eksperimen adalah ketergantungannya pada kualitas teks. Problem terakhir ini secara parsial berhasil ditangani oleh model pengurutan ulang cuplikan teks sebagai penyaring kandidat-kandidat kalimat yang dianggap mengandung jawaban dari hasil temu balik informasi.

The task of a question answering system (QAS) is to find a final answer given a natural language question. Since it was introduced in the 1960s, the task of QAS has always been at the forefront of technology advances. Along with the advances in the fields of information retrieval, computational linguistics, and artificial intelligence, research on QAS are broadened into unstructured textual documents in open domains. Evaluation forums for QAS have steered the development of QAS into an established and large-scale research methodologies and evaluations.
This doctoral research investigates various techniques in the answer validation component. The main objective of the research is to develop new methods in snippet reranking and answer extraction process by combining the statistical and the symbolic (semantics) approaches. Two novel techniques are proposed as the results of this doctoral research. The first one is the snippets' reranking model which is developed by using the question-answer pairs' characteristics in a community-based QAS. This answer quality model forms the basic ingredient for the snippet reranking process. The second proposal is the least generalized answer bearing phrase model (ABP-LG) to predict the final answer location of a given question which is extracted from a number of good quality snippets, after a reranking process. The ABP-LG model employs syntactic tree information of question-answer (snippet) pairs as indicators to predict the answer bearing possibility in each part of a snippet.
The experiment results show that the ABP-LG model combines with the pattern-based approach contributes considerably in the answer extraction process for factoid- and complex (other)-typed questions. The main advantage of the ABPLG model beyond the common approaches, which are based on named-entity recognizers or dictionaries, is its ability to predict the 'way-of-answering', either in factoid or complex question types. Based on the analysis of the experiment results, the main weaknesses of the ABP-LG model is its high dependency on good quality snippets which partially has been tackled by employing the snippets' reranking model.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2014
D1990
UI - Disertasi Membership  Universitas Indonesia Library
cover
Prasnurzaki Anki
"

Pada zaman modern ini, implementasi chatbot digunakan untuk menyimpan data yang dikumpulkan melalui sistem tanya jawab, yang dapat diterapkan dalam program Python. Data yang akan digunakan dalam program ini adalah Cornell Movie Dialog Corpus yang merupakan dataset yang berisi korpus ini berisi kumpulan percakapan fiksi kaya metadata yang besar yang diekstraksi dari skrip film Penerapan chatbot dalam program Python, dapat menggunakan berbagai macam model, secara spesifik pada program ini akan diterapkan model LSTM, dan model BiLSTM. Penerapan chatbot dalam program Python, dapat menggunakan berbagai macam model, secara spesifik pada program ini akan diterapkan model LSTM, dan model BiLSTM. Hasil output dari program chatbot dengan penerapan model LSTM, dan BiLSTM adalah berupa akurasi, serta kumpulan data yang sesuai dengan informasi yang pengguna masukkan dalam input kotak dialog chatbot. Pemilihan model yang dapat diterapkan berdasarkan karakteristik data dapat mempengaruhi kinerja program, dengan tujuan program agar dapat menentukan tinggi atau rendahnya tingkat akurasi yang akan dihasilkan dari hasil yang diperoleh melalui sebuah program, yang dapat dijadikan faktor utama dalam menentukan model yang dipilih. Berdasarkan pertimbangan yang menjadi syarat pemilihan model dari sebuah program, pada akhirnya dipilih model LSTM, dan BiLSTM sebagai model yang akan diterapkan ke dalam program. Selain pemilihan model, berikutnya adalah menentukan metode yang digunakan dalam program, pada program ini dipilih metode greedy sebagai bentuk implementasi model LSTM dan model BiLSTM, dengan tujuan ketika dalam menjalankan program, waktu pengolahan data dapat lebih cepat, dan meningkatkan akurasi pada model yang dipilih pada program. Selain itu, atribut pendukung seperti seq2seq model, menjadi faktor penentu dalam sebuah program yang dapat berfungsi untuk memverifikasi pengolahan data apakah sesuai dengan kriteria yang dapat dijadikan sebagai pedoman dalam pengolahan data. Dalam penerapan komponen-komponen tersebut ke dalam program, seq2seq model dapat memproses kalimat input yang kemudian akan dilakukan pengolahan data tersebut menggunakan model dan struktur lain yang ada pada program, sehingga pada akhirnya dapat menghasilkan kalimat output yang berbagai macam, sebagai respon atas kalimat input yang dihasilkan dari program chatbot. Selain itu diperlukan metode evaluasi program yang dapat digunakan untuk memverifikasi apakah hasil output program sesuai dengan data yang diharapkan oleh pengguna. Berdasarkan penerapan model LSTM, dan model BiLSTM ke dalam chatbot, dapat disimpulkan bahwa dengan semua hasil uji program yang terdiri dari beragam pasangan parameter yang berbeda, maka dinyatakan Pasangan Parameter 1 (size_layer 512, num_layers 2, embedded_size 256, learning_rate 0.001, batch_size 32, epoch 20) yang berasal dari File 6 merupakan BiLSTM Chatbot dengan nilai avg accuracy 0.995217 yang menggunakan model BiLSTM menjadi pasangan parameter terbaik.


In modern times, chatbots are implemented and used to store data collected through a question and answer system which can be applied in the Python program. The data used in this program is the Cornell Movie Dialog Corpus which is a dataset containing a corpus that contains a large collection of metadata-rich fictional conversations extracted from film scripts. The application of chatbots into the Python program can be done using various models. In this research we specifically use the LSTM and BiLSTM models. The output results from the chatbot program with the application of the LSTM and BiLSTM models are in the form of accuracy, as well as a data set that matches the information that the user enters in the chatbot dialog box input. The choice of models that will be applied is based on data that can affect program performance, with the target of the program that can determine the high or low level of accuracy that will be generated from the results obtained through the program, which is a major factor in determining the selected model.
Based on the considerations that are the required for choosing the model for the program, in the end the LSTM and the BiLSTM models are chosen and will be applied to the program. After selecting the appropriate model, the next step is to determine the method used in the program. The greedy method is chosen as a form of implementation of the LSTM and BiLSTM models that aims to decrease the data processing time of the program and make it quicker, and also increase the accuracy of the model selected for the program. In addition, supporting attributes such as the seq2seq model are a determining factor in a program that functions to verify whether data processing process matches the criteria and can be used as a guide. In applying these components to the program, the seq2seq model processes the input sentences which will then be processed using the models and other structures in the program, so that in the end it can produce various output sentences in response to the input sentences that are generated from the chatbot program. In addition, a program evaluation method is needed to verify whether the program output matches the data expected by the user. Based on the application of the LSTM dan BiLTSM models into the chatbot program, it can be concluded that between all the program test results consisting of a variety of different parameter pairs, it is stated that Parameter Pair 1 (size_layer 512, num_layers 2, embedded_size 256, learning_rate 0.001, batch_size 32, epoch 20) from File 3 is the best paramater pair of the BiLSTM Chatbot which uses the BiLTSM model, with the avg accuracy value of 0.995217."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Turkiye: Hakikat Kitabevi, 1993
297.29 COU
Buku Teks SO  Universitas Indonesia Library
cover
Hendrico Kristiawan
"Pertanyaan konsultasi pada sebuah forum daring perlu dijawab oleh dokter spesialis yang tepat agar jawaban yang diberikan akurat dan bermanfaat bagi pengguna yang bertanya. Terkait hal tersebut, penelitian ini membahas tentang pengembangan model yang dapat secara otomatis mengarahkan sebuah pertanyaan konsultasi kesehatan ke dokter dengan spesialisasi yang sesuai. Lebih jauh lagi, model yang dibangun merupakan model klasifikasi multi-label karena sebuah pertanyaan dapat terasosiasi dengan lebih dari satu spesialisasi. Penelitian ini dimulai dengan mengevaluasi keefektifan metode pemetaan berbasis aturan dalam memprediksi data yang dianotasi oleh pakar, dan diperoleh hasil yang menunjukkan tingkat keberhasilan yang cukup. Selanjutnya, dikembangkan sebuah model machine learning yang melakukan klasifikasi domain spesialis dokter. Pelatihan model dilakukan dengan berbagai metode, termasuk supervised, unsupervised, serta semi-supervised learning. Model terbaik ditemukan melalui metode domain adaptive pre-training dengan IndoBERT-large sebagai model acuan dan melibatkan unsupervised learning. Selain itu, model supervised learning juga digunakan dengan menggunakan model konvensional, dan hasilnya digunakan untuk analisis kontribusi dari fitur-fitur yang digunakan dalam klasifikasi. Terakhir, penelitian ini mengevaluasi kembali anotasi yang dilakukan oleh manusia dengan menggunakan kata kunci sebagai pendekatan untuk mengurangi kesalahan dalam dataset. Dengan pendekatan ini, berhasil ditemukan beberapa kesalahan anotasi pada dataset yang dianotasi oleh manusia.

The consultation questions on an online forum need to be answered by the appropriate specialist doctors to provide accurate and beneficial answers to the users asking the questions. In relation to this, this study discusses the development of a model that can automatically direct a health consultation question to a doctor with the corresponding specialization. Furthermore, the constructed model is a multi-label classification model because a question can be associated with more than one specialization. There are several issues addressed in this work. This research begins by evaluating the effectiveness of rule-based mapping methods in predicting data annotated by experts, and the results show a satisfactory level of success. Furthermore, a multi-label classification model is developed to classify the specialist domains of doctors. The model training is performed using various methods, including supervised learning, unsupervised learning, and semi-supervised learning. The best model is found through domain adaptive pre-training using IndoBERT-large as the reference model and involving unsupervised learning. Additionally, the supervised learning model is also used with a conventional model, and the results are used to analyze the contribution of the features used in the classification. Lastly, this research re-evaluates the annotations made by humans using keyword-based approaches to reduce errors in the dataset. With this approach, several annotation errors were successfully identified in the dataset annotated by humans.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
cover
Rinawati
"Sistem Tanya Jawab (Question Answering) merupakah sistem yang menerima query (pertanyaan) berupa bahasa alami atau bahasa yang biasa digunakan untuk berkomunikasi antar manusia sebagai masukan (input) dan mengembalikan jawaban yang tepat sebagai keluaran (output). Tujuan dari penelitian ini adalah dikembangkannya Sistem Tanya Jawab Satu Bahasa (Monolingual Question Answering System) dan Sistem Tanya Jawab Lintas Bahasa (Cross Language Quetion Answering System). Yang menjadi masukan pada Sistem Tanya Jawab Satu Bahasa adalah query berbahasa Inggris dan keluarannya adalah jawaban berbahasa Inggris, sedangkan pada Sistem Tanya Jawab Lintas Bahasa yang menjadi masukan pada sistem adalah query berbahasa Indonesia dan keluarannya adalah jawaban yang menggunakan bahasa Inggris. Teknik perolehan jawaban yang digunakan pada Sistem Tanya Jawab yang dilakukan oleh penulis ini adalah teknik yang menganalisa passage. Yang dimaksud dengan passage adalah bagian kecil dari dokumen yang isinya dapat berupa sejumlah kata (jumlahnya bervariasi, misalnya 50, 100 atau 200 kata), kalimat atau paragraf. Masing-masing passage tersebut selanjutnya akan diberikan nilai dan diberi keterangan (document annotation). Selanjutnya jawaban dari suatu query diperoleh dari passage yang mempunyai nilai tertinggi dan keterangan yang sesuai dengan query. Uji coba sistem dilakukan terhadap 200 query berbahasa Inggris untuk Sistem Tanya Jawab Satu Bahasa dan 200 query berbahasa Indonesia (hasil terjemahan dari query bahasa Indonesia yang dilakukan secara manual oleh penulis) untuk Sistem Tanya Jawab Lintas Bahasa. Mesin Pencari Informasi yang digunakan untuk menemukan dokumen adalah Lemur sedangkan koleksi dokumen yang digunakan adalah Los Angeles Times tahun 1994 dan Glasgow Herald tahun 1995. Baik query maupun koleksi dokumen, keduanya diperoleh dari CLEF 2004. Evaluasi Sistem Tanya Jawab dilakukan dengan cara mencocokkan jawaban dari hasil penelitian yang dilakukan penulis dengan hasil jawaban yang telah dinilai oleh CLEF 2004. Evaluasi sistem dilakukan untuk mengetahui seberapa baik sistem dapat memperoleh jawaban dengan benar. Hasil dari Sistem Tanya Jawab yang dilakukan penulis adalah 20 buah pertanyaan (10%) dari seluruh query berbahasa Inggris yang dimasukkan ke dalam sistem berhasil dijawab dengan benar sedangkan untuk query berbahasa Indonesia, sebanyak 16 buah pertanyaan (8%) berhasil dijawab dengan benar."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Septian Adiwibowo
"Perolehan informasi adalah salah satu bidang di ilmu komputer yang bertujuan untuk membantu menemukan informasi tertentu di antara banyak informasi yang tersedia. Sistem tanya jawab adalah satu topik pada bidang perolehan informasi, di mana informasi yang diperlukan direpresentasikan dalam suatu kueri berbentuk kalimat tanya dan menghasilkan jawaban singkat.
Penelitian ini menghasilkan sistem tanya jawab bilingual di mana pertanyaan diberikan dalam Bahasa Indonesia dan jawaban dihasilkan dalam Bahasa Inggris. Kueri yang digunakan adalah 190 pertanyaan Bahasa Indonesia dari topik tanya jawab Cross Language Information Retrieval (CLEF) 2006 yang terdiri dari pertanyaan fakta dan definisi. Koleksi dokumen yang digunakan adalah koleksi koran berbahasa Inggris: Glasgow Herald dan Los Angeles Times.
Untuk menemukan jawaban dari pertanyaan, pertama-tama sistem tanya jawab melakukan analisis terhadap teks pertanyaan untuk menentukan jenis jawaban yang diperlukan. Kemudian pertanyaan diterjemahkan ke Bahasa Inggris menggunakan ToggleText. Setelah itu pertanyaan yang telah berbahasa Inggris dijadikan kueri ke Lemur Toolkit untuk mendapatkan sekumpulan cuplikan dokumen dari koleksi dokumen yang relevan terhadap pertanyaan.
Bila pertanyaan bertipe fakta, maka semua entitas bernama dikumpulkan dari cuplikan-cuplikan dokumen tersebut untuk menjadi kandidat jawaban. Terdapat empat penilaian untuk memilih satu jawaban di antara para kandidat tersebut: frekuensi kemunculan kandidat jawaban yang diperoleh dari search engine; urutan dokumen yang diperoleh dari sistem perolehan informasi; jarak antarkata (Average Distance Weight); dan bobot kata kandidat jawaban.
Bila pertanyaan bertipe definisi maka perolehan jawaban dilakukan dengan mengekstrak frasa kata benda dari tiap cuplikan dokumen yang berisi kata-kata pertanyaan. Hasil evaluasi menunjukkan bahwa sistem tanya jawab ini berhasil mencapai ketepatan jawaban sebesar 14%."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Lily Fitria
"Penelitian ini bertujuan untuk mengembangkan sebuah Sistem Tanya Jawab (Question Answering System). Sistem Tanya Jawab merupakan sebuah sistem yang menerima masukan (input) pertanyaan dalam bahasa alami (natural language) bukan keywords, kemudian memproses koleksi dokumen yang tidak terstruktur, dan terakhir mengembalikan sebuah jawaban yang tepat sebagai keluaran (output), bukan dokumen. Sistem Tanya Jawab yang dihasilkan dalam penelitian ini menerima masukan sejumlah pertanyaan berbahasa Inggris dari query set Cross-Language Evaluation Forum (CLEF) dan menggunakan koleksi dokumen CLEF. Sistem Tanya Jawab ini dikembangkan dengan menerapkan teknik-teknik IR dan mengkombinasikannya dengan teknik pemrosesan bahasa alami. Aspek pemrosesan bahasa alami ditekankan pada analisis struktur ketergantungan (dependency structures) antar kata pada sebuah kalimat. Struktur ketergantungan antar kata diterjemahkan dalam skema anotasi hubungan sintaktik (syntactic relations annotation scheme). Hasil analisis struktur ketergantungan kalimat berupa aturanaturan yang dipakai untuk mengekstrak jawaban dan memperluas pertanyaan. Evaluasi terhadap Sistem Tanya Jawab menghasilkan 20 rights, 19 unsupporteds, dan 3 inexacts untuk query set tahun 2005 yang terdiri dari 92 queries. Sementara untuk query set tahun 2006 diperoleh 32 rights, 16 unsupporteds, dan 4 inexacts dari 152 queries."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Karisma Linda Nissa Kusumawati
"Pada skripsi ini telah dilakukan pengujian variasi kata kunci dalam jawaban mahasiswa yang mempengaruhi keakuratan nilai dari penggunaan program SIMPLE-O. Dengan adanya jawaban mahasiswa dalam berbagai variasi maka dapat dilihat pengaruh kata kunci dalam proses penilaian sistem. Kata kunci merupakan kumpulan kata-kata yang dipilih dari jawaban dimana kata-kata tersebut yang mempunyai nilai. Selain itu, terdapat kata bobot yang merupakan kumpulan dari kata kunci yang mempunyai bobot nilai lebih tinggi. Semakin banyak kata kunci yang dimasukkan, maka semakin besar keakuratan nilai pada sistem. Terdapat enam skenario yang digunakan sebagai bahan analisis.
Korelasi waktu penggunaan sistem saat program dimasukkan ke dalam cloud computing berbeda dengan penggunaan sistem saja. Waktu proses penilaian yang dihasilkan oleh sistem lebih cepat dibandingkan waktu proses penilaian saat sistem berada dimasukkan ke dalam cloud computing. Nilai korelasi yang baik adalah nilai korelasi yang mendekati satu. Waktu korelasi yang paling baik pada pengujian skenario pada sistem sebesar 0.97. Sedangkan nilai korelasi pada pengujian skenario pada sistem sebesar 0.22.

In this thesis will discuss some keyword variation affects the accuracy of the students in the program use SIMPLE-O. With the variety of answer?s student in large amounts it can be seen how keywords in the process of the assessment system. Keywords is a collection of selected words from the answers which those words that has a value. In addition, there is the word weight is a collection of keywords that have a higher weight value. Increasingly many keywords entered, the greater accuracy in the system. There are six scenarios used for analysis.
Correlation time when using system in cloud computing has different than using simply system. Time processing in system make a better value than using simply system in cloud computing. Correlation value has a good value when the correlation closed with one. Correlation time in scenario system is 0.97. Whereas correltion value in scenario system is 0.22.
"
Depok: Fakultas Teknik Universitas Indonesia, 2016
S65119
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rimbun Budiman
"Data Panel merupakan kombinasi dua jenis data yaitu data cross section dan data time series. Tujuan dari penulisan tugas akhir ini adalah mencari taksiran parameter pada model regresi untuk data panel yang tidak lengkap (incomplete panel data regression models) dengan komponen error satu arah (one-way error component). Selain itu model regresi tersebut merupakan random effect models, yang berarti perbedaan karakteristik individu dan waktu diakomodasikan pada komponen error dari model.
Metode yang digunakan untuk menaksir parameter adalah metode Feasible Generalized Least Squares (FGLS). Pada metode tersebut, matriks kovarians error tidak diketahui, sehingga perlu dilakukan penaksiran terhadap komponen variansi yang terdapat pada matriks kovarians error tersebut. Metode yang digunakan untuk menaksir komponen variansi adalah modifikasi metode penaksiran ANOVA yang diusulkan oleh Wallace dan Hussain."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>