Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Achmad Fatchuttamam Abka
Abstrak :
Natural Language Generation (NLG) merupakan salah satu topik dalam bidang Natural Language Processing (NLP) yang hingga sekarang penelitiannya masih banyak dilakukan. Tugas dari NLG adalah menghasilkan bahasa natural (manusia) dari data non-linguistik. Secara umum, sistem NLG melibatkan tahapan-tahapan utama yaitu document planning, microplanning, dan surface realisation. Penelitian yang dilakukan adalah mengembangkan sistem NLG yang menggunakan konsep inference dalam prosesnya menghasilkan dokumen. Selain itu sistem juga diharapkan mampu memanfaatkan informasi yang sifatnya historis dalam proses menghasilkan dokumen tersebut. Pengembangan terutama dilakukan pada subbagian perencanaan (document planning dan microplanning) dengan domain yang dipilih adalah sepak bola. Implementasi dilakukan dengan menggunakan prolog. Prolog dipilih karena sangat cocok digunakan untuk proses inference. Evaluasi sistem dilakukan dengan cara melakukan pengujian unit untuk setiap komponen, terutama komponen yang melakukan inference. Hasilnya menunjukkan bahwa sistem berjalan sebagaimana mestinya yaitu mengeluarkan output yang benar sesuai dengan permintaan pada input (query). Selain itu, dilakukan juga evaluasi oleh manusia dengan cara menyebarkan kuesioner penilaian terhadap laporan yang dihasilkan oleh sistem NLG dibandingkan dengan laporan hasil buatan manusia. Hasilnya menunjukkan bahwa laporan buatan manusia masih lebih baik, namun laporan hasil dari sistem juga memperoleh penilaian yang cukup baik. ......Natural Language Generation (NLG) is one of the topics in the field of Natural Language Processing (NLP), which until now is still a lot of research done. Task of NLG is to generate natural (human) language from non-linguistic data. In general, the NLG system involves main phases namely document planning, microplanning, and surface realisation. This research is to develop NLG system which uses the concept of inference in the process of generating document. Furthermore, the system also expected to use historical information in the process of producing the document. Development is mainly on planning phase (document planning and microplanning) with selected domain is football. Implementation is done by using prolog. Prolog selected because it is suitable for inference process. Evaluation of the system is done by doing a unit testing for each component, especially for component which perform inference. The result shows that the system is running as it should be that is gives correct output according to the request on the input (query). In addition, the evaluation was also conducted by distributing questionnaires to compare the reports generated by the NLG system with man-made reports. The results show that man-made report is still better, but the report generated by the NLG system also obtain a fairly good assessment.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2013
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Achmad Fatchuttamam Abka
Abstrak :
Peringkasan lintas bahasa adalah sebuah proses menghasilkan ringkasan dalam bahasa target dari dokumen sumber berbahasa lain. Secara tradisional, peringkasan lintas bahasa dilakukan dalam skema pipeline yang melibatkan dua langkah, yaitu penerjemahan dan peringkasan. Pendekatan ini memiliki masalah, yaitu munculnya error propagation. Untuk mengatasi masalah tersebut, penelitian ini mengusulkan peringkasan lintas bahasa abstraktif end-to-end tanpa secara eksplisit menggunakan mesin penerjemah. Arsitektur peringkasan lintas bahasa yang diusulkan berbasis Transformer yang sudah terbukti memiliki performa baik dalam melakukan text generation. Model peringkasan lintas bahasa dilatih dengan 2-task learning yang merupakan gabungan peringkasan lintas bahasa dan peringkasan satu bahasa. Hal ini dilakukan dengan menambahkan decoder kedua pada Transformer untuk menangani peringkasan satu bahasa, sementara decoder pertama menangani peringkasan lintas bahasa. Pada arsitektur peringkasan lintas bahasa juga ditambahkan komponen multilingual word embeddings. Multilingual word embeddings memetakan kedua bahasa yang berbeda ke dalam ruang vektor yang sama sehingga membantu model dalam memetakan relasi antara input dan output. Hasil eksperimen menunjukkan model usulan mendapatkan kenaikan performa hingga +32,11 ROUGE-1, +24,59 ROUGE-2, +30,97 ROUGE-L untuk peringkasan lintas bahasa dari dokumen sumber berbahasa Inggris ke ringkasan berbahasa Indonesia dan hingga +30,48 ROUGE-1, +27,32 ROUGE-2, +32,99 ROUGE-L untuk peringkasan lintas bahasa dari dokumen sumber berbahasa Indonesia ke ringkasan berbahasa Inggris. ......Cross-lingual summarization (CLS) is a process of generating summaries in the target language from source documents in other languages. Traditionally, cross-lingual summarization is done in a pipeline scheme that involves two steps, namely translation and summarization. This approach has a problem, it introduces error propagation. To overcome this problem, this study proposes end-to-end abstractive cross-lingual summarization without explicitly using machine translation. The proposed cross-lingual summarization architecture is based on Transformer which has been proven to have good performance in text generation. The cross-lingual summarization model is trained with 2-task learning, which is a combination of cross-lingual summarization and monolingual summarization. This is accomplished by adding a second decoder to handle monolingual summarization, while the first decoder handles cross-lingual summarization. The multilingual word embeddings component is also added to the cross-lingual summarization architecture. Multilingual word embeddings map both different languages into the same vector space so that it helps the model in mapping the relationship between input and output. The experimental results show that the proposed model achieves performance improvements of up to +32.11 ROUGE-1, +24.59 ROUGE-2, +30.97 ROUGE-L for cross-lingual summarization from English source documents to Indonesian summaries and up to +30,48 ROUGE-1, +27.32 ROUGE-2, +32.99 ROUGE-L for cross-lingual summarization from Indonesian source documents to English summaries.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library