Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query
cover
Chabot, B.
Amsterdam: De Bezige Bij, 1990
BLD 839.36 CHA d
Buku Teks  Universitas Indonesia Library
cover
Brey, Bart
Harleem: In de Knipscheer, 1987
BLD 839.36 BRE bo
Buku Teks  Universitas Indonesia Library
cover
Michael Harditya
Abstrak :
Penelitian ini melakukan pengembangan integrasi metode perangkum abstraktif dengan metode ekstraktif dalam merangkum teks berita yang melebihi input maksimal dari model machine learning. Penggabungan metode abstraktif dan ekstraktif menciptakan rangkuman yang lebih natural tanpa kehilangan makna semantiknya, serta menyelesaikan keterbatasan jumlah input maksimal dari model machine learning yang digunakan pada metode abstraktif. Bagian abstraktif dibuat menggunakan model machine learning yang menggunakan arsitektur Transformer, yaitu model BART. Bagian ekstraktif menggunakan algoritma gabungan untuk melakukan pembobotan tiap kalimat menggunakan term frequency – inverse document frequency (TF-IDF), konjungsi antar kalimat, dan peletakan kalimat pada paragraf yang dapat diidentifikasi menggunakan algoritma pemrograman. Dataset yang digunakan adalah benchmark IndoSum, yaitu dataset bahasa Indonesia untuk merangkum teks, sehingga dapat dievaluasikan dengan model pada penelitian yang serupa. Beberapa pengujian dilakukan pada model BART dan tokenizer, dengan nilai ROUGE Score menunjukan adanya peningkatan pada tokenizer bahasa Indonesia ketimbang bahasa Inggris. Hasil evaluasi pada finetuning model BART mendapatkan nilai ROUGE Score sebesar 0,725 untuk ROUGE-1, 0,635 untuk ROUGE-2, 0,699 untuk ROUGE-L, dan 0,718 untuk ROUGE-Lsum, menjadikan model BART lebih tinggi pada beberapa model lainnya pada riset terkait. Human evaluation dilakukan pada hasil integrasi, menunjukan hasil yang baik untuk morfologi, semantik, dan kenaturalan rangkuman, namun masih buruk untuk kesalahan pengetikan. ......This research develops the integration of abstractive summarization methods with extractive methods in summarizing news texts that exceed the maximum input from the machine learning model. Combining abstractive and extractive methods creates a more natural summary without losing its semantic meaning, and resolves the limitations of the maximum number of inputs from the machine learning model used in the abstractive method. The abstractive part was created using a machine learning model that uses the Transformer architecture, namely the BART model. The extractive section uses a combined algorithm to weight each sentence using term frequency - inverse document frequency (TF-IDF), conjunctions between sentences, and placement of sentences in paragraphs that can be identified using a programming algorithm. The dataset used is the IndoSum benchmark, namely an Indonesian language dataset for summarizing text, so that it can be evaluated with models in similar research. Several tests were carried out on the BART model and tokenizer, with the ROUGE Score showing an increase in the Indonesian language tokenizer compared to English. The evaluation results of finetuning the BART model obtained a ROUGE Score of 0.725 for ROUGE-1, 0.635 for ROUGE-2, 0.699 for ROUGE-L, and 0.718 for ROUGE-Lsum, making the BART model higher than several other models in related research. Human evaluation was carried out on the integration results, showing good results for morphology, semantics and naturalness of summaries, but still poor results for typing errors.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Zahra Septi Amalia
Abstrak :
Youtube merupakan salah satu web yang menawarkan video-video interaktif untuk berbagai kalangan. Tidak hanya sebagai sarana hiburan, tetapi juga sebagai sarana belajar berbagai bahasa dunia. Learn Dutch with Bart de Pau menjadi salah satu contoh dari beberapa kanal Youtube yang mengajarkan Bahasa Belanda secara daring mulai dari level dasar hingga menengah. Penelitian ini bertujuan untuk mengetahui apakah repetisi nomina, verba dan adjektiva yang ditawarkan oleh kanal Youtube Learn Dutch with Bart de Pau sesuai dengan 60 daftar kata berfrekuensi tinggi dari buku Handboek Nederlands als Tweede Taal in het volwassenenonderwijs karya Bart Bossers (2015). Repetisi dihitung berdasarkan teori Stuart Webb (2007) yaitu pengulangan kata sebanyak sepuluh kali. Metode yang digunakan adalah deskriptif kualitatif dan data yang digunakan bersumber dari serial Heb je zin? musim satu level 0/A1/A2. Hasil penelitian menunjukkan bahwa ketiga kategori kata ini mengalami repetisi lebih dari sepuluh. Akan tetapi hanya kategori adjektiva dan verba yang sesuai dengan 60 daftar kata berfrekuensi tinggi. Konteks cerita menjadi alasan mengapa kategori nomina yang diulang tidak sesuai dengan daftar kata dari Bart Bossers (2015). ......YouTube is one of the websites that offers interactive videos for various groups. Not only as a means of entertainment, but also as a means of learning various world languages. Learn Dutch with Bart de Pau is one example of several YouTube channels that teach Dutch online from basic to intermediate levels. This research aims to determine whether the repetition of nouns, verbs, and adjectives presented in the YouTube channel Learn Dutch with Bart de Pau aligns with the 60 high-frequency word lists from the book Handboek Nederlands als Tweede Taal in het volwassenenonderwijs by Bart Bossers (2015). Repetition is calculated based on Stuart Webb's (2007) theory of repeating a word ten times. The method is descriptive qualitative and the data comes from the series Heb je zin? season one level 0/A1/A2. The results show that these three categories of words experience more than ten repetitions. However, the analysis reveals that only adjectives and verbs align with the 60 high-frequency words list. The context of the story is the reason why the repeated nouns do not match the word list from Bart Bossers (2015).
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library