Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 89749 dokumen yang sesuai dengan query
cover
Ronaldi Tjaidianto
"Perbedaan media komunikasi yang digunakan antara komunitas tuli dengan masyarakat normal menjadi pembatas dalam menjalin komunikasi antar keduanya. Untuk mengatasi hal ini, diperlukan suatu alat penerjemah yang dapat menerjemahkan bahasa isyarat Indonesia (Bisindo) yang biasa digunakan oleh komunitas tuli di Indonesia ke bahasa lisan dan sebaliknya. Penelitian ini akan berkontribusi pada pembentukan alat penerjemah tersebut dengan menerjemahkan kalimat dalam format Bisindo menjadi kalimat bahasa Indonesia secara satu arah. Penerjemahan dilakukan dengan dua metode berbeda, yaitu penerjemahan berbasis statistik menggunakan model neural machine translation (NMT) dan penerjemahan berbasis aturan. Khusus untuk penerjemahan berbasis aturan, penelitian ini hanya akan berfokus pada sebuah tahapan saja yaitu penambahan preposisi. Selain itu, penelitian ini juga memaparkan metode pembentukan dataset yang menyerupai karakteristik Bisindo dari dataset Indonesia menggunakan aturan-aturan sederhana untuk mengatasi minimnya ketersediaan dataset tersebut. Model NMT terbaik pada eksperimen ini memperoleh peningkatan nilai SacreBLEU sekitar 56%, serta penurunan nilai WER sekitar 7% dari nilai awal yang diperoleh pada dataset testing secara langsung. Di sisi lain, penerjemahan berbasis aturan memperoleh peningkatan nilai SacreBLEU sekitar 1.1% serta penurunan nilai WER sekitar 9.7% dari nilai awal. Sebagai tambahan, model tersebut memperoleh nilai precision sebesar 0.436 dan nilai recall sebesar 0.340 pada performanya dalam menambahkan preposisi secara spesifik.

The difference of communication methods used by the deaf community and the society becomes a boundary that limits the communication between the two. In order to tackle this issue, we need a tool that can translate sign language (especially bahasa isyarat Indonesia or Bisindo which is commonly used by the deaf community in Indonesia) to oral language and vice versa. This experiment will contribute to such tool by building a tool to translate sentences in Bisindo format to Bahasa Indonesia in one direction. Translation is done using two different methods: statistic-based translation using neural machine translation (NMT) models and rule-based translation. Specific to the rule-based approach, we will only focus on one step of the translation process which is adding prepositions. Aside of that, we also propose a method in building Bisindo-like dataset from Bahasa Indonesia dataset in order to handle the low availability of it. The best NMT model in this experiment achieved an improvement around 56% in SacreBLEU and a decrease around 7% in WER compared to the initial metrics value that we got directly from the testing dataset. On the other side, rule-based translation achieved an improvement around 1.1% in SacreBLEU and a decrease around 9.7% in WER compared to the initial metrics value. In addition, the model achieved 0.436 precision score and 0.340 recall score specific to its performance in adding preposition."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Helma Rizkiana
"Penelitian mengenai negasi dalam bahasa isyarat belum banyak dilakukan di Indonesia. Memperhatikan situasi tersebut, penelitian ini bertujuan untuk mendeskripsikan negasi dalam bahasa isyarat Indonesia (Bisindo) yang berfokus pada analisis terhadap bentuk penanda manual dan nonmanual serta pola susunan kata dari satu jenis kalimat, yaitu kalimat pernyataan. Penelitian ini menggunakan data berupa rekaman video berbahasa isyarat informan tuli yang berisi 60 kalimat pernyataan negasi dalam Bisindo. Data yang sudah dikumpulkan, selanjutnya ditranskripsi terlebih dahulu untuk mengetahui bentuk penanda manual, penanda nonmanual, serta pola susunan kata dalam kalimat pernyataan negasi Bisindo. Hasil penelitian memperlihatkan bahwa (1) kalimat pernyataan negasi pada Bisindo dominan menggunakan penanda manual untuk menyatakan negasi; (2) penanda manual yang digunakan untuk menegasikan kalimat adalah TIDAK/BUKAN, BELUM, TIDAK-ADA, TIDAK-MENGERTI, TIDAK-PERNAH/BELUM-PERNAH, TIDAK-SUKA, dan TIDAK-MAU yang cenderung muncul di akhir kalimat; (3) jenis gerakan penanda nonmanual yang digunakan dalam kalimat pernyataan negasi adalah alis naik, alis turun, dan kepala menggeleng, (4) gerakan nonmanual yang paling banyak muncul adalah alis naik, sedangkan penanda manual negasi yang paling banyak digunakan adalah TIDAK/BUKAN; (5) untuk pola susunan kata, ditemukan sebanyak 10 jenis/tipe dan pola SP-Neg muncul dengan jumlah yang paling signifikan.
Research on negation in sign language has not been extensively conducted in Indonesia. Recognizing this gap, this study aims to describe negation in Indonesian Sign Language (Bisindo) which focuses on analyzing the forms of manual and nonmanual markers, as well as word order patterns in one type of sentence: statement sentences. This study utilizes data in the form of video recordings of deaf informants using sign language, comprising 60 negation statement sentences in Bisindo. The collected data is transcribed to identify the forms of manual markers, nonmanual markers, and word order patterns in Bisindo negation statement sentences. The findings show that (1) negation statement sentences in Bisindo predominantly employ manual markers to express negation; (2) manual markers such as NOT/NOT, NOT-YET, NOTHING, NOT-UNDERSTAND, NEVER, NOT-LIKE, and NOT-WANT are used to negate sentences, often appearing at the end of the sentence; (3) the types of nonmanual marker gestures used in negation statement sentences include raising eyebrows, lowering eyebrows, and shaking the head; (4) the most prevalent nonmanual gesture is raising eyebrows, while the most frequently used negation manual marker is NOT/NOT; (5) concerning word order patterns, 9 types are identified, with the SP-Neg pattern being the most significant."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Felicia Salim
"Perkembangan teknologi membawa banyak inovasi pada berbagai bidang, salah satunya dalam bidang penerjemahan sastra dan bahasa. Dengan munculnya mesin-mesin penerjemah berbasis Neural Machine Translate (NMT) membantu dan mempercepat penerjemahan kumpulan karya dan teks dalam berbagai bahasa, tetapi tidak diketahui apakah terjemahan mesin tersebut sudah tepat dan lebih unggul dibandingkan dengan terjemahan manusia. Penelitian ini mengkaji secara semantis dan sintaktis hasil terjemahan mesin berbasis NMT yaitu Baidu Translate, Youdao Translate dan Google Translate dibandingkan dengan terjemahan penerjemah pada buku Dizigui. Metode yang digunakan adalah metode penelitian kualitatif dengan melakukan penelusuran terhadap suku kata, frasa, klausa dan kalimat kemudian dikomparasikan hasil terjemahan tersebut dengan hasil terjemahan penerjemah dalam buku Dizigui. Hasil penelitian menemukan bahwa terjemahan manusia memiliki keunggulan dibandingkan dengan terjemahan mesin penerjemah. Hal membedakan terjemahan  mesin dan manusia terdapat pada cara mesin memaknai karakter, interpretasi mesin terhadap komposisi sintaktis dan pengetahuan konsep budaya pada setiap karakter kutipan teks.

Technology developments have brought many innovations in various fields, one of which is in the field of literary and language translation. With the advance of machine translation based on Neural Machine Translate (NMT) it helps and accelerates the translation of collections of works and texts in various languages, but it’s unknown whether machine translation is correct and superior to human translation. This study examines semantically and syntactically the results of NMT-based machine translations Baidu Translate, Youdao Translate and Google Translate compared to translator’s translations in Dizigui book. The method used is a qualitative research method by searching syllables, phrases, clauses and sentences then compared the results of the translation with the results of the translator's translation in Dizigui's book. The results of the study found that human translation has an advantage over machine translation. What distinguishes machine and human translation lies in the way the machine interprets the characters, the machine's interpretation of the syntactic composition and knowledge of the cultural concept in each character of the text quote."
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Tambunan, Anggino
"Tulisan ini bertujuan mendeskripsikan pembentukan kalimat nondeklaratif, yaitu kalimat yang tidak mengungkapkan pernyataan atau proposisi, dalam Bahasa Isyarat Indonesia atau yang lebih dikenal dengan sebutan Bisindo. Kalimat nondeklaratif yang dibahas dalam tulisan ini adalah kalimat interogatif, kalimat imperatif, dan kalimat eksklamatif. Dua aspek kalimat nondeklaratif yang diperiksa adalah strukturnya dan unsur nonmanual yang menandainya. Berdasarkan analisis terhadap kalimat-kalimat nondeklaratif yang dihasilkan oleh dua penutur Bisindo ditemukan bahwa (1) kalimat nondeklaratif Bisindo cenderung diawali dengan topik yang dapat berupa subjek, pronomina, nomina atau pewatas frasa yang bermakna 'pemilik'; (2) dalam kalimat interogatif, kata tanya, apabila digunakan, cenderung muncul pada kata di akhir kalimat; (3) unsur nonmanual yang terdapat dalam kalimat nondeklaratif adalah alis (mengerut, menaik), mata (membesar, menyipit, tertutup), dan gerakan kepala (mengangguk); dan (4) unsur-unsur nonmanual tersebut dapat muncul pada keseluruhan kalimat, sebagain kalimat, dan pada kata tertentu.  

The Indonesian Sign Language, better known as Bisindo, is a sign language used by many deaf communities in Indonesia. Misconceptions about this language and its speakers are abound because little is known about it. This paper aims at describing the formation of non-declarative sentences-those that do not express statement or proposition in Indonesian Sign Language. Non-declarative sentences discussed in this research are interrogative, imperative, and exclamative sentences. Two aspects to be examined are the structure and non-manual elements. The data for this paper are collected through elicitation from two Bisindo speakers. From the analysis of the data, it is found that (1) nondeclarative sentences in Bisindo tends to be initially marked by topic-part of sentence which shows what the sentence is about; (2) in interogative sentences, the wh-question word tends to occur at the end of the sentence; (3) non-manual elements that occur in non-declarative sentences are eye brows (lowered, arisen), eyes (widened, narrowed, closed), and head movement (nodded); and (4) the nonmanual elements can occur in in a certain part of the sentence or in the whole sentence depending on the types of non-declarative sentence. "
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2017
S70319
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arini Satyandita
"Penelitian ini membahas penerjemahan preposisi pemarkah lokatif dan adverbia lokatif bahasa Prancis ke dalam bahasa Indonesia dengan menganalisis padanannya. Hasil penelitian menunjukkan bahwa preposisi pemarkah lokatif bahasa Prancis dapat diberi padanan berupa preposisi pula dalam bahasa Indonesia, sedangkan adverbia lokatif bahasa Prancis tidak pernah berpadanan adverbia lokatif bahasa Indonesia, sebab bahasa Indonesia tidak mengenal adverbia lokatif. Oleh karena itu, kesejajaran bentuk dapat diterapkan dalam penerjemahan preposisi pemarkah lokatif, sebaliknya penerjemahan adverbia lokatif tidak terikat pada kesejajaran bentuk dan lebih mementingkan kesepadanan tekstual. Hasil analisis juga menunjukkan pergeseran dalam penerjemahan, baik pergeseran tataran maupun pergeseran kategori. Meskipun demikian, amanat yang terdapat dalam bahasa sumber tetap dapat tersampaikan dalam bahasa sasaran.

This research explains the translation of locative prepositions and locative adverbs in French language to Indonesian language by analyzing their Indonesian equivalents. It shows that there are Indonesian equivalents for French locative prepositions that work as prepositions as well, whereas Indonesian equivalents for French locative adverbs can never be determined as adverbs because there is no locative adverb in Indonesian language. Therefore, formal correspondence can be applied in the translation of locative prepositions. On the other hand, the translation of locative adverbs ignores formal correspondence but emphasizes textual equivalence. The result of the analysis shows translation shifts, both level shifts and category shifts. Nevertheless, the message in the source language still can be transferred in the target language."
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2014
S56458
UI - Skripsi Membership  Universitas Indonesia Library
cover
Noer Fitria Putra Setyono
"SIBI merupakan bahasa isyarat resmi yang digunakan di Indonesia. Penggunaan SIBI seringkali ditemukan permasalahan karena banyaknya gerakan isyarat yang harus diingat. Penelitian ini bertujuan untuk mengenali gerakan isyarat SIBI dengan cara mengekstraksi fitur tangan dan wajah yang kemudian diklasifikasikan menggunakan Bidirectional Long ShortTerm Memory (BiLSTM). Ekstraksi fitur yang digunakan dalam penelitian ini adalah Deep Convolutional Neural Network (DeepCNN) seperti ResNet50 dan MobileNetV2, di mana kedua model tersebut digunakan sebagai pembanding. Penelitian ini juga membandingkan performa dan waktu komputasi antara kedua model tersebut yang diharapkan dapat diterapkan pada smartphone nantinya, dimana model tersebut akan diimplementasikan. Hasil penelitian menunjukkan bahwa penggunaan model ResNet50-BiLSTM memiliki kinerja yang lebih baik dibandingkan dengan MobileNetV2-BiLSTM yaitu 99,89%. Namun jika akan diaplikasikan pada arsitektur mobile, MobileNetV2-BiLSTM lebih unggul karena memiliki waktu komputasi yang lebih cepat dengan performa yang tidak jauh berbeda jika dibandingkan dengan ResNet50-BiLSTM.

SIBI is a sign language that is officially used in Indonesia. The use of SIBI is often found to be a problem because of the many gestures that have to be remembered. This study aims to recognize SIBI gestures by extracting hand and facial features which are then classified using Bidirectional Long ShortTerm Memory (BiLSTM). The feature extraction used in this research is Deep Convolutional Neural Network (DeepCNN) such as ResNet50 and MobileNetV2, where both models are used as a comparison. This study also compares the performance and computational time between the two models which is expected to be applied to smartphones later, where both models can now be implemented on smartphones. The results showed that the use of ResNet50-BiLSTM model have better performance than MobileNetV2-BiLSTM which is 99.89\%. However, if it will be applied to mobile architecture, MobileNetV2-BiLSTM is superior because it has a faster computational time with a performance that is not significantly different when compared to ResNet50-BiLSTM."
Depok: Fakultas Komputer Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Deyana Efelin
"Perkembangan teknologi terlebih pada bidang komputer membawa banyak inovasi yang mempengaruhi dunia ilmu pengetahuan, salah satunya dalam bidang penerjemahan. Munculnya mesin-mesin penerjemah dapat membantu dan juga mempercepat penerjemahan kumpulan karya dan teks dalam berbagai bahasa, tetapi belum diketahui pasti bagaimana ketepatan dari hasil terjemahan mesin tersebut. Penelitian ini membandingkan hasil terjemahan teks 苗族银饰miaozu yinshi oleh empat mesin penerjemah yaitu Google Translate, Baidu Fanyi, Youdao, dan Lingvanex dengan hasil terjemahan manual. Hasil terjemahan keempat mesin tersebut selanjutnya dianalisis ketepatan pilihan kosakata dan struktur kalimatnya dalam bahasa sasaran. Metode penelitian yang digunakan adalah metode kualitatif yang memaparkan hasil penelitian secara deskriptif. Hasil penelitian menemukan bahwa terjemahan manual memiliki keunggulan dibandingkan dengan hasil terjemahan mesin. Hal ini disebabkan kurangnya kemampuan mesin dalam memaknai kosakata dalam bahasa sumber dan kurangnya pemahaman mesin terhadap fungsi sintaktis serta kelaziman bahasa sasaran.
Technological developments especially in the field of computers have brought many innovations that have influenced the world of science, one of which is in the field of translation. The emergence of machine translations can help and speed up the translation of collections of works and texts in various languages, but it is not certain how accurate the machine translation results are. This review compares the results of the translation of the text 苗族银饰miaozu yinshi by four machine translators namely Google Translate, Baidu Fanyi, Youdao, and Lingvanex with the results of manual translation. The translation results of the four machines are then analysed for the accuracy of the choice of vocabulary and sentence structure in the target language. The research method used is a qualitative method which describes the results of the research descriptively. The results of the study found that manual translation has advantages over machine translation. This is due to a lack of machine ability to interpret vocabulary in the source language and a lack of machine understanding of the syntactic functions and prevalence of the target language."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Lucky Susanto
"Neural machine translation (NMT) untuk bahasa daerah yang low resource di Indonesia menghadapi tantangan yang signifikan, meliputi kurangnya tolok ukur dasar yang representatif dan ketersediaan data yang terbatas. Penelitian ini mengatasi masalah tersebut dengan cara mengembangkan sebuah tolok ukur dasar yang bersifat replicable untuk empat bahasa daerah di Indonesia yang sering digunakan menggunakan sumber daya komputasi terbatas pada dataset FLORES-200. Penelitian ini mengadakan penyelidikan sistematis dan pemeriksaan menyeluruh terhadap berbagai pendekatan dan paradigma untuk melatih model NMT pada konteks sumber daya komputasi terbatas yang pertama. Tolok ukur ini, dilatih menggunakan sumber daya komputasi dan data pelatihan terbatas, mencapai performa yang kompetitif serta mampu melewati performa GPT-3.5-turbo yang telah di zero-shot untuk berbagai arah translasi dari bahasa Indonesia ke bahasa daerah yang low resource. Penelitian ini berkontribusi kepada kemajuan bidang NMT untuk bahasa-bahasa low resource di Indonesia dan membuka jalan untuk penelitian kedepannya sekaligus mengeksplorasi limitasi GPT-3.5-turbo dalam melakukan translasi bahasa daerah yang low resource. Akhirnya, penelitian ini menunjukkan bahwa melatih model XLM menggunakan data sintetis hasil code-switch memiliki performa translasi diatas pendekatan pelatihan penuh dan pelatihan model XLM dengan data monolingual saja.

Neural machine translation (NMT) for low-resource local languages in Indonesia faces significant challenges, including the lack of a representative benchmark and limited data availability. This study addresses these challenges by establishing a replicable benchmark for four frequently spoken Indonesian local languages using limited computing resources on the FLORES-200 dataset. This study conduct the first systematic and thorough examination of various approaches and paradigms for NMT models in low-resource language settings. The benchmark, trained with limited computing power and training data, achieves competitive performance and surpass zero-shot GPT-3.5-turbo in multiple translation directions from Indonesian to low-resource local languages. This work contributes to the advancement of NMT for low-resource Indonesian languages and pave ways for future studies while exploring the limit of GPT-3.5-turbo in translating low-resource local languages. This study shows that training XLM models using synthetic data through code-switching increases translation performance of NMT models down the line compared to just training NMT models from scratch or training XLM models with only monolingual data."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arie Andrasyah Isa
"ABSTRAK
Disertasi ini menyingkap strategi, ideologi, metode, dan teknik penerjemahan ungkapan sapaan bahasa Inggris-Amerika dan ungkapan sapaan bahasa Indonesia serta budaya kebahasaan yang terlibat di dalam penerjemahan. Penelitian kualitatif ini menggunakan tiga novel Amerika beserta terjemahan bahasa Indonesianya dan wawancara dengan penerjemah serta narasumber lain. Didukung oleh teori penerjemahan, ungkapan sapaan, dan budaya kebahasaan, penelitian ini menemukan dua ideologi penerjemahan yang berhulu pada strategi penerjemahan pemancaan (foreignization) dan pelokalan (domestication). Di samping itu, juga ditemukan tujuh metode penerjemahan dan dua puluh empat teknik penerjemahan serta budaya kebahasaan yang menyangkut kuasa (power) dan solidaritas (solidarity).

ABSTRACT
This dissertation reveals the translation strategies, ideologies of translation, translation methods, and translation techniques of American-English forms of address into their Indonesian translations within linguistic culture involved in the translation. This qualitative research employs three American novels with their translation versions and interviews with their translators and other resource persons. Through the theories of translation, forms of address theories, and linguistic culture, the research findings indicate that two ideologies of translation: foreignization and domestication. Besides, it is also found that there are seven methods of translation with twenty four techniques of translation and linguistic culture relating to power and solidarity."
Depok: 2015
D2108
UI - Disertasi Membership  Universitas Indonesia Library
cover
Sri Hartati Wijono
"Terjemahan mesin adalah program komputer yang menerjemahkan kata dari satu bahasa ke bahasa lain. Neural Machine Translation (NMT) merupakan salah satu jenis terjemahan mesin yang menggunakan hasil pelatihan corpus paralel untuk menerjemahkan kata. Proses NMT dengan pelatihan menggunakan corpus paralel dalam jumlah besar (high resource) dapat memberikan hasil terjemahan sangat baik. Tetapi proses NMT yang dilatih menggunakan corpus paralel dalam jumlah kecil (low-resource) tidak mampu memberikan penerjemahan kata dengan baik akibat adanya out-of-vocabulary (OOV). Salah satu cara mengurangi OOV pada low-resourse NMT adalah melatih NMT menggunakan subword dari hasil segmentasi kata. Canonical segmentation dipilih untuk mengsegmentasi kata bahasa Jawa dan bahasa Indonesia menjadi subword afiks dan subword root word yang mengalami alomorf. Hal ini dikarenakan kedua hasil subword tersebut memiliki makna linguistik yang dapat digunakan untuk mengurangi OOV. Proses canonical segmentation tersebut dilakukan menggunakan encoder-decoder Transformer dengan memanipulasi masukannya sebagai usulan dari penelitian. Penelitian ini juga mengembangkan algoritma untuk membuat dataset canonical segmentation bahasa Jawa yang digunakan untuk melatih Transformer. Manipulasi masukan Transformer tersebut berupa penggunaan tag fitur afiks dan root word atau tag fitur afiks dan urutan root word yang digabungkan ke setiap karakter masukan untuk membantu proses pembelajaran Transformer. Manipulasi usulan ini menghasilkan akurasi segmentasi sebesar 84,29% untuk semua kata, 69,82% untuk kata berimbuhan dan 56,09% untuk kata berimbuhan canonical. Nilai F1 yang dihasilkan 92,89% untuk semua kata, 98,69% untuk kata berimbuhan dan 96,81% untuk kata berimbuhan canonical. Subword hasil proses segmentasi ini selanjutnya digabung dengan tag fitur berupa afiks dan root word untuk menguji low-resource NMT. Metode ini dapat eningkatkan nilai BLEU sebesar +3,55 poin dibandingkan penggunaan kata tanpa segmentasi dan meningkat +2,57 poin dibandingkan penggunaan subword BPE yang banyak dipakai saat ini.

Machine translation is a machine that translates words from one language to another. Neural Machine Translation (NMT) is a type of machine translation that uses the results of parallel corpus training to translate words. The NMT process with training using a large number of the parallel corpus (high resource) can give excellent translation results. But the NMT process, which was trained using a parallel corpus in small numbers (low resources), could not provide good word translation due to out-of-vocabulary (OOV). One way to reduce OOV in low-resource NMT is to train NMT using subwords from word segmentation results. Canonical segmentation was chosen to segment Javanese and Indonesian words into affix and root word subwords that experience allomorphism. This segmentation method was chosen because the two subword results have linguistic meanings that can be used to reduce OOV. The canonical segmentation process is conducted using Transformer encoder-decoder by manipulating the input as a research proposal. This research also develops an algorithm to create a corpus parallel canonical segmentation in the Java language used to train Transformers. Manipulating the Transformer input uses affix and root word feature tags or affix and root word sequences concatenated with each input character to help the Transformer learning process. This proposed manipulation produces a segmentation accuracy of 84.29% for all words, 69.82% for affixed words and 56.09% for canonical affixed words. The resulting F1 value is 92.89% for all words, 98.69% for affixed words and 96.81% for canonical affixed words. The subwords resulting from the segmentation process are then combined with feature tags in the form of affixes and root words to test low-resource NMT. This method can increase the BLEU value by +3.55 points compared to using words without segmentation and +2.57 points compared to using BPE subwords which are widely used today."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>