Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 3 dokumen yang sesuai dengan query
cover
Amelia Wahyu Julisdianti
Abstrak :
Kamus Larousse merupakan salah satu kamus utama berbahasa Prancis yang digunakan secara luas. Setiap tahunnya, Larousse akan menerbitkan kamus edisi terbarunya dengan penambahan sekitar 150 kata baru. Kemunculan kata baru dalam sebuah bahasa biasa dikenal dengan fenomena neologisme. Penelitian ini bertujuan untuk mengindentifikasi bagaimana neologisme yang ditemukan dalam Larousse edisi tahun 2018 dan 2019 terbentuk. Adapun teori yang digunakan dalam penelitian ini adalah teori yang dipaparkan oleh Lehmann & Martin-Berthet (1999) dan Grevisse, M., & Goosse, A. (2007) mengenai empat proses pembentukan kata dalam bahasa Prancis, yakni derivasi, komposisi, siglaison, dan, troncation. Kata baru yang masuk di dalam kamus juga dipengaruhi oleh bahasa asing lain sehingga penelitian ini juga menggunakan teori mengenai peminjaman kata dari bahasa lain dan faktor peminjaman yang dipaparkan oleh Haspelmath & Tadmor (2009). Data yang digunakan bersumber dari brosur digital yang diterbitkan Larousse untuk tujuan promosi dan memuat daftar kata baru  kamus edisi terbarunya. Penelitian ini menunjukkan bahwa kata-kata baru yang muncul dalam kamus Larousse tahun 2018 dan 2019, terdiri dari dua kategori yaitu, (1) kata baru yang terbentuk melalui proses pembentukan kata dalam bahasa Prancis, (2) kata baru yang terbentuk melalui proses peminjaman kata. Ditemukan bahwa komposisi mendominasi pembentukan neologisme yang ditemukan kemudian diikuti oleh proses derivasi. Hal ini terkait dengan komposisi yang lebih mudah untuk diciptakan dibandingkan dengan derivasi. Selain itu, dalam penelitian ini juga ditemukan penemuan formulasi pembentukan kata yang belum dipaparkan oleh Lehmann & Martin-Berthet atau Grevisse, yaitu dengan menggunakan nom propre sebagai kata dasar.  ......Larousse is one of the most important and widely used French language dictionary that annually releases its new edition with the addition of on average 150 new words. The emergence of new words known as the phenomenon of neologism. The aim of this study is to identify how new words or neologisms in Larousse dictionary edition of 2018 and 2019 were formed. The analysis essentially uses the combination of theories of Lehmann & Martin-Berthet (1999) and Grevisse, M., & Goosse, A. (2007) on four types of word formation: derivation, composition, siglaison (acronym), and troncation (clipping).  neologisms is often influenced by foreign language and therefore additional theory on borrowing words from other languages and lending factors introduced by Haspelmath & Tadmor (2009) is also used. Data was collected from Larousse dictionary’s digital press kit, served to promote their latest edition and to highlight the new words added in the dictionary. The study indicates that the new words in Larousse edition of 2018 and 2019 can be categorized into two groups (1) First group of neologisms that are formed by the process of word-formation and (2) neologisms that are formed through loan words Composition dominates the process of neologisms, followed by derivation. This relates to composition’s formation that is considered less complicated in terms of grammar than derivation.  An interesting finding is that based on data analysis there is type of word formation with nom propre as a base word which has not been discussed by Lehmann & Martin-Berthet or Grevisse in their theories.

Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2020
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Intan Fadilla Andyani
Abstrak :
Pengembangan NLP di Indonesia terbilang lambat, terutama penelitian terkait bahasa daerah Indonesia. Alasannya adalah sumber data bahasa daerah tidak terdokumentasikan dengan baik sehingga sumber daya NLP yang ditemukan juga sedikit. Penelitian ini membahas metode ekstraksi kamus-kamus bahasa daerah di Indonesia untuk menghasilkan suatu sumber daya NLP yang dapat dibaca oleh mesin. Tahap penelitian dimulai dari pengumpulan data kamus, perancangan dan eksperimen metode ekstraksi, serta evaluasi hasil ekstraksi. Hasil penelitian berupa korpus paralel, leksikon bilingual, dan pasangan kata dasar-kata berimbuhan dalam format CSV dari beberapa kamus dwibahasa di Indonesia. Beberapa bahasa di antaranya adalah bahasa Minangkabau, Sunda, Mooi, Jambi, Bugis, Bali, dan Aceh. Perancangan metode ekstraksi berfokus pada kamus Minangkabau yang kemudian dilakukan eksperimen pada kamus-kamus bahasa daerah lainnya. Evaluasi dilakukan terhadap hasil ekstraksi kamus Minangkabau dengan melakukan anotasi data. Perhitungan akurasi dilakukan terhadap penempatan kelompok kata dari hasil anotasi. Hasil perhitungan menunjukkan 99% hasil ekstraksi sudah tepat untuk penentuan kelompok kata pada leksikon bilingual dan 88% untuk korpus paralel. Tim peneliti menemukan bahwa struktur dalam kamus bahasa daerah Indonesia sangat beragam, sehingga menuntut perlakuan yang berbeda pada setiap kamus, seperti perihal penomoran halaman. Selain itu, tim peneliti menemukan banyak kamus bahasa daerah Indonesia dengan kualitas yang kurang baik. Kualitas yang kurang baik ditunjukan dengan banyaknya kesalahan baca akibat noise yang terdapat pada tampilan berkas kamus. ......The development of NLP in Indonesia is relatively slow, especially for Indonesian local languages. Indonesian local language data sources are not well-documented so that there are only few NLP resources found. This study discusses the extraction method of Indonesian local language dictionaries to produce a machine-readable NLP resource. Starting from collecting dictionary data, designing and experimentation of the extraction method, and evaluating the extraction results. The extraction results are parallel corpus, bilingual lexicon, and words’ morphological form in CSV format from several Indonesian Local Language bilingual dictionaries that are Baso Minangkabau, Sundanese, Moi, Jambinese, Buginese, Balinese, and Acehnese. The designed method is also applied to some other local language dictionaries. Data annotation has been done to evaluate the extraction results so that we can calculate its accuracy of word classification for parallel corpus and bilingual lexicon. Extraction method design focuses on the Minangkabau dictionary which is then applied to other dictionaries. Data annotation has been done to evaluate the extraction results.The evaluation results show that 99% of the extraction results are correct for word classifying in the bilingual lexicon and 88% correct for parallel corpus. We found that the structure of dictionaries varies, so it requires different approaches for each dictionary, for example regarding page numbering. We also found many dictionaries with poor quality. The poor quality is indicated by the number of reading errors due to noise contained in the original dictionary file.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Daniel Martin
Abstrak :
Pengembangan NLP di Indonesia terbilang lambat, terutama penelitian terkait bahasa daerah Indonesia. Alasannya adalah sumber data bahasa daerah tidak terdokumentasikan dengan baik sehingga sumber daya NLP yang ditemukan juga sedikit. Penelitian ini membahas metode ekstraksi kamus-kamus bahasa daerah di Indonesia untuk menghasilkan suatu sumber daya NLP yang dapat dibaca oleh mesin. Tahap penelitian dimulai dari pengumpulan data kamus, perancangan dan eksperimen metode ekstraksi, serta evaluasi hasil ekstraksi. Hasil penelitian berupa korpus paralel, leksikon bilingual, dan pasangan kata dasar-kata berimbuhan dalam format CSV dari beberapa kamus dwibahasa di Indonesia. Beberapa bahasa di antaranya adalah bahasa Minangkabau, Sunda, Mooi, Jambi, Bugis, Bali, dan Aceh. Perancangan metode ekstraksi berfokus pada kamus Minangkabau yang kemudian dilakukan eksperimen pada kamus-kamus bahasa daerah lainnya. Evaluasi dilakukan terhadap hasil ekstraksi kamus Minangkabau dengan melakukan anotasi data. Perhitungan akurasi dilakukan terhadap penempatan kelompok kata dari hasil anotasi. Hasil perhitungan menunjukkan 99% hasil ekstraksi sudah tepat untuk penentuan kelompok kata pada leksikon bilingual dan 88% untuk korpus paralel. Tim peneliti menemukan bahwa struktur dalam kamus bahasa daerah Indonesia sangat beragam, sehingga menuntut perlakuan yang berbeda pada setiap kamus, seperti perihal penomoran halaman. Selain itu, tim peneliti menemukan banyak kamus bahasa daerah Indonesia dengan kualitas yang kurang baik. Kualitas yang kurang baik ditunjukan dengan banyaknya kesalahan baca akibat noise yang terdapat pada tampilan berkas kamus. ......The development of NLP in Indonesia is relatively slow, especially for Indonesian local languages. Indonesian local language data sources are not well-documented so that there are only few NLP resources found. This study discusses the extraction method of Indonesian local language dictionaries to produce a machine-readable NLP resource. Starting from collecting dictionary data, designing and experimentation of the extraction method, and evaluating the extraction results. The extraction results are parallel corpus, bilingual lexicon, and words’ morphological form in CSV format from several Indonesian Local Language bilingual dictionaries that are Baso Minangkabau, Sundanese, Moi, Jambinese, Buginese, Balinese, and Acehnese. The designed method is also applied to some other local language dictionaries. Data annotation has been done to evaluate the extraction results so that we can calculate its accuracy of word classification for parallel corpus and bilingual lexicon. Extraction method design focuses on the Minangkabau dictionary which is then applied to other dictionaries. Data annotation has been done to evaluate the extraction results.The evaluation results show that 99% of the extraction results are correct for word classifying in the bilingual lexicon and 88% correct for parallel corpus. We found that the structure of dictionaries varies, so it requires different approaches for each dictionary, for example regarding page numbering. We also found many dictionaries with poor quality. The poor quality is indicated by the number of reading errors due to noise contained in the original dictionary file.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library