Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Alif Iqbal Hazairin
"Bahasa daerah adalah bahasa yang digunakan sebagai penghubung pada masyarakat suatu daerah atau suatu kelompok masyarakat tertentu di samping bahasa utama, yaitu bahasa Indonesia. Keragaman bahasa daerah di Indonesia merupakan kekayaan budaya yang harus dipertahankan sepanjang zaman. Sayangnya, penggunaan bahasa daerah yang berkurang serta minimnya perhatian masyarakat pada digitalisasi bahasa daerah membuat bahasa daerah semakin terpinggirkan. Tak terkecuali pada bidang NLP, belum ada perkembangan signifikan dalam puluhan tahun terakhir yang melibatkan bahasa daerah sebagai subjek penelitian. Oleh karena itu, penelitian ini mencoba memberikan salah satu cara untuk meningkatkan kembali pelibatan bahasa daerah dalam penelitian khususnya NLP. Penelitian ini mencoba membangun korpus teks untuk sebanyak mungkin bahasa daerah di Indonesia menggunakan metode web crawling. Sistem melakukan crawling untuk mengumpulkan web berbahasa daerah sebanyak-banyaknya dan kontennya diambil dengan melakukan web scraping. Teks hasil scraping selanjutnya dinormalisasikan dan dilakukan language identification pada tiap kalimatnya. Kalimat dengan bahasa mayor seperti Indonesia dan Inggris dibuang, dan kalimat yang berbahasa daerah dipertahankan. Hasilnya adalah korpus teks untuk ratusan bahasa daerah di Indonesia. Harapannya hasil penelitian ini dapat menjadi batu loncatan penelitian bahasa daerah NLP di Indonesia selanjutnya.
......Regional languages are languages used as a means of communication within a specific region or community, in addition to the main language, which is Indonesian. The diversity of regional languages in Indonesia is a cultural wealth that should be preserved throughout time. Unfortunately, the diminishing use of regional languages and the lack of attention given by society to the digitization of these languages have led to their marginalization. This holds true even in the field of Natural Language Processing (NLP), where there has been little significant development involving regional languages as research subjects in recent decades. Therefore, this study aims to provide a method to re-engage regional languages, particularly in NLP research. The research attempts to build a text corpus for as many regional languages in Indonesia as possible using web crawling methods. The system will crawl the web to collect regional language websites and extract their content through web scraping. The scraped texts will then undergo a normalization process and language identification process for each sentence. Sentences in major languages such as Indonesian and English will be discarded, while sentences in regional languages will be retained. The outcome of this research will be a text corpus for hundreds of regional languages in Indonesia. The hope is that the results of this study can serve as a stepping stone for the next NLP research on regional languages in Indonesia."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Lestari Ningsih
"ABSTRAK
Skripsi ini membahas peran bahasa daerah sebagai sumber kebahasaan dalam pengayaan kosakata bahasa Indonesia di Kamus Besar Bahasa Indonesia Edisi Kelima KBBI V. Pembahasan tersebut ditinjau melalui analisis ranah semantis pada kosakata daerah bahasa Jawa, Minangkabau, Jakarta, Sunda, dan Madura di KBBI V. Analisis ranah semantis dilakukan dengan menggunakan sistem kategori UCREL Semantic Analysis System USAS. Selain itu, skripsi ini juga membahas daya ungkap bahasa Indonesia berdasarkan dominasi ranah semantis yang ditemukan pada kosakata daerah di KBBI V. Penelitian ini merupakan penelitian deskriptif kualitatif dengan sumber data 3.231 kosakata dari bahasa daerah di dalam KBBI V. Hasil penelitian ini, yaitu bahasa Jawa adalah bahasa daerah yang paling banyak memperkaya kosakata bahasa Indonesia dengan kosakata daerah berjumlah 1.247 lema. Sementara itu, daya ungkap bahasa Indonesia yang paling banyak diisi oleh kosakata daerah berada pada ranah semantis TINDAKAN SOSIAL, KEADAAN, DAN PROSES S. Dalam penelitian ini juga ditemukan beberapa kosakata daerah yang berpotensi meningkatkan daya ungkap bahasa Indonesia, dua di antaranya adalah kata uring dan oreng. Namun, berdasarkan seluruh kosakata daerah di dalam KBBI V, terdapat 43 pasang lema yang melewah atau bersifat mubazir.

ABSTRACT
This undergraduate thesis discusses the role of regional languages as the source of linguistic in enriching Indonesian vocabulary in Kamus Besar Bahasa Indonsesia KBBI V. The study is reviewed through the analysis of the semantic domain at regional vocabulary from Javanese, Minangkabau, Jakarta, Sundanese, and Madurese at KBBI V. Semantic domain analysis is done by using UCREL Semantics Analysis System USAS. Besides that, this undergaduate thesis also discusses the vocabulary coverage Indonesian language based on the dominance of the semantic domain on the regional vocabulary in KBBI V. This research is a qualitative descriptive research with data source 3.231 vocabularies from regional language in KBBI V. The results of this research show that the regional language that most enriching the vocabulary of Indonesian language is the Javanese language with a regional vocabulary amount to 1.247 entries. Meanwhile, the vocabulary coverage the Indonesian language is most widely filled by regional vocabulary is in the semantic domain of social action, condition, and process. In this research also found some regional vocabularies that has potential to improve the vocabulary coverage the Indonesian language, two of them are uring and oreng. However, based on the entire regional vocabulary in KBBI V, there are 43 pairs of redundant or pleonastic entries. "
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library