Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Universitas Indonesia, 1997
S27305
UI - Skripsi Membership  Universitas Indonesia Library
cover
Bernadia Puspasari
Abstrak :
Mesin Penerjemah digunakan untuk menerjemahkan teks dari suatu bahasa ke bahasa lain secara otomatis. Mesin Penerjemah Statistik adalah Mesin Penerjemah yang menggunakan pendekatan statistik dalam proses menerjemahkan teks. Penelitian dilakukan dengan menggunakan Mesin Penerjemah Statistik berdasarkan frase yang memanfaatkan korpus dwibahasa paralel sebagai data pelatihannya. Korpus dwibahasa Indonesia - Jepang yang digunakan berupa koleksi dokumen Kitab Suci, artikel berita, dan percakapan sehari-hari dengan jumlah keseluruhan kalimat sebanyak 24.365 kalimat. Koleksi dokumen dalam bahasa Jepang tersedia dalam dua macam bentuk tulisan, yaitu Kanji atau Romaji. Penelitian dilakukan pada korpus dwibahasa tanpa faktor tambahan dan korpus yang menggunakan perangkat bahasa tambahan, yaitu lema. Dari hasil penelitian, didapati bahwa kinerja penerjemahan teks Indonesia - Jepang menggunakan Mesin Penerjemah Statistik berdasarkan frase pada penelitian ini, nilai akurasi tertinggi berdasarkan BLEU score mencapai 0,2027. Nilai akurasi tertinggi tersebut didapatkan pada jenis dokumen artikel berita tanpa faktor tambahan dengan model bahasa 5-gram. Sedangkan penambahan perangkat bahasa lema pada korpus pelatihan menurunkan kinerja dari Mesin Penerjemah Statistik berdasarkan frase.
Machine Translation translates text from one language to another automatically. Statistical Machine Translation uses statistical approach to translate text. This research uses phrase-based Statistical Machine Translation system. We use Indonesian ? Japanese bilingual corpora as the training data which consist of holy writings, news article, and daily conversation with total of 24.365 sentences. Japanese document collections are written in Kanji and Romaji. This research uses unfactored training corpora and factored training corpora (lemma). The highest accuracy based on evaluation of the translation result is 0.2027 in BLEU score which is the score of news article document written in Romaji using 5-gram language model. Factored training corpora (lemma) decreases the performance of the machine translation system.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Valentino Vito
Abstrak :

Lema Lima Pendek adalah sebuah pernyataan mengenai kategori Abelian. Untuk mendefinisikan kategori Abelian, perlu dibahas mengenai kategori. Teori kategori adalah sebuah teori yang memberikan konteks untuk menyatukan berbagai macam struktur matematis. Suatu kategori terdiri atas sebuah koleksi berisi objek beserta himpunan-himpunan berisi morfisma sedemikian sehingga beberapa aksioma terpenuhi. Sebuah kategori dapat digambarkan sebagai sebuah diagram berpanah dengan setiap panah dipandang sebagai sebuah morfisma. Pada teori kategori, beberapa konsep seperti produk dan kernel dapat didefinisikan. Kategori Abelian merupakan sebuah kategori yang diberikan strukturstruktur Abelian serta memenuhi beberapa aksioma tambahan. Pada kategori Abelian, dapat didefinisikan konsep barisan eksak pendek. Lema Lima Pendek merupakan sebuah hasil sederhana mengenai barisan eksak pendek. Pada tugas akhir ini, diberikan bukti alternatif Lema Lima Pendek.


The Short Five Lemma is a statement about Abelian categories. To define Abelian categories, the notion of categories needs to be discussed. Category theory is a theory which gives a context for combining various mathematical structures. A category consists of a collection of objects and sets of morphisms such that a set of axioms are satisfied. A category can be drawn as a diagram consisting of arrows where an arrow is considered as a morphism. In category theory, concepts such as products and kernels are introduced. An Abelian category is a category equipped with Abelian structures which satisfies some additional axioms. In Abelian categories, the notion of a short exact sequence is defined. The Short Five Lemma is a simple result regarding short exact sequences. In this thesis, an alternative proof of the Short Five Lemma is presented.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Metti Zakaria Wanagiri
Abstrak :
Mesin Penerjemah (MP) adalah sebuah sub-bagian dari computational linguistics yang menggunakan komputer untuk menerjemahkan teks dari sebuah bahasa ke bahasa yang lain. Sementara Mesin Penerjemah Statistik (MPS) adalah sebuah pendekatan MP dimana hasil terjemahan dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus teks dwibahasa (yang paralel). Pada tugas akhir ini, penerjemahan teks Indonesia-Inggris dilakukan dengan menggunakan MPS berdasarkan frase dimana penerjemahan dilakukan dengan menggunakan prinsip penerjemahan berdasarkan frase. Korpus dwibahasa Indonesia-Inggris yang digunakan terdiri dari kategori berita, kitab suci, novel dan percakapan. Jumlah korpus pelatihan yang digunakan adalah 40779 kalimat, yaitu 704 berita, 4025 percakapan, 16050 novel dan 20000 kitab suci. Sementara korpus pengujian yang digunakan adalah 20300 kalimat, yaitu 300 berita, 2000 percakapan, 8000 novel dan 10000 kitab suci. Percobaan penerjemahan ini dilakukan, dievaluasi dan dianalisis dari dua aspek yaitu penggunaan perangkat bahasa tambahan (yang meliputi Part-of-Speech Tagging dan lema) dan n-gram yang digunakan dalam membentuk model bahasa. Hasil percobaan yang didapat adalah nilai akurasi tertinggi dicapai oleh penerjemahan korpus dwibahasa biasa (tidak menggunakan Part-of-Speech Tagging maupun lema) pada kategori novel dengan menggunakan model bahasa 5-gram, yaitu 0,2696.
Machine Translation (MT) is a sub-field of computational linguistics that uses a computer to translate text or speech from one natural language to another. Meanwhile Statistical Machine Translation (SMT) is a paradigm of MT where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora (parallel). The Indonesian-English text translation is done using a phrase-based SMT in which the translation is carried out using phrase-based Translation. We use Indonesian and English bilingual corpora which consists of news, holy writings, fiction and daily conversation categories. We use training corpus of 40779 sentences which are 704 for news, 4025 for conversation, 16050 for fiction and 20000 for holy writings. Meanwhile the testing corpus consists of 20300 sentences which are 300 for news, 2000 for conversation, 8000 for fiction and 10000 for holy writings. Experiments have been done, evaluated and analyzed regarding two aspects, namely the use of factored-models (Part-of-Speech Tagging and lemma) and number of n-gram for generating the language model. In this thesis, we found that the translations of default bilingual corpora (without Part-of-Speech Tagging and lemma) for fiction category using 5-gram language model yield the highest accuracy of 0.2696.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Lauder, Allan Frank
Abstrak :
This paper looks at the nature of data for lexicography and in particular on the central role that electronic corpora can play in providing it. Data has traditionally come from existing dictionaries, citations, and from the lexicographer?s own knowledge of words, through introspection. Each of these is examined and evaluated. Then the electronic corpus is considered. Different kinds of corpora are described and key design criteria are explained, in particular the size of corpus needed for lexicography as well as the issue of representativeness and sampling. The advantages and disadvantages of corpora are weighed and compared against the other types of data. While each of these has benefits, it is argued that corpora are a requirement, not an option, as data for dictionary making.
Depok: Faculty of Humanities University of Indonesia, 2010
pdf
Artikel Jurnal  Universitas Indonesia Library