Benchmarking analisis sentimen teks berbahasa Indonesia = Benchmarking sentiment analysis in Indonesian language

Harnindyto Wicaksana, author

Benchmarking analisis sentimen teks berbahasa Indonesia = Benchmarking sentiment analysis in Indonesian language

Harnindyto Wicaksana; Samosir, Samuel Ludwig Ian; Setyawan Pratama; Rahmad Mahendra, supervisor; Mei Silviana Saputri, supervisor; Bayu Anggorojati, examiner; Alfan Farizki Wicaksono, examiner (Fakultas Ilmu Komputer Universitas Indonesia;, 2021)

Abstrak

Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi didapatkan menggunakan metode klasifikasi adjektiva.

Currently, there have been many kinds of research done on sentiment analysis. However, there are no papers on sentiment analysis benchmarks for the Indonesian language. Due to the absence of such research, it became difficult for researchers to get information about classifiers with the best performance. Because of this problem, this research is conducted so it would be easier for researchers to get information and direction on doing Indonesian sentiment analysis. In this paper, we held an experiment comparing sentiment classification using rule-based, machine learning, and deep learning and comparing feature extraction techniques to achieve the best sentiment analysis scenario. Based on our experiments in this research, prediction using deep learning classification gave the best result compared to machine learning and rule-based classification. Using deep learning classification, the BERT model is used to get the best result. The best F1-Score for machine learning classification is obtained using a Logistic Regression classifier alongside a combination of unigram and combined lexicon feature extraction. Meanwhile, the best F1-Score for the rule-based classification is obtained using the Adjective classification method.

File Digital: 1

Shelf

S-Harnindyto Wicaksana.pdf :: Unduh

LOGIN required

Kata Kunci

benchmarking

analisis sentimen

sentiment analysis

bahasa Indonesia

Indonesian-language

feature extraction

ekstraksi fitur

lexicon

leksikon

word embedding

rule-based

machine learning

deep learning

convolutional neural network

long short term memory

bidirectional encoder representations for transformers

Metadata

Jenis Koleksi :	UI - Skripsi Membership
No. Panggil :	S-pdf
Entri utama-Nama orang :	Harnindyto Wicaksana, author


Entri tambahan-Nama orang :	Samosir, Samuel Ludwig Ian, author Setyawan Pratama, author Rahmad Mahendra, supervisor Mei Silviana Saputri, supervisor Bayu Anggorojati, examiner Alfan Farizki Wicaksono, examiner
Entri tambahan-Nama badan :	Universitas Indonesia. Fakultas Ilmu Komputer

Program Studi :	Sistem Informasi
Subjek :	Benchmarking Sentiment analysis Indonesian language
Penerbitan :	Depok: Fakultas Ilmu Komputer Universitas Indonesia;, 2021

Bahasa :	ind;ind;ind
Sumber Pengatalogan :	LibUI ind rda
Tipe Konten :	text
Tipe Media :	unmediated ; computer
Tipe Carrier :	volume ; online resource
Deskripsi Fisik :	xxiv, 131 pages : illustrations ; 28 cm. + appendix
Naskah Ringkas :
Lembaga Pemilik :	Universitas Indonesia
Lokasi :	Perpustakaan UI

Ketersediaan
Ulasan
Sampul

No. Panggil	No. Barkod	Ketersediaan
S-pdf	14-23-16296660	TERSEDIA

Ulasan:

Tidak ada ulasan pada koleksi ini: 20524665

UI - Skripsi Membership :: Kembali

UI - Skripsi Membership :: Kembali

Benchmarking analisis sentimen teks berbahasa Indonesia = Benchmarking sentiment analysis in Indonesian language

Abstrak

File Digital: 1

LOGIN required

Kata Kunci

Metadata