Analisis Sentimen dan Pemodelan Topik Ulasan Aplikasi E-Grocery Menggunakan Algoritma Naive Bayes dan Support Vector Machine: Studi Kasus Data Ulasan Segari di Google Play Store = Sentiment Analysis and Topic Modeling of E-grocery Application Reviews Using Naive Bayes and Support Vector Machine Algorithm: A Case Study of Segari Data Review on Google Play Store

Jefka Dhammananda; Indra Budi, supervisor; Betty Purwandari, examiner; Imairi Eitiveni, examiner (Fakultas Ilmu Komputer Universitas Indonesia, 2023)


Pesatnya perkembangan teknologi informasi dan komunikasi menuntut adanya inovasi dalam pengembangan aplikasi agar dapat mengikuti perkembangan yang cepat tersebut. Segari adalah salah satu penyedia layanan supermarket online yang populer di Indonesia. Segari merupakan perusahaan yang berlandasan customer centric dan mempunyai nilai Be Obsessed with our Customers, sangat mengedepankan kebutuhan dari pelanggannya. Minimnya sumber daya manusia dan banyaknya ulasan pelanggan yang perlu di analisis menghambat proses penggalian informasi dari ulasan pelanggan tersebut, sehingga diperlukan model pembelajaran mesin yang dapat secara otomatis melakukan analisis sentimen untuk mengklasifikasikan ulasan menjadi sentimen positif atau negatif. Informasi yang diambil dari analisis sentimen dapat digunakan sebagai referensi untuk menjaga kualitas layanan berdasarkan sentimen positif, sedangkan hasil dari sentimen negatif dapat digunakan sebagai bahan evaluasi untuk meningkatkan layanan dan aplikasi Segari. Dalam penelitian ini, peneliti membahas implementasi model analisis sentimen menggunakan ulasan pelanggan dari Google Play Store. Metode pembuatan model dimulai dari pengumpulan data, pelabelan data, pra proses data, ekstraksi fitur, model klasifikasi sentimen, evaluasi model, dan pemodelan topik. Peneliti menggunakan dua algoritma klasifikasi, Naive Bayes Classifier (NB) dan Support Vector Machine (SVM), pada total 10.507 ulasan. Data menunjukkan bahwa 74,37% ulasan mengungkapkan sentimen positif, sedangkan 25,63% mengungkapkan sentimen negatif. Hasil penelitian menunjukkan bahwa algoritma SVM dengan oversampling mencapai kinerja model terbaik, dengan recall sebesar 89,98%. Selain itu, peneliti menggunakan Latent Dirichlet Allocation (LDA) untuk mengidentifikasi topik terkait dengan perspektif pelanggan tentang Segari yang selanjutnya disampaikan kepada tim terkait. Hasil analisis mengungkapkan bahwa terdapat pelanggan yang puas dan kecewa dengan proses pengiriman produk. Pelanggan umumnya sudah puas dengan kualitas dan kesegaran dari produk. Beberapa pelanggan merasa kecewa karena pesanan yang kosong atau tidak lengkap dalam paket. Terdapat pelanggan yang puas dan kecewa terhadap aplikasi antarmuka pengguna, kecepatan, maupun kinerja aplikasi. Terdapat pelanggan yang puas dan kecewa terhadap harga, promo, dan voucher yang tersedia. Beberapa pelanggan merasa kecewa terhadap servis yang diberikan oleh customer service. Secara keseluruhan, penelitian ini memperluas pengetahuan tentang metode analisis sentimen dan memberikan wawasan tentang melakukan penelitian terkait analisis sentimen dan ulasan pelanggan.

The rapid development of information and communication technology demands innovation in application development to keep up with such rapid advancement. Segari is one of the popular online supermarket service providers in Indonesia. Segari is a customer-centric company with a core value of being obsessed with its customers, prioritizing their needs. The lack of human resources and the abundance of customer reviews that need to be analyzed hinder the process of extracting information from these reviews. Therefore, a machine learning model is needed to automatically perform sentiment analysis and classify the reviews into positive or negative sentiments. The information extracted from sentiment analysis can be used as a reference to maintain service quality based on positive sentiments, while the results of negative sentiments can be used for evaluation to improve Segari's services and application. In this research, the implementation of a sentiment analysis model using customer reviews from the Google Play Store is discussed. The model development process includes data collection, data labeling, data preprocessing, feature extraction, sentiment classification model, model evaluation, and topic modeling. The researcher utilized two classification algorithms, Naive Bayes Classifier (NB) and Support Vector Machine (SVM), on a total of 10,507 reviews. The data shows that 74.37% of the reviews express positive sentiments, while 25.63% express negative sentiments. The results of the study indicate that the SVM algorithm with oversampling achieved the best model performance, with a recall of 89.98%. Additionally, the researcher used Latent Dirichlet Allocation (LDA) to identify topics related to customer perspectives on Segari, which will be communicated to the relevant team. The analysis revealed that some customers are satisfied while others are disappointed with the product delivery process. Customers generally expressed satisfaction with the quality and freshness of the products. Some customers felt disappointed due to missing or incomplete items in their orders. There were mixed opinions about the user interface, speed, and performance of the application. Customers also expressed satisfaction and dissatisfaction with the available prices, promotions, and vouchers. Some customers felt disappointed with the service provided by the customer service team. Overall, this paper extends knowledge of sentiment analysis methods and provides insights on conducting research related to sentiment analysis and customer reviews.

Penerbitan : Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
