Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 166853 dokumen yang sesuai dengan query
cover
Afif Farisi
"Data Mining merupakan serangkaian proses untuk menganalisa data sehingga dapat ditemukan sesuatu informasi yang berguna dan dapat digunakan demi mendapatkan keuntungan pada suatu perusahaan. Perkembangan teknologi Data Mining yang sangat pesat dan dengan semakin berkembangnya algoritma-algoritma yang dapat digunakan untuk proses Data Mining itu sendiri, memungkinkan sebuah kasus untuk dapat diproses dengan beberapak kemungkinan algoritma dan hasilnya pun akan berbeda. PT. XYZ sebagai salah satu perusahaan yang bergerak dibidang manufaktur dan penjualan sepeda berusaha untuk terus mengembangkan strateginya dalam melakukan pemasaran dan penjualan produk-produknya sekaligus sebisa mungkin melakukan penekanan terhadap biaya yang dikeluarkan. Direct marketing sebagai salah satu strategi pemasaran yang dilakukan oleh PT. XYZ , dinilai mengeluarkan biaya operasional yang cukup besar, sehingga mereka berfikir untuk melakukan suatu cara agar kegiatan direct marketing yang dilakukan lebih mengenai sasaran dan dapat mengurangi biaya, dimana pada akhirnya mereka menggunakan solusi data mining. Tesis ini melakukan simulasi pembuatan Data Mining model dengan mengambil dataset dari database dan datawarehouse yang ada pada PT. XYZ. Metodologi yang penulis gunakan dalam melakukan pembuatan model Data Mining adalah dengan menggunakan metodologi CRISP-DM. Pada akhirnya tesis ini berhasil melakukan pengujian tingkat akurasi pada dua model Data Mining yang dihasilkan dengan dua algoritma yang berbeda, yaitu dengan algoritma Decision Tree dan algoritma Naive Bayes.

Data mining is a series of process to analyze data with the aim of gaining useful information and can be used to add some values for the organization. With the growth of data mining and the variety of data mining algorithm, it is very possible for one case being analyzed with different algorithm and also with a different result. Finally, a method to test the accuracy of Data Mining model is needed. PT. XYZ, a retail company that sells and manufactures bicycles, constantly researching and developing their marketing and sales strategies, while reducing costs. Direct marketing is one of the strategy used by PT. XYZ. As the strategy takes too much cost, the management is looking for a way to more accurately identify potential customers. Several algorithms in Data Mining could answer their problem. This thesis simulates the generation of data mining models by taking sample dataset from database and datawarehouse of PT. XYZ. The models were generated using the decision tree and the naïve bayes algorithms. The methodology that is used to generate the data mining models is CRISP-DM. Finaly the level of accuracy of the resulting models were evaluated and compared."
Depok: Universitas Indonesia, 2007
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
" Algoritma K-Support Vector Nearest Neighbor (K-SVNN) menjadi salah satu alternatif
metode hasil evolusi K-Nearest Neighbor (K-NN) yang bertujuan untuk mengurangi saat prediksi
tetapi tetap mempertahankan akurasi prediksi. Metode ini masih relatif muda sehingga baru
dibandingkan hanya dengan metode-metode berbasis K-NN lainnya. Dalam penelitian ini
dilakukan analisis perbandingan kesamaan, perbedaan, dan kinerja terhadap metode Decision Tree
(DT) dan Naïve Bayes (NB). Pengujian dengan perbandingan ini penting untuk mengetahui
keunggulan dan kelemahan relatif yang dimiliki oleh K-SVNN. Dengan mengetahui keunggulan
dan kelemahan maka metode tersebut dapat dibuktikan kehandalannya ketika diimplementasikan.
Pengujian dilakukan baik pada saat pelatihan maupun prediksi. Kinerja pelatihan diukur dalam hal
waktu yang digunakan untuk pelatihan, kinerja prediksi diukur dalam hal waktu yang digunakan
untuk prediksi dan akurasi prediksi yang didapat. Hasil pengujian menunjukkan bahwa K-SVNN
mempunyai akurasi yang lebih baik daripada DT dan NB. Sedangkan waktu yang digunakan untuk
pelatihan dan prediksi K-SVNN lebih lama disbanding DT dan NB. "
005 JEI 3:1 (2013)
Artikel Jurnal  Universitas Indonesia Library
cover
Annisa Kamalia
"ABSTRACT
Talasemia adalah penyakit yang disebabkan oleh adanya kelainan dalam hemoglobin. Penyakit talasemia merupakan penyakit herediter atau penyakit keturunan dimana pembawa gen talasemia adalah orang tua dari penderita. Di Indonesia, pada tahun 2015 diketahui jumlah kasus talasemia mencapai 7.029 kasus. Sampai saat ini talasemia belum dapat disembuhkan namun dapat dikenali sifat pembawanya dengan skrining. Dalam tugas akhir ini, akan dibandingkan performa dari dua metode yang digunakan untuk mengklasifikasikan data talasemia, yaitu K-Nearest Neighbor dan Naive Bayes. Data yang digunakan adalah 82 data pasien talasemia dan 68 data pasien non-talasemia dari Rumah Sakit Anak dan Bunda Harapan Kita, Jakarta Barat. Hasil akhir menunjukkan bahwa metode Naive Bayes memberikan nilai akurasi yang lebih besar dari K-Nearest Neighbor dalam mengklasifikasikan talasemia. Rata-rata akurasi Naive Bayes sebesar 99.775% dengan rata-rata waktu running 0.0554 detik dan rata-rata akurasi K-Nearest Neighbor adalah 97.142% dengan rata-rata waktu running 0.081 detik. Untuk nilai spesifikasi, keduanya memberikan performa yang sama, yaitu dari K-Nearest Neighbor diperoleh ketika K=3 yaitu sebesar 100% dan dari Naive Bayes sebesar 100%. Hasil rata-rata sensitivitas tertingi diberikan oleh Naive Bayes yaitu sebesar 99.59%, sedangkan K-Nearest Neighbor sebesar 96.25% untuk K=1.

ABSTRACT
Thalassemia is a disease caused by abnormalities in the hemoglobin. Thalassemia is a hereditary disease which the thalassemia gene carriers are parents of sufferers. In Indonesia, in 2015 it was found that the number of thalassemia cases reached 7,029 cases. Until now thalassemia has not been cured, but it can be recognized the nature of its carrier by screening. In this final project, the performance of the two methods will be compared to classify thalassemia data, namely K-Nearest Neighbor and Naive Bayes. The data used were 82 data on thalassemia patients and 68 data on non-thalassemia patients from Harapan Kita Children and Womans Hospital, West Jakarta. The final results show that the Naive Bayes method provides greater accuracy value than K-Nearest Neighbor in classifying thalassemia. The average accuracy of Naive Bayes is 99.775% with an average running time of 0.0554 seconds and the average accuracy of K-Nearest Neighbor is 97.142% with an average running time of 0.081 seconds. For specification values, both give the same performance. The result of specification values using K-Nearest Neighbor yield when K = 3 that is 100% and from Naive Bayes that is 100%. The highest average sensitivity results are given by Naive Bayes is 99.59%, while K-Nearest Neighbor is 96.25% for K = 1."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahri Alamsyah
"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Junanto Prihantoro
"

Konsumsi energi nasional secara signifikan dikontribusikan oleh tenaga listrik rumah tangga. Untuk mengetahui penggunaan energi listrik di setiap peralatan listrik rumah tangga, teknik yang disebut Non-Intrusive Load Monitoring (NILM) digunakan. NILM adalah alat untuk memantau dan mengidentifikasi kekuatan setiap peralatan listrik. Baru-baru ini beberapa metode klasifikasi data seperti jaringan saraf, pembelajaran mendalam telah diterapkan untuk mengembangkan NILM. Dalam tulisan ini, metode naive bayes digunakan untuk NILM. Metode ini untuk mengklasifikasikan kondisi on-off peralatan listrik. Untuk meningkatkan akurasi, metode preprocessing data yang normalisasi dan diskritisasi digunakan. Perbandingan kinerja dievaluasi untuk setiap metode. Dalam tulisan ini, dataset REDD digunakan. Metode Supervised learning yang digunakan adalah Naive Bayes dan K Nearest Neighbour. Hasil simulasi menunjukkan bahwa dua metode ini dapat mengenali data NILM dengan akurasi yang tinggi. Metode naive bayes dengan diskritisasi memperoleh akurasi tertinggi dengan nilai 96.64% diikuti oleh KNN dengan k =5 dengan nilai 96.1287%.

 


National energy consumption is significantly contributed by household electricity. To find out the use of electrical energy in every household electrical equipment, a technique called Non-Intrusive Load Monitoring (NILM)  used. NILM is a tool to monitor and identify the strength of each electrical equipment. Recently several methods of data classification such as neural networks, deep learning have been applied to develop NILM. In this paper, the naive Bayes method used for NILM. This method is to classify the conditions of on-off electrical equipment. Accuracy to improve, data preprocessing techniques that are normalised and discretised used. Performance comparisons are evaluated for each method. In this paper, the REDD dataset used. The Supervised learning method used is Naive Bayes and K Nearest Neighbor. The simulation results of the two classification methods can recognise NILM data with high accuracy, the naive Bayes method with discretisation obtained the highest accuracy with an amount of 96.64% followed by KNN with 5 with a value of 96.1287%.

 "

2019
T53159
UI - Tesis Membership  Universitas Indonesia Library
cover
As`ad, Bahrawi
"Proses mencari pola atau informasi yang berguna pada suatu kumpulan data dengan menggunakan metode tertentu, saat ini telah menjadi topik yang menarik. Salah satu manfaatnya yaitu dapat menunjang pengambilan keputusan dalam suatu organisasi baik itu organisasi profit maupun non profit. Pada makalah ini akan dilakukan pengujian terhadap sekumpulan data yang diambil dari kejadian nyata untuk diolah, guna mendapatkan informasi atau pola yang dapat berguna untuk penentuan pengambilan sebuah keputusan. Pengujian pada makalah ini merupakan prediksi terhadap pengguna jasa sebuah operator seluler akan kehadirannya pada suatu acara berdasarkanbeberapa indicator, cuaca, jarak relative terhadap lokasi acara, serta apakah pengguna jasa tersebut merupakan termasuk pelanggan pasca bayar atau tidak. Pengujian dilakukan dengan menggunakan tiga metode klasifikasi, yakni naïve bayes, decision tree, dan oneR. Hasil dari percobaan ini bisa menunjukkan prediksi dari setiap percobaan dengan tingkat akurasi prediksi yang berbeda-beda disetiap metode yang digunakan."
Kementerian Komunikasi dan Informatika RI. Badan Penelitian dan Pengembangan Sumber Daya Manusia, 2016
384 JPKOP 20:1 (2016)
Artikel Jurnal  Universitas Indonesia Library
cover
Dilla Fadlillah Salma
"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional Naïve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.

Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fikri Afif Musyaffa
"Spam email merupakan salah satu masalah yang sangat sering dialami dalam komunikasi digital. Penelitian ini bertujuan untuk membandingkan efektifitas dua algoritma klasifikasi Naïve Bayes dan Support Vector Machine (SVM) dalam mendeteksi email spam. Tahapan penelitian dimulai dari pengumpulan data, pemrosesan teks seperti penghapusan angka, tanda baca, dan huruf kapital, penghapusan kata-kata umum, stemming, dan transformasi teks menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Dataset dibagi menjadi dua bagian yaitu data latih dan data uji dengan perbandingan 80% data latih dan 20% data uji. Hyperparameter yang digunakan pada metode Naive Bayes adalah nilai alpha, sedangkan pada SVM adalah nilai C, gamma dan kernel Radial Basis Function (RBF). Evaluasi menggunakan parameter metrik akurasi, presisi, recall, dan F1 score. Hasil penelitian menunjukkan metode SVM dengan hyperparameter tuning dan teks preprocessing mendapatkan nilai akurasi 98,74% sedangkan metode naïve bayes hanya 98,35%. Sehingga dapat disimpulkan bahwa metode Support Vector Machine lebih efektif dibandingkan metode Naïve Bayes dalam mendeteksi email spam.

Spam email is one of the most frequently encountered issues in digital communication. This study aims to compare the effectiveness of two classification algorithms, Naïve Bayes and Support Vector Machine (SVM), in detecting spam emails. The research stages begin with data collection, followed by text processing such as removing numbers, punctuation, and capital letters, removing common words, stemming, and text transformation using the Term Frequency-Inverse Document Frequency (TF-IDF) method. The dataset is divided into two parts: training data and testing data, with a ratio of 80% training data and 20% testing data. The hyperparameter used for the Naïve Bayes method is the alpha value, while for SVM, the hyperparameters are the values of C, gamma, and the Radial Basis Function (RBF) kernel. Evaluation is conducted using accuracy, precision, recall, and F1 score metrics. The results show that the SVM method, with hyperparameter tuning and text processing, achieved an accuracy of 98.74%, whereas the Naïve Bayes method only achieved 98.35%. Therefore, it can be concluded that the Support Vector Machine method is more effective than the Naïve Bayes method in detecting spam emails."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kresna Bima Sudirgo
"Biaya transportasi adalah salah satu komponen untuk mendapatkan keuntungan maksimal, tetapi sekarang tingkat emisi yang dihasilkan dari kegiatan transportasi juga menjadi perhatian di dunia industri. Model optimal komponen biaya dan emisi diperlukan untuk mendapatkan skenario terbaik yang memiliki biaya dan emisi rendah untuk mendukung komitmen industri ramah lingkungan. Untuk mencapai model yang dapat menyerupai kondisi asli di tempat tertentu kita akan menggunakan metode classifier Naïve Bayes. Model ini akan mengklasifikasikan tingkat keramahan lingkungan dan efisiensi biaya berdasarkan pengukuran berat dan volume menggunakan database yang diperoleh dari area tertentu, pada riset ini periset menggunakan beberapa skenario transportasi dari zona industri yang memiliki aktivitas melalui pelabuhan Tanjung Priok. Sebagai hasil dari pengklasifikasi alat yang dapat mengklasifikasikan tingkat hijau, tingkat biaya dan karakteristik barang yang sesuai (apakah itu cenderung memenuhi berat atau volume) berdasarkan metode pengklasifikasi Naïve Bayes.

Transportation costs are one of the components to get the maximum profit, but now the level of emissions resulting from transportation activities also becomes a concern in the industry. Optimum models of cost and emissions components required to get the best scenario that has low costs and emissions to support green industrial commitment. To achieve a model that can resemble the original conditions on the specific place we will use the Naïve Bayes classifier method. This model will classify the environmental friendliness and cost efficiency incurred with weight and volume measurement based on existing databases acquired from specific areas, at this study researcher using multiple transportation scenarios from industrial zones that had activity through the Tanjung Priok port. As a result of a classifier of tools that can classify green levels, cost levels and suitable characteristics of goods (whether it tends to meet weight or volume) based on Naïve Bayes classifier methods."
Jakarta: Fakultas Teknik Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Jefka Dhammananda
"Pesatnya perkembangan teknologi informasi dan komunikasi menuntut adanya inovasi dalam pengembangan aplikasi agar dapat mengikuti perkembangan yang cepat tersebut. Segari adalah salah satu penyedia layanan supermarket online yang populer di Indonesia. Segari merupakan perusahaan yang berlandasan customer centric dan mempunyai nilai Be Obsessed with our Customers, sangat mengedepankan kebutuhan dari pelanggannya. Minimnya sumber daya manusia dan banyaknya ulasan pelanggan yang perlu di analisis menghambat proses penggalian informasi dari ulasan pelanggan tersebut, sehingga diperlukan model pembelajaran mesin yang dapat secara otomatis melakukan analisis sentimen untuk mengklasifikasikan ulasan menjadi sentimen positif atau negatif. Informasi yang diambil dari analisis sentimen dapat digunakan sebagai referensi untuk menjaga kualitas layanan berdasarkan sentimen positif, sedangkan hasil dari sentimen negatif dapat digunakan sebagai bahan evaluasi untuk meningkatkan layanan dan aplikasi Segari. Dalam penelitian ini, peneliti membahas implementasi model analisis sentimen menggunakan ulasan pelanggan dari Google Play Store. Metode pembuatan model dimulai dari pengumpulan data, pelabelan data, pra proses data, ekstraksi fitur, model klasifikasi sentimen, evaluasi model, dan pemodelan topik. Peneliti menggunakan dua algoritma klasifikasi, Naive Bayes Classifier (NB) dan Support Vector Machine (SVM), pada total 10.507 ulasan. Data menunjukkan bahwa 74,37% ulasan mengungkapkan sentimen positif, sedangkan 25,63% mengungkapkan sentimen negatif. Hasil penelitian menunjukkan bahwa algoritma SVM dengan oversampling mencapai kinerja model terbaik, dengan recall sebesar 89,98%. Selain itu, peneliti menggunakan Latent Dirichlet Allocation (LDA) untuk mengidentifikasi topik terkait dengan perspektif pelanggan tentang Segari yang selanjutnya disampaikan kepada tim terkait. Hasil analisis mengungkapkan bahwa terdapat pelanggan yang puas dan kecewa dengan proses pengiriman produk. Pelanggan umumnya sudah puas dengan kualitas dan kesegaran dari produk. Beberapa pelanggan merasa kecewa karena pesanan yang kosong atau tidak lengkap dalam paket. Terdapat pelanggan yang puas dan kecewa terhadap aplikasi antarmuka pengguna, kecepatan, maupun kinerja aplikasi. Terdapat pelanggan yang puas dan kecewa terhadap harga, promo, dan voucher yang tersedia. Beberapa pelanggan merasa kecewa terhadap servis yang diberikan oleh customer service. Secara keseluruhan, penelitian ini memperluas pengetahuan tentang metode analisis sentimen dan memberikan wawasan tentang melakukan penelitian terkait analisis sentimen dan ulasan pelanggan.

The rapid development of information and communication technology demands innovation in application development to keep up with such rapid advancement. Segari is one of the popular online supermarket service providers in Indonesia. Segari is a customer-centric company with a core value of being obsessed with its customers, prioritizing their needs. The lack of human resources and the abundance of customer reviews that need to be analyzed hinder the process of extracting information from these reviews. Therefore, a machine learning model is needed to automatically perform sentiment analysis and classify the reviews into positive or negative sentiments. The information extracted from sentiment analysis can be used as a reference to maintain service quality based on positive sentiments, while the results of negative sentiments can be used for evaluation to improve Segari's services and application. In this research, the implementation of a sentiment analysis model using customer reviews from the Google Play Store is discussed. The model development process includes data collection, data labeling, data preprocessing, feature extraction, sentiment classification model, model evaluation, and topic modeling. The researcher utilized two classification algorithms, Naive Bayes Classifier (NB) and Support Vector Machine (SVM), on a total of 10,507 reviews. The data shows that 74.37% of the reviews express positive sentiments, while 25.63% express negative sentiments. The results of the study indicate that the SVM algorithm with oversampling achieved the best model performance, with a recall of 89.98%. Additionally, the researcher used Latent Dirichlet Allocation (LDA) to identify topics related to customer perspectives on Segari, which will be communicated to the relevant team. The analysis revealed that some customers are satisfied while others are disappointed with the product delivery process. Customers generally expressed satisfaction with the quality and freshness of the products. Some customers felt disappointed due to missing or incomplete items in their orders. There were mixed opinions about the user interface, speed, and performance of the application. Customers also expressed satisfaction and dissatisfaction with the available prices, promotions, and vouchers. Some customers felt disappointed with the service provided by the customer service team. Overall, this paper extends knowledge of sentiment analysis methods and provides insights on conducting research related to sentiment analysis and customer reviews.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>