Hasil Pencarian

Ditemukan 171138 dokumen yang sesuai dengan query

Afif Farisi

Perbandingan tingkat akurasi dua model data mining yang dihasilkan oleh decision tree dan naive bayes studi kasus: suatu perusahaan manufactur dan penjualan sepeda

"Data Mining merupakan serangkaian proses untuk menganalisa data sehingga dapat ditemukan sesuatu informasi yang berguna dan dapat digunakan demi mendapatkan keuntungan pada suatu perusahaan. Perkembangan teknologi Data Mining yang sangat pesat dan dengan semakin berkembangnya algoritma-algoritma yang dapat digunakan untuk proses Data Mining itu sendiri, memungkinkan sebuah kasus untuk dapat diproses dengan beberapak kemungkinan algoritma dan hasilnya pun akan berbeda. PT. XYZ sebagai salah satu perusahaan yang bergerak dibidang manufaktur dan penjualan sepeda berusaha untuk terus mengembangkan strateginya dalam melakukan pemasaran dan penjualan produk-produknya sekaligus sebisa mungkin melakukan penekanan terhadap biaya yang dikeluarkan. Direct marketing sebagai salah satu strategi pemasaran yang dilakukan oleh PT. XYZ , dinilai mengeluarkan biaya operasional yang cukup besar, sehingga mereka berfikir untuk melakukan suatu cara agar kegiatan direct marketing yang dilakukan lebih mengenai sasaran dan dapat mengurangi biaya, dimana pada akhirnya mereka menggunakan solusi data mining. Tesis ini melakukan simulasi pembuatan Data Mining model dengan mengambil dataset dari database dan datawarehouse yang ada pada PT. XYZ. Metodologi yang penulis gunakan dalam melakukan pembuatan model Data Mining adalah dengan menggunakan metodologi CRISP-DM. Pada akhirnya tesis ini berhasil melakukan pengujian tingkat akurasi pada dua model Data Mining yang dihasilkan dengan dua algoritma yang berbeda, yaitu dengan algoritma Decision Tree dan algoritma Naive Bayes.

Data mining is a series of process to analyze data with the aim of gaining useful information and can be used to add some values for the organization. With the growth of data mining and the variety of data mining algorithm, it is very possible for one case being analyzed with different algorithm and also with a different result. Finally, a method to test the accuracy of Data Mining model is needed. PT. XYZ, a retail company that sells and manufactures bicycles, constantly researching and developing their marketing and sales strategies, while reducing costs. Direct marketing is one of the strategy used by PT. XYZ. As the strategy takes too much cost, the management is looking for a way to more accurately identify potential customers. Several algorithms in Data Mining could answer their problem. This thesis simulates the generation of data mining models by taking sample dataset from database and datawarehouse of PT. XYZ. The models were generated using the decision tree and the naïve bayes algorithms. The methodology that is used to generate the data mining models is CRISP-DM. Finaly the level of accuracy of the resulting models were evaluated and compared."

Depok: Universitas Indonesia, 2007

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Uji kinerja dan analisis k-support vector nearest neighbor terhadap decision tree dan naive bayes

" Algoritma K-Support Vector Nearest Neighbor (K-SVNN) menjadi salah satu alternatif

metode hasil evolusi K-Nearest Neighbor (K-NN) yang bertujuan untuk mengurangi saat prediksi

tetapi tetap mempertahankan akurasi prediksi. Metode ini masih relatif muda sehingga baru

dibandingkan hanya dengan metode-metode berbasis K-NN lainnya. Dalam penelitian ini

dilakukan analisis perbandingan kesamaan, perbedaan, dan kinerja terhadap metode Decision Tree

(DT) dan Naïve Bayes (NB). Pengujian dengan perbandingan ini penting untuk mengetahui

keunggulan dan kelemahan relatif yang dimiliki oleh K-SVNN. Dengan mengetahui keunggulan

dan kelemahan maka metode tersebut dapat dibuktikan kehandalannya ketika diimplementasikan.

Pengujian dilakukan baik pada saat pelatihan maupun prediksi. Kinerja pelatihan diukur dalam hal

waktu yang digunakan untuk pelatihan, kinerja prediksi diukur dalam hal waktu yang digunakan

untuk prediksi dan akurasi prediksi yang didapat. Hasil pengujian menunjukkan bahwa K-SVNN

mempunyai akurasi yang lebih baik daripada DT dan NB. Sedangkan waktu yang digunakan untuk

pelatihan dan prediksi K-SVNN lebih lama disbanding DT dan NB. "

005 JEI 3:1 (2013)

Artikel Jurnal Universitas Indonesia Library

Azzam Labib Hakim

Peningkatan Akurasi Transliterasi Reversibel Pegon - Latin dengan Pendekatan Rule-Based dan Model Naive Bayes dengan Metode Tokenisasi Bigram = Improving the Accuracy of Reversible Transliteration from Pegon to Latin using a Rule-based Approach and Naive Bayes Model with Bigram Tokenization Method

"Indonesia memiliki kekayaan warisan budaya yang berlimpah, salah satunya adalah aksara Pegon, sebuah modifikasi aksara Arab yang tumbuh dan berkembang pada zaman penyebaran agama Islam di Nusantara. Kekayaan tersebut tentu tak dapat dilepaskan pada keaktifan menulis para ulama sehingga terbentuklah kekayaan manuskrip Pegon yang kaya. Namun dikarenakan masyarakat Indonesia lebih paham aksara Latin, tidak banyak yang bisa membaca aksara Pegon, bahkan yang memahami aksara Arab pun belum tentu dapat mengerti Pegon. Oleh karena itu, dibutuhkan transliterasi antara aksara Pegon dan Latin. Penelitian ini berfokus pada peningkatan akurasi model transliterasi rule-based yang telah dikembangkan sebelumnya pada mata kuliah Proyek Perangkat Lunak (PPL) genap 2022/2023. Lalu, penelitian ini juga berfokus pada pengembangan transliterasi dengan model Naive Bayes berbasis tokenisasi bigram yang mengacu pada pedoman transliterasi Arab-Latin dari Kementerian Agama tahun 1987, Hasil Kongres Aksara Pegon 2022, dan SNI 9047:2023. Hasil uji coba model rule-based yang telah direvisi dengan perbaikan 15 rules dari total 87 rules menghasilkan akurasi 98.8%. Sedangkan model bigram yang telah dikembangkan menghasilkan akurasi 94%. Dua model tersebut terbukti memiliki hasil yang jauh lebih baik dibandingkan dengan model rule-based sebelumnya yang hanya memiliki akurasi 60% saja.

Indonesia is rich in cultural heritage, one of which is the Pegon script, a modification of the Arabic script that grew and developed during the spread of Islam in the archipelago. This wealth is undoubtedly linked to the writing activities of religious scholars, leading to the formation of a wealth of Pegon manuscripts. However, due to the Indonesian public’s better understanding of the Latin script, not many can read the Pegon script, and even those who understand the Arabic script may not necessarily understand Pegon. Therefore, a transliteration between the Pegon and Latin scripts is needed. This study focuses on improving the accuracy of a previously developed rule-based transliteration model in the Software Project (PPL) course in the even semester of 2022/2023. Then, this study also focuses on the development of transliteration with a Naive Bayes model based on bigram tokenization, referring to the Arabic-Latin transliteration guidelines from the Ministry of Religion in 1987, Kongres Aksara Pegon 2022 results, and SNI 9047:2023. The revised rule-based model, with corrections to 15 rules out of a total of 87, achieved an accuracy of 98.8%. Meanwhile, the developed bigram model achieved an accuracy of 94%. These two models have proven to yield much better results than the previous rule-based model, which only had an accuracy of 60%.
"

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Adrian Larry Ananda Sudarthio

Peningkatkan Akurasi Transliterasi Reversibel Pegon - Latin dengan Pendekatan Rule-Based dan Model Naive Bayes dengan Metode Tokenisasi Bigram = Improving the Accuracy of Reversible Transliteration from Pegon to Latin using a Rule-Based Approach and Naive Bayes Model with Bigram Tokenization Method

Indonesia is rich in cultural heritage, one of which is the Pegon script, a modification of the Arabic script that grew and developed during the spread of Islam in the archipelago. This wealth is undoubtedly linked to the writing activities of religious scholars, leading to the formation of a wealth of Pegon manuscripts. However, due to the Indonesian public’s better understanding of the Latin script, not many can read the Pegon script, and even those who understand the Arabic script may not necessarily understand Pegon. Therefore, a transliteration between the Pegon and Latin scripts is needed. This study focuses on improving the accuracy of a previously developed rule-based transliteration model in the Software Project (PPL) course in the even semester of 2022/2023. Then, this study also focuses on the development of transliteration with a Naive Bayes model based on bigram tokenization, referring to the Arabic-Latin transliteration guidelines from the Ministry of Religion in 1987, Kongres Aksara Pegon 2022 results, and SNI 9047:2023. The revised rule-based model, with corrections to 15 rules out of a total of 87, achieved an accuracy of 98.8%. Meanwhile, the developed bigram model achieved an accuracy of 94%. These
two models have proven to yield much better results than the previous rule-based model, which only had an accuracy of 60%.
"

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Annisa Kamalia

Klasifikasi data talasemia menggunakan K-nearest neighbor dan naive bayes = Classification of data thalassemia using K-nearest neighbor and naive bayes

"ABSTRACT

Talasemia adalah penyakit yang disebabkan oleh adanya kelainan dalam hemoglobin. Penyakit talasemia merupakan penyakit herediter atau penyakit keturunan dimana pembawa gen talasemia adalah orang tua dari penderita. Di Indonesia, pada tahun 2015 diketahui jumlah kasus talasemia mencapai 7.029 kasus. Sampai saat ini talasemia belum dapat disembuhkan namun dapat dikenali sifat pembawanya dengan skrining. Dalam tugas akhir ini, akan dibandingkan performa dari dua metode yang digunakan untuk mengklasifikasikan data talasemia, yaitu K-Nearest Neighbor dan Naive Bayes. Data yang digunakan adalah 82 data pasien talasemia dan 68 data pasien non-talasemia dari Rumah Sakit Anak dan Bunda Harapan Kita, Jakarta Barat. Hasil akhir menunjukkan bahwa metode Naive Bayes memberikan nilai akurasi yang lebih besar dari K-Nearest Neighbor dalam mengklasifikasikan talasemia. Rata-rata akurasi Naive Bayes sebesar 99.775% dengan rata-rata waktu running 0.0554 detik dan rata-rata akurasi K-Nearest Neighbor adalah 97.142% dengan rata-rata waktu running 0.081 detik. Untuk nilai spesifikasi, keduanya memberikan performa yang sama, yaitu dari K-Nearest Neighbor diperoleh ketika K=3 yaitu sebesar 100% dan dari Naive Bayes sebesar 100%. Hasil rata-rata sensitivitas tertingi diberikan oleh Naive Bayes yaitu sebesar 99.59%, sedangkan K-Nearest Neighbor sebesar 96.25% untuk K=1.

ABSTRACT

Thalassemia is a disease caused by abnormalities in the hemoglobin. Thalassemia is a hereditary disease which the thalassemia gene carriers are parents of sufferers. In Indonesia, in 2015 it was found that the number of thalassemia cases reached 7,029 cases. Until now thalassemia has not been cured, but it can be recognized the nature of its carrier by screening. In this final project, the performance of the two methods will be compared to classify thalassemia data, namely K-Nearest Neighbor and Naive Bayes. The data used were 82 data on thalassemia patients and 68 data on non-thalassemia patients from Harapan Kita Children and Womans Hospital, West Jakarta. The final results show that the Naive Bayes method provides greater accuracy value than K-Nearest Neighbor in classifying thalassemia. The average accuracy of Naive Bayes is 99.775% with an average running time of 0.0554 seconds and the average accuracy of K-Nearest Neighbor is 97.142% with an average running time of 0.081 seconds. For specification values, both give the same performance. The result of specification values using K-Nearest Neighbor yield when K = 3 that is 100% and from Naive Bayes that is 100%. The highest average sensitivity results are given by Naive Bayes is 99.59%, while K-Nearest Neighbor is 96.25% for K = 1."

2019

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Fahri Alamsyah

Perancangan sistem pengenalan wajah menggunakan Support Vector Machine (SVM), Logistic Regression, Multi-Layer Perceptron (MLP), Gaussian Naive Bayes, K-Nearest Neighbour (KNN), Decision Tree (DT), dan Convolutional Neural Network (CNN) = Development of face recognition system using Support Vector Machine (SVM), Logistic Regression, Multi-Layer Perceptron (MLP), Gaussian Naive Bayes, K-Nearest Neighbour (KNN), Decision Tree (DT), and Convolutional Neural Network (CNN)

"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."

Depok: Fakultas Teknik Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Junanto Prihantoro

Analisis Performa Teknik Klasifikasi Data NILM Menggunakan Metode Naive Bayes dan K-NN = Performance Analisys Of Classification Technique For NILM Data Using Naive Bayes And K-NN Method

Konsumsi energi nasional secara signifikan dikontribusikan oleh tenaga listrik rumah tangga. Untuk mengetahui penggunaan energi listrik di setiap peralatan listrik rumah tangga, teknik yang disebut Non-Intrusive Load Monitoring (NILM) digunakan. NILM adalah alat untuk memantau dan mengidentifikasi kekuatan setiap peralatan listrik. Baru-baru ini beberapa metode klasifikasi data seperti jaringan saraf, pembelajaran mendalam telah diterapkan untuk mengembangkan NILM. Dalam tulisan ini, metode naive bayes digunakan untuk NILM. Metode ini untuk mengklasifikasikan kondisi on-off peralatan listrik. Untuk meningkatkan akurasi, metode preprocessing data yang normalisasi dan diskritisasi digunakan. Perbandingan kinerja dievaluasi untuk setiap metode. Dalam tulisan ini, dataset REDD digunakan. Metode Supervised learning yang digunakan adalah Naive Bayes dan K Nearest Neighbour. Hasil simulasi menunjukkan bahwa dua metode ini dapat mengenali data NILM dengan akurasi yang tinggi. Metode naive bayes dengan diskritisasi memperoleh akurasi tertinggi dengan nilai 96.64% diikuti oleh KNN dengan k =5 dengan nilai 96.1287%.

National energy consumption is significantly contributed by household electricity. To find out the use of electrical energy in every household electrical equipment, a technique called Non-Intrusive Load Monitoring (NILM) used. NILM is a tool to monitor and identify the strength of each electrical equipment. Recently several methods of data classification such as neural networks, deep learning have been applied to develop NILM. In this paper, the naive Bayes method used for NILM. This method is to classify the conditions of on-off electrical equipment. Accuracy to improve, data preprocessing techniques that are normalised and discretised used. Performance comparisons are evaluated for each method. In this paper, the REDD dataset used. The Supervised learning method used is Naive Bayes and K Nearest Neighbor. The simulation results of the two classification methods can recognise NILM data with high accuracy, the naive Bayes method with discretisation obtained the highest accuracy with an amount of 96.64% followed by KNN with 5 with a value of 96.1287%.

2019

T53159

UI - Tesis Membership Universitas Indonesia Library

As`ad, Bahrawi

Prediksi kehadiran menggunakan metode klasifikasi naive bayes, one-r, decision tree / Bahrawi As'ad

"Proses mencari pola atau informasi yang berguna pada suatu kumpulan data dengan menggunakan metode tertentu, saat ini telah menjadi topik yang menarik. Salah satu manfaatnya yaitu dapat menunjang pengambilan keputusan dalam suatu organisasi baik itu organisasi profit maupun non profit. Pada makalah ini akan dilakukan pengujian terhadap sekumpulan data yang diambil dari kejadian nyata untuk diolah, guna mendapatkan informasi atau pola yang dapat berguna untuk penentuan pengambilan sebuah keputusan. Pengujian pada makalah ini merupakan prediksi terhadap pengguna jasa sebuah operator seluler akan kehadirannya pada suatu acara berdasarkanbeberapa indicator, cuaca, jarak relative terhadap lokasi acara, serta apakah pengguna jasa tersebut merupakan termasuk pelanggan pasca bayar atau tidak. Pengujian dilakukan dengan menggunakan tiga metode klasifikasi, yakni naïve bayes, decision tree, dan oneR. Hasil dari percobaan ini bisa menunjukkan prediksi dari setiap percobaan dengan tingkat akurasi prediksi yang berbeda-beda disetiap metode yang digunakan."

Kementerian Komunikasi dan Informatika RI. Badan Penelitian dan Pengembangan Sumber Daya Manusia, 2016

384 JPKOP 20:1 (2016)

Artikel Jurnal Universitas Indonesia Library

Dilla Fadlillah Salma

Analisis akurasi metode support vector machine, random forest, dan logistic regression dalam mengklasifikasi data asuransi mobil dengan implementasi metode seleksi fitur one dimensional naive bayes classifier = Accuracy analysis of support vector machine, random forest, and logistic regression method in classifying car insurance data with one dimensional naive bayes classifier features selection implementation

"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional NaÃ¯ve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.
Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Fikri Afif Musyaffa

Analisis Perbandingan Algoritma Klasifikasi Naive Bayes dan Support Vector Machine Dalam Efektifitas Pendeteksi Email Spam = Comparative Analysis of The Classification Algorithm Naive Bayes and Support Vector Machine in The Effectiveness of Spam Email Detection

"Spam email merupakan salah satu masalah yang sangat sering dialami dalam komunikasi digital. Penelitian ini bertujuan untuk membandingkan efektifitas dua algoritma klasifikasi Naïve Bayes dan Support Vector Machine (SVM) dalam mendeteksi email spam. Tahapan penelitian dimulai dari pengumpulan data, pemrosesan teks seperti penghapusan angka, tanda baca, dan huruf kapital, penghapusan kata-kata umum, stemming, dan transformasi teks menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Dataset dibagi menjadi dua bagian yaitu data latih dan data uji dengan perbandingan 80% data latih dan 20% data uji. Hyperparameter yang digunakan pada metode Naive Bayes adalah nilai alpha, sedangkan pada SVM adalah nilai C, gamma dan kernel Radial Basis Function (RBF). Evaluasi menggunakan parameter metrik akurasi, presisi, recall, dan F1 score. Hasil penelitian menunjukkan metode SVM dengan hyperparameter tuning dan teks preprocessing mendapatkan nilai akurasi 98,74% sedangkan metode naïve bayes hanya 98,35%. Sehingga dapat disimpulkan bahwa metode Support Vector Machine lebih efektif dibandingkan metode Naïve Bayes dalam mendeteksi email spam.
Spam email is one of the most frequently encountered issues in digital communication. This study aims to compare the effectiveness of two classification algorithms, Naïve Bayes and Support Vector Machine (SVM), in detecting spam emails. The research stages begin with data collection, followed by text processing such as removing numbers, punctuation, and capital letters, removing common words, stemming, and text transformation using the Term Frequency-Inverse Document Frequency (TF-IDF) method. The dataset is divided into two parts: training data and testing data, with a ratio of 80% training data and 20% testing data. The hyperparameter used for the Naïve Bayes method is the alpha value, while for SVM, the hyperparameters are the values of C, gamma, and the Radial Basis Function (RBF) kernel. Evaluation is conducted using accuracy, precision, recall, and F1 score metrics. The results show that the SVM method, with hyperparameter tuning and text processing, achieved an accuracy of 98.74%, whereas the Naïve Bayes method only achieved 98.35%. Therefore, it can be concluded that the Support Vector Machine method is more effective than the Naïve Bayes method in detecting spam emails."

Depok: Fakultas Teknik Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian