Antonius Rangga Hapsoro Wicaksono
"Kanker merupakan salah satu penyebab kematian utama di dunia, dengan 18,1 juta kasus dan 10 juta kematian pada 2020. Kanker serviks menempati urutan keempat secara global dan kedua di Indonesia. Tingginya angka kematian lebih banyak terjadi di negara berpenghasilan menengah ke bawah karena keterbatasan akses pada pencegahan. Deteksi dini kanker serviks sering sulit dilakukan hingga mencapai stadium lanjut. Salah satu metode deteksi dini adalah menggunakan machine learning. Penelitian ini mengaplikasikan algoritma stacking classifier yang menggabungkan decision tree, support vector machine, dan random forest sebagai first-level learner, serta logistic regression sebagai meta learner, untuk mengklasifikasi pasien kanker serviks. Dataset berasal dari 858 pasien di Hospital Universitario de Caracas, Venezuela. Data dibagi 70% untuk pelatihan dan 30% untuk pengujian, dengan lima percobaan acak. Model menghasilkan akurasi rata-rata 95,03%, precision 99,05%, sensitivity 95,49%, specificity 89,39%, dan G-mean 92,37%. Meskipun stacking ensemble menunjukkan performa yang baik, model tunggal menghasilkan kinerja yang sedikit lebih baik namun tidak signifikan.

Cancer is a leading cause of death worldwide, with 18.1 million cases and 10 million deaths in 2020. In Indonesia, there were 396,914 cases and 235,511 deaths. Cervical cancer is the fourth most common cancer globally and the second most common in Indonesia. Higher death rates occur in low- and middle-income countries due to limited access to preventive measures. Cervical cancer is often difficult to detect until it reaches an advanced stage. This research applies a machine learning approach, using a stacking classifier algorithm that combines decision tree, support vector machine, and random forest models as first-level learners, with logistic regression as the meta learner, to classify patients with and without cervical cancer. The dataset, from the UCI Repository, contains data from 858 patients at risk for cervical cancer at Hospital Universitario de Caracas in Venezuela. The data was split into 70% for training and 30% for testing, with five random trials. The model achieved an average accuracy of 95.03%, precision of 99.05%, sensitivity of 95.49%, specificity of 89.39%, and a G-mean of 92.37%. While the stacking ensemble model performed well, single-classifier models showed slightly better performance, though the difference was not significant."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
Rafiqatul Khairi
"Kanker pankreas adalah penyakit di mana sel-sel tumor ganas (kanker) berkembang di jaringan pankreas, yaitu organ di belakang perut bagian bawah dan di depan tulang belakang, yang membantu tubuh menggunakan dan menyimpan energi dari makanan dengan memproduksi hormon untuk mengontrol kadar gula darah dan enzim pencernaan untuk memecah makanan. Biasanya, kanker pankreas jarang terdeteksi pada tahap awal. Salah satu tanda seseorang mengalami kanker pankreas adalah diabetes, terutama jika itu bertepatan dengan penurunan berat badan yang cepat, penyakit kuning, atau rasa sakit di perut bagian atas yang menyebar ke punggung. Di antara berbagai jenis kanker, kanker pankreas memiliki tingkat kelangsungan hidup terendah, yaitu hanya sekitar 3-6% dari mereka yang didiagnosis yang dapat bertahan hidup selama lima tahun. Jika pasien didiagnosis tepat waktu untuk perawatan, peluang mereka untuk bertahan hidup akan meningkat. Terdapat penanda tumor yang biasa digunakan untuk mengikuti perkembangan kanker pankreas, yaitu CA 19-9 yang dapat diukur dalam darah. Orang sehat dapat memiliki sejumlah kecil CA 19-9 dalam darah mereka. Kadar CA 19-9 yang tinggi seringkali merupakan tanda kanker pankreas. Tetapi kadang-kadang, kadar tinggi dapat menunjukkan jenis kanker lain atau gangguan non-kanker tertentu, seperti sirosis dan batu empedu. Karena kadar CA 19-9 yang tinggi tidak spesifik untuk kanker pankreas, CA 19-9 tidak dapat digunakan dengan sendirinya untuk skrining atau diagnosis. Ini dapat membantu memantau perkembangan kanker dan efektivitas pengobatan kanker. Dalam studi ini, metode Kernel-based Support Vector Machine digunakan untuk mengklasifikasikan hasil tes darah CA19-9 menjadi dua bagian; data pasien yang didiagnosis dengan kanker pankreas atau pasien normal (tidak terdiagnosis kanker pankreas). Metode ini memperoleh akurasi sekitar 95%.

Pancreatic cancer is a disease in which malignant (cancerous) tumor cells develop in pancreatic tissue; organ behind the lower abdomen and in front of the spine, which helps the body use and store energy from food by producing hormones to control blood sugar levels and digestive enzymes to break down food. Usually, pancreatic cancer is rarely detected at an early stage. One sign of a person with pancreatic cancer is diabetes, especially if it coincides with rapid weight loss, jaundice, or pain in the upper abdomen that spreads to the back. Among various types of cancer, pancreatic cancer has the lowest survival rate of only about 3-6% of those diagnosed who can survive for five years. If patients are diagnosed on time for treatment, their chances of survival will increase. There is a tumor marker commonly used to follow the course of pancreatic cancer, namely CA 19-9 which can be measured in the blood. Healthy people can have small amounts of CA 19-9 in their blood. High levels of CA 19-9 are often a sign of pancreatic cancer. But sometimes, high levels can indicate other types of cancer or certain noncancerous disorders, including cirrhosis and gallstones. Because a high level of CA 19-9 is not specific for pancreatic cancer, CA 19-9 cannot be used by itself for screening or diagnosis. It can help monitor the progress of your cancer and the effectiveness of cancer treatment. In this study, the Kernel-based Support Vector Machine method is used to classify CA19-9 blood test results into two sections including data on patients diagnosed with pancreatic cancer or normal patients. This method will get an accuracy of around 95%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
Anas Bachtiar
"Kematian yang disebabkan oleh kanker diperkirakan akan terus meningkat, terutama untuk kanker prostat. Penyakit ini adalah jenis kanker yang paling umum untuk pria di dunia. Jumlah kematian dapat dikurangi dengan deteksi dini menggunakan machine learning. Salah satunya adalah klasifikasi data kanker prostat. Data kanker yang digunakan memiliki berbagai fitur, tetapi tidak semua fitur adalah fitur penting. Dalam penelitian ini, kami menggunakan Support Vector Machine-Recursive Feature Elimination (SVM-RFE) dan One Dimensional Naïve Bayes Classifier (1-DBC) sebagai metode seleksi fitur. Dalam kedua metode itu akan mendapatkan peringkat untuk setiap fitur. Penggunaan kedua metode ini dalam klasifikasi data kanker prostat menghasilkan tingkat evaluasi yang tinggi. Kedua metode ini dapat menghasilkan tingkat akurasi 100%, precision 100%, dan recall 100% pada metode klasifikasi Random Forest. Dan menghasilkan tingkat akurasi 95%, precision 100%, dan recall 94,11% pada metode klasifikasi SVM. Dalam evaluasi tambahan, SVM-RFE memiliki running time lebih rendah dari 1-DBC.

Death caused by cancer is expected to continue to increase, especially for prostate cancer. This disease is the most common type of cancer for men in the world. The number of deaths can be reduced by early detection using machine learning. One of them is the classification of prostate cancer data. Cancer data used has various features, but not all features are essential features. In this study, we use Support Vector Machine-Recursive Feature Elimination (SVM-RFE) and One Dimensional Naïve Bayes Classifier (1-DBC) as a feature selection method. In both methods, it will get a rating for each feature. The use of these two methods in the classification of prostate cancer data produces a high level of evaluation. Both of these methods can produce 100% accuracy, 100% precision, and 100% recall in the Random Forest classification method. And it produces 95% accuracy, 100% precision, and 94.11% recall in the SVM classification method. In the additional evaluation, SVM-RFE has a running time lower than 1-DBC."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
Vinezha Panca
Kanker merupakan salah satu penyebab kematian terbesar di seluruh dunia. Secara khusus, kanker otak adalah kanker yang terjadi pada sistem saraf pusat. Salah satu hal yang dapat dilakukan untuk penelitian kanker otak menggunakan machine learning adalah melakukan pendeteksian jenis kanker otak dengan memanfaatkan microarray data. Permasalahan tersebut merupakan masalah klasifikasi multikelas. Dengan menggunakan pendekatan one versus one, akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Karena data kanker otak memiliki fitur yang sangat banyak, perlu dilakukan seleksi fitur. Pada penelitian ini, akan diimplementasikan metode Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM-RFE sebagai metode seleksi fitur, dan Twin Support Vector Machine TWSVM sebagai metode klasifikasi. Pada metode MMSVM-RFE dilakukan pelatihan SVM-RFE pada setiap masalah dua kelas, sehingga setiap masalah dua kelas memiliki pengurutan fitur masing-masing. Sebagai metode klasifikasi, TWSVM memiliki tujuan untuk mencari hyperplane masing ndash; masing kelas sedemikian sehingga data kelas satu sedekat mungkin terhadap suatu hyperplane namun sejauh mungkin dengan hyperplane lainnya. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel linear pada TWSVM adalah 95,33 dengan menggunakan 200 fitur. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel RBF pada TWSVM adalah 87 dengan 70 fitur. Sedangkan apabila proses validasi juga dilakukan pada seleksi fitur, rata-rata akurasi tertinggi yang diperoleh adalah 90,67 dengan menggunakan 90 fitur.

Cancer is one of main causes of death worldwide. Brain cancer is a type of cancer which occurs at central nervous system. Taking advantage from microarray data, machine learning methods can be applied to help brain cancer prediction according to its types. This problem can be referred as a multiclass classification problem. Using one versus one approach, the multiclass problem with k classes can be transformed into k k 1 2 binary class problems. The huge amount of features makes it necessary to use feature selection. In this research, Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM RFE method is implemented as the feature selection method, and Twin Support Vector Machine TWSVM method is implemented as the classification method. The main concept of MMSVM RFE is to train SVM RFE at each binary problem so that each binary problem will have their own arrangements of feature. As a classification method, TWSVM is trained to find two hyperplanes, each representative of its own class. The data of one class must be as near as possible from its representative hyperplane while also must be as far as possible from the other hyperplane. In the simulation which uses linear kernel on MMSVM RFE and linear kernel on TWSVM, the highest average accuracy is 95,33 , using 200 features. In the simulation which uses linear kernel on MMSVM RFE and RBF kernel on TWSVM, the highest average accuracy is 87 , using 70 features. In the case where the feature selection process is included in doing validation, the highest average accuracy is 90,67 , using 90 features."
Brahmana, Jane Eva Aurelia Sembiring
"Di dunia kesehatan, tenaga medis dituntut untuk mengatasi berbagai jenis penyakit dengan gejala yang beragam. Oleh karena itu, diperlukan suatu teknologi untuk membantu mereka menyelesaikannya dengan baik. Penelitian ini mendukung mereka dengan menggunakan machine learning sebagai pemecah masalah. Penelitian ini membahas kanker payudara yang merupakan salah satu penyakit dengan angka kematian tertinggi di dunia, khususnya bagi wanita. Berdasarkan patologisnya, ada beberapa jenis kanker payudara yang dikelompokkan menjadi dua kategori utama, yaitu invasif dan non-invasif. Penelitian ini menggunakan dataset MRI payudara penderita kanker payudara dari Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Dataset berupa citra MRI akan diimplementasikan pada algoritma yang telah dikonstruksikan. Pada tahap awal, metode Convolutional Neural Network akan digunakan untuk bagian konvolusi. Berikutnya, pada bagian klasifikasi, metode yang akan diterapkan sebagai metode klasifikasi adalah Support Vector Machine. Dengan mengevaluasi hasil kinerja metode pembaharuan yang digunakan (Convolutional Neural Network–Support Vector Machine) dari dataset yang dimiliki, kita akan mengetahui apakah metode Convolutional Neural Network–Support Vector Machine lebih akurat dibandingkan dengan metode Convolutional Neural Network dalam membantu klasifikasi dataset MRI penderita kanker payudara yang dimiliki. 

In the world of health, medical personnel are required to deal with various types of diseases with various symptoms. Therefore, a technology is needed to help them solve it well. This research supports them by using machine learning as a problem solver. This research discusses breast cancer, which is one of the diseases with the highest mortality rate in the world, especially for women. Based on the pathology, there are several types of breast cancer which are grouped into two main categories, namely invasive and non-invasive. This study used the breast MRI dataset of breast cancer patients from Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The dataset in the form of an MRI image will be implemented in the algorithm that has been constructed. In the early stages, the Convolutional Neural Network method will be used for the convolution section. Next, in the classification section, the method that will be applied as a classification method is the Support Vector Machine. By evaluating the performance results of the renewal method used (Convolutional Neural Network–Support Vector Machine) from our dataset, we will find out whether the Convolutional Neural Network–Support Vector Machine method is more accurate than the Convolutional Neural Network method in helping to classify the MRI dataset for breast cancer patients which are owned."
Jakarta: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
Melati Vidi Jannati
"Klasifikasi data kanker menggunakan microarray data menjadi salah satu cara untuk mendapatkan pengobatan yang lebih tepat. Kendala yang terdapat adalah karakteristik dari microarray yang memiliki fitur yang sangat banyak. Seringkali fitur tersebut tidak begitu informatif bagi pengklasifikasian sehingga perlu adanya suatu cara untuk memilih fitur-fitur yang mengandung informasi yang penting. Salah satu cara tersebut adalah dengan pemilihan fitur. Pada penelitian ini, metode pemilihan fitur yang digunakan berdasarkan clustering dengan fungsi kernel. Fitur-fitur yang sudah terpilih kemudian diklasifikasikan menggunakan metode Support Vector Machine.
Evaluasi dari klasifikasi pada penelitian ini melibatkan K-Fold Cross Validation, metode tersebut akan membagi data secara acak, tetapi merata sehingga akurasi yang didapat juga merata. Hasil akurasi tersebut dilakukan dengan berbagai uji terhadap parameter yang berkaitan seperti K partisi, nilai dan fitur-fitur yang digunakan. Pada proses klasifikasi tanpa pemilihan fitur tingkat akurasinya mencapai 89.68 dengan k partisi sebanyak 6 sementara dengan 5 fitur akurasinya menjadi 95.87 pada partisi sebanyak 10.

Classification of cancer using microarray data is one way to get a more precise treatment. The obstacle on classification data is the characteristics of microarray data that is having many features. These features are often not so informative for classification, so it needs a way to select the features that contain important information. One way is by selection feature. In this research, the method of selection features that are used based on clustering with kernel function. Features that are already selected then classified using Support Vector Machine.
Evaluation of classification in this research involves a K Fold Cross Validation, that methods split data randomly but uniformly so that it can reach all of accuracy. The results of accuracy data was done with different test against related parameters such as K partition, the value of and the features that are used. On the classification process without selection features rate of accuracy reached on 89.68 with k partition number 6 while with the 5 features obtained 95.87 on partition number 10.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
Kanker adalah penyakit yang disebabkan akibat pertumbuhan (pembelahan) tidak normal dari sel jaringan tubuh. Kanker dapat menyebar ke jaringan lain yang terdekatnya. Menurut World Health Organization (WHO), tercatat pada tahun 2018 ada sebanyak 9,6 juta jiwa yang meninggal pada tahun 2018. Biasanya untuk dapat mengetahui sesorang terjangkit kanker atau tidak, ahli medis akan melakukan biopsi apabila disarankan oleh dokter. Namun, sekarang terknologi semakin berkembang, para saintis menggunakan metode komputasi dalam pendekatan pengolahan citra untuk meningkatkan penilaian histopatologis. Penelitian – penelitian sebelumnya telah menunjukan bagaimana machine learning dapat membantu pendeteksian kanker salah satunya mengguakan metode data scaling. Penelitian ini membahas algoritma data scaling membantu meningkatkan akurasi dalam proses klasifikasi kanker usus besar menggunakan Support Vector Machine. Hasil dari penelitian ini, algoritma data scaling memiliki nilai akurasi yang lebih tinggi dibandingkan dengan yang tidak menggunakannya.


Cancer is a disease caused by abnormal growth (division) of body tissue cells. Cancer can spread to other tissues closest to it. According to the World Health Organization (WHO), it was noted that in 2018 there were 9.6 million people who dies in 2018. Usually to be able to find out if someone has contracted cancer, a medical expert will do a biopsy if advised by a doctor. However, now that technology is growing, scientists use computational methods in image processing approaches to improve histopathological assessment. Previous studies have shown how machine learning can help detect cancer, one of which uses the method of data scaling. This study discusses the data scaling algorithm help to improve accuracy in the process of classification of colon cancer using Support Vector Machine. The result of this study, the data scaling algorithm has a higher accuracy than those who did not use it.

Nafizatus Salmi
Kanker telah dikenal sebagai penyakit yang terdiri dari beberapa jenis berbeda. Kanker adalah penyakit yang mengancam jiwa di dunia saat ini. Ada begitu banyak jenis kanker di dunia, salah satunya adalah kanker usus besar, di mana kanker ini adalah salah satu pembunuh nomor satu di dunia. Banyak pembelajaran mesin telah diterapkan dalam klasifikasi kanker. Penulis membandingkan model Naïve Bayes Classifier dan Support Vector Machine (SVM) dalam klasifikasi kanker usus besar. Naïve Bayes Classifier adalah teknik prediksi berbasis probabilitas sederhana berdasarkan pada penerapan teorema Bayes (atau aturan Bayes) dengan asumsi kemandirian yang kuat. Sedangkan konsep dasar metode SVM adalah membentuk bidang atau hyperplane optimal yang memisahkan data menjadi bidang-bidang yang memisahkan data ke dalam setiap kelas. Kedua metode menghasilkan akurasi tinggi hingga 95,24% untuk Naïve Bayes Classifier dan 94,05% untuk SVM dengan kernel linier.

Cancer has been known as a disease that consists of several different types. Cancer is a life-threatening disease in the world today. There are so many types of cancer in the world, one of which is colon cancer, where this cancer is one of the number one killers in the world. Much machine learning has been applied in the classification of cancer. The author compares the Naïve Bayes Classifier and Support Vector Machine (SVM) models in the classification of colon cancer. Naïve Bayes Classifier is a simple probability-based prediction technique based on the application of the Bayes theorem (or Bayes rule) with a strong assumption of independence. While the basic concept of the SVM method is to form an optimal plane or hyperplane that separates data into fields that separate data into each class. Both methods produce high accuracy up to 95.24% for Naïve Bayes Classifier and 94.05% for SVM with linear kernels."
Dian Puspita Sari
"Coronavirus yaitu kelompok virus yang menginfeksi sistem pernapasan yang dapat menyebabkan infeksi pernapasan ringan maupun berat. Salah satu virus yang termasuk ke dalam coronavirus adalah SARS-CoV-2. Penyakit yang disebabkan oleh virus SARS-CoV-2 disebut COVID-19. COVID-19 pertama kali terdeteksi pada tahun 2019 di Wuhan, China. Penyebaran COVID-19 sangat cepat dengan tingkat kematian yang tinggi terus terjadi di berbagai negara sehingga penyakit ini berstatus pandemi. Skripsi ini menyelesaikan masalah klasifikasi virus SARS-CoV-2 dengan menggunakan data sekuens protein coronavirus. Seleksi fitur pada data sekuens protein coronavirus menggunakan metode seleksi fitur Random Forest-Recurisive Feature Elimination (RF-RFE). Setelah dilakukan seleksi fitur, dilakukan klasifikasi menggunakan pendekatan machine learning dengan metode Support Vector Machine (SVM) dan Particle Swarm Optimization-Support Vector Machine (PSO-SVM). Hasil terbaik performa rata-rata akurasi, spesifisitas, dan sensitivitas untuk metode SVM berturut-turut adalah 93,43%, 98,06%, dan 88,84% pada data pelatihan sebesar 80%. Untuk metode PSO-SVM, hasil terbaik rata-rata akurasi dan spesifisitas adalah 98,48% dan 98,57% pada data pelatihan sebesar 80%, sedangkan hasil terbaik rata-rata sensitivitas adalah 98,96% pada data pelatihan sebesar 90%. Oleh karena itu, pada penelitian ini dapat disimpulkan bahwa metode PSO-SVM menghasilkan performa yang lebih baik dibandingkan dengan metode SVM.

Coronaviruses are a group of viruses that infect the respiratory system that can cause mild or severe respiratory infections. One of the viruses that belongs to the coronavirus is SARS-CoV-2. The disease caused by the SARS-CoV-2 virus is called COVID-19. COVID-19 was first detected in 2019 in Wuhan, China. The spread of COVID-19 is very fast with a high mortality rate that continues to occur in various countries so that this disease has a pandemic status. This thesis solves the problem of classifying the SARS-CoV-2 virus using coronavirus protein sequence data. Feature selection on coronavirus protein sequence data used the Random Forest-Recursive Feature Elimination (RF-RFE) feature selection method. After feature selection, classification is carried out using a machine learning approach with the Support Vector Machine (SVM) and Particle Swarm Optimization-Support Vector Machine (PSO-SVM) methods. The best results of the average performance of accuracy, specificity, and sensitivity for the SVM method are 93.43%, 98.06%, and 88.84%, respectively, for training data of 80%. For the PSO-SVM method, the best results on average accuracy and specificity are 98.48% and 98.57% on training data of 80%, while the best results on average sensitivity are 98.96% on training data of 90%. Therefore, in this study it can be concluded that the PSO-SVM method produces better performance than the SVM method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
Dilla Fadlillah Salma
"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional Naïve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.

Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
