Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 146568 dokumen yang sesuai dengan query
cover
Nafizatus Salmi
"ABSTRACT
Kanker telah dikenal sebagai penyakit yang terdiri dari beberapa jenis berbeda. Kanker adalah penyakit yang mengancam jiwa di dunia saat ini. Ada begitu banyak jenis kanker di dunia, salah satunya adalah kanker usus besar, di mana kanker ini adalah salah satu pembunuh nomor satu di dunia. Banyak pembelajaran mesin telah diterapkan dalam klasifikasi kanker. Penulis membandingkan model Naïve Bayes Classifier dan Support Vector Machine (SVM) dalam klasifikasi kanker usus besar. Naïve Bayes Classifier adalah teknik prediksi berbasis probabilitas sederhana berdasarkan pada penerapan teorema Bayes (atau aturan Bayes) dengan asumsi kemandirian yang kuat. Sedangkan konsep dasar metode SVM adalah membentuk bidang atau hyperplane optimal yang memisahkan data menjadi bidang-bidang yang memisahkan data ke dalam setiap kelas. Kedua metode menghasilkan akurasi tinggi hingga 95,24% untuk Naïve Bayes Classifier dan 94,05% untuk SVM dengan kernel linier.

ABSTRACT
Cancer has been known as a disease that consists of several different types. Cancer is a life-threatening disease in the world today. There are so many types of cancer in the world, one of which is colon cancer, where this cancer is one of the number one killers in the world. Much machine learning has been applied in the classification of cancer. The author compares the Naïve Bayes Classifier and Support Vector Machine (SVM) models in the classification of colon cancer. Naïve Bayes Classifier is a simple probability-based prediction technique based on the application of the Bayes theorem (or Bayes rule) with a strong assumption of independence. While the basic concept of the SVM method is to form an optimal plane or hyperplane that separates data into fields that separate data into each class. Both methods produce high accuracy up to 95.24% for Naïve Bayes Classifier and 94.05% for SVM with linear kernels."
2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Mayang Nurul Aulia
"Performa akademik adalah bagian penting dari suatu sekolah. Saat ini, sebagian besar sekolah di Indonesia masih jarang melakukan klasifikasi performa akademik siswa, sehingga diperlukan metode yang tepat untuk mengklasifikasikan siswa berdasarkan perfroma akademiknya.  Pada peneltian ini digunakan metode Nave Bayes Classifier (NBC) dan metode Support Vector Machine (SVM) untuk mengklasifikasikan performa akademik siswa SMAN 38 Jakarta. Metode NBC menghasilkan tingkat akurasi tertinggi sebesar 96%, recall 100%, precision 92.68% dan %. Sedangkan metode SVM dengan kernel linier menghasilkan tingkat akurasi tertinggi sebesar 98%, recall 100%, precision 96.42% dan f1-score.

Academic performance is an important part of a school. At present, most schools in Indonesia rarely classify students’ academic performance, so we need the right method to classify students based on their academic performance. In this research, the Nave Bayes Classifier (NBC) and Support Vector Machine (SVM) methods are used to classify academic performance of SMAN 38 Jakarta students’. The NBC method produces the highest accuracy 96%, recall 100%, precision 92.68% and f1-score  While the SVM method produces the highest accuracy 98%, recall 100%, precision 96.42% and f1-score  on linear kernels."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anas Bachtiar
"Kematian yang disebabkan oleh kanker diperkirakan akan terus meningkat, terutama untuk kanker prostat. Penyakit ini adalah jenis kanker yang paling umum untuk pria di dunia. Jumlah kematian dapat dikurangi dengan deteksi dini menggunakan machine learning. Salah satunya adalah klasifikasi data kanker prostat. Data kanker yang digunakan memiliki berbagai fitur, tetapi tidak semua fitur adalah fitur penting. Dalam penelitian ini, kami menggunakan Support Vector Machine-Recursive Feature Elimination (SVM-RFE) dan One Dimensional Naïve Bayes Classifier (1-DBC) sebagai metode seleksi fitur. Dalam kedua metode itu akan mendapatkan peringkat untuk setiap fitur. Penggunaan kedua metode ini dalam klasifikasi data kanker prostat menghasilkan tingkat evaluasi yang tinggi. Kedua metode ini dapat menghasilkan tingkat akurasi 100%, precision 100%, dan recall 100% pada metode klasifikasi Random Forest. Dan menghasilkan tingkat akurasi 95%, precision 100%, dan recall 94,11% pada metode klasifikasi SVM. Dalam evaluasi tambahan, SVM-RFE memiliki running time lebih rendah dari 1-DBC.

Death caused by cancer is expected to continue to increase, especially for prostate cancer. This disease is the most common type of cancer for men in the world. The number of deaths can be reduced by early detection using machine learning. One of them is the classification of prostate cancer data. Cancer data used has various features, but not all features are essential features. In this study, we use Support Vector Machine-Recursive Feature Elimination (SVM-RFE) and One Dimensional Naïve Bayes Classifier (1-DBC) as a feature selection method. In both methods, it will get a rating for each feature. The use of these two methods in the classification of prostate cancer data produces a high level of evaluation. Both of these methods can produce 100% accuracy, 100% precision, and 100% recall in the Random Forest classification method. And it produces 95% accuracy, 100% precision, and 94.11% recall in the SVM classification method. In the additional evaluation, SVM-RFE has a running time lower than 1-DBC."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nabilla Ayu Fauziyyah
"ABSTRACT
Dewasa ini, sudah banyak rumah sakit modern yang dilengkapi dengan peralatan monitoring yang lengkap, yang menyebabkan makin banyaknya data medis yang tersimpan. Data medis ini memiliki karakteristik khusus, dan biasanya metode statistika biasa tidak dapat diterapkan begitu saja. Dari sinilah kemudian muncul gagasan mengenai Medical Data Mining (MDM) yang sudah terbukti cocok untuk diterapkan dalam analisis data medis. Naive Bayes Classifier (NBC) merupakan salah satu implementasi dari MDM. Kendati terbukti memiliki hasil yang akurat dan memuaskan dalam proses diagnosis medis, metode-metode dalam MDM belum sepenuhnya diterima dalam praktek medis untuk diterapkan. Alasan utama mengapa metode ini belum dapat diterima adalah karena terdapatnya resistansi dari tenaga medis terhadap metode diagnosis yang baru. Tujuan dari penelitian ini adalah untuk menerapkan dan mengevaluasi performa NBC  pada data rekam medis pasien kanker payudara di salah satu rumah sakit di Jakarta dalam masalah klasifikasi subtipe molekular kanker payudara, serta membandingkan hasil klasifikasi NBC dengan metode MDM lain, yaitu Decision Tree (DT). Hasil analisis menunjukkan bahwa NBC mengungguli DT dengan tingkat akurasi sebesar 92,8%. Selain itu, dapat juga ditunjukkan secara empiris bahwa NBC mampu menangani missing value dengan cukup baik dan tidak membutuhkan data dalam jumlah banyak untuk tetap dapat mengklasifikasikan sebagian besar pasien dengan benar.

ABSTRACT
Nowadays, modern hospitals are well equipped with data monitoring devices, which resulted in an abundant amount of medical data. These medical data possess specific characteristics and usually, statistical methods could not be applied directly. This is what started the notion of Medical Data Mining (MDM), which has proven to be effective in analysing medical data. Naive Bayes Classifier (NBC) is an implementation of MDM. Even though MDM methods produce a sufficiently accurate and satisfying results in diagnosis problems, these methods are still not well accepted in the medical practice. One of the main reasons is because there is a resistance of physicians to a new diagnosis method. The main goal of this study is to apply and evaluate the performance of NBC in classifying breast cancer patients in a private hospital in Indonesia into five classes of molecular subtypes and compare its performance with another popular MDM method, Decision Tree (DT). Results showed that NBC outperformed DT by reaching an accuracy rate of 92.8%. This study could also show empirically that NBC does not need a big dataset to be able to achieve a high accuracy rate and that NBC could handle the problem of missing values just fine."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fikri Afif Musyaffa
"Spam email merupakan salah satu masalah yang sangat sering dialami dalam komunikasi digital. Penelitian ini bertujuan untuk membandingkan efektifitas dua algoritma klasifikasi Naïve Bayes dan Support Vector Machine (SVM) dalam mendeteksi email spam. Tahapan penelitian dimulai dari pengumpulan data, pemrosesan teks seperti penghapusan angka, tanda baca, dan huruf kapital, penghapusan kata-kata umum, stemming, dan transformasi teks menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Dataset dibagi menjadi dua bagian yaitu data latih dan data uji dengan perbandingan 80% data latih dan 20% data uji. Hyperparameter yang digunakan pada metode Naive Bayes adalah nilai alpha, sedangkan pada SVM adalah nilai C, gamma dan kernel Radial Basis Function (RBF). Evaluasi menggunakan parameter metrik akurasi, presisi, recall, dan F1 score. Hasil penelitian menunjukkan metode SVM dengan hyperparameter tuning dan teks preprocessing mendapatkan nilai akurasi 98,74% sedangkan metode naïve bayes hanya 98,35%. Sehingga dapat disimpulkan bahwa metode Support Vector Machine lebih efektif dibandingkan metode Naïve Bayes dalam mendeteksi email spam.

Spam email is one of the most frequently encountered issues in digital communication. This study aims to compare the effectiveness of two classification algorithms, Naïve Bayes and Support Vector Machine (SVM), in detecting spam emails. The research stages begin with data collection, followed by text processing such as removing numbers, punctuation, and capital letters, removing common words, stemming, and text transformation using the Term Frequency-Inverse Document Frequency (TF-IDF) method. The dataset is divided into two parts: training data and testing data, with a ratio of 80% training data and 20% testing data. The hyperparameter used for the Naïve Bayes method is the alpha value, while for SVM, the hyperparameters are the values of C, gamma, and the Radial Basis Function (RBF) kernel. Evaluation is conducted using accuracy, precision, recall, and F1 score metrics. The results show that the SVM method, with hyperparameter tuning and text processing, achieved an accuracy of 98.74%, whereas the Naïve Bayes method only achieved 98.35%. Therefore, it can be concluded that the Support Vector Machine method is more effective than the Naïve Bayes method in detecting spam emails."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Febrisa Dhewi Ramadhany
"ABSTRACT
Thalassemia merupakan salah satu penyakit kelainan sel darah merah yang diturunkan oleh orang tua sejak lahir. Thalassemia mengakibatkan protein yang ada di dalam sel darah merah rusak dan tidak mampu berfungsi dengan baik. Hingga saat ini penyakit thalassemia belum dapat disembuhkan, namun penyakit thalassemia dapat dicegah dengan melakukan deteksi dini atau tes prenatal yang dikenal dengan skrining. Pada penelitian ini deteksi dini dilakukan dengan bantuan komputer. Ada beberapa teknik yang telah digunakan untuk mengklasifikasi skrining data thalassemia, salah satu metode yang mampu mengklasifikasi penyakit thalassemia diantaranya adalah Support Vector Machines (SVM) dan Multi-Layer Perceptron (MLP). Data thalassemia yang digunakan diperoleh dari RSAB Harapan Kita, Indonesia. Data tersebut memiliki yang memiiki 10 fitur. Setelah pengujian dilakukan, klasifikasi dengan menggunakan metode SVM menunjukkan hasil akurasi lebih baik sebesar 97,47190988%  dengan rata-rata running time 0,145899875 detik. Sedangkan MLP memperoleh hasil akurasi terbaik sebesar 63,91% dengan rata-rata running time 0,009033 detik. Kesimpulan yang diperoleh menunjukkan bahwa teknik klasifikasi menggunakan SVM memiliki akurasi yang  lebih baik apabila dibandingkan dengan MLP. 

ABSTRACT
Thalassaemia is a red blood cell disorder that is inherited by parents from birth. Thalassaemia results in damaged proteins in red blood cells and are unable to function properly. Until now, thalassaemia has not been cured, but thalassaemia can be prevented by early detection or prenatal testing known as screening. In this study, early detection is done with the help of a computer. There are several techniques that have been used to classify thalassaemia data screening, one method that is able to classify thalassaemia include Support Vector Machines (SVM) and Multi-Layer Perceptron (MLP). The thalassaemia data used was obtained from Harapan Kita Hospital, Indonesia. The data has 10 features. After the testing is done, the classification using the SVM method shows better accuracy results of 97.447190988% with an average running time of 0.145899875 seconds. While MLP obtained the best accuracy results of 63.91% with an average running time of 0.009033 seconds. The conclusions obtained showed that the classification technique using SVM had better accuracy compared to MLP."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Daffa Jatmiko
"Peranan ibu kota sangatlah vital, saat ini pemerintah kembali memutuskan pemindahan ibu kota karena Jakarta dianggap sudah tidak layak lagi menjadi ibu kota negara Republik Indonesia. Pemindahan ibu kota Indonesia nyatanya mengundang banyaknya opini pro dan kontra di kalangan masyarakat dan respon ini menarik untuk diteliti yaitu bagaimana pandangan masyarakat terhadap kebijakan pemerintah ini yang juga menggambarkan tingkat kepercayaan kepada pemerintah. Oleh karena itu, diperlukan sentiment analysis dengan classifier berbasis machine learning yang akurat dan menentukan algoritma yang terbaik. Data berupa tweets dikumpulkan dengan web scraping dan dilakukan pra-pemrosesan yang menghasilkan label data berupa polaritas dan kategori/aspek yang teridentifikasi. Model Machine Learning dengan algoritma Naive Bayes dan Support Vector Machine kemudian digunakan dalam klasifikasi polaritas kelas biner dengan fitur n-gram (urutan kata) dan optimasi heuristik yaitu Hyperparameter Tuning. Dari kombinasi fitur dan perlakuan optimasi, nilai MCC sebagai metrik evaluasi dibandingkan dan ditemukan bahwa Naive Bayes mengungguli Support Vector Machine dalam mengklasifikasi opini publik di media sosial Twitter khususnya mengenai pemindahan ibu kota.

The role of the capital city is very vital, at this time the government has again decided to move the capital city because Jakarta is considered no longer suitable as the capital city of the Republic of Indonesia. The relocation of Indonesia's capital city in fact invites many pro and contra opinions among the public and this response is interesting to study, namely how the public views this government policy which also describes the level of trust in the government. Therefore, sentiment analysis is needed with a machine learning-based classifier that is accurate and determines the best algorithm. Data in the form of tweets is collected by web scraping and pre-processed which produces data labels in the form of polarity and identified categories/aspects. Machine Learning model with Naive Bayes algorithm and Support Vector Machine is then used in the classification of binary class polarity with n-gram features (word order) and heuristic optimization, namely Hyperparameter Tuning. From the combination of features and optimization treatment, the MCC value as an evaluation metric was compared and it was found that Naive Bayes outperformed the Support Vector Machine in classifying public opinion on Twitter social media, especially regarding the relocation of the capital city."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sigit Suryono
"ABSTRAK
Klasifikasi sentimen merupakan salah satu cabang dari text mining. Klasifikasi sentimen dapat menjadi sesuatu yang penting dalam proses evaluasi terhadap sebuah topik permasalahan. Tujuan utama dari klasifikasi sentimen adalah untuk mencari tahu polaritas dari sentimen positif, negatif dan netral. Klasifikasi sentimen salah satunya dapat diperoleh melalui tweet yang ada pada Twitter. Dalam tulisan ini, tweet yang berhubungan dengan kata kunci yang dicari dihimpun dengan menggunakan tools yaitu API Twitter. Data yang didapat dari proses penghimpunan akan diolah dengan menggunakan Natural Language Toolkit yang berjalan diatas bahasa pemrograman Python. Data selanjutnya akan dilakukan klasifikasi sentimen dengan menggunakan Naive Bayes untuk melihat sentimen yang dihasilkan. Dari proses klasifikasi yang telah dilakukan akan diukur tingkat akurasi. Dari hasil uji coba sebanyak 3 kali, didapatkan tingkat akurasi pada percobaan pertama 64.95%, kedua 66.36% dan ketiga 66.79% Hasil lain yang didapatkan dari proses klasifikasi yaitu sentimen positif 28% sentimen negatif 20% dan sentimen netral 52%. Berdasarkan hasil persentase kelas sentimen, sentimen neutral merupakan sentimen yang paling banyak apabila dikaitkan dengan topik Presiden Joko Widodo dan pemerintahannya."
Yogyakarta: Pusat Penelitian dan Pengabdian Pada Masyarakat (P3M) STTA, 2018
600 JIA X:1 (2018)
Artikel Jurnal  Universitas Indonesia Library
cover
Dilla Fadlillah Salma
"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional Naïve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.

Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahri Alamsyah
"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>