Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query

Selly Anastassia Amellia Kharis

Klasifikasi kanker paru-paru menggunakan support vector machine dengan pemilihan fitur berbasis support vector machine recursive feature elimination dan artificial bee colony = Classification of lung cancer using support vector machine and feature selection based on support vector machine recursive feature elimination and artificial bee colony

"Kanker merupakan kelompok penyakit yang ditandai dengan pertumbuhan dan penyebaran sel-sel abnormal yang tidak terkendali. Jika penyebaran sel tersebut tidak terkendali, hal ini dapat menyebabkan kematian. Berdasarkan American Cancer Society, pendeteksian dini terhadap sel kanker dapat meningkatkan angka harapan hidup seorang pasien lebih dari 97 . Banyak penelitian yang telah meneliti mengenai klasifikasi kanker menggunakan microarray data. Microarray data terdiri dari ribuan fitur gen namun hanya memiliki puluhan atau ratusan sampel. Hal tersebut dapat menurunkan akurasi klasifikasi sehingga perlu dilakukannya pemilihan fitur sebelum proses klasifikasi.

Pada penelitian ini dilakukan dua tahap pemilihan fitur. Pertama, support vector machine recursive feature elimination SVM-RFE digunakan untuk prefilter gen. Kedua, hasil pemilihan fitur SVM-RFE diseleksi kembali dengan menggunakan artificial bee colony ABC yang merupakan algoritma optimisasi berdasarkan perilaku lebah madu. Penelitian ini menggunakan dua dataset, yaitu data kanker paru-paru Michigan dan Ontario dari Kent Ridge Biomedical Dataset.

Hasil percobaan dengan menggunakan SVM-RFE dan ABC menunjukkan nilai akurasi klasifikasi yang lebih tinggi daripada tanpa pemilihan fitur, SVM-RFE, dan ABC, yaitu 98 untuk data kanker paru-paru Michigan dengan menggunakan 100 fitur dan 97 untuk data kanker paru-paru Ontario dengan menggunakan 70 fitur.

Cancer is a group of diseases characterized by the uncontrolled growth and spread of abnormal cells. If the spread is not controlled, it can result in death. Based on American Cancer Society, early detection of cancerous cells can increase survival rates for patients by more than 97 . Many study showed new aspect of cancer classification based microarray data. Microarray data are composed of many thousands of features genes and from tens to hundreds of instances. It can decrease classification accuracy so feature selection is needed before the classification process
In this paper, we propose two stages feature selection. First, support vector machine recursive feature elimination recursive feature elimination SVM RFE is used to prefilter the genes. Second, the SVM RFE features selection result is selected again using Artificial Bee Colony ABC which is an optimization algorithm based on a particular intelligent behavior of honeybee swarms. This research conducted experiments on Ontario and Michigan Lung Cancer Data from Kent Ridge Biomedical Dataset.
Experiment results demonstrate that this approach provides a higher classification accuracy rate than without feature selection, SVM RFE, and ABC, 98 for Michigan lung cancer dataset with using 100 features and 97 for Ontario lung cancer dataset with using 70 features."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

T49733

UI - Tesis Membership Universitas Indonesia Library

Alifah

Klasifikasi retinopati diabetik menggunakan Support Vector Machine (SVM) dengan metode seleksi fitur Recursive Feature Elimination (RFE) dan chi-square = Classification of retinopathy diabetic using Support Vector Machine (SVM) with feature selection method Recursive Feature Elimination (RFE) and chi-square

"Diabetes Melitus (DM) merupakan gangguan sistem metabolik akibat pankreas tidak memproduksi cukup insulin atau tubuh tidak mampu menggunakan insulin yang ada secara efektif. Menderita diabetes dalam jangka waktu panjang dapat mengakibatkan berbagai macam komplikasi salah satu di antaranya adalah Retinopati diabetik. Retinopati diabetik adalah kelainan pada bagian mata yang disebabkan oleh adanya kerusakan dan penyumbatan pada pembuluh darah di bagian belakang mata (retina). Pada penelitian kali ini akan di gunakan data retinopati diabetik dengan menggunakan metode seleksi fitur Recursive Feature Elimination (RFE) dan Chi-Square dan akan di klasifikasi menggunakan Support Vector Machine.

Diabetic retinopathy is one of the complication of diabetes, which is an eye disease that can cause blindness. Its happen because of damage of retina as a result of the long illness of diabetic melitus. People usually do research using image data in diabetic patients. This paper present about diabetic retinopathy will extracting with feature selection. In this study, we use data diabetic patients who will be extracted with a feature selection method. Feature selection used in this study is Recursive Feature Elimination (RFE) and Chi-Square. For classification of diabetic retinopathy has been done by Support Vector Machine (SVM). From the experimental result with various tunning hyperparameters, the classification model can obtain the accuracy between 97%-100% for both methods."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Fiftitah Repfian Aszhari

"Klasifikasi Data Stroke Menggunakan Random Forest dengan Recursive Feature Elimination" = "Classification of Stroke Data Using Random Forest with Recursive Feature Elimination"

Stroke merupakan salah satu penyakit dengan risiko kematian dan kecacatan yang tinggi. Secara umum, stroke diklasifikasikan menjadi dua jenis, yaitu stroke iskemik dan stroke hemoragik. Klasifikasi jenis stroke secara cepat dan tepat diperlukan untuk menentukan jenis pengobatan dan tindakan yang tepat guna mencegah terjadinya dampak yang lebih fatal pada pasien stroke. Pada penelitian ini, klasifikasi stroke dilakukan menggunakan pendekatan machine learning. Adapun data penelitian yang digunakan adalah data stroke yang terdiri atas pemeriksaan laboratorium. Pada data penelitian tersebut, terdapat berbagai komponen pemeriksaan laboratorium yang dicatat serta memungkinkan adanya suatu pemeriksaan yang kurang relevan atau informatif dalam mengklasifikasi stroke. Apabila data tersebut tidak ditangani, akan mempengaruhi kinerja serta waktu komputasi model dalam mengklasifikasi stroke. Oleh karena itu, pada penelitian ini, Random Forest (RF) dengan seleksi fitur Recursive Feature Elimination (RFE) digunakan dalam mengklasifikasi data stroke. Dengan menerapkan metode tersebut, diperoleh kinerja model yang lebih baik saat melakukan klasifikasi menggunakan sejumlah fitur yang diperoleh dari hasil seleksi fitur, dibandingkan menggunakan keseluruhan fitur dalam data stroke. Selain itu, pada penerapan metode tersebut, diperoleh kinerja model yang baik dalam mengklasifikasi data kelas stroke iskemik, akan tetapi tidak cukup baik dalam mengklasifikasi data kelas stroke hemoragik. Hal ini dikarenakan proporsi jumlah data pada kelas stroke iskemik lebih banyak dibandingkan stroke hemoragik. Dalam hal ini dibutuhkan suatu metode penanganan agar kinerja model tetap optimal dalam mengklasifikasi data kelas stroke iskemik dan stroke hemoragik. Pada penelitian ini, Synthetic Minority Oversampling Technique (SMOTE) digunakan untuk menyeimbangkan kedua kelas data stroke guna memperoleh kinerja model yang optimal dalam mengklasifikasi kedua kelas data stroke. Berdasarkan penerapan metode RF dengan RFE serta SMOTE dalam mengklasifikasi data stroke, diperoleh kinerja model yang lebih baik dibandingkan melakukan klasifikasi pada data stroke yang tidak diseimbangkan dengan SMOTE.

Stroke is one of the diseases with the high risk of death and disability. Stroke generally can be classified into two types, namely ischemic stroke and hemorrhagic stroke. A quick and accurate stroke classification is needed to find the right treatment to prevent a dangerous effect on the stroke patients. In this study, the stroke classification was applied using a machine learning approach. The data used in this study is stroke data that consists of laboratory examinations. The data consists of various laboratory examination components, therefore, it might be possible that some of the components are less relevant and has less informative related in classifying stroke. If the data is not well handled, it might affect the performance and computation time of the model in classifying stroke. Therefore, in this study, Random Forest (RF) with Recursive Feature Elimination (RFE) method is used to classify the stroke data. The result showed that by applying the method in classifying several amounts of features obtained from the feature selection results has better performance rather than classifying the method using all features in stroke data. Moreover, based on applying this method, the result showed that the model has better performance in classifying ischemic stoke class data but not good enough in classifying hemorrhagic stroke class data. This result might occur because the proportion of numbers the ischemic stroke more than hemorrhagic stroke class data. Therefore, the handling method is needed to obtain optimal model performance in classifying ischemic stroke and hemorrhagic stroke class data. In this study, Synthetic Minority Oversampling Technique (SMOTE) is applied to balance the two classes of stroke data so optimal performance of the classification model can be obtained. Based on the application of the RF with RFE methods and SMOTE in the classification of stroke data, better model performance is obtained compared to classifying the stroke data that is not balanced with SMOTE.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Ervaran Panjilara Putra

Prediksi perilaku mahasiswa pada mata kuliah daring X menggunakan RFE-random forest = Students behaviours prediction in online course X using RFE-random forest

"E-learning Management Systems (EMAS) merupakan aplikasi pembelajaran jarak jauh Universitas Indonesia yang memiliki berbagai fitur untuk membantu pendidik dalam proses perkuliahan. Dalam pembelajaran jarak jauh, perilaku mahasiswa memiliki peran penting dalam meningkatkan proses pembelajaran yang berpengaruh pada kelulusan mahasiswa. Pada tugas akhir ini Recurrent Neural Network (RNN) dengan 1 input layer, 1 hidden layer, dan 1 output layer digunakan untuk memprediksi perilaku mahasiswa pada mata kuliah daring X di EMAS, dimana perilaku tersebut berupa aktivitas mahasiswa di EMAS seperti menjawab pertanyaan dalam forum diskusi, melihat berkas pembelajaran dan aktivitas lainnya. Sebelum dilakukan implementasi model RNN, ditentukan terlebih dahulu perilaku mahasiswa yang paling berpengaruh terhadap kelulusan mahasiswa menggunakan feature selection, yaitu Recursive Feature Elimination Random Forest (RFE-RF). Hasil RFE-RF terdapat 3 fitur yang terpilih yaitu Course View (CV), File View (FV) dan Discussion Viewed (DV). Implementasi Model RNN menggunakan optimizer function yaitu Stochastic Gradient Descent (SGD) dan performa model ditentukan berdasarkan Mean Square Error (MSE). Implementasi RNN dilakukan dengan 2 skenario berbeda, yaitu skenario data 75 hari pertama dan skenario data 115 hari. RNN model terbaik menggunakan data 75 hari pertama adalah model dengan jumlah nodes pada input layer, hidden layer, dan output layer secara berturut- turut sebanyak 1, 10 dan 1 dengan 500 epoch, learning rate 0,01, dan perbandingan data training dan data testing adalah 60%: 40%. Nilai MSE untuk fitur CV 0,00055, untuk fitur FV 0,00051 dan fitur DV sebesar 0,00019. Model RNN terbaik menggunakan data 115 hari menghasilkan nilai MSE untuk fitur CV 0,00054, fitur FV 0,00041 dan fitur DV 0,00027.

E-learning Management Systems (EMAS) is an online learning application from the University of Indonesia with various features to help educators in the lecture process. In online learning, student behavior is important in improving the learning process that affects final student scores. In this final task, Recurrent Neural Network (RNN) with one input layer, one hidden layer, and one output layer is used to predict student behavior in online course X in EMAS. The behavior is student activity in EMAS, such as answering questions in discussion forums, viewing learning files, and other activities. Before implementing the RNN model, the behavior of students who have the most influence on final student scores is determined in advance using feature selection, namely Recursive Feature Elimination Random Forest (RFE-RF). RFE-RF results there are three features selected, namely Course View (CV), File View (FV), and Discussion Viewed (DV). The implementation of the RNN Model using optimizer function stochastic gradient descent (SGD) and the model's performance is determined based on Mean Square Error (MSE). RNN implementation is divided into two different scenarios, the first 75-days data scenario, and the 115-days data scenario. The best RNN models using the first 75 days of data are models with the number of nodes on the input layer, hidden layer, and output layers respectively as much as 1, 10, and 1 with 500 epoch, learning rate 0,01, and comparison of training data and testing data is 60%: 40%. The MSE value for the CV features is 0,00055, FV feature is 0,00051 and DV feature is 0,00019. The best RNN models using 115 days of data generate MSE values for the CV features, which are 0,00054, FV features are 0,00041, and DV features are 0,00027."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Vinezha Panca

Klasifikasi multikelas kanker otak dengan metode multiple support vector machine recursive feature elimination dan twin support vector machine = Multiclass brain cancer classification using multiple support vector machine recursive feature elimination and twin support vector machine

"ABSTRAK

Kanker merupakan salah satu penyebab kematian terbesar di seluruh dunia. Secara khusus, kanker otak adalah kanker yang terjadi pada sistem saraf pusat. Salah satu hal yang dapat dilakukan untuk penelitian kanker otak menggunakan machine learning adalah melakukan pendeteksian jenis kanker otak dengan memanfaatkan microarray data. Permasalahan tersebut merupakan masalah klasifikasi multikelas. Dengan menggunakan pendekatan one versus one, akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Karena data kanker otak memiliki fitur yang sangat banyak, perlu dilakukan seleksi fitur. Pada penelitian ini, akan diimplementasikan metode Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM-RFE sebagai metode seleksi fitur, dan Twin Support Vector Machine TWSVM sebagai metode klasifikasi. Pada metode MMSVM-RFE dilakukan pelatihan SVM-RFE pada setiap masalah dua kelas, sehingga setiap masalah dua kelas memiliki pengurutan fitur masing-masing. Sebagai metode klasifikasi, TWSVM memiliki tujuan untuk mencari hyperplane masing ndash; masing kelas sedemikian sehingga data kelas satu sedekat mungkin terhadap suatu hyperplane namun sejauh mungkin dengan hyperplane lainnya. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel linear pada TWSVM adalah 95,33 dengan menggunakan 200 fitur. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel RBF pada TWSVM adalah 87 dengan 70 fitur. Sedangkan apabila proses validasi juga dilakukan pada seleksi fitur, rata-rata akurasi tertinggi yang diperoleh adalah 90,67 dengan menggunakan 90 fitur.

ABSTRACT

Cancer is one of main causes of death worldwide. Brain cancer is a type of cancer which occurs at central nervous system. Taking advantage from microarray data, machine learning methods can be applied to help brain cancer prediction according to its types. This problem can be referred as a multiclass classification problem. Using one versus one approach, the multiclass problem with k classes can be transformed into k k 1 2 binary class problems. The huge amount of features makes it necessary to use feature selection. In this research, Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM RFE method is implemented as the feature selection method, and Twin Support Vector Machine TWSVM method is implemented as the classification method. The main concept of MMSVM RFE is to train SVM RFE at each binary problem so that each binary problem will have their own arrangements of feature. As a classification method, TWSVM is trained to find two hyperplanes, each representative of its own class. The data of one class must be as near as possible from its representative hyperplane while also must be as far as possible from the other hyperplane. In the simulation which uses linear kernel on MMSVM RFE and linear kernel on TWSVM, the highest average accuracy is 95,33 , using 200 features. In the simulation which uses linear kernel on MMSVM RFE and RBF kernel on TWSVM, the highest average accuracy is 87 , using 70 features. In the case where the feature selection process is included in doing validation, the highest average accuracy is 90,67 , using 90 features."

2016

S66302

UI - Skripsi Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian