Hasil Pencarian

Ditemukan 135471 dokumen yang sesuai dengan query

Theresia Veronika Rampisela

Klasifikasi data skizofrenia dengan support vector machines dan twin support vector machines = Classification of schizophrenia data using support vector machines and twin support vector machines

"Skizofrenia adalah gangguan jiwa yang serius dan kronis. Penyakit ini ditandai dengan gangguan dalam pemikiran, persepsi, dan tingkah laku. Karena gangguan-gangguan ini dapat memicu penderita Skizofrenia untuk bunuh diri atau mencoba bunuh diri, penderita Skizofrenia mempunyai usia harapan hidup yang lebih rendah dari populasi umum. Skizofrenia juga sulit untuk didiagnosis karena belum ada tes secara fisik untuk mendiagnosisnya dan gejala-gejalanya sangat mirip dengan beberapa gangguan jiwa lainnya. Dengan menggunakan Northwestern University Schizophrenia Data, penelitian ini bertujuan untuk mengklasifikasikan orang yang menderita Skizofrenia dan orang yang tidak menderita Skizofrenia. Data tersebut terdiri dari 392 observasi dan 65 variabel yang merupakan data demografis dan data kuesioner Scale for the Assessment of Positive Symptoms dan Scale for the Assessment of Negative Symptoms yang diisi oleh klinisi. Metode klasifikasi yang digunakan adalah machine learning dengan metode Support Vector Machines SVM dan Twin Support Vector Machines Twin SVM menggunakan MATLAB R2017a. Simulasi dilakukan dengan data dan persentase data training dan testing yang berbeda-beda. Pada setiap simulai, akurasi serta running time diukur. Validasi dan evaluasi performa dari model yang telah dioptimasi dilakukan dengan mengambil rata-rata dari sepuluh kali Hold-Out Validation yang dilakukan. Pada umumnya, metode Twin SVM berhasil mengklasifikasikan data Skizofrenia dengan lebih akurat dibandingkan dengan metode SVM. Metode Twin SVM dengan kernel Gaussian menghasilkan hasil akhir akurasi klasifikasi data Skizofrenia yang terbaik, yaitu 91,0 . Berdasarkan hasil akhir running time, metode SVM dengan kernel Gaussian untuk klasifikasi data Skizofrenia mempunyai running time yang paling cepat, 0,664 detik. Selain itu, metode SVM dengan kernel linear, metode SVM dengan kernel Gaussian, dan metode Twin SVM untuk klasifikasi data Skizofrenia berhasil mencapai akurasi hingga 95,0 dalam setidaknya satu simulasi.

Schizophrenia is a severe and chronic mental disorder. This disorder is marked with disturbances in thoughts, perceptions, and behaviours. Due to these disturbances that can trigger Schizophrenics to commit suicide or attempt to do so, Schizophrenics have a lower life expectancy than the general population. Schizophrenia is also difficult to diagnose as there is no physical test to diagnose it yet and its symptoms are very similar to several other mental disorders. Using Northwestern University Schizophrenia Data, this research aims to distinguish people who are Schizophrenics and people who are not. The data consists of 392 observations and 65 variables that are demographic data as well as clinician filled Scale for the Assessment of Positive Symptoms and Scale for the Assessment of Negative Symptoms questionnaires. Classification methods that are used are machine learning with Support Vector Machines SVM and Twin Support Vector Machine Twin SVM using MATLAB R2017a. Simulations are done with different data and percentage of training and testing data. In each simulation, accuracy and running time are measured. Performance validation and evaluation of the optimized models are done by taking the average of ten times Hold Out Validations that were done. In general, Twin SVM successfully classified Schizophrenia data more accurately than the SVM method. Twin SVM with Gaussian kernel produced the best final accuracy in classifying Schizophrenia data, 91.0 . Based on the final running time, SVM with Gaussian kernel has the fastest running time in classifying Schizophrenia data, 0.664 seconds. Furthermore, SVM with linear kernel, SVM with Gaussian kernel, and Twin SVM managed to reach an accuracy of 95.0 in at least one simulation in classifying Schizophrenia data."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Fildzah Zhafarina

Klasifikasi data kanker hati menggunakan metode Twin Support Vector Machines = Liver cancer classification using Twin Support Vector Machines methods

Kanker hati merupakan penyebab utama kematian akibat kanker di seluruh dunia. Di Indonesia, kanker hati menempati angka kejadian tertinggi kedua untuk laki laki yaitu sebesar 12,4 per 100.000 penduduk dengan rata-rata kematian 7,6 per 100.000 penduduk. Pada tugas akhir ini, dibahas mengenai kanker hati primer dengan jenis hepatocellular carcinoma. Metode Twin Support Vector Machines (Twin SVM) diimplementasikan untuk mengklasifikasikan data kanker hati berdasarkan hasil CT scan. Data yang digunakan adalah data numerik hasil CT scan pasien yang menderita kanker hati dan diperoleh dari Laboratorium Radiologi RSUPN Cipto Mangunkusumo. Metode Twin SVM adalah pengembangan dari metode SVM yang menggunakan dua hyperplane dalam mengklasifikasikan sampel. Pada tugas akhir ini, kernel yang digunakan pada metode Twin SVM adalah polinomial dan radial basis function (RBF). Berdasarkan hasil perbandingan, klasifikasi data kanker hati menggunakan metode Twin SVM dengan kernel Polinomial menghasilkan akurasi tertinggi sebesar 77,30% pada penggunaan data testing sebesar 10% dan data training 90%. Selain itu, nilai akurasi terendah terdapat pada kernel RBF menghasilkan sebesar 60,10% pada penggunaan data testing sebesar 90% dan data training 10% dan nilai parameter ð¶ = 1. Jika dibandingkan, klasifikasi data kanker hati dengan menggunakan metode Twin SVM dengan kernel polinomial menghasilkan nilai akurasi yang lebih baik.

Liver cancer is the main cause of cancer death in the worldwide. In Indonesia, the incidence rate of liver cancer is the second highest for men, that is 12.4 per 100,000 population with the average death rate is 7.6 per 100,000 population. This final project discusses primary liver cancer with a type of hepatocellular carcinoma. The Twin Support Vector Machines (Twin SVM) method was implemented to classify liver cancer data based on CT scan results. The data used are numerical data from CT scan results of patients suffering from liver cancer and obtained from the Radiology Laboratory of Cipto Mangunkusumo Hospital. The Twin SVM method is the development of the SVM method that uses two hyperplane in classifying samples. In this final project, the kernel used in the Twin SVM method is polynomial and radial basis function (RBF). Based on the comparison results, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces the highest accuracy of 77.30% on the use of testing data of 10% and training data of 90%. In addition, the lowest accuracy value is found in the RBF kernel resulting in 60.10% on the use of testing data of 90% and training data of 10% and the parameter value of C=1. When compared, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces better accuracy values.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nurul Maghfirah

Klasifikasi data kanker menggunakan support vector machines dengan pemilihan fitur menggunakan correlated based support vector machines-recursive feature elimination = Cancer classification using support vector machines with feature selection using correlated based support vector machines recursive feature elimination

"Kematian yang disebabkan oleh kanker diperkirakan akan terus meningkat, padahal jumlah kematian ini dapat dikurangi dengan adanya deteksi dini. Salah satunya adalah dengan klasifikasi data kanker. Data kanker yang digunakan merupakan data kanker berdimensi tinggi dengan ribuan fitur, tetapi tidak semua fitur yang ada merupakan fitur yang relevan. Oleh karena itu, perlu adanya proses seleksi fitur. Untuk meningkatkan tingkat akurasi yang dihasilkan, digunakan sebuah metode seleksi fitur yang meninjau adanya korelasi antar gen, yaitu CSVM-RFE. Pada metode tersebut, data yang ada diproyeksikan dan diubah menjadi sebuah data baru dengan ekstraksi fitur, dan kemudian dilakukan proses seleksi fitur. Penggunaan dua metode tersebut pada klasifikasi tiga data kanker yang ada terbukti menghasilkan tingkat akurasi yang tinggi, pada data kanker kolon tingkat akurasi yang didapatkan adalah sebesar 96.6, pada kanker prostat sebesar 98.9, dan pada kanker lymphoma sebesar 98,6.

The number of death caused by cancer expected to rise over two decades, whereas the number of death can be reduced by early detection. One of them is cancer classification. Cancer dataset is a high dimensional dataset that consist of thousands of features, but not all of these features are relevant. Therefore, it is necessary to remove the redundant features using feature selection. Feature selection can also improve the accuracy of classification. Many feature selection methods do not consider the correlated genes, so we need a new feature selection method that consider the correlated genes. It is CSVM RFE, in this method the existing data is projected and converted into a new data with feature extraction. These two methods are applied to the cancer datasets, and produce the accuracy of 96.6 using colon cancer dataset, 98.9 using prostate cancer dataset, and 98.6 using lymphoma cancer dataset."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017

S69588

UI - Skripsi Membership Universitas Indonesia Library

Putu Wira Angriyasa

Klasifikasi tekanan dalam rongga kepala menggunakan support vector machines sequential = Intracranial pressure classification using support vector machines sequential

"ABSTRAK

Metode standar dalam mendapatkan informasi mengenai kondisi tekanan dalam rongga kepala atau tekanan intrakranial (TIK) seseorang adalah dengan melakukan pengukuran secara langsung menggunakan alat ICP monitoring. Untuk menggunakan alat tersebut, perlu dilakukan pembedahan pada kepala pasien. Selain membutuhkan biaya yang relatif mahal, dalam beberapa kasus, pembedahan pada kepala memiliki tingkat risiko yang tinggi. Untuk mengatasi hal tersebut, dalam skripsi ini dijelaskan metode alternatif untuk mendapatkan kondisi TIK secara tidak langsung dengan memanfaatkan konsentrasi Superoksida Dismutase (SOD), Katalase, Nikotinamida Adenin Dinukleotida Fosfat (NADPH), dan Malondialdehid (MDA) sebagai penanda stress oksidatif. Dengan menggunakan data-data tersebut, TIK akan diklasifikasikan dalam kondisi normal, rendah, atau tinggi. Untuk tujuan klasifikasi, digunakan metode Support Vector Machines Sequential dan keakuratannya dibandingkan dengan metode Fuzzy C Means.

ABSTRACT

The standard method for getting information about Intracranial Pressure (ICP) is invasive measurement using ICP monitoring. For using that tool, perforation of cranial scalp of patient was needed. In addition to the expensive cost, in some case, this perforation has high risk. For handling this problem, the alternative method for getting ICP condition was explained in this skripsi, using the level of Superoxide Dismutase (SOD), Catalase (CAT), Nicotinamide Adenine Dinucleotide Phosphate (NADPH), and Malondialdehyde (MDA) such as oxidative stress indicators. Using these indicators, ICP would be classified in normal, low, and high condition. For classification purpose, Support Vector Machines Sequential was used as a classification method and the accuracy was compared with Fuzzy C-Means method."

Universitas Indonesia, 2011

S1955

UI - Skripsi Open Universitas Indonesia Library

Ni Putu Ayu Audia Ariantari

Perbandingan aplikasi dari klasifikasi support vector machines dan fuzzy support vector machines dalam memprediksi future claim pada asuransi kendaraan bermotor = Comparison between support vector machines and fuzzy support vector machines as classifiers for predicting future claim in automobile insurance

"Kestabilan perekonomian suatu negara ditentukan oleh sektor-sektor ekonomi di dalamnya. Salah satu sektor yang sedang berkontribusi secara signifikan di Indonesia adalah asuransi. Industri Asuransi sedang mengalami perluasan pada beberapa tahun terakhir. Seiring dengan perluasan tersebut, terdapat kompetisi antar perusahaan asuransi di Indonesia. Kompetisi ini menuntut perusahaan asuransi untuk lebih cerdik dalam mengungguli pasar. Tetapi, perlu diperhatikan bahwa perusahaan asuransi harus selalu sadar akan tingkat risiko yang harus ditanggungnya. Sehingga perlunya dilakukan penelitian tentang kemungkinan klaim di masa depan dari perusahaan asuransi.

Dalam penelitian ini, akan difokuskan pada sektor asuransi kendaraan bermotor di Indonesia. Model yang diajukan pada penelitian ini adalah suatu machine learning yang biasa digunakan untuk masalah klasifikasi dan prediksi. Metode klasifikasi yang digunakan adalah Support Vector Machines dan Fuzzy Support Vector Machines. Penelitian ini menggunakan data historis polis dari suatu perusahaan asuransi umum di Indonesia. Data historis polis ini terdiri dari 7.373 data dengan periode waktu berlaku polis adalah setahun terhitung dari Januari 2015 sampai dengan Desember 2016. Setelah itu, dibandingkan hasil dari kedua metode tersebut untuk mendapatkan hasil yang terbaik. Penggunaan data historis polis dari suatu asuransi umum di Indonesia ini menunjukkan bahwa Support Vector Machines menghasilkan tingkat akurasi rata rata 100 dalam klasifikasi dua kelas yaitu klaim dan tidak klaim. Memang waktu yang dibutuhkan relatif lama dalam mengklasifikasi data yaitu 4673,33 detik. Kemudian dibandingkan hasil olahan dengan klasifikasi Fuzzy Support Vector Machines dengan komposisi 80 training data dan akurasi yang dihasilkan adalah 99,23 .

Economics stability of a country is depending on each economics sector of the country. One of the most sector that give a significant contribution is Insurance. Insurance Industry is rapidly grow in recent years. As it grows bigger, there is exist one simple core that indeed affected Insurance Industry in Indonesia which is a competition. The competition is to force one Insurance company to be sharper to win the market. On the other hand, one should realize that Insurance company must be well aware of the immerging risk rate. Insurance company indeed should be prepared for the probability of high indemnities. It leads to the point that a study about future claim should be done for this matter.
In this study, one will focus on Automobile Insurance in Indonesia. The proposed model for this matter is using the mighty machine learning that is well known for classification and prediction problems. The classification methods that one will use are Support Vector Machines and Fuzzy Support Vector Machines. The aims of this study are to compare those two classification methods. This study also use a comprehensive historical policy data from a General Insurance company in Indonesia. This data consists of 7373 data with a one year policy starting from January 2015 until December 2016. One will has to compare those two methods to gain the best result. The used of this historical policy data will show that a classification using Support Vector Machines will result in 100 accuracy for binary classification, in this case will be yes or no claim within one year period. It is indeed takes longer to classify using this method. It takes about 4673,33 seconds. Then, one will compare the result with the other method which is Fuzzy Support Vector Machines with the used of 80 training data. It shows that the accuracy is 99,23 ."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Tommy Rachmansyah Adyalam

Klasifikasi data kanker otak menggunakan adaboost support vector machines dengan pemilihan fitur signal-to-noise ratio = Classification of brain cancer data using adaboost support vector machines with signal to noise ratio feature selection

"Kanker otak adalah pertumbuhan sel-sel abnormal di organ otak yang bersifat ganas. Salah satu cara untuk mengurangi perkembangan penyakit ini adalah melakukan pendeteksian dini menggunakan machine learning. Metode machine learning yang digunakan adalah AdaBoost Support Vector Machines untuk klasifikasi. AdaBoost Support Vector Machines adalah metode ensemble antara AdaBoost dengan base classifier Support Vector Machines. Data kanker otak direpresentasikan dalam bentuk matriks berupa ekspresi gen yang disebut DNA microarray. Data DNA microarray yang berdimensi tinggi akan direduksi dengan pemilihan fitur Signal-to-noise Ratio.

Pemilihan fitur bekerja untuk menemukan fitur-fitur yang informatif dan membuang fitur-fitur yang tidak sesuai. Pertama, data diklasifikasi menggunakan AdaBoost Support Vector Machines tanpa pemilihan fitur, dilanjutkan klasifikasi menggunakan AdaBoost Support Vector Machines dengan pemilihan fitur. Pendekatan one vs one digunakan untuk menyelesaikan masalah multi kelas. Setelah melakukan pengujian, hasil akurasi terbaik adalah 91,111 pada data training 90 dengan menggunakan pemilihan fitur sebanyak 60 fitur. Hasil tersebut lebih baik dibandingkan klasifikasi tanpa pemilihan fitur yaitu 86,667 pada data training 90.

Brain cancer is the growth of abnormal cells in the brain organ malignantly. One way to reduce the progression of this disease is to do early detection using machine learning. Machine learning method used is AdaBoost Support Vector Machines for classification. AdaBoost Support Vector Machines is an ensemble method between AdaBoost and base classifier Support Vector Machines. Brain cancer data is represented in the form of matrix of gene expression called DNA microarray. The high dimensional DNA microarray data will be reduced by Signal to noise Ratio feature selection.
Feature selection works to find informative features and discard irrelevant features. Firts, the data is classified using AdaBoost Support Vector Machines without feature selection, further classified using AdaBoost Support Vector Machines with feature selection. The one vs one approach is used to solve multi class problems. After testing, the best accuracy result is 91,111 in 90 training data by using feature selection of 60 features. The result is better than the classification without feature selection that is 86,667 in 90 data training."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Soya Febeauty Yama Otantia Pradini

Klasifikasi tingkatan parasit plasmodium pada citra sel darah merah menggunakan multiclass support vector machines = Plasmodium classification on red blood cells image using multiclass support vector machines

"Metode klasifikasi telah banyak digunakan dalam berbagai aspek, termasuk dalam bidang bioinformatika. Salah satu penggunaan metode klasifikasi ini adalah untuk menentukan tingkatan fase dari sebuah penyakit. Dalam penelitian ini akan dilakukan pengklasifikasian parasit plasmodium falciparum. Parasit tersebut merupakan parasit penyebab penyakit malaria. Penyakit ini dapat ditularkan oleh gigitan nyamuk Anopheles betina yang mengandung plasmodium di dalamnya. Hasil penelitian ini dapat digunakan untuk menentukan fase parasit plasmodium yang berada di sel darah orang yang terjangkit malaria. Tujuan penelitian ini adalah untuk mengetahui persentase keberhasilan dan menganalisis metode Multiclass Support Vector Machines untuk memprediksi tingkatan parasit tersebut. Data yang digunakan adalah data citra sel darah merah yang telah terjangkit tiga jenis tingkatan parasit plasmodium falciparum. Dalam prosesnya, penelitian ini akan menggunakan Canopy sebagai IDE bahasa pemrograman python. Dari 112 percobaan, didapatkan tingkat akurasi tertinggi sebesar 87,5% untuk metode Multclass SVM one vs rest dan one vs one menggunakan 4-fold cross validation dengan parameter linear kernel dan C=1.

Classification methods has been frequently used in various aspects, including bioinformatics. One of its purpose of this classification is to determine phase level of a disease. This research will classify the phase of plasmodium falciparum parasite which causes malaria.The disease is spread by an infected female Anopheles mosquito which contains Plasmodium. The result of this research could be use to determine Plasmodium parasite phase in infected peoples red blood cells. The purpose of this research is to discover the success rate of Multiclass Support Vector Machines method and analyze it in order to predict the parasite phase levels. The data of this study is image data of red blood cells which was infected by three kinds of Plasmodium falciparum parasite levels. In the process, this study will be using Canopy as Integration Development Environtments of phyton programming language. From 112 trials, the highest number of accuracy is 87.5% for Multiclass Support Vector Machines one vs rest and one vs all methods which used the 4-fold cross validation with C=1 as parameter for linear kernel."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

T52713

UI - Tesis Membership Universitas Indonesia Library

Febrisa Dhewi Ramadhany

Klasifikasi thalassemia menggunakan support vector machines (SVM) dan multi-layer perceptron (MLP) = Classification of thalassaemia using support vector machines (SVM) and multi-layer perceptron (MLP)

"ABSTRACT

Thalassemia merupakan salah satu penyakit kelainan sel darah merah yang diturunkan oleh orang tua sejak lahir. Thalassemia mengakibatkan protein yang ada di dalam sel darah merah rusak dan tidak mampu berfungsi dengan baik. Hingga saat ini penyakit thalassemia belum dapat disembuhkan, namun penyakit thalassemia dapat dicegah dengan melakukan deteksi dini atau tes prenatal yang dikenal dengan skrining. Pada penelitian ini deteksi dini dilakukan dengan bantuan komputer. Ada beberapa teknik yang telah digunakan untuk mengklasifikasi skrining data thalassemia, salah satu metode yang mampu mengklasifikasi penyakit thalassemia diantaranya adalah Support Vector Machines (SVM) dan Multi-Layer Perceptron (MLP). Data thalassemia yang digunakan diperoleh dari RSAB Harapan Kita, Indonesia. Data tersebut memiliki yang memiiki 10 fitur. Setelah pengujian dilakukan, klasifikasi dengan menggunakan metode SVM menunjukkan hasil akurasi lebih baik sebesar 97,47190988% dengan rata-rata running time 0,145899875 detik. Sedangkan MLP memperoleh hasil akurasi terbaik sebesar 63,91% dengan rata-rata running time 0,009033 detik. Kesimpulan yang diperoleh menunjukkan bahwa teknik klasifikasi menggunakan SVM memiliki akurasi yang lebih baik apabila dibandingkan dengan MLP.

ABSTRACT

Thalassaemia is a red blood cell disorder that is inherited by parents from birth. Thalassaemia results in damaged proteins in red blood cells and are unable to function properly. Until now, thalassaemia has not been cured, but thalassaemia can be prevented by early detection or prenatal testing known as screening. In this study, early detection is done with the help of a computer. There are several techniques that have been used to classify thalassaemia data screening, one method that is able to classify thalassaemia include Support Vector Machines (SVM) and Multi-Layer Perceptron (MLP). The thalassaemia data used was obtained from Harapan Kita Hospital, Indonesia. The data has 10 features. After the testing is done, the classification using the SVM method shows better accuracy results of 97.447190988% with an average running time of 0.145899875 seconds. While MLP obtained the best accuracy results of 63.91% with an average running time of 0.009033 seconds. The conclusions obtained showed that the classification technique using SVM had better accuracy compared to MLP."

2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Tya Nadira

Klasifikasi data kanker menggunakan metode support vector machines dengan pemilihan fitur berdasarkan artificial bee colony dan global artificial bee colony = Classification of cancer data using support vector machines method with features selection based on artificial bee colony and global artificial bee colony

"ABSTRAK

Kanker merupakan penyebab utama kematian kedua di seluruh dunia sehingga mengakibatkan kanker menjadi salah satu prioritas masalah dalam kesehatan. Di Indonesia, tercatat bahwa kanker payudara dan kanker paru-paru memiliki angka kejadian dan kematian tertinggi bagi wanita dan pria WHO, 2014 . Untuk menangani hal tersebut, dalam tugas akhir ini diusulkan suatu metode untuk mengklasifikasikan data kanker menggunakan Support Vector Machines SVM dengan pemilihan fitur berdasarkan Artificial Bee Colony ABC dan Global Artificial Bee Colony GABC pada data kanker payudara dan paru-paru berbasis microarray. Hasil yang diperoleh menunjukkan bahwa metode pemilihan fitur ABC dan GABC memberikan hasil rata-rata akurasi yang lebih tinggi dibandingkan tanpa dilakukan pemilihan fitur dalam klasifikasi data kanker. Untuk pemilihan fitur, metode GABC memberikan hasil yang lebih unggul yaitu dengan akurasi tertinggi 99,99 dengan 10 fitur untuk data kanker paru-paru dan 96,4286 dengan 10 fitur untuk data kanker payudara selama 3 kali running sedangkan metode ABC memberikan rata-rata akurasi tertinggi 99,99 dengan 20 fitur untuk data kanker paru-paru dan 96,4286 dengan 10 fitur untuk data kanker payudara selama 5 kali running.

ABSTRACT

Cancer is the second leading cause of death globally, so that cancer becomes one of priority problems in health. According to WHO on 2014, Indonesia has breast cancer and lung cancer that is the highest incidence and death rates for women and men. To overcome it, in this research, we proposed method to classify cancer data using Support Vector Machines SVM with features selection based on Artificial Bee Colony ABC and Global Artificial Bee Colony GABC on breast and lung cancer based on microarray data. The results show that ABC and GABC as features selection method produced higher average classification accuracy than without no features selection. For features selection methods, the GABC method provides higher results with the highest 99,99 with 10 features for lung cancer data and 96,4286 with 10 features for breast cancer data for 3 times of runs while ABC method provides 99,99 with 20 features for data lung cancer and 96,4286 with 10 features for breast cancer data for 5 times of runs."

2017

S69844

UI - Skripsi Membership Universitas Indonesia Library

Intan Primasari

Perbandingan pemilihan fitur genetic algorithm dan laplacian score menggunakan klasifikasi support vector machines pada data kanker = Comparison of feature selection of genetic algorithm and laplacian score using classification of support vector machines on cancer data

"ABSTRAK

Kanker merupakan salah satu penyakit yang paling mematikan bagi manusia. Menurut WHO 2015 , kanker adalah penyebab kematian nomor 2 di dunia sebesar 13 setelah penyakit kardiovaskular. Salah satu hal yang dapat dilakukan untuk penelitian kanker menggunakan machine learning adalah melakukan pendeteksian jenis kanker dengan memanfaatkan microarray data. Microarray data yang memiliki banyak fitur. Itu merupakan salah satu kendala dalam penerapan teknik machine learning. Hal ini akan mempengaruhi perfoma atau keakuratan dari hasil klasifikasi pada data kanker. Oleh karena itu, metode pemilihan fitur diperlukan untuk meningkatkan perfoma dalam pendeteksian kanker. Dalam tugas akhir ini dilakukan perbandingan pemilihan fitur menggunakan Genetic Algorithm dan Laplacian Score. Fitur-fitur yang sudah terpilih pada data kanker kemudian digunakan dalam proses klasifikasi Support Vector Machines. Hasilnya, didapatkan akurasi terbaik saat dengan metode pemilihan fitur menggunakan Genetic Algorithm yaitu 98,69 dengan penggunaan 40 fitur untuk data kanker prostat dan 98,97 dengan penggunaan 30 fitur untuk data kanker kolon.

ABSTRACT

Cancer is one of the most deadly diseases for humans. According to the WHO 2015 , cancer is the causes of the death number two in the world by 13 after cardiovascular disease. Taking advantage from microarray data, machine learning methods can be applied to help cancer prediction according to its types. Microarray data has many features. It is one of the obstacles in the machine learning techniques. This will affect the performance or accuracy of the classification results on cancer data. Therefore, feature selection methods are required to increase performance in cancer prediction. This research proposed comparison of feature selection using Genetic Algorithm and Laplacian Score. Features that are already selected in the cancer data then used in the Support Vector Machines classification. The results show that the best accuracy obtained when using Genetic Algorithm with percentage of 98,69 by using 40 features for prostate cancer data and 98,97 by using 30 features for colon cancer data. "

2017

S68354

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian