Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 64197 dokumen yang sesuai dengan query
cover
Nurul Maghfirah
"Kematian yang disebabkan oleh kanker diperkirakan akan terus meningkat, padahal jumlah kematian ini dapat dikurangi dengan adanya deteksi dini. Salah satunya adalah dengan klasifikasi data kanker. Data kanker yang digunakan merupakan data kanker berdimensi tinggi dengan ribuan fitur, tetapi tidak semua fitur yang ada merupakan fitur yang relevan. Oleh karena itu, perlu adanya proses seleksi fitur. Untuk meningkatkan tingkat akurasi yang dihasilkan, digunakan sebuah metode seleksi fitur yang meninjau adanya korelasi antar gen, yaitu CSVM-RFE. Pada metode tersebut, data yang ada diproyeksikan dan diubah menjadi sebuah data baru dengan ekstraksi fitur, dan kemudian dilakukan proses seleksi fitur. Penggunaan dua metode tersebut pada klasifikasi tiga data kanker yang ada terbukti menghasilkan tingkat akurasi yang tinggi, pada data kanker kolon tingkat akurasi yang didapatkan adalah sebesar 96.6, pada kanker prostat sebesar 98.9, dan pada kanker lymphoma sebesar 98,6.

The number of death caused by cancer expected to rise over two decades, whereas the number of death can be reduced by early detection. One of them is cancer classification. Cancer dataset is a high dimensional dataset that consist of thousands of features, but not all of these features are relevant. Therefore, it is necessary to remove the redundant features using feature selection. Feature selection can also improve the accuracy of classification. Many feature selection methods do not consider the correlated genes, so we need a new feature selection method that consider the correlated genes. It is CSVM RFE, in this method the existing data is projected and converted into a new data with feature extraction. These two methods are applied to the cancer datasets, and produce the accuracy of 96.6 using colon cancer dataset, 98.9 using prostate cancer dataset, and 98.6 using lymphoma cancer dataset."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
S69588
UI - Skripsi Membership  Universitas Indonesia Library
cover
Selly Anastassia Amellia Kharis
"Kanker merupakan kelompok penyakit yang ditandai dengan pertumbuhan dan penyebaran sel-sel abnormal yang tidak terkendali. Jika penyebaran sel tersebut tidak terkendali, hal ini dapat menyebabkan kematian. Berdasarkan American Cancer Society, pendeteksian dini terhadap sel kanker dapat meningkatkan angka harapan hidup seorang pasien lebih dari 97 . Banyak penelitian yang telah meneliti mengenai klasifikasi kanker menggunakan microarray data. Microarray data terdiri dari ribuan fitur gen namun hanya memiliki puluhan atau ratusan sampel. Hal tersebut dapat menurunkan akurasi klasifikasi sehingga perlu dilakukannya pemilihan fitur sebelum proses klasifikasi.
Pada penelitian ini dilakukan dua tahap pemilihan fitur. Pertama, support vector machine recursive feature elimination SVM-RFE digunakan untuk prefilter gen. Kedua, hasil pemilihan fitur SVM-RFE diseleksi kembali dengan menggunakan artificial bee colony ABC yang merupakan algoritma optimisasi berdasarkan perilaku lebah madu. Penelitian ini menggunakan dua dataset, yaitu data kanker paru-paru Michigan dan Ontario dari Kent Ridge Biomedical Dataset.
Hasil percobaan dengan menggunakan SVM-RFE dan ABC menunjukkan nilai akurasi klasifikasi yang lebih tinggi daripada tanpa pemilihan fitur, SVM-RFE, dan ABC, yaitu 98 untuk data kanker paru-paru Michigan dengan menggunakan 100 fitur dan 97 untuk data kanker paru-paru Ontario dengan menggunakan 70 fitur.

Cancer is a group of diseases characterized by the uncontrolled growth and spread of abnormal cells. If the spread is not controlled, it can result in death. Based on American Cancer Society, early detection of cancerous cells can increase survival rates for patients by more than 97 . Many study showed new aspect of cancer classification based microarray data. Microarray data are composed of many thousands of features genes and from tens to hundreds of instances. It can decrease classification accuracy so feature selection is needed before the classification process
In this paper, we propose two stages feature selection. First, support vector machine recursive feature elimination recursive feature elimination SVM RFE is used to prefilter the genes. Second, the SVM RFE features selection result is selected again using Artificial Bee Colony ABC which is an optimization algorithm based on a particular intelligent behavior of honeybee swarms. This research conducted experiments on Ontario and Michigan Lung Cancer Data from Kent Ridge Biomedical Dataset.
Experiment results demonstrate that this approach provides a higher classification accuracy rate than without feature selection, SVM RFE, and ABC, 98 for Michigan lung cancer dataset with using 100 features and 97 for Ontario lung cancer dataset with using 70 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49733
UI - Tesis Membership  Universitas Indonesia Library
cover
Inry Raudiatul Fauzi
""ABSTRAK
"
Kanker merupakan penyakit penyebab kematian terbesar kedua di dunia. Menurut prediksi WHO 2015 kasus kematian akibat kanker akan meningkat menjadi 21,6 juta kasus pada tahun 2030. Salah satu usaha untuk mengurangi penyebaran kanker dengan menggunakan machine learning adalah melakukan pendeteksian jenis kanker dengan memanfaatkan microarray data. Pada umumnya, microarray data kanker terdiri dari banyak fitur. Namun, tidak semua fitur yang ada pada data kanker memiliki informasi penting. Oleh karena itu, fitur-fitur tersebut akan diekstraksi menggunakan metode Principal Component Analysis PCA . Kemudian dipilih fitur-fitur yang paling informatif dari data hasil ekstraksi PCA. Fitur-fitur terpilih dari data hasil ekstraksi akan dibentuk dalam data baru. Data sebelum dan data setelah dilakukan pemilihan fitur akan diklasifikasi menggunakan metode Fuzzy Support Vector Machines FSVM . Akurasi dari proses klasifikasi dua tahap tersebut akan dibandingkan. Pendekatan one versus one akan digunakan pada masalah klasifikasi multikelas data kanker leukemia. Dengan pendekatan tersebut akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Hasilnya, tanpa melakukan pemilihan fitur, diperoleh akurasi tertinggi sebesar 87.69 . Setelah dilakukan pemilihan fitur, diperoleh akurasi terbaik dengan menggunakan 60 fitur dengan akurasi sebesar 96,92 .

ABSTRACT
Cancer is the second leading cause of death globally. According to WHO prediction 2015 cases of cancer deaths will increase become 21.6 million cases by 2030. One of the effort to reduce the spread of cancer by using machine learning is to detect the types of cancer. We can use microarray data to detect the types of cancer. In general, microarray cancer data consist of many features. However, not all features in cancer data have important information. Therefore, these features will be extracted by using Principal Component Analysis PCA method. Then, we select the most features who have important information of data extraction. The selected features of extracted data will be formed in the new data. Data, before and after selection will be classified using Fuzzy Support Vector Machines FSVM method. The accuracy of the classification process will be compared. The one versus one approach will be used on multiclass leukemia cancer data. This approach will formed the multiclass problem into k k 1 2 binary class problems, where k denotes the number of classes. The results, without doing feature selection, the highest accuracy is 87.69 . After doing feature selection, the best accuracy is obtained by using 60 features with the accuracy is 96.92 ."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Tommy Rachmansyah Adyalam
"Kanker otak adalah pertumbuhan sel-sel abnormal di organ otak yang bersifat ganas. Salah satu cara untuk mengurangi perkembangan penyakit ini adalah melakukan pendeteksian dini menggunakan machine learning. Metode machine learning yang digunakan adalah AdaBoost Support Vector Machines untuk klasifikasi. AdaBoost Support Vector Machines adalah metode ensemble antara AdaBoost dengan base classifier Support Vector Machines. Data kanker otak direpresentasikan dalam bentuk matriks berupa ekspresi gen yang disebut DNA microarray. Data DNA microarray yang berdimensi tinggi akan direduksi dengan pemilihan fitur Signal-to-noise Ratio.
Pemilihan fitur bekerja untuk menemukan fitur-fitur yang informatif dan membuang fitur-fitur yang tidak sesuai. Pertama, data diklasifikasi menggunakan AdaBoost Support Vector Machines tanpa pemilihan fitur, dilanjutkan klasifikasi menggunakan AdaBoost Support Vector Machines dengan pemilihan fitur. Pendekatan one vs one digunakan untuk menyelesaikan masalah multi kelas. Setelah melakukan pengujian, hasil akurasi terbaik adalah 91,111 pada data training 90 dengan menggunakan pemilihan fitur sebanyak 60 fitur. Hasil tersebut lebih baik dibandingkan klasifikasi tanpa pemilihan fitur yaitu 86,667 pada data training 90.

Brain cancer is the growth of abnormal cells in the brain organ malignantly. One way to reduce the progression of this disease is to do early detection using machine learning. Machine learning method used is AdaBoost Support Vector Machines for classification. AdaBoost Support Vector Machines is an ensemble method between AdaBoost and base classifier Support Vector Machines. Brain cancer data is represented in the form of matrix of gene expression called DNA microarray. The high dimensional DNA microarray data will be reduced by Signal to noise Ratio feature selection.
Feature selection works to find informative features and discard irrelevant features. Firts, the data is classified using AdaBoost Support Vector Machines without feature selection, further classified using AdaBoost Support Vector Machines with feature selection. The one vs one approach is used to solve multi class problems. After testing, the best accuracy result is 91,111 in 90 training data by using feature selection of 60 features. The result is better than the classification without feature selection that is 86,667 in 90 data training.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Intan Primasari
"ABSTRAK
Kanker merupakan salah satu penyakit yang paling mematikan bagi manusia. Menurut WHO 2015 , kanker adalah penyebab kematian nomor 2 di dunia sebesar 13 setelah penyakit kardiovaskular. Salah satu hal yang dapat dilakukan untuk penelitian kanker menggunakan machine learning adalah melakukan pendeteksian jenis kanker dengan memanfaatkan microarray data. Microarray data yang memiliki banyak fitur. Itu merupakan salah satu kendala dalam penerapan teknik machine learning. Hal ini akan mempengaruhi perfoma atau keakuratan dari hasil klasifikasi pada data kanker. Oleh karena itu, metode pemilihan fitur diperlukan untuk meningkatkan perfoma dalam pendeteksian kanker. Dalam tugas akhir ini dilakukan perbandingan pemilihan fitur menggunakan Genetic Algorithm dan Laplacian Score. Fitur-fitur yang sudah terpilih pada data kanker kemudian digunakan dalam proses klasifikasi Support Vector Machines. Hasilnya, didapatkan akurasi terbaik saat dengan metode pemilihan fitur menggunakan Genetic Algorithm yaitu 98,69 dengan penggunaan 40 fitur untuk data kanker prostat dan 98,97 dengan penggunaan 30 fitur untuk data kanker kolon.

ABSTRACT
Cancer is one of the most deadly diseases for humans. According to the WHO 2015 , cancer is the causes of the death number two in the world by 13 after cardiovascular disease. Taking advantage from microarray data, machine learning methods can be applied to help cancer prediction according to its types. Microarray data has many features. It is one of the obstacles in the machine learning techniques. This will affect the performance or accuracy of the classification results on cancer data. Therefore, feature selection methods are required to increase performance in cancer prediction. This research proposed comparison of feature selection using Genetic Algorithm and Laplacian Score. Features that are already selected in the cancer data then used in the Support Vector Machines classification. The results show that the best accuracy obtained when using Genetic Algorithm with percentage of 98,69 by using 40 features for prostate cancer data and 98,97 by using 30 features for colon cancer data. "
2017
S68354
UI - Skripsi Membership  Universitas Indonesia Library
cover
Alifah
"Diabetes Melitus (DM) merupakan gangguan sistem metabolik akibat pankreas tidak memproduksi cukup insulin atau tubuh tidak mampu menggunakan insulin yang ada secara efektif. Menderita diabetes dalam jangka waktu panjang dapat mengakibatkan berbagai macam komplikasi salah satu di antaranya adalah Retinopati diabetik. Retinopati diabetik  adalah kelainan pada bagian mata yang disebabkan oleh adanya kerusakan dan penyumbatan pada pembuluh darah di bagian belakang mata (retina). Pada penelitian kali ini akan di gunakan data retinopati diabetik dengan menggunakan metode seleksi fitur Recursive Feature Elimination (RFE) dan Chi-Square dan akan di klasifikasi menggunakan Support Vector Machine.

Diabetic retinopathy is one of the complication of diabetes, which is an eye disease that can cause blindness. Its happen because of damage of retina as a result of the long illness of diabetic melitus. People usually do research using image data in diabetic patients. This paper present about diabetic retinopathy will extracting with feature selection. In this study, we use data diabetic patients who will be extracted with a feature selection method. Feature selection used in this study is Recursive Feature Elimination (RFE) and Chi-Square. For classification of diabetic retinopathy has been done by Support Vector Machine (SVM). From the experimental result with various tunning hyperparameters, the classification model can obtain the accuracy between 97%-100% for both methods."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Melati Vidi Jannati
"Klasifikasi data kanker menggunakan microarray data menjadi salah satu cara untuk mendapatkan pengobatan yang lebih tepat. Kendala yang terdapat adalah karakteristik dari microarray yang memiliki fitur yang sangat banyak. Seringkali fitur tersebut tidak begitu informatif bagi pengklasifikasian sehingga perlu adanya suatu cara untuk memilih fitur-fitur yang mengandung informasi yang penting. Salah satu cara tersebut adalah dengan pemilihan fitur. Pada penelitian ini, metode pemilihan fitur yang digunakan berdasarkan clustering dengan fungsi kernel. Fitur-fitur yang sudah terpilih kemudian diklasifikasikan menggunakan metode Support Vector Machine.
Evaluasi dari klasifikasi pada penelitian ini melibatkan K-Fold Cross Validation, metode tersebut akan membagi data secara acak, tetapi merata sehingga akurasi yang didapat juga merata. Hasil akurasi tersebut dilakukan dengan berbagai uji terhadap parameter yang berkaitan seperti K partisi, nilai dan fitur-fitur yang digunakan. Pada proses klasifikasi tanpa pemilihan fitur tingkat akurasinya mencapai 89.68 dengan k partisi sebanyak 6 sementara dengan 5 fitur akurasinya menjadi 95.87 pada partisi sebanyak 10.

Classification of cancer using microarray data is one way to get a more precise treatment. The obstacle on classification data is the characteristics of microarray data that is having many features. These features are often not so informative for classification, so it needs a way to select the features that contain important information. One way is by selection feature. In this research, the method of selection features that are used based on clustering with kernel function. Features that are already selected then classified using Support Vector Machine.
Evaluation of classification in this research involves a K Fold Cross Validation, that methods split data randomly but uniformly so that it can reach all of accuracy. The results of accuracy data was done with different test against related parameters such as K partition, the value of and the features that are used. On the classification process without selection features rate of accuracy reached on 89.68 with k partition number 6 while with the 5 features obtained 95.87 on partition number 10.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
S66852
UI - Skripsi Membership  Universitas Indonesia Library
cover
Vinezha Panca
"ABSTRAK
Kanker merupakan salah satu penyebab kematian terbesar di seluruh dunia. Secara khusus, kanker otak adalah kanker yang terjadi pada sistem saraf pusat. Salah satu hal yang dapat dilakukan untuk penelitian kanker otak menggunakan machine learning adalah melakukan pendeteksian jenis kanker otak dengan memanfaatkan microarray data. Permasalahan tersebut merupakan masalah klasifikasi multikelas. Dengan menggunakan pendekatan one versus one, akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Karena data kanker otak memiliki fitur yang sangat banyak, perlu dilakukan seleksi fitur. Pada penelitian ini, akan diimplementasikan metode Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM-RFE sebagai metode seleksi fitur, dan Twin Support Vector Machine TWSVM sebagai metode klasifikasi. Pada metode MMSVM-RFE dilakukan pelatihan SVM-RFE pada setiap masalah dua kelas, sehingga setiap masalah dua kelas memiliki pengurutan fitur masing-masing. Sebagai metode klasifikasi, TWSVM memiliki tujuan untuk mencari hyperplane masing ndash; masing kelas sedemikian sehingga data kelas satu sedekat mungkin terhadap suatu hyperplane namun sejauh mungkin dengan hyperplane lainnya. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel linear pada TWSVM adalah 95,33 dengan menggunakan 200 fitur. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel RBF pada TWSVM adalah 87 dengan 70 fitur. Sedangkan apabila proses validasi juga dilakukan pada seleksi fitur, rata-rata akurasi tertinggi yang diperoleh adalah 90,67 dengan menggunakan 90 fitur.

ABSTRACT
Cancer is one of main causes of death worldwide. Brain cancer is a type of cancer which occurs at central nervous system. Taking advantage from microarray data, machine learning methods can be applied to help brain cancer prediction according to its types. This problem can be referred as a multiclass classification problem. Using one versus one approach, the multiclass problem with k classes can be transformed into k k 1 2 binary class problems. The huge amount of features makes it necessary to use feature selection. In this research, Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM RFE method is implemented as the feature selection method, and Twin Support Vector Machine TWSVM method is implemented as the classification method. The main concept of MMSVM RFE is to train SVM RFE at each binary problem so that each binary problem will have their own arrangements of feature. As a classification method, TWSVM is trained to find two hyperplanes, each representative of its own class. The data of one class must be as near as possible from its representative hyperplane while also must be as far as possible from the other hyperplane. In the simulation which uses linear kernel on MMSVM RFE and linear kernel on TWSVM, the highest average accuracy is 95,33 , using 200 features. In the simulation which uses linear kernel on MMSVM RFE and RBF kernel on TWSVM, the highest average accuracy is 87 , using 70 features. In the case where the feature selection process is included in doing validation, the highest average accuracy is 90,67 , using 90 features."
2016
S66302
UI - Skripsi Membership  Universitas Indonesia Library
cover
Tya Nadira
"ABSTRAK
Kanker merupakan penyebab utama kematian kedua di seluruh dunia sehingga mengakibatkan kanker menjadi salah satu prioritas masalah dalam kesehatan. Di Indonesia, tercatat bahwa kanker payudara dan kanker paru-paru memiliki angka kejadian dan kematian tertinggi bagi wanita dan pria WHO, 2014 . Untuk menangani hal tersebut, dalam tugas akhir ini diusulkan suatu metode untuk mengklasifikasikan data kanker menggunakan Support Vector Machines SVM dengan pemilihan fitur berdasarkan Artificial Bee Colony ABC dan Global Artificial Bee Colony GABC pada data kanker payudara dan paru-paru berbasis microarray. Hasil yang diperoleh menunjukkan bahwa metode pemilihan fitur ABC dan GABC memberikan hasil rata-rata akurasi yang lebih tinggi dibandingkan tanpa dilakukan pemilihan fitur dalam klasifikasi data kanker. Untuk pemilihan fitur, metode GABC memberikan hasil yang lebih unggul yaitu dengan akurasi tertinggi 99,99 dengan 10 fitur untuk data kanker paru-paru dan 96,4286 dengan 10 fitur untuk data kanker payudara selama 3 kali running sedangkan metode ABC memberikan rata-rata akurasi tertinggi 99,99 dengan 20 fitur untuk data kanker paru-paru dan 96,4286 dengan 10 fitur untuk data kanker payudara selama 5 kali running.

ABSTRACT
Cancer is the second leading cause of death globally, so that cancer becomes one of priority problems in health. According to WHO on 2014, Indonesia has breast cancer and lung cancer that is the highest incidence and death rates for women and men. To overcome it, in this research, we proposed method to classify cancer data using Support Vector Machines SVM with features selection based on Artificial Bee Colony ABC and Global Artificial Bee Colony GABC on breast and lung cancer based on microarray data. The results show that ABC and GABC as features selection method produced higher average classification accuracy than without no features selection. For features selection methods, the GABC method provides higher results with the highest 99,99 with 10 features for lung cancer data and 96,4286 with 10 features for breast cancer data for 3 times of runs while ABC method provides 99,99 with 20 features for data lung cancer and 96,4286 with 10 features for breast cancer data for 5 times of runs."
2017
S69844
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fildzah Zhafarina
"

Kanker hati merupakan penyebab utama kematian akibat kanker di seluruh dunia. Di Indonesia, kanker hati menempati angka kejadian tertinggi kedua untuk laki laki yaitu sebesar 12,4 per 100.000 penduduk dengan rata-rata kematian 7,6 per 100.000 penduduk. Pada tugas akhir ini, dibahas mengenai kanker hati primer dengan jenis hepatocellular carcinoma. Metode Twin Support Vector Machines (Twin SVM) diimplementasikan untuk mengklasifikasikan data kanker hati berdasarkan hasil CT scan. Data yang digunakan adalah data numerik hasil CT scan pasien yang menderita kanker hati dan diperoleh dari Laboratorium Radiologi RSUPN Cipto Mangunkusumo. Metode Twin SVM adalah pengembangan dari metode SVM yang menggunakan dua hyperplane dalam mengklasifikasikan sampel. Pada tugas akhir ini, kernel yang digunakan pada metode Twin SVM adalah polinomial dan radial basis function (RBF). Berdasarkan hasil perbandingan, klasifikasi data kanker hati menggunakan metode Twin SVM dengan kernel Polinomial menghasilkan akurasi tertinggi sebesar 77,30% pada penggunaan data testing sebesar 10% dan data training 90%. Selain itu, nilai akurasi terendah terdapat pada kernel RBF menghasilkan sebesar 60,10% pada penggunaan data testing sebesar 90% dan data training 10% dan nilai parameter 𝐶 = 1. Jika dibandingkan, klasifikasi data kanker hati dengan menggunakan metode Twin SVM dengan kernel polinomial menghasilkan nilai akurasi yang lebih baik.


Liver cancer is the main cause of cancer death in the worldwide. In Indonesia, the incidence rate of liver cancer is the second highest for men, that is 12.4 per 100,000 population with the average death rate is 7.6 per 100,000 population. This final project discusses primary liver cancer with a type of hepatocellular carcinoma. The Twin Support Vector Machines (Twin SVM) method was implemented to classify liver cancer data based on CT scan results. The data used are numerical data from CT scan results of patients suffering from liver cancer and obtained from the Radiology Laboratory of Cipto Mangunkusumo Hospital. The Twin SVM method is the development of the SVM method that uses two hyperplane in classifying samples. In this final project, the kernel used in the Twin SVM method is polynomial and radial basis function (RBF). Based on the comparison results, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces the highest accuracy of 77.30% on the use of testing data of 10% and training data of 90%. In addition, the lowest accuracy value is found in the RBF kernel resulting in 60.10% on the use of testing data of 90% and training data of 10% and the parameter value of C=1. When compared, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces better accuracy values.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>