Kanker hati merupakan penyebab utama kematian akibat kanker di seluruh dunia. Di Indonesia, kanker hati menempati angka kejadian tertinggi kedua untuk laki laki yaitu sebesar 12,4 per 100.000 penduduk dengan rata-rata kematian 7,6 per 100.000 penduduk. Pada tugas akhir ini, dibahas mengenai kanker hati primer dengan jenis hepatocellular carcinoma. Metode Twin Support Vector Machines (Twin SVM) diimplementasikan untuk mengklasifikasikan data kanker hati berdasarkan hasil CT scan. Data yang digunakan adalah data numerik hasil CT scan pasien yang menderita kanker hati dan diperoleh dari Laboratorium Radiologi RSUPN Cipto Mangunkusumo. Metode Twin SVM adalah pengembangan dari metode SVM yang menggunakan dua hyperplane dalam mengklasifikasikan sampel. Pada tugas akhir ini, kernel yang digunakan pada metode Twin SVM adalah polinomial dan radial basis function (RBF). Berdasarkan hasil perbandingan, klasifikasi data kanker hati menggunakan metode Twin SVM dengan kernel Polinomial menghasilkan akurasi tertinggi sebesar 77,30% pada penggunaan data testing sebesar 10% dan data training 90%. Selain itu, nilai akurasi terendah terdapat pada kernel RBF menghasilkan sebesar 60,10% pada penggunaan data testing sebesar 90% dan data training 10% dan nilai parameter ð¶ = 1. Jika dibandingkan, klasifikasi data kanker hati dengan menggunakan metode Twin SVM dengan kernel polinomial menghasilkan nilai akurasi yang lebih baik.
Liver cancer is the main cause of cancer death in the worldwide. In Indonesia, the incidence rate of liver cancer is the second highest for men, that is 12.4 per 100,000 population with the average death rate is 7.6 per 100,000 population. This final project discusses primary liver cancer with a type of hepatocellular carcinoma. The Twin Support Vector Machines (Twin SVM) method was implemented to classify liver cancer data based on CT scan results. The data used are numerical data from CT scan results of patients suffering from liver cancer and obtained from the Radiology Laboratory of Cipto Mangunkusumo Hospital. The Twin SVM method is the development of the SVM method that uses two hyperplane in classifying samples. In this final project, the kernel used in the Twin SVM method is polynomial and radial basis function (RBF). Based on the comparison results, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces the highest accuracy of 77.30% on the use of testing data of 10% and training data of 90%. In addition, the lowest accuracy value is found in the RBF kernel resulting in 60.10% on the use of testing data of 90% and training data of 10% and the parameter value of C=1. When compared, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces better accuracy values.
"Stroke merupakan salah satu penyakit dengan risiko kematian dan kecacatan yang tinggi. Secara umum, stroke diklasifikasikan menjadi dua jenis, yaitu stroke iskemik dan stroke hemoragik. Klasifikasi jenis stroke secara cepat dan tepat diperlukan untuk menentukan jenis pengobatan dan tindakan yang tepat guna mencegah terjadinya dampak yang lebih fatal pada pasien stroke. Pada penelitian ini, klasifikasi stroke dilakukan menggunakan pendekatan machine learning. Adapun data penelitian yang digunakan adalah data stroke yang terdiri atas pemeriksaan laboratorium. Pada data penelitian tersebut, terdapat berbagai komponen pemeriksaan laboratorium yang dicatat serta memungkinkan adanya suatu pemeriksaan yang kurang relevan atau informatif dalam mengklasifikasi stroke. Apabila data tersebut tidak ditangani, akan mempengaruhi kinerja serta waktu komputasi model dalam mengklasifikasi stroke. Oleh karena itu, pada penelitian ini, Random Forest (RF) dengan seleksi fitur Recursive Feature Elimination (RFE) digunakan dalam mengklasifikasi data stroke. Dengan menerapkan metode tersebut, diperoleh kinerja model yang lebih baik saat melakukan klasifikasi menggunakan sejumlah fitur yang diperoleh dari hasil seleksi fitur, dibandingkan menggunakan keseluruhan fitur dalam data stroke. Selain itu, pada penerapan metode tersebut, diperoleh kinerja model yang baik dalam mengklasifikasi data kelas stroke iskemik, akan tetapi tidak cukup baik dalam mengklasifikasi data kelas stroke hemoragik. Hal ini dikarenakan proporsi jumlah data pada kelas stroke iskemik lebih banyak dibandingkan stroke hemoragik. Dalam hal ini dibutuhkan suatu metode penanganan agar kinerja model tetap optimal dalam mengklasifikasi data kelas stroke iskemik dan stroke hemoragik. Pada penelitian ini, Synthetic Minority Oversampling Technique (SMOTE) digunakan untuk menyeimbangkan kedua kelas data stroke guna memperoleh kinerja model yang optimal dalam mengklasifikasi kedua kelas data stroke. Berdasarkan penerapan metode RF dengan RFE serta SMOTE dalam mengklasifikasi data stroke, diperoleh kinerja model yang lebih baik dibandingkan melakukan klasifikasi pada data stroke yang tidak diseimbangkan dengan SMOTE.
Stroke is one of the diseases with the high risk of death and disability. Stroke generally can be classified into two types, namely ischemic stroke and hemorrhagic stroke. A quick and accurate stroke classification is needed to find the right treatment to prevent a dangerous effect on the stroke patients. In this study, the stroke classification was applied using a machine learning approach. The data used in this study is stroke data that consists of laboratory examinations. The data consists of various laboratory examination components, therefore, it might be possible that some of the components are less relevant and has less informative related in classifying stroke. If the data is not well handled, it might affect the performance and computation time of the model in classifying stroke. Therefore, in this study, Random Forest (RF) with Recursive Feature Elimination (RFE) method is used to classify the stroke data. The result showed that by applying the method in classifying several amounts of features obtained from the feature selection results has better performance rather than classifying the method using all features in stroke data. Moreover, based on applying this method, the result showed that the model has better performance in classifying ischemic stoke class data but not good enough in classifying hemorrhagic stroke class data. This result might occur because the proportion of numbers the ischemic stroke more than hemorrhagic stroke class data. Therefore, the handling method is needed to obtain optimal model performance in classifying ischemic stroke and hemorrhagic stroke class data. In this study, Synthetic Minority Oversampling Technique (SMOTE) is applied to balance the two classes of stroke data so optimal performance of the classification model can be obtained. Based on the application of the RF with RFE methods and SMOTE in the classification of stroke data, better model performance is obtained compared to classifying the stroke data that is not balanced with SMOTE.