Penelitian ini bertujuan untuk melakukan pengelompokan varian virus SARS-CoV-2 melalui proses clustering menggunakan metode unsupervised learning. Data yang digunakan adalah sekuens protein SARS-CoV-2 yang diekstraksi fiturnya menggunakan paket Discere dalam bahasa pemrograman Python. Sebanyak 27 fitur dihasilkan dan diseleksi dengan metode seleksi fitur Least Absolute Shrinkage and Selection Operator (LASSO). Metode Elbow digunakan untuk menentukan jumlah cluster yang optimal. Dalam penelitian ini, digunakan metode clustering K-Means dan Balanced Iterative Reducing and Clustering using Hierarchies (BIRCH). Evaluasi hasil clustering dilakukan menggunakan metrik evaluasi Silhouette Score dan Davies-Bouldin Index, serta memperhatikan waktu runtime untuk setiap simulasi. Hasil evaluasi kemudian dibandingkan untuk melihat perbedaan performa antara kedua metode clustering yang digunakan, serta pengaruh seleksi fitur terhadap performa clustering. Hasil terbaik diperoleh pada simulasi dengan metode clustering BIRCH + LASSO, dengan nilai Silhouette Score 0,74186 untuk jumlah cluster k=4 dan 0,73207 untuk k=5. Nilai Davies-Bouldin Index terbaik juga diperoleh pada simulasi tersebut, yaitu 0,42697 untuk k=4 dan 0,37949 untuk k=5. Waktu runtime terbaik tercatat pada simulasi dengan metode K-Means + LASSO, yaitu 0,21551 detik untuk k=4 dan 0,17539 detik untuk k=5. Dapat disimpulkan bahwa metode BIRCH menghasilkan cluster yang lebih baik berdasarkan metrik evaluasi, namun K-Means memberikan proses clustering yang lebih cepat. Seleksi fitur dengan metode LASSO juga membantu meningkatkan performa clustering.
Infark Serebri adalah kondisi dari suatu jaringan otak yang tidak teralirkan darah sehingga sel-sel otak tersebut kekurangan oksigen dan nutrisi. Hal ini dapat mengakibatkan kerusakan bahkan kematian sel-sel otak dan perlu dengan segera mendapatkan penanganan. Keadaan ini sering dikenal sebagai Stroke, dimana pada penulisan ini akan berfokus pada data stroke nonhemoragik (stroke tidak berdarah) yang diakibatkan penyumbatan pembuluh darah di otak. Biasanya penyakit ini dapat dikenali dari gejala kelumpuhan suatu bagian tubuh atau kesulitan menggunakan suatu alat indra. Menurut para ahli, penyakit ini harus dicegah sejak dini karena dapat berakibat fatal bagi keseluruhan fungsional tubuh. Salah satu tindakan yang dapat dilakukan sejak dini adalah mendeteksi kemungkinan penyakit agar dapat dilakukan penanganan secara tepat dan cepat. Dalam penelitian ini, Infark Serebri dideteksi dengan mengklasifikasi ada atau tidaknya sel abnormal pada jaringan otak pada hasil CT Scan otak pasien menggunakan Support Vector Machine dengan Seleksi Fitur RELIEF. Data yang digunakan berupa data numerik dari pasien yang melakukan pemeriksaan di RSUPN dr. Cipto Mangunkusumo Jakarta dalam bentuk hasil CT Scan otak. Terdapat Sembilan fitur indikator yang digunakan dan diproses dengan membandingkan Support Vector Machine dengan dan tanpa seleksi fitur RELIEF. Berdasarkan hasil uji coba, metode yang diusulkan mampu mencapai akurasi sebesar 95,23%. Sehingga, penggunaan seleksi fitur RELIEF pada SVM merupakan metode yang baik untuk menklasifikasi infark serebri.
The Cerebrovascular Infarction is a condition of an inflowed blood of brain tissue so that the brain cells lack oxygen and nutrients. This can cause the damage and even the death of brain cells and needed to get immediate treatment. This situation is often known as stroke, which at this writing will fokus on data on non-hemoragic strokes (non-bleeding strokes) caused by blockage of blood vessels in the brain. Usually this disease can be identified by symptoms of paralysis of some body part or difficulty using a human sensory. According to the experts, this disease must be prevented early because it can be fatal to the overall functional body. One of the actions that can be done early is to detect the possibility of a disease so that it can be handled appropriately and quickly. In this study, the cerebral infarction was detected by classifying the presence or absence of abnormal cells in brain tissue in the results of a CT brain scan of patients using Support Vector Machine with the RELIEF Selection Feature. The data used in the form of numerical data reports from patients who performed examinations at the RSUPN dr. Cipto Mangunkusumo Jakarta in the form of brain CT Scan. There are nine indicator features that are used and processed by comparing Support Vector Machine with and without RELIEF feature selection. Based on the results, the proposed method is able to achieve accuracy value of 95,23%. Thus, the use of RELIEF feature selection with SVM is a good method for classifying cerebral infarction.
"
Stroke merupakan salah satu penyakit dengan risiko kematian dan kecacatan yang tinggi. Secara umum, stroke diklasifikasikan menjadi dua jenis, yaitu stroke iskemik dan stroke hemoragik. Klasifikasi jenis stroke secara cepat dan tepat diperlukan untuk menentukan jenis pengobatan dan tindakan yang tepat guna mencegah terjadinya dampak yang lebih fatal pada pasien stroke. Pada penelitian ini, klasifikasi stroke dilakukan menggunakan pendekatan machine learning. Adapun data penelitian yang digunakan adalah data stroke yang terdiri atas pemeriksaan laboratorium. Pada data penelitian tersebut, terdapat berbagai komponen pemeriksaan laboratorium yang dicatat serta memungkinkan adanya suatu pemeriksaan yang kurang relevan atau informatif dalam mengklasifikasi stroke. Apabila data tersebut tidak ditangani, akan mempengaruhi kinerja serta waktu komputasi model dalam mengklasifikasi stroke. Oleh karena itu, pada penelitian ini, Random Forest (RF) dengan seleksi fitur Recursive Feature Elimination (RFE) digunakan dalam mengklasifikasi data stroke. Dengan menerapkan metode tersebut, diperoleh kinerja model yang lebih baik saat melakukan klasifikasi menggunakan sejumlah fitur yang diperoleh dari hasil seleksi fitur, dibandingkan menggunakan keseluruhan fitur dalam data stroke. Selain itu, pada penerapan metode tersebut, diperoleh kinerja model yang baik dalam mengklasifikasi data kelas stroke iskemik, akan tetapi tidak cukup baik dalam mengklasifikasi data kelas stroke hemoragik. Hal ini dikarenakan proporsi jumlah data pada kelas stroke iskemik lebih banyak dibandingkan stroke hemoragik. Dalam hal ini dibutuhkan suatu metode penanganan agar kinerja model tetap optimal dalam mengklasifikasi data kelas stroke iskemik dan stroke hemoragik. Pada penelitian ini, Synthetic Minority Oversampling Technique (SMOTE) digunakan untuk menyeimbangkan kedua kelas data stroke guna memperoleh kinerja model yang optimal dalam mengklasifikasi kedua kelas data stroke. Berdasarkan penerapan metode RF dengan RFE serta SMOTE dalam mengklasifikasi data stroke, diperoleh kinerja model yang lebih baik dibandingkan melakukan klasifikasi pada data stroke yang tidak diseimbangkan dengan SMOTE.
Stroke is one of the diseases with the high risk of death and disability. Stroke generally can be classified into two types, namely ischemic stroke and hemorrhagic stroke. A quick and accurate stroke classification is needed to find the right treatment to prevent a dangerous effect on the stroke patients. In this study, the stroke classification was applied using a machine learning approach. The data used in this study is stroke data that consists of laboratory examinations. The data consists of various laboratory examination components, therefore, it might be possible that some of the components are less relevant and has less informative related in classifying stroke. If the data is not well handled, it might affect the performance and computation time of the model in classifying stroke. Therefore, in this study, Random Forest (RF) with Recursive Feature Elimination (RFE) method is used to classify the stroke data. The result showed that by applying the method in classifying several amounts of features obtained from the feature selection results has better performance rather than classifying the method using all features in stroke data. Moreover, based on applying this method, the result showed that the model has better performance in classifying ischemic stoke class data but not good enough in classifying hemorrhagic stroke class data. This result might occur because the proportion of numbers the ischemic stroke more than hemorrhagic stroke class data. Therefore, the handling method is needed to obtain optimal model performance in classifying ischemic stroke and hemorrhagic stroke class data. In this study, Synthetic Minority Oversampling Technique (SMOTE) is applied to balance the two classes of stroke data so optimal performance of the classification model can be obtained. Based on the application of the RF with RFE methods and SMOTE in the classification of stroke data, better model performance is obtained compared to classifying the stroke data that is not balanced with SMOTE.
"