Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 172132 dokumen yang sesuai dengan query
cover
Ahmad Fahrezi
"Kanker prostat merupakan salah satu penyakit yang menjadi penyebab kematian utama di kalangan pria. Deteksi dini melalui pemindaian medis dapat membantu dalam pengobatan dan penanganan yang efektif. Namun, interpretasi dari pemindaian ini seringkali sulit dan memerlukan keahlian klinis yang tinggi oleh para ahli patologi. Selain itu keterbatasan dataset publik dengan bentuk biopsi H&E dengan anotasi level biopsy hinggal level patch yang tersedia terbatas jumlahnya sehingga menyebabkan pelatihan machine learning menjadi lebih sulit. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan dataset dengan model machine learning yang dapat membantu mengimprove model machine learning pengklasifikasi kanker prostat. Model machine learning yang digunakan untuk mengembangkan dataset dalam penelitian ini adalah conditional Progressive Growing GAN (ProGleason-GAN), sebuah jenis jaringan saraf tiruan yang dapat digunakan untuk mempelajari dan menghasilkan gambar sintetis dari pemindaian prostat yang telah menunjukkan hasil yang menjanjikan dalam generasi gambar sintetis beresolusi tinggi. Dataset yang ditambahkan dengan hasil gambar sintesis ProGleason-GAN digunakan untuk melatih model klasifikasi kanker prostat yaitu Semi Supervised Learning yang di gabungkan dengan Multiple Instance Learning. Dataset yang yang berisikan dataset SICAPv2 yang ditambahkan dengan hasil augmentasi ProGleason-GAN dinamakan SICAPv2 augmented. Penulis juga mengembangkan model klasifikasi dengan penambahan batch normalization yang dimana memungkinkan setiap batch data yang diberikan ke jaringan untuk dinormalisasi terlebih dahulu sebelum diolah lebih lanjut oleh jaringan. Ketika model klasifikasi ditambahkan dengan batch normalization serta dilatih dengan SICAPv2 augmented , maka nilai accuracy yang dihasilkan sebesar 76% lebih tinggi 4% model acuan.

Prostate cancer is a disease that is the main cause of death among men. Early detection through medical scanning can help in effective treatment and management. However, interpretation of these scans is often difficult and requires a high degree of clinical skill by pathologists. In addition, the limited number of available public datasets in the form of H&E biopsies with biopsy level to patch level annotations makes machine learning training more difficult. Therefore, this research aims to develop a dataset with a machine learning model that can help improve machine learning models for prostate cancer classification. The machine learning model used to develop the dataset in this research is Conditional Progressive Growing GAN (ProGleason-GAN), a type of artificial neural network that can be used to learn and generate synthetic images from prostate scans which has shown promising results in the generation of high-resolution synthetic images. tall. The dataset added with the ProGleason-GAN synthetic image results is used to train a prostate cancer classification model, namely Semi Supervised Learning combined with Multiple Instance Learning. The dataset containing the SICAPv2 dataset added with the results of ProGleason-GAN augmentation is called SICAPv2 augmented. The author also developed a classification model with the addition of batch normalization, which allows each batch of data given to the network to be normalized first before being further processed by the network. When the classification model was added with batch normalization and trained with augmented SICAPv2, the resulting accuracy value was 76%, 4% higher than the reference model."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Fitriani
"Kinerja mahasiswa adalah bagian penting dari suatu perguruan tinggi. Hal ini dikarenakan salah satu kriteria  perguruan tinggi yang berkualitas didasarkan pada  prestasi akademik yang baik. Tahun pertama perkuliahan adalah periode mahasiswa untuk meletakkan dasar atau fondasi yang selanjutnya akan mempengaruhi keberhasilan akademik karena tahun pertama memainkan peran penting dalam membentuk sikap dan kinerja siswa di tahun-tahun berikutnya. Pada Penelitian ini, pendekatan Semi-supevised Learning digunakan dalam mengklasifikasi kinerja mahasiswa tahun pertama di Departemen Matematika, Universitas Indonesia. Kinerja Mahasiswa dibagi menjadi dua kategori, yaitu sedang dan tinggi. Sampel pada penelitian ini adalah 140 mahasiswa tahun pertama dengan menggunakan 27 fitur. Ada dua proses yang digunakan, yaitu proses clustering dan klasifiksi. Pada proses clustering, mahasiswa dibagi menjadi tiga cluster/kelompok menggunakan K-Means Clustering. Sedangkan dalam proses klasifikasinya menggunakan Naïve Bayes Classifier. Kinerja algoritma yang diusulkan menghasilkan nilai akurasi 96.67% dan sensitifitas 94.44%.

Students performance is an essential part of a higher learning institution because one of the criteria for a high-quality university is based on its excellent record of academic achievements. The first- year of the lecture is the student period in laying the foundation that will affect academic success because first-year plays an important role in shaping the attitudes and performance of students in the following years. In this study, a semi-supervised learning approach is used to classify the performance of first-year students in the Department of Mathematics, Universitas Indonesia. Student performance will be divided into two categories, namely medium and high. The sample in this study consist of 140 first-year students with 27 features. There are two processes used i.e. clustering and the classification process. In the clustering process, the data is divided into three clusters using K-Means Clustering and the Naïve Bayes Classifier is chosen to classify it. The performance of the proposed algorithms is stated by accuracy and sensitivity value i.e. 96.67% and 94.44% respectively."
Depok: Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Bella Septina Ika Hartanti
"Bencana banjir merupakan salah satu peristiwa alam yang sering terjadi di dunia, termasuk Indonesia, dan terjadi ketika aliran air yang berlebihan menggenangi daratan dalam jangka waktu tertentu. Perubahan iklim, cuaca ekstrem, urbanisasi yang tidak terkendali, dan kondisi geografis yang kompleks telah berkontribusi terhadap peningkatan frekuensi dan intensitas banjir, terutama di daerah perkotaan. Analisis banjir otomatis dan deteksi citra dapat memberikan panduan dan informasi yang berguna dalam membuat keputusan untuk mengurangi dampak destruktif seperti korban jiwa dan ekonomi, salah satunya dengan melakukan segmentasi untuk membantu proses pembuatan peta kerawanan banjir. Namun, sejumlah kecil data beresolusi tinggi dan berlabel yang tersedia membuat proses segmentasi sulit untuk dilakukan. Oleh karena itu, penulis mengusulkan pendekatan semi-supervised yaitu mean teacher dengan memanfaatkan teknik deep learning. Adapun dataset yang digunakan adalah citra SAR Sentinel-1 C-band yang telah diolah sebelumnya. Hasil penelitian menunjukkan bahwa model usulan memberikan kenaikan performa yang cukup signifikan pada metrik IoU sebesar 5% terhadap baseline yang mengimplementasikan teknik pseudo-labeling.

Floods are one of the natural disaster events that occur in the world. Floods happen when excessive water flows and submerges land for a certain period of time. Climate change, extreme weather, uncontrolled urbanization, and complex geographical conditions have contributed to the increase in the frequency and intensity of floods, especially in urban areas. Automatic flood analysis and detection of imagery can provide useful guidance and information in making decisions to reduce destructive impacts such as loss of life and economy. However, the small amount of high-resolution and labeled data available makes the segmentation process difficult for flood detection. Therefore, the author proposes a semi-supervised approach, namely mean teacher by utilizing the deep learning architecture. The dataset used is the SAR image of Sentinel-1 C-band which has been processed. The results show that the proposed model provides a significant increase in performance on the IoU metric by 5% against the baseline that implements the pseudo-labeling technique."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Iffa Maula Nur Prasasti
"Asuransi mobil adalah produk asuransi yang banyak digunakan di Indonesia. Namun, asuransi mobil memiliki potensi untuk kecurangan klaim yang menyebabkan kerugian bagi perusahaan dan pemegang polis. Penelitian ini bertujuan untuk merancang model prediksi deteksi kecurangan asuransi mobil di Indonesia menggunakan pendekatan machine learningSupervised classifiers adalah salah satu teknik machine learning yang memiliki kemampuan untuk memprediksi kasus-kasus anomali. Supervised classifiers yang digunakan pada penelitian ini adalah Multilayer Perceptron (MLP), Decision Tree C4.5, dan Random Forest (RF). Penelitian ini menggunakan data real-world pada perusahaan asuransi mobil di Indonesia. Dataset memiliki distribusi tidak seimbang yang sangat tinggi antara data pemegang polis yang melakukan kecurangan dan pemegang polis yang sah. Penelitian ini menangani masalah dataset yang tidak seimbang dengan menggunakan Synthetic Minority Oversampling Technique (SMOTE) dan metode undersampling. Kinerja model dievaluasi melalui confusion matrix, Kurva ROC, dan parameter seperti sensitivitas. Penelitian ini menemukan bahwa Random Forest memberikan hasil terbaik dibandingkan dengan MLP dan Decision Tree C4.5.

Automobile insurance is widely used insurance product in Indonesia. However, automobile insurance has the potential for  fraudulent claim that leads to several consequences for the company and policyholder. This research aims to design a prediction model of automobile insurance fraud detection in Indonesia using a machine learning approach. Supervised classifiers is one of machine learning techniques that has the ability to predict anomaly cases. The proposed supervised classifiers are Multilayer Perceptron (MLP), Decision Tree C4.5, and Random Forest(RF). This research used real-world data on an automobile insurance company in Indonesia. The dataset has a high imbalanced distribution between the data of policyholders who commit fraud and legitimate. This study handles the imbalanced dataset problem by using the Synthetic Minority Oversampling Technique (SMOTE) and undersampling methods. The performance of models is evaluated through the confusion matrix, ROC Curve, and parameters such as sensitivity. This research found that Random Forest outperformed the results comparing to other classifiers."
Depok: Fakultas Teknik Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Tahtia Anharani Sazwara
"Real Estate Investment Trust (REIT) membentuk akses yang lebih mudah dan inklusif ke pasar investasi properti dan memberikan hasil yang lebih stabil dengan resiko lebih rendah relatif dengan direct investment berkat aturan yang mengharuskan minimum 90% dari pendapatan pajak REIT diberikan sebagai dividen. Di sisi lain, penggunaan machine learning dalam memprediksi variabel keuangan kunjung meningkat dalam popularitas dikarenakan efisiensi dan akurasi yang tinggi. Studi ini memanfaatkan algoritma machine learning dalam menemukan prediktor terbaik yang menjadi faktor harga saham REIT. Makalah ini menemukan hubungan signifikan antara nilai buku perusahaan dan hasil dividen terhadap return saham REIT, walaupun tidak dalam arah yang sama dengan literatur lampau terkait.

Real Estate Investment Trust (REIT) opens the door for easier and more inclusive access to the real estate investment market and provides stable, low risk returns thanks to the ruling where at least 90% of a REIT's taxable income must be given out as dividends. On the other hand, the use of machine learning in forecasting finance variables has always been increasing in popularity due to its ability to cut down processing time and its high accuracy. This study is aimed to utilize machine learning algorithms to find the best predictors for REIT returns. This paper found significant relationship between company’s book value and its dividend yield towards its stock returns, although not in the same direction as the literature suggests.
"
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2023
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Syarifah Dina Meutia
"Kanker leher rahim atau kanker serviks merupakan penyakit kanker yang paling banyak menyerang wanita di negara berkembang, termasuk Indonesia. Salah satu cara pencegahannya adalah dengan melakukan test Pap-Smear. Sel serviks hasil test Pap-Smear tersebut kemudian didiagnosa oleh dokter Patologi Anatomi. Namun dokter Patologi Anatomi tidak selalu ada di semua wilayah, terutama di daerah terpencil. Untuk memungkinkan diagnosa pasien di daerah terpencil yang jarang ditemukan dokter Patologi Anatomi, diperlukan suatu upaya untuk mengotomatiskan diagnosa terhadap hasil test Pap-Smear, sehingga dapat dilakukan diagnosa jarak jauh (telemedicine).
Penelitian ini bertujuan untuk melakukan diagnosa terhadap citra hasil test Pap-Smear, yaitu dengan menggunakan Algoritma Multiflaktal yang dikombinasi dengan Adaptive Multiple Thresholding sebagai metode segmentasi secara otomatis dan Jaringan Syaraf Tiruan menggunakan Learning Vector Quantization (LVQ) sebagai metode klasifikasi dengan nilai intensitas dari citra hasil segmentasi sebagai cirinya. Performa dari hasil segmentasi akhir, tingkat ketelitiannya sekitar 70%. Hasil klasifikasi dengan LVQ terhadap tujuh kelas tingkat pengenalannya masih di bawah 40%, sedangkan tingkat pengenalan terhadap dua kelas mampu mencapai sekitar 82%.

Cervix cancer is the most cancer disease that attact women in the developing country, include Indonesia. One of the way of its prevention is by a PapSmear test Cervix cells that resulted from Pap-Smear test then diagnosed by a Pathology of Anatomy doctor. But Pathology of Anatomy doctor is not always in all area. To enable diagnosa patient in purilieus which seldom be found Pathology of Anatomy doctor, needed an effort, so that can be conducted by long distance diagnosa (telemedicine).
This research aims to conduct diagnose the image result of Pap-Smear test, and keep involve Multifractal Algorithm which is combined with Adaptive Multiple Thresholding as segmentation method automatically, and Artiflcial Neural Network using Leaming Vector Quantization (LVQ) as clssification method with intensity value from segmentation image as its feature. The performance in segmentation and increasing quality result, the correctness about 70%. The result of classification using LVQ toward seven classes, its recognition is less than 40%, meanwhile the recognition rate of two classes about 82%.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
T26451
UI - Tesis Open  Universitas Indonesia Library
cover
Hasnan Fiqih
"Hampir separuh dunia bergantung pada makanan yang berasal dari laut sebagai sumber protein utama. Di Pasifik Barat dan Tengah 60% dari ikan tuna ditangkap secara illegal, tidak dilaporkan, dan tidak diatur dengan regulasi dapat mengancam ekosistem laut, pasokan ikan global, dan mata pencaharian lokal. Salah satu solusi yang dapat dilakukan adalah dengan menggunakan kamera keamanan untuk menangkap gambar aktivitas kapal. Pada penelitian ini akan dibuat sistem untuk mengklasifikasi jenis ikan yang ditangkap dari gambar kamera keamanan kapal tersebut. Sistem ini menggunakan model transfer learning yang sudah dilakukan fine tuning dan dilatih menggunakan dataset yang disediakan oleh The Nature Conservancy. Dari penelitian ini didapatkan performa terbaik dengan akurasi 98.19% menggunakan model EfficientNetV2L dan optimizer Stochastic Gradient Descent (SGD) dengan learning rate 1e-4, momentum 0.9, weight decay 1e-6, dan split ratio training testing 80/20. Dengan sistem ini pengolahan data untuk menghitung jumlah penangkapan ikan berdasarkan spesies akan lebih efisien.

Almost half of the world depends on food that comes from the sea as the main source of protein. In the West and Central Pacific 60% of tuna fish are caught illegally, unreported and unregulated, threatening marine ecosystems, global fish supplies and local livelihoods. One possible solution is to use a security camera to capture images of ship activity. In this study a system will be created to classify the types of fish caught from the ship's security camera images. This system uses a transfer learning model that has been fine tuned and trained using the dataset provided by The Nature Conservancy. From this study, the best performance was obtained with an accuracy of 98.19% using the EfficientNetV2L model and the Stochastic Gradient Descent (SGD) optimizer with a learning rate of 1e-4, momentum of 0.9, weight decay of 1e-6, and split ratio training testing of 80/20. With this system, data processing to calculate the amount of fish caught by species will be more efficient.
"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hadi Nursalim
"Salah satu organ tubuh yang paling penting adalah jantung. Darah dapat didistribusikan dengan baik ke seluruh tubuh jika terdapat jantung. Organ lain akan berhenti bekerja dan orang tersebut akan meninggal jika jantung di dalam tubuh tidak berfungsi dengan baik. Salah satu jenis penyakit jantung adalah terjadinya gejala arrhythmia, yaitu suatu bentuk kondisi jantung yang ditandai dengan laju atau irama detak jantung. Detak jantung bisa lebih cepat dari biasanya, atau terlalu lambat, atau bahkan memiliki pola yang tidak teratur. Metode yang paling umum dan banyak digunakan oleh ahli jantung dan praktisi medis untuk memantau dan mendeteksi penyakit atau kelainan pada jantung adalah dengan menggunakan elektrokardiogram (EKG) yang dianalisis secara manual, sehingga dapat memakan waktu yang lama dan rentan terhadap kesalahan. Penerapan Artificial Intelligence diharapkan mampu memberikan peranan penting dalam mempercepat kinerja kardiologi. Dalam penelitian ini digunakan Model CNN dengan Arsitektur ResNet-50 untuk mengklasifikasikan detak jantung normal dan detak jantung beberapa jenis arrhythmia yang akan divisualisasikan dengan algoritma Grad-CAM. Dari hasil eksperimen pengklasifikasian, didapatkan tingkat akurasi rata-rata sebesar 94% dan meningkat menjadi 99% untuk setiap kelas setelah dilakukan visualisasi dengan menggunakan algoritma Grad-CAM.

One of the most important organs of the body is the heart. Blood can be well distributed throughout the body if there is a heart. Other organs will stop working and the person will die if the heart in the body is not functioning properly. One type of heart disease is the occurrence of symptoms of arrhythmia, which is a condition in which the heartbeat rate is too fast, to slow, or irregular. Currently, the most common and widely used method by cardiologists and other medical practitioners to monitor and detect diseases or abnormalities in the heart is to use an electrocardiogram (ECG), which is analyzed manually. where the task can take a long time and is prone to errors. The application of Artificial Intelligence is expected to play an important role in accelerating the performance of cardiologists. In this study, a CNN model with ResNet-50 architecture was used to classify normal heart rates and heart rates of several types of arrhythmia that would be visualized with the Grad-CAM algorithm. From the results of the classification experiment, an average accuracy rate of 94% was obtained and increased to 99% for each class after visualization using the Grad-CAM algorithm."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Arief Pratama
"Sebagai salah satu industri terbesar di dunia, pemasaran fashion pada platform ecommerce menarik jutaan pengguna setiap harinya. Salah satu fitur yang penting untuk dimiliki platform ecommerce adalah kemampuan mencari produk fashion menggunakan foto pengguna sebagai query. Hasil pencarian yang akurat akan memberikan manfaat bagi pengguna dan bagi pelaku bisnis. Persoalan ini sangat menantang karena adanya perbedaan domain antara citra query yang diunggah pengguna dengan citra galeri produk yang menjadi target pencarian. Perolehan citra lintas domain dapat diselesaikan dengan metode konvensional seperti pemelajaran metrik menggunakan dataset berlabel. Namun metode ini tidaklah feasible dalam jangka panjang mengingat selalu bertambahnya inovasi di bidang fashion sehingga dibutuhkan anotasi terhadap citra yang berkesinambungan agar model tetap relevan. Pada penelitian ini diusulkan penggunaan self-supervised learning untuk meningkatkan kebermanfaatan data tanpa label dan mengurangi ketergantungan terhadap data berlabel. Pelatihan dengan metode ini menghasilkan sebuah encoder CNN dengan arsitektur ResNet-50, yang dilatih dengan sekumpulan citra tidak berlabel, agar mampu menghasilkan fitur umum dari citra. Model ini kemudian di-finetune dengan data berlabel agar mampu melakukan downstream task, yaitu perolehan citra lintas domain. Untuk meningkatkan hasil perolehan, dilakukan structural matching menggunakan Wasserstein distance (optimal transport) terhadap fitur spasial luaran encoder CNN pada saat inference dan finetuning. Selain itu, structural matching juga dapat menjelaskan bagian mana dari citra yang berkontribusi atas keseluruhan kesamaan atau jarak. Hasil menunjukkan bahwa kinerja encoder yang dilatih dengan self-supervised learning secara kuantitatif masih belum melampaui kinerja encoder baseline ImageNet, dengan perbedaan 1-2% dari sisi akurasi dan mAP menggunakan Triplet Loss, dan 6-10% dengan InfoNCE. Structural matching secara umum dapat meningkatkan hasil perolehan pada encoder yang dilatih dengan self-supervised learning. Hasil kualitatif menunjukkan bahwa semua varian model mampu mencari citra yang mirip dengan query, baik dari sisi kategori, warna, bentuk, dan motif.

Being one of the largest industries in the world, fashion marketing on ecommerce platforms attracts millions of users every day. One of the essential features for an ecommerce platform is the ability to retrieve fashion items using user photos as queries. Good search results will yield benefits for users and for businesses. This problem is challenging due to the domain differences of the query images uploaded by the users and of product gallery images as retrieval targets. Cross-domain image retrieval can be accomplished by conventional methods such as metric learning using labeled datasets. However, this method is not feasible in the long term since innovations in this sector are fast such that continuous image annotations are required for the model to stay relevant. In this study, we propose to use self-supervised learning to increase usefulness of unlabeled data and to reduce dependency on labeled data. Training with this method produces a CNN encoder with ResNet-50 architecture, trained on a collection of unlabeled images, to infer generic features of images. The model is then finetuned with labeled data so that it can perform the downstream task, which is cross-domain image retrieval. To improve retrieval results, we performed structural matching by calculating Wasserstein distance (optimal transport) using spatial features inferred from CNN encoder during inference and finetuning. In addition, structural matching can also explain which parts of two images contribute to overall similarity or distance. Results show that an encoder trained with self-supervision quantitatively has not yet outperformed off-the-shelf ImageNet encoder baseline, with a difference in terms of accuracy and mAP of 1-2% for Triplet Loss, and 6-10% for InfoNCE. Generally, structural matching can improve retrieval results for self-supervised encoders. Qualitative results show that all model variants are able to retrieve images similar to the query, in terms of categories, colors, shapes, and patterns."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Raisha Zhafira
"Berdasarkan Global Cancer Observatory (GLOBOCAN), tumor otak diestimasikan berada di urutan ke-19 sebagai tumor yang paling umum terjadi dan ke-12 sebagai penyebab utama kematian akibat kanker di dunia pada tahun 2020. Walaupun begitu, informasi terkait epidemiologi tumor otak di Indonesia masih sangat terbatas. Belum diwajibkannya pendataan kasus tumor di Indonesia merupakan salah satu alasannya. Tumor otak dapat dideteksi menggunakan pencitraan medis, seperti computed tomography (CT) scan dan magnetic resonance imaging (MRI). Deteksi dini tumor otak merupakan hal yang penting karena dapat meningkatkan tingkat keberlangsungan hidup dari pasien. Saat ini, banyak perkembangan teknologi yang dapat dimanfaatkan untuk membantu kehidupan manusia, salah satunya adalah deep learning (DL). Akan tetapi, data medis merupakan data yang sensitif, sehingga menjadi salah satu tantangan dalam penerapan DL di bidang kesehatan. Untuk mengatasi privasi dan keterbatasan data, terdapat metode federated learning (FL) yang memungkinkan untuk dilakukannya pelatihan data lokal pada klien tanpa menyebarkan data klien tersebut. Pada penelitian ini, akan dibentuk simulasi klasifikasi tumor otak menggunakan DL berbasis FL. Tujuan utama dari penelitian ini adalah untuk menganalisis performa model yang dihasilkan dari federated learning dan membandingkannya dengan metode training konvensional. Terdapat empat cycle data dengan tiga cycle berasal dari dataset pertama (M. Nickparvar) dan satu cycle dari dataset kedua (J. Cheng). Hasil akurasi dan F1-score tertinggi dari simulasi federated didapatkan pada epoch (jumlah putaran pelatihan data pada tiap klien) 15 dan round (jumlah putaran mulai dari tahap pembagian parameter model global kepada klien sampai dengan agregasi model) 15, yaitu 0.8375 dan 0.8384 (cycle 1), 0.7625 dan 0.7567 (cycle 2), 0.8375 dan 0.8308 (cycle 3), serta 0.7333 dan 0.7255 (dataset 2). Hasil akurasi dan F1-score tertinggi dari simulasi standard pelatihan lokal pada tiap cycle adalah 0.75 dan 0.7568 (cycle 1), 0.6875 dan 0.6677 (cycle 2), 0.675 dan 0.6744 (cycle 3), serta 0.7222 dan 0.7085 (dataset 2). Hasil akurasi dan F1-score tertinggi dari simulasi standard pelatihan all data pada tiap cycle adalah 0.7625 dan 0.7644 (cycle 1), 0.6875 dan 0.6723 (cycle 2), 0.775 dan 0.7766 (cycle 3), serta 0.6 dan 0.5355 (dataset 2). Berdasarkan pengujian hasil simulasi, korelasi epoch dan round terhadap performa model signifikan pada dataset kedua (Pacc-epoch = 0.019; PF1-epoch = 0.006; Pacc-round = 0.008; PF1-round = 0.025), tetapi hanya korelasi round yang signifikan pada dataset pertama (cycle 1 Pacc-round < 0.001 dan PF1-round < 0.001; cycle 2 Pacc-round = 0.004 dan PF1-round = 0.003; cycle 3 Pacc-round < 0.001 dan PF1-round < 0.001). Selain itu, performa model global hasil federated learning lebih baik daripada performa model lokal dan model pelatihan standard. Tidak ditemukan perbedaan signifikan antara performa model dataset pertama dengan cycle yang berbeda (Pacc between cycles = 0.679; PF1 between cycles = 0.770) serta tidak ditemukan juga perbedaan signifikan antara performa model dataset pertama dan kedua (Pacc cycle 1-dataset 2 = 0.103; Pacc cycle 2-dataset 2 = 0.334; Pacc cycle 3-dataset 2 = 0.103; PF1 cycle 1-dataset 2 = 0.140; PF1 cycle 2-dataset 2 = 0.120; Pacc cycle 3-dataset 2 = 0.140).

Based on the Global Cancer Observatory (GLOBOCAN), brain tumors are estimated to rank 19th among the most common tumors and 12th as the leading cause of cancer-related deaths worldwide in 2020. However, information regarding the epidemiology of brain tumors in Indonesia remains very limited. One reason is that case registration for tumors is not yet mandatory in Indonesia. Brain tumors can be detected using medical imaging, such as computed tomography (CT) scan and magnetic resonance imaging (MRI). Early detection of brain tumors is crucial as it can improve the survival rates of patients. Currently, many technological advancements can be utilized to aid human life, one of which is deep learning (DL). However, medical data is sensitive, presenting a challenge in applying DL in healthcare. To address privacy and data limitation problems, there is a method called federated learning (FL) that enables local data training on clients without sharing the clients' data. This study aims to simulate brain tumor classification using DL based on FL. The main objective of this research is to analyze the performance of the model generated from federated learning and compare it with conventional training methods. There are four data cycles, with three cycles from the first dataset (M. Nickparvar) and one cycle from the second dataset (J. Cheng). The highest accuracy and F1-score from the federated simulation were achieved at epoch (number of training rounds on each client) 15 and round (number of rounds starting from the global model parameter distribution to the clients until model aggregation) 15, which are 0.8375 and 0.8384 (cycle 1), 0.7625 and 0.7567 (cycle 2), 0.8375 and 0.8308 (cycle 3), and 0.7333 and 0.7255 (dataset 2). The highest accuracy and F1-score from the standard local training simulation in each cycle are 0.75 and 0.7568 (cycle 1), 0.6875 and 0.6677 (cycle 2), 0.675 and 0.6744 (cycle 3), and 0.7222 and 0.7085 (dataset 2). The highest accuracy and F1-score from the standard all data training simulation in each cycle are 0.7625 and 0.7644 (cycle 1), 0.6875 and 0.6723 (cycle 2), 0.775 and 0.7766 (cycle 3), and 0.6 and 0.5355 (dataset 2). Based on the simulation, the correlation between epoch and round on model performance is significant in the second dataset (Pacc-epoch = 0.019; PF1-epoch = 0.006; Pacc-round = 0.008; PF1-round = 0.025), but only the round correlation is significant in the first dataset (cycle 1 Pacc-round < 0.001 and PF1-round < 0.001; cycle 2 Pacc-round = 0.004 and PF1-round = 0.003; cycle 3 Pacc-round < 0.001 and PF1-round < 0.001). Moreover, the performance of the global model resulting from federated learning is better than the local model performance and standard all data training model performance. No significant difference was found between the performance of the first dataset with different cycles (Pacc between cycles = 0.679; PF1 between cycles = 0.770) nor between the performance of the first and second datasets (Pacc cycle 1-dataset 2 = 0.103; Pacc cycle 2-dataset 2 = 0.334; Pacc cycle 3-dataset 2 = 0.103; PF1 cycle 1-dataset 2 = 0.140; PF1 cycle 2-dataset 2 = 0.120; Pacc cycle 3-dataset 2 = 0.140)."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>