Retinopati diabetik merupakan salah satu bentuk komplikasi diabetes melitus yang diekspresikan dengan adanya kerusakan pada pembuluh darah retina mata. Pada tahap awal, retinopati diabetik seringkali tidak menimbulkan gejala atau hanya menimbulkan gejala yang ringan. Namun, jika tidak mendapatkan penanganan yang baik, retinopati diabetik dapat menyebabkan kebutaan. Maka dari itu, akses skrining yang terjangkau menjadi esensial untuk mencegah efek jangka panjang dari penyakit ini. Penelitian ini berfokus pada pengembangan sistem deteksi retinopati diabetik berbasis
deep learning yang bertujuan untuk meningkatkan aksesibilitas terhadap skrining retinopati diabetik. Model deteksi yang dibuat dalam penelitian ini yaitu model model berbasis
Vision Transformer (ViT) B32 yang dibandingkan performanya dengan model
convolutional neural network (CNN) berarsitektur DenseNet-121 dan. Model DenseNet-121 yang dilatih menggunakan gambar yang di-
pre-process dengan teknik Ben Graham dan datanya di
upsample memiliki performa terbaik dibandingkan teknik lainnya yang diteliti penelitian ini. Teknik
pre-processing yang menghasilkan model CNN terbaik itu kemudian diimplementasikan pada model ViT untuk dibandingkan. Selain mengungguli model CNN, model ViT juga berhasil mengungguli model
state of the art yang ada dengan nilai
accuracy, precision, recall, dan
f1-score masing-masing senilai 96%. Model ViT ini kemudian diintegrasikan dengan
graphical user interface (GUI) untuk memudahkan dokter dalam memanfaatkan model yang diusulkan untuk skrining retinopati diabetik.
Diabetic retinopathy is a complication of diabetes mellitus characterized by damage to the blood vessels of the retina. In its early stages, diabetic retinopathy often does not present symptoms or only causes mild symptoms. However, without proper treatment, diabetic retinopathy can lead to blindness. Therefore, affordable screening access is essential to prevent the long-term effects of this disease. This research focuses on the development of a deep learning-based detection system for diabetic retinopathy, aiming to enhance the accessibility of diabetic retinopathy screening. The detection model developed in this study is based on the Vision Transformer (ViT) B32 model, and its performance is compared with the DenseNet-121 convolutional neural network (CNN) architecture. The DenseNet-121 model, trained using images pre-processed with the Ben Graham technique and upsampled data, showed the best performance compared to other techniques investigated in this study. The pre-processing technique that yielded the best CNN model was then implemented on the ViT model for comparison. In addition to outperforming the CNN model, the ViT model also surpassed the existing state-of-the-art models with an accuracy, precision, recall, and F1-score of 96% each. This ViT model was subsequently integrated with a graphical user interface (GUI) to facilitate doctors in utilizing the proposed model for diabetic retinopathy screening.