Sistem klasifikasi diabetes sangat berguna di bidang kesehatan. Dataset Pima Indian Diabetes (PID) digunakan untuk melatih dan mengevaluasi algoritma ini. Rentang nilai yang tidak seimbang pada atribut mempengaruhi kualitas hasil klasifikasi, sehingga perlu dilakukan preprocess data yang diharapkan dapat meningkatkan akurasi dari dataset hasil klasifikasi PID. Dua jenis metode yang digunakan yaitu normalisasi min-max dan normalisasi z-score. Kedua metode normalisasi ini digunakan dan akurasi klasifikasi dibandingkan. Sebelum dilakukan proses klasifikasi data, data dibagi menjadi data latih dan data uji. Hasil pengujian klasifikasi menggunakan algoritma K-Means menunjukkan bahwa akurasi terbaik terletak pada dataset PID yang telah dinormalisasi menggunakan metode normalisasi min-max, yaitu 79% dibandingkan dengan normalisasi z-score.
The diabetes classification system is very useful in the health sector.. The Pima Indian Diabetes (PID) dataset is used to train and evaluate this algorithm. The unbalanced value range in the attributes affects the quality of the classification result, so it is necessary to preprocess the data which is expected to improve the accuracy of the PID dataset classification result. Two types methods are used that are min-max normalization and z-score normalization. These two normalization methods are used and the classification accuracies are compared. Before the data classification process is carried out, the data is divided into training data and test data. The result of the classification test using the K-Means algorithm has shown that the best accuracy lies in the PID dataset which has been normalized using the min-max normalization method, which 79% compared to z-score normalization