Salah satu poin penilaian akreditasi universitas adalah jumlah mahasiswa yang lulus tepat waktu dan mahasiswa yang drop-out (DO). Sayangnya, potensi terjadinya mahasiswa terlambat lulus atau drop out masih menjadi tantangan bagi Universitas Kristern Krida Wacana (UKRIDA). Untuk dapat melakukan tindakan mitigasi dan menyusun strategi retensi, perlu dilakukan prediksi terhadap mahasiswa yang berpeluang DO dan terlambat lulus menggunakan data informasi akademik. Hal tersebut dilakukan untuk membantu proses pengecekan mahasiswa DO yang sebelumnya masih manual. Selain itu, faktor informasi akademik apa saja yang memengaruhi hasil prediksinya. Model yang dibangun menggunakan algoritma-algoritma yang diantaranya Logistic Regression, Nave Bayes, Support Vector Machine (SVM), Decision Tree, Random Forest, dan Gradient Boosting. Hasilnya data yang digunakan untuk mendeteksi mahasiswa DO berhasil mencapai 99,42% pada metric precision dan 98,58% pada average precision. Data yang digunakan untuk mendeteksi mahasiswa terlambat lulus berhasil mencapai 78,51% pada metric precision dan AUC 82,86%. Faktor-faktor yang memengaruhi mahasiswa DO adalah status bayar karena terdapat mahasiswa yang hutang terprediksi DO, IPK dengan rata-rata dibawah 2 diprediksi DO, jumlah ulang mata kuliah di atas 1, tidak KRS di atas 2. Namun pada deteksi mahasiswa terlambat lulus, faktor-faktor yang memengaruhi hal tersebut adalah terdapat data yang lebih dari 1 Tidak KRS dan 24 kali mengulang mata kuliah serta dengan status bayar Hutang. One of the points of university accreditation assessment is the number of students who graduate on time and drop-out students (DO). Unfortunately, the potential for students to graduate late or drop out is still a challenge for Kristern Krida Wacana University (UKRIDA). To be able to take mitigation actions and develop retention strategies, it is necessary to predict students who are likely to drop out and graduate late using academic information data. This was done to help the process of checking DO students which was previously still manual. In addition, what academic information factors affect the prediction results. The model is built using algorithms including Logistic Regression, Naïve Bayes, Support Vector Machine (SVM), Decision Tree, Random Forest, and Gradient Boosting. As a result, the data used to detect DO students managed to reach 99.42% on metric precision and 98.58% on average precision. The data used to detect late graduating students managed to reach 78.51% on metric precision and 82.86% AUC. The factors that affect dropout students are paid status because there are students whose debt is predicted to drop out, GPA with an average of below 2 is predicted to drop out, the number of repeat courses is above 1, not KRS is above 2. -Factors that influence this are data that is more than 1 No KRS and repeats courses 24 times as well as with Debt payment status. |