Tingginya jumlah peserta seleksi beasiswa yang tidak lulus, menyebabkan tidak efisiennya penyelenggaraan kegiatan seleksi beasiswa di LPDP. Berdasarkan data hasil seleksi beasiswa, terlihat bahwa persentase kelulusan peserta sangat rendah tiap tahunnya. Pada tahun 2013 proporsi yang tidak lulus seleksi sebesar 54%, sedangkan pada tahun 2014 dan tahun 2015 meningkat menjadi 85% dan 71%. Secara keseluruhan, terdapat 74% pendaftar beasiswa LPDP yang tidak lulus seleksi beasiswa dari tahun 2013 hingga tahun 2015. Hal ini menyebabkan tingginya biaya yang dikeluarkan untuk pelaksanaan seleksi. Jika LPDP bisa memprediksi peluang kelulusan peserta, maka biaya tersebut bisa dikurangi. Teknik klasifikasi pada data mining merupakan teknik yang tepat untuk permasalahan ini.
Metodologi yang digunakan dalam penelitian ini adalah knowledge discovery in databases (KDD). Metodologi ini terdiri dari 5 (lima) langkah, yaitu selection, preprocessing, transformation, data mining, dan interpretation / evaluation. Dataset bersumber dari data formulir pendaftaran beasiswa dan hasil wawancara. Proses pemodelan menggunakan software Rapid Miner dan algoritma decision tree. Model yang dihasilkan dievaluasi menggunakan k-fold cross validation. Hasil penelitian ini yaitu LPDP dapat memprediksi peluang kelulusan peserta seleksi.
The high number of participants who did not pass the scholarship selection, leading to inefficient operation of the selection of scholarship in the LPDP. Based on data from scholarship selection results, it appears that a very low percentage of graduation of each year. In 2013 the proportion who were not selected by 54%, whereas in 2014 and 2015 increased to 85% and 71%. Overall, there is a 74% LPDP scholarship applicants who did not pass the selection of scholarship from 2013 to 2015. This led to high costs incurred for the implementation of the selection. If LPDP can predict the chances of graduation participants, the cost can be reduced. Classification techniques in data mining is a technique that is appropriate for this problem. The methodology used in this study is a knowledge discovery in databases (KDD). This methodology consists of five (5) steps, namely selection, preprocessing, transformation, data mining, and interpretation / evaluation. Dataset data sourced from the scholarship application form and interview. Process modeling using software Rapid Miner and decision tree algorithm. The resulting model was evaluated using the k-fold cross validation. Results of this study are LPDP can predict the chances of graduation of the selection.