Credit Scoring adalah metode yang digunakan untuk memprediksi kemungkinan adanya risiko calon peminjam akan gagal bayar atau menunggak. Credit scoring digunakan oleh penyedia jasa pinjaman ketika calon peminjam dana mengajukan pinjaman. Salah satu perusahaan yang menggunakan credit scoring terhadap peminjamnya adalah Lending Club. Lending Club adalah salah satu penyedia jasa pinjam meminjam online Peer-to-Peer (P2P) di Amerika Serikat. Pada penelitian ini, dilakukan klasifikasi multikelas credit scoring berdasarkan status pinjaman (Loan Status) dari dataset Lending Club. Status pinjaman memiliki 3 kelas, yaitu default, fully paid, dan late. Dengan menggunakan pendekatan machine learning, yaitu supervised learning, klasifikasi multikelas credit scoring dapat dilakukan dengan menggunakan Multinomial Logistic Regression (MLR). MLR merupakan pengembangan dari Logistic Regression yang mampu menangani klasifikasi multikelas. Pada implementasi model MLR, digunakan 3 skenario sampling strategy pada SMOTE yang berbeda dalam mengklasifikasikan multikelas. Hasil klasifikasi multikelas dievaluasi dengan menggunakan metrik accuracy, precision, recall, F1-Score dan AUC (Area Under the Curve) One versus All. Hasil implementasi dengan evaluasi terbaik adalah model MLR dengan nilai accuracy sebesar 0,67 dan nilai rata-rata AUC One versus All sebesar 0,724932. Sedangkan evaluasi pada setiap kelas, kelas default memiliki nilai precision sebesar 0,47,recall sebesar 0,02 dan F1-Score sebesar 0,04; kelas fully paid memiliki nilai precision sebesar 0,85, recall sebesar 0,83 dan F1-Score sebesar 0,84; dan kelas late memiliki nilai precision sebesar 0,02, recall sebesar 0,84 dan F1-Score sebesar 0,04. Hasil tersebut menunjukkan bahwa kelas default memiliki hasil evaluasi yang kurang baik untuk setiap metrik evaluasi, kelas fully paid memiliki hasil evaluasi yang baik untuk setiap metrik evaluasi, sedangkan kelas late memiliki nilai yang cukup baik hanya pada nilai recall (0,84). Hasil yang kurang baik diduga dipengaruhi oleh adanya data yang tidak seimbang dan kelas yang saling tumpang tindih.
Credit Scoring is a method used to predict the possible risk that a prospective borrower will default or delinquency. Credit scoring is used by loan service providers when prospective borrowers apply for loans. One company that uses credit scoring for its borrowers is the Lending Club. Lending Club is a Peer-to-Peer (P2P) online lending and borrowing service provider in the United States. In this study, a multiclass credit scoring classification was carried out based on loan status from the Lending Club dataset. Loan status has 3 classes, namely default, fully paid, and late. By using a machine learning approach, namely supervised learning, multiclass classification of credit scoring can be done using Multinomial Logistic Regression (MLR). MLR is a development of Logistic Regression which is able to handle multiclass classification. In the implementation of the MLR model, 3 different sampling strategy scenarios are used in SMOTE in classifying multiclasses. The multiclass classification results are evaluated using accuracy, precision, recall, F1-Score and AUC (Area Under the Curve) One versus All metrics. The result of the implementation with the best evaluation is the MLR model with an accuracy value of 0.67 and an average value of AUC One versus All of 0.724932. While the evaluation for each class, the default class has a precision value of 0.47, a recall of 0.02 and an F1-Score of 0.04; the fully paid class has a precision value of 0.85, a recall of 0.83 and an F1-Score of 0.84; and the late class has a precision value of 0.02, a recall of 0.84 and an F1-Score of 0.04. These results show that the default class has poor evaluation results for each evaluation metric, the fully paid class has good evaluation results for each evaluation metric, while the late class has a fairly good value only on the recall value (0.84). Unfavorable results are thought to be influenced by the presence of unbalanced data and overlapping classes.