Kegagalan bayar kartu kredit merupakan risiko yang perlu dikelola, sehinggaperbankan perlu menerapkan credit scoring untuk memprediksi pemegang kartuyang berisiko default. Seiring dengan perkembangan teknologi, terdapat berbagaimetode credit scoring, sehingga perlu adanya telaah mengenai efektivitas metodemetodecredit scoring. Penelitian ini memiliki tujuan untuk memprediksi defaultberdasarkan data demografi, payment, dan savings nasabah, dan membandingkanefektivitas dari beberapa metode credit scoring yang berkembang, dan mengetahuivariabel apa saja yang mempengaruhi dalam hasil permodelan. Sehingga,perusahaan dapat memitigasi resiko lebih awal dan dapat mengoptimalkan revenuedari nasabah tidak beresiko lainnya. Selain itu ditemukan pula hubungan ketikasebuah cut off point dengan akurasi dan sensitivity. Dari variabel-variabel yangdigunakan dalam model, utilisasi dan pembayaran kartu kredit menjadi variabelyang sangat berpengaruh dalam permodelan, selain itu jenis kelamin, profesi,jumlah penghasilan, status kepemilikan tempat tinggal dan tingkat pendidikan akhirmenjadi variabel yang penting dalam memprediksi default. Dalam hasil permodelanrandom forest menghasilkan hasil yang paling baik secara keseluruhan, dan modellogistic regression merupakan permodelan yang memiliki defiasi lebih sedikit stabil dibandingkan hasil permodelan lainnya.
Failure to pay for credit cards is a risk that needs to be managed, so banks need toapply credit scoring to predict cardholders who are at risk of default. Along withtechnological developments, there are various methods of credit scoring, so there isa need for a review of the effectiveness of credit scoring methods. This study aimsto predict default from demographic, payments, and savings data from credit cardholder and compare the effectiveness of some of the growing credit scoringmethods, and to know what factors influence in the modeling results. Thus,companies can mitigate risks early and can optimize revenue from other risklesscustomers. In this research, the result shows that random forest modeling withoutfeature selections has the best overall result, and logistic regression model is amodel that has less defiation than other modeling result. In addition there is also arelationship when a cut off point with accuracy and sensitivity. From the variabelsused in the model, utilization and credit card payment to be highly influentialvariabel in modeling, besides gender, profession, income, residence status andeducation level become an important variabel in this research.