Fraud asuransi merupakan tindakan yang sangat merugikan, baik untuk perusahaan asuransi dalam bentuk kerugian maupun untuk pemegang polis lainnya dalam bentuk kenaikan premi untuk menutupi kerugian. Salah satu cara yang dapat dilakukan adalah menggunakan jasa claim investigator untuk mendeteksi fraud yang mungkin terjadi. Namun, semakin banyak klaim yang perlu dianalisis, semakin tinggi juga biaya yang akan dikeluarkan. Solusi untuk mengatasi masalah scalability tersebut adalah dengan menggunakan machine learning. Metode machine learning yang saat ini cukup populer dan banyak digunakan untuk berbagai aplikasi adalah deep learning. Metode deep learning banyak dipakai untuk memproses data tidak terstruktur contohnya pemrosesan data gambar dengan menggunakan convolutional neural networks (CNN). Kesuksesan metode CNN dalam memproses data tidak terstruktur menjadi dasar dari pengembangan algoritma IGTD (image generator for tabular data) yang bertujuan untuk memproses data terstruktur menjadi data berbentuk gambar agar dapat diproses oleh metode CNN. Penelitian ini bertujuan untuk menganalisis kinerja algoritma IGTD dan model CNN dalam memprediksi fraud asuransi dengan menggunakan data fraud asuransi kendaraan bermotor. Kinerja algoritma IGTD dan model CNN akan dibandingkan dengan model XGBoost dengan pembobotan data, imbalance-XGBoost weighted function, decision tree, serta random forest. Selain itu, pada penelitian ini dianalisis juga modifikasi dari algoritma IGTD terhadap kinerja model CNN yang digunakan. Hasil simulasi menunjukkan bahwa algoritma IGTD dan model CNN masih belum mampu menandingi model XGBoost dengan pembobotan data dan imbalance-XGBoost weighted function yang masih menjadi model terbaik dalam memprediksi fraud asuransi. Selain itu, model CNN berbasis modifikasi algoritma IGTD memiliki kinerja yang serupa dengan model CNN berbasis algoritma IGTD. Insurance fraud is an act that could inflict serious damage not only for the insurance company in the form of net loss, but also for other policyholders in the form of increased premium rates to cover the net loss. Insurance companies might use claim investigator to detect possible fraud by policyholders. However, as more claims need to be investigated, the cost of investigation will also increase. Machine learning is the solution for this scalability issue, especially the deep learning method which is popular and widely used in numerous applications. Deep learning method is commonly used to process unstructured data such as image by using convolutional neural networks (CNN). The success of CNN model motivates the invention of IGTD (image generator for tabular data) algorithm to process structured data into images to ensure it can be processed by the CNN model. The purpose of this research is to analyze the performance of IGTD algorithm and CNN model to predict insurance fraud using auto insurance fraud dataset. The performance of IGTD algorithm and CNN model is compared to XGBoost sample weighted, imbalance-XGBoost weighted function, decision tree, and random forest. In this research the impact of IGTD algorithm modification to the performance of CNN model is analyzed. The simulation result shows that the IGTD algorithm and CNN model is unable to outperform the best model to predict insurance fraud, XGBoost sample weighted and imbalance-XGBoost weighted function. Moreover, CNN model based on IGTD algorithm and modified IGTD algorithm yield similar performance. |