Dalam upaya untuk mengendalikan besarnya kerugian, memodelkan severitas klaim merupakan salah satu cara yang sering dilakukan oleh perusahaan asuransi. Terdapat beberapa cara untuk memodelkan severitas klaim, salah satunya dengan generalized linear model. Akan tetapi fakta sederhana bahwa setiap pemegang polis itu tidak sama sering diabaikan karena hasil yang diperoleh hanya disajikan untuk ârata-rataâ pemegang polis. Potensi variabilitas ini yang tercermin pada data asuransi dapat diidentifikasi dengan mengelompokkan pemegang polis ke dalam kelompok yang berbeda. Sehingga dari perilaku yang berbeda pada masing-masing kelompok memungkinkan perusahaan asuransi mengembangkan strategi untuk mengendalikan besarnya kerugian. Pada praktiknya, model yang sering digunakan untuk pengelompokan adalah model finite mixture, dengan setiap kelompok dimodelkan dengan fungsi kepadatan probabilitasnya (pdf) sendiri. Salah satu keluarga model finite mixture yang fleksibel untuk vektor acak yang terdiri dari variabel respon dan satu set kovariat yang disesuaikan dengan distribusi bersamanya adalah cluster-weighted model (CWM). CWM merupakan kombinasi linear antara distribusi marjinal kovariat dan distribusi bersyarat dari respons yang diberikan kovariat. Distribusi bersyarat pada CWM diasumsikan milik keluarga eksponensial dan kovariatnya diperbolehkan tipe campuran yaitu diskrit dan kontinu (diasumsikan gaussian). Selanjutnya, model dicocokkan ke dalam data (fitting the model) menggunakan Maximum likelihood estimation (MLE) untuk menaksir parameter model dengan algoritma ekspektasi-maksimalisasi (EM). Pemilihan model terbaik dievaluasi dari skor akaike information criterion (AIC) dan bayesian information criterion (BIC). Permasalahan penentuan jumlah cluster diselesaikan secara bersamaan dengan memilih model terbaik. Pada akhirnya, CWM dapat digunakan untuk meningkatkan pemahaman tentang perilaku pemegang polis dan karakteristik risikonya yang dihasilkan di setiap cluster. Penerapan metode ini diilustrasikan pada data asuransi mobil di Prancis.
In an effort to control the amount of loss, modeling the severity of claims is one way that is often done by insurance companies. There are several ways to model claim severity, one of which is a generalized linear model. However, the simple fact that every policyholder is not the same is often overlooked because the results obtained are only presented for the "average" policyholder. This potential for variability reflected in insurance data can be identified by classifying policyholders into different groups. So that the different behavior of each group allows insurance companies to develop strategies to control the amount of losses. In practice, the model often used for grouping is the finite mixture model, with each group being modeled with its own probability density function (pdf). One of the flexible finite mixture model families for random vectors consisting of a response variable and a set of covariates adjusted for their common distribution is the cluster-weighted model (CWM). CWM is a linear combination between the marginal distribution of the covariates and the conditional distribution of the responses given by the covariates. The conditional distribution on CWM is assumed to belong to the exponential family and the covariates are allowed mixed types, namely discrete and continuous (assumed to be gaussian). Next, the model is fitted to the data (fitting the model) using Maximum likelihood estimation (MLE) to estimate the model parameters with the expectation-maximization (EM) algorithm. Selection of the best model was evaluated from the Akaike information criterion (AIC) and Bayesian information criterion (BIC) scores. The problem of determining the number of clusters is solved simultaneously by selecting the best model. In the end, CWM can be used to increase understanding of policyholder behavior and the resulting risk characteristics in each cluster. The application of this method is illustrated in data on auto insurance in France.