Prediksi dengan model mesin learning regresi telah banyak digunakan untuk penelitian. Salah satu model mesin learning yang digunakan untuk prediksi adalah random forest regressor. Mesin learning membutuhkan data training untuk mempelajari pola dan hubungan antar data. Model regressor yang sedangkan dikembangkan dalam bidang medis saat ini adalah model yang dapat memprediksi dosis pada perencanaan IMRT. Data perencanaan dalam format DICOM (format asli data) dieksport ke bentuk CVS (
Comma Separated Values). Kemudian data dibagi menjadi data training dan testing yang dipilih secara random. Algoritma yang digunakan untuk memprediksi adalah random forest yang akan di training menggunakan 7-fold validation dan kemudian model akan di uji dengan data baru yaitu data testing yang belum pernah dilihat oleh model. Data yang dievaluasi yaitu parameter untuk mendapat HI (Homogenety Index) untuk organ target, dan dosis
mean dan
max untuk OAR (Organ At Risk). Random forest mampu memprediksi nilai sebenarnya dengan kesalahan dievaluasi menggunakan MAE pada fitur PTV D2 (0,012), D50 (0,015) dan D98 (0,018) serta pada fitur OAR (
mean dan
max) paru kanan (0,104 dan 0,228), paru kiri (0,094 dan 0,27), jantung (0,088 dan 0,267),
spinal cord (0,069 dan 0,121) dan (V95)
Body (0,094).
Predictions with machine learning regression models have been widely used for research. One of the machine learning models used for prediction is the random forest regressor. Machine learning requires training data to determine patterns and relationships between data. Nowadays, the regressor model that being developed in the medical field is able to predict dose in IMRT planning. Planning data in DICOM format (original data format) was exported to CVS (Comma Separated Values) format. Then, the data was divided into training and testing data which were selected randomly. The algorithm used to predict is a random forest that was trained using 7-fold validation and the model was evaluated with new data, namely testing data that have not been seen by the model. The evaluated data are parameters to obtain HI (Homogenety Index) for target organs, and mean and max doses for OAR (Organ At Risk). Random forest was able to predict the true value with errors and it was evaluated using MAE for PTV D2 (0,012), D50 (0,015) and D98 (0,018), for OAR (mean and max) right lung (0,104 and 0,228), left lung (0,094 and 0,27), heart (0,088 and 0,267), spinal cord (0,069 and 0,121) and (V95) Body (0,094).