Rotating machinery dalam industri minyak dan gas merupakan aset kritis yang beroperasi dalam medan kerja yang berat, sehingga beberapa bagian umum rentan mengalami fault. Fault merupakan anomali yang menunjukkan penyimpangan dari kondisi operasi normal pada suatu sistem, sehingga perlu dideteksi lebih dini, secara akurat, dan terotomasi. Salah satu metode yang dapat digunakan adalah dengan machine learning. Data yang digunakan dalam penelitian ini adalah sensor condition monitoring aset rotating machinery yang diperoleh dari sebuah perusahaan minyak dan gas di Indonesia. Data sensor yang diperoleh mencakup 3 operation parameters yakni kecepatan, suhu, dan vibrasi. Algoritme klasifikasi pada penelitian ini menggunakan supervised learning yakni Support Vector Machine (SVM), Random Forest (RF), dan K-Nearest Neighbors (KNN). Kinerja model machine learning dievaluasi menggunakan metrik accuracy, precision, F1 score, dan matthews correlation coefficient (MCC). Hasil model klasifikasi random forest menunjukkan hasil yang sangat baik dengan akurasi 98,5%, presisi 98,6%, f1-score 98,5%, dan MCC sebesar 97,2%. Analisis SHAP Explainer secara global mampu menjelaskan feature importance dan secara lokal yang memperlihatkan kontribusi variabel-variabel operating parameter yang berkontribusi paling besar pada kelas normal, alert, dan fault.
Rotating machinery in the oil and gas industry is a critical asset that operates in a tough work environment, where some of the common parts are prone to faults. Fault is an anomaly that indicates a deviation from the normal operating conditions of a system, so it needs to be detected early, accurately, and automated. The data used in this study is obtained from a condition monitoring sensor of rotating machinery in an oil and gas company in Indonesia. The acquired sensor data includes 3 operating parameters: speed, temperature, and vibration. The classification algorithms used in this research are supervised learning methods, namely Support Vector Machine (SVM), Random Forest (RF), and K-Nearest Neighbors (KNN). The performance of the machine learning models is evaluated using metrics such as accuracy, precision, F1 score, and Matthews correlation coefficient (MCC). The results of the random forest classification model show very good results with an accuracy of 98.5%, a precision of 98.6%, an f1-score of 98.5%, and an MCC of 97.2%. SHAP Explainer in global explanation is able to explain the feature importance and also locally which shows the contribution of operating parameter variables that contribute the most to the normal, alert, and fault classes.