Gempa bumi merupakan peristiwa alam yang kapan saja bisa terjadi dan dapat membahayakan
orang-orang yang berada dekat dengan pusat gempa. Akan sangat baik jika
kita dapat melakukan persiapan sebelum gempa bumi terjadi, tetapi permasalahannya kita
tidak tahu kapan gempa bumi akan terjadi. Penelitian ini bertujuan untuk menganalisis
hubungan antara kejadian gempa bumi di masa lalu dan di masa mendatang dengan
mencoba memprediksi jumlah gempa tahunan pada suatu tahun dilihat dari jumlah kejadian
gempa bumi di tahun-tahun sebelumnya. Penelitian ini membagi data kejadian
gempa bumi berdasarkan dua kategori lokasi: zona waktu GMT dan lempengan bumi.
Hasil dari penelitian ini berupa model-model machine learning yang dapat memprediksi
jumlah gempa tahunan berdasarkan masing-masing lokasi. Penelitian ini menggunakan
teknik-teknik machine learning yaitu linear regression, LSTM, dan Prophet pada dataset
gempa bumi dengan menggunakan pendekatan time series analysis. Penelitian ini juga
mencoba beberapa pengaturan window size, dan penggunaan jenis data stationary untuk
training. Hal ini dilakukan untuk menemukan pengaturan terbaik yang dapat digunakan
untuk melakukan prediksi. Performa model yang dihasilkan akan dievaluasi menggunakan
metrik RMSE dan R2. Teknik machine learning yang dianggap memiliki performa
rata-rata terbaik (rata-rata dari penggunaan window size 3, 4, dan 5) untuk dua kategori
lokasi tersebut adalah linear regression dengan penggunaan data stationary yang mana
mendapatkan rata-rata RMSE 11.26 dan R2 0.19 untuk kategori zona waktu, sedangkan
untuk kategori lempengan bumi mendapatkan rata-rata RMSE 6.87 dan R2 0.13.
An earthquake is a natural event that can occur anytime and endanger many lives. It is agood thing if we can make a preparation to overcome the after-effect, but the problem iswe do not know when an earthquake will take place. The purpose of this research is to analyzethe correlation between the past and future earthquakes by predicting the number ofearthquakes in a certain year based on the number of earthquakes in previous years. Thisresearch groups the earthquakes based on their location categorization: GMT time zoneand earth plate. The results of this research are machine learning models that can predictthe number of annual earthquakes for each location. We employ various machine learningtechniques in this research, such as linear regression, LSTM, and Prophet on earthquakedatasets with a time series analysis approach. This research also measures the effect ofwindow sizes and the usage of stationary data for training. This is done to find the bestsettings that can be used in prediction. The models are evaluated using the RMSE and R2metrics. The evaluation results suggest that the highest average performance (average onthe window size of 3, 4, and 5) is obtained by using the linear regression model, achievingan RMSE score of 11.26 and an R2 score of 0.19 for the time zone categorization, and anRMSE score of 6.87 and an R2 score of 0.13 for the earth plate categorization.