Jatuh merupakan penyebab utama kedua cedera dan kematian yang tidak disengaja di seluruh dunia. Kejadian ini sering terjadi pada lansia dan frekuensinya meningkat setiap tahun. Sistem pendeteksi aktivitas jatuh yang reliabel dapat mengurangi risiko cedera yang dialami. Mengingat jatuh adalah kejadian yang tidak dikehendaki atau terjadi secara tiba-tiba, sulit untuk mengumpulkan data jatuh yang sebenarnya. Deteksi jatuh juga sulit karena kemiripannya dengan beberapa aktivitas seperti jongkok, dan mengambil objek dari lantai. Selain itu, beberapa tahun belakangan dataset mengenai aktivitas jatuh yang tersedia secara publik juga terbatas. Oleh karena itu, di tahun 2019, beberapa peneliti mencoba membuat dataset jatuh yang komprehensif yang mensimulasikan kejadian yang sebenarnya dengan menggunakan perangkat kamera dan sensor. Dataset yang dihasilkan dataset multimodal bernama UP-Fall. Menggunakan dataset tersebut, penelitian ini mencoba mendeteksi aktivitas jatuh dengan pendekatan Convolutional Neural Network (CNN) dan Long Short Term Memory (LSTM). CNN digunakan untuk mendeteksi informasi spasial dari data citra, sedangakan LSTM digunakan untuk mengeksploitasi informasi temporal dari data sinyal. Kemudian, hasil dari kedua model digabungkan dengan strategi majority voting. Berdasarkan hasil evaluasi, CNN memperoleh akurasi sebesar 98,49% dan LSTM 98,88%. Kedua model berkontribusi kepada performa strategi majority voting sehingga mendapatkan akurasi (98,31%) yang melebihi akurasi baseline (96,4%). Metrik evaluasi lain juga meningkat seperti precision naik 11%, recall 14%, dan F1-score 12% jika dibandingan dengan baseline .Fall is the second leading cause of accidental injury and death worldwide. This event often occurs in the elderly and the frequency is increasing every year. Reliable fall activity detection system can reduce the risk of injuries suffered. Since falls are unwanted events or occur suddenly, it is difficult to collect actual fall data. It is also difficult because of the similarity to some activities such as squatting, and picking up objects from the floor. In addition, in recent years the fall dataset that is publicly available is limited. Therefore, in 2019, some researchers tried to create a comprehensive fall dataset that simulates the actual events using camera and sensor devices. The experiment produced a multimodal dataset UP-Fall. Using this dataset, this study tries to detect falling activity using Convolutional Neural Network and Long Short Term Memory approaches. CNN is used to detect spatial information from image data, while LSTM is used to exploit temporal information from signal data. Then, the results of the two models are combined with the majority voting strategy. Based on the evaluation results, CNN obtained an accuracy of 98.49% and LSTM 98.88%. Both models contribute to the performance of the majority voting strategy with the result that the accuracy (98.31%) exceeds baseline accuracy (96.4%). Other evaluation metrics also improved such as precision goes up to 11%, recall 14%, and F1-score 12% in comparison with baseline. |