Aktivitas bongkar muat kargo bahan bakar dengan kapal tanker di pelabuhan di Indonesia memiliki kekurangan terkait efisiensi waktu dan kecepatan. Sebuah virtual robotic dibuat untuk dapat meningkatkan efisiensi waktu terhadap proses bongkar muat tersebut. Namun dibutuhkan suatu cara agar robot dapat berkomunikasi dengan petugas kapal tanker selama proses bongkar muat dilakukan. Karena pelabuhan tempat proses bongkar muat termasuk kedalam lokasi berbahaya dan mudah meledak, maka komunikasi yang diperbolehkan hanyalah komunikasi suara melalui radio Very High Frequency (VHF) laut. Solusi untuk mengatasi masalah tersebut adalah dengan merancang teknologi yang dapat melakukan pengenalan suara melalui radio VHF laut, salah satunya dengan metode Deep Learning menggunakan arsitektur DeepSpeech. Skripsi ini telah mengembangkan simulasi pengenalan suara menggunakan metode DeepSpeech architecture pada komunikasi radio VHF bagi petugas kapal tanker di pelabuhan laut. Skripsi ini telah mengembangkan uji coba dengan arsitektur DeepSpeech untuk menghasilkan model pengenalan suara dengan hasil keluaran nilai rata-rata Word Error Rate (WER) sebesar 0,335 dan rata-rata Character Error Rate (CER) sebesar 0,263. Skripsi ini juga menganalisa pengaruh variasi nilai learning rate, dropout rate, dan epoch untuk mendapatkan model sistem pengenalan suara terbaik.
The loading and unloading of fuel cargo by tanker ships at ports in Indonesia has a problem in terms of time efficiency and speed. A virtual robotic is created to increase the time efficiency of the loading and unloading process. However, the robot needs a way to communicate with the tanker ship officers during the process. Because the port where the loading and unloading process took place is considered as a dangerous and explosive location, the only communication allowed is through voice communication via marine Very High Frequency (VHF) radio. The solution to overcome this problem is to design a technology that can perform speech recognition via marine VHF radio, one of which is using the Deep Learning method with DeepSpeech architecture. This thesis has simulated speech recognition system using DeepSpeeh architecture method on VHF radio communication for tanker ship officers at sea ports. This thesis has tested the DeepSpeech architecture to produce a speech recognition model with an average WER value of 0,335 and an average CER value of 0,263. This thesis also analyzes the effect of variations in learning rate, dropout rate, and epoch value to get the best speech recognition system model.