DNA merupakan komponen penting dalam tubuh makhluk hidup dalam kaitannya dengan sintesis asam amino penyusun protein. Informasi mengenai sintesis asam amino tersebut direpresentasikan oleh empat buah karakter nukleotida A, T, C dan G yang mempakan simbol basa-basa nitrogen penyusun DNA. Rangkaian DNA makhluk hidup tersusun atas gen-gen yang panjangnya jutaan bahkan milyaran karakter nukleotida. Namun, yang terpakai sebagai kode genetik dalam sintesis asam amino hanya karakter nukleotida yang terdapat pada suatu daerah pengkodean yang disebut exon dalam setiap gen.
Hidden Markov Model (HMM) merupakan salah satu cara yang dapat digunakan untuk memprediksi lokasi exon pada DNA. HMM memiliki dua buah fase, yakni fase training dan fase tes. Sequence-sequence DNA ditraining untuk mendapatkan estimasi matrik transisi dan estimasi matrik emisi melalui proses iterasi. Matrik transisi dan matrik emisi ini kemudian digunakan untuk mengetes sequence DNA yang bersangkutan. Pada skripsi ini, simulasi dilakukan dengan menggunakan tiga jenis organisme, Drosophila melanogaster (lalat buah). Homo sapiens (manusia), serta Zea mays (padi).
Data yang diperoleh dari simulasi berupa nilai sensitivity (Sn) dan specificity (Sp) hasil prediksi lokasi exon gen yang bersangkutan. Dari perhitungan nilai akurasi untuk Drosophila melanogaster didapat nilai akurasi Sn sebesar 92.5% dan nilai Sp sebesar 88%, pada Homo sapiens dengan nilai akurasi Sn sebesar 69.7% dan nilai Sp sebesar 44.7% serta pada Zea Mays dengan nilai akurasi Sn sebesar 55.6% dan nilai Sp sebesar 78.6%.