Phonetic similarity merupakan model mengenai kemiripan antar bunyi. Penerapan bidang penelitian ini sudah meluas ke dalam berbagai bidang. Diantaranya ialah speech recognition, identifikasi cognates, machine translation, dan jokes generator. Terdapat beberapa penelitian yang telah dilakukan pada bidang ini. Penelitian phonetic similarity dengan metode empiris telah dilakukan oleh Stephen Rooney [STR05]. Sedangkan penelitian dengan berlandaskan pada teori fonetik telah dilakukan pada riset STANDUP [RGH08].
Penggunaan phonetic similarity dalam konteks bahasa Indonesia dinilai dapat membawa manfaat bagi berbagai bidang penelitian yang melibatkan bahasa Indonesia dan bunyi. Namun sampai saat ini, belum ada model phonetic similarity untuk bahasa Indonesia. Penelitian ini dilakukan untuk mengembangkan model phonetic similarity dalam bahasa Indonesia.
Fokus pada penelitian ini ialah pada penelitian mengenai perbedaan kemiripan fonem sebagai satuan bunyi terkecil. Akan digunakan fonem-fonem yang terdapat dalam kamus fonetik bahasa Indonesia Zahra [ZAR08]. Penelitian dilakukan dengan mengumpulkan data melalui kuesioner, yang menghasilkan matriks substitusi antar fonem. Matriks tersebut kemudian digunakan sebagai salah satu komponen dalam metode penghitungan kemiripan bunyi antar kata. Metode penghitungan berbasis pada algoritma edit distance/levenshtein distance.
Hasil observasi terhadap eksperimen yang dilakukan ialah bahwa model penghitungan kemiripan bunyi cukup sesuai dengan persepsi mengenai kemiripan bunyi. Pada perbandingan matriks substitusi yang diperoleh dengan model pada riset STANDUP yang berlandaskan teori fonetik, diperoleh hasil yang cukup baik. Nilai-nilai pada matriks substitusi cukup sejalan dengan nilai-nilai pada model STANDUP.