Untuk memenuhi kebutuhan manusia dalam mendapatkan informasi yang banyak dalam waktu yang singkat, teknologi informasi terus menerus dikembangkan. Saat ini informasi menjadi lebih mudah didapat melalui internet. Pengguna internet terdiri dari berbagai macam orang dengan berbagai macam suku bangsa dan bahasa. Dokumen yang dapat diakses melalui internet juga terdiri dari berbagai bahasa.
Untuk memudahkan pencari informasi mendapatkan informasi yang mereka inginkan tanpa terhalangi faktor bahasa, maka dikembangkan teknologi perolehan informasi lintas bahasa. Perolehan informasi lintas bahasa adalah perolehan informasi atau dokumen yang ditulis dalam bahasa yang berbeda dari bahasa kueri. Teknologi perolehan informasi lintas bahasa yang berkembang saat ini antara lain adalah dengan menggunakan mesin penerjemah, dengan kamus dwibahasa, dan berdasarkan korpus. Teknologi perolehan informasi lintas bahasa berdasarkan korpus dapat menggunakan korpus paralel atau korpus yang sebanding. Pada penelitian kali ini, dicoba teknik perolehan informasi berdasarkan korpus yang sebanding dengan menggunakan penghitungan statistik phi square dan koefisien korelasi Pearson.
Hasil dari eksperimen yang dilakukan dalam penelitian ini menunjukkan bahwa kinerja dari perolehan dokumen lintas bahasa dengan menggunakan teknik phi square dapat mencapai 494% dari kinerja kamus dwi-bahasa, sedangkan kinerja korelasi Pearson dapat mencapai 510% dari kinerja kamus dwi-bahasa. Kinerja dari perolehan dokumen lintas bahasa dengan menggunakan teknik phi square dapat mencapai 117% dari kinerja mesin penerjemah Transtool, sedangkan kinerja korelasi Pearson dapat mencapai 121%.