Banyaknya karya penelitian yang dihasilkan oleh para peneliti sekarang ini tidak terlepas dari karya - karya penelitian yang dihasilkan sebelumnya. Karya penelitian tersebut banyak yang dipublikasikan baik lewat media cetak ataupun elektronik, dan dengan perkembangan media informasi elektronik seperti Internet, menjadikannya sebagai salah satu media publikasi yang banyak digunakan. Karya penelitian yang banyak dipublikasikan tersebut salah satunya berupa jurnal, Untuk mengetahui keterkaitan antara artikel jurnal dengan artikel jurnal sebelumnya, dapat diketahui dengan melihat sitasi antara artikel-artikel tersebut. Dengan demikian dapat diketahui seberapa sering suatu artikel jurnal disitasi oleh artikel jurnal lainnya. Untuk membantu mengetahui sitasi antara jurnal yang dipublikasikan di Internet, diperlukan suatu sistem yang secara otomatis mendapatkan data yang diperlukan dari situs penyedia jurnal.
Dalam Skripsi ini telah dibuat tools yang dapat mengekstraksi halaman web lalu kemudian memilih data-data yang diperlukan. Selain itu diperlukan suatu database yang digunakan untuk menyimpan data hasil ekstraksi tersebut dan mencari keterkaitannya. Data yang telah diproses dapat dilihat menggunakan suatu antarmuka pengguna yang mempunyai fungsi pencarian data sesuai kata kunci yang dimasukkan oleh pengguna. Sehingga akhirnya secara keseluruhan dan bagian sistem membentuk suatu Mashup. Sistem ini dibangun dengan menggunakan bantuan bahasa PHP dan database MySQL, setelah mempelajari crawler seperti Openkapow robomaker.
Dari hasil pengujian terbukti sistem ini dapat bekerja dengan baik mengekstraksi halaman web penyedia jurnal, termasuk halaman pdf tipe tertentu dan menyimpannya dalam database. Hasil pengujian sistem memperlihatkan analisa masalah waktu program dan memori pada komputer dan juga koneksi ke Internet, juga menampilkan keterkaitan sitasi antar artikel jurnal yang ada.