Tes Akademik Umum (TAU) merupakan tes yang mengukur penguasaan siswa lulusan Sekolah Dasar dalam bidang studi Bahasa Indonesia, Matematika, IPA dan IPS. Tes ini digunakan sebagai tes seleksi atau tes penempatan lulusan Sekolah Dasar ke Sekolah Lanjutan Pertama. Sebagai alat seleksi, diharapkan dapat memberikan informasi yang lebih banyak dan sistem pelaporan yang lebih bermakna dengan memberikan gambaran kompetensi yang dimiliki oleh peserta tes. Gambaran kompetensi seseorang pada suatu skala kontinum dapat diperoleh dengan proses benchmark. Yang menjadi permasalahan sekarang ini adalah bagaimana pengembangan benchmarknya dan bentuk dari laporan hasil tes yang lebih komunikatif. Tujuan dari penelitian ini adalah menganalisis butir soal Tes Akademik Umum sehingga dapat menyeleksi soal-soal yang memenuhi Kriteria sebagai soal yang baik. Mengembangkan benchmark Tes Akademik umum. Mengidentifikasi karakteristik populasi peserta tes untuk menentukan design TAU yang optimal (membandingkan data empirik dengan data simulasi).
Subjek penelitian ini adalah peserta seleksi Tes Akademik Umum di kabupaten serang (15108 orang) dan Tangerang (25245 orang). Seleksi dilaksanakan pada bulan Juni tahun 2004. Untuk menganalisis data tersebut digunakan beberapa program yaitu: ITEMAN, SPSS, BILOG ,DGEN dan BIGSTEPS.
Analisis ITEMAN dan SPSS menunjukkan bahwa ada 7 soal yang dibuang pada TAU yang digunakan. Pada model 1 parameter dari 95 soal yang ada hanya ada 12 soal yang sesuai dengan kriteria bench dan sisanya masuk dalam kategori mendekati kriteria bench, kriteria 60%-65% dan sama sekali tidak sesuai dengan kriteria-kriteria yang ada. Sedangkan untuk model 2 parameter ada 18 soal yang masuk bench. Dari simulasi data diperoleh soal yang masuk bench sebanyak 28 soal (model 1 PL) dan 30 soal (model 2 PL). Simulasi data dirancang antara tingkat kesukaran dan ability orang mempunyai ukuran yang sama dan dilakukan 5 kali replikasi. Hasil penelitian menunjukkan bahwa TAU belum mencapai tes yang optimal karena masih belum sesuai dengan obyek yang akan diukur. Proses benchmarking TAU juga belum maksimal karena soal yang bisa terjaring hanya sedikit sehingga informasi kompetensi yang dimiliki siswa sangat terbatas. Dari hasil simulasi data menunjukkan bahwa tes yang dirancang dengan tingkat kesukaran dan ability orang sama (sesuai dengan target yang akan diukur) maka soal-soal yang masuk dalam bench (menganchor dalam bench) akan lebih banyak. Hai ini menunjukkan benchmarking tersebut tergantung pada karakteristik populasi dan design tes. Untuk pengembangan benchmark TAU selanjutnya perlu diperhatikan langkah dalam design tes yang baik sehingga hasil yang akan diperoleh akan lebih maksimal.