The Trends in International Mathematics and Science Study (TIMSS) aims to provide a broad perspective forevaluating and improving education. This assessment also ranks the participant countries based on their performanceand makes inferences about factors affecting achievement and learning. However, the study may not function as it wasexpected because of differences in curricular, cultural, or language settings among countries. Consequently, thischallenges assumptions about measurement equivalency. The present study aims to assess the equivalency ofmathematics items on the TIMSS (2007) study across Australian and Indonesia. Students’ responses were subjected toRasch analysis to determine DIF items. The results revealed that many items of mathematics tests are problematicbecause they showed significant bias. The study also found that Australian students performed better and foundmathematics items on the test easier than their Indonesian counterparts did. Several factors such as curriculardifferences, methods used to solve mathematics problems, availability of textbooks and teachers’ quality might explainthe existence of DIF between the countries. These findings indicate that serious limitations of using TIMSS results incomparing the performance of students across countries. Thus, further empirical evidence is needed before TIMSS 2007results can be meaningfully used in research.The Trends in International Mathematics and Science Study (TIMSS) bertujuan menyediakan perspektif yang luasdalam mengevaluasi dan meningkatkan mutu pendidikan. TIMSS juga merangking negara-negara peserta studiberdasarkan kemampuan serta membuat prediksi tentang faktor-faktor yang memengaruhi capaian belajar siswamereka. Akan tetapi, karena perbedaan kurikulum, budaya atau bahasa dari negara-negara tersebut, TIMSS ini tidakberfungsi sebagaimana yang diharapkan. Akibatnya, kondisi ini menantang asumsi-asumsi tentang pengukuran yangekuivalen. Penelitian ini bertujuan untuk menguji keekuivalenan soal-soal matematika dari studi TIMSS 2007 denganmenggunakan jawaban siswa Australia dan Indonesia. Rasch analisis digunakan untuk menemukan soal-soal yang bias.Hasil analisis menujukkan bahwa banyak soal matematika dalam studi TIMSS 2007 bermasalah karena soal tersebutmemperlihatkan bias yang signifikan. Penelitian ini juga menemukan bahwa kemampuan siswa Australia lebih baik darisiswa Indonesia. Soal matematika terlihat lebih mudah bagi siswa Australia dibandingkan bagi siswa Indonesia.Perbedaan kurikulum sekolah, metode dalam pemecahan masalah dan ketersediaan buku dan kualitas guru didugasebagai faktor penyebab munculnya DIF item. Temuan-temuan dalam penelitian ini mengindikasikan adanyaketerbatasan yang serius dalam menggunakan hasil studi TIMSS untuk membandingkan negara-negara peserta studi.Oleh karena itu, bukti-bukti empiris lainnya sangat diperlukan sebelum hasil studi TIMSS 2007 dapat digunakandengan bermakna sebagai dasar penelitian. |