摘要:Penelitian ini bertujuan: (1) memperoleh informasi tentang karakteristik butir dan tes ujian akhir semester Program Penyetaraan D2 PGSD UT, berdasarkan analisis dengan pendekatan teori respons butir model Rasch; (2) mengetahui butir-butir soal yang cocok dengan model Rasch dan (3) mengetahui kualitas butir-butir soal hasil telaah para ahli bidang studi dengan menggunakan pedoman telaah yang standar. Perangkat tes yang diteliti sebanyak empat matakuliah dengan rincian jumlah sampel: perangkat tes PPDG 2130 sebesar 3009 lembar jawab, PPDG 2332 sebesar 3897 lembar jawab, PPDG 2131 sebesar 3186 lembar jawab, dan PPDG 2531 sebesar 4959 lembar jawab; yang diambi 1 dengan teknik proportional cluster random sampling. Data penelitian inidiperoleh melalui dokumentasi. Secara kuantitatif, data diolah dengan menggunakan program Rascal untuk kepentingan estimasi parameter butir, dan secara kualitatif menggunakan pedoman yang telah standar yang dilakukan oleh tiga orang penelaah. Hasil analisis data secara kualitatif menunjukkan bahwa keempat perangkat tes tersebut memiliki kualitas cukup baik sebagai alat ukur, karena tidak satu butirpun yang ditolak, sedangkan butir yang baik masing-masing berjumlah: 30 butir (60%) untuk PPDG 2130, 34 butir (56,7%) untuk PPDG 2332, 46 butir (76,7%) untuk PPDG 2131, dan 48 butir (80%) untuk PPDG 2531; selebihnya butir yang perlu direvisi. Hasil analisis data empiris, baik hasil estimasi parameter butir maupun kecocokan data terhadap model menunjukkan bahwa keempat perangkat tes memiliki kualitas cukup baik dengan tingkat kesukaran sedang dan rerata sebesar 0,000 skala logits. Butir-butir soal yang baik masing-masing berjumlah: 39 butir (78%) untuk PPDG 2130, 46 butir (77,7%) untuk PPDG 2332, 33 butir (55%) untuk PPDG 2131, dan 46 butir (77,7%) untuk PPDG 2531, selebihnya butir soal yang ditolak. Berdasarkan temuan ini, Universitas Terbuka dan semua pihak yang terlibat dalam pengujian dan penilaian, dianjurkan untuk terlebih dahulu menganalisis baik secara kualitatif maupun secara kuantitatif sebelum butir atau tes tersebut digunakan, sehingga penilaian lebih objektif dan kesalahan pengukuran dapat dihindari.