Article

공동문항 비동등집단 설계에서 동등화 연결선 (equating strains)이 검사 동등화 오차에 미치는 영향

반재천1, Bradley A. Hanson2, Deborah J. Harris3
Jae-Chun Ban1, Bradley A. Hanson2, Deborah J. Harris3
Author Information & Copyright
1한국교육과정평가원
2CTB/McGraw-Hill
3ACT, lnc.
1KICE
2CTB/McGraw-Hill
3ACT, Inc.

ⓒ Copyright 2002, Korea Institute for Curriculum and Evaluation. This is an Open-Access article distributed under the terms of the Creative Commons Attribution NonCommercial-ShareAlike License (http://creativecommons.org/licenses/by-nc-sa/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Published Online: Dec 31, 2002

요약

검사동등화를 적용하는 대규모 검사프로그램의 경우 여러 가지 난이도를 가진 검사폼 (test form) 탈이 고리처럼 연결되어 검사점수들이 상호 비교 가능하게 된다. 본 연구는 연결되는 모든 검사의 평균점수가 높거나 낮을 때, 혹은 높고 낮은 검사가 섞여 있을 때 생길 수 있는 오차(무선오차와 체계적 오차)의 정도를 탐구하였다. 이 연구에서는 공통문항 비동등집단설계법 (common-item nonequivalent groups design)을 이용하였다. 시율레이션을 통해 어떤 검사동등화법이 여라 유형의 동등화 연결선 (equating strains) 에 영향을 적게 받는지플 탐구했다. High strain 은 평균점수가 높은 검사만으로 연결된 것을 말하고, Low strain 은 평균점수가 낮 은 검사만으로 연결된 것이며, Mixedl (LH)는 평균점수가 낮고 높은 검사들이 교대로 연결된 것을 말하며, 마지막으로 Mixed2(HL)는 평균점수가 높고 낮은 검사탈이 511 대로 연결된 것을 말한다. Tucker와 빈도추정볍 (frequency estimation method) 을 사용했을 때, Low와 Mixedl(LH) 에서 보다 Higher Mixed2(HL)에서 전체오차가 낮았다. Levine방볍파 IRT방법을 썼을 때는 High strain에서 전체오차가 작았다. IRT방법은 연구에 사용된 유형 모두에서 전체오차가 비슷했다. 결론적으로 IRT방볍이 연구에 사용된 유형의 연결선 모두에서 오차가 가장 적었 고, 빈도추정법이 다음으로 적었고, 선형동등화 방법이 가장 오차가 컸다. 그러나 시뮬레이션에 사용된 자료가 IRT모델의 가정을 모두 충족한반면 다른 방법들의 일부 가정에는 맞지 않았 을 수 있다.

Keywords: 검사 동등화; 동등화 연결선; 검사 동등화 오차; 공통문항 · 비동등집단설; 계법; 빈도추정법; 문항반응이론