大尺度教育测评中IRT等值方法的比较研究

2013-12-28分类号：G647

【作者】杨涛辛涛高燕

【部门】北京师范大学教育统计与测量研究所北京师范大学发展心理研究所北京师范大学认知神经科学与学习国家重点实验室

【摘要】世界各国和国际组织都把大尺度教育测评作为关注教育质量的有效方式。有效发挥大尺度教育测评的作用离不开对其测评技术和方法的深入研究。等值是大尺度教育测评中数据处理的重要方法,有助于实现测验的公平。研究采用共同题非等组设计,利用实际数据,比较3种等值方法(同时性校准、Stocking&Lord分别校准方法和Mean-Mean分别校准方法)与2种分别校准链接方案(集中式链接、链式链接)的题目参数等值精度。结果显示:多题本共同题设计下,Stocking&Lord方法的估计精度要高于Mean-Mean方法;Mean-Mean和Stocking&Lord两种分别校准等值方法在集中式链接方案和链式链接方案中的参数估计精度都比同时性校准的精度高;在链式链接方案中,随着链接题本数量的增加,参数等值精度在下降,在集中式链接方案中等值精度则没有这样明显的规律;等值方法对精度的影响要大于链接方案对等值精度的影响。其中,不同等值方法虽然在不同研究中分别被采用过,但同时考虑不同题本链接方案在国内外均没有实证研究。此研究结果,既弥补了国内外有关多题本共同题设计下不同等值方法以及不同题本链接方案的实证研究的不足,也为我国相关大尺度教育测评的等值设计提供参考和实证依据,进而更好地实现测验的公平。

【关键词】IRT 等值链接方案

【基金】

【所属期刊栏目】中国软科学

文献传递