梧桐文学

第一 概述(第3页)

天才一秒记住【梧桐文学】地址:https://www.wtwx.net

(OptimalSequentialDesign)(Berger,1992;Jones&Jin,1994;Ying&Wu,1997)。

前人(g,2011;Ying&Wu,1997)证明了在一系列正则条件下,这种最优序列设计将会收敛至最优设计。

这些统计证明为在线标定的实践应用打下了理论基础。

需要注意的是,事实上,在线标定并不完全符合最优设计的情境。

最优设计通过统计计算,为每一道测试题算出最佳样本的取样标准,然后通过这一标准去取样。

在在线标定的情境下,这些样本也就是参加CAT考试的考生们,而符合最优设计的情境是所有的考生形成一个考生样本库,而我们可以任意选择某一考生来回答一道测试题。

然而在真实的CAT情境下,我们无法控制哪些考生来参加考试。

在某一特定时间点,正在参加CAT考试的考生是给定的,可以控制的只有选哪一道测试题给这位考生,如图9-1-1所示。

这一情境与最优设计的情境有所偏差。

另外,这套统计理论只考虑了统计估计上的量化指标。

有的学者会质疑这种基于统计估计效率的最优取样,因为这样获取的样本很容易失去对总体的代表性,从而成为偏置样本。

那么通过这种样本估计出的参数值,尽管量化方面效率提高了,但从质性方面考虑,是否有效呢?这是一个值得探讨的争议。

四、在线标定的主要设计因素

从图9-1-1中可以归纳出在线标定程序中的四大设计因素:

第一,试测题嵌入位置。

在正式的CAT考试过程中,哪些题目位置被安排为试测题?

第二,试测题选题法。

如何根据题目临时参数和考生能力估计值将考生和试测题合理搭配?

第三,参数估计法。

如何将已有常规参数估计方法改编成适合在线标定情境的参数估计方法?

第四,试测终止规则。

在什么条件下终止一道试测题的试测过程?

测量学界对在线标定的探索始于20世纪80年代(Stog,1988)。

目前存在的研究可以归类为两大方向:一是对于在线标定情境下参数估计方法的开发(Ban,Hanson,Wang,Li&Harris,2001;,Way&g,2012;Segall,2003;Stog,1988)。

二是对试测题选题的探索(g&Lu,2010;,Way&g,2012;Kingsbury,2009;vanderLinden&Ren,2015)。

目前,研究试测题嵌入位置和试测终止规则的文献还较少。

另外,大多数可见文献都是关于单维二级评分模型下在线标定的讨论,而在其他模型下(如单维多项评分、多维度模型、认知诊断模型)的研究则仍处于起步状态。

下文将先对文献资料比较成熟的单维二级评分模型下的在线标定进行详细的论述,之后再对其他模型下的研究情况进行概括。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

电影空间黑粉五百万的影帝夫人又拽又凶柴刀流恋爱日常陵夭苍穹之上我真的没想当魔王啊侯门风华:拜见极品恶婆婆沈影帝的小甜妻七十年代掌中娇重生之学霸攻略被拉入群聊的创世神国民影后:老公,安分点!三国之上将邢道荣西游:大王不好,他又来抓食材了梦回大明春都市之大仙尊龙图案卷集·续重生之我是星二代镇国战神风水主播,一个关注全网官方慌了我在大明养生百年电影世界交换师仙酿师重生农女巧当家年代文中的小媳妇