第二可修改答案的计算机化自适应测验设计与方法（第7页）

天才一秒记住【梧桐文学】地址：https://www.wtwx.net

表7-2-2RCAT选题策略及其优缺点

表7-2-3RCAT模型及其优缺点

（二）展望

目前有关RCAT这方面的研究并不多，本文在已有研究的基础上对未来的研究提出几点展望。

第一，未来研究需采用MonteCarlo模拟研究及实证研究综合比较以上RCAT设计、选题策略、计量模型的效果及特点，为实际应用者在RCAT的设计方案、选题策略及模型选用上提供参考及支持。

第二，vanderLinden和Jeon（2012）提出被试两次作答的题目参数应该不同，基于此提出了条件概率模型。

研究结果发现修改阶段的题目难度和区分度参数都高于第一阶段，其中难度参数的差异程度要大于区分度参数。

但是其余模型和方法都假设：在修改阶段题目参数并未改变。

然而修改情境可能会使题目参数发生改变。

那么假设两次作答题目参数在可能改变的情况下，如何在未来的研究中兼顾这点值得关注。

第三，CAT大致可分为定长CAT和变长CAT，前者固定的测验长度不利于使所有被试水平都得到恰当的估计，或者一些被试得到恰当估计能力水平后还需额外作答题目，所以在部分测验的实际应用中并不理想。

变长CAT可以克服以上缺点，本文所述的RCAT的控制方法都是在定长CAT中所进行的研究，这些方法在变长CAT中的效果能否产生同样的效果？如果不能应该做出怎么样的调整？例如，重新安排题目顺序方法的一个较大的缺陷：最后参与能力估计的题目过少导致额外的估计误差。

那么在变长CAT中这种缺陷导致的误差可能就会降低。

第四，现有的有关RCAT的方法都有各自的优点和缺陷，如何在应用中将这些方法有机结合起来，取长补短？例如，逻辑斯蒂克4参数模型和IP方法结合起来使用，前者的失误参数对能力估计精度的偏差进行一定的修正，后者能够降低“人题”

不匹配的误差。

逻辑斯蒂克4参数模型和SIIS选题策略结合使用，这两种方法分别从模型和选题角度对能力估计产生的误差进行了修正。

再如，也可以试着将条件概率模型和综合评分模型结合在一起，通过条件概率模型计算被试修改答对的概率，然后把答对概率作为综合评分模型中的第二次作答的权重，这样就可以计算得到被试最终在修改题目的期望得分。

综合评分模型在对抗“Wainer”

策略的效果不理想，但是RCAT测验设计中的方法可以有效对抗“Wainer”

策略。

因而，未来的研究者可以考虑这些方法的两两结合甚至两个以上结合。

事实上前文所述的有关RCAT的控制方法，很多都可以视具体的研究内容相互融合使用。

未来的研究者可以朝着这个方向开展研究。

第五，CD-CAT在CAT的基础上发展而来，同时赋予传统CAT新的功效——认知诊断（涂冬波，蔡艳，戴海琦，漆树青，2008）。

同样地，CD-CAT测验因不允许被试修改答案，也面临着和传统CAT同样的困境。

CAT注重测验的结果，对测验分数背后隐藏的内部心理加工过程、加工技能、认知结构等无法提供进一步的信息。

CD-CAT主要在于对被试的知识掌握状态进行诊断，帮助被试有针对性地做出补救，所以被试在作答过程中并没有必要使用CAT中的“作弊”

策略，并且被试要想通过“作弊”

策略来获得高分或正偏能力估计值的机会不大（Vispoel，Rog＆Bleiler，1999；Davey＆Faa，Ximénez＆Abad，2000）。

因此，未来的研究者对可修改答案CD-CAT进行研究的时候，借鉴RCAT的方法的同时可以适当减少对于“作弊”

策略的考虑。

思考题：

1.与CAT相比，RCAT有什么优势与不足？

2.目前RCAT常用的测验测试设计方法有哪些？

3.RCAT选题策略有哪些及其特点如何？

4.基于模型视角的RCAT中有哪些模型？

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第二 可修改答案的计算机化自适应测验设计与方法（第7页）