第一计算机化自适应测验理论基础项目反应理论（第3页）

天才一秒记住【梧桐文学】地址：https://www.wtwx.net

2.基于除总模式的多级评分IRT模型

除总模式中，被试得T分的概率被定义为部分除以总体的关系，如Masters（1982）的分部评分模型（PCM）属于除总模式。

在PCM中，被试得T分的概率表现为部分与整体的比值，即

第一步，7.50.3＝25

………1分

第二步，25-16＝9

………2分

用δjt来表示项目第T步的难度，记住δjt的含义与GRM中的bjt的含义不同，bjt指得T分的难度。

PCM中，δjt不一定满足单调递增性，因为有的项目第一步非常难，而最后一步可能非常容易，因此PCM强调的是项目每个步骤的难度，而GRM强调的是被试得各个分数的难度（满足bj1≤bj2≤bj3≤…≤bjmj），图2-1-3和图2-1-4为两个模型难度的区别。

图2-1-3分步评分模型PCM项目步难度（ItemStepDifficulties）参数

图2-1-4等级反应模型GRM项目难度（ItemDifficulties）参数

记被试从第（t-1）步正确跳到第T步的概率为Φ（t），记被试得T分的概率为P（t），则有

即被试答对第T步的概率Φ（t）只受到被试能力θ和项目第T步的难度δjt影响，而与其他步骤的难度δjk（k≠t）无关。

则根据公式（2.1.13）可得

求解上式方程组，可分别求解出P（0）、P（1）、P（2）和P（3）的数学表达式，即

上式即为分部评分模型的项目反应函数，同时限定∑0v=0（θ-δjv）≡0。

需要指出的是，分部评分模型只考虑了项目难度参数对被试反应概率的影响，并没有考虑区分度在项目反应过程的作用。

鉴此，Muraki（1992）对分部评分模型进行拓广，把项目区分度也加入项目反应函数中，提出了拓广分部评分模型（GPCM），GPCM项目反应函数为

除了分部评分模型和拓广分部评分模型外，评定量表模型以及称名反应模型等也均属除总模式的多级评分IRT模型，限于篇幅，对这些模型的介绍不再一一展开，感兴趣的读者可参考相关文献。

三、项目反应理论假设

项目反应理论采用数学函数（项目反应模型）来解释被试在项目上的作答反应，而这些函数的建立是基于一定的假设之下。

（一）能力单维性假设

不论是Logistic模型，还是GRM或PCM等，这些项目反应模型中涉及的被试能力（θ）维度只有一个，即测验测量的维度为单维。

如果测验测量为多维时，以上模型的项目反应模型都无法准确解释、预测被试不同维度的能力是如何影响被试在项目上的作答的，因此以上模型仅适用于测量单维情境。

但在实际中，被试要正常完成一个项目任务往往会涉及多个能力（测验维度为多维），那如何进行IRT分析呢？随着测量技术的不断发展，学者们已提出了多维项目反应理论，从而使IRT模型从只能处理单维数据拓展到了多维数据，关于多维项目反应理论的介绍可参考本书第五章。

能力单维性假设只是针对单维IRT模型，而对于多维IRT模型则无须这条假设，因此读者需要辩证地看待IRT的这条假设。

（二）局部独立性假设

局部独立性假设在估计项目参数和被试参数时会涉及。

我们知道，IRT模型中，能力参数（θ）和项目参数（a，b）都是未知参数，是需要进行估计的；而实际中能获取的是一群被试在测验每个项目上的得分情况或得分矩阵（该得分矩阵中行为被试，列为项目，中间的元素代表某被试在某题上的实际观察得分），因此IRT需要根据该已知的得分矩阵去估计未知的项目参数和被试参数。

IRT在估计这些未知参数时，构建了似然函数（LikelihoodFun），即被试具有这种观察到得分矩阵的联合概率。

接下去以一个实例来说明似然函数的构造：

若3个被试在4个项目上的得分矩阵U为

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第一 计算机化自适应测验理论基础 项目反应理论（第3页）