梧桐文学

第一 计算机化自适应测验理论基础 项目反应理论(第1页)

天才一秒记住【梧桐文学】地址:https://www.wtwx.net

第一节计算机化自适应测验理论基础:项目反应理论

banner"

>

一、项目反应理论

项目反应理论(IRT)也被称为潜在特质理论(LatentTraitTheory,LTT),它假设被试观察的项目反应结果由被试潜在特质(或潜在能力)与测验项目共同决定,被试在某项目上答对或答错是受被试潜在能力和项目特征(如项目难度)等共同影响;项目反应理论采用项目反应函数(ItemRespoion,IRF)来模拟、解释、预测被试潜在能力及项目特征是如何影响被试在特定项目上的作答反应结果,同时综合被试在所有测验项目上的作答反应结果以及项目反应函数来估计被试的潜在能力和项目参数。

经典测量理论(ClassigTheory,CTT)中,测验总分常被用于估计被试的潜在能力,也即CTT一般把可观察的测验总分作为被试潜在能力的估计值,并根据测验总分的高低来判定被试能力水平的高低。

CTT假设,被试观察分数(X)主要受两个因素影响,一个是被试的能力真值(T,即真分数,相当于被试的潜在能力),另一个是误差分数(E,即测量误差),它们之间的数学函数表达式为

从式(2.1.1)中可以看出:第一,CTT假设被试的观察分数与被试真分数及测量误差分数存在简单相加的函数关系。

第二,CTT是在测验整体层面解释被试潜在能力是如何影响被试测验总分结果的。

第三,CTT没有直接考察测验项目特征(如项目难度)是如何影响被试在项目以及测验上的得分的,即公式(2.1.1)没有项目参数。

显然,测验总分即观察分数(X)作为被试潜在能力的估计值是比较粗糙的,它并没有深入分析不同测验项目对观察分数的影响,并会导致不同测验下的分数无法比较。

第四,CTT一般只能对所有被试计算一个笼统的测量误差(E),也即一个笼统的测量信度,从而无法深入分析测验对不同被试测量误差的不同。

而项目反应理论则试图突破CTT的以上不足。

二、项目反应模型

与CTT一样,项目反应理论也采用数学函数来解释、预测被试的潜在能力与被试作答反应间的关系。

但与CTT不同的是,IRT是基于更为细致的项目层面来进行建模,同时深入考察项目特征这一重要影响因素。

在IRT中,这种用来描述、解释被试在测验项目上的作答反应的数学函数被称为项目反应模型(ItemResponseModel,IRM)。

心理测量学者们根据测验项目记分方式、测量的维度等特征开发出了不同类型的项目反应模型,如二级评分模型、多级评分模型、多维模型等。

(一)二级评分IRT模型

二级评分项目是指被试在项目上的观察反应得分只有两种,答对或答错,即被试在该项目上要么得0分,要么得满分;而用于分析二级评分项目的数学模型(项目反应模型)则称为二级评分项目反应模型。

这种模型适合分析单项选择题、填空题等二级评分的题型。

较为常用的三参数Logistic模型(3PLM)如下:

其中Xij指被试i在项目j上的观察得分;

Pij指被试i在项目j上的答对概率;

θi指被试i的潜在能力值,即能力参数;

aj指项目j的区分度参数;

bj指项目j的难度参数;

cj指项目j的猜测度参数;

D是一常数,取值1.702。

若假设项目不存在猜测度,即可以简化为两参数Logistic模型(2PLM),即

若在2PLM基础上,假设所有项目区分度相等,则2PLM可以简化为单数Logistic模型(2PLM)或拉希模型(RaschModel),即

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

电影空间黑粉五百万的影帝夫人又拽又凶柴刀流恋爱日常陵夭苍穹之上我真的没想当魔王啊侯门风华:拜见极品恶婆婆沈影帝的小甜妻七十年代掌中娇重生之学霸攻略被拉入群聊的创世神国民影后:老公,安分点!三国之上将邢道荣西游:大王不好,他又来抓食材了梦回大明春都市之大仙尊龙图案卷集·续重生之我是星二代镇国战神风水主播,一个关注全网官方慌了我在大明养生百年电影世界交换师仙酿师重生农女巧当家年代文中的小媳妇