第一双因子IRT模型简介（第1页）

天才一秒记住【梧桐文学】地址：https://www.wtwx.net

第一节双因子IRT模型简介

banner"

尽管项目反应理论（IRT）实现了对被试潜在特质的精确估计，提高了测量的效率，解决了CTT模型的不足，但传统的单维IRT理论也存在一定的不足。

传统的IRT模型对测量变量的维度有所限制，模型一般会假设欲测量的心理特质是单维的，但实际上大量研究表明，这种假设在一些情况下是难以保证的，在数据不满足单维的条件下，强行使用单维的模型，可能会造成很大的测量误差，这种误差不仅在使用IRT模型的纸质测验中存在，在CAT中也同样存在。

Folk和Green（1989）把单维模型用在了两维数据上，比较了这种模型误用对CAT测验和传统测验造成的影响。

结果表明：当次要因子对测验的影响不显著时，传统测验下可以通过假设测验单维，从而采用单维模型；两个潜在维度不相关，且都对数据有显著的影响，使用任何一个维度的参数，均会引起特质参数估计的巨大差异；将单维模型用于多维数据引起的偏差在CAT上更加明显，因为单维模型的参数不仅会用于选题过程中，还会用来进行特质水平估计。

因此，建立被试反应与多种能力及项目特征之间的多维项目反应理论（MIRT）模型成了IRT近40年来研究较为活跃的领域之一（杜文久，肖涵敏，2012）。

正是基于上述的现状，在过去的几十年时间中，许多测量学研究者已经将IRT理论从单维的模型扩展到了多维的模型，并逐渐形成了多维项目反应理论。

例如，Bo（1981）基于以往的研究，将EM算法（EMAlgorithm）扩展到了多维情况中，形成了全息项目因素分析（FIIFA）的雏形。

在接下来的研究中，Bouraki（1988）在Bo的研究基础上正式地提出了全息项目因素分析的方法，从而将IRT模型扩展到了多维的数据中。

与以往的基于单维的IRT模型不同的是，在MIRT模型下，对于被试的潜在特质定位并不是在一个一维的连续体上进行的，而是在多维的空间中进行的（ReIRT能同时估计被试在测验每个维度上的能力水平，实现测验的认知诊断功能；另一方面，MIRT比项目反应理论更适用于分析许多新形式的测验，如认知诊断测验、公务员考试、表现性评估以及写作测验的项目和被试特征（毛秀珍，辛涛，2015）。

虽然多维IRT能够实现对多个维度的测量与评估，但在维度之间存在相关时，人们除了希望了解被试在各个维度上的潜在特质上的水平外，还希望获得对被试整体水平的评估，在这种情况下，如果同时考虑所有维度的信息，就可能会使得测验的估计精度下降。

为了解决这个问题，可以采用双因子模型拟合数据，在这个基础上，Gibbons等人进行了一系列的研究，并提出了全息项目双因子分析（Full-InformatioorAnalysis，FIIBFA），用以解决二值计分、多级计分的双因子数据的参数估计问题（Gibbons＆Hedeker，1992）。

全息项目双因子分析将传统的因素分析与项目反应理论相结合，分析所采用的模型可以看成一种多维的IRT模型，或是多维IRT模型的一个特例。

与传统MCAT相比，基于双因子模型开发的计算机自适应测验（BifaputerizedAdaptiveTesting，BCAT）具有一些天然优势：双因子IRT模型通过一般因素和特殊因素的设定，使得待估计参数大大减少，在一定程度上降低了参数估计的难度；同时由于模型本身的特点，不仅可以得到被试在某一具体维度上的表现，同时还能够获取被试在欲测心理品质上的总体水平。

但是总体看来，目前对双因子IRT以及双因子CAT的研究还非常薄弱，当前研究主要是集中在模型的构建以及参数估计方面，部分的研究将双因子IRT的模型用到了CAT中，但这些研究大多是从单维视角来进行的，即一般因素和特殊因素的选题过程及其特质参数估计是分开进行，而不是同时考虑多个维度的信息选题和估计，从这个角度上来看，这一类的双因子CAT并不算是完全意义上的多维CAT。

一、基于探索性因素分析模型的研究现状

传统的项目因素分析方法是基于经典线性因素分析（ClassiearFaalysis，CLFA）进行的，在这种模型下，是从观测变量间的线性相关矩阵或协方差矩阵出发来进行因素分析的。

但是这种方法存在的问题是，当“项目—特质”

回归线不一致，也就是难度、猜测度等项目参数不一致时，会产生虚假因素、高估维度数、低估因子负荷（俞宗火，戴海琦，唐小娟，2006）。

但在实际的心理测验中，项目的难度不一致，往往是一个不可避免的问题，在线性因素分析方法下，可能会产生虚假因素，即使能够估计出恰当的因素，也会导致有偏的因子载荷；除此之外，基于经典线性因素分析在对数据的使用方面也存在不足，由于只采用相关矩阵或协方差矩阵，并没有充分使用到被试的所有作答数据信息，因此，数据信息使用不充分。

针对经典线性因素分析中存在的不足，Bouraki（1988）在前人研究的基础上详细论述了一种基于IRT的题目因素分析方法，即前文提到的全息项目因素分析，这种方法是一种非线性的因素分析，相较于经典线性因素分析，这种方法的优势体现在以下三点。

第一，不需要计算题目之间的相关系数，并且不会受到题目数量的影响。

第二，作为一种非线性的因素分析方法，更符合心理研究中的实际数据非线性的情况。

第三，直接采用被试的作答结果进行估计，因此充分运用了被试作答的所有数据信息。

Bo（1981）在其论文中，根据Thurstoiple-Factor）模型，假设，存在一个由m个因素组成的模型，即

Xji：表示的是一种没办法观测到的“反应过程”

，也就是被试j在做第i题的过程中所需要的各种主要能力或潜在特质相互作用的过程；

θjk：表示的是被试j的第k种能力或是第k中潜在特质；

λik：表示的是第i题在第k种能力或是第k种潜在特质上的因子载荷；

εji：表示不能观测到的随机变量，服从正态分布均值为0，方差为σ2i的正态分布。

公式（8.1.1）反映的是一个补偿型的模型，即在一个维度上有较高的特质水平，能够对其他的特质水平低的维度起到补偿的作用。

除了补偿型的模型，还有其他的模型。

例如，存在交互作用的模型等，具体可以查阅文献。

根据上面的模型，可以得到二级计分题目的FIIFA模型。

被试j答对第i题的概率为

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

如遇章节错误，请点击报错(无需登陆)

第一 双因子IRT模型简介（第1页）

第一双因子IRT模型简介（第1页）