简介:1984年下半年起,我们开始接触和研究项目反应理论(IRT)。到1986年7月,已经正式成功地编制了“高中数学水平自适应测验”。在实际测验的编制过程中,比较全面地应用了项目反应理论的原则和方法。我们感到,为了更好地实现考试方法和测验理论研究的现代化,有必要深入研究项目反应理论,并努力作出改进和创新。一、崭新的项目反应理论项目反应理论(ItemResponseTheory),是六十年代才得到迅速发展的一种崭新的测验理论。大家知道,根据经典方法所编制的测验,其难度、区分度和信度等技术质量指标,是严重依赖于样本的。也就是说,这样编出的测验,只适应于跟原先试测过程中所采用的样本非常类似的考生组。否则,测验结果就难以作出正确的解释。
简介:本研究以经典测试理论和项目反应理论为基础,对英汉版VocabularySizeTest前80个项目进行了结构效度研究,从被试能力、项目难度、词频分布和性别偏差四个方面证明了该版本VST对中国学生的适用性和局限性。研究显示:该版VST能有效检验受试者接受性词汇量并区分被试水平;项目分析体现了试卷良好的结构效度;词频段难度分布整体合理,1k-8k词频段难度总体呈由低到高的上升趋势,但6k-8k词频段的外来词对区分高水平受试者词汇量的效度有待商榷;男女生在测试中无显著性差异证明VST良好的结构效度。与国内外同类研究相比,本研究证明:借用国外的测试工具时,研究者更需要从中国学习者的学习环境出发,综合考虑词汇量表的测量方式,以使测试结果更加客观准确。
简介:大规模教育考试的维度与考试分数的意义解释、考生在考试中的行为表现解释密切相关。利用非参数项目反应理论模型选择试题组成单维量表,可以达到研究考试维度的目的。选择单维量表试题时,下界C值的确定,是个值得探讨的问题。用非参数项目反应理论模型对英语考试的三个量表维度研究发现,从每一个量表中只能选择出一个单维量表,而不是与每一部分测量的微技能数相应的多个单维量表;每一单维量表测量的均为该部分不同微技能的组合。这个特征表明这些单维量表均为基本单维量表,非严格单维量表。无论c值为0.3,还是0.2,选择出的基本单维量表均满足弱单调性要求,整个单维量表的区分功能不会有明显差异。