学科分类
/ 25
500 个结果
  • 简介:大规模教育考试的维度与考试分数的意义解释、考生在考试中的行为表现解释密切相关。利用参数反应理论模型选择试题组成单维量表,可以达到研究考试维度的目的。选择单维量表试题时,下界C值的确定,是个值得探讨的问题。用参数反应理论模型对英语考试的三个量表维度研究发现,从每一个量表中只能选择出一个单维量表,而不是与每一部分测量的微技能数相应的多个单维量表;每一单维量表测量的均为该部分不同微技能的组合。这个特征表明这些单维量表均为基本单维量表,严格单维量表。无论c值为0.3,还是0.2,选择出的基本单维量表均满足弱单调性要求,整个单维量表的区分功能不会有明显差异。

  • 标签: 非参数项目反应理论模型 教育考试 维度 单维量表
  • 简介:项目反应理论模型的参数估计一般需要较大样本量,小样本量条件下参数型与参数项目反应理论模型的相对优势并无定论。通过计算机模拟数据比较两类模型在小样本量时(n〈=200)估计项目特征曲线所产生的偏误及均方根误差。当模拟数据基于3PL模型生成时,参数型与参数型模型在样本量低于200时估值偏误方面无差别,但前者均方根误差较小。在样本量为200时,两模型估算值类似。当真实数据基于3PL模型且样本量小于200时,参数型Rasch模型比参数核平滑模型更值得推荐。

  • 标签: 项目反应理论 核平滑 项目特征曲线 非参数 模拟数据
  • 简介:探讨了几种常用的基于项目反应理论(IRT)的试题参数估计方法,并分析了每一种估计方法的优缺点及各自的适用领域,为构建基于IRT的试题库系统提供理论参考。

  • 标签: 项目反应理论 试题库 参数估计 遗传算法
  • 简介:项目反应数据的建模过程属于项目反应理论范畴,被称为现代测量理论。随着社会测量要求的广度和复杂度的增加,以及测量功能的不断扩展的要求,需要越来越复杂的项目反应模型来完成心理学、教育学、社会学等领域的测量任务。本文就当前较普遍以及发展迅速的项目反应复杂模型,如高阶、多维、多层模型进行论述,并且描述了复杂模型的参数评估技术,结合复杂模型的应用情况,期望本土的测量技术向客观化、尖端化发展。

  • 标签: 项目反应模型 高阶模型 多维模型 多层模型
  • 简介:摘要:随着科技日新月异的发展,心理与教育测量领域也迎来了新的伙伴——人工智能。在素质化教育进程不断加快的今天,人们越来越关注项目反应理论与人工智能会产生出什么样的火花。本文就此话题展开,介绍在未来项目反应理论与人工智能相结合的发展趋势。

  • 标签: 项目反应理论 人工智能 相关思考
  • 简介:概化理论项目反应理论是两大现代测量理论,广泛应用于心理测评实践中。但是,两种理论都有优势与弱势,宜将它们进行整合,包括"黏合"与"融合"两种形式。对比"黏合","融合"能够产生一种新模型,能够使得两种理论有效走向统一、取长补短。总结了五种将两种理论有效"融合"的模型,包括MM、HRM、GIRM、GIRMT和其他模型,指出了相关研究存在的一些问题。

  • 标签: 概化理论 项目反应理论 模型整合 融合模型
  • 简介:】文章简要介绍外语试题库建设所必须具备的基本条件及其指导理论——项目反应理论(IRT)的核心单参数模式,分析该理论的优点、本质及其局限。

  • 标签: 外语测试 试题库 项目反应 单参数模式
  • 简介:项目反应理论中logistic模型翻译为“比率对数”模型,可以比较适当地表达该词的统计学意义,便于解释和交流。像常态曲线分布一样,比率对数分布同样具有对称分布的特性,只是尾部较常态分布稍微大一些,不易受分布两端极端分数的影响。比率对数的累积分布函数与平均值为0、标准差为1.7的常态分布的累积函数在所有分数点上都小于0.01。更重要的是,比率对数模型较常态分布模型更便于进行数学运算和解释,在项目反应理论中比率对数模型是试题和考生能力参数的直接函数。

  • 标签: 项目反应理论 比率对数模型 胜算比对数函数
  • 简介:摘要:随着计算机技术的发展,智能化教育越来越受到重视,项目反应理论作为一种现代测量理论,与智能化教育结合将产生更大的优势,本文介绍了在教育测量中项目反应理论现有的应用,并对未来可能的发展方向做出展望。

  • 标签: 项目反应理论 智能化教育 教育测评 IRT
  • 简介:本研究基于项目反应理论,探索题目变动的公开招聘考试的最优题型。利用《北京市新进人员通用能力考试》专业技术岗位1000名考生成绩,通过探索性因素分析保证仅包含一个维度的情况下,使用项目反应理论等级反应模型分析10个题型的性能。先将各个题型不同题目的得分加和,将不同得分的频数转换为等级,分别计算区分度、难度、类别反应曲线和信息函数。最优题型用两种方法确定,一是选取信息量占比高于均值的题型,二是排除各种参数达不到常用标准的题型。两种方法得到非常接近的结果,即逻辑推理、图表解读、短文加工、阅读理解四个题型最优。

  • 标签: 项目反应理论 经典测量理论 等级反应模型 类别反应曲线
  • 简介:由于近现代大生产是建立在科学发展的基础上的,因此,对人的智能水平作出正确评估,为发现、培养与使用人员提供可靠依据,就不仅是教育,而且是经济发展中的一个极为重要的问题。正是在强有力的社会客观要求的推动下,在新的心理与教育学理论

  • 标签: 经典测验理论 项目反应理论 被试 项目参数 项目区分度 特性曲线
  • 简介:对IRT模型应用中须注意的几个重要问题做了分析与探讨,包括模型的假设,模型的拟合,模型对样本大小的要求等,虽然分析与探讨这些问题时主要以单维参数IRT模型为焦点,但参数IRT模型以及多维IRT模型的应用也同样涉及这些问题。这些模型拥有某些特别的优势,在某些情况下应用是恰当的,但在健康评估领域并不是全部适用。

  • 标签: 项目反应理论 模型假设 模型选取 模型拟合 样本量
  • 简介:1984年下半年起,我们开始接触和研究项目反应理论(IRT)。到1986年7月,已经正式成功地编制了“高中数学水平自适应测验”。在实际测验的编制过程中,比较全面地应用了项目反应理论的原则和方法。我们感到,为了更好地实现考试方法和测验理论研究的现代化,有必要深入研究项目反应理论,并努力作出改进和创新。一、崭新的项目反应理论项目反应理论(ItemResponseTheory),是六十年代才得到迅速发展的一种崭新的测验理论。大家知道,根据经典方法所编制的测验,其难度、区分度和信度等技术质量指标,是严重依赖于样本的。也就是说,这样编出的测验,只适应于跟原先试测过程中所采用的样本非常类似的考生组。否则,测验结果就难以作出正确的解释。

  • 标签: 项目反应理论 被试 测验结果 项目参数 数学水平 考试方法
  • 简介:本研究以经典测试理论项目反应理论为基础,对英汉版VocabularySizeTest前80个项目进行了结构效度研究,从被试能力、项目难度、词频分布和性别偏差四个方面证明了该版本VST对中国学生的适用性和局限性。研究显示:该版VST能有效检验受试者接受性词汇量并区分被试水平;项目分析体现了试卷良好的结构效度;词频段难度分布整体合理,1k-8k词频段难度总体呈由低到高的上升趋势,但6k-8k词频段的外来词对区分高水平受试者词汇量的效度有待商榷;男女生在测试中无显著性差异证明VST良好的结构效度。与国内外同类研究相比,本研究证明:借用国外的测试工具时,研究者更需要从中国学习者的学习环境出发,综合考虑词汇量表的测量方式,以使测试结果更加客观准确。

  • 标签: VST RASCH模型 结构效度
  • 简介:测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。

  • 标签: 分数等值 样本量 锚题
  • 简介:为了有助于促进国内测评领域从业人员提高专业素质,《考试研究》从2011年起设置"测评课堂"栏目,刊载系列用以指导考试、评价实践的文章。近期将以美国教育测量学会(NCME)2010年年会(科罗拉多州,丹佛)的部分"培训课程"(TrainingSession)的相关主题为主要内容。首期主题为"考试等值及连接理论与技术入门",

  • 标签: 项目反应理论 经典测量理论 基本术语 连接 等值 概念
  • 简介:摘要目的应用项目反应理论(item response theory,IRT)和知识图谱(knowledge graph,KG)探析衡量医学专业课程重点与难点的量化指标,以期为促进精细化教学管理提供参考和借鉴。方法2022年1月,基于运动疗法学课程大纲编制知识点难度问卷,对完成课程期末考试的南京中医药大学2019级康复治疗学专业119名学生进行知识点难度自评调查。提取学生考试成绩及其对61个课程专有知识点的自评结果,基于IRT进行摩肯量表分析和罗氏模型构建,评估学生的学习能力及其与考试成绩的相关性,并估算知识点的难度值;借助KG技术量化测评知识点的相关关系,并提取和分析KG核心结构。结果摩肯量表分析筛选出42个知识点用于构建罗氏模型,所得模型具有良好的拟合度(拟合度检验P=0.065)、信度(克隆巴赫系数为0.968)和效度(学生的考试成绩与模型估算的学习能力值呈显著弱相关:P=0.014,r=0.23)。各知识点难度的模型拟合度良好(Bonferroni校正P值均>0.05)。KG的核心结构覆盖61个知识点,可视化分析结果显示其呈现为含有枢纽节点的层次支配结构。结论IRT模型和KG技术相结合,可以量化测评学生的学习能力和知识的重点和难点,为医学专业课程的教学提供精细化管理工具。

  • 标签: 运动疗法 项目反应理论 知识图谱 教学管理
  • 简介:题库建设在我国尚处起步阶段,本文拟就题库建设的意义、理论与方法作一探讨,以利于高校招生考试改革的研究。加强题库建设是当务之急我国高考制度正在进行重大改革,其中重要一环是把原来高校招生的一次性考试,改为采用中学毕业会考和高校招生性向考试相结合的方法,以求克服原来把高校选拔考试和中学毕业水平考试相混淆的弊端,使之既有利于高校选拔德智体全面发展的优秀学生,又有利于中等教育的健康发展。高考改革基本的要求应该是,无论是会考还是专业性向考试,都必须做到科学、合理,真正起到鉴定和选拔的作用。为此应迅速建立适

  • 标签: 题库建设 项目反应理论 高考改革 题库管理 考试改革 毕业会考
  • 简介:就正答唯一性对测量效果的影响进行探讨。研究结果显示,无论是填空题型还是多选一题型,唯一正答类题目的区分度均好于多正答类型,两种题型的唯一正答类题目的测试信息量均显著高于多正答类型。在唯一正答的范围内,两种题型的同类项目参数值都有显著性差异;在多正答范围内,两种题型的项目区分度之间的差异不显著。

  • 标签: 题干 选项 项目参数 信息量