期刊网_中国期刊网

项目反应理论与人工智能

作者：罗光初
学科：文化科学 > 教育学
创建时间：2024-03-28
出处：《时代教育》 2024年第2期
机构：江西师范大学心理学院·江西南昌· 330022

简介：摘要：随着科技日新月异的发展，心理与教育测量领域也迎来了新的伙伴——人工智能。在素质化教育进程不断加快的今天，人们越来越关注项目反应理论与人工智能会产生出什么样的火花。本文就此话题展开，介绍在未来项目反应理论与人工智能相结合的发展趋势。
标签：项目反应理论人工智能相关思考

全文阅读

外语试题库建设与项目反应理论

作者：王建华
学科：文化科学 > 职业技术教育学
创建时间：1999-01-28
出处：《南宁职业技术学院学报》 1999年第S2期

简介：】文章简要介绍外语试题库建设所必须具备的基本条件及其指导理论——项目反应理论(IRT)的核心单参数模式,分析该理论的优点、本质及其局限。
标签：外语测试试题库项目反应单参数模式

全文阅读

基于项目反应理论的试题参数估计方法

作者：薛宝山
学科：文化科学 > 高等教育学
创建时间：2010-01-11
出处：《贵阳学院学报：自然科学版》 2010年第1期

简介：探讨了几种常用的基于项目反应理论（IRT）的试题参数估计方法，并分析了每一种估计方法的优缺点及各自的适用领域，为构建基于IRT的试题库系统提供理论参考。
标签：项目反应理论试题库参数估计遗传算法

全文阅读

项目反应理论复杂模型发展与参数估计

作者：曾毅;吴顺领
学科：文化科学 > 教育学
创建时间：2017-05-15
出处：《考试研究》 2017年第5期

简介：项目反应数据的建模过程属于项目反应理论范畴,被称为现代测量理论。随着社会测量要求的广度和复杂度的增加,以及测量功能的不断扩展的要求,需要越来越复杂的项目反应模型来完成心理学、教育学、社会学等领域的测量任务。本文就当前较普遍以及发展迅速的项目反应复杂模型,如高阶、多维、多层模型进行论述,并且描述了复杂模型的参数评估技术,结合复杂模型的应用情况,期望本土的测量技术向客观化、尖端化发展。
标签：项目反应模型高阶模型多维模型多层模型

全文阅读

项目反应理论中Logistic模型中文翻译的说明

作者：刘育明;张煜
学科：文化科学 > 教育学
创建时间：2017-08-18
出处：《教育测量与评价》 2017年第8期

简介：项目反应理论中logistic模型翻译为“比率对数”模型,可以比较适当地表达该词的统计学意义,便于解释和交流。像常态曲线分布一样,比率对数分布同样具有对称分布的特性,只是尾部较常态分布稍微大一些,不易受分布两端极端分数的影响。比率对数的累积分布函数与平均值为0、标准差为1.7的常态分布的累积函数在所有分数点上都小于0.01。更重要的是,比率对数模型较常态分布模型更便于进行数学运算和解释,在项目反应理论中比率对数模型是试题和考生能力参数的直接函数。
标签：项目反应理论比率对数模型胜算比对数函数

全文阅读

项目反应理论在智能化教育中的作用

作者：王慧杰
学科：文化科学 > 教育学
创建时间：2024-03-28
出处：《时代教育》 2024年第2期
机构：江西师范大学心理学院·江西南昌·330022

简介：摘要：随着计算机技术的发展，智能化教育越来越受到重视，项目反应理论作为一种现代测量理论，与智能化教育结合将产生更大的优势，本文介绍了在教育测量中项目反应理论现有的应用，并对未来可能的发展方向做出展望。
标签：项目反应理论智能化教育教育测评 IRT

全文阅读

基于项目反应理论的公开招聘考试的最优题型选择

简介：本研究基于项目反应理论,探索题目变动的公开招聘考试的最优题型。利用《北京市新进人员通用能力考试》专业技术岗位1000名考生成绩,通过探索性因素分析保证仅包含一个维度的情况下,使用项目反应理论等级反应模型分析10个题型的性能。先将各个题型不同题目的得分加和,将不同得分的频数转换为等级,分别计算区分度、难度、类别反应曲线和信息函数。最优题型用两种方法确定,一是选取信息量占比高于均值的题型,二是排除各种参数达不到常用标准的题型。两种方法得到非常接近的结果,即逻辑推理、图表解读、短文加工、阅读理解四个题型最优。
标签：项目反应理论经典测量理论等级反应模型类别反应曲线

全文阅读

一种与经典测验理论有别的方法——项目反应理论评介

简介：由于近现代大生产是建立在科学发展的基础上的,因此,对人的智能水平作出正确评估,为发现、培养与使用人员提供可靠依据,就不仅是教育,而且是经济发展中的一个极为重要的问题。正是在强有力的社会客观要求的推动下,在新的心理与教育学理论
标签：经典测验理论项目反应理论被试项目参数项目区分度特性曲线

全文阅读

项目反应理论模型应用中需要注意的几个问题

作者：王芳;燕雁;赵守盈
学科：文化科学 > 课程与教学论
创建时间：2015-02-12
出处：《中国考试》 2015年第2期

简介：对IRT模型应用中须注意的几个重要问题做了分析与探讨，包括模型的假设，模型的拟合，模型对样本大小的要求等，虽然分析与探讨这些问题时主要以单维参数IRT模型为焦点，但非参数IRT模型以及多维IRT模型的应用也同样涉及这些问题。这些模型拥有某些特别的优势，在某些情况下应用是恰当的，但在健康评估领域并不是全部适用。
标签：项目反应理论模型假设模型选取模型拟合样本量

全文阅读

考生智能水平的自适应测验——项目反应理论的重要应用

作者：
学科：文化科学 > 教育学
创建时间：1987-02-12
出处：《江西师范大学学报：哲学社会科学版》 1987年第2期

简介：1984年下半年起,我们开始接触和研究项目反应理论(IRT)。到1986年7月,已经正式成功地编制了“高中数学水平自适应测验”。在实际测验的编制过程中,比较全面地应用了项目反应理论的原则和方法。我们感到,为了更好地实现考试方法和测验理论研究的现代化,有必要深入研究项目反应理论,并努力作出改进和创新。一、崭新的项目反应理论项目反应理论(ItemResponseTheory),是六十年代才得到迅速发展的一种崭新的测验理论。大家知道,根据经典方法所编制的测验,其难度、区分度和信度等技术质量指标,是严重依赖于样本的。也就是说,这样编出的测验,只适应于跟原先试测过程中所采用的样本非常类似的考生组。否则,测验结果就难以作出正确的解释。
标签：项目反应理论被试测验结果项目参数数学水平考试方法

全文阅读

基于经典测试理论和项目反应理论的VST测试工具效度研究

作者：赵平;纪晓丽
学科：文化科学 > 教育学
创建时间：2016-02-12
出处：《外语测试与教学》 2016年第2期

简介：本研究以经典测试理论和项目反应理论为基础,对英汉版VocabularySizeTest前80个项目进行了结构效度研究,从被试能力、项目难度、词频分布和性别偏差四个方面证明了该版本VST对中国学生的适用性和局限性。研究显示：该版VST能有效检验受试者接受性词汇量并区分被试水平;项目分析体现了试卷良好的结构效度;词频段难度分布整体合理,1k-8k词频段难度总体呈由低到高的上升趋势,但6k-8k词频段的外来词对区分高水平受试者词汇量的效度有待商榷;男女生在测试中无显著性差异证明VST良好的结构效度。与国内外同类研究相比,本研究证明：借用国外的测试工具时,研究者更需要从中国学习者的学习环境出发,综合考虑词汇量表的测量方式,以使测试结果更加客观准确。
标签： VST RASCH模型结构效度

全文阅读

考生样本量对项目反应理论（IRT）等值稳定性的影响

作者：马洪超
学科：文化科学 > 教育学
创建时间：2011-02-12
出处：《考试研究》 2011年第2期

简介：测验等值使得不同形式的考试能进行比较，从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换，等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试（HSK）阅读分测验，采用真实数据模拟共同组锚测验设计，确定等值的参照标准，考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明，考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时，等值误差不降反增。
标签：分数等值样本量锚题

全文阅读

基于经典测量理论和项目反应理论的等值与连接——主要概念和基本术语

作者：约瑟夫·M·瑞安
学科：文化科学 > 教育学
创建时间：2011-01-11
出处：《考试研究》 2011年第1期

简介：为了有助于促进国内测评领域从业人员提高专业素质,《考试研究》从2011年起设置＂测评课堂＂栏目,刊载系列用以指导考试、评价实践的文章。近期将以美国教育测量学会（NCME）2010年年会（科罗拉多州,丹佛）的部分＂培训课程＂（TrainingSession）的相关主题为主要内容。首期主题为＂考试等值及连接理论与技术入门＂,
标签：项目反应理论经典测量理论基本术语连接等值概念

全文阅读

从项目特征曲线的估算比较参数型及非参数型项目反应理论模型

作者：吴琼;Pui-wa Lei
学科：文化科学 > 教育学
创建时间：2015-06-16
出处：《考试研究》 2015年第6期

简介：项目反应理论模型的参数估计一般需要较大样本量,小样本量条件下参数型与非参数型项目反应理论模型的相对优势并无定论。通过计算机模拟数据比较两类模型在小样本量时（n〈=200）估计项目特征曲线所产生的偏误及均方根误差。当模拟数据基于3PL模型生成时,参数型与非参数型模型在样本量低于200时估值偏误方面无差别,但前者均方根误差较小。在样本量为200时,两模型估算值类似。当真实数据基于3PL模型且样本量小于200时,参数型Rasch模型比非参数核平滑模型更值得推荐。
标签：项目反应理论核平滑项目特征曲线非参数模拟数据

全文阅读

基于经典测量理论和项目反应理论的等值与连接——等值设计和经典测量理论等值程序

作者：约瑟夫·M·瑞安;杜承达;谢小庆
学科：文化科学 > 教育学
创建时间：2011-02-12
出处：《考试研究》 2011年第2期

简介：导言笔者连续写作了三篇论文探讨测验等值和连接的概念、程序、应用以及存在的问题等，本文是这一系列论文的第二篇。本系列
标签：测验等值经典测量理论项目反应理论程序连接设计

全文阅读

用非参数项目反应理论模型研究大规模教育考试维度的问题

作者：雷新勇
学科：文化科学 > 教育学
创建时间：2007-03-13
出处：《华东师范大学学报：教育科学版》 2007年第3期

简介：大规模教育考试的维度与考试分数的意义解释、考生在考试中的行为表现解释密切相关。利用非参数项目反应理论模型选择试题组成单维量表，可以达到研究考试维度的目的。选择单维量表试题时，下界C值的确定，是个值得探讨的问题。用非参数项目反应理论模型对英语考试的三个量表维度研究发现，从每一个量表中只能选择出一个单维量表，而不是与每一部分测量的微技能数相应的多个单维量表；每一单维量表测量的均为该部分不同微技能的组合。这个特征表明这些单维量表均为基本单维量表，非严格单维量表。无论c值为0．3，还是0．2，选择出的基本单维量表均满足弱单调性要求，整个单维量表的区分功能不会有明显差异。
标签：非参数项目反应理论模型教育考试维度单维量表

全文阅读

加强题库建设搞好高考改革——兼谈项目反应理论在题库建设中的应用

作者：侯光文
学科：文化科学 > 教育学
创建时间：1988-01-11
出处：《当代教育科学》 1988年第1期

简介：题库建设在我国尚处起步阶段,本文拟就题库建设的意义、理论与方法作一探讨,以利于高校招生考试改革的研究。加强题库建设是当务之急我国高考制度正在进行重大改革,其中重要一环是把原来高校招生的一次性考试,改为采用中学毕业会考和高校招生性向考试相结合的方法,以求克服原来把高校选拔考试和中学毕业水平考试相混淆的弊端,使之既有利于高校选拔德智体全面发展的优秀学生,又有利于中等教育的健康发展。高考改革基本的要求应该是,无论是会考还是专业性向考试,都必须做到科学、合理,真正起到鉴定和选拔的作用。为此应迅速建立适
标签：题库建设项目反应理论高考改革题库管理考试改革毕业会考

全文阅读

正答唯一性对测量效果的影响——项目反应理论框架内答题方式的比较研究

作者：张一平;张丽娜
学科：文化科学 > 教育学
创建时间：2018-02-12
出处：《考试研究》 2018年第2期

简介：就正答唯一性对测量效果的影响进行探讨。研究结果显示,无论是填空题型还是多选一题型,唯一正答类题目的区分度均好于多正答类型,两种题型的唯一正答类题目的测试信息量均显著高于多正答类型。在唯一正答的范围内,两种题型的同类项目参数值都有显著性差异;在多正答范围内,两种题型的项目区分度之间的差异不显著。
标签：题干选项项目参数信息量

全文阅读

多项选择题与填空题对测量效果的影响——在项目反应理论框架内答题方式的比较研究

作者：张丽娜;张一平
学科：文化科学 > 教育学
创建时间：2017-03-13
出处：《考试研究》 2017年第3期

简介：本研究是关于项目形式对测量效果的影响研究。研究结果显示，在题干等价的条件下，填空形式的难度一般高于多选一形式；两种形式在区分度上没有显著差异，如果能给出恰当的选择项，多选一形式的区分度可能会高于填空形式。同时，两种项目形式所测量能力的维度差异不大，但对于较低能力层的被试，多选一形式的测量效果相对较好，而对于较高能力层的被试，则填空形式的测量效果比较好。
标签：多选一形式填空形式项目参数信息量