学科分类
/ 25
500 个结果
  • 简介:作者指出颈椎损伤大多数根据力学或形态学进行分类,不能对稳定性进行量化。同神经功能一样,稳定性是关系到治疗和预后的一个主要决定因素。本文的目的是研究一种针对下颈椎(C3~7)损伤的稳定性进行量化的方法的可信度。在该量化系统中,每一脊柱节段被分成4部分(前、后、右柱和左柱),每一部分均根据骨折移位和韧带损伤的严重性单独进行评分

  • 标签: 损伤严重度评分 颈椎损伤 可信度 评估 稳定性 神经功能
  • 简介:近年来,随着学习自主逐渐成为外语教学的研究重点之一,自我评估和学生互评作为该概念在评估测试领域的重要体现,也越来越受到研究们的关注。然而,在中国的英语教学环境下针对中国英语学习的相关研究却不多见。本文旨在研究中国大学生二语写作自我评估和学生互评的评分信度。通过对中国科学技术大学52位非英语专业大一学生二语写作自我评估和学生互评的调查,作者发现:学生自我评估的信度为0.432,互评的信度为0.202;自评有高估的趋势,而互评则有低估的趋势;自评和互评均有高估低表现、低估高表现的倾向。

  • 标签: 自我评估 学生互评 学习者自主
  • 简介:主观性考试的评分信度问题一直是语言测试研究体系中的重要组成部分.据以往研究.评分员如何把握评分标准对评分信度具有至关重要的作用,鉴于此,本研究从2009年4月HSK(高等)写作测试评分的48组评分员中随机抽取了两组(每组中一老一新两名评分员),运用概化理论对两组的评分信度进行了检验,结果表明两组的测验信度较高;通过比较评分员问评分数据的描述性统计结果以及调查问卷,大致了解到新老评分员在对评分标准把握中的不同,这些因素也导致他们在评分过程中产生评分差异。

  • 标签: 写作测试 信度 概化理论
  • 简介:本文以某届国际奥林匹克运动会女子跳水决赛为例,综合应用CTT、GT和IRT三大测量理论进行评分信度分析,从不同角度揭示评分之间和评分内部的差异情况。结果表明:CTT的评分信度分别为0.981和078;GT的概化系数和可靠性指数分别为0.8279和0.8271,比赛中所采用的7名评委分别对选手在5轮上的跳水表现进行评定的决策是比较适宜的决策;在IRT中,相对而言,评委5在7名评委中最为严厉,评委2最为宽松,但评委之间在宽严程度上的差异不显著,评委1和评委4在自身一致性上存在问题,不同评委在评定不同选手、不同难度系数动作和不同轮数上存在偏差,但未达到显著性水平。基于本文的分析,可以了解三种评分信度分析方法的特点及各自优势,为评分培训和提高评分信度提供有用信息。

  • 标签: 评分者信度 经典测量理论 概化理论 多面RASCH模型 跳水决赛
  • 简介:摘要目的研究Harris髋关节评分量表(HarrisHipscore)中文版在髋关节患者功能评定中的重测信度和内部的一致性。方法完成量表的汉化,对53例全髋关节置换术后的患者进行测试,评价Harris髋关节评分量表中文版内部一致性信度、重测信度和测量间的信度。结果量表4个领域中的Cronbach′s系数为0.811~0.904;重测信度和测量间的信度系数均大于0.9。各领域与总量表得分的相关系数0.718~0.872。结论Harris髋关节评分量表中文版具有较好的信度和效度,适用于髋关节患者的功能评估。

  • 标签: Harris 髋关节评分 中文版 功能评定 信度
  • 简介:实验是人类认识和改造世界的重要手段和方法。面对传统教学实验室在远程教育中的局限性和虚拟实验的迅速发展,本文分析了教学中虚拟实验面临的诸多挑战,如用户难以获得身临其境的感受、交互不够自然真切等;从学习对虚拟实验可信度要素的视角,提出了包含环境拟真度、用户体验度和操控可信度三个维度的虚拟实验用户可信度认知模型;从虚拟实验用户可信度水平的视角,提出了包含模拟性实验(Procedure—based)、探究性实验(Data—based)以及实证性实验(Reality—based)三个层次的虚拟实验PDR层次模型,并用实例阐释了三个层次的实验类型。

  • 标签: 虚拟实验 可信度认知 环境拟真度 操控可信度 用户体验度
  • 简介:高级汉语口语测验将高水平学习的口语能力,操作性地定义为在“听一说”模式和“独白”模式下的议论性语篇表达的能力。本研究针对评分员使用两种评分标准对67名外国考生完成“听后说”题型的评分进行了检验。概化理论的分析结果显示,两种评分标准的测验信度都达到了优良标准;评分标准一使用两名评分员即可使测验信度达到优良(概化系数为0.826),评分标准二则需要使用三名评分员才能使测验信度达到优良。

  • 标签: 评分标准 信度 概化理论
  • 简介:摘要目的建立咽喉反流性疾病(LPRD)的反流症状评分(reflux symptom score,RSS)量表中文版,评估其信度和效度。方法回顾性分析2020年11月—2021年12月就诊于中日友好医院耳鼻咽喉头颈外科的疑似LPRD患者[研究组,135例,其中男67例,女68例,年龄18~77(43.03±13.35)岁]和健康受试者[对照组,42名,其中男20名,女22名,年龄20~23(21.26±0.67)岁]资料,评估其反流症状指数(RSI)、反流体征评分(RFS)、口咽动态pH监测(Dx-pH监测)以及RSS,1周后再次评估其RSS。对确诊的LPRD患者,给予质子泵抑制剂(PPI)治疗8周,再行RSS评估。分析比较相关结果,对RSS的信度和效度进行评估。采用SPSS 18.0软件进行统计学分析。结果RSS各条目之间Cronbach′s α系数为0.77。1周后再次评估上述各条目,2次评估的P值均小于0.05。RSS与Dx-pH监测结果对照显示,诊断符合率为84.44%(114/135),阳性预测值为85.71%(114/133)。确诊LPRD患者PPI治疗后的RSS明显降低[治疗前(84.79±42.50)分,治疗后(20.11±22.82)分,t=-10.54,P<0.001]。与健康受试者相比,疑似LPRD患者的症状对其生活质量的影响评分较高(t=7.15,P<0.001)。所有疑似LPRD患者和健康受试者认为RSS能较好评估其症状。结论RSS量表内在和外在信度良好,校标效度和反应度良好,可作为评估LPRD症状的重要参考指标之一。

  • 标签: 咽喉反流性疾病 问卷调查 疾病严重程度指数 可重复性,结果
  • 简介:目的评估DAP肾肿瘤评分系统的可信度和可重复性。方法收集2013年至2015年于我院行肾部分切除术的110例患者的影像学资料,由5名泌尿外科医师(2名主治医师和3名住院医师)采用DAP系统独立进行评分,其中2名住院医师间隔3个月后再次进行评分,分别应用Kappa和Kendalltau-b分析法评估同一评分和2名评分间DAP各参数及总分的一致性,ICC检验分析不同资历医师的一致性。结果同一评分DAP各参数及总分的Kappa值分别为0.889、0.817、0.787、0.693和0.897、0.834、0.830、0.708。2名评分之间DAP各参数及总分的Ken—dalltau—b值分别为0.896、0.832、0.847、0.832。Bland—Altman图显示,D、A、P参数均有超过90%的位点在95%的置信区间的参考线内。高年资医师间评分的一致性较低年资医师高。结论DAP肾肿瘤评分系统在同一评分及不同评分间的一致性好,具有良好的可信度和可重复性。

  • 标签: 肾肿瘤 DAP评分 一致性
  • 简介:目的:研制适合我国文化背景的癌症患者家庭照顾负担量表(CaregiverBurdenScaleforCancerPatients,CBS-CP)。方法:在研制CBS-CP的基础上,通过对144例确诊的癌症患者家庭照顾进行调查,以评价量表的信度和效度。结果:CBS-CP量表内容效度指数(S-CVI)为0.936;探索性因子分析(EFA)结果表明,5个因子模型符合概念框架中所设计的五维照顾负担的构想;CBS-CP总量表及其5个因子的Cronbach’sα系数及重测信度均达到0.7以上。结论:所研制CBS-CP的信度和效度较好,可应用于对我国癌症患者家庭照顾的负担进行检测。建议未来研究中通过大样本的调查,进一步对量表进行科学性和应用性双重评价。

  • 标签: 肿瘤 家庭照顾者 照顾者负担量表
  • 简介:言语交流过程中常常会有信息的“失真”,这既有人的认识的根源,又有语言、语境、语用诸因素的影响,是多种因素共同参与的结果。该论文就此对其中的主要因素做些分析和探讨。

  • 标签: 语言 信道 信度 语境 语用
  • 简介:摘要目的验证中文版爱丁堡视觉步态评分(EVGS)在脑瘫儿童中应用的信度和效度。方法根据国际指南对原量表进行翻译和跨文化调适形成中文版,选取30例脑瘫患者的步态视频,由6位具有不同步态分析经验的评估师分别独立使用编译后的量表进行评分。测试间和测试信度使用组内相关系数(ICC)进行评价,采用相关性分析和分组比较评价校标关联效度、聚合效度和区分效度。结果中文版EVGS 17个条目的组间ICC为0.20~0.87,组内ICC为0.41~0.90。有经验组的大部分条目具有良好的组间和组内信度,无经验组的大部分条目具有中等的组间和组内信度。相关性分析结果显示,中文版EVGS量表与PRS(r=0.77,P<0.001)和OGS(r=-0.85,P<0.001)呈强相关;与GMFM-D/E区总分(r=-0.55,P=0.002)呈中等程度相关,与10MWT(r=-0.69,P<0.001)和TUG(r=0.60,P<0.001)呈强相关。EVGS评分在不同GMFCS分级之间以及不同受累侧下肢之间的差异具有统计学意义(P<0.05)。结论中文版EVGS适用于不同经验水平的评估师,且应用于脑瘫儿童中具有良好的信度和效度。

  • 标签: 爱丁堡视觉步态评分 步态分析 脑性瘫痪 信度 效度
  • 简介:信度是衡量测量结果稳定性与可靠性的重要指标,反映了测量过程中对误差控制能力的大小。信度分析是自学考试试题评价的重要内容,包括测量分数信度分析与及格线决策信度分析。本文简要介绍CTT信度观、GT信度观及IRT信度观的理论内容与信度分析方法,并对三种测量信度观进行比较。本文提出,自学考试的信度分析工作应结合具体课程的考试特点、试卷结构、考试作答数据类型等因素,同时考虑CTT、GT、IRT&种信度观的优势及信度估计方法的应用条件,根据具体研究目的选择最恰当的或综合运用不同的信度分析方法。

  • 标签: 信度 信度分析 测量误差 自学考试
  • 简介:一、语言测试的信度度是指测试结果的准确性和可靠性。语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言能力。若同一受试者在不同的时间不同的场合下接受同一个测试或水平相当的测试所得分数是一致的(consistency),则该测试结果具有可靠性或具有一定的信度。任何一种语

  • 标签: 语言测试 信度 区分度 难度 重复测试法 可靠性
  • 简介:摘要编制2~6岁儿童看护养育行为量表,并对量表的信效度进行验证。招募1 350名2~6岁儿童看护,采用条目区分度分析和探索性因子分析对量表结构、维度、条目进行分析,采用同质信度、折半信度、重测信度对量表信度进行分析,采用内容效度、结构效度对量表效度进行分析。结果显示,量表共包含7个维度,45个条目。同质信度分析显示,总量表的Cronbach′s α系数为0.945;折半系数为0.899;重测信度分析显示,两次测试相关系数分别为:0.893(总分),0.854(社交),0.832(语言),0.871(大运动),0.893(精细动作),0.862(认知),0.832(自理),0.872(感觉)。2轮德尔菲专家咨询法对内容效度检验显示,项目评分的kendall系数为0.813(P<0.01);结构效度分析显示,本量表各维度与总量表、各维度之间均相关,各维度平均方差提取值均大于该维度与其他维度的相关系数。整体而言,本量表信度、效度良好,可以作为2~6岁儿童看护养育行为的评价和指导工具。

  • 标签: 看护者 养育行为 量表 信度 效度
  • 简介:信度是对测量一致性程度的估计.信度分成再测信度、复本信度、同质信度评分信度等四种类型.测验的长度与难度以及被试团体的变异性与能力水平是影响信度的主要因素.测量标准误差属另类信度,可用于解释个体分数或解释分数差异.估计速度测验和掌握测验的信度,需使用特殊的方法.

  • 标签: 信度 测量标准误差 同质信度 心理测量学
  • 简介:采用四评模式的网上阅卷既有优点也有不足,本文通过调查法对辽宁省2006年10月份成人高考网上阅卷的评分差异进行了研究。结果表明,评分之间在阅卷速度、阅卷平均分、阅卷标准差及出分率等方面均存在差异。评分评分过程中在阅卷速度、出分率方面逐渐提高,在阅卷标准差方面逐渐降低,在阅卷平均分方面差异不明显。并通过访谈法归纳出了及时反馈、严格要求、做好培训、减少误差阈值等减少评分差异的有效策略。

  • 标签: 成人高考 网上评卷 评分者差异
  • 简介:课堂评估是基于课堂、以促学为主要目的的评估方式。以往课堂评估研究多侧重其促学功能,忽略其评分功能。由于课堂评估分数多计人课程总分供教育决策参考,因此其信度问题不容忽视。本文从课堂评估的理论本质出发,探讨传统测量理论下信度概念的适用性。在回顾信度实证研究的基础上,本文试图揭示课堂评估信度的跨学科共性,并讨论对外语课堂评估信度的启示。文末总结了提高课堂评估信度的主要策略,并探讨了该概念理论重构的可能性。

  • 标签: 课堂评估 信度 研究述评 理论重构
  • 简介:政府的信誉,可以靠权威建立。但是,用权威建立起来的政府信誉是脆弱的,像“墙上的芦苇”一样,没有群众基础。一个取信于民的政府,一个置身于民众中间的政府,所依靠的决不是权威,而是诚实守信。而一个诚实守信的政府,公信度高的政府,才能让群众“信得过”。

  • 标签: 政府信誉 公信度 群众基础 诚实守信 取信于民 权威
  • 简介:摘要目的评价胸腰椎AO脊柱损伤评分(TLAOSIS)和胸腰椎损伤分型及评分系统(TLICS)在指导胸腰椎骨折手术的可信度和可重复性,探讨影响分型评分系统一致性的原因。方法选取6名医师,根据术前正侧位X线片、CT、MRI影像,分别用TLAOSIS和TLICS对2018年1月— 2018年12月浙江中医药大学附属第二医院收治的55例胸腰椎骨折患者进行独立分型。对同一例患者,6名医师在一次分型中只要有1名医师分型不同即认定为不一致。4周后,打乱资料顺序再次分型。全部资料均不含与分型有关的任何标记。用加权Cohen's Kappa系数从骨折形态、神经功能状态、后纵韧带复合体(PLC)损伤等方面评价观察间可信度和观察内可重复性,用Kappa系数观察各研究内前后测量的一致性。结果两种分型评分系统均具有良好的可信度和可重复性。TLAOSIS:观察间和观察内对于骨折形态分型Kappa值分别为0.806和0.667;神经功能状态分型Kappa值分别为0.937和0.891;PLC损伤分型Kappa值分别为0.873和0.779;最终建议手术与否的Kappa值分别为0.816和0.764。TLICS:观察间和观察内对于骨折形态分型的Kappa值分别为0.878和0.788;神经功能状态分型Kappa值分别为0.936和0.888;PLC损伤分型Kappa值分别为0.809和0.691;最终建议手术与否Kappa值分别为0.811和0.705。两种分型评分系统在骨折形态和PLC损伤分型方面,无论是可信度分析还是可重复性分析方面,差异均具有统计学意义(P<0.05),但在神经功能评分方面,差异均无统计学意义(P>0.05)。结论TLAOSIS和TLICS在指导手术方面具有良好的一致性和可重复性,其中骨折形态和PLC损伤情况是影响两种分型评分系统对手术指导一致性的影响因素。

  • 标签: 胸椎 腰椎 脊柱骨折 一致性分析