简介:为建立不同产区及风格烤烟烟叶与化学指标之间的关系,对2005~2009年湖南省、河南省、福建省和云南省等4省份共计1040份烟叶样品的21种化学成分进行检测,并利用MiningTree模型进行分类-回归决策树(C&RTanalysis)数据分析。结果表明:(1)从21个烟叶化学成分中,共筛选出14个特征化学指标,其中钾和硝酸根为4省烟叶共有特征化学指标;(2)湖南、河南、福建和云南4省份识别概率最高的特征化学指标分段组合(Segment)分别为:还原糖(≤24.93%)、钾(〉1.98%)、pH值(≤5.37)(p=0.658);钾(≤1.98%)、灰分(〉11.03%)、水溶性灰份碱度(≤0.49)、硝酸根(≤0.06%)(p=0.776);还原糖(〉24.93%)、钾(〉1.98%)、硝酸根(≤0.06%)、蛋白质(〉5.01%)(p=0.914);钾(≤1.98%)、灰分(≤11.03%)、水溶性总糖(〉28.94%)、硫酸根(≤1.43%)(p=0.957)。分类-回归决策树方法在建立烤烟化学成分识别模型中具有重要的应用价值。
简介:目的应用exhaustiveCHAID分类树模型与logistic回归分析来分析北京社区居民脑卒中危险因素以及不同特征人群的重点干预因素,为加强北京市居民脑卒中的干预提供科学依据。方法于2007年6月至8月,采用整群抽样方法,对北京10108名社区居民进行问卷调查、体格检查及检测空腹血糖、血脂。采用logistic回归与exhaustiveCHAID分类树分析相结合来探讨影响北京市居民脑卒中的因素。结果logistic回归分析和exhaustiveCHAID分类树分析显示年龄、性别、踝臂指数(ABI)、高血压、腹型肥胖、高密度脂蛋白胆固醇、吸烟状况、工作强度为脑卒中的危险因素;ExhaustiveCHAID分类树分析揭示老年者ABI贡献大,不容忽视中年者糖尿病。Logistic回归分析和exhaustiveCHAID分类树分析的ROC曲线下面积分别为0.803和0.778,模型可靠。结论对脑卒中的防治,要在总体把握的情况下,对不同的高危人群应采取不同的防制措施。
简介:摘要目的在确认创伤性颈脊髓损伤(TCSCI)气管切开的危险因素的基础上,构建分类与回归树(CART)模型以指导气管切开。方法回顾性分析2009年1月至2018年12月陆军军医大学新桥医院骨科收治的498例TCSCI患者资料,男403例,女86例;年龄(50.2±13.6)岁。其中气管切开69例,未行气管切开420例。统计患者的性别、年龄、吸烟史、致伤原因、神经损伤平面(NLI)、美国脊髓损伤学会(ASIA)分级、创伤严重程度评分(ISS)、胸部损伤、既往肺部疾病、既往基础疾病、手术入路并进行单因素分析。通过二元logistic回归分析行气管切开的危险因素,并在危险因素的基础上建立预测气管切开的CART。结果logistic回归分析显示,年龄>50岁(OR=4.744, 95%CI: 1.802~12.493, P=0.002)、NLI在C4及以上(OR=23.662, 95%CI: 8.449~66.268, P<0.001)、ASIA分级A级(OR=40.007, 95%CI: 12.992~123.193, P<0.001)及ISS>16分(OR=10.502, 95%CI: 3.909~28.211, P<0.001)是行气管切开的危险因素。CART显示,ASIA分级A级、神经损伤平面在C4及以上作为第一、第二决策点对行气管切开具有较强的预测作用,ASIA分级A级且神经损伤平面在C4及以上的TCSCI患者行气管切开的比例为86.84%。结论CART模型结果显示神经损伤平面在C4及以上、ASIA分级A级对气管切开具有较强的指导作用。
简介:梯度Boosting思想在解释Boosting算法的运行机制时基于基学习器张成的空间为连续泛函空间,但是实际上在有限样本条件下形成的基学习器空间不一定是连续的。针对这一问题,从可加模型的角度出发,基于平方损失,提出一种重抽样提升回归树的新方法。该方法是一种加权的加法模型的逐步更新算法。实验结果表明,这种方法可以显著地提升一棵回归树的效果,减小预测误差,并且能得到比L2Boost算法更低的预测误差。
简介:单次脑电分类实验中,采用基于logistic回归的正则化方法来提高分类准确率.首先,提出一种新算法——局部保持投影稀疏logistic回归,将局部保持投影正则项加入到稀疏logistic回归中.该算法旨在保留原始特征空间邻域信息的同时保证结果的稀疏性.然后,利用边界优化法和逐分量迭代算法在训练集上求解权重向量,克服了牛顿一拉夫森法和迭代重加权最小二乘法的局限性.最后,在自步调手指运动数据集上采用十重交叉验证法得到80%的分类准确率,并与稀疏logistic回归的实验结果进行对比,说明局部保持投影正则项有效地保留了对脑电分类有用的信息.