简介:摘要;化学及工业制备的效率和纯度往往受到多种影响因子的干扰,在这种条件下对于最优解的选取和研究就显得尤为重要,本文以C4烯烃的催化制备为例,分析环境温度和催化剂类型对于反应的影响,综合考虑催化剂中各种成分浓度和反应副产物,建立了乙醇偶合催化制备C4烯烃实验的多元非线性回归拟合模型,该模型可用于计算在多种影响因素共同作用下反应的相关参数,并预测出相关反应条件的最优解。
简介:目的使用XGBoost算法开发加强监护病房(ICU)中脓毒症患者住院死亡风险的预测模型。方法使用美国大型重症数据库MIMIC-Ⅲ作为数据来源;根据2016年发布的第三版脓毒症诊断和定义标准,选取数据库中的脓毒症患者,提取其生命体征、实验室检查等数据;使用XGBoost开发模型,并比较其与SVM模、SAPS-Ⅱ模型的预测性能。结果共纳入10487例脓毒症患者,住院死亡率20.80%。XGBoost模型的受试者工作特征曲线下面积(AUROC)为0.836(95%置信区间:0.819-0.853),优于SVM模型和SAPS-Ⅱ模型。Hosmer–Lemeshow检验显示,XGBoost模型拥有优秀的校准度。结论基于XGBoost的ICU脓毒症患者住院死亡风险预测模型能准确地辅助临床医生进行风险预测,从而采取合适的临床干预以降低ICU脓毒症患者的死亡率。
简介:摘要:本文构建了线上学习平台的学情特征数据结构,通过超参数优化后的XGBoost算法学习个体的学情特征数据与考核结果间的内在关联,从而构建了能实现学生线上课程学情预警的模型。该模型准确性高收敛快,泛化性能可靠。
简介:摘要:风电机组作为清洁能源的重要组成部分,对于实现可持续发展具有重要意义。然而,由于外部环境等因素的影响,风电机组存在着功率极限及健康性能问题,为了提高风电机组的运行效率和可靠性,本文提出了基于XGBoost-Bin算法的自动功率极限计算方法,该方法通过监测风电机组工作状态及传感器数据,构建了一个自动计算功率极限的模型,并利用XGBoost-Bin算法来评估和预测风电机组的健康性能。通过实验证明,该方法具有较高的准确性和可靠性,对于风电机组的健康性能评估和预测具有重要意义。
简介:摘要目的基于XGBoost模型探讨影响Stanford B型急性主动脉夹层(AAD)患者术后死亡的危险因素。方法回顾性选取2012年2月—2019年6月于云南省文山州人民医院住院诊断的Stanford B型AAD患者226例为研究对象,其中男性126例,女性100例,平均年龄为(61.24±4.25)岁;根据患者出院时结局分为存活组(n=129)和死亡组(n=97),其中自动放弃治疗并离院者视为死亡组,若在研究期间患者多次入住云南省文山州人民医院,仅选取首次诊断为Stanford B型AAD的临床数据进行研究。收集受试对象的临床资料、血液学指标等,使用XGBoost模型预测Stanford B型AAD患者术后死亡的快速诊断,并与传统的Logistic回归模型进行比较。结果XGBoost模型中,按照重要度对各影响因素进行排序,排名前6位的分别是:高血压、中性粒细胞与淋巴细胞比值(NLR)、C反应蛋白(CRP)、白细胞计数(WBC)、D-二聚体、心率,其中高血压和NLR对Stanford B型AAD患者术后死亡的影响最大。使用受试者操作特征曲线对这2个模型预测效能进行比较发现,在训练集中,XGBoost模型的预测效能显著强于Logistic回归模型,而在验证集中,两者效能相当。2种方法构建的预测模型中最终都纳入了高血压、NLR、CRP、WBC、D-二聚体、心率、收缩压、舒张压、手术治疗等自变量。结论XGBoost模型可用于对Stanford B型AAD患者术后死亡的预测分析,其诊断性能在训练集中优于Logistic回归模型,在验证集中与后者相当。高血压和NLR是预测Stanford B型AAD患者术后死亡最重要的因素。
简介:摘要目的建立一种能预测肝细胞癌(HCC)患者腹腔镜肝切除术(LH)术后复发的极端梯度上升法(XGBoost)模型。方法回顾性选取2013年1月—2016年9月在承德医学院附属医院首次接受LH治疗的原发性HCC患者440例为研究对象,确诊方式为病理诊断。使用随机数表法,以2∶8的比例将研究对象分为训练组(n=88)和验证组(n=352)。采用Kaplan-Meier法绘制无复发生存曲线,并采用Log-rank检验比较两组的生存情况;采用训练组建立COX回归模型和XGBoost模型,筛选预测LH术后复发的独立预测因素;采用受试者工作特征曲线(ROC)分析两种模型的预测能力,并在验证组中进行内部验证;采用Hosmer and Lemeshow Test来评价两种模型的校准度,以P>0.05为模型与实际情况拟合度良好。结果多因素COX回归模型和XGBoost模型均筛选出了癌栓、分化程度低、肿瘤微血管浸润、肿瘤个数、肿瘤较大、乙肝表面抗原阳性是肿瘤复发的独立预测因素(HR=2.477、0.769、1.786、1.905、1.544、1.805;95%CI: 1.465~4.251、0.619~0.819、1.263~2.546、1.354~2.704、1.272~1.816、1.055~2.555)。XGboost模型评分依次为32、29、24、18、16、11分。训练组中COX回归模型和XGBoost模型预测复发的曲线下面积(AUC)分别为0.746(0.730~0.762)和0.802(0.785~0.818),XGBoost模型预测能力较强,且在验证队列中也得到了证实。结论本研究建立和验证了能够预测接受LH的HCC患者术后复发的XGBoost模型。该模型可应用于临床工作中,辅助医师为患者制订个性化的术后监测方案。HCC患者复发率高,预后差,早发现、早诊断、早治疗、加强术后复诊是改善患者预后的重要措施。
简介:摘要目的研究一种用于inter-patient范式下对心律失常心电(ECG)信号进行分类的分类器,提高自动分类的准确度,解决心律失常人工诊断的局限性。方法构建包括预处理、特征提取、支持向量机(SVM)训练和集成分类4个模块的SVM+XGBoost集成分类器。具体步骤为:对ECG信号进行预处理,将R-R间期、高阶统计量、局部二值模式、小波分量作为特征,分别训练独立SVM分类器;使用XGBoost算法对各独立SVM分类器进行集成,输出心律失常分类结果;在MIT-BIH数据库上对集成分类器进行训练和测试。结果集成分类器对心律失常的总体分类准确度为0.867、平均灵敏度为0.782。结论所提出的集成分类器能实现inter-patient范式下心律失常ECG信号的自动、准确分类,可用于临床辅助诊断。
简介:无
简介:摘要目的评估基于18F-FDG PET/CT图像的影像组学融合特征结合极端梯度提升(XGBoost)机器学习模型在乳腺癌人表皮生长因子受体2(HER2)表达状态预测中的价值。方法回顾性分析2012年1月至2019年12月于天津医科大学肿瘤医院行18F-FDG PET/CT检查的210例原发性乳腺癌患者[均为女性;年龄52(46,60)岁;HER2阳性95例,HER2阴性115例],采用Python 3.7.1软件从HER2阳性组及HER2阴性组分别随机抽取70%作为训练集[147例,其中HER2阳性67例,年龄52(46,60)岁;HER2阴性80例,年龄55(45,62)岁],30%作为测试集[63例,其中HER2阳性28例,年龄54(43,65)岁;HER2阴性35例,年龄52(45,61)岁]。在CT和PET图像上进行肿瘤分割后,分别提取CT、PET影像组学特征,经后处理获得PET/CT融合特征(包括PET/CT拼接特征和PET/CT平均特征)。建立支持向量机(SVM)模型和XGBoost机器学习模型,输入经特征筛选后保留的特征,用于预测乳腺癌原发灶中HER2的表达状态,并用ROC曲线对模型的预测效能进行评估。采用Delong检验分析不同模型及组学特征的预测效能,并绘制预测效能最高的机器学习模型的校准曲线。结果与SVM模型比较,XGBoost模型在输入CT特征、PET特征、PET/CT拼接特征和PET/CT平均特征时均有更佳的预测效能(z值:2.26~3.54, P值:0.016~0.040)。在XGBoost机器学习模型中,PET/CT平均特征预测乳腺癌HER2表达状态的ROC AUC为0.83(95% CI:0.73~0.93),优于CT特征[0.75(95% CI:0.63~0.88);z=3.57,P=0.027]、PET特征[0.73(95% CI:0.60~0.86);z=2.64,P=0.034]及PET/CT拼接特征[0.74(95% CI:0.60~0.87);z=2.49,P=0.037]。结论基于PET/CT影像组学融合特征建立的XGBoost机器学习模型有望用于乳腺癌患者HER2表达状态的预测。
简介:摘要目的基于Logistic回归和XGBoost算法构建急性膝关节周围多发损伤患者围手术期深静脉血栓形成风险的预测模型,并比较预测性能。方法回顾性选取2017年1月—2020年6月于广州市番禺区中心医院创伤骨科治疗的急性膝关节周围多发损伤患者120例,以7∶3的比例随机分为训练集(n=84)和测试集(n=36),采用训练集数据构建Logistic回归和XGBoost算法预测模型,筛选急性膝关节周围多发损伤患者围手术期深静脉血栓形成的预测因素,采用测试集数据评价模型的预测效果。符合正态分布的计量资料以均数±标准差(Mean±SD)表示,组间比较采用独立样本t检验;非正态分布的计量资料以中位数(四分位间距)[M(P25,P75)]表示,组间比较采用独立样本Mann-Whitney U检验;计数资料组间比较采用χ2检验。结果Logistic回归模型结果表明,年龄、合并高血压、合并冠心病、受伤至手术时间、术后1 d的D-二聚体、合并多发伤是急性膝关节周围多发损伤患者围手术期深静脉血栓形成的预测因素(P<0.05)。XGBoost算法模型重要特征评分结果中排前5位的为合并多发伤35分,受伤至手术时间28分,年龄24分,合并冠心病21分,术后1 d的D-二聚体16分。训练集中,Logistic回归模型的曲线下面积为0.805(95%CI:0.637~0.912),Hosmer and Lemeshow检验的χ2=1.436,P=0.329;XGBoost算法模型的曲线下面积为0.847(95%CI:0.651~0.920),Hosmer and Lemeshow检验的χ2=1.103,P=0.976。结论Logistic回归模型和XGBoost算法模型对急性膝关节周围多发损伤患者围手术期深静脉血栓形成的预测性能相当,且合并多发伤、受伤至手术时间、年龄、合并冠心病、术后1 d的D-二聚体可作为预测因子。