基于深度学习的心脑血管疾病预测方法研究

(整期优先)网络出版时间:2017-12-22
/ 2

基于深度学习的心脑血管疾病预测方法研究

吴春冬

(眉山市心脑血管病医院神经内科3病区四川眉山620010)

【摘要】随着生活环境的改变,人们的身体状况日益下降,引起人们的高度重视。心脑血管疾病的致死率以及致残率都比较高,如果可以提前预测患病情况,就可以提前相应的干预措施,控制心脑血管疾病发病风险。计算机技术持续进步,已经应用疾病预测过程当中,同时有着重要的应用价值。深度学习作为近年来机器学习的最新成果之一,本文简要介绍深度学习技术在心脑血管疾病预测当中的应用。

【关键词】深度学习;心脑血管疾病;预测;计算机技术;模型

【中图分类号】R5【文献标识码】A【文章编号】1007-8231(2017)15-0023-02

【Abstract】Withthechangeoflivingenvironment,people'sphysicalconditionisdecliningdaybyday.Cardiovascularandcerebrovasculardiseasemortalityanddisabilityratesarerelativelyhigh,ifthediseasecanbepredictedinadvance,youcanadvancetheappropriateinterventionstocontroltheriskofcardiovasculardisease.Withthecontinuousprogressofcomputertechnology,ithasbeenappliedintheprocessofdiseaseprediction,andhasimportantapplicationvalue.Asoneofthelatestachievementsofmachinelearninginrecentyears,deeplearningisintroducedinthispaper.

【Keywords】Deeplearning;Cardiovasculardisease;Prediction;Computertechnology;Model

心脑血管疾病包括脑血管疾病以及心脏血管疾病,通常指的是血压以及血脂上升,诱发动脉粥样硬化等问题,而使得大脑、心脏等组织缺氧缺血。该病严重威胁人们的生命健康。随着机器学习技术的发展,研究人员应用计算机构建预测特定疾病的模型,不过传统的算法存在很多问题,预测效果不够理想[1]。近年来深度学习技术快速发展,应用领域涉及到各个方面,给心脑血管疾病的预测提供了新的思路。

1.心脑血管疾病预测技术

1.1预测过程

通常情况下,医疗数据挖掘主要包括五个步骤。第一,确定主题。在这一环节,需要相关领域的工作人员深入进行沟通交流,从而确定数据挖掘主题,并且要制定出数据挖掘结果以及结果判断的标准。第二,数据采集以及预处理:明确数据的来源是数据库当中的数据或者来自于其他途径,这样能够从数据角度分析数据挖掘的目标,也能够确定数据是否符合形式,应当进行怎样处理。在此环节的工作包括数据的集成、变换还有简化[2]。第三,知识发现。这一过程包括选择算法、确定挖掘流程、建立模型、验证模型并且评价结果。数据挖掘得到的知识在具体应用环节还需要多次进行分析以及验证,从而确定合理与否,并且需要研究人员进行交流,将不同实验的结果进行验证,验证得到的知识合理与否。第四,分析知识。挖掘数据的结果就是从用户层面去分析。医疗领域进行数据的挖掘时候,需要求助于医务人员分析挖掘得到的知识是否具备医疗诊断价值以及预测价值,同时是否符合挖掘目的。第五,结果应用。在挖掘知识并且验证之后,应当总结整个过程,从而为后续的数据挖掘积累经验,并且还需要加以推广,这一过程离不开具体的计划以及部署。

1.2数据挖掘方法

疾病发生发展的过程比较复杂,在预测疾病的过程当中已经出现各种数据挖掘技术,例如回归预测法、灰色预测法、时间序列法以及神经网络法等,不过格局有其优缺点。相同之处在于上述方法均应用数学模型[3]。建立数学模型的过程覆盖数据挖掘的常见步骤,将具体问题的转化为数学问题,从而体现数学建模的思想。在具体问题的解决过程当中研究人员发现,回归预测法适合解决那些样本数量较大同时态势稳定的情况。截止到目前为止,在预测疾病的过程当中,回归预测法、灰色系统法以及时间序列法等主要用来研究群体当中疾病发生发展的趋势,从而预测发病率、死亡率还有蔓延的速度,从而帮助卫生机构制定预防对策,不过在这些算法的问题都比较明显。深度学习能够让计算机学习分析数据的特点,从而将特征学习纳入到模型建立的过程当中,有效降低人为因素造成的特征不完备问题。以深度学习的相关应用,在特定条件下已经超越其他算法的识别效果以及分类性能。因此本研究尝试应用基于深度学习的相关DBN模型预测心脑血管疾病,DBN模型可以综合多种不同发生的因素,一方面具备神经网络调整适应能力,另一方面也能够防止BP神经络陷入到极小值的问题[4]。

2.基于DBN的心脑血管疾病预测方法

2.1预测模型流程

第一,数据采集以及预处理。首要需要收集心脑血管疾病患者的体检各项数据,从而得到原始数据集。在此之后预处理原始数据,并且将数据集进一步分成训练数据以及测试数据。第二,建立DBN模型。通过实验技术来构建DBN模型网络结构,主要分为输入层个数、隐含层个数以及隐含层层数等不同的方面。地上那,构造DBN预测模型。应用训练数据来训练DBN预测模型,为改进训练的效果,需要计算目标输出以及实际输出之间的误差。应用网络权重W函数来代表这一误差,使用共轭梯度算法确定权重矩阵,从而得到误差函数达最小的权重矩阵W,也就是DBN联合共轭梯度算法的疾病预测模型。第四,测试阶段。输入测试数据到DBN的预测模型当中,从而得到心脑血管疾病预测的结果。第五,分析预测结果。如果训练数据以及测试数据相同,应用经典预测技术来完成预测,对比预测结果以及DBN模型得到的预测结果[5]。

2.2确定方法

DBN模型训练的主要内容在于玻尔兹曼机自主训练以及BP算法训练。在DBN模型进行训练的过程当中,要是进行网络所有层的同时训练,容易使得时间的复杂度比较高,而通过选择贪婪逐层算法则能够顺利解决这一问题。贪婪逐层学习技术的基本理念在于,把DBN网络的模型加以分层并且在此基础上进行学习,每层都属于无监督的自主学习。所有网络层完成学习之后,再对DBN模型开展监督学习从而加以微调。在DBN模型构建的过程当中,有两个十分关键的参数应当确定,也就是输入层结点的数量以及隐含层数量。在构建心脑血管疾病的预测模型环节,输入层个数也就是应用集中数据的个数,要是输入层结点数量不同,容易导致预测结果出现显著的区别。因此在构建模型的时候,应当首先确定输入层结点数量。模型当中隐含层结点是DBN模型能够借助于数据集学习得到的知识,反映出数据当中的关系。如果模型隐含层当中的结点数量太少,容易发生建立模型失败的问题[6]。如果隐含层结点数量太逗,容易出现过度拟合的问题。这些问题都会导致预测结果的误差比较大。因此隐含层结点数量的合理确定,在预测心脑血管疾病环节有重要的影响。

DBN模型当中包含多个不同的隐含层,是神经网络的完整模型。如果建立的模型数据关系比较复杂,就需要包含多个不同的隐含层,因此可以表现出更理想的能力。所以在优化模型性能方面,就可以改变隐含层的数量以及隐含层结点的数量,从而为模型构建的优化提供了思路。不同数据集以及不同应用领域当中构建得到的DBN模型其隐含层的数量的不同的。不过在DBN模型当中,结点数量以及网络层数量的确定过程方面,一直面临着比较大的难度。到现在为止,还缺乏一个统一技术来解决这方面的问题。因此本研究仍然应用实验方法确定DBN最优结构。DBN模型隐含层的数量是1的时候,输入层当中需要将输入结点数量设置成1~10之间的数值,将隐含层结点的个数设置为不同值。研究人员发现,同输入结点数量变化相对比而言,网络预测结果对于隐含层结点数量的变化敏感程度更高。在数据集分析的过程当中,寻找识别率更高的情况下,相匹配的输入层结点数量以及隐含层结点数量,然后陆续增加隐藏层,从而判断隐含层当中结点数量改变对心脑血管疾病预测效果带来的影响,能够确定最合理科学的佳结点数量,进一步确定隐含层数量。

综上所述,本文对心脑血管预测当中深度技术的应用进行一定探讨,不过仍然存在很多不足。一方面是受各方面条件的限制,研究搜集到的数据量较少,另一方面是仅仅建立DBN模型,并未应用其他深度学习的模型,在后续研究当中应当选取其他模型进行预测。相信通过建模方式,能够应用深度学习进一步提高疾病预测的效果。

【参考文献】

[1]李论.基于灰色预测模型的我国心脑血管疾病死亡率预测[J].现代电子技术,2015,442(11):107-111.

[2]呼晓雷,周继朋,陈小平.AGXT2与ADMA代谢及心脑血管疾病的研究进展[J].中国药理学通报,2015,1(5):601-605.

[3]李凌.血清脂蛋白(a)、尿酸水平与心脑血管疾病的相关性分析[J].国际检验医学杂志,2016,37(4):530-531.

[4]赵淑香.高同型半胱氨酸血症与心脑血管疾病相关性的研究进展[J].内蒙古中医药,2016,35(7):134-135.

[5]李奋华,赵润林.基于数据挖掘的疾病预测模型的构建与分析[J].现代计算机,2016,1(18):14-17.

[6]王丽平,吴亚飞.联合稀疏独立法则及其在疾病分类中的应用[J].数值计算与计算机应用,2016,37(3):179-185.