如何利用分类算法进行汽动给水泵组的故障预测

(整期优先)网络出版时间:2022-07-18
/ 2

如何利用分类算法进行汽动给水泵组的故障预测

梁艺馨

河南京能滑州热电有限责任公司   河南省安阳市   456400

摘要:汽动给水泵组是火电厂热力系统的重要辅助设备,它将给水从凝结水压力提高到锅炉给水压力,并向过热器及再热器提供减温水。汽动给水泵组的安全运行与整个机组的安全密切相关。鉴于此,本文将就如何利用分类算法进行汽动给水泵组的故障预测进行探究。

关键词:分类算法;汽动给水泵组;故障预测

1案例情况分析

为做好故障预测工作,本文分别选取电厂A和电厂B的1台汽动给水泵组作为研究对象进行故障预测,分别取性能测点、轴承及油温测点、振动测点3类数据。其中,性能测点主要包括功率、转速、进出口压力、温度、流量等参数;轴承及油温测点主要包括轴承温度和润滑油温度等参数;振动测点主要包括轴向位移、X和Y向振动等参数。A电厂共选取39个测点,B电厂共选取22个测点。设备的故障往往不是瞬间导致,而有萌芽、发展、恶化直至发生事故的过程(图1)。尽管无法完全正确地衡量故障萌芽、发展、恶化的时间点,但可通过模糊处理,将设备离故障发生点还很久时的状态看作健康状态,将设备故障前夕的状态看作故障状态。A电厂于2016年9月28日发生了小汽轮机末级叶片断裂事故,选取其2016年1月至2016年9月的SIS数据。B电厂于2016年9月至2017年6月因给水泵动、静平衡盘碰磨而产生了一系列问题,选取其2015年11月至2017年6月的SIS数据。

图1故障发展过程

2数据预处理

2.1样本划分

对A电厂,将2016年1月的样本标定为正常类,将2016年9月的样本标定为故障类;对B电厂,将2015年11—12月以及2016年1月的样本标定为正常类,将2016年8—10月的样本标定为故障类。其余样本均作为验证数据。然后对所有数据进行清理,即剔除原始数据中的坏值,对缺失值进行光滑,并实现数据的一致性。

2.2特征提取

本文对各维数据均提取6个统计特征量,分别为加权平均值f1、加权标准差f2、变化次数f3、最大变化率f4、平均变化率f5、极差f6。其中,加权平均值反映数据的集中趋势,加权标准差和极差反映数据的离散程度,变化次数、最大变化率和平均变化率反映设备在状态恶化时数据可能出现的频繁或大幅的波动。计算公式为:

n为样本中要提取特征的维度值数量;xi为样本中要提取特征的维度的第i个数据;ti为数据对应的规范化时标,t1=1,tn+1=1801;xmax为样本中要提取特征维度的最大值;xmin为样本中要提取特征维度的最小值。A电厂共39个测点,每个维度产生6个特征量,将各维的特征量依次排序组成特征向量,其维度为39×6=234维。B电厂共22个测点,得到的特征向量维度为22×6=132维。将数据在[0,1]区间归一化,归一化处理后,所有数据值都处于[0,1]区间。

2.3特征选择

本文采用常用于二分类问题的启发式特征选择算法——Relief算法。1)建立特征的权重向量W并初始化为0;2)在训练数据集中随机选取一个样本A;3)从与A同类的样本集中找出与其距离最近的样本S,从与A不同类的样本集中找出与其距离最近的样本D;4)对每个特征F=1-N(原特征向量维度),通过式(7)更新其权重,式中,m为抽样次数,A[F]为A样本在特征F上的值,max(F)为F特征上的最大值,min(F)为F特征上的最小值;5)返回步骤2)继续进行下一次抽样,直到完成m次抽样;6)按权重由大到小对特征进行排序,取排名靠前的部分特征的组合作为最终的特征向量;7)对A电厂选取权重排序前43维特征,对B电厂选取前33维特征,分别作为各自的特征向量。

3模型建立

本文分别采用BP神经网络、SVM、朴素贝叶斯算法、决策树以及组合分类算法来建立模型,比较选取最适合汽动给水泵组的故障预测方法。其中,决策树采用C4.5算法,组合分类使用装袋策略。A电厂正常数据和故障数据分别有1390和1307个样本,共2697个。从中随机选择1800个样本作为训练数据,剩余897个样本作为测试数据。B电厂正常数据和故障数据分别4295和2022个样本,共6317个。从中随机选择4200个样本作为训练数据,剩余2117个作为测试数据。根据特征选择结果,在建模时,A电厂分类模型输入参数为43维向量,B电厂分类模型输入参数为33维向量,输出用{[1]、[–1]}简单区分。据此可以对各分类算法设置模型参数。

4模型评估

通过模型评估结果可以得知,BP神经网络、朴素贝叶斯、SVM和决策树都对A电厂和B电厂的训练和测试样本有极高识别率,最高甚至达到100%,最低也在93%以上,说明选取的特征向量对正常和故障数据有良好区分能力。但决策树算法的训练及测试时间远大于其他3种,而组合分类的投票需要奇数个分类器,考虑到决策树算法会大大增加组合分类时间,故组合分类的子分类器选取BP神经网络、朴素贝叶斯、SVM。总体而言,BP神经网络、SVM和组合分类3种算法的分类性能指标最优,决策树算法耗时较长,朴素贝叶斯算法性能指标略低,故BP神经网络、SVM和组合分类算法最适合。

5模型验证

对A电厂,2016年9月28日发生了一次给水泵汽轮机叶片断裂事故,在以2016年9月数据为故障样本、2016年1月数据为正常样本建立分类模型情况下,模型不仅可以很好地识别2类,而且可以在8月就给出故障指示,提前4-5周达到预测效果。对B电厂,情况略微复杂。经专家鉴定,B电厂汽动给水泵组在2016年9月至2017年6月因给水泵动、静平衡盘碰磨故障而产生了一系列问题。在以2015年11月至2016年1月数据为正常样本、以2016年8—10月数据为故障样本建立分类模型情况下,可以将2类很好地识别,而且可以在2016年6月就给出故障指示,提前9-10周达到预测效果。2016年11月至2017年6月共8个月里,除2016年12月(检修)、2017年1月(停机)、2017年2月(检修)外,其余月份的预测结果都明显偏向故障类,而电厂专业人员证实,在此期间,设备确实一直处于带故障运行状态,且此给水泵在每次完成检修投入运行后,状态又会逐渐恶化,其故障未能得到根本解决。2016年12月及2017年2月的预测结果偏向正常类,与当月对设备进行了检修这一事实正好吻合,且2017年2月后预测结果的逐渐上升趋势与给水泵完成检修投入运行后设备状态的逐渐恶化也基本匹配。根据以上分析,数据分类的结果与设备的实际运行和检修记录基本吻合,说明此分类方法对汽动给水泵组的典型故障预测有明显效果。

6结束语

本文采用5种分类算法分别针对2个电厂汽动给水泵组的实际故障案例,建立了正常与故障状态的分类模型,实现了汽动给水泵组的典型故障预测,并结合实际案例对模型的有效性进行了验证。

参考文献

[1]沈磊.300MW汽动给水泵异常振动原因分析及处理[J].热能动力工程,2020,35(4):288-292.

[2]章雅楠.基于数据驱动与多变量状态估计的汽动引风机故障预警[J].热力发电,2020,49(1):78-84.

作者介绍:

梁艺馨(1988.12.14—),性别:男;籍贯:吉林省白山市;民族:汉族;学历:本科;职称:工程师;职务:集控主值班员;研究方向:发电厂设备运行管理;单位:河南京能滑州热电有限责任公司。