面向飞机维修与维护的知识图谱应用

(整期优先)网络出版时间:2023-08-11
/ 2

面向飞机维修与维护的知识图谱应用

张立坤

Ameco西南航线中心 四川省成都市610000

 摘要:随着我国航空事业的不断发展,飞机维修与维护领域也越来越受到重视。鉴于目前飞机维护维修资料主要以纸质手册为介质,且随着技术的发展,新机型的不断出现,必然会有大量新资料的涌入,这些问题的出现均会造成飞机维修与维护资料查阅不便、检修人力成本过高等问题。以知识图谱为代表的处理关联数据技术是解决该难题的方法之一,知识图谱是结构化的语义知识库,它由实体和实体的关系组成,通过图的形式表现出来。它能将飞机维修与维护资料中数据进行精确处理,将 Web 上的信息、数据以及链接关系聚集为知识,使信息资源更方便的管理和更新。

关键词:飞机维修;知识图谱;应用

近年来中国民航业飞速发展,从新机型ARJ21投入使用,到我国自主研发的大飞机C919试飞成功,均标志着我国由一个民航大国到民航强国的转变。而作为民航安全运行的根本保障,民航飞机维修已受到社会各界的关注。民用航空飞机维修主要包括飞机机体结构与附件修理、装配和调试、飞机试飞及其故障诊断和排故、飞机修理技术管理、飞机外场维护等工作内容。飞机故障诊断与维修规划工作的开展主要通过人工观察航电设备的故障参数与表现状态,翻阅现有纸质故障隔离手册进行细致繁杂的查找与匹配,可直接读取的结构化参数数据可以通过翻阅手册进行精准匹配,以查找对应的维修方案。

一、知识图谱建立

知识图谱(Knowledge Graph,kg)源自于语义网络,由相互连接的节点和边组成,其中节点表示概念或对象,边表示节点与节点之间的关系。它由一些相互连接的实体以及它们的属性构成的,知识图谱中的每一条知识可以表示为一个 SPO 三元数组(Subject-Predicate-Object)。在知识图谱中以 RDF(Resource Description Framework),即资源描述框架的形式化表示这种三元关系。从广义上来讲知识图谱由主体、关系、客体三部分组成,是一个连接起来的图,节点是实体,边是关系,是一个主体指向客体的有向图。

1、飞机维护维修知识系统设计。以知识图谱为媒介的飞机维护维修知识系统,旨在通过简单地输入工作单号或故障代码,以及必要的事件描述,可以给出各相关度最高的几种方案,供飞机维护维修人员参考。当系统升级为嵌入式时,还可以通过接入飞机的主机系统,当主机系统给出工作单号或故障代码时,可自动运行本系统。

2、飞机维护维修知识系统功能设计。对本系统框架提出了以下功能板块:基础查询功能和可视化分析功能。

(1)基础查询功能。日常维护功能:用户输入工作单号,点击查询,可获取相应的维护步骤;用户在根据维护步骤检查相应飞机系统部件之后,如果发现异常,可以提交异常报告,并保存在数据库中,给后续工作提供一定先例和经验。故障维修功能:用户输入故障代码,以及必要的事件描述,可获取最大相关度的维修步骤。除此之外,还包含以下功能:新建维修记录、查看异常报告、维修记录查询、搜索历史查询。

(2)可视化分析。可视化分析是知识图谱的一个重要应用,在实际飞机维修与维护中重要作用,采用某航空公司提供的相关数据集进行分析。结果五月份、六月份、十二月份飞机故障次数较多,主要原因可能是:五人们出行旅游数量较多,飞机航班数有所增加,基数大。十二月份因为天气比较寒冷,飞机内部部件或者飞机飞行所需液体成分容易出现问题,导致故障次数增加。结果在机场飞机出现故障的数量比较高,主要原因应该是在机场的飞机航班数比较多,基数大,出现故障的可能性相等的情况下,数量就会多。次要原因可能与飞机投入使用时间有关,这些地方较发达,机场建立的早,可能大部分飞机已经使用很久,出现故障可能性会变高。另外一个次要原因可能是在这几个机场飞行航班数过多,工作人员数量有限,无法及时对每一架飞机进行维护检查,所以导致了故障的发生。由以上分析可知,在基于知识图谱的飞机维护维修知识系统建立之后,不仅实现了飞机维修与维护资料的快速查询,而且使繁多的维修信息实现了数据可视化,对合理利用大数据、揭示信息的内在联系,起到指导作用。

二、飞机维修知识图谱应用

维修方案推荐HMM模型是由隐藏的马尔科夫链得到无法观测的状态序列[1],再由此推测出可以观测到的随机序列的模型.在飞机的实体识别任务中,HMM将故障实体标签视为隐状态,将可观测到的故障描述视为观测值.CRF模型是能够高效表达长距离依赖性和交叠性的机器学习实体抽取方法。对飞机的实际维修场景,在完成实体抽取任务过程中的优缺点总结如下.HMM假设当前状态只与前一个状态有关,没有考虑“故障描述”文本的长期依赖性.CRF虽然解决了标记偏置问题,但须使用大量特定语料进行训练,且不适用于方案推荐精确度较高的场景。BiLSTM克服了算法只能捕捉近距离的状态信息的问题,但是其调参过程复杂且没有考虑故障实体类型标签前后的依赖性.BiLSTMCRF通过加入CRF层提高了预测合理性,但是对短词的识别效果较差且易于过拟合.BM LSTM算法降低了对单个模型的依赖性,利用Bagging集成多种命名实体识别算法,实体识别精度显著提高.基于BM LSTM集成命名实体识别算法,本研究结合TF.IDF算法提出的飞机维修方案推荐系统,总体框架如图所示。

考虑实际应用场景,维修方案推荐系统设计采用运行效率高的文本相似度匹配模块计算进行方案匹配,当文本相似度匹配模块无法满足系统要求的匹配准确程度时,利用基于BM LSTM集成算法的实体识别匹配模块对“故障描述”文本中的关键信息进行抽取与检索,以获取更加准确的维修方案推荐。对文本相似度匹配模块的阈值设定,可以采用交叉验证方法或者基于经验的人工设定方法来确定阈值。本研究以系统匹配准确率为评价准则,采用交叉验证的方法确定文本相似度匹配模块的阈值,综上,本研究构建的基于知识图谱的维修方案推荐模型能够兼顾查询效率和推荐精度。

(1)文本相似性匹配模块。文本相似度的衡量关键在于句子中重要信息的匹配,直接采用完整句子进行相似度衡量容易受到语序和语言习惯的影响,因此进行相似度匹配的文本的颗粒度不应太大,采用Jieba分词的方法进行文本颗粒度细化,再去除停用词以减少无用信息对文本相似性计算的影响。文本相似性匹配的关键在于构建文本的特征向量.TF.IDF算法在获取句子特征方面表现优异,具有简单、效率高以及无效标注数据等优点。该算法通过加权技术将文本映射为向量,自动实现过滤常见词条并保存关键词条,即若某词条在出现频数越高,则权重越大.TF.IDF是词频TF和逆文本频率指数IDF的乘积.TF表示某个词条在文档中出现的频率,计算式为:

(2)实体识别匹配模块。当匹配得到的文本最高相似度低于设定阈值的水平时,触发实体识别匹配模块,提高系统匹配准确程度和精度,采用基于知识图谱的实体识别匹配模块进行更加精准的方案匹配,面向商用飞机“故障描述”字段的实体识别匹配模块包括本体构建、基于BM LSTM集成算法的实体抽取、基于Ne04j的知识图谱构建以及基于实体识别的故障。构建知识图谱的步骤如下:根据专家知识设计知识图谱的本体,为实体抽取步骤提供规范,本研究的应用背景为特定领域,因此采用专家知识人工构建本体.本体的构建包括实体类型的规定以及实体间关系类型的规定;基于BM LSTM算法对数据进行实体抽取,使抽取出的实体涵盖后续文本匹配需要的全部关键语义信息;基于Ne04j知识图谱进行匹配。在此过程中,利用抽取出的实体检索知识图谱进行实体间的相似度计算.通过获取知识图谱中的相应实体,对包含这些实体的文本进行加分,返回得分最高的文本作为匹配结果.匹配逻辑表达式为:

本研究所提出的飞机维修方案推荐系统通过综合考虑实际应用场景和需求,结合基于TF.IDF的文本相似度匹配模块和基于BM LSTM算法的实体识别匹配模块,能够智能和高效地实现维修方案的精准推荐功能。

通过对飞机故障维修效率低下、维修成本高以及非结构化知识资源利用不足等问题,提出了BM LSTM算法.考虑到航空领域的实际工业应用场景,结合TF.IDF相似度算法和BM LSTM算法,构建了基于知识图谱的面向商用飞机故障维修过程的维修方案智能推荐系统,利用所提方法对商用飞机在使用阶段产生的大量非结构化数据进行统一规范化表达,有效地提高了维修效率和维修精度。

参考文献:

[1]左奎军.基于视觉引导的民航维修工具抓取检测方法研究[D].南京:南京航空航天大学,2018.

[2]李臻.民航发动机全寿命周期机队维修策略优化方法研究[D].哈尔滨:哈尔滨工业大学,2019.

[3]白建坤,罗亮生,何艳斌.中国民航维修培训体系的现状与发展[J].航空维修与工程,2018(8):14-16.