基于机器学习的工程施工大数据智能分析平台设计研究

(整期优先)网络出版时间:2024-05-20
/ 4

基于机器学习的工程施工大数据智能分析平台设计研究

安 欢,徐 宏,杨 倩,田黎明

(中铁一局集团有限公司,西安,710054)

摘要工程施工行业的数据分析和数据价值的挖掘对于项目生产、企业管理等具有重要意义,也是进行数字化转型的必然举措之一。目前,国内施工企业对数据的采集、管理基本依靠人工,对数据的分析也基本表现为基础统计分析,对海量数据进行统一分析和内在规律挖掘极度缺乏。本文提出的基于机器学习的工程施工大数据智能分析平台通过大数据处理分析技术,以建立业务模型为基础,明确业务场景,剖析业务问题,进而开展数据建模、算法建模、模型验证与优化等工作,同时提供资源调度与匹配优化等功能,最终将成熟的算法模型存储于模型库,为生产管理提供有效的辅助决策。该平台区别于通用性分析平台,以业务模型为基础,并提供可视化操作界面,具备行业友好性和操作便捷性,算法库和模型库也提供了良好的可扩展性,为工程施工行业的数据分析提供了良好的平台工具。

关键词:工程施工;智能分析;业务模型;算法库;模型库;辅助决策

Design Research of Big Data Intelligent Analysis Platform for Engineering Construction Based on Machine Learning

Abstract: The data analysis and mining of data value in the construction industry is really significant for project production, enterprise management. Its also one of inevitable measures for digital transformation. At present, domestic construction enterprises mainly rely on manual on data collection and management, and the data analysis mainly involves basic statistical analysis. The unified analysis and internal rule mining of massive data is extremely lacked. By big data processing and analysis technology, the big data intelligent analysis platformproposed in the article is based on business models, clarify business scenarios, analyze business problems, and build data modeling, algorithm modeling, model validation and optimization work. Besides, it has functions such as resource adjustment and matching optimization. Finally, mature algorithm models are stored in the model library, providing effective auxiliary decision-making for production management. This platform is different from the general analysis platform, based on business models and provides a visual operation interface, which is industry friendly and easy to operate. The algorithm library and model library also has good scalability. The platform provides a good platform tool for construction industry data analysis.

Keywords: Engineering construction; Smart analysis; Business model; Algorithm library; Model library; Assistant decision

0引言

近年来,随着云计算、大数据、人工智能等技术的快速发展,以及这些技术与各行业融合应用的纷纷涌现,很多传统行业开始将产业数字化转型升级列为企业发展的战略规划,而产业数字化的重要基础就是数据资产的积累和价值挖掘。在2023底发布的《“数据要素×”三年行动计划(2024—2026年)》

[【1】]中,也明确列举出多个行业领域数据要素发挥价值的重点行动。“新质生产力”概念的提出,也为各行业领域进行产业转型升级和高质量发展提供了新的路径。而数据则在新质生产力中有着至关重要的作用,主要体现在驱动创新。通过对数据内在规律及价值的挖掘分析,可以为企业优化生产提供辅助决策,进而提高生产效能。除此之外,数据在技术创新、管理创新和商业模式创新等方面也有着明显的支撑和推动作用。

工程施工行业目前大部分还属于劳动密集型,在数字化、智能化优化改造及转型升级方面起步较晚[【]2,加上专业多、业务标准化程度低、数据复杂,包括数据的类型、属性、采集方式、存储介质等,也缺乏较成熟和规范的数据管理基础设施建设[【]3,因此数据价值没有得到有效和充分利用,对于生产和管理的辅助决策作用非常有限[【]4。但是,随着铁路、轨道交通、房建、市政等主要板块的业务发展,以及城市更新、绿色建造、新能源等新兴市场的出现,施工行业对于数据价值的需求越来越凸显[【]5,例如投标质量分析、安全风险管控[【]6、进度质量管理等,而常规的大数据分析平台往往较为专业,适合有一定分析背景的用户使用,最重要的是和业务场景的融合较差,平台本身提供的数据模型等与具体业务存在割裂,因此一个能基于业务的数据分析平台将对于为工程施工行业提供基于数据的管理决策意义重大。

1建设目标

针对工程施工行业构建大数据智能分析平台,区别于通用型的分析平台,该平台在包含基础分析功能支撑的基础上,主要解决针对行业场景的业务模型搭建和应用,形成大数据分析算法库与模型库,完成数据挖掘、分析、计算、展示与部署,满足勘察设计、工程施工、运营维护全产业链分析需求的同时,还能够支撑智慧城市、智慧交通等第三方大数据分析需求。同时,通过对大数据分析服务的封装与发布,为大数据相关应用服务提供各分析组件,支持大数据应用系统的形成。基于该平台,可以构建并封装基于场景的业务模型,例如地铁盾构轴线纠偏模型、地面沉降预测模型等,此类模型可以重复调用,或者在类似条件下对输入数据和模型参数微调后使用,有效提高了分析模型的业务适用性[【]7[【]8

2系统介绍

按照数据分析模型构建逻辑,基于机器学习的工程施工大数据智能分析平台主要由大数据智能分析可视化工具、算法库、模型库、大数据分析过程数据处理、大数据分析服务封装与发布和大数据计算资源调用匹配优化等核心模块组成,并依赖大数据计算引擎和基础环境提供计算能力和运行环境等。

平台的外层架构包括了底层的数据管理平台[【]9和上层的数据应用服务平台,数据管理平台为分析平台提供数据包,形式可以是标准的数据中台,也可以是企业根据实际需求建设的轻量化中台、数据资产管理平台等。而上层的大数据应用服务平台类似,由分析平台提供分析组件和服务,形式可以是应用广场,也可以是具体的业务应用系统或平台[【]10[【]11

1 平台功能架构设计

2.1 大数据智能分析可视化工具

大数据智能分析可视化工具包括业务建模工具、数据建模工具、分析建模工具与试验验证工具等。

业务建模工具帮助分析人员快速了解业务相关信息,从中找出业务痛点,分析出业务问题。根据具体业务需求,构建对应业务场景下的业务主干脉络,形成对业务的宏观描述,同时明确业务问题。数据建模工具针对业务问题分析处理数据,涵盖了从数据产生、处理、应用的整个过程,包括感知、筛选、关联、索引、调用等阶段,支持全过程可视化展示,为分析建模奠定数据基础。分析建模工具针对业务问题进行分析,使用数据建模提供的数据,通过分析流程构建、分析单元等完成相应的算法模型构建与融合,支持分析模型构建、运行计算、结果分析和可视化展示,最终完成对业务问题的分析。试验验证工具通过构建验证场景、验证数据包,对分析模型进行验证,为模型修正、优化提供参考,包括验证场景构建、应用验证数据包构建、模型预览、模型验证等功能。

2.2 算法库

考虑到建筑业场景业务的复杂性,平台对已有的行业通用算法(如数据预处理类、特征工程类、数值模拟类等)、行业专用算法(如pack公式、有限元分析类等)、人工智能算法(如XGboost、SVM、BP神经网络等)进行封装与分类管理,形成算法库。算法来源可以是开源算法包,也可以由用户对开源算法进行封装改造后形成。

算法库在集成已有算法的基础上,还提供Python、R等语言算法扩充功能,通过在线算法代码规约工具,对自主算法进行引导式整合,进一步提升算法的规范性、通用性、独立性和平台无关性,经过代码安全核查后实现算法扩充;同时平台提供算法库管理工具,实现算法的加载、调试、版本的管理,满足大数据智能分析需求。

2.3 模型库

在不同业务场景下,基于数据、算法和业务知识的融合,对业务分析过程进行凝练,通过分析建模工具,建立对应的业务、数据、分析、验证模型,进而形成模型库。此外,模型库还会内置已经训练并应用成熟的行业场景模型,如地面沉降预测模型、盾构轴线纠偏模型、盾构滚刀刀具磨损评估模型等,并通过模型库管理工具,对模型实现分类管理,对模型实现分类管理,实现模型的加载、调试、版本管理,满足大数据智能分析需求。

2模型库模块

3系统特性和使用受限场景

3.1 系统特性

平台融合多用户管理、高效数据存储访问、分布式并行数据处理等实现大数据智能分析平台的高效数据分析和处理能力。

平台提供的数据隔离、身份信息进一步验证、数据备份以及元数据的加密等安全功能,可以保障其安全可靠的运行。同时,平台具备日志审计、管理、查询功能,主要操作如启动、关闭、功能模块的启用和关闭均会产生日志并具备日志存储空间的阈值设置功能。

3.2 系统使用受限场景说明

该平台的使用是基于业务场景开展的,要求用户对业务场景有较为准确和深入的理解,对于业务场景的建模目标有清晰的定义等。其次,平台依赖于底层数据管理平台提供数据包,因此要求用户场景有充足和较为完备的数据量,能够支撑分析平台的数据处理和模型构建。

4结束语

相较于金融、医疗、教育、能源等行业,建筑业的数字化转型升级起步较晚,对于数据的采集、管理和分析应用也还在初始阶段,甚至可以说现在就是传统施工企业的新赛点,如何建立数据资产,并利用数据价值提升企业生产和管理效能必定会为转型升级提供最有利的支撑,在赢得赛点上抢占优势。目前,AI技术、大模型技术也在各行业被广泛应用,国家也在积极布局算力中心建设,而这些技术应用的前提均是数据管理和分析应用得到充分的积累,建立有效的业务大数据智能分析平台是实现这一目标的有效途径之一。

参考文献


[【1】][1]国家数据局.“数据要素×”三年行动计划(2024—2026年).[2024-01-08].https://mp.weixin.qq.com/s/utNOAXwc_NHEXQdNqMZo7A

[【][2] 张坤璞. 建设工程施工数字化管理的应用研究[J]. 工程技术研究,2023,8(13):150-152. DOI:10.19537/j.cnki.2096-2789.2023.13.046.

[3] TIAN D., LI M., SHEN Y., et al. Intelligent mining of safety hazard information from construction documents using semantic similarity and information entropy[J]. Engineering Applications of Artificial Intelligence: The International Journal of Intelligent Real-Time Automation,2023,119. DOI:10.1016/j.engappai.2022.105742.

[【][4] 赵余江. 现代建筑工程施工建设过程中的大数据技术应用研究[J]. 建筑技术开发,2020,47(14):78-79. DOI:10.3969/j.issn.1001-523X.2020.14.040.

[5] NGO, JASMINE, HWANG, BON-GANG, ZHANG, CHENYUE. Factor-based big data and predictive analytics capability assessment tool for the construction industry[J]. Automation in construction,2020,110(Feb.):103042.1-103042.12. DOI:10.1016/j.autcon.2019.103042.

[6] 苑东林. 大数据视角下建筑施工安全风险管理研究[J]. 建筑与装饰,2022(11):58-60.

[7] 贾淑滟. 基于Spark技术的大数据智能分析平台构建[J]. 滨州学院学报,2023,39(6):86-91. DOI:10.13486/j.cnki.1673-2618.2023.06.012.

[8] 李娟. 基于Hadoop云平台的空间属性数据挖掘技术研究[J]. 南京理工大学学报(自然科学版),2022,46(4):419-426. DOI:10.14177/j.cnki.32-1397n.2022.46.04.006.

[9] KYAR NYO AYE, THANDAR THEIN. A platform for big data analytics on distributed scale-out storage system[J]. International journal of big data intelligence,2015,2(2):127-141.

[10] 王烨晟,吴勇,赵良云,等. 城市地下工程盾构施工风险分级管控平台研发与应用分析[J]. 现代隧道技术,2023,60(1):76-89,106. DOI:10.13807/j.cnki.mtt.2023.01.008.

[11] 阮梦雄. 高速公路隧道智慧综合管控平台建设探析[J]. 科学与信息化,2023(7):146-148.

[【] 

[【] 

[【] 

[【] 

[【] 

[【] 

[【] 

[【]