基于物理信息神经网络的油气管道内腐蚀预测方法
Pipeline Corrosion Prediction Method Based on Physics-informed Neural Networks
通讯作者: 刘迎正,E-mail:liuyingzheng2024@126.com,研究方向为油气管道腐蚀预测
收稿日期: 2024-11-06 修回日期: 2024-12-05
基金资助: |
|
Corresponding authors: LIU Yingzheng, E-mail:liuyingzheng2024@126.com
Received: 2024-11-06 Revised: 2024-12-05
Fund supported: |
|
作者简介 About authors
周涛涛,男,1990年生,博士,副教授
为了对管道内腐蚀预测进行准确分析,解决传统机器学习在预测管道腐蚀速率时的解释能力不足和泛化能力不足的问题。通过将温度、CO2分压与腐蚀速率之间的物理特性嵌入到神经网络中,使得模型服从给定的机理约束,同时考虑结构损失,缓解了模型过拟合和欠拟合,建立了基于物理信息神经网络(PINN)管道内腐蚀预测模型。结果表明:PINN模型效果优于支持向量机(SVM)、极端梯度提升(XGBoost)、人工神经网络(ANN)等模型,严格遵循着相关变量的单调性关系,确保了预测结果的物理一致性,同时该模型也表现出卓越的泛化能力。
关键词:
With the increasing oil and gas exploration, the number of service pipelines is growing, making the accurate prediction of internal corrosion crucial for pipeline integrity management. To address the limitations of traditional machine learning methods in interpreting and generalizing corrosion rate predictions, the monotonic relationships between temperature, CO2 partial pressure, and corrosion rate are incorporated into a Physics-Informed Neural Network (PINN). This approach is designed to adhere to mechanistic constraints, avoid overfitting and underfitting, and ensure physical consistency. The PINN model is shown to outperform Support Vector Machines (SVM), Extreme Gradient Boosting (XGBoost), and Artificial Neural Networks (ANN), demonstrating superior accuracy and generalization.
Keywords:
本文引用格式
周涛涛, 刘迎正, 郑文培, 姜恒良, 刘海鹏, 夏刚.
ZHOU Taotao, LIU Yingzheng, ZHENG Wenpei, JIANG Hengliang, LIU Haipeng, XIA Gang.
管道内腐蚀预测的方法基本上可以概括为基于机理的方法、统计学方法以及基于机器学习(Machine learning,ML)的方法。基于机理的方法研究领域,De Waard和Milliams[10]利用管道内腐蚀的动力学过程和相关实验现场数据于1975年提出了DWM (DeWaard-Milliams)模型,主要考虑了温度和CO2分压,预测结果较为保守,后续又对模型进行了相关的改进[11~13],进一步考虑了其他的腐蚀影响因素。Interech公司提出了ECE (Electronic corrosion engineer)模型[14],该模型考虑了H2S的影响,但是预测结果忽略了pH的作用。Nesic模型[15,16]是著名的管道内腐蚀机理模型。该模型考虑了钢材表面的电化学模型、FeCO3产物膜特征和形成机理、腐蚀动力学生长模型等。尽管基于机理的模型在预测和分析方面充分考虑了潜在的腐蚀机理,但其复杂性较高,且需要大量实验数据确定模型参数[17,18],计算成本高,此外内管道腐蚀受多种腐蚀机制共同影响,影响因素之间存在相互作用和协同效应,传统的机理模型未能考虑。统计学方法主要是以传统线性回归为主,Al-Fakih等[19]提出的线性回归预测模型和Velázquez等[20]提出的多元回归模型是利用的统计方法进行的模型构建,但是这类模型通常只能捕捉简单的线性关系,面对复杂的非线性问题时,效果通常不佳。Ossai等[21]利用Markov链模型预测管道内腐蚀深坑的分布情况,较好的预测了时间序列,但是需要大量的实测数据来支持模型的参数估计和验证。
机器学习方法在管道内腐蚀预测的应用越来越广泛[22]。El-Abbasy等[23]基于回归分析和人工神经网络(Artificial neural network,ANN)的预测模型,在处理复杂的非线性问题上有着一定的优势。周逸轩等[24]将遗传算法(Genetic algorithm,GA)优化BP神经网络同时结合了核主成分(Kernel principal component analysis,KPCA)特征分析方法进行页岩气集输管道的腐蚀预测。刘军衡等[25]用麻雀搜索算法(Sparrow search algorithm,SSA)改进了支持向量机回归(Support vector regression,SVR)模型,优化后的模型预测效果明显提升。尽管数据驱动模型在捕捉变量之间的相关性方面表现出色[26],但是它们不能准确地理解输入和输出变量之间的因果关系[27]。特别是在少样本或无样本区域,这些方法往往反应出参数关联特性与实际机理规律之间存在较大的偏差,且缺乏足够的物理可解释性。这使得这些模型常被称为“黑箱(Black box)[28]”。
相关学者考虑到了机理模型和ML模型的局限性,考虑将特定领域的相关知识纳入到ML模型当中。由Raissi等[29]首次提出的物理信息神经网络(Physics-informed neural networks,PINN)是一种十分有应用前景的方法,在多个领域显示出了巨大的应用潜力。PINN将物理知识转化为约束条件,并将这些约束条件编码到神经网络的训练过程中[30],从而得出符合物理规律的可解释性的预测结果[31],减少了对大量数据的依赖,增强了模型的普适性。在最近的研究中,国内外相关学者在不同领域当中将物理知识神经网络相结合。Zhou等[32]将疲劳机制的物理学与概率物理信息网络相结合,提出了物理一致的疲劳寿命预测框架,利用灵敏度分析等验证了框架,具有较好的鲁棒性。任少君等[33]利用物理信息神经网络预测了燃煤锅炉的NO x 浓度,促使模型服从约束,提升模型在锅炉宽工况条件下的准确性。邓志平等[34]将实验数据和先验机理衔接,在人工神经网络当中嵌入边界约束和关键参数间的单调性关系,预测了生物质气化产物的分布。而在管道内腐蚀预测领域,PINN的应用相对较少。陈潜等[35]利用物理引导神经网络(PGNN)与改进粒子群算法(IPSO)相结合,将不同腐蚀因素的普适性规律加入到机器学习当中,该研究对于物理机理的运用并没有与传统的机理经验模型相结合。管道内腐蚀涉及复杂的动力学和化学反应过程,管道内腐蚀以CO2腐蚀为主,受到多种腐蚀因素的影响[36,37],包括温度、管道内的CO2分压、pH等等。了解管道内腐蚀的相关机制并合理的捕捉它们之间的作用关系对于预测模型的开发至关重要。
鉴于此,本研究提出了一种结合管道腐蚀机理信息的物理信息神经网络。该网络考虑了管道内腐蚀速率和两个腐蚀影响参数之间的单调关系,用于预测管道的内腐蚀预测。物理单调性关系从传统的机理模型中获取,通过损失函数的形式加入到模型的训练优化当中,并与其他具有代表性的基础ML模型进行比较,验证本研究建立的PINN模型的准确性、解释性和可推广性。
1 内嵌单调性关系的物理信息神经网络
1.1 神经网络框架
ANN是一种受生物神经网络启发的数学模型,用于模拟人脑处理信息的方式。由输入层、隐含层和输出层组成。隐含层需要利用激活函数来提取数据的非线性特征。本网络结构采用Sigmoid激活函数,因其在处理复杂的非线性任务时效果良好,其数学表达式为:
本文使用的网络结构为n~
式中,yi 为模型对于第i个输入值的一维的预测输出;w作为连接输入和隐藏层的参数矩阵;β代表连接隐含层和输出层的权重参数;b为隐含层的偏置向量;f(x)为表征函数;g(x)为激活函数的表达函数。
ANN用的是反向传播算法进行的内部参数优化,具体是使用梯度下降的方式更新ω,β,b等内部参数,目标是实现模型的输出值和真实值之间的误差Er最小化,具体如
1.2 物理单调性表述
对于任意的给定样本(xi, ti ),如果输出的变量
式中,j = 1, 2,···, n。
1.3 损失函数构建
L2正则化是一种用于减少机器学习模型复杂度并防止过拟合的技术。其基本原理是通过向损失函数中添加一个正则化项,来惩罚较大的权重值,从而使得模型的参数保持较小的数值,通常是将神经网络的权重矩阵和权重向量进行平方求和。若神经网络的权重矩阵w为
除防止过拟合的结构损失函数之外,蕴含着物理信息的物理不一致性损失函数尤为重要。其目标是为了使得传统神经网络符合一定的物理机理规律。将物理不一致性损失函数可表示为Ep,则Ep可用以下公式表示:
式中,
PINN总损失可以由3部分组成:回归损失Er、L2正则化结构损失Es以及单调性损失Ep。总损失如
式中,λs,λp分别为Es,Ep的权重因子。
1.4 模型评价指标
均方根误差(Root mean square error,RMSE)是衡量模型预测值与实际观测值之间差异的一种常用指标。它提供了预测误差的标准度量,通常用于评估回归模型的性能,计算式如(7)所示:
平均绝对误差百分比(Mean absolute percentage error,MAPE)是评估预测模型准确性的指标之一,它可以直观的表示预测值和实际值之间的差异,在实际值和预测值都是非负的情况之下使用效果较好。计算式如(8)所示:
2 模型建立
2.1 实验数据和预处理
2.1.1 实验数据采集
表1 管道内腐蚀预测模型的相关变量
Table 1
Labels | Variable | Variable name | Unit | Range | Average |
---|---|---|---|---|---|
X1 | T | Temperature | ℃ | 41.7-69.4 | 58.5 |
X2 | P | System pressure | Pa | 1.52 × 106-3.23 × 106 | 2.28 × 106 |
X3 | CO2 partial pressure | Pa | 2.9 × 104-3.8 × 104 | 3.3 × 104 | |
X4 | pH | pH | - | 4.2-6.2 | 5.8 |
X5 | Vf | Fluid flow rate | m·s-1 | 0.37-0.69 | 0.53 |
X6 | Cl- | Cl- concentration | mg·L-1 | 3420-8280 | 6227 |
X7 | CO2 eq | CO2 concentration | mg·L-1 | 15.8-27.4 | 22.7 |
X8 | HCO | HCO | mg·L-1 | 107-208 | 150 |
X9 | WC | Water content | % | 52.5-63.9 | 58.6 |
Y | Vcorr | Internal corrosion rate | mm·a-1 | 2.289-3.105 | 2.681 |
2.1.2 数据预处理
由于数据特征量纲的不同,需要对数据进行归一化处理,以减少深度学习过程当中的梯度爆炸问题。统一数据的尺度也可以使得模型更好的学习特征之间的关系。本研究采用的数据处理方式为Min-Max归一化方法,如
2.2 腐蚀因素单调性关系的叙述
管道的内腐蚀机理错综复杂,各种影响因素之间存在各式各样的相互作用,而其中有些因素对于管道腐蚀速率有着显著影响。本文重点分析温度和CO2分压对于CO2腐蚀下管道腐蚀速率的影响。
温度对于腐蚀速率的影响可以用化学反应过程来描述,温度的提升会加快CO2在管道内部跟水的溶解,进而影响腐蚀速率。温度是影响化学反应进程的最关键因素,在一定范围内呈现的是单调递增的状态,这一点还可以从De Waard的相关模型当中可以看出。De Waard于1975年提出的相关模型一直是CO2管道腐蚀预测领域的经典之作,其计算式如
其中,Crate为腐蚀速率,mm·a-1;T为温度,℃;
对变量
根据偏导数分析的结果可知,在所考察的模型有效域内,腐蚀速率关于温度的偏导数始终大于0。这一现象表明,在给定的公式适用条件下,腐蚀速率与温度之间存在单调递增的正相关关系。进一步地,根据De Waard等[10]提出的理论模型,在特定的CO2分压范围(3 × 104~6 × 104 Pa)内,当温度超过80 ℃时,由于腐蚀产物的形成,这些产物在管道金属表面形成一层保护膜,从而抑制腐蚀反应的进一步发展。相对地,在80 ℃以下,腐蚀速率随温度的升高而单调递增,未观察到由腐蚀产物引起的明显抑制效应。本研究所采用的实验对象和条件均位于前述模型所界定的适用范围之内,确保了研究结果的准确性和可靠性。因此,温度与管道的内腐蚀速率之间是单调递增关系,即:
CO2分压也是影响管道内腐蚀的重要因素之一。在管道内部的CO2的腐蚀,CO2与水反应生成H2CO3,进而引发腐蚀。研究表明,CO2分压较高的时候,溶于水的CO2量会变大,H2CO3的浓度也随之增加,会电离更多的H+,加速腐蚀过程。同样地,从DeWaard公式的偏导数(
2.3 PINN模型的训练过程
本文采用的基础模型为单层人工神经网络模型,隐含层节点数设置为32。使用的工具为PyTorch框架,其中的自动微分功能为偏导数的求得以及损失函数的相关处理提供了便捷。自动微分的核心原理是链式法则,即将复杂函数分解为一系列简单的基本函数(如加法、乘法、指数、对数等),然后利用这些基本函数的已知导数来递归地计算整个函数的导数。模型的一般训练过程如下:
步骤1:设置PINN模型的网络结构,本文的模型结构为n~
步骤2:初始化相关的参数,比如网络结构中的ω,β,b等参数。
步骤3:根据
综合上述分析结果,本研究采用温度和CO2分压与管道内腐蚀速率之间的单调性关系作为物理先验知识,将其整合入PINN模型中。该模型据此对管道内腐蚀速率进行定量预测,确保预测结果与实验观测的一致性,并增强模型的准确性与可靠性。模型的整体结构如图1所示。
图1
图1
基于PINN的内腐蚀预测模型框架
Fig.1
Framework of corrosion prediction model based on PINN
3 结果和讨论
本研究旨在从两个关键维度对所提出的模型进行性能评估:模型的预测精度和可解释性。(1) 采用RMSE和MAPE两个指标分析本文提出的PINN腐蚀预测模型的预测效果,与其他3种基本预测模型(ANN、SVM、XGBoost)进行对比,3类基本模型包含监督学习模型、集成学习模型以及连接主义模型,涵盖不同的机器学习范式,从而确保对比分析的全面性和公正性;(2) 针对PINN模型的可解释性,本研究进行了深入分析,旨在验证模型对于关键变量温度和CO2分压的单调性响应是否与理论预期一致。通过评估模型输出对这些变量的敏感性,旨在揭示模型预测的物理一致性和内在机制,从而增强模型的可信度和实用性。
3.1 模型性能分析和对比
为验证本研究所提出方法的性能,在一致的数据集基础上,进行了SVM、ANN、XGBOOST 3种经典机器学习模型与PINN内腐蚀预测模型以及传统的De Waard模型的预测成效比较。具体而言,以上所有5模型均在相同的训练数据和测试数据上运行,以确保比较的公正性和结果的可验证性。通过这种对照实验,旨在全面评估PINN模型在腐蚀预测任务中的准确性和实用性。
图2
表2 各模型误差
Table 2
Function Metric | PINN | ANN | SVM | XGBoost | De Waard |
---|---|---|---|---|---|
RMSE | 0.1329 | 0.3419 | 0.2095 | 0.2491 | 0.7258 |
MAPE | 3.81% | 10.72% | 5.76% | 7.37% | 63.19% |
3.2 物理单调性和模型的可解释分析
3.2.1 PDA分析原理及实现方式
为了深入理解机器学习模型如何对特定特征的变化做出响应,部分依赖性分析(Partial dependence analysis,PDA)提供了一种有效的可视化工具。PDA假设其他特征是固定的,即在分析特定特征时,其他特征不变。这使得它能够专注于单一特征或特征组合的影响。利用PDA可以观察温度和CO2关于内腐蚀速率的单调性变化。
本研究实现PDA的方式是数据构造。随机选择一组数据特征,包括温度和
3.2.2 温度的单调性分析
图3给出了4种模型的温度和内腐蚀速率的PDA分析图。图4给出了各个模型中预测点对温度和
图3
图3
不同模型预测的管道在不同CO2分压下的腐蚀速率随温度的变化
Fig.3
Corrosion rate vs. temperature curves obtained for pipelines by SVM (a), XGBoost (b), ANN (c) and PINN (d) models under different CO2 partial presses
图4
图4
各个模型中预测点对温度和
Fig.4
Distributions of partial derivatives of prediction points by SVM (a), XGBoost (b), ANN (c) and PINN (d) models with respect to temperature and
从图3b和4b中可以看出XGBoost模型则对于温度的变化并不敏感,
3.2.3 p 的单调性分析
图5
图5
不同模型预测的管道在不同温度下的腐蚀速率随p
Fig.5
Corrosion rate vs. p
4 结论
(1) 此模型考虑了腐蚀速率和温度以及
(2) 此模型基于机器学习,依赖于管道数据中几个关键影响因素(如腐蚀速率及相关环境参数),因此具有广泛的适用性。无论是不同材质、不同工作环境或不同运行条件下的管道,只要监测相关数据,模型都能有效地进行腐蚀速率预测,具有较强的跨管道系统的适应能力和迁移能力。
尽管本研究在腐蚀机理知识引入机器学习领域取得了一定进展,当前的模型仍存在一定的不足。特别是未充分考虑管道内腐蚀速率受其他因素(如流速、管道材质和pH值等)影响的复杂性。未来的研究将重点探讨这些因素与腐蚀速率之间的关系,并考虑将其纳入模型,以进一步提高预测的精度和全面性。此外,针对目前模型在处理复杂多变环境下的适应性问题,未来还将考虑如何优化模型结构,增强其泛化能力和鲁棒性。
参考文献
External corrosion of oil and gas pipelines: A review of failure mechanisms and predictive preventions
[J].
Buckling resistance of an X80 steel pipeline at corrosion defect under bending moment
[J].
Prediction of maximum pitting corrosion depth in oil and gas pipelines
[J].
Development and outlook of China's pipeline transportation technologies under energy security strategy
[J].
能源安全战略下中国管道输送技术发展与展望
[J].
Efficient management and safe operation of gas pipelines under the background of "Dual Carbon"
[J].
“双碳”背景下输气管道的高效管理与安全运行
[J].
Analysis of oil and gas pipeline corrosion causes and influencing factors
[J].
浅析油气管道腐蚀原因及影响因素
[J].
Analysis of chemical corrosion mechanism of oil and gas pipelines and its protective measures
[J].
油气管道化学腐蚀机理分析及其防护措施
[J].
Study on bearing capacity of buried pipeline containing corrosion defects under external force
[J].
含腐蚀缺陷埋地管道在外力作用下的承载力研究
[J].
A review on pipeline integrity management utilizing in-line inspection data
[J].
Carbonic acid corrosion of steel
[J].
Predictive model for CO2 corrosion engineering in wet natural gas pipelines
[J].
Prediction of CO2 corrosion of carbon steel
[A].
Influence of liquid flow velocity on CO2 corrosion: a semi-empirical model
[R].
A quasi 2-D localized corrosion model
[A].
Integrated CO2 corrosion-multiphase flow model
[A].
A revision of mechanistic modeling of mild steel corrosion in H2S environments
[J].
Advances in corrosion growth modeling for oil and gas pipelines: a review
[J].
Quantitative structure-activity relationship model for prediction study of corrosion inhibition efficiency using two-stage sparse multiple linear regression
[J].
Predictive model for pitting corrosion in buried oil and gas pipelines
[J].
Markov chain modelling for time evolution of internal pitting corrosion distribution of oil and gas pipelines
[J].
Main control factors and prediction model of flow-accelerated CO2/H2S synergistic corrosion for X65 steel
[J].
Artificial neural network models for predicting condition of offshore oil and gas pipelines
[J].
Internal corrosion rate prediction of shale gas gathering pipeline based on KPCA-GA-BP model
[J].
基于KPCA-GA-BP模型的页岩气集输管道的内腐蚀速率预测
[J].
Pipeline corrosion rate prediction based on SSA-SVR model
[J].
基于ISSA-SVR模型的管道腐蚀速率预测
[J].
Prediction on CO2 corrosion rate of tubing based on neural oblivious decision ensemble
[J].
基于神经遗忘决策集成的油管CO2腐蚀速率预测
[J].
Theory-guided data science: a new paradigm for scientific discovery from data
[J].
Opening the black box: interpretable machine learning for geneticists
[J].Because of its ability to find complex patterns in high dimensional and heterogeneous data, machine learning (ML) has emerged as a critical tool for making sense of the growing amount of genetic and genomic data available. While the complexity of ML models is what makes them powerful, it also makes them difficult to interpret. Fortunately, efforts to develop approaches that make the inner workings of ML models understandable to humans have improved our ability to make novel biological insights. Here, we discuss the importance of interpretable ML, different strategies for interpreting ML models, and examples of how these strategies have been applied. Finally, we identify challenges and promising future directions for interpretable ML in genetics and genomics.Copyright © 2020 Elsevier Ltd. All rights reserved.
Hidden fluid mechanics: learning velocity and pressure fields from flow visualizations
[J].For centuries, flow visualization has been the art of making fluid motion visible in physical and biological systems. Although such flow patterns can be, in principle, described by the Navier-Stokes equations, extracting the velocity and pressure fields directly from the images is challenging. We addressed this problem by developing hidden fluid mechanics (HFM), a physics-informed deep-learning framework capable of encoding the Navier-Stokes equations into the neural networks while being agnostic to the geometry or the initial and boundary conditions. We demonstrate HFM for several physical and biomedical problems by extracting quantitative information for which direct measurements may not be possible. HFM is robust to low resolution and substantial noise in the observation data, which is important for potential applications.Copyright © 2020 The Authors, some rights reserved; exclusive licensee American Association for the Advancement of Science. No claim to original U.S. Government Works.
Temperature prediction of lithium-ion batteries based on physical information and deep neural network
[J].
基于物理信息与深度神经网络的锂离子电池温度预测
[J].
Physics-informed machine learning
[J].The rapidly developing field of physics-informed learning integrates data and mathematical models seamlessly, enabling accurate inference of realistic and high-dimensional multiphysics problems. This Review discusses the methodology and provides diverse examples and an outlook for further developments.
A physically consistent framework for fatigue life prediction using probabilistic physics-informed neural network
[J].
Forecasting method for NO x emission in coal fired boiler based on physics-informed neural network
[J].
基于物理信息神经网络的燃煤锅炉NO x 排放浓度预测方法
[J].
Prediction method for biomass gasification product distribution based on physics-informed neural network
[J].
基于物理信息神经网络的生物质气化产物分布预测方法
[J].机器学习方法已经在生物质气化建模中展现出广阔的应用前景。然而,机器学习模型主要依赖于实验数据,并不考虑气化中的反应机理,在数据样本不充分的情况下模型所表现出的实际关联特性与机理规律之间存在严重偏差。为此,提出一种基于物理信息神经网络(PINN)的生物质气化产物分布预测方法,该方法将真实实验数据与先验机理进行无缝衔接,在人工神经网络(ANN)模型中嵌入边界约束和关键参数间的单调性关系,通过自动微分技术进行辅助优化,实现模型的高效训练。结果表明:PINN模型的决定系数大于0.89,均方根误差小于4%,其总体预测精度要优于随机森林(RF)、支持向量机(SVM)和ANN 3种纯拟合机器学习模型;PINN模型能够严格服从边界约束和先验机理单调性关系,表现出更好的可解释性和泛化能力。
Physics-guided prediction of corrosion rate inside gathering and transportation
[J].
基于物理引导的集输管道内腐蚀速率预测及可解释性分析
[J].
Research progress on internal corrosion of supercritical/dense-phase CO2 pipelines for CCUS
[J].
CCUS超临界/密相CO2管道内腐蚀研究进展
[J].
Effect of water content on corrosion behavior of X65 pipeline steel in supercritical CO2 fluids
[J].
水含量对超临界CO2输送管道腐蚀的影响
[J].通过模拟实验和表面分析技术等方法,对比研究有无杂质的超临界CO<sub>2</sub>输送环境中水含量对X65管线钢腐蚀行为的影响,并探讨不同水含量环境中杂质对X65钢腐蚀的影响机理。结果表明:在超临界CO<sub>2</sub>-H<sub>2</sub>O环境中,即使水含量达到饱和溶解度0.4114%,X65钢也仅发生轻微腐蚀,腐蚀速率为0.0013 mm/a。在O<sub>2</sub>、H<sub>2</sub>S、SO<sub>2</sub>和NO<sub>2</sub>杂质共存的超临界CO<sub>2</sub>-H<sub>2</sub>O环境中,水含量由0.002%增加至0.4114%,X65钢腐蚀速率由0.0181 mm/a增加至0.2901 mm/a。杂质与杂质间交互作用显著促进腐蚀性液相形成,进而加剧X65钢的腐蚀。在低含水量环境中,X65钢腐蚀过程由杂质间反应产物控制;而在高含水量环境中,杂质和杂质间反应产物共同控制X65钢的腐蚀过程。
/
〈 |
|
〉 |
