基于物理信息神经网络的油气管道内腐蚀预测方法

doi:10.11902/1005.4537.2024.363

基于物理信息神经网络的油气管道内腐蚀预测方法

周涛涛¹^,²^,³, 刘迎正^,¹^,²^,³, 郑文培¹^,²^,³, 姜恒良⁴, 刘海鹏⁴, 夏刚⁴

1 中国石油大学(北京)安全与海洋工程学院北京 102249

2 油气生产安全与应急技术应急管理部重点实验室北京 102249

3 国家市场监督管理总局重点实验室(油气生产装备质量检测与健康诊断) 北京 102249

4 中国石油国际勘探开发有限公司北京 102100

Pipeline Corrosion Prediction Method Based on Physics-informed Neural Networks

ZHOU Taotao¹^,²^,³, LIU Yingzheng^,¹^,²^,³, ZHENG Wenpei¹^,²^,³, JIANG Hengliang⁴, LIU Haipeng⁴, XIA Gang⁴

1 College of Safety and Ocean Engineering, China University of Petroleum (Beijing), Beijing 102249, China

2 Key Laboratory of Oil and Gas Safety and Emergency Technology, Ministry of Emergency Management, Beijing 102249, China

3 Key Laboratory of Oil and Gas Production Equipment Quality Inspection and Health Diagnosis, State Administration for Market Regulation, Beijing 102249, China

4 China National Oil and Gas Exploration and Development Corporation Limited, Beijing 102100, China

通讯作者: 刘迎正，E-mail：liuyingzheng2024@126.com，研究方向为油气管道腐蚀预测

收稿日期: 2024-11-06 修回日期: 2024-12-05

基金资助:

国家自然科学基金.  72301294
中国石油天然气集团有限公司-中国石油大学(北京)战略合作科技专项.  ZLZX2020-05
中国石油大学(北京)科研启动基金.  2462023BJRC016

Corresponding authors: LIU Yingzheng, E-mail:liuyingzheng2024@126.com

Received: 2024-11-06 Revised: 2024-12-05

Fund supported:

National Natural Science Foundation of China.  72301294
Cooperation Technology Projects of CNPC (China National Petroleum Corporation) and CUPB (China University of Petroleum, Beijing).  ZLZX2020-05
Program for Youth Talents by the China University of Petroleum-Beijing.  2462023BJRC016

作者简介 About authors

周涛涛，男，1990年生，博士，副教授

摘要

为了对管道内腐蚀预测进行准确分析，解决传统机器学习在预测管道腐蚀速率时的解释能力不足和泛化能力不足的问题。通过将温度、CO₂分压与腐蚀速率之间的物理特性嵌入到神经网络中，使得模型服从给定的机理约束，同时考虑结构损失，缓解了模型过拟合和欠拟合，建立了基于物理信息神经网络(PINN)管道内腐蚀预测模型。结果表明：PINN模型效果优于支持向量机(SVM)、极端梯度提升(XGBoost)、人工神经网络(ANN)等模型，严格遵循着相关变量的单调性关系，确保了预测结果的物理一致性，同时该模型也表现出卓越的泛化能力。

关键词： 内腐蚀 ; 速率预测 ; 物理信息神经网络 ; 物理单调性

Abstract

With the increasing oil and gas exploration, the number of service pipelines is growing, making the accurate prediction of internal corrosion crucial for pipeline integrity management. To address the limitations of traditional machine learning methods in interpreting and generalizing corrosion rate predictions, the monotonic relationships between temperature, CO₂ partial pressure, and corrosion rate are incorporated into a Physics-Informed Neural Network (PINN). This approach is designed to adhere to mechanistic constraints, avoid overfitting and underfitting, and ensure physical consistency. The PINN model is shown to outperform Support Vector Machines (SVM), Extreme Gradient Boosting (XGBoost), and Artificial Neural Networks (ANN), demonstrating superior accuracy and generalization.

Keywords： internal corrosion ; rate prediction ; physics-informed neural networks ; monotonicity in physics

PDF (1719KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

周涛涛, 刘迎正, 郑文培, 姜恒良, 刘海鹏, 夏刚. 基于物理信息神经网络的油气管道内腐蚀预测方法. 中国腐蚀与防护学报[J], 2025, 45(5): 1320-1330 DOI:10.11902/1005.4537.2024.363

ZHOU Taotao, LIU Yingzheng, ZHENG Wenpei, JIANG Hengliang, LIU Haipeng, XIA Gang. Pipeline Corrosion Prediction Method Based on Physics-informed Neural Networks. Journal of Chinese Society for Corrosion and Protection[J], 2025, 45(5): 1320-1330 DOI:10.11902/1005.4537.2024.363

石油和天然气在全球能源结构中占据着举足轻重的地位^[1]，它们不仅是现代工业的血液，更是推动全球经济发展的关键动力。在这些能源的输送过程中，管道输送以其高效性、安全性和成本效益成为了首选方式^[2~5]。油气在开采和输送过程中不可避免地含有腐蚀性杂质^[6~8]，这些腐蚀性的杂质会与管道内壁发生化学反应，引起管道的泄漏以及破裂，严重危害管道的完整性。管道腐蚀速率是评价管道腐蚀的关键因素，准确预测管道腐蚀速率关系到能源供应的稳定性，也直接影响到相关企业的经济效益和环境安全^[9]。

管道内腐蚀预测的方法基本上可以概括为基于机理的方法、统计学方法以及基于机器学习(Machine learning，ML)的方法。基于机理的方法研究领域，De Waard和Milliams^[10]利用管道内腐蚀的动力学过程和相关实验现场数据于1975年提出了DWM (DeWaard-Milliams)模型，主要考虑了温度和CO₂分压，预测结果较为保守，后续又对模型进行了相关的改进^[11~13]，进一步考虑了其他的腐蚀影响因素。Interech公司提出了ECE (Electronic corrosion engineer)模型^[14]，该模型考虑了H₂S的影响，但是预测结果忽略了pH的作用。Nesic模型^[15,16]是著名的管道内腐蚀机理模型。该模型考虑了钢材表面的电化学模型、FeCO₃产物膜特征和形成机理、腐蚀动力学生长模型等。尽管基于机理的模型在预测和分析方面充分考虑了潜在的腐蚀机理，但其复杂性较高，且需要大量实验数据确定模型参数^[17,18]，计算成本高，此外内管道腐蚀受多种腐蚀机制共同影响，影响因素之间存在相互作用和协同效应，传统的机理模型未能考虑。统计学方法主要是以传统线性回归为主，Al-Fakih等^[19]提出的线性回归预测模型和Velázquez等^[20]提出的多元回归模型是利用的统计方法进行的模型构建，但是这类模型通常只能捕捉简单的线性关系，面对复杂的非线性问题时，效果通常不佳。Ossai等^[21]利用Markov链模型预测管道内腐蚀深坑的分布情况，较好的预测了时间序列，但是需要大量的实测数据来支持模型的参数估计和验证。

机器学习方法在管道内腐蚀预测的应用越来越广泛^[22]。El-Abbasy等^[23]基于回归分析和人工神经网络(Artificial neural network，ANN)的预测模型，在处理复杂的非线性问题上有着一定的优势。周逸轩等^[24]将遗传算法(Genetic algorithm，GA)优化BP神经网络同时结合了核主成分(Kernel principal component analysis，KPCA)特征分析方法进行页岩气集输管道的腐蚀预测。刘军衡等^[25]用麻雀搜索算法(Sparrow search algorithm，SSA)改进了支持向量机回归(Support vector regression，SVR)模型，优化后的模型预测效果明显提升。尽管数据驱动模型在捕捉变量之间的相关性方面表现出色^[26]，但是它们不能准确地理解输入和输出变量之间的因果关系^[27]。特别是在少样本或无样本区域，这些方法往往反应出参数关联特性与实际机理规律之间存在较大的偏差，且缺乏足够的物理可解释性。这使得这些模型常被称为“黑箱(Black box)^[28]”。

相关学者考虑到了机理模型和ML模型的局限性，考虑将特定领域的相关知识纳入到ML模型当中。由Raissi等^[29]首次提出的物理信息神经网络(Physics-informed neural networks，PINN)是一种十分有应用前景的方法，在多个领域显示出了巨大的应用潜力。PINN将物理知识转化为约束条件，并将这些约束条件编码到神经网络的训练过程中^[30]，从而得出符合物理规律的可解释性的预测结果^[31]，减少了对大量数据的依赖，增强了模型的普适性。在最近的研究中，国内外相关学者在不同领域当中将物理知识神经网络相结合。Zhou等^[32]将疲劳机制的物理学与概率物理信息网络相结合，提出了物理一致的疲劳寿命预测框架，利用灵敏度分析等验证了框架，具有较好的鲁棒性。任少君等^[33]利用物理信息神经网络预测了燃煤锅炉的NO _x 浓度，促使模型服从约束，提升模型在锅炉宽工况条件下的准确性。邓志平等^[34]将实验数据和先验机理衔接，在人工神经网络当中嵌入边界约束和关键参数间的单调性关系，预测了生物质气化产物的分布。而在管道内腐蚀预测领域，PINN的应用相对较少。陈潜等^[35]利用物理引导神经网络(PGNN)与改进粒子群算法(IPSO)相结合，将不同腐蚀因素的普适性规律加入到机器学习当中，该研究对于物理机理的运用并没有与传统的机理经验模型相结合。管道内腐蚀涉及复杂的动力学和化学反应过程，管道内腐蚀以CO₂腐蚀为主，受到多种腐蚀因素的影响^[36,37]，包括温度、管道内的CO₂分压、pH等等。了解管道内腐蚀的相关机制并合理的捕捉它们之间的作用关系对于预测模型的开发至关重要。

鉴于此，本研究提出了一种结合管道腐蚀机理信息的物理信息神经网络。该网络考虑了管道内腐蚀速率和两个腐蚀影响参数之间的单调关系，用于预测管道的内腐蚀预测。物理单调性关系从传统的机理模型中获取，通过损失函数的形式加入到模型的训练优化当中，并与其他具有代表性的基础ML模型进行比较，验证本研究建立的PINN模型的准确性、解释性和可推广性。

1 内嵌单调性关系的物理信息神经网络

1.1 神经网络框架

ANN是一种受生物神经网络启发的数学模型，用于模拟人脑处理信息的方式。由输入层、隐含层和输出层组成。隐含层需要利用激活函数来提取数据的非线性特征。本网络结构采用Sigmoid激活函数，因其在处理复杂的非线性任务时效果良好，其数学表达式为： $g (ψ) = \frac{1}{1 + e x p (- ψ)}$ ，其中 $ψ$ 为输入到Sigmoid激活函数的值， $g (ψ)$ 为Sigmoid激活函数的输出。

本文使用的网络结构为n~ $\tilde{N}$ ~1的人工神经网络结构作为管道内腐蚀预测的基础预测模型，其中n为输入层的神经元个数， $\tilde{N}$ 为隐含层节点个数，节点数设置为32。输出仅有腐蚀速率，故输出层节点数为1。对于含有N个数据的数据样本(x_i, t_i )，x_i = (x_i_{, 1}, x_i_{, 2},···, x_i_,_n ) $\in$ Rⁿ 作为人工神经网络的输入向量，t_i，i = 1,···, n，作为输出向量。模型的相应预测值可以表示为：

y_{i} = f (x_{i}) = β g (w x_{i} + b), i = 1, 2, \dots, N

(1)

式中，y_i 为模型对于第i个输入值的一维的预测输出；w作为连接输入和隐藏层的参数矩阵；β代表连接隐含层和输出层的权重参数；b为隐含层的偏置向量；f(x)为表征函数；g(x)为激活函数的表达函数。

ANN用的是反向传播算法进行的内部参数优化，具体是使用梯度下降的方式更新ω，β，b等内部参数，目标是实现模型的输出值和真实值之间的误差E_r最小化，具体如式(2)所示：

E_{r} = \sum_{i = 1}^{N} {(y_{i} - t_{i})}^{2}

(2)

1.2 物理单调性表述

对于任意的给定样本(x_i, t_i )，如果输出的变量 $y$ 对于输入变量x_i 第j维度x_j 之间存在单调关系。记 $\frac{\partial y}{\partial x_{j}}$ 为输出y相对于输入变量x_j 的偏导数。若y随x_j 单调递增，则 $\frac{\partial y}{\partial x_{j}} > 0$ ；反之，若y随x_j 单调递减，则 $\frac{\partial y}{\partial x_{j}} < 0$ 。具体偏导数如式(3)所示：

\begin{array}{l} \frac{\partial y}{\partial x_{j}} = \frac{\partial (β g (w x + b))}{\partial x_{j}} \\ = \frac{\partial (β_{1} g (w_{11} x_{i, 1} + \dots + w_{1 n} x_{i, n} + b_{1})) + \dots}{\partial x_{j}} + \\ \frac{\partial (β_{\tilde{N}} g (w_{\tilde{N} 1} x_{i, 1} + \dots + w_{\tilde{N} n} x_{i, n} + b_{\tilde{N}}))}{\partial x_{j}} \\ = \sum_{k = 1}^{\tilde{N}} β_{k} w_{k j} g (w_{k} x_{i} + b_{k}) (1 - g (w_{k} x_{i} + b_{k})) \end{array}

(3)

式中，j = 1, 2,···, n。

1.3 损失函数构建

L2正则化是一种用于减少机器学习模型复杂度并防止过拟合的技术。其基本原理是通过向损失函数中添加一个正则化项，来惩罚较大的权重值，从而使得模型的参数保持较小的数值,通常是将神经网络的权重矩阵和权重向量进行平方求和。若神经网络的权重矩阵w为 $\sum_{j = 1}^{n} \sum_{k = 1}^{\tilde{N}} w_{j k}$ ，权重向量β为 $\sum_{k = 1}^{\tilde{N}} β_{k}$ ，则L2正则化的权重损失(E_s)为：

E_{S} = \sum_{j = 1}^{n} \sum_{k = 1}^{\tilde{N}} {(w_{j k})}^{2} + \sum_{k = 1}^{\tilde{N}} {(β_{k})}^{2}

(4)

除防止过拟合的结构损失函数之外，蕴含着物理信息的物理不一致性损失函数尤为重要。其目标是为了使得传统神经网络符合一定的物理机理规律。将物理不一致性损失函数可表示为E_p，则E_p可用以下公式表示：

E_{p} = \sum_{j = 1}^{n} H (\frac{\partial y}{\partial x_{j}}, n_{j})

(5)

式中， $\frac{\partial y}{\partial x_{j}}$ 表示输出值y对于第j个输入x_j 的偏导数，若 $(\frac{\partial y}{\partial x_{j}} \cdot n_{j}) < 0$ ，则 $H (\frac{\partial y}{\partial x_{j}}, n_{j})$ 取 $|\frac{\partial y}{\partial x_{j}}|$ ，若 $(\frac{\partial y}{\partial x_{j}} \cdot n_{j}) > 0$ ，则 $H (\frac{\partial y}{\partial x_{j}}, n_{j})$ 取0；m_j 为定义的单调性因子，如果该因素的物理单调性为正值，那么n_i = 1，否则n_i = -1。此函数表示的含义为：如果在模型训练过程中，网络的实际过程与定义的单调性不同，即 $(\frac{\partial y}{\partial x_{j}} \cdot n_{j}) < 0$ ，那么将 $\frac{\partial y}{\partial x_{j}}$ 的绝对值作为惩罚值计入到 $E_{p}$ 中；如果单调性一致，即 $(\frac{\partial y}{\partial x_{j}} \cdot n_{j}) > 0$ 则在损失函数当中没有惩罚值。

PINN总损失可以由3部分组成：回归损失E_r、L2正则化结构损失E_s以及单调性损失E_p。总损失如式(6)所示：

\begin{array}{l} E = E_{r} + λ_{s} E_{s} + λ_{p} E_{p} = \sum_{i = 1}^{N} {(y_{i} - t_{i})}^{2} + \\ λ_{s} \{\sum_{j = 1}^{n} \sum_{k = 1}^{\tilde{N}} {(w_{j k})}^{2} + \sum_{k = 1}^{\tilde{N}} {(β_{k})}^{2}\} + λ_{p} \{\sum_{j = 1}^{n} H (\frac{\partial y}{\partial x_{j}}, n_{j})\} \end{array}

(6)

式中，λ_s，λ_p分别为E_s，E_p的权重因子。

1.4 模型评价指标

均方根误差(Root mean square error，R_MSE)是衡量模型预测值与实际观测值之间差异的一种常用指标。它提供了预测误差的标准度量，通常用于评估回归模型的性能，计算式如(7)所示：

R_{M S E} = \sqrt[]{\frac{1}{N} \sum_{i = 1}^{N} {(y_{i} - t_{i})}^{2}}

(7)

平均绝对误差百分比(Mean absolute percentage error，M_APE)是评估预测模型准确性的指标之一，它可以直观的表示预测值和实际值之间的差异，在实际值和预测值都是非负的情况之下使用效果较好。计算式如(8)所示：

M_{A P E} = \frac{1}{N} \sum_{i = 1}^{N} |\frac{t_{i} - y_{i}}{t_{i}}| \times 100 %

(8)

2 模型建立

2.1 实验数据和预处理

2.1.1 实验数据采集

本文收集到的数据为我国海南省东部某油田群管段^[38]。其海底采用的是油气混输双层保温管道。材质为API SPEC 5L X52等级管线钢，管线直径为273.1 mm，壁厚12.7 mm，设计腐蚀余量为2 mm，设计温度为80 ℃。输送介质为油气水的混合物，主要腐蚀介质为CO₂气体。收集到的相关数据共50组，相关数据及描述如表1所示。

表1 管道内腐蚀预测模型的相关变量

Table 1 Variables in prediction models of corrosion of pipelines

Labels	Variable	Variable name	Unit	Range	Average
X₁	T	Temperature	℃	41.7-69.4	58.5
X₂	P	System pressure	Pa	1.52 × 10⁶-3.23 × 10⁶	2.28 × 10⁶
X₃	$p_{C O_{2}}$	CO₂ partial pressure	Pa	2.9 × 10⁴-3.8 × 10⁴	3.3 × 10⁴
X₄	pH	pH	-	4.2-6.2	5.8
X₅	Vf	Fluid flow rate	m·s^-1	0.37-0.69	0.53
X₆	Cl^-	Cl^- concentration	mg·L^-1	3420-8280	6227
X₇	CO₂ eq	CO₂ concentration	mg·L^-1	15.8-27.4	22.7
X₈	HCO $_{3}^{-}$	HCO $_{3}^{-}$ concentration	mg·L^-1	107-208	150
X₉	WC	Water content	%	52.5-63.9	58.6
Y	V_corr	Internal corrosion rate	mm·a^-1	2.289-3.105	2.681

新窗口打开| 下载CSV

2.1.2 数据预处理

由于数据特征量纲的不同，需要对数据进行归一化处理，以减少深度学习过程当中的梯度爆炸问题。统一数据的尺度也可以使得模型更好的学习特征之间的关系。本研究采用的数据处理方式为Min-Max归一化方法，如式(9)所示：

x' = \frac{x - x_{m i n}}{x_{m a x} - x_{m i n}}

(9)

2.2 腐蚀因素单调性关系的叙述

管道的内腐蚀机理错综复杂，各种影响因素之间存在各式各样的相互作用，而其中有些因素对于管道腐蚀速率有着显著影响。本文重点分析温度和CO₂分压对于CO₂腐蚀下管道腐蚀速率的影响。

温度对于腐蚀速率的影响可以用化学反应过程来描述，温度的提升会加快CO₂在管道内部跟水的溶解，进而影响腐蚀速率。温度是影响化学反应进程的最关键因素，在一定范围内呈现的是单调递增的状态，这一点还可以从De Waard的相关模型当中可以看出。De Waard于1975年提出的相关模型一直是CO₂管道腐蚀预测领域的经典之作，其计算式如式(10)：

l g C_{r a t e} = 5.8 - \frac{1710}{T + 273} + 0.67 l g p_{C O_{2}}

(10)

其中，C_rate为腐蚀速率，mm·a^-1；T为温度，℃； $p_{C O_{2}}$ 为CO₂分压值，Pa。

对变量 $T$ 求偏导数，如式(11)：

\frac{\partial C_{r a t e}}{\partial T} = \frac{1710}{{(T + 273)}^{2}} \cdot 2.303 \cdot 10^{5.8 - \frac{1710}{T + 273} + 0.67 l g p_{C O_{2}}}

(11)

根据偏导数分析的结果可知，在所考察的模型有效域内，腐蚀速率关于温度的偏导数始终大于0。这一现象表明，在给定的公式适用条件下，腐蚀速率与温度之间存在单调递增的正相关关系。进一步地，根据De Waard等^[10]提出的理论模型，在特定的CO₂分压范围(3 × 10⁴~6 × 10⁴ Pa)内，当温度超过80 ℃时，由于腐蚀产物的形成，这些产物在管道金属表面形成一层保护膜，从而抑制腐蚀反应的进一步发展。相对地，在80 ℃以下，腐蚀速率随温度的升高而单调递增，未观察到由腐蚀产物引起的明显抑制效应。本研究所采用的实验对象和条件均位于前述模型所界定的适用范围之内，确保了研究结果的准确性和可靠性。因此，温度与管道的内腐蚀速率之间是单调递增关系，即：

\frac{\partial y}{\partial T} > 0

(12)

CO₂分压也是影响管道内腐蚀的重要因素之一。在管道内部的CO₂的腐蚀，CO₂与水反应生成H₂CO₃，进而引发腐蚀。研究表明，CO₂分压较高的时候，溶于水的CO₂量会变大，H₂CO₃的浓度也随之增加，会电离更多的H⁺，加速腐蚀过程。同样地，从DeWaard公式的偏导数(式11)可以看出，对变量 $p_{C O_{2}}$ 求得的偏导数如式(13)所示：

\frac{\partial C_{r a t e}}{\partial p_{C O_{2}}} = \frac{0.67}{p_{C O_{2}}} \cdot 10^{5.8 - \frac{1710}{T + 273} + 0.67 l g p_{C O_{2}}}

(13)

式(13)同样表明，腐蚀速率对CO₂分压的偏导数在统计意义上显著> 0，暗示CO₂分压的增加将正向促进腐蚀速率的提升。然而，与温度影响腐蚀速率的机制不同，CO₂分压对管道内腐蚀的作用并不涉及类似温度那样的复杂动态过程。由此可见，CO₂分压与管道内腐蚀之间也是单调递增关系，即：

\frac{\partial y}{\partial p_{C O_{2}}} > 0

(14)

2.3 PINN模型的训练过程

本文采用的基础模型为单层人工神经网络模型，隐含层节点数设置为32。使用的工具为PyTorch框架，其中的自动微分功能为偏导数的求得以及损失函数的相关处理提供了便捷。自动微分的核心原理是链式法则，即将复杂函数分解为一系列简单的基本函数(如加法、乘法、指数、对数等)，然后利用这些基本函数的已知导数来递归地计算整个函数的导数。模型的一般训练过程如下：

步骤1：设置PINN模型的网络结构，本文的模型结构为n~ $\tilde{N}$ ~1，隐含层节点为46，输入节点数和输出节点数按照数据类型自动设置。

步骤2：初始化相关的参数，比如网络结构中的ω，β，b等参数。

步骤3：根据式(6)给出的损失函数进行网络的权重更新，更新方式采用的是BP神经网络的反向传播算法，根据给定的学习率以及迭代次数，目标是使损失函数最小化，迭代结束后为PINN模型的最优权重参数。

综合上述分析结果，本研究采用温度和CO₂分压与管道内腐蚀速率之间的单调性关系作为物理先验知识，将其整合入PINN模型中。该模型据此对管道内腐蚀速率进行定量预测，确保预测结果与实验观测的一致性，并增强模型的准确性与可靠性。模型的整体结构如图1所示。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 基于PINN的内腐蚀预测模型框架

Fig.1 Framework of corrosion prediction model based on PINN

3 结果和讨论

本研究旨在从两个关键维度对所提出的模型进行性能评估：模型的预测精度和可解释性。(1) 采用R_MSE和M_APE两个指标分析本文提出的PINN腐蚀预测模型的预测效果，与其他3种基本预测模型(ANN、SVM、XGBoost)进行对比，3类基本模型包含监督学习模型、集成学习模型以及连接主义模型，涵盖不同的机器学习范式，从而确保对比分析的全面性和公正性；(2) 针对PINN模型的可解释性，本研究进行了深入分析，旨在验证模型对于关键变量温度和CO₂分压的单调性响应是否与理论预期一致。通过评估模型输出对这些变量的敏感性，旨在揭示模型预测的物理一致性和内在机制，从而增强模型的可信度和实用性。

3.1 模型性能分析和对比

为验证本研究所提出方法的性能，在一致的数据集基础上，进行了SVM、ANN、XGBOOST 3种经典机器学习模型与PINN内腐蚀预测模型以及传统的De Waard模型的预测成效比较。具体而言，以上所有5模型均在相同的训练数据和测试数据上运行，以确保比较的公正性和结果的可验证性。通过这种对照实验，旨在全面评估PINN模型在腐蚀预测任务中的准确性和实用性。

5种模型在测试集上的真实值和预测值的对比情况如图2所示。M_APE和R_MSE两个指标的情况如表2所示。从图中可以看出，PINN的模型拟合程度与原始值较为接近，SVM、ANN、以及XGBoost模型存在一些较大的波动。PINN的误差百分比为3.87%，在对比模型中效果最优，这得益于PINN腐蚀预测模型不仅考虑了物理一致性的约束也考虑了L2正则化下的结构损失。而De Waard模型的波动最大，因为其是根据实验数据拟合而出来的公式，虽然考虑了一定的腐蚀机理，但是模型的泛化性能较差。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 不同模型预测结果比较

Fig.2 Comparisons of prediction results of various models

表2 各模型误差

Table 2 Errors of prediction results of various models

Function

Metric

PINN

ANN

SVM

XGBoost

De Waard

R_MSE

0.1329

0.3419

0.2095

0.2491

0.7258

M_APE

3.81%

10.72%

5.76%

7.37%

63.19%

新窗口打开| 下载CSV

3.2 物理单调性和模型的可解释分析

3.2.1 PDA分析原理及实现方式

为了深入理解机器学习模型如何对特定特征的变化做出响应，部分依赖性分析(Partial dependence analysis，PDA)提供了一种有效的可视化工具。PDA假设其他特征是固定的，即在分析特定特征时，其他特征不变。这使得它能够专注于单一特征或特征组合的影响。利用PDA可以观察温度和CO₂关于内腐蚀速率的单调性变化。

本研究实现PDA的方式是数据构造。随机选择一组数据特征，包括温度和 $p_{C O_{2}}$ 在内的9个特征。观察温度和内腐蚀速率的变化时，等梯度的变化温度，变化范围为温度在给定数据的范围(49~70 ℃)，构造10000个温度特征，其他变量保持不变，根据管道 $p_{C O_{2}}$ 范围给定其值分别为3 × 10⁴、4 × 10⁴和5 × 10⁴ Pa，共构造3组维度为(10000，9)的温度特征数据，用于实验观察不同温度和内腐蚀速率之间的单调变化。同样的，判定 $p_{C O_{2}}$ 与内腐蚀速率的关系根据 $p_{C O_{2}}$ 数据范围(2.8 × 10⁴~3.7 × 10⁴ Pa)构建10000个 $p_{C O_{2}}$ 特征，根据管道温度范围给定温度分别为40、50和60 ℃，也同样构造3组维度为(10000，9)的 $p_{C O_{2}}$ 特征数据，用于判定不同 $p_{C O_{2}}$ 和内腐蚀速率之间的变化关系。由于构造数据量高达10000，生成的PDA分析图可近似为曲线。

3.2.2 温度的单调性分析

图3给出了4种模型的温度和内腐蚀速率的PDA分析图。图4给出了各个模型中预测点对温度和 $p_{C O_{2}}$ 偏导数的分布情况。从图3a、c和4a、c中可以看出，SVM模型和ANN模型都对于温度的变化有一定的敏感性。SVM模型的预测结果随着温度的升高呈现单调递增的趋势，这与温度对腐蚀速率影响的预期单调性相符，SVM模型的响应并不显著，甚至观察到轻微的下降趋势，在一定区域内偏导数呈现负值，这可能表明模型在该温度区间内对温度变化的捕捉能力有限，同时模型对于 $p_{C O_{2}}$ 的变化不敏感ANN模型对于温度的响应在 $p_{C O_{2}}$ 不同时呈现不同的状态， $p_{C O_{2}}$ 为3 × 10⁴和4 × 10⁴ Pa时呈现平缓上升的趋势， $p_{C O_{2}}$ 为3 × 10⁴ Pa时最后会趋于水平，在一定程度上符合温度单调性的关系，而 $p_{C O_{2}}$ 为5 × 10⁴ Pa时出现温度增加内腐蚀速率先下降后增加的趋势，一些数据区域偏导数呈现负值，违反了一定的物理单调性。这种对温度变化响应的非单调性揭示了在较高 $p_{C O_{2}}$ 条件下，模型在解释温度与腐蚀速率关系时的复杂性，或者指出了在特定环境压力下模型需要进一步校准以提高其预测的准确性和物理一致性。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 不同模型预测的管道在不同CO₂分压下的腐蚀速率随温度的变化

Fig.3 Corrosion rate vs. temperature curves obtained for pipelines by SVM (a), XGBoost (b), ANN (c) and PINN (d) models under different CO₂ partial presses

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 各个模型中预测点对温度和 $p_{C O_{2}}$ 偏导数的分布图

Fig.4 Distributions of partial derivatives of prediction points by SVM (a), XGBoost (b), ANN (c) and PINN (d) models with respect to temperature and $p_{C O_{2}}$

从图3b和4b中可以看出XGBoost模型则对于温度的变化并不敏感， $p_{C O_{2}}$ 在4 × 10⁴和5 × 10⁴ Pa、温度在60 ℃以上时，呈现略微递增的趋势。然而，从整体上看，该模型对于温度波动的反应并不显著，其偏导数在0以上小范围波动，大多数偏导数为0，表明其在捕捉温度对腐蚀速率影响方面的效能有限。这种低敏感度可能与XGBoost模型在处理温度特征时的算法特性有关，也可能反映出模型在建模过程中对温度变量的重视不足。图3d显示了本研究所提出的PINN内腐蚀预测模型的预测结果。在3种不同的 $p_{C O_{2}}$ 条件下，模型预测的温度与内腐蚀速率之间呈现出明显的单调递增关系。这表明PINN模型能够准确地捕捉到温度对腐蚀速率的正向影响，符合腐蚀过程的物理规律。从图4d可以看出，预测模型关于温度的偏导数都呈现正值，符合单调递增规律。此外，3条曲线在图中的相对位置也遵循 $p_{C O_{2}}$ 与腐蚀速率之间的单调性关系，即随着 $p_{C O_{2}}$ 的增加，预测的腐蚀速率相应上升。

3.2.3 p $_{C O_{2}}$ 的单调性分析

图5给出了 $p_{C O_{2}}$ 与内腐蚀速率的PDA图。由图5a可以看出，SVM模型对于 $p_{C O_{2}}$ 的变化呈现水平的直线，同时图4a表明，SVM模型关于 $p_{C O_{2}}$ 的偏导数值较小，且存在为偏导数为负值的区域。这一结果表明SVM模型对于 $p_{C O_{2}}$ 与内腐蚀速率之间的单调性关系不敏感。换言之，模型未能捕捉到 $p_{C O_{2}}$ 变化对腐蚀速率的显著影响，这可能意味着模型在该特征上的表达能力有限。

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 不同模型预测的管道在不同温度下的腐蚀速率随p $_{C O_{2}}$ 的变化

Fig.5 Corrosion rate vs. p $_{C O_{2}}$ curves obtained for pipelines by SVM (a), XGBoost (b), ANN (c) and PINN (d) at different temperatures

图5b和c给出了XGBoost和ANN关于 $p_{C O_{2}}$ 的PDA图。从图中可以看出，ANN和XGBoost对于 $p_{C O_{2}}$ 都有一定的敏感性。对于ANN模型，当温度设定为40、50和60 ℃时，预测的内腐蚀速率均随 $p_{C O_{2}}$ 的增加而呈现下降趋势。从图4b可以看出，ANN关于 $p_{C O_{2}}$ 的偏导数均为负值这与预期的 $p_{C O_{2}}$ 与腐蚀速率之间单调递增的物理规律不符，表明在这些温度条件下ANN模型未能准确反映 $p_{C O_{2}}$ 对腐蚀速率的正向影响。在对XGBoost模型的部分依赖性分析中， $p_{C O_{2}}$ 与内腐蚀速率的关系曲线表现出显著的波动性，其中包含了平稳段和急剧下降的区域。如图5b所示，该曲线的总体趋势是下降的，图4b中偏导数也主要在0以下波动，这与预期的物理规律相悖。

图5d显示了本研究提出的基于物理信息的神经网络模型的部分依赖性分析结果。该模型预测的内腐蚀速率与 $p_{C O_{2}}$ 之间的关系呈现出预期的单调递增趋势。图4d显示关于 $p_{C O_{2}}$ 的偏导数也均为正值。具体来说，在不同的温度条件下(40、50和60 ℃)，随着 $p_{C O_{2}}$ 的增加，预测的腐蚀速率也相应升高。此外，PINN模型的内腐蚀速率预测结果在图5d中以3条曲线的形式呈现，每条曲线对应一个特定的温度条件。这些曲线的位置从低到高依次排列，反映了 $p_{C O_{2}}$ 与腐蚀速率之间的单调递增关系，并且随着 $p_{C O_{2}}$ 的增加，曲线整体向上平移，进一步验证了模型预测的物理一致性和可靠性。

4 结论

(1) 此模型考虑了腐蚀速率和温度以及 $p_{C O_{2}}$ 的之间的物理单调性关系，构建了基于物理不一致性的损失函数，与相关模型对比模型性能和模型的可解释性。实验结果表明，在相同的数据集上，PINN模型能够严格遵循腐蚀速率与环境参数之间的单调性关系，这一点在SVM、ANN和XGBoost模型中并未得到充分体现，同时模型的预测性能也优于其他模型。本研究的发现证实了在物理规律约束下训练的PINN模型，能够有效地利用内腐蚀过程中的先验知识，增强模型的预测能力和解释性。

(2) 此模型基于机器学习，依赖于管道数据中几个关键影响因素(如腐蚀速率及相关环境参数)，因此具有广泛的适用性。无论是不同材质、不同工作环境或不同运行条件下的管道，只要监测相关数据，模型都能有效地进行腐蚀速率预测，具有较强的跨管道系统的适应能力和迁移能力。

尽管本研究在腐蚀机理知识引入机器学习领域取得了一定进展，当前的模型仍存在一定的不足。特别是未充分考虑管道内腐蚀速率受其他因素(如流速、管道材质和pH值等)影响的复杂性。未来的研究将重点探讨这些因素与腐蚀速率之间的关系，并考虑将其纳入模型，以进一步提高预测的精度和全面性。此外，针对目前模型在处理复杂多变环境下的适应性问题，未来还将考虑如何优化模型结构，增强其泛化能力和鲁棒性。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

Wasim

, Djukic

M B

External corrosion of oil and gas pipelines: A review of failure mechanisms and predictive preventions

[J]. J. Nat. Gas Sci. Eng., 2022, 100: 104467