基于Stacking集成模型融合的钢筋混凝土锈胀开裂预测方法
Prediction Method for Reinforced Concrete Corrosion-induced Crack Based on Stacking Integrated Model Fusion
通讯作者: 刘梅梅,E-mail:lmeimei@cccc4.com,研究方向为钢筋混凝土结构耐久性
收稿日期: 2024-01-12 修回日期: 2024-03-21
基金资助: |
|
Corresponding authors: LIU Meimei, E-mail:lmeimei@cccc4.com
Received: 2024-01-12 Revised: 2024-03-21
Fund supported: |
|
作者简介 About authors
梁梓豪,男,1997年生,硕士,助理工程师
为了解决传统经验公式模型对钢筋混凝土锈胀开裂预测方法存在的公式不统一、精度有限等问题的局限性,本文提出一种基于Stacking集成模型融合的钢筋混凝土锈胀开裂预测方法。首先,通过文献收集的223组钢筋混凝土锈胀开裂试验数据进行数据预处理;其次,基于支持向量回归(SVR)、随机森林(RF)和极端梯度提升树(XGBoost)算法分别进行贝叶斯优化超参数、模型训练及评估,采用决定系数
关键词:
In predicting corrosion-induced cracking of reinforced concrete, traditional empirical formulas used are varied with limited precision of prediction. To address these limitations, this paper presents a method based on the stacking of models to predict the cracking of reinforced concrete due to corrosion induced expansion. Firstly, 223 sets of test data on the cracking of reinforced concrete due to corrosion induced expansion were collected from published articles and processed in advance. Next, Bayesian optimization of hyperparameters, model training, and evaluation were conducted separately based on Support Vector Regression (SVR), Random Forest (RF), and Extreme Gradient Boosting (XGBoost) algorithms. Determination coefficient (R2), mean absolute error (MAE), and root mean square error (RMSE) were utilized for a comparative analysis of the prediction performances of three machine learning models. On this basis, a prediction model integrating multiple algorithms with the Stacking method was proposed. Finally, the generalization performances of the proposed prediction model and traditional empirical formula models were verified, and the XGBoost model was employed to analyze the interpretability of the proposed model. As revealed in the results, the proposed model has better prediction accuracy and generalization performance than other machine learning models. The interpretability analysis result demonstrates that the prediction of the proposed model logic matches the practical engineering experience. This finding is conducive to improve the prediction accuracy of thecorrosion-induced cracking of reinforced concrete, and can provide scientific theoretical guidance for decision-makers in practical engineering.
Keywords:
本文引用格式
梁梓豪, 应宗权, 刘梅梅, 杨帅.
LIANG Zihao, YING Zongquan, LIU Meimei, YANG Shuai.
目前,国内外许多学者对混凝土锈胀开裂过程的研究主要集中在数值模拟和试验方法。如有学者[3,4]使用非线性有限元方法对钢筋混凝土锈蚀开裂的演变过程和影响因素进行模拟分析,但此方法难以给出锈胀裂缝宽度与钢筋锈蚀率之间的关系式。此外,有学者[5~8]通过快速锈蚀试验给出了混凝土表面锈胀裂缝宽度与钢筋截面锈蚀率之间的关系式,如惠云玲[5]考虑混凝土表面锈胀裂缝宽度随不同参数的影响,对长期室外暴露混凝土试件破型取样,提出了钢筋混凝土锈蚀程度的预测方法,给出了钢筋锈蚀率与裂缝宽度、保护层厚度、钢筋直径和混凝土强度之间的经验公式;邸小坛和周燕[6]通过大量工程调查和试验研究,提出了基于混凝土表面裂缝宽度、保护层厚度、钢筋直径以及混凝土强度的钢筋锈蚀率经验公式,并给出在不同混凝土裂缝剥离状态下钢筋锈蚀率的区间范围。然而,基于试验方法不仅周期长、工作量大、成本高、所获得计算精度和试验数据有限,导致经验公式模型泛化性能差,而且对于影响钢筋锈蚀率的因素众多,实验方法无法充分考虑影响因素之间复杂映射关系。因此,找到一种能够快速且准确地评估结构健康状况的方法至关重要。
近年随着计算机的快速发展,基于人工智能和机器学习方法来解决复杂的工程问题引起了各领域的关注[9~15]。Liu等[16]提出了4种集成学习方法进行再生混凝土抗硫酸盐侵蚀性能预测,并通过重要性分析得到再生混凝土的抗硫酸盐侵蚀能力对干燥状态下的环境条件较为敏感的结论。Li等[17]提出了基于机器学习方法对超高性能混凝土与钢筋之间的粘结强度进行数据驱动分析,结果表明人工神经网络和随机森林的评估性能比经验公式更优,钢筋嵌入深度与钢筋直径之比对粘结强度有显著影响。Huang等[18]基于混合机器学习算法预测锈蚀钢筋混凝土粘结强度,结果表明,与传统经验模型相比,机器学习模型的预测性能远高于经验公式。胡以婵等[19]提出了一种基于Stacking模型融合的高性能混凝土强度预测方法,并验证极端梯度提升树(XGBoost)和随机森林(RF)融合模型比传统机器学习和经验公式模型的预测精度和泛化性能要好。由此可见,机器学习模型在工程实际研究中具有一定的潜力。然而,鲜有研究采用机器学习模型开展对钢筋混凝土锈胀开裂进行预测。
为了解决上述方法存在的局限性,本文将XGBoost、RF和支持向量回归(SVR)算法与集成学习方式进行融合,提出一种基于Stacking集成模型融合的钢筋混凝土锈胀开裂的预测方法。研究表明,与传统机器学习算法和经验公式模型相比,基于Stacking集成多种机器学习算法的模型在泛化性能和预测精度上得到一定的提升,研究结果具有较好的工程应用前景,可为探究钢筋混凝土锈胀裂缝发展规律提供理论参考。
1 数据处理
1.1 数据统计
其中,
图1
图1
模型输入和输出特征数据统计
Fig.1
Model input and output feature data statistics: (a) concrete strength, (b) protection thickness, (c) crack width, (d) reinforcement diameters, (e) corrosion rate
1.2 相关性分析
其中,
图2
1.3 数据集划分
此外,机器学习模型对于未知事件的预测结果质量主要取决于其泛化能力。因此,一个完整的模型训练过程必须包括对泛化性能的评估。将数据样本划分为训练集和测试集的目的正是为了验证基于训练集得到的模型在测试集上的分类效果。值得注意的是,测试集是完全独立于训练集,不参与模型训练过程。机器学习模型的泛化性能主要体现在对于测试集的预测表现。因此,将样本数据的80%用于模型训练,20%用于模型测试。
2 机器学习方法
2.1 支持向量机模型
SVR模型是由Vapnik[31]提出,其基本原理是通过非线性映射将输入参数映射到一个高层特征空间,随后在该空间中识别超平面以用于线性回归或分类,该映射过程涉及核函数的应用。其主要超参数包括核函数、惩罚因子等。SVR模型预测主要由下式实现:
其中,
2.2 随机森林模型
RF模型是由国外研究学者Breiman[32]在2001年提出。该算法采用Bootstrap随机放回采样,并使用并行计算方式来提高模型的泛化能力。其原理是基于Bootstrap抽样进行多轮抽样,每轮抽样中随机选取一个输入特征子集;然后,可以基于每个新的数据集和对应的特征来训练多个单独的决策树;最后,可以通过对每个决策树的结果进行投票或平均来确定RF模型的预测。对于回归问题,RF模型的输出是通过平均每个决策树的结果获得的,可以描述成下式:
其中,
2.3 XGBoost模型
XGBoost是由陈天奇等[33]于2015年提出的一种开源机器学习模型。其原理是基于boosting框架的一种算法,与传统梯度提升决策树(GBDT)相比,它通过对损失函数进行二阶Taylor展开、正则化和并行计算等方法进行改进,提高了模型的预测性能。它的目标函数可以由下式表达:
其中,
2.4 Stacking集成模型
图3
2.5 模型超参数优化
2.6 评估指标
为了评估机器学习模型的可靠性,需要对模型的预测性能进行评价。对于回归预测问题,本文选用决定系数(
其中,
3 模型预测及结果分析
3.1 预测结果分析
本文基于XGBoost、RF和SVR 3种机器学习模型对钢筋混凝土锈胀开裂进行预测,采用Bayes优化方法理论优化各个模型超参数,并采用上述2.6节中3种评估指标对模型进行评价,结果如表1所示。由此可见XGBoost预测性能表现最好,在测试集上的
表1 机器学习模型预测结果比较
Table 1
Arithmetic | Hyperparameterization | Optimal parameter values | RMSE/% | MAE/% | |
---|---|---|---|---|---|
Stacking | / | / | 0.906 | 1.17 | 0.88 |
XGBoost | n_estimator | 222 | 0.883 | 1.31 | 0.95 |
max_depth | 9 | ||||
gamma | 3 | ||||
learning_rate | 0.3 | ||||
RF | max_depth | 9 | 0.837 | 1.55 | 1.09 |
min_samples_split | 2 | ||||
min_sample_leaf | 1 | ||||
n_estimators | 125 | ||||
SVR | C | 32 | 0.773 | 1.83 | 1.46 |
Gamma | 1 |
此外,采用基于Stacking集成XGBoost、RF和SVR模型融合的钢筋混凝土锈胀开裂预测结果优于其他3种单一的机器学习模型,相比于XGBoost、RF和SVR,Stacking集成模型预测结果的
图4为标准化Taylor图,该图以图形的形式比较不同模型的性能,通过RMSE、
图4
3.2 模型比较
为了验证机器学习模型的钢筋混凝土锈胀开裂预测方法的适用性和准确性,本文将Stacking、RF和XGBoost模型与3种传统经验公式模型的计算结果进行比较。其中,3种传统经验公式模型计算公式见表2。式中,
表2 3种传统经验公式
Table 2
图5
表3 机器学习与经验公式模型误差比较
Table 3
3.3 模型验证
图6
图6
模型泛化性能验证比较
Fig.6
Comparison of generalization performance validations of various models
3.4 可解释性分析
为了探究各影响因素对钢筋锈蚀率的影响,本节选用XGBoost模型进行特征重要性(FI)分析。其主要的步骤是先将该特征值随机打乱输入到预测模型中,从而得到新的预测结果,然后通过计算新的预测值与原预测值的差值得到该特征的重要性,通过以上循环打乱各个参数,即可获得所有特征的重要性。利用该方法得到了裂缝宽度,混凝土强度,钢筋直径和保护层厚度4个输入参数的特征重要性排序,其贡献度分别为0.44、0.26、0.17和0.13。可以看出,锈胀裂缝宽度对钢筋锈蚀率影响最大,而保护层厚度影响最小;此外,混凝土强度是第二大的影响参数,其次是钢筋直径。
为进一步探究上述分析中的最重要影响因素对模型输出特征的影响,本节采用SHAP分析方法的单特征依赖图观察裂缝宽度的变化对钢筋锈蚀率的影响,结果如图7所示,其中X轴为裂缝宽度,Y轴为SHAP值,从图可以看出,Y=0轴线的上半区SHAP值为正,锈蚀率平均值为9.21%,下半区SHAP值为负,锈蚀率平均值为6.51%。结果表明:当裂缝宽度逐渐增大,SHAP值越大,钢筋锈蚀率变大的概率也逐渐增大。这是因为裂缝扩大使得环境中的水分子、氧气和侵蚀性离子更容易进入到钢筋内部,导致钢筋表面钝化膜破裂;其次,裂缝增大还会导致钢筋局部电化学环境变化,从而增加该区域的腐蚀敏感性。对于少数样本随裂缝宽度变大,钢筋锈蚀率变大不明显的主要原因是试验环境条件、混凝土材料性能和设计施工质量等因素也会对钢筋锈蚀程度产生影响。
图7
综上所述,本文构建的XGBoost方法对模型内部机制进行解释,量化了输入参数对模型的重要程度,且可解释分析显示最重要的输入特征参数为裂缝宽度和混凝土强度,说明模型内在的预测逻辑与工程实践的经验较吻合,模型具有一定合理性和可靠性。
4 结论
(1) 提出一种基于Stacking集合模型融合的钢筋混凝土锈胀开裂预测方法,相比于XGBoost、RF和SVR,Stacking集成模型预测结果的
(2) 与传统经验公式模型相比,本文提出Stacking模型和机器学习预测模型误差较小,均具备一定的泛化性能和适用性,而经验模型的预测值与试验真实值误差较大,说明经验模型有一定的局限性,泛化性能低。
(3) 基于XGBoost模型从全局和最重要的单特征因素开展模型可解释性分析。结果表明,裂缝宽度是最主要的影响因素,混凝土强度、钢筋直径和保护层厚度次之。随着混凝土裂缝宽度增大,钢筋锈蚀率变大的概率也会增大。说明模型的内在预测逻辑与实际工程经验较为吻合,模型具有一定合理性和可靠性。
参考文献
Reliability analysis of damaged concrete beams based on the rust crack width
[J]. J.
基于锈胀裂缝宽度的损伤混凝土梁可靠度分析
[J].
A practical mathematical model of concrete carbonation depth based on the mechanism
[J].
基于碳化机理的混凝土碳化深度实用数学模型
[J].
A study of carbonation-induced corrosion
[J].
Assessment and predicted experimental study on corrosive degree of reinforcements in concrete structures
[J].
混凝土结构中钢筋锈蚀程度评估和预测试验研究
[J].
Research and durability assessment of rust expansion cracks in reinforced concrete structures
[D].
钢筋混凝土结构锈胀裂缝的研究及耐久性评估
[D].
Research on the damage of concrete and the influence for the longitudinal reinforcement corrosion by stirrup corrosion
[D].
箍筋锈蚀引起的混凝土保护层损伤及对纵筋锈蚀的影响研究
[D].
Prediction for TBM penetration rate using four hyperparameter optimization methods and random forest model
[J].
基于4种超参数优化算法及随机森林模型预测TBM掘进速度
[J].
Application status of machine learning in field of natural environment corrosion assessment and prediction
[J].
机器学习在自然环境腐蚀评估与预测领域的应用现状
[J].机器学习应用于腐蚀数据的分析及腐蚀预测,已成为腐蚀学科的重要发展方向。介绍了近年来机器学习在土壤、海水及大气三种自然环境腐蚀研究中的应用现状,对比了不同环境中采用的机器学习方法及研究结果,总结了目前机器学习在三种自然环境腐蚀研究中存在的问题,展望了在材料腐蚀领域机器学习的未来发展趋势。
Research progress on corrosion prediction model of metallic materials for electrical equipment
[J].
金属材料腐蚀预测模型研究进展
[J].
Development on machine learning for durability prediction of concrete materials
[J].
机器学习预测混凝土材料耐久性的研究进展
[J].
Machine learning embedded with materials domain knowledge
[J].
材料领域知识嵌入的机器学习
[J].
Concrete strength prediction of the three gorges dam based on machine learning regression model
[J].
基于机器学习回归模型的三峡大坝混凝土强度预测
[J].
Prediction of abrasion resistance of pervious concrete based on machine learning
[J].The aim of this study is to utilize machine learning models for the prediction of the abrasion resistance of pervious concrete. 150 sets of pervious concrete abrasion resistance test data were collected and a database was constructed. 6 input parameters were identified using feature correlation analysis, namely maximum aggregate size, water/binder ratio, sand ratio, aggregate/binder ratio, fly ash ratio and rotation circle. A variety of machine learning algorithms (XGBoost, Gradient Boosting, AdaBoost, Decision Tree and Random Forest) were used to establish prediction models for the abrasion ratio of pervious concrete, and the model performance was characterized by coefficient of determination (<i>R</i><sup>2</sup>), root mean squared error (RMSE) and mean absolute error (MAE). The results show that the Gradient Boosting model exhibits high accuracy and small prediction error on both the training and test sets, and the comparative analysis with the existing theoretical models confirms the advantages of the Gradient Boosting model in predicting the abrasion ratio of pervious concrete. The research results can provide a reference for the design and application of pervious concrete, and are expected to reduce the maintenance cost of related projects.
基于机器学习的透水混凝土耐磨性能预测
[J].
Prediction of the sulfate resistance for recycled aggregate concrete based on ensemble learning algorithms
[J].
Estimation of bond strength between UHPC and reinforcing bars using machine learning approaches
[J].
Modelling the interface bond strength of corroded reinforced concrete using hybrid machine learning algorithms
[J].
Strength prediction method of high performance concrete based on stacking model fusion
[J].Strength prediction method of high performance concrete based on stacking model fusion was proposed to address the issues of large deviations and low efficiency of traditional empirical formulas for high-performance concrete strength prediction. Firstly, 1 030 sets of high-performance concrete compressive strength test data were preprocessed through data cleaning and normalization to eliminate abnormal data and the dimensional influence among data. Secondly, based on extreme gradient boosting (XGBoost), category boosting, multi-layer perceptron, and random forest (RF) algorithms, hyperparameter optimization, model training and evaluation were conducted, and the overall effect of the four base learners on strength prediction were compared and analyzed using coefficient of determination <i>R</i><sup>2</sup>, root mean square error and mean absolute error. Based on this, a Stacking ensemble learning model was constructed, which fuses multiple machine learning algorithms for concrete strength prediction. Finally, the model was validated using 103 sets of new data, and interpretable analysis was performed. The results show that compared to other combinations of base learners, the fusion model using XGBoost and RF significantly improves prediction accuracy and performance, and has good generalization performance. The interpretable analysis shows that the most important input feature variables are age and cement, indicating that the internal prediction logic of the model is more in line with engineering practice experience, having high rationality and reliability. The research results provide reference for further improving the accuracy of high-performance concrete strength prediction.
基于Stacking模型融合的高性能混凝土强度预测方法
[J].针对传统经验公式对高性能混凝土强度预测时存在偏差大、效率低等问题,本文提出一种基于Stacking模型融合的高性能混凝土强度预测方法。首先,通过数据清洗和归一化对1 030组高性能混凝土抗压强度试验数据进行预处理,剔除异常数据及消除数据间量纲影响;其次,基于极端梯度提算法(XGBoost)、类别优先梯度提升算法、多层感知器和随机森林(RF)4种算法开展超参数优化、模型训练和评估,采用决定系数、均方根误差和平均绝对误差对比分析4种基学习器对强度预测的整体效果,在此基础上构建基于Stacking集成学习融合多种机器学习算法的高性能混凝土强度预测模型;最后,采用103组新的高性能数据集对模型进行验证,并开展可解释分析。结果表明:与其他基学习器的组合相比,XGBoost和RF融合模型的预测精度和性能均明显提高,泛化性能较好,且可解释分析显示最重要的输入特征变量是龄期和水泥,说明模型内在的预测逻辑与工程实践的经验较吻合,具有较高的合理性与可靠度。研究结果为进一步提高高性能混凝土强度的预测精度提供参考。
Experimental research on compressive strength of concrete damaged by coupling of chlorine-corrosion
[J].
氯盐-锈蚀耦合损伤混凝土抗压强度试验
[J].
Effect of protective layer on crack of corroded reinforced concrete beam
[J].
保护层对锈蚀钢筋混凝土梁裂缝的影响
[J].
Relationship between corrosion rate and width of corrosion cracks in corner of concrete components with different depth of cover
[J].
基于不同保护层厚度下混凝土构件角区锈胀裂缝宽度与钢筋锈蚀率的关系研究
[J].
采用人工通电加速锈蚀法来获得6个不同锈蚀结果的锈蚀钢筋混凝土构件,在锈蚀钢筋混凝土试件的三个锈蚀表面划分网格,用裂缝观测仪对裂缝进行观测并记录裂缝的宽度值.将钢筋混凝土试件进行破型处理,获得对应裂缝位置处的钢筋锈蚀率.针对试验获得的保护层为10 mm、20 mm、30 mm下混凝土构件角部锈胀裂缝和锈蚀率的基本数据,通过数据拟合发现不同保护层厚度下锈蚀率和锈胀裂缝宽度存在明显的线性关系.最后,通过统计回归分析,将混凝土构件角部钢筋锈蚀率与裂缝宽度及保护层厚度之间的关系整合为一个回归方程,以方便其在实际工程中的应用.
Study on the relationship between total width of corrosion cracks in the corner of corroded reinforcement corrosion components and corrosion rate
[J].
锈蚀钢筋混凝土构件角部锈胀裂缝总宽度与钢筋锈蚀率之间的关系研究
[J].
针对锈蚀钢筋混凝土构件角部锈胀裂缝总宽度与钢筋锈蚀率之间的关系展开研究.采用半湿通电加速法,获得三个锈蚀钢筋混凝土试件,在其上测得75组锈胀裂缝宽度和锈蚀率数据,通过观测、汇总、分析得出以下结论:对于仅沿纵筋方向的锈胀裂缝,其裂缝总宽度与纵筋锈蚀率之间存在明显的线性关系,利用二者间的拟合公式进行实际锈蚀钢筋混凝土构件内部钢筋锈蚀率的预测是可行的.对于沿纵筋和箍筋方向的双向锈胀裂缝,其裂缝总宽度与纵筋锈蚀率之间不存在明显的线性关系,在实际锈蚀混凝土结构安全检测工作中应尽量避免采用此类裂缝来预测钢筋锈蚀情况.
Research on concrete reinforcement corrosion process and test
[D].
混凝土钢筋锈蚀过程及试验研究
[D].
Study on time-varying properties of load bearing-corroded reinforced concrete structures
[D].
持载锈蚀钢筋混凝土结构时变性能研究
[D].
Experimental study and prediction model of corrosion-induced crack width in RC structure
[J].
钢筋混凝土结构锈胀开裂宽度的试验研究及预测模型
[J].
Model of corroded expansion force at cracking on reinforced concrete structures
[J].
钢筋混凝土结构开裂时刻的钢筋锈胀力模型
[J].
The investigation and analysis of corroded and cracked reinforced concrete
[D].
混凝土结构锈胀裂缝分析与钢筋锈蚀预测研究
[D].
Normalization: A preprocessing stage
[Z].
Noise Reduction in Speech Processing
[M].
Xgboost: extreme gradient boosting
[J].
Fitting segmented regression models by grid search
[J].
Random search for hyper-parameter optimization
[J].
Taking the human out of the loop: A review of Bayesian optimization
[J].
Cover cracking as a function of bar corrosion: part I-experimental test
[J].
/
〈 |
|
〉 |
