异构金属材料因其特殊的微观结构,在具有较高强度的同时仍然能保持良好的韧性,但是复杂的结构参数使其性能预测和结构设计变得非常困难。机器学习(ML)在处理高维物理量之间的复杂非线性关系方面表现出强大的能力,从而成为异构金属材料性能预测和结构设计的有力工具。介绍了异构金属材料的特征,总结了ML算法及其相关的数据处理问题,综述了ML在异构金属材料性能预测和结构设计方面的应用研究现状,给出了ML辅助异构金属材料性能预测及结构设计中存在的关键问题,并对未来的研究方向进行了展望。
1、异构金属材料的特征
通过设计材料表面微观结构、晶体结构或成分不均匀,构筑组分间性能不协调界面而引发额外强化效应的材料被称为异构金属材料。异构金属材料中的组分分为“硬区”和“软区”两类,二者间的协同作用大大提高了材料的强度和韧性,甚至高于混合法的预测值。根据设计方法的不同,异质结构主要分三类:控制组元的尺寸和结构不同,如梯度结构、核壳结构;在材料的晶体内部引入孪晶等缺陷,如纳米孪晶异构;调控组成成分(包括相、元素等)不同,如异质双相结构。异构金属材料主要通过上述调控方式来达到强韧均衡的目标,这也使得异构金属材料具有较复杂微观结构,为此引入了晶粒尺寸、软硬区的体积分数、异构基元有序构筑的梯度指数、异构界面密度等结构参量,如图1所示。LIN等通过控制梯度指数利用电沉积法制备了强度和韧性都高于粗晶镍的梯度结构纯镍,并且发现了最佳晶粒尺寸分布曲线。ZHANG等通过机械球磨和火花等离子烧结工艺制备了一系列具有不同壳体积分数的核壳结构CoCrFeMnNi高熵合金,壳体积分数在20%~40%的核壳结构高熵合金表现出优异的强度-韧性协同作用和良好的抗低周疲劳性能。ZHANG等通过控制粗晶的空间分布,分析了具有双峰尺寸分布的3种典型非均质结构的变形机制,并且定量研究了不同结构的界面与应变硬化之间的关系。上述研究结果均通过改变微观结构参数来探求最优的材料性能,寻找各项参数与异构材料综合性能的关系,这为优化异构材料的微观结构设计提供了帮助。
异构金属材料的微观结构是基于其特殊的力学响应而设计的:在加载过程中,异构金属材料中微区软硬相之间的载荷传递引起了应变不协调,在异质界面处产生明显的应变梯度。应变梯度需要几何必需位错(GNDs)来调节,并且几何必需位错密度与应变梯度正相关。几何必需位错的累积进一步产生了背应力,显著增加了软区的流动应力,提高了材料的应变硬化率;而硬区则产生背应力的反作用力即前应力。二者之间协调作用,耦合为异质变形应力。在韧性强化方面,异构金属材料在变形过程中会发生由几何必需位错引起的异质塑性变形,同时存在几何必需位错与界面间相互作用以及几何必需位错特殊的运动,这有利于塑性变形的离域化。累积的几何必需位错含量越高,由几何必需位错主导的异质塑性变形占比越大。因此,异构金属材料在拉伸卸载-再加载过程中会形成力学迟滞环,韧性得到极大提高。此外,在拉伸变形时部分微区甚至呈现多轴应力状态,这促进了位错相互作用,诱导了额外的应变硬化。这些力学效应与材料微观结构特征参量的关系密不可分,对强度和韧性的提升也起着重要的作用。
在传统异质结构设计流程中,通常需要寻求微观结构与强化机制的联系,进而采用高通量的试验对异构金属材料内部结构进行优化设计,逐步逼近金属材料的强韧极限。利用试错法来设计及研究异构金属材料需耗费大量的人力物力,因此用理论计算为试验结果做支撑,给设计找到突破口成为研究的热点。然而这需要不断完善本构方程来保证建模和仿真计算的准确性。早期科学家大多从试验中建立宏观的唯象本构模型,对深入揭示材料变形内在的物理机制缺乏认识。例如,GURSON提出的多孔微观模型利用宏观流场分布和耗散积分为多孔延性材料开发提供屈服标准和流动规则。然而仅在宏观尺度上建立的这类模型,很难用于研究在加载时材料微观结构的演变规律及失效机理。随着非线性有限元软件的快速发展及晶体塑性理论的不断成熟,描述材料微观变形行为的本构模型也在逐步发展中。LU等通过将纳米梯度材料变形过程中的损伤演化和机械驱动晶粒生长纳入本构模型中,研究了微观组织梯度在整体塑性响应中的作用。
ZHANG等引入与尺寸相关的异质诱导硬化项来描述因异质结构而增强的背应力。黄春阳等提出率相关的Hadamard嵌入式晶界模型来研究双晶或者多晶材料中孪晶的成核和扩展及塑性变形模式。然而,有限元分析在处理多物理场耦合、多目标优化等复杂问题时较为困难,且计算成本高。ML可以先通过已有数据综合分析学习,建立成分-结构-性能关系,然后对材料的设计空间进行高速搜索,最后通过微观精准调控达到目标性能。因此,利用ML指导异构金属材料微区结构设计及力学性能优化有着较高的研究价值与广阔的应用前景。
2、机器学习算法
ML作为解决人工智能问题的主要方法发展极为迅速,已应用于各行各业。ML算法大致可以分为监督学习、无监督学习、强化学习(RL)三类,如图2所示。监督学习所使用的数据具有标签,可以应用在回归与分类的任务中,在材料性能预测与结构设计中应用最为广泛。无监督学习所使用的数据没有标签,因此也难以量化效果,主要应用于聚类算法与降维算法。强化学习强调智能体与环境的交互,目标是获取最大的长期收益。
2.1 机器学习算法应用场景
线性回归(LR)是最简单的监督学习算法,通过最小化均方误差损失函数来获得输入与输出之间的线性关系。当输入特征数量增加时,可以将线性回归推广到多项式回归。对于分类任务,不再是预测特征与标签之间一一对应的精确值,而是根据特征将一条数据划分为预定好的一个类别,因此处理分类问题一般选用交叉熵损失函数。为了更好地应对非线性问题,提出了支持向量机、人工神经网络、随机森林、高斯过程回归等机器学习算法,这些算法可以胜任回归和分类任务。在预测材料性能时,高维物理量之间复杂的非线性关系难以通过计算获得经验解。上述监督学习算法为这一问题提供了一种替代方法。LIU等基于决策树、梯度提升树、人工神经网络模型,利用试样尺寸、裂纹尖端因子并结合物理模型预测了多晶硅的断裂韧性。LUO等使用线性回归、支持向量机、核岭回归算法,综合考虑最大孔径、孔隙数、孔隙位置以及弯曲疲劳应力幅,预测了增材制造铬镍铁合金的疲劳寿命。异构金属材料具有复杂的结构参数特征。GONG等从热力学角度出发,结合晶粒的拓扑几何和统计分析,讨论了双峰微观结构的熵衰变,建立线性回归模型,根据平均晶粒表面积预测了单位微观结构熵、平均晶粒周长和平均晶粒体积。
无监督学习中聚类算法与降维算法更多被应用于数据的预处理阶段。经典的聚类算法有K-Means、DBSACN等,这些算法所使用的数据没有标签,即在训练之前不会为数据指定类别,仅通过计算使得同一个簇内的对象相似性尽可能大。GAN等在训练模型之前,首先将数据进行聚类处理,为模型训练寻找具有代表性的数据,以此来提高模型的预测精度。降维算法是指将一组没有标签的特征通过线性变换,从高维空间投影到具有最大方差的低维空间中的方法。过多的特征会降低模型的预测能力,尤其是当特征相关性较高时;可以用主成分分析算法减少特征数量。
强化学习训练目标是探索未知领域并寻找到与现有知识之间的平衡。JIN等使用强化学习模型学习不同工况下的疲劳裂纹发展模式,智能体在交互过程中学会了通过改变应力角和应力频率控制裂纹扩展方向与速率。强化学习还可用于设计多级复合材料的微观结构,寻找具有最佳力学性能的复合材料。
2.2 深度学习
上述ML算法在处理结构化数据方面取得了很好的成果,但是在处理非结构化数据(图像等)方面的效果却不尽人意。监督学习中的一个分支——深度学习在近10a来得到了更多科学家的关注。前馈神经网络,可以视为最简单的深度学习模型。卷积神经网络(CNN)与循环神经网络(RNN)2种深度学习模型可以很好地处理非结构化数据,并且分别在计算机视觉与自然语言处理领域取得了重大突破。
卷积神经网络于1980年被首次提出。不同于全连接神经网络,卷积神经网络通过一定尺寸的滤波器与图像中的像素进行卷积运算,因此在处理图像数据时可以避免因向量展开而丢失空间信息,同时还可减少训练参数。金属材料的微观结构决定着性能;卷积神经网络可以捕获到微观结构中一些细微的特征从而高效地进行性能预测、目标检测、结构设计等工作。KAUFMANN等使用卷积神经网络成功地在低质量甚至不完整背散射电子衍射(EBSD)图像中识别到不同的相。JHA等使用卷积神经网络准确获取 EBSD图像中的晶粒取向,误差仅有0.548°。JIA等使用包含各种强化信息的能带对比图、晶界图、位错密度图作为输入端建立卷积神经网络,对马氏体钢的硬度进行了准确预测。
使用循环神经网络处理具有序列特性的数据非常有效。长短期记忆网络引入记忆门与遗忘门,门控循环单元引入重置门与更新门,这两种常用循环神经网络结构可以长时间记忆有用信息。在材料设计领域,循环神经网络被用于解决蛋白质结构的设计、复杂寿命预测、裂纹扩展方向预测等问题。
传统ML模型的建立需要对一些特征抽象化,以建立与设计目标之间的关联。在建立异质结构中各种结构参数与强韧性之间的关系时,异质结构中存在晶粒排布方式、晶粒形状等难以被参数化的特征;而使用卷积神经网络这种深度学习模型可以从晶相图中快速提取这部分信息从而完成设计,甚至寻找到前所未有的高性能异构金属材料。此外,对于一些多步加载情况下的寿命预测问题,传统ML算法难以捕捉到不同加载顺序下的时间特征,但是循环神经网络却非常擅长处理这类数据。深度学习在异质结构设计中展现出了强大的力量,使用深度学习辅助性能预测、结构设计是未来的一个重要探索方向。
3、数据处理
ML是一类数据驱动的方法,足够的数据量是ML模型工作的先决条件。当具有一定量的数据后,可以根据数据量选择合适的ML模型:数据量较少时,适合使用逻辑回归、朴素贝叶斯等简单算法,或者支持向量机等稀疏模型;数据量中等或较多时,适合使用树模型,例如随机森林、极端梯度提升树等;数据量很大时,人工神经网络模型表现更优。
有关材料结构设计、性能预测的数据,可以由开放数据库、文献、试验、仿真等方式获取。此外,输入数据的预处理也是至关重要的一步。有关异构金属材料设计的ML数据处理方法需着重讨论特征选择和数据增强。
3.1 特征选择
只有当选用的特征合理时才能获得一个较好的ML模型。评判一组特征的好坏通常可以从以下3个方面考虑:特征与标签相关程度的高低;特征彼此之间的相关性;特征是否容易获取。首先,只有当特征与标签具有一定的物理关系时,才能获得一个合理的ML模型,例如疲劳试验的应力幅等参数与疲劳寿命就是一组合理的特征与标签。其次,特征之间相关性较高会产生大量冗余信息,降低模型的训练效率。最后,如果特征获取困难,势必无法获得足够的数据量,并且使整个设计过程的成本增加。
除了物理关系外,特征的选择还包含过滤(filter)、封装(wrapper)、嵌入(embedded)3种思路。过滤主要通过数学方法计算皮尔逊系数(PCC)、最大互信息系数(MIC)等特征与标签的相关程度。ZHANG等分别计算了皮尔逊系数与最大互信息系数与疲劳寿命的相关系数,根据相关系数的大小将特征分为3组来分别训练ML模型。分装是指每次使用不同的特征子集训练模型,输出模型的准确度,根据每次选用的不同特征子集造成的模型误差来确定每个特征的 最 终 贡 献 率。PENG等在分析不同缺陷参数对疲劳寿命的影响时,首先计算了不同缺陷特征之间的皮尔逊系数,确保特征之间的独立性,然后训练随机森林,查看某个特征在随机森林中增加或减少时模型均方误差的变化,以此确定不同缺陷特征的重要性,最后去除不重要特征,从而进一步提升疲劳寿命预测模型的精度。嵌入则使用模型训练得到的特征权重来筛选特征,主要方法为正则化,LASSO便是代表算法之一。
当待选特征数量特别大时,也可以使用启发式搜索算法,例如遗传算法、粒子群优化算法等,其基本流程为随机挑选若干特征作为初始种群,训练ML模型,将模型准确度设定为目标函数,多次迭代寻找最优特征子集。
3.2 数据增强
当模型的特征选定后,可能还面临着数据量不足的问题。由于异构金属材料制备所需时间长、成本高,通过试验得到所需要的数据较为困难,而通过数值模拟所获取的数据可能因为缺少噪声数据,使得模型的泛化能力下降。基于此,可以考虑通过数据增强的手段来获得足够模型训练的数据量。
对于传统结构化数据,可采用虚拟样本生成技术,如整体趋势扩散技术(MTD)、蒙特卡洛模拟(MCs)进行数据增强。一些小样本学习问题使用整体趋势扩散技术生成虚拟样本,使用寻优算法筛选有益样本,从而有效提高小数据集训练模型的精度。对于增材制造Ti-6Al-4V合金的疲劳数据难以获取的问题,LI等通过蒙特卡洛模拟扩大数据集规模,构造并训练反向传播(BP)神经网络模型预测疲劳寿命,由于利用了更大数据集训练,模型的适用性和泛化能力获得了大幅提高。
非结构化数据的增强方法也是近些年的研究热点。对于图像,可以对训练集图像进行旋转、镜像、剪切等变换来获得新的数据,同时修改图片颜色也是数据增强的方法之一。在计算机视觉领域识别物体时可能有很多干扰因素,但是在材料设计领域,图像更多通过扫描电镜(SEM)、EBSD等获取,这类显微结构图像往往具有丰富的相关信息。因此,即使数据量少于计算机视觉领域,卷积神经网络仍然能出色地完成图像特征提取任务。非结构化的数据增强还可使用生成对抗网络(GAN)来进行。生成对抗网络包含生成模型和判别模型2个模型,生成模型不断生成与真实数据相似的数据,判别模型做出最终预测。生成模型是天然的数据增强器,但是当真实样本过少,无法体现样本真实分布时,生成对抗网络的数据增强效果可能会不理想。经过良好训练的生成对抗网络还可生成大量错综复杂的结构,这也成为了发现新型超材料的一个契机。
4、ML辅助异构金属材料设计
异构金属材料中复杂的强化机制尚未被完全挖掘,基于当下的数学模型也很难对其性能作出准确预测。金属材料的设计需要从性能出发,经过设计-制备-测试等繁琐的流程才能最终得到具有目标性能的材料。虽然在之前的工作中,通过传统试验方式寻找新一代强韧均衡的异构金属材料已取得不错的成果,但是这不仅耗费时间,成本也相当昂贵。ML可以使用大量数据训练,快速构建整体结构、成分和性能的链接。随着深度学习和优化算法的发展,人们可以进一步借助高精准度的ML模型优化工艺参数并设计新材料。然而,大多数ML模型属于“黑盒”模型,无法得到输入与输出之间显性的关系式;但是异质结构中部分增韧机制已经被多次证实,将这些增韧机制的物理信息与ML模型相结合,有目标地选取特征参数,或者修改底层算法,可以在一定程度上改善模型的这种不可解释性,同时还能得到更高精度的性能预测与更精准的结构设计。
4.1 双峰结构材料的力学性能预测
双峰结构是指材料晶粒尺寸呈双峰分布,即粗晶与细晶的体积分数有各自明显峰值的结构。研究表明,双峰结构同时具有高强度与高韧性,细晶与超细晶组织为材料提供了高强度,微米级的大晶粒则有助于延展性的提高。引入双峰晶粒分布是实现材料强韧均衡的途径之一,但是目前通过试验改变结构参数来寻找性能更优的双峰结构材料仍然成本极高,而使用数值模拟方法计算双峰结构材料的性能是提高设计效率的一种方式。ML算法为寻找性能更优的双峰结构开辟了一条新的道路,并且相较于数值模拟其效率更高。
MATSUMOTO等通过试验分析和ML方法,研究了Ti-17合金的拉伸性能和硬度,发现双峰结构使该合金在强度和韧性方面取得了很好的平衡。WANG等建立了一种小样本学习的ML模型,采用细晶尺寸、粗细晶尺寸比、粗晶体积分数等特征参数预测不同微结构双峰结构材料的强度与延展性;由于试验数据获取较为困难,因此在这项工作中结合了晶体塑性有限元模拟来获得一部分训练数据,此外还用整体趋势扩散技术进一步扩大数据集来保证模型的泛化能力;所采用的基于整体趋势扩散技术样本增强训练的极限学习机模型的预测精度高于其他ML模型,使用优化算法结合效果最优的极限学习机模型得到了双峰结构的强韧性Pareto前沿图,证明了通过构筑双峰结构可以使低碳钢的强韧曲线拓维;通过分析双峰结构Pareto前沿图高延性区、高强度区和强度与延性平衡区3个区域的微观结构参数,得到各自力学性能与微观结构的三维设计图。
4.2 主动学习扩大梯度结构设计空间
梯度结构(GS)属于异质结构的一类,广泛存在于生物结构中。梯度纳米材料(GNS)晶粒尺寸从表面的纳米尺度到中心的微米尺度呈梯度增大,其表面的纳米晶决定材料的整体强度,而材料整体塑性由心部的粗晶决定,因此梯度结构材料同时具有高强度和高延展性。然而,目前仍然存在不少的问题阻碍着梯度纳米材料的结构和性能优化,例如:无法确定晶粒控制梯度结构力学性能的关键参数;是否存在一种特定的梯度结构使其力学性能大幅度优化。使用分子动力学寻找力学性能更优异的梯度结构材料虽也取得了一定的成果,但是仅依靠分子动力学探索设计空间是极其消耗计算成本的。
CHEN等提出了一个梯度纳米材料设计空间探索框架,该框架集成了原子模拟、基于高斯过程回归的主动学习代理建模以及梯度纳米材料设计和创新优化:先利用计算成本较高的分子动力学生成高保真样本点,然后建立基于高斯过程的主动学习代理模型以建立梯度结构-性能关系。这项工作还使用了分子动力学揭示了晶粒和孪晶梯度对强度和变形机制的综合效应,结果显示梯度纳米材料的强度随孪晶梯度增加而增大,并且存在一个使强度最大化的临界晶粒梯度,在临界晶粒梯度以上的脱孪诱导的软化机制会占据主导地位,强度会随晶粒梯度增大而降低。
4.3 多级结构设计
天然生物材料具有的优异力学性能与其独特的微观结构紧密相关。研究人员受到生物材料的启发,通过模仿生物结构来获得更强韧的材料。多级结构作为一种仿生异质结构,具有非常高的韧性,但是多级结构拓扑结构设计空间极大,传统优化方法很难求解大量待优化参数以及探索极大设计空间。经过训练的ML模型,不仅可以快速预测由各向异性胞结构构成的二维多级结构性能,而且可以用来探索性能更优异的多级结构材料。
GU等使用具有各向异性的3种单元格族构建不同微结构,通过有限元模拟获得每个微结构的韧性,具体方法:将微结构转换为单元胞构建块的数据矩阵,将此矩阵作为卷积神经网络的输入,韧性作为预测输出。ML模型仅经过1000次训练,就寻找到韧性超过训练数据的新结构;经过10h训练超过106次后,ML模型训练集与测试集的归一化均方根误差分别为0.2978与0.4926,即模型可以准确预测多级结构材料的韧性,并且不存在过拟合现象;ML可以在几秒内计算数亿个微结构的性能,并且寻找到的多级结构韧性参数超过训练数据中结构的2倍以上。上述研究展示出深度学习算法在异构金属材料设计中的巨大潜力。深度学习结合有限元模拟的结构设计方法不仅可以准确地预测多级结构的力学性能,还能够产生新的结构从而获得更强韧的材料。
4.4 脆性金属断裂预测
由于塑性较差的材料在断裂前不发生或仅发生少量宏观塑性变形,因此很难对其进行预测。目前,预测裂纹扩展方向的方法主要包括扩展有限元(XFEM)、相场模型、内聚力模型等,但是这些方法的计算成本较高,且无法在短时间内获得准确结果。ML模型经过训练也可用于脆性断裂预测。WANG等使用人工神经网络预测了疲劳裂纹的扩展速率,并且其预测精度高于传统的数学模型。
深度学习算法应用于预测脆性断裂裂纹扩展时的效果较好,这得益于其无需结构化的参数以及处理序列信息的强大能力。带有卷积层的长短期记忆网络 (Conv-LSTM)在 这 方 面 取 得 了 一 定 的 成果,其具体流程如下:先使用分子动力学预测脆性断裂位置,随后将所获得的裂纹扩展图像信息作为训练集训练ML模型,从中学习裂纹扩展模式。这一模型较为准确地预测了裂纹在2个晶粒中扩展的位置,以及晶粒取向梯度变化材料中的裂纹扩展方向。这一研究对于预防脆性断裂的发生以及抗脆性断裂材料的设计具有一定的指导意义。
5、结束语
基于ML的异构金属材料结构设计及性能预测已经取得了初步成果,随着新一代深度学习技术的发展,异构金属材料微观结构对宏观非线性本构行为的影响机制的探索工作也在逐步开展。ML算法可以将多场耦合作用引入到材料精准设计流程,使材料结构设计更加符合需求。但是,目前所使用的方法仍然存在局限性。在ML推动加速异构金属材料性能预测、结构设计、揭示强韧机理方面,未来的发展方向包括以下几个方面。
(1)融合物理知识。目前ML算法仅依靠数据驱动,即采用输入-训练-预测的模式,缺少物理知识指导,其模型的实用性有待商榷,甚至有可能与现实违背,同时模型得到的结论仍然需要大量试验来验证。因此,需明确经过训练的ML模型适用的物理范围,并在模型中针对性地融入基于物理机制的内变量边界条件或额外的变形机制等,使模型输出结果符合常识。此外,还应从更底层的材料变形本征机制出发,将弹塑性变形物理机制纳入ML模型中,基于此可以将异质结构数据和均匀结构数据相结合来训练ML模型,并明晰各强化机制的贡献。
(2)小样本学习。直接从数据库获取材料特征是短时间内获取大量数据的方式,但是数据库中的数据一般难以满足异构金属材料设计所需要的全部信息,并且最新研究成果无法及时纳入数据库。建立在线数据库,及时共享完整数据,将有助于新模型的快速建立。如何高效地从论文中搜集和筛选数据也是未来的一个研究热点。主动学习的代理模型可以用来指导试验,节省试验时间,从而在一定程度上解决数据量少的问题。此外,需进一步发展虚拟样本生成技术以提高模型精度。
(3)结构参数编码。异构金属材料优异的力学性能得益于其独特的结构,因此在建立模型时需要将该结构科学地转换为可供ML模型训练的特征参数。晶粒平均尺寸、晶粒尺寸分布信息等都可作为结构参数使用,但晶粒分布方式等复杂结构参数编码比较困难。卷积神经网络具有识别二维图像中异质结构边界特征的能力,两点相关性分析也具有该能力,将二者结合可以有效提高抽象结构参数编码的能力。现实中三维结构的复杂程度远远超过二维图像,这使得从微观结构设计到实际工程应用还需要长时间的努力。
引用本文:
王晓坤,汪永纪,贾云飞,等.基于机器学习的异构金属材料性能预测及结构设计[J].机械工程材料,2023,47(5):72-82.
Wang X K, Wang Y J, Jia Y F, et al. Property Prediction and Structure Design of Heterostructured Metallic Materials Based on Machine Learning, 2023, 47(5): 72-82.
DOI:10.11973/jxgccl202305012