自监督预训练模型助力提升合金成分一结构一性能预测

袁睿豪,李金山 , Turab Lookman

言北工业大学疑固技术国家重点实验室,西安,710072,中国;
AiMaterials Research LLC, Santa Fe, NM 87501, USA;

详细摘要先进金属结构材料在航空航天等多个领域有重要应用,通过调控成分、工艺、微观结构等变量, 可以获得预期的性能。 但是, 多变量的存在及其耦合作用导致难以有效建立成分 - 工艺 - 结构 - 性能关系模型。 近几年, 人工智能技术如机器学习等因其优异的数据处理和跨尺度建模能力, 巳被广泛应用于 金属结构材料的研究中;通过构建成分 - 工艺 - 结构 - 性能关系模型, 使得新合金的研发周期和成本同时降低。 但是, 对于金属结构材料, 尤其是考虑到可能的高温、 高压等极端服役环境, 对应的微观结构 和性能数据不易获得, 即可用于机器学习建模的数据样本非常有限, 导致预测模型精度不足, 难以指导合金成分、 工艺和微观结构的优化与设计。针对这一问题, 本报告提出利用大量的、 无标签数据获得预训练自监督模型, 并将模型应用于有限的、带标签合金数据, 实现了对合金力学性能预测精度的提升, 并从模型可解释性的角度尝试理解模型性能提升的关键, 进而为合金成分、 工艺和微观结构设计提供指导。 具体内容从两个方面展开: (1)利用自然语言处理方法基于大量的非结构化无标签数据学习潜在钦合金设计知识,输出合金的特征表达嵌入; 址于特征嵌入同步预测合金各项性能, 搜索合金组成空间以求得最佳性能匹配。 采用Transformer牍本架构在大数据集上训练一个具有强泛化能力的预训练模型, 之后在下游任务上进行微调。 不仅可以适用于不同的下游任务, 还可以通过注意力机制提升模型可解释性, 从而定向指导钦合金设计。 (2)基于标记的25组高温合金EBSD图像和性能数据, 无法准确构建结构-性能定量关系。 针对这一问题, 首先结合VAE和图像增强方法(无标签数据)获得了预训练模型;相对于基于25组标签数据直接训练VAE 预测力学性能, 预训练模型能够提取更全面、 更稳健的微观结构信息;进一步将预训练模型应用于构建微观结构-性能关系模型, 实现了对力学性能预测的提升;基于注意力的可解释算法, 发现VAE预训练模型提取的低维变量的不同维度值能够表达微观图像中不同取向晶粒的特定区域;通过异常检测算法对比高性能和低性能合金的微观结构差异, 发现图像中的小晶粒区域是影响合金性能的关键区域。
关键词:预训练模型;特征提取;小样本数据;合金设计;

Brief Introduction of Speaker
袁睿豪

袁睿豪副教授, 博士毕业于西安交通大学, 曾在美国洛斯阿拉莫斯匡家实验室进行访问交流,现为西北工业大学材料学院副教授,博士生导师。长期致力用材料科学和信息学的交叉融合, 主要关注利用机器学习技术辅助研发高性能铁电材料和航空航天用结构合金。 近五年在<<Adv Mater〉〉、 <<Nano Lett〉〉、 《Adv Sc心 、 <<Acta Mater>〉等期刊上发表研究论文40余篇,授权/巾请专利/软著10余项;主持国家自然科学基金青年项目、 重点研发计划子课题等国家和省部级项目多项。