当前位置:首页 > 科技资讯 > 正文

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破

上海交通大学人工智能与微结构实验室的李金金教授与黄富强教授团队,成功开发出一款创新的AI材料设计模型CGformer,该模型实现了对传统晶体图神经网络局限性的重大突破。

人工智能技术正在深刻变革材料科学的研发模式,在新材料发现与性能优化中展现出颠覆性潜力。通过高通量计算与机器学习的深度结合,传统“试错法”所面临的实验周期漫长、资源消耗巨大等难题得到有效解决,材料探索已进入“计算驱动-实验验证”的高效迭代新阶段。然而,随着人类技术与生活方式的不断演进,新能源、航空航天等领域对新材料性能的要求日益严苛,传统机器学习方法的局限性逐渐暴露,尤其在高熵材料研发领域显得尤为突出。

所谓“高熵”材料,是指由多种主元元素混合制备而成的新型材料。高熵材料通过多主元协同效应,显著提升原子排列的构型熵(即无序度),从而赋予其比传统材料更卓越的力学性能、耐高温性、耐腐蚀性等综合特性,在能源存储、航空航天、极端环境装备等领域具有广阔的应用前景。

此前的方法如晶体图卷积神经网络(CGCNN)、原子线图神经网络(ALIGNN)等人工智能模型均存在架构缺陷:受限于局部信息交互机制,难以建模远距离原子协同效应,无法完整捕获复杂晶体结构特有的全局信息,从而导致预测精度受限。同时,高熵材料的固有特性也使其研发面临远超传统材料的挑战——复杂的微观结构、稀缺的高质量实验数据,以及动态无序的原子行为,共同构成了高熵材料研发道路上的关键障碍。

针对工具缺陷与需求升级,上海交通大学人工智能与微结构实验室(AIMS-Lab)李金金教授和黄富强教授团队研发了全新的AI材料设计模型CGformer,成功突破了传统模型的局限性。该模型创新性地将Graphormer的全局注意力机制与CGCNN相融合,并集成中心性编码与空间编码,使其既能通过晶体图直观描述材料结构,又能借助“全局注意力”机制捕捉长距离原子间的相互作用,从而获得了传统“仅关注相邻原子”模型所不具备的全局信息处理能力。

该方法提供了更全面的结构信息,有助于更准确地预测结构内部离子迁移行为,为新材料尤其是高熵、复杂结构晶体材料的研发提供了可靠工具。研究成果以“CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction”为题,发布于顶级期刊《Matter》。

研究亮点:

* 研究开发出基于全局注意力机制的AI材料设计模型CGformer,为材料研发科学提供了一个强大而可靠的工具,有助于加速复杂晶体结构的发现进程。

* 与CGCNN相比,CGformer在高熵钠离子固态电解质(HE-NSEs)的研究中,平均绝对误差降低了25%,有效证实了其实用性与先进性。

* 从148,995种可能的高熵结构中筛选出18种,成功合成并验证了6种高熵钠离子固态电解质(HE-NSEs),室温钠离子电导率高达0.256mS/cm,展示了其实际应用价值。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第1张

论文地址:https://www.cell.com/matter/abstract/S2590-2385(25)00423-0

多类别数据集完善CGformer模型能力

本研究的目的是通过基于案例的解决方案,应对高熵系统中数据稀缺和结构复杂性带来的挑战。研究案例聚焦于新能源电动汽车和电网储能应用,针对性地围绕高熵钠离子固态电解质的性能预测和筛选展开,构建并使用了多类数据集,为CGformer模型的训练、微调和实验验证提供支撑,具体如下:

钠离子扩散能垒(Eb)基础数据集:这是研究人员针对研究构建的当前已知规模最大的高熵结构中钠离子扩散能垒数据集,基于Voronoi分解的晶体结构分析(CAVD)和键价位点能(Bond Valence Site Energy,BVSE)方法构建。该数据集主要用于CGformer的预训练,使模型学习与含钠结构相关的图信息,然后将其迁移到计算出的高熵数据集,为后续高熵材料Eb预测奠定基础。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第2张

CGformer筛选工作流程

HE-NSEs计算数据集:以Na₃Zr₂Si₂PO₁₂为基础(如上图所示),在Zr位点考虑45种潜在高熵掺杂元素,初步形成包含148,995种可能的高熵结构的初始化学空间。之后通过多轮筛选,包括排除不适宜元素(放射性、高毒性及昂贵元素)、约束原子半径差异与电荷平衡等,进一步将化学空间缩小至826种相对稳定的结构。接着再通过无监督层次聚类将其分为20组,从每组分层采样30%的结构(共238种),经密度泛函理论(DFT)计算得到其Eb值,最终形成用于微调CGformer的专用数据集,以便模型专门适配高熵NASICON结构中钠离子Eb的预测任务,提升模型在目标场景下的精度。

热稳定性评估数据集:研究人员从Materials Project数据库中提取所有含钠结构的能量高于凸包值(Ehull),整理成一个专用训练集。该数据集主要用于训练评估HE-NSEs热力学稳定性的补充模型,与CGformer预测的Eb结合,筛选“性能+稳定性”的候选材料。

创新融合架构实现CGformer“全局感知”

CGformer针对传统方法的不足进行了根本性革新,将两种先进技术进行有机融合以实现优势互补,其核心是既保留了对晶体结构的图化表征能力,又通过全局注意力机制打破了仅关注局部原子交互的局限。具体来看,它将Graphormer的全局注意力机制与CGCNN的晶体图表示方法相结合,同时增加关键编码模块,从而构建了一套全新的信息处理流程。

下图a展示的是晶体图编码过程,该过程是为了将真实的三维晶体结构转化为模型可处理的晶体图。晶体结构中原子被表示为节点,原子之间的化学键被表示为边。通过转换过程,研究人员能够提取节点和边特征,如各种元素属性、电荷、共价半径、原子间距离、键类型和晶体对称性信息,然后再将这些特征进行结合,得到CGformer所需的初始输入数据,确保了晶体的化学与结构信息被完整保留。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第3张

从晶体到晶体图的编码流程示意图

下图b展示了CGformer的网络架构,通过多模块协同实现全局信息整合与精准预测。首先输入的晶体图经过一轮图卷积操作,生成简化的图结构,从而减少后续网络层的计算量,加速CGformer的训练过程。然后在此基础上,研究人员计算中心编码并更新晶体图的节点特征,中心编码包括每个节点的入度和出度,然后将其整合到原始节点特征中。随后每个节点通过多头注意力模块(Multi-head Attention Module),结合变特征和空间编码来表示节点之间的位置关系。中心编码将相邻节点的平均特征转换为总和形式,而空间编码使自注意力机制能够区分相邻节点,促进有效的消息聚合并增强不同原子之间的信息连接。最后,输出向量经过“池化(整合全局特征)”和“激活(函数运算)”过程,完成最终的材料属性预测。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第4张

CGformer的网络架构

值得一提的是,多头注意力模块使得每个节点“关注”晶体图中所有其他节点,而非仅相邻节点,实现了长程原子相互作用的捕捉。与此同时,中心编码和空间编码的加入,也使模型不仅能识别原子的化学属性,还能感知其在结构中的“位置重要性”和“空间关系”,提升了模型对复杂晶体的表征精度。

总而言之,CGformer相比传统晶体网络实现了质的跃迁,实现了全局视野、信息增强、效率平衡三大优势,为复杂高熵材料的发现和性能优化提供了可信、可靠的工具。

CGformer展现强大性能,凸显现实指导价值

为了准确评估CGformer模型的性能和先进性,研究人员将其与传统模型CGCNN、ALIGNN、SchNet等进行了比较,实验从“预训练”到“微调”两个阶段验证了CGformer的预测精度。

在预训练阶段(如下图所示),CGformer展现出更佳的稳定性和预测精度,CGformer初始误差与波动显著低于CGCNN,10折交叉验证(10-fold CV)显示,其训练集平均绝对误差(MAE)为0.1703,较CGCNN性能提升了25.7%;测试集平均MAE为0.3205,较CGCNN性能提升了近10%。与ALIGNN和SchNet的比较进一步凸显了CGformer的优良性能。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第5张

CGformer与CGCNN作用对比

从拟合效果来看,CGformer的预测值与真实值偏差更小,残差更集中于0附近,且残差标准差更小,证明了其对钠离子Eb的预测更加可靠。

在微调阶段(如下图所示),预训练后的CGformer在200轮微调中,10轮左右MAE即显著下降,最终10折交叉验证平均MAE仅为0.0361;微调后预测值与真实值偏差进一步缩小,残差主要集中在-0.05到0.05范围内,且呈良好正态分布,证明其对高熵体系Eb的预测具有极高精度,体现了其数据缺失场景下的应用潜力。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第6张

CGformer在计算得到的高熵钠Eb数据集上的微调结果

最终,实验对CGformer筛选出的6种最优HE-NSEs进行了实验合成与电化学表征,验证其结构与性能。结果显示,这些材料均展现出优异的室温离子电导率,在25℃室温下钠离子电导率在0.093至0.256mS/cm之间,显著高于未掺杂的Na₃Zr₂Si₂PO₁₂。

上海交通大学CGformer模型:AI驱动的高熵材料设计新突破 AI材料设计  CGformer 高熵材料 全局注意力机制 第7张

所选HE-NSEs的实验验证

“人工智能+材料”已成为材料科学发展的主流

“人工智能+材料”已成为当前材料科学领域的前沿研究方向,通过融合人工智能技术与材料研发、设计和应用等环节,展示出两种学科交叉的强大发展潜力和应用价值。CGformer的提出无疑为人工智能在材料科学领域的应用画上了浓墨重彩的一笔,因其独特而创新的算法架构,解决了高熵材料研发的关键性难题。

CGformer仅是AIMS-Lab在人工智能与材料科学领域探索中的冰山一角,人工智能与材料科学的交叉研究作为实验室的主要研究方向之一,早已成为实验室的鲜活注脚,且硕果累累。

同样是该团队,去年以“Transformer enables ion transport behavior evolution and conductivity regulation for solid electrolyte”为题,在国际顶刊《Energy Storage Materials》上展示了其研究成果。研究提出了一个名为T-AIMD的人工智能模型,采用Transformer网络架构,不仅能够大幅降低计算成本,同时还能快速准确地预测任何离子在任何晶体结构中的行为。该方法将传统AIMD模拟速度提升了100倍以上,显著加速了材料性能的评估过程。

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S2405829724003829

另外,德国柏林工业大学和卢森堡大学的团队也在AIP Publishing发表他们的相关研究,提出了一种专门设计用于模拟原子系统的深度学习架构SchNet,它利用了连续滤波卷积层,能够学习元素周期表中原子类型的化学合理嵌入,在分子和材料的多种化学性质预测中展示了强大的能力。相关成果以“SchNet – A deep learning architecture for molecules and materials”为题。

论文地址:https://pubs.aip.org/aip/jcp/article-abstract/148/24/241722/962591/SchNet-A-deep-learning-architecture-for-molecules?redirectedFrom=fulltext

从生活中常见的塑料包装、金属制品,到高端产业中的纳米材料、超导材料,人类文明的进步与材料科学的发展可谓密切相关。而人工智能的飞速发展无疑将在未来的材料科学中发挥巨大潜力,而这也将再次间接推动人类文明的进步。