爱奇飞网

网站首页健康养生 >正文

Crystal语言使人工智能能够设计具有所需特性的新颖材料

开心的月饼 2023-12-14 13:58:17 健康养生

在过去的十年中,生成式深度学习模型已成功应用于新型药物分子、有机合成路线以及为电子/光电器件量身定制的功能分子的设计。这在很大程度上得益于分子SMILES表示的可用性——一种可逆且不变的表示,非常适合循环神经网络、变压器等自然语言处理模型。

Crystal语言使人工智能能够设计具有所需特性的新颖材料

然而,设计具有所需性能的结晶无机固体仍然是一个艰巨的挑战。这主要是由于缺乏“SMILES等效”晶体表示来桥接周期性固态材料和最先进的深度学习架构。

以前的逆晶体设计方法主要依靠3D体素网格或绝对空间坐标来表示结构。但这些方法本质上缺乏旋转不变性。还尝试使用晶体图,由于缺乏明确的周期性或成分信息,晶体图是不变的但不可逆的。为了应对这一挑战,我们提出了一种称为SLICES的新晶体表示。该研究发表在《自然通讯》杂志上。

SLICES背后的核心思想

开发SLICES背后的关键动机是创建可逆且不变的晶体表示,类似于广泛用于分子逆设计的SMILES表示(图1)。可逆性意味着表示可以明确地转换回原始晶体结构。这对于生成模型进行逆向设计至关重要,模型创建新的晶体结构,并从表示中解码。

不变性表示在晶体结构的平移、旋转和排列下表示保持不变。满足不变性允许表示纯粹专注于编码系统的基本拓扑和组成信息,而不是在变换下变化的表面特征。这减少了冗余并提高了学习效率。

通过满足可逆性和不变性,SLICES能够使用深度生成模型有效探索晶体材料的广阔化合物空间。

SLICES如何表示晶体

从概念上讲,SLICES将晶体结构的拓扑和组成编码为字符串,就像SMILES将分子图转换为线条符号一样。更具体地说,SLICES利用“标记商图”的数学概念来表示周期性晶体结构。晶胞内的原子和键被映射到商图的节点和边。附加标签被分配给边缘,指示连接相邻晶胞中的等效原子所需的周期性移位向量。

钻石的晶体结构就是一个例子(图1),它包含两个在原始晶胞中结合在一起的碳原子。SLICES字符串显式编码原子符号“C”和边缘标签“001”,表示沿[001]方向传播的周期键。通过解析SLICES字符串,可以获得金刚石结构的组成和连接性。

值得注意的是,SLICES仅对拓扑和组成信息进行编码。原子坐标和晶格参数等属性没有明确嵌入。这使得SLICES在设计上对平移、旋转和原子索引排列保持不变。

从切片重建晶体结构

虽然将晶体编码为SLICES相对简单,但挑战在于确保可逆性,即从SLICES字符串准确重建晶体结构的能力。为了实现可逆性,我们开发了SLICES的重建流程(图2),其中包含三个关键步骤:

基于从输入SLICES字符串解析的拓扑和连接信息,使用图论技术生成初始结构。

使用修改的原子间势优化初始结构以获得化学上合理的几何形状。

使用基于图神经网络的通用晶体弛豫模型进一步细化结构。

重建性能以包含40,000多种实验已知材料(每个晶胞最多有20个原子)的数据库为基准。SLICES的重建管道能够重建94.95%的原始结构,大大优于以前的方法。SLICES的这种可逆性允许从学习的表示中生成新的结构,这是逆向材料设计的关键。

在功能材料逆向设计中的应用

作为演示,我们将SLICES应用于使用循环神经网络(RNN)的光电器件直接窄带隙半导体的逆向设计。工作流程包括(图3):

在已知晶体结构上训练RNN模型,以了解与目标电子特性相关的底层SLICES语法和成分/拓扑特征。

使用经过训练的RNN生成假设的SLICES字符串。

将SLICES串重建为晶体结构。

使用从头计算和人工智能模型筛选结构,以确定符合设计标准的候选结构。

通过结合SLICES、RNN和高通量计算的工作流程,发现了14种直接带隙处于最佳范围的新型半导体(图4)。这展示了SLICES作为利用生成人工智能加速发现功能材料的推动者的承诺。

具有指定形成能的新材料的定向生成

此外,我们采用条件递归神经网络(cRNN)架构(如图5所示)来生成与具有用户指定的所需形成能的晶体相对应的SLICES字符串。生成的结构的形成能分布相对于数据集分布更接近指定的目标值。基于SLICES的cRNN显着优于以前最先进的模型。这种方法标志着以受控和精确的方式设计和发现新材料的能力的重大进步。

作为第一个基于弦的可逆且不变的晶体表示,SLICES在晶体固体的逆向设计中开辟了许多令人兴奋的机会,就像SMILES在过去十年中为分子所做的那样。就在过去的几年里,我们见证了从图像、视频、语音到蛋白质和分子的生成模型的巨大进步。我们预计固体材料将成为下一个前沿领域,这要归功于SLICES等表示形式所赋予的数据高效、化学集成探索的新能力。

这个故事是ScienceXDialog的一部分,研究人员可以在其中报告他们发表的研究文章的发现。请访问此页面,了解有关ScienceXDialog以及如何参与的信息。


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行