1.1 概述

USPEX是通用结构预测器的简称:进化晶体结构。在俄语里,“uspekh”代表“成功”, 鉴于此方法的高效,以及通过这种方法产生了许多有用结构,这一命名是恰当的!USPEX在计算材 料发现方面具备许多独特功能,这里将列出它的一系列特点。

最初从2004年,USPEX项目的主要目的是不依赖经验知识预测晶体结构。这一目的已通过整合局部 优化和实空间从头算法模拟,发展成为先进的进化算法。除了完全非经验式的搜索外,USPEX同时 能够预测大量亚稳结构,并运用不同程度的先验知识进行不同类型的模拟。自2010年起,我们的 代码迅速地涉及了其它许多类型的问题,从2012年起代码包含了许多互补的方法。

晶体结构预测是一个较早期的问题,实际上包括理论晶体化学的中心问题也很悠久。 John Maddox于1988年写道

显然,目前的问题是全局优化,即在结构变动过程中发现晶体的最小自由能(每摩尔)。为了得到 一些可能存在的结构,让我们考虑一种简化的情况,一个体积为$V$,有$N$个相同原子的固定立方 晶胞。为了进一步简化,我们假设原子只能离散分布在一个分辨率为$\delta $的网格节点上。这 种数字离散化使得不同原子坐标组合的数目$C$有限化:

  \begin{equation} \label{eq:structNum} C=\frac{1}{(V/\delta ^3)}\frac{(V/\delta ^3)!}{[(V/\delta ^3)-N]!N!} \end{equation}   (1)

如果将$\delta $设为特征键长(例如,$\delta $=1 $\text {\r{A}}$),由方程  1给出的组合数量将是自由能局部极小的结构数量的合理估计。 如果有不止一种原子类型,不同结构的数量将显著增加。假设一个典型体积 $\sim $10 $\text {\r{A}}^3$的原子,考虑到斯特灵的公式 ($n!\approx \sqrt{2 \pi n}(n/e)^ n$),在一个有10原子的单胞内A元素(化合物AB)的可能 结构数为$10^{11}$ ($10^{14}$),若在20个原子的单胞内为$10^{25}$ ($10^{30}$),30个原 子的单胞内为$10^{39}$ ($10^{47}$)我们可以看到,这些数目很大,甚至是总原子数 $N\sim 10$的小体系实际处理起来也不可能实现。更糟的是,随着$N$的增加其复杂性呈指数增加。 很明显,除了最简单的含有$\sim $1-5个原子的单胞体系,在自由能表面上逐点探索所有结构也不 可行。

USPEX采用的进化算法由A.R. Oganov 和 C.W. Glass设计, 还有随后做出很大贡献的A.O. Lyakhov 和 Q. Zhu。它的高效来源于精心设计的变异运算,其可靠 性很大程度上取决于在进化算法中运用了目前最先进的从头算法模拟。进化算法的最大优势是不需 要任何体系的特殊知识(除了化学成分之外),同时还可以自我改进,即随后代的不断增加,越来 越好的结构会被发现并用于产生新结构。下图(Fig. 1)是一个能量 面(或性质)的可能区域放大图。而且,基于变异算法的灵活特性,很容易把一些附加的特点融入 到进化算法中。

\includegraphics[scale=0.3]{pic/energy_landscape.png}
1: 图1:Au8Pd4的简化面2D投影图,显示了某一区域内具有低能量结构的聚集区。此图是 由Oganov & Valle(2009)的方法获得。

我们开发USPEX的一个主要动力就是2004年 发现了 MgSiO$_3$的后钙钛矿结构(Fig. 2),这一发 现显著改变了地球内核的结构模型。2010年9月,当USPEX公开发布时,用户数近200。用户增长速 度很快——在2012年5月我们拥有800用户,这一数字在2014年12月已超过2100。

\includegraphics[scale=0.3]{pic/prediction_of_the_crystal_structure_of_MgSiO3.png}
2: 在120 GPa下的MgSiO$_3$晶体结构预测(20 原子/晶胞)。 上图展示了随着代数的增加,最优结构的焓值变化。在第六代和第十二代间最优结构为钙钛矿, 但在第十三代全局最低的(后钙钛矿)被发现。这次模拟计算在2005年结合了USPEX的第一个版本 和 从头算法完成。它没使用实验数据,证明了USPEX可以在一次模拟中同时找到稳定结构和低能量 的亚稳结构,每一代都包含30个结构。这个图举例的是用最初的USPEX版本计算$\sim $10次中最慢的一个 ,即使这样速度也相当快。

USPEX的普及归功于它的高效性和可靠性,而且在第一次对无机晶体结构预测的 盲测中体现出了USPEX优于其他方法测试,因为它是针对性的测试 (模拟退火和随机抽样)。随机抽样(由Freeman和Schmidt分别于1993年和1996年提倡用于晶体 结构预测,并于2006年被Pickard以AIRSS的名字重新使用)是最简单的, 也是成功率最低和计算成本最高的方法。由于在结构搜索中复杂的指数标度(公式1),USPEX的 优势伴随体系大小的增加呈指数增长。然而,即使在小体系中,如有8个原子的GaAs单胞内,这些 优势还是很大(在这个例子中,随机抽样需要平均500个结构弛豫来发现基态,而USPEX仅仅需要 $\sim $ 30个结构弛豫就能找到(图3))。例如:由随机抽样预测得到的SnH$_4$的稳定 结构中三分之二都被证明不稳定;同样, 使用随机抽样对N和SnH$_4$的预测也被证实不正确 (对USPEX和随机抽样的预测结构进行比较)。

\includegraphics[scale=0.4]{pic/Structure_prediction_for_GaAs_a.png} \includegraphics[scale=0.2]{pic/Structure_prediction_for_GaAs_b.png}
3: GaAs结构预测。 a) 弛豫随机结构的能量分布图, b) 一个进化模拟进程图(细垂直线表示结构代数,而灰线则表现随代数变化最低能量的变化 趋势。所有的能量都是基态结构能量的相对值,进化模拟中每代会有10个结构。此外,上一代 具有最低能量的结构会延续到下一代。

对于较大的体系,随机抽样倾向于产生几乎具有相同能量的完全无序结构,这样就把成功率降低 到几乎为零。从MgSiO$_3$超胞中有40个原子的后钙钛矿的例子可以看出:在120,000次的弛豫后 随机抽样仍然没有找到正确的结构,而USPEX在几百次的弛豫后就找到了(Fig. 4)。

\includegraphics[scale=0.3]{pic/Sampling_of_the_energy_surface.png}
4: 能量表面取样:分别采用随机抽样和USPEX对有40个 原子的MgSiO$_3$后钙钛矿相晶格常数进行计算并对比。 局域优化结构的能量如图所示。随机 抽样共生成$1.2\times 10^{5}$个结构(没有一种结构与基态一致)。USPEX的搜索,每一代 包括40个结构,在15代内发现基态结构。基态结构的能量为箭头标示处。这张图显示,包含在 进化搜索中的“学习”驱动模拟发现低能量结构。

在USPEX中实现随机抽样是非常容易的,但大多数情况下只在测试的时候觉得这样很有用。同样, 粒子群优化(PSO)算法和晶体结构预测 (由A. I.Boldyrev开发,Wang, Lu, Zhu 和 Ma改进实现) 已经被改造。它是在USPEX的基础上进行略微调整被作为修正的PSO(croPSO)算法,它优于 之前未修订版本的PSO,但实际上所有现存的PSO方法远不如USPEX那么高效可靠。如果有人 想尝试,我们认为PSO方法更适用于测试。结合了Martoňák’s的准动力学和Oganov-Glass的进化 方法的进化准动力学方法非常强大,弥补了进化算法的不足。对于全局优化 和获得低能量的亚稳结构,这个方法是足够的,甚至可用于寻找可能的相转变路径。为了研究对于 相变机制的详细信息,其他方法:变胞NEB法 和转变路径方法 加入到该版本