本发明涉及晶体结构分析技术领域,更具体地,涉及一种晶体电子密度分布模型的评价方法及其应用。
背景技术:
物质的物理、化学性质取决于其微观结构,因此,获取物质的结构信息对于理解物质的物理、化学性质极为重要。目前x射线衍射技术是测定晶态物质结构最重要、最权威的方法,也是应用最广泛的方法。也正是由于100多年前x射线衍射技术的出现,使人们对物质结构的认识深入到了原子层次,从而深刻改变了物理、化学、材料、生命科学等学科领域的面貌,极大地推动了技术进步,进而深刻改变了人类生活的面貌。x射线衍射技术的基本原理是入射到晶体中的x射线会被晶体中周期性分布的电子密度所衍射,而且晶体中的电子密度分布就是晶体结构因子的逆傅里叶变换。晶体中电子密度分布就代表了晶体的结构信息,因此只要通过x射线衍射技术测量出晶体的结构因子,就可以方便地获得晶体结构信息。非常遗憾的是,x射线衍射技术通常只能获得衍射强度信息,从衍射强度信息可以获得晶体结构因子的模值(通常被称为结构振幅),但无法获得晶体结构因子的相位信息,这就是x射线晶体学中著名的“相位问题”。
迄今人们已经发展出了多种推引结构因子相位的理论和实验方法,但目前这些方法都各有其局限性。例如曾经荣获诺贝尔奖的“直接法”,仅适用于晶胞中含有独立原子个数较少(通常低于1000)的情况,而且要求衍射数据的分辨率为原子级(约为0.1纳米)。即使在最有利的条件下,各种推引相位的方法给出的通常也只是推荐的尝试相位,与正确相位仍然存在着较大的差距。将这些尝试相位与实验测量得到的衍射振幅相结合,就可以构建晶体中电子密度分布的模型。但这样获得的电子密度分布模型是否正确(即与晶体中的实际电子密度分布相符合)还需要做进一步的分析判断。在衍射数据分辨率高而且电子密度分布模型正确或接近正确的情况下,可以根据电子密度分布模型构建出原子级结构模型,然后利用原子级结构模型计算出晶体的结构振幅,如果计算出的结构振幅与实验观测的结构振幅相一致,则认为结构模型正确。
在这种情况下,结构模型与实际相符合的程度通常用下述指标加以评价:
其中,∑h表示对所有观察到的衍射振幅加和,|fobs|和|fcal|分别表示实验测量到的衍射振幅和由结构模型计算出的衍射振幅。res(通常被称为残差因子)不能应用于无法构建出原子级结构模型的情况。在2004年,oszlányi和
r因子的定义如下:
其中∑h和|fobs|与res中相同,
随着分辨率的恶化,在正确的电子密度模型中将会有越来越多的电子密度分布在原子之间的区域,对正确的电子密度分布模型施加一个微扰后,电子密度将发生较为显著的改变,此时,|fobs|与
在x射线衍射中,很多时候是无法获得原子级分辨率的衍射数据的,例如蛋白质等大分子晶体的衍射数据的分辨率目前常常会劣于0.2纳米。如何在较低的衍射数据分辨率条件下评价一个当前电子密度分布模型的质量,以及如何利用较低分辨率的衍射数据导出正确的电子密度分布模型一直是一个有待解决的难题。
技术实现要素:
本发明提供一种克服上述问题或者至少部分地解决上述问题的晶体电子密度分布模型的评价方法,包括:
s1.计算待测晶体的正确电子密度分布模型在经历第一微扰后的结构振幅值,所述第一微扰使得所述待测晶体中各原子的正确电子密度分布模型在经历微扰后在晶胞内的加和与其对应的原子的核外电子数目相同;
s2.计算待测晶体的当前电子密度分布模型在经历微扰后的结构振幅值,所述微扰使当前电子密度分布模型中的低密度区发生改变;
s3.比较s2中结构振幅值与s1中结构振幅值,以评价当前电子密度分布模型。
优选地,s1包括:
基于与待测晶体的晶格参数相同的假想晶体,计算待测晶体的正确电子密度分布模型在经历第一微扰后结构振幅值;
其中,所述假想晶体在晶胞原点处仅有一个原子且位于原点处,所述原子的种类与组成所述待测晶体的原子之一相同。
优选地,s1具体包括:
s11.基于对所述假想晶体的电子密度分布模型施加第一微扰后的电子密度分布模型,利用傅里叶变换计算得到赝原子散射因子;
s12.基于所述赝原子散射因子,根据晶体衍射运动学理论,得到待测晶体的正确电子密度分布模型在第一微扰后的结构振幅值。
优选地,s11具体为:
s111.基于所述假想晶体的结构因子,利用逆傅里叶变换得到电子密度分布模型;
s112.对s111的电子密度分布模型施加第一微扰,得到经历微扰后的电子密度分布模型;
s113.基于s112中经历微扰后的电子密度分布模型,根据傅里叶变换得到该电子密度分布模型的赝原子散射因子。
优选地,所述假想晶体的结构因子的获取基于构成假想晶体的原子散射因子。
优选地,所述s12具体为:
基于所述赝原子散射因子,对待测晶体实验观测衍射强度值进行修正,得到待测晶体的正确电子密度分布模型在经历第一微扰后的结构振幅值。
优选地,s2中所述待测晶体的当前电子密度分布模型在经历微扰后的结构振幅值的获取包括:
利用实验观测的衍射振幅和当前相位,通过傅里叶合成构建待测晶体的当前电子密度分布模型;
对所述当前电子密度分布模型施加微扰,使模型中的低密度区发生改变,并利用傅里叶变换计算得到当前电子密度分布模型在经历微扰后的衍射振幅值。
优选地,所述评价方法应用于分辨率劣于0.2纳米的晶体电子密度分布模型。
本发明的另一个方面,还提供了上述评价方法在晶体结构分析中的应用。
所述晶体结构分析中还包括使用直接法和/或电荷翻转法。
本发明提出的晶体电子密度分布模型的评价方法,根据当前电子密度分布模型在经历特定微扰后的结构振幅与正确电子密度分布模型在经历特定微扰后的结构振幅的估算值的吻合程度来评价当前电子密度分布模型的质量,克服了现有的评价方法无法在低分辨条件下可靠地评价电子密度分布模型质量的不足,本发明的方法不仅适用于具备原子级分辨率衍射数据的情况,而且能够适用于衍射数据分辨率较低的情形。本发明的评价方法中正确电子密度分布模型在经历特定微扰后的结构振幅的估算值可以直接由实验测量可获取的信息导出。本发明所提供的评价方法可以应用于晶体结构解析工作,包括但不限于与现有的直接法、电荷翻转法等方法相结合,从备选或尝试的电子密度分布模型中甄选出正确模型。
附图说明
图1为本发明测试例1中c6br6晶体0.25纳米分辨率的电子密度分布图在微扰后的结构振幅计算值(×表示)和估算值(
图2a为本发明测试例2中rtian值随着不同的电子密度分布模型的变化图;
图2b为本发明测试例2中与rtian最小值相对应的电子密度模型;
图2c为本发明测试例2中晶体的正确电子密度分布图;
图3为本发明测试例3和对比测试例1中r和rtian值随着不同的电子密度分布模型的变化曲线图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明提供了一种晶体电子密度分布模型的评价方法,该方法包括:
s1.计算待测晶体的正确电子密度分布模型在经历第一微扰后的结构振幅值,所述第一微扰使得所述待测晶体中各原子的正确电子密度分布模型在经历微扰后在晶胞内的加和与其对应的原子的核外电子数目相同;
s2.计算待测晶体的当前电子密度分布模型在经历微扰后的结构振幅值,所述微扰使当前电子密度分布模型中的低密度区发生改变;
s3.比较s2中结构振幅值与s1中结构振幅值,以评价当前电子密度分布模型。
其中,在当前电子密度分布模型正确时,两者之间差别很小。两者之间差别越小,说明当前电子密度分布模型越接近于正确。
本发明也提供了一种利用可测量或事先获得的信息估算微扰后的正确电子密度分布模型结构振幅的方法。
在估算的结构振幅能够充分接近真实结构振幅的情况下,可以利用估算的结构振幅值与微扰后的当前电子密度分布模型的结构振幅计算值相比较,并根据两者之间的一致程度评价当前电子密度分布模型的质量。
在本发明的评价方法中,可以利用实验观测的衍射振幅和当前尝试相位通过傅里叶合成的方式构建当前电子密度分布模型;然后,对当前电子密度分布模型施加一个微扰,使模型中的低密度区发生改变,并计算改变后的电子密度分布的衍射振幅,此处的微扰只需使模型中的低密度区发生改变即可;随后,再利用实验观测的衍射振幅和其它可以预先获得的晶体信息估算正确电子密度分布在被第一微扰扰动后的结构振幅;然后,再考察微扰后的当前电子密度分布模型的衍射振幅与扰动后的正确电子密度分布图的衍射振幅的符合程度。
即s2中待测晶体的当前电子密度分布模型在经历微扰后的结构振幅值的获取可以包括:
利用实验观测的衍射振幅和当前相位,通过傅里叶合成构建待测晶体的当前电子密度分布模型;
对当前电子密度分布模型施加微扰,使模型中的低密度区发生改变,并利用傅里叶变换计算得到当前电子密度分布模型在经历微扰后的衍射振幅值。
其中,在s2中对当前电子密度分布模型所施加的使该模型中的低密度区发生改变的微扰为本领域中具有上述功效的微扰。
优选地是,施加于当前电子密度分布模型的微扰为
在本发明的评价方法中,在s1中,待测晶体的正确电子密度分布模型经历使得该晶体中各原子的正确电子密度分布模型在晶胞内的加和与其对应的原子的核外电子数据相同的第一微扰,只要能满足上述条件的微扰均可作为本发明的第一微扰。
例如,晶体在某一特定分辨率下的正确电子密度分布图为ρo,ρi为晶胞中第i个原子在同一分辨率下的电子密度分布图,ri是晶胞中第i个原子的坐标,对晶胞中每个原子施加的微扰
δi是一个接近于0的实数。其中,δi的选取应满足使
其中,实验观测的衍射振幅即为通过x射线衍射实验测量得到的晶体结构振幅。
其中,尝试相位是指实验观测的衍射振幅所对应的相位的尝试值。尝试值可以根据统计学或是数学关系如直接法公式给出。
符合程度可以但不限于用下述指标量化表示:
其中,其中∑h和
在本发明的实施方式中,为了使评价更准确,s1包括:
基于与待测晶体的晶格参数相同的假想晶体,计算待测晶体的正确电子密度分布模型在经历第一微扰后的结构振幅值;
其中,假想晶体在晶胞原点处仅有一个原子且位于原点处,原子种类与组成待测晶体的原子之一相同。
假定一个晶体的衍射振幅和晶格参数通过x射线衍射测量已经确定。此外,组成晶体的原子种类和数目也已经通过化学分析或其他途径已知。假定晶胞中第i个原子的原子散射因子为fi,则可以构建一个假想晶体结构,其晶格参数与所研究的晶体相同,晶胞中只有一个原子且位于原点处,原子散射因子为fi。
在本发明一个优选实施方式中,s1具体包括:
s11.基于对该假想晶体的电子密度分布模型施加第一微扰后的电子密度分布模型,利用傅里叶变换计算得到赝原子散射因子;
s12.基于上述赝原子散射因子,根据晶体衍射运动学理论,得到待测晶体的正确电子密度分布模型在第一微扰后的结构振幅值。
其中,s11具体可以为:
s111.基于所述假想晶体的结构因子,利用逆傅里叶变换得到电子密度分布模型;
s112.对s111的电子密度分布模型施加第一微扰,得到经历微扰后的电子密度分布模型;
s113.基于s112中经历微扰后的电子密度分布模型,根据傅里叶变换得到该电子密度分布模型的赝原子散射因子。
其中,s111中,假想晶体的晶格参数与所研究的晶体相同,晶胞中只有一个原子且位于原点处,原子散射因子为fi,其结构因子则为
其中,
该假想晶体的电子密度分布则为
ρi=ift(fi,h)=ift(fi)
其中,ift代表逆傅里叶变换。上式中的傅里叶合成截止于与所研究晶体的衍射数据相同的分辨率。
本发明的“截止于”指傅里叶级数项加和截止于实验衍射振幅的分辨率极限,更高空间频率的傅里叶级数项没有包含在傅里叶级数项加和之中。
其中,s112中,在对ρi施加第一微扰后,电子密度变为
其中vi是一个微扰函数,其定义为:
其中δi是一个接近于0的实数。
其中,s113中,赝原子散射因子的计算方式具体为:
其中,ft代表傅里叶变换,
显然,
所研究晶体的观测电子密度分布可以看成是晶胞中所有原子的电子密度分布按照原子几何位置进行的叠加,即:
其中,ρi(ri)是从晶胞原点平移至ri处的ρi,n为晶胞中的原子数目。对ρo施加第一微扰后,电子密度分布变为:
其中,vi(ri)是从原点平移至ri处的vi。通过选择合适的δi,可以使每个原子vj(rj)=1的区域不重合。
在此情形下有
ρi(ri)×vj(rj)=0fori≠j,则可得
此电子密度分布的结构因子为
在s12中,基于得到的赝原子散射因子,对待测晶体实验观测衍射强度值进行修正,得到待测晶体的正确电子密度分布模型在经历第一微扰后的结构振幅的估算值。
根据晶体衍射运动学理论,一个晶体的实验观测衍射强度为:
其中k是不依赖于衍射角θ的比例因子。
因此,晶胞内电子密度分布为
其中ki=fi*/fi,
如果ki=kj,则可得:
如前述所讨论,当δi取适当值的时候,fi*与fi在低衍射角度范围内基本一致,这意味着在此情况下ki=kj=1近似成立,因此上式也近似成立。
在高衍射角度范围,依据晶体衍射强度的wilson统计分布规律,有:
其中,<|fobs|2>是|fobs|2在某一指定的sin2θ范围内的均值,k′是不依赖于衍射角度的比例因子。相应地,可以得到
联立上述两式,可得
因此在高衍射角度范围,从统计平均的意义上说,下式成立
因此我们可以把
该估算值可以由实验测量可获取的信息使用上式直接导出。
利用上述估算值可以计算量化指标rtian。
在常规方法中,使用残差因子res来评价结构模型与实际相符合的程度,
即,
其中,∑h表示对所有观察到的衍射振幅加和,|fobs|和|fcal|分别表示实验测量到的衍射振幅和由结构模型计算出的衍射振幅。
在本发明中,优选使用rtian来量化评价电子密度分布模型与实际相符合的程度。
其中,∑h表示对所有观察到的衍射振幅加和,
其中,
其中ift表示逆傅里叶变换,
施加微扰后,当前电子密度分布模型变为ρ*,
ρ*=ρ×w
其中w为微扰函数,
其中δcryst是一个接近于0或等于0的实数。然后,
需要特别指出的是只有在对当前电子密度分布模型和正确电子密度分布图施加同样微扰的情况下,rtian值中才仅仅包含了电子密度分布模型本身的贡献。在当前模型正确的情况下,rtian将趋近于零。但在推导
微扰函数
显然,在这种情形下,rtian值将不仅依赖于当前电子密度分布模型,还依赖于δcryst。在当前电子密度分布模型正确,并且w接近于
本发明所公开的评价方法可以适用于分辨率低至(劣于)0.2纳米的晶体电子密度分布模型。
在本发明的一个方面,还提供了上述评价方法在晶体结构分析中的应用。
上述应用包括但不限于与现有的直接法、电荷翻转法等方法相结合,从备选或尝试的晶体电子密度分布模型中甄选出正确模型。
实施例1
本实施例用于说明本发明所提供的电子密度分布模型评价方法及其在晶体结构解析中的应用。
衍射数据来源:因实际晶体测量得到的衍射数据所对应的正确电子密度分布模型无法准确地获知,所以在评价晶体结构解析中得到的电子密度分布模型的质量时缺乏严格的参考标准。为克服这一困难,本实施例中采用模拟衍射数据,模拟衍射数据由文献中报道的已知晶体结构计算得到。本实施例中的已知晶体结构引用自文献:
wu,j.s.,spence,j.c.h.,o’keeffe,m.&groy,t.l.(2004).acta.cryst.a60,326-330。
相关晶体结构数据如下:
分子式:c6br6,空间群:p21/n,晶格参数:a=0.8381纳米,b=0.40192纳米,c=1.53939纳米,β=92.674°,每个晶胞内的分子式个数(z):2。
各独立原子的晶体学坐标详见上述文献。
根据晶体结构数据计算得到结构因子,然后去掉结构因子的相位信息,仅保留结构因子的模值(结构振幅)作为模拟衍射数据。模拟衍射数据的分辨率设定为0.25纳米。
(1)计算赝原子散射因子
首先构建假想晶体,假想晶体的晶格参数与c6br6晶体的晶格参数相同,但仅在晶胞原点处有一个c原子或br原子。计算假想晶体在0.25纳米分辨率范围内的所有结构因子,并利用逆傅里叶变换得到0.25纳米分辨率下的电子密度图ρc和ρbr。分别对ρc和ρbr施加微扰,微扰具有以下的函数形式:
选择合适的δ值,以使分别由c和br构成的假想晶体的晶胞中大于等于δ的电子密度之和与c或br的核外电子数目相同。在本实施例中,δc和δbr分别为0.0024和
(2)估算c6br6正确电子密度分布图在微扰后的结构振幅
利用在(1)中得到的
计算c6br6正确电子密度模型在微扰后的结构振幅估算值。
(3)计算晶体微扰后的当前电子密度分布模型的结构振幅
首先对c6br6的任一当前电子密度分布模型ρ施加微扰,微扰函数具有如下形式:
然后,计算微扰后的电子密度分布模型:ρ*=ρ×w,则微扰后的电子密度分布图的结构振幅可以通过傅里叶变换得到:
(4)计算rtian
利用(2)中得到的
(5)比较一系列不同的晶体电子密度分布模型,对应于rtian值较小并且rtian取最小值的电子密度模型则为在一定精度范围内的正确晶体电子密度分布模型。
实施例2
本实施例用于说明本发明所提供的电子密度分布模型评价方法及其在晶体结构解析中的应用。
衍射数据来源:基于与实施例1相同的原因,本实施例中仍然采用模拟衍射数据,模拟衍射数据由文献中报道的已知晶体结构计算得到。本实施例中的已知晶体结构引用自文献:
czugler,m.,weber,e.,parkanyi,l.,korkas,p.p.&bombicz,p.(2003).chem.eur.j.,9,3741-3747.
相关晶体结构数据如下:
分子式:c252h324o18·h2o,空间群:p1,晶格参数:a=1.6909纳米,b=1.8772纳米,c=2.1346纳米,α=111.46°,β=103.38°,γ=107.74°。每个晶胞内的分子式个数(z):1。
各独立原子的晶体学坐标详见相关文献。
从晶体结构得到模拟衍射数据(结构振幅)的方法与实施例1相同,h原子没有包括在计算之中。模拟衍射数据的分辨率同样设定为0.25纳米。
步骤(1)-(5)与实施例1基本相同,差别仅在于涉及的原子种类不同。在本实施例中,所涉及的原子种类为c和o。
测试例1
本测试例用于说明本发明所提供的微扰后的正确电子密度分布图的结构振幅的估算方法可靠性的测试。
计算实施例1中c6br6晶体在0.25纳米分辨率下的电子密度图ρo,并对其施加微扰,微扰后的电子密度分布图为
其中
将
测试例2
本测试例用于说明本发明所提供的晶体电子密度分布模型评价方法有效性的测试。
按照实施例1所述方法,在步骤(5)中,对于模拟衍射数据中的每一个衍射振幅,分别赋予一个随机相位,利用这些衍射振幅和随机相位构建初始电子密度分布模型ρ0,然后令新一轮的电子密度模型为
测试例3
本测试例用于说明本发明所提供的电子密度分布模型评价方法有效性的测试。
本测试例针对实施例2所得到的模拟衍射数据进行。测试方法与测试例2基本相同,区别仅在于把正确电子密度分布图作为初始电子密度分布模型。正确电子密度分布图利用衍射振幅和正确相位通过傅里叶合成得到。每一个电子密度分布模型所对应的rtian值如图3所示。从图中可以看出,在尝试的400个电子密度分布模型中,正确电子密度分布图所对应的rtian值最小。
对比测试例1
本测试例用于说明参比的电子密度分布模型评价方法有效性的测试。
本对比测试例针对实施例2所得到的模拟衍射数据进行。测试方法与测试例3基本相同,区别仅在于对应于每一个电子密度分布模型计算的不再是rtian而是r值。每一个电子密度分布模型所对应的r值也显示在图3中以便于与rtian值相比较。从图中可以看出,在尝试的400个电子密度分布模型中,正确电子密度分布图所对应的r值不仅不是最小值,反而是最大值。因此,在此情形下,已经不能依据r取最小值来识别出正确的电子密度分布模型。相反地,rtian值依然是一种有效的晶体电子密度分布模型的评价指标,可以用来识别出正确电子密度模型。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。