一种蛋白质靶点结构优化方法及系统与流程

文档序号:25821304发布日期:2021-07-09 14:44阅读:325来源:国知局
一种蛋白质靶点结构优化方法及系统与流程

1.本发明涉及蛋白质靶点结构技术领域,特别是涉及一种蛋白质靶点结构优化方法及系统。


背景技术:

2.现代药物研发必须依赖相关计算软件,其作用体现在:1、通过计算机生成所有可能的分子结构;2、对生成的分子进行修饰改造;3、通过计算模拟对所有分子进行筛选,将计算指标满足要求的少量分子从众多候选者中挑选出来,才能进入下一步合成实验阶段。以上三个方面涉及到的分子数量数以百万计,所以必须通过软件在计算平台上得以实现。这种计算必须通过计算药物分子与相关蛋白质靶点的相互作用情况进行筛选。
3.然而现有方法从蛋白质数据库中提取的靶点结构,其侧链结构信息是不完善的。这是因为蛋白质数据库中的结构一般为实验方法获得,实验方法的测量精度可以很好的反映主链结构,然而侧链结构的获取对于实验的精度要求更高(小于1.5a),大部分情况难以达到。因此需要计算方法的帮助才能获取侧链结构,而通常使用的分子力场等方法精度与普适性较差,因此给出的侧链结构可靠性较低。
4.使用这种侧链结构不可靠的蛋白质靶点进行药物与靶点的相互作用计算,是造成计算结果偏差的重要因素。而这种偏差导致的筛选乏力是药物研发成本过高的重要原因。
5.现有方法从蛋白质数据库中提取靶点结构,蛋白质数据库中的结构主要为实验方法获得。主链与侧链结构的测量对实验的分辨率要求是不同的,主链4.5

6埃,而要分辨侧链的形态与方向需要小于2.5埃的分辨率,因此实验获取的主链结构相对可靠,侧链结构通常通过计算方法辅助获得。
6.通常使用的计算方法的不足之处体现在两方面,即能量计算精度不高,以及采样方法不可靠。


技术实现要素:

7.本发明的目的是提供一种蛋白质靶点结构优化方法及系统,通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构。
8.为实现上述目的,本发明提供了如下方案:
9.一种蛋白质靶点结构优化方法,包括:
10.从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定;
11.按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转;
12.判断旋转后的侧链结构数量是否达到预设结构数量;
13.若否,则继续进行三自由度旋转;
14.若是,则对旋转后的侧链结构采用dftb方法进行优化并截取;
15.截取之后,对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb
方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。
16.进一步地,截取能量排序前n的结构。
17.进一步地,截取能量范围在8kcal以内的结构。
18.进一步地,所述预设结构数量为6561个。
19.进一步地,旋转周期为120
°

20.进一步地,在按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转之前,还包括:
21.对侧链以及侧链的二面角进行编号。
22.本发明还提供了一种蛋白质靶点结构优化系统,包括:
23.靶点结构提取模块,用于从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定;
24.第一旋转模块,用于按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转;
25.判断模块,用于判断旋转后的侧链结构数量是否达到预设结构数量;
26.优化截取模块,用于对旋转后的侧链结构采用dftb方法进行优化并截取;
27.第二旋转及优化截取模块,用于对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。
28.根据本发明提供的具体实施例,本发明公开了以下技术效果:
29.本发明提供的蛋白质靶点结构优化方法包括:从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定;按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转,并判断旋转后的侧链结构数量是否达到预设结构数量;若否,则继续进行三自由度旋转;若是,则对旋转后的侧链结构采用dftb方法进行优化并截取;截取之后,对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。本发明通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构,在计算药物分子与靶点相互作用时更加符合真实情况。通过提高初始环节的出产效率的方式,降低研发成本,加快研发速度。
附图说明
30.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
31.图1为本发明实施例蛋白质靶点结构优化方法的流程图;
32.图2为本发明实施例侧链二面角编号示意图;
33.图3为结构优化与结构搜索(结构采样)示意图。
具体实施方式
34.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
35.本发明的目的是提供一种蛋白质靶点结构优化方法及系统,通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构。
36.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
37.如图1所示,本发明公开的蛋白质靶点结构优化方法包括以下步骤:
38.步骤101:从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定。
39.步骤102:按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转,旋转周期为120
°

40.步骤103:判断旋转后的侧链结构数量是否达到预设结构数量;若否则继续执行步骤102,若是则执行步骤104。
41.步骤104:对旋转后的侧链结构采用dftb方法进行优化并截取。截取能量排序前n的结构,或者截取能量范围在8kcal以内的结构。
42.步骤105:截取之后,对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。
43.在按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转之前,还包括:对侧链以及侧链的二面角进行编号。
44.下面将详细介绍上述方法:
45.1、从现有蛋白质靶点数据库中提取靶点结构。(从靶点数据库中提取靶点结构,即靶点中每个原子的三维坐标)
46.2、固定主链结构,靶点数据库中主链结构是可靠的,侧链结构精度不足,因此该步骤的目的是将主链原子的三维坐标固定住,后面的采样与优化只针对侧链进行。被固定的原子在输入文件中采用约束参数,实现方式通过在dftb的输入文件中使用constraintst{}命令,括号中填写被固定原子对应的序列号。
47.3、将侧链与侧链二面角进行编号,此处编号是在图2中的编号,对每个二面角命名。如图2所示首先对第1个侧链的第1个二面角χ(1,1)进三个自由度的旋转。然后依次旋转第χ(2,1),χ(3,1)
……
由于靶点区域通常包含十几个氨基酸侧链,这样旋转到χ(8,1)后会得到6561个结构。对这些结构使用dftb方法进行结构优化。截取能量范围在8kcal以内,或者能量排序前n个结构,两个条件满足其一即可。n的数值由使用者决定,建议选择1000,既能保证结构多样性,又能控制计算量在合理范围内。
48.4、后面每次选取(此处选取是由程序完成,按照上一步规定的顺序逐个对每个二面角进行操作)1个二面角进行3个自由度的旋转。该旋转即对结构采样,其中采样、优化、与结构搜索等概念以及关系在图3中详细说明。例如选取χ(9,1)进行3个自由度的旋转,结构数量扩充三倍,将得到的3*n个结构进行dftb优化,截取标准与第3步相同。按照这种方式将
所有靶点侧链的第χ(1,n)搜索完成。)
49.5、按照以上方式对每个侧链的第2个二面角χ(1,2)到χ(n,2)进行搜索,(根据相关化学理论,该结构是c

c键结构,旋转周期约为120
°
在该二面角初始角度x的基础上分别加120
°
与240
°
,即x、x+120、x+240三个角度,即“结构采样”,对结构的“搜索”即为“结构采样”与“结构优化”的最终结果,图3中详细说明)每次旋转三个自由度,结构数量扩充3倍,使用dftb方法对结构进行优化,选取能量在8kcal以内或者排序在前n的低能稳定结构。
50.6、按照上面步骤,把全部侧链的全部二面角进行搜索(依次对每个二面角的转动自由度进行采样,即原来角度数值x,分别加120度与240度,搜索与优化的含义在图3中说明),得到一系列低能构象。
[0051][0052]
其中p
i
是量子态i的概率,ε
i
是量子态i的能量,k是玻尔兹曼常数,t是系统温度且m为系统具有的量子态数目。p
i
表示第5步输出的结果中,能量排序为i的结构在温度t下存在的概率,药物分子发挥作用的环境为人体体温,t设定为37℃;ε
i
为第5步输出结果中第i个结构的能量;k为玻尔兹曼常数(物理学常数k=1.380649
×
10

23j/k);表达式的分母部分充当归一化参数;整个公式的意义在于表明在任意温度下,第5步输出的结果中,每个结构存在的概率随着其能量的升高按指数方式减小,在人体环境温度下(37℃),真实的分子结构落在能量排序在8kcal/mol以内的结构集合中的概率超过99.9%。第5步结果之外的结构,由于其能量较高,其存在的可能性可以忽略。
[0053]
图3,黑色曲线代表势能面,分子真实的结构处于势能面的局域极小点,本发明的目标是把一定能量范围内的所有的局域极小值都找出来(根据需要该能量上限一般在3

8kcal之间选取);上方的黑色圆点代表初始结构中某个二面角的数值;虚线箭头代表结构优化过程,优化过程由dftb程序完成,目的是寻找初始结构附近的能量局域极小值,但是结构优化无法获得其他区域的局域极小值,因此需要采样操作;实线箭头代表采样操作,根据相关化学理论,此类二面角的在0

360
°
的范围内通常包含3个局域极小值,因此对初始结构中的该二面角分别加120
°
与240
°
,目的是使采样点落入其他包含局域极小值的区域。以上通过采样与优化将局域极小值都找出来的操作即为“结构搜索”。
[0054]
药物研发(化学药物与生物药物)必须通过计算药物分子与相关蛋白质靶点的相互作用情况进行筛选。然而现有方法从蛋白质数据库中提取的靶点结构侧链信息缺失,是造成计算结果偏差的重要因素。本发明获得的靶点结构,通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构,在计算药物分子与靶点相互作用时更加符合真实情况。通过提高初始环节的出产效率的方式,降低研发成本,加快研发速度。
[0055]
本发明还提供了一种蛋白质靶点结构优化系统,包括:
[0056]
靶点结构提取模块,用于从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定。
[0057]
第一旋转模块,用于按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转;
[0058]
判断模块,用于判断旋转后的侧链结构数量是否达到预设结构数量;
[0059]
优化截取模块,用于对旋转后的侧链结构采用dftb方法进行优化并截取。
[0060]
第二旋转及优化截取模块,用于对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。
[0061]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0062]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1