一种蛋白质表面残基的快速确定方法与流程

文档序号:16744764发布日期:2019-01-28 13:24阅读:1689来源:国知局
一种蛋白质表面残基的快速确定方法与流程

本发明涉及生物学信息学及计算机应用领域,具体而言涉及一种蛋白质表面残基的快速确定方法。



背景技术:

蛋白质是一种由20种常见氨基酸组成的有机大分子。它是生命活动的物质基础,是与各种形式的生命活动紧密联系在一起的物质。在生命活动中,蛋白质需要与其他的生物分子产生相互作用,来完成特定的生物学功能。而在与其他生物分子产生相互作用时,大多数情况下都是暴露在蛋白质表面的残基(称为表面残基)与其他生物学分子发生物理化学作用。因此,准确识别蛋白质中的表面残基,对于研究蛋白质的功能与进一步的生物制药具有重要的指导意义。

目前,专门用于确定蛋白质表面残基的计算方法还很欠缺。查阅文献可以发现,mandler在1988年提出的antigen方法(mandlerj.antigen:proteinsurfaceresidueprediction[j].bioinformatics,1988,4(4):493-493.)是使用蛋白质二级结构等信息来辅助确定表面残基的。pymol软件(delanowl.thepymolmoleculargraphicsystem[j].2002.)中是使用探针的方式来确定蛋白质表面残基。除此之外,还可以通过计算蛋白质中每个残基的溶剂可及性面积来辅助判断蛋白质的表面残基。尽管这些为数不多的计算方法可以用于确定蛋白质表面残基,但这些方法均存在计算复杂度较高、识别精度较低的问题,并不能有效地用于实际应用。

综上所述,专门用于确定蛋白质表面残基的计算方法还很欠缺,现存的蛋白质表面残基确定方法在计算代价、精确度方面,距离实际应用的要求还有很大差距,迫切地需要改进。



技术实现要素:

为了克服现有的蛋白质表面残基确定方法在计算代价、精确性方面的不足,本发明提出一种能从蛋白质结构信息出发,计算代价低、精确度高的蛋白质表面残基确定方法。

本发明解决其技术问题所采用的技术方案是:

一种蛋白质表面残基的快速确定方法,所述方法包括以下步骤:

1)输入待确定表面残基的蛋白质结构信息,记作a;

2)将a中的每个残基的中心碳原子cα看做是笛卡尔坐标系下的一个坐标点,记作r={r1,r2,…,rn},其中ri为表示a的第i个残基的cα的坐标点,n是a的残基数目;

3)从蛋白质结构信息a中,抽取r中所有坐标点的坐标信息,记为p={p1,p2,…,pn},其中pi=(xi,yi,zi)t表示坐标点ri的坐标信息,xi、yi与zi分别表示坐标点ri在笛卡尔坐标系下的三个维度信息,t表示向量的转置;

4)计算r中所有坐标点的中心点o的坐标信息,记作o:

并计算r中所有坐标点与o之间的欧氏距离,记作d={d1,d2,…,dn},其中di

表示坐标点ri与o之间的欧氏距离;

5)针对r中的任意两个不同坐标点ri与rj,计算它们与o组成的角∠riorj的余弦值

其中,||·||为向量的模运算符;

6)计算r中距离最远的两个坐标点的距离,记作df:

并根据计算得到的df,计算阈值thcos:

thcos=cos(2·arcsin(k/df))

其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;7)选择d中值最大的元素,记为di′,并将其对应坐标点ri′对应的残基标记为表面残基,然后将元素di′从d中移除,再将ri′从r中移除,最后检查r中余下的每一个坐标点rj,若大于thcos,则将rj标记为非表面残基,从r和d中移除rj与dj;

8)若d中元素数目不为0,返回步骤7),否则,将a中所有残基是否为表面残基的标记信息返回。

本发明的技术构思为:首先,抽取蛋白质所有残基的中心碳原子在笛卡尔坐标系下的坐标信息;其次,计算这些中心碳原子的中心点坐标信息;再次,计算这些中心碳原子与计算得到的中心点之间的位置关系;最后,根据这些位置关系,判断对应残基是否为蛋白质表面残基。本发明提供一种计算代价低、精确度高的蛋白质表面残基确定方法。

本发明的有益效果表现在:直接从蛋白质结构信息出发,快速精确地确定了蛋白质表面残基,对理解蛋白质的结构与功能起到了促进作用。

附图说明

图1为一种蛋白质表面残基的快速确定方法的示意图。

图2为使用一种蛋白质表面残基的快速确定方法对蛋白质1xefa确定表面残基后得到的三维结构图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1和图2,一种蛋白质表面残基的快速确定方法,包括以下步骤:

1)输入待确定表面残基的蛋白质结构信息,记作a;

2)将a中的每个残基的中心碳原子cα看做是笛卡尔坐标系下的一个坐标点,记作r={r1,r2,…,rn},其中ri为表示a的第i个残基的cα的坐标点,n是a的残基数目;

3)从蛋白质结构信息a中,抽取r中所有坐标点的坐标信息,记为p={p1,p2,…,pn},其中pi=(xi,yi,zi)t表示坐标点ri的坐标信息,xi、yi与zi分别表示坐标点ri在笛卡尔坐标系下的三个维度信息,t表示向量的转置;

4)计算r中所有坐标点的中心点o的坐标信息,记作o:

并计算r中所有坐标点与o之间的欧氏距离,记作d={d1,d2,…,dn},其中di表示坐标点ri与o之间的欧氏距离;

5)针对r中的任意两个不同坐标点ri与rj,计算它们与o组成的角∠riorj的余弦值

其中,||·||为向量的模运算符;

6)计算r中距离最远的两个坐标点的距离,记作df:

并根据计算得到的df,计算阈值thcos:

thcos=cos(2·arcsin(k/df))

其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;7)选择d中值最大的元素,记为di′,并将其对应坐标点ri′对应的残基标记为表面残基,然后将元素di′从d中移除,再将ri′从r中移除,最后检查r中余下的每一个坐标点rj,若大于thcos,则将rj标记为非表面残基,从r和d中移除rj与dj;

8)若d中元素数目不为0,返回步骤7),否则,将a中所有残基是否为表面残基的标记信息返回。

本实施例以确定蛋白质1xefa的表面残基为实施例,一种蛋白质表面残基的快速确定方法,包括以下步骤:

1)输入待确定表面残基的蛋白质结构信息,记作a;

2)将a中的每个残基的中心碳原子cα看做是笛卡尔坐标系下的一个坐标点,记作r={r1,r2,…,rn},其中ri为表示a的第i个残基的cα的坐标点,n是a的残基数目;

3)从蛋白质结构信息a中,抽取r中所有坐标点的坐标信息,记为p={p1,p2,…,pn},其中pi=(xi,yi,zi)t表示坐标点ri的坐标信息,xi、yi与zi分别表示坐标点ri在笛卡尔坐标系下的三个维度信息,t表示向量的转置;

4)计算r中所有坐标点的中心点o的坐标信息,记作o:

并计算r中所有坐标点与o之间的欧氏距离,记作d={d1,d2,…,dn},其中di表示坐标点ri与o之间的欧氏距离;

5)针对r中的任意两个不同坐标点ri与rj,计算它们与o组成的角∠riorj的余弦值

其中,||·||为向量的模运算符;

6)计算r中距离最远的两个坐标点的距离,记作df:

并根据计算得到的df,计算阈值thcos:

thcos=cos(2·arcsin(k/df))

其中,控制thcos大小的参数k的值为3.8埃,cos与arcsin分别为余弦与反正弦运算符;

7)选择d中值最大的元素,记为di′,并将其对应坐标点ri′对应的残基标记为表面残基,然后将元素di′从d中移除,再将ri′从r中移除,最后检查r中余下的每一个坐标点rj,若大于thcos,则将rj标记为非表面残基,从r和d中移除rj与dj;

8)若d中元素数目不为0,返回步骤7),否则,将a中所有残基是否为表面残基的标记信息返回。

以确定蛋白质1xefa的表面残基为实施例,运用以上方法得到了蛋白质1xefa的表面残基,蛋白质1xefa的表面残基的数目为137,表面残基结构如图2所示。

以上说明是本发明以确定蛋白质1xefa的表面残基为实例所得出的结果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1