一种蛋白质冷冻电镜密度图结构检测方法

文档序号:6346169阅读:1096来源:国知局
专利名称:一种蛋白质冷冻电镜密度图结构检测方法
技术领域
本发明涉及ー种蛋白质冷冻电镜密度图结构检测方法,属于生物信息学领域,特别是冷冻电镜密度数据的分析。
背景技术
人类基因组工作草图绘制完成后,生命科学进入后基因时代,结构生物学将处在具有战略性的关键地位,在人类基因组测定之后,将进一歩集中研究蛋白质的结构与功能,特别是蛋白质的三维结构,这是掲示基因组功能的基本途径。冷冻电镜技术作为结构生物学重要的研究手段将扮演越来越重要的角色,冷冻电镜对于具有ニ维晶体结构的生物样品,能够得到其高分辨率的三维重构图像,并直接用于解析其空间结构信息;对于非晶体的样品,虽只能得到低分辨率的三维重构图,但可以为高分辨率的X-射线晶体学和核磁共振波谱学所得的亚结构提供模型。对冷冻电镜重构的密度数据分析,主要包含三个步骤可视化、分割和结构匹配。冷冻电镜的密度图虽然包含生物大分子的结构,但密度数据的精度较 低,不能直接获取其ニ级结构。而通过X射线获取的小分子晶体结构是高精度的,包含分子的原子组成以及原子之间的连接关系。一个翻译蛋白质结构的主要方法就是把这种已知结构的晶体结构通过坐标变换放入密度图中,如果两者匹配的很好,则可以推測出密度图的结构和它的原子模型。目前,已有软件的匹配算法単一,计算量大,效果有待提高,很大程度还靠手工匹配。

发明内容
针对上述问题,本发明的目的在于提出了ー种蛋白质冷冻电镜密度图结构检测方法,根据密度图的物理属性,用冷冻电镜密度图的关键点来代表冷冻电镜密度图,用高密度的原子代表原子模型,使用迭代法计算出两者点的对应关系,把匹配问题转化成绝对定向问题,然后求解出其绝对定向坐标变换,在每次迭代中利用绝对定向法计算出变换矩阵的解析解,这里变换矩阵包括旋转矩阵和平移矩阵。用此变换矩阵乘以原子模型当前位置矩阵,从而得到原子模型的新位置,即匹配結果。所以匹配问题的核心问题就是求解变换矩阵,即旋转矩阵和平移向量。本发明的技术方案为ー种蛋白质冷冻电镜密度图结构检测方法,其步骤为I)选取原子模型中符合设定条件的原子表示所选原子模型;其中,所选原子记为集合P,将集合P中的姆一点p(x,1,z)对应的四元数用P(X,I, z)表示;2)选取待测蛋白质冷冻电镜密度图中的关键点并将其添加到集合M中;所述关键点为密度图中某一点的密度值在该点邻域中两个方向均为最大值的点;3)对于集合P中的每一点P,计算集合M中距离点P最近的点g作为点P的对应点并将其添加到集合G中,得到与集合P对应的集合G ;4)根据集合P、集合G计算所述原子模型的旋转四元数q和平移向量t ;
5)根据旋转四元数q计算旋转矩阵R,并根据R、t计算所述原子模型中每一原子坐标转换后的位置,得到所述原子模型与冷冻电镜密度图的匹配结果;6)根据满足要求的匹配结果得到待测蛋白质冷冻电镜密度图的结构。进ー步的,所述符合设定条件的原子为所述原子模型中的高质量原子。进ー步的,计算所述原子模型的旋转四元数q和平移向量t的方法为I)初始化ー表示刚体转换的旋转四元数q[°] = I,一平移向量t[°] = O ;2)循环计算旋转四元数q和平移向量t,直到设定循环次数W ;其中,毎次循环计算的方法为a)PM = q[-i]p[w-i](q[w-i]r+t[w-i] ;pM 为集合 p = {ル…,pJ 中所有四元数 p(x,y,z)构成的矩阵;

b)计算与集合P对应的点集G =G = UUCP ,ル0};CP ,M)表示集合M中与P距尚最近的点;c)根据Horn四元数绝对定向算法计算第w次循环的旋转四元数q[w]和平移向量tM;3)将最终输出的旋转四元数作为所述原子模型的旋转四元数q,对应的平移向量作为所述原子模型的平移向量t。
Xix X进ー步的,采用公式·^ =R* 2 * ノ计算所述原子模型中每一原子坐标转换后
_1 I [I」[I
的位置;其中(X,1,Ζ)为所述原子模型中原子的坐标,ti、t2、t3分别是平移变量t的三个分量,U丨,1' ,Z')为转换后的位置。进ー步的,通过公式Il P-CP(p,M) Il= mm{||尸-ぎ||}计算集合M中距离点p最近的
点g ^^,CP(ρ,Μ)表示M中与P距离最近的点,I p-g I表示点pep与点g e M的欧拉距离。首先简单讲述ー下四元数和绝对定向概念。四元数定义为q = (q0, qx, qy, qz) = q0+qxi+qy j+qzk其中i, j, k类似于复数,满足如下规则i2 = -I, j2 = -I, k2 = -Iij = k, jk = i, ki = jji = _k, kj = -i, ik = -j根据应用需要,四元数还可以表示为ー个实数r和一个向量r = (x,y,z)复合数q = [r, v]可以把三维空间一点p (X,y, ζ)视为无纯量的四元数xi+yj+zk。四元数旋转和旋转矩阵的关系因为OpenGL中的旋转是用旋转矩阵表示的,因此用OpenGL绘制出旋转后的物体需要用到旋转矩阵,根据四元数的性质,可以得到qPq = (QP)q = Qt (QP) = (QtQ)P
其中
权利要求
1.ー种蛋白质冷冻电镜密度图结构检测方法,其步骤为 1)选取原子模型中符合设定条件的原子表示所选原子模型;其中,所选原子记为集合P,将集合P中的姆一点p(x,y,z)对应的四元数用p(x, y, z)表示; 2)选取待测蛋白质冷冻电镜密度图中的关键点并将其添加到集合M中;所述关键点为密度图中某一点的密度值在该点邻域中两个方向均为最大值的点; 3)对于集合P中的姆一点P,计算集合M中距离点P最近的点g作为点P的对应点并将其添加到集合G中,得到与集合P对应的集合G ; 4)根据集合P、集合G计算所述原子模型的旋转四元数q和平移向量t; 5)根据旋转四元数q计算旋转矩阵R,并根据R、t计算所述原子模型中每一原子坐标转换后的位置,得到所述原子模型与冷冻电镜密度图的匹配結果; 6)根据满足要求的匹配结果得到待测蛋白质冷冻电镜密度图的结构。
2.如权利要求I所述的方法,其特征在于所述符合设定条件的原子为所述原子模型中的高质量原子。
3.如权利要求I或2所述的方法,其特征在于计算所述原子模型的旋转四元数q和平移向量t的方法为 1)初始化ー表示刚体转换的旋转四元数q[°]= I,一平移向量tM = O ; 2)循环计算旋转四元数q和平移向量t,直到设定循环次数W;其中,每次循环计算的方法为 a)PM=(q[w-i])*+t[w-i] ;PM 为集合 ρ = {Pi, ...,pJ 中所有四元数 p(x,y,z)构成的矩阵; b)计算与集合P对应的点集G= [}lx{CP(pΜ)};ひ ,ルO表示集合M中与ρ距离最近的点; c)根据Horn四元数绝对定向算法计算第w次循环的旋转四元数q[w]和平移向量t[w]; 3)将最终输出的旋转四元数作为所述原子模型的旋转四元数q,对应的平移向量作为所述原子模型的平移向量t。
4.如权利要求3所述的方法,其特征在于采用公
5.如权利要求I所述的方法,其特征在于通过公式IlP-CP(PM) Il= mm{|| ρ -g ||}计算集合M中距离点ρ最近的点g(ρ,Μ)表示M中与ρ距离最近的点,I p-g I表示点P e P与点g e M的欧拉距离。
全文摘要
本发明公开了一种蛋白质冷冻电镜密度图结构检测方法,属于生物信息学领域。本方法为1)选取原子模型中符合条件的原子表示所选原子模型;2)选取待测蛋白质冷冻电镜密度图中的关键点并将其添加到集合M中;3)对于集合P中的每一点p,计算集合M中距离点p最近的点g作为点p的对应点并将其添加到集合G中;4)根据集合P、G计算原子模型的旋转四元数q和平移向量t;5)根据旋转四元数q计算旋转矩阵R,并根据R、t计算原子模型中每一原子坐标转换后的位置,得到原子模型与密度图的匹配结果;6)根据满足要求的匹配结果得到待测蛋白质冷冻电镜密度图的结构。本发明鲁棒性好,模型数据不必与密度数据重合,计算量小、易于编程实现。
文档编号G06F19/16GK102682223SQ20111034250
公开日2012年9月19日 申请日期2011年11月2日 优先权日2010年11月30日
发明者刘俊, 单桂华, 田东, 谢茂金, 迟学斌 申请人:中国科学院计算机网络信息中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1