多聚谷氨酰胺致病机理的分析方法

文档序号:6493749阅读:368来源:国知局
多聚谷氨酰胺致病机理的分析方法
【专利摘要】本发明涉及一种多聚谷氨酰胺致病机理的分析方法,包括以下步骤,S1、选择蛋白质模型:二维整点HP模型;S2、确定能量函数;S3、搜索自由能最小的蛋白质二维构型:采用对等模式的MPI并行算法搜索能量最小的蛋白质所对应的二维结构的步骤为,本发明提供的多聚谷氨酰胺致病机理的分析方法与现有技术相比,采用在多聚谷氨酰胺蛋白质构型群体中,构型个体的温度由该个体次序所决定,通过将较高的温度分配给较差的个体,使之更有可能向较好的个体变动;同时,使用降温因子加速收敛速度,采用并行方式可加快收敛速度。
【专利说明】多聚谷氨酰胺致病机理的分析方法
【【技术领域】】
[0001]本发明涉及生物信息学,特别涉及一种基于并行群体模拟退火算法的多聚谷氨酰胺致病机理的分析方法。
【【背景技术】】
[0002]多聚谷氨酰胺(polyQ)疾病是三核苷酸CAG基因异常重复扩增导致多聚谷氨酰胺蛋白的神经系统功能障碍疾病。多聚谷氨酰胺疾病有九种,且致病蛋白质以及相应的基因各不相同,但其共同特征是患者的大脑细胞中形成不可溶的蛋白质聚集体、具有共同的多聚谷氨酰胺(PolyQ)片段。
[0003]多聚谷氨酰胺蛋白质如何误折叠和聚集,进而导致疾病还有待研究。与其他多数神经退行性疾病(例如,老年痴呆证)相似,多聚谷氨酰胺疾病与多聚谷氨酰胺蛋白的误折叠有关。多聚谷氨酰胺蛋白长度达到35-40氨基酸时,就容易产生这种疾病,而且多聚谷氨酰胺蛋白长度越长疾病就越严重。蛋白质折叠研究有助于蛋白质分子药物的设计,因此,蛋白质折叠研究对探索多聚谷氨酰胺疾病的致病机理以及对多聚谷氨酰胺疾病的预防和治疗将起重大的帮助作用。
[0004]近年,生物物理学家提出了几种简化的蛋白质折叠研究的数学模型。其中国际上研究最广泛的模型是二维整点HP模型,该模型中蛋白质链由两种类型的氨基酸的序列构成,分别是亲水氨基酸(用P表示)和疏水氨基酸(用H表示),将每个氨基酸想象成一个节点,P用白球表示,H用黑球表示。
[0005]一个合法的蛋白质链空间构型必须满足以下三个条件:①序列中每个节点必须放在二维空间整数坐标上。②序列中每个节点相对其前驱节点(对多肽链的氨基酸序列编号后的前一个编号)除可以向前延伸一个单位距离外还能向左或向右延伸一个单位距离。③二维空间上的每个整数格点上最多只能放一个节点,即不允许蛋白质链自重叠。
[0006]对于每个合法构型都有其能量,每一对在蛋白质链中非直接相连而在二维空间里相邻(即距离为I)的疏水氨基酸H间的能量为-1 (称其为H-H键),其他情况能量都为O。计算构型中所有非直接相连而相邻的H-H键的能量之和即是整个构型的能量。上述蛋白质结构模型氨基酸的亲水和疏水作用力,以最小能量作为优化指标,得出的蛋白质空间构型表现出疏水氨基酸H趋于构形内部,而亲水氨基酸P则分布在构型的外层,且该模型已被证实对预测蛋白质螺旋结构有极高的可信度。
[0007]虽然HP模型是最简单的简化模型,但求解基于该模型的蛋白质折叠问题依然困难,该问题已被证明是NP难度问题,这意味着不存在既完整又不是太慢的求解算法。

【发明内容】

[0008]本发明要解决的技术问题在于现有技术中多聚谷氨酰胺致病机理的分析收敛速度慢的问题。
[0009]为此,本发明提供一种多聚谷氨酰胺致病机理的分析方法,包括以下步骤,[0010]S1、选择蛋白质模型:二维整点HP模型;
[0011]S2、确定能量函数:
[0012]
【权利要求】
1.一种多聚谷氨酰胺致病机理的分析方法,其特征在于,包括以下步骤, 51、选择蛋白质模型:二维整点HP模型; 52、确定能量函数:
2.根据权利要求1所述的分析方法,其特征在于,所述二维整点HP模型具体为, 蛋白质链由两种类型的氨基酸的序列构成,分别是亲水氨基酸用P表示和疏水氨基酸用H表不,将每个氨基酸定义为一个节点,P用白球表不,H用黑球表不。
3.根据权利要求1所述的分析方法,其特征在于,所述步骤S2还包括根据蛋白质折叠过程中的HP模型的构型变动集。
4.根据权利要求1所述的分析方法,其特征在于,所述初始化记录器包括MCS步数记录器t = O,迭代步数记录器k = 0.。
5.根据权利要求1所述的分析方法,其特征在于,所述步骤S32具体为, 所有进程相互通信,根据每个个体i的能量函数决定个体的次序值其中ri可为I到N的整数值。并根据下式确定每个个体的温度:
6.根据权利要求1所述的分析方法,其特征在于,所述步骤S32具体为, 在每个进程中,对原来的二维构型利用构型变动集进行随机变动,构建新的构型,并计算新的能量函数Enew,同时根据Metropolis准则确定新构型被接受(即替换原来的构型)的概率:
7.根据权利要求1所述的分析方法,其特征在于,所述步骤S34中所述重复步骤次数为100次;并对迭代步数k赋值,k = k+1,当迭代步数k超过阈值,所述阈值为20,即kmax =20,停止计算。
8.根据权利要求7所述的分析方法,其特征在于,所述降温因子β取值为0.9。
【文档编号】G06F19/10GK103902847SQ201210576343
【公开日】2014年7月2日 申请日期:2012年12月26日 优先权日:2012年12月26日
【发明者】彭丰斌, 魏彦杰, 张慧玲 申请人:中国科学院深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1