蛋白质溶解度预测方法、计算机设备及计算机存储介质与流程

文档序号:36937623发布日期:2024-02-02 22:05阅读:35来源:国知局
蛋白质溶解度预测方法、计算机设备及计算机存储介质与流程

本申请实施例涉及生物信息,具体涉及一种蛋白质溶解度预测方法、计算机设备及计算机存储介质。


背景技术:

1、蛋白质溶解度是指在特定的条件下(如温度、ph值等),蛋白质在水或其他溶剂中的溶解程度。在合成生物学研究和应用中,准确预测蛋白质的溶解度至关重要,因为它直接影响着蛋白质的稳定性和活性。

2、现有的蛋白质溶解度预测方法可分为两大类:一是基于手工特征的方法,其特征的设计需要人工干预,难以全面准确地反映蛋白质的性质,因此导致了溶解度预测的准确率较低。此外,特征提取的过程相当繁琐,难以进行批量处理。

3、另一类是仅利用蛋白质的序列信息来进行溶解度预测,但是,除了蛋白质的序列信息会影响蛋白质溶解度,蛋白质的其他特性同样也会影响蛋白质的溶解度,因而此方式忽略了其他影响因素,导致预测精度较低。


技术实现思路

1、本申请实施例提供了一种蛋白质溶解度预测方法、计算机设备及计算机存储介质,用于提升蛋白质溶解度预测的准确性,提升蛋白质溶解度的预测精度。

2、本申请实施例第一方面提供了一种蛋白质溶解度预测方法,所述方法包括:

3、获取多组训练样本,每组所述训练样本包括蛋白质样本及所述蛋白质样本的真实溶解度;

4、获取初始预测模型,将所述多组训练样本输入至所述初始预测模型以对所述初始预测模型进行模型训练,所述模型训练包括:

5、利用所述初始预测模型针对每组所述训练样本提取所述蛋白质样本的结构的嵌入表示以及提取所述蛋白质样本的序列的嵌入表示;

6、基于所述结构的嵌入表示与所述序列的嵌入表示计算所述蛋白质样本的预测溶解度;

7、当所述蛋白质样本的预测溶解度与所述真实溶解度之间的关系满足收敛条件时停止训练,以得到目标预测模型;所述目标预测模型用于对目标蛋白质样本预测其溶解度。

8、本申请实施例第二方面提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前述第一方面的方法。

9、本申请实施例第三方面提供了一种计算机存储介质,计算机存储介质中存储有指令,该指令在计算机上执行时,使得计算机执行前述第一方面的方法。

10、从以上技术方案可以看出,本申请实施例具有以下优点:

11、目标预测模型在对目标蛋白质样本预测溶解度时,可以提取目标蛋白质样本的结构特征和序列特征并基于其结构特征和序列特征预测蛋白质样本的溶解度,由于综合蛋白质的多种特性预测其溶解度,因而更全面地考虑到蛋白质溶解度的多种影响因素,使得蛋白质溶解度的预测更加准确,预测精度更高。



技术特征:

1.一种蛋白质溶解度预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始预测模型包括蛋白质语言模型和图神经网络;

3.根据权利要求2所述的方法,其特征在于,所述对所述残基接触图进行离散化处理,包括:

4.根据权利要求2所述的方法,其特征在于,所述利用所述图神经网络对所述残基关系图与所述节点特征矩阵提取所述蛋白质样本的结构的嵌入表示,包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述初始预测模型包括蛋白质语言模型和多层感知机;

6.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述结构的嵌入表示与所述序列的嵌入表示计算所述蛋白质样本的预测溶解度,包括:

7.根据权利要求1所述的方法,其特征在于,所述将所述多组训练样本输入至所述初始预测模型以对所述初始预测模型进行模型训练,包括:

8.根据权利要求1至7任一项所述的方法,其特征在于,每组所述训练样本中蛋白质样本的真实溶解度为预设数值范围内的连续值;或者,所述真实溶解度为多个离散值中的任意一个数值。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的方法。

10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至8中任一项所述的方法。


技术总结
本申请实施例公开了一种蛋白质溶解度预测方法、计算机设备及计算机存储介质。将多组训练样本输入至初始预测模型,利用初始预测模型针对每组训练样本提取蛋白质样本的结构的嵌入表示与序列的嵌入表示,基于结构的嵌入表示与序列的嵌入表示计算蛋白质样本的预测溶解度,当预测溶解度与真实溶解度之间的关系满足收敛条件时停止训练,以得到目标预测模型。目标预测模型在对目标蛋白质样本预测溶解度时,可以提取目标蛋白质样本的结构特征和序列特征并基于其结构特征和序列特征预测蛋白质样本的溶解度,由于综合蛋白质的多种特性预测其溶解度,因而更全面地考虑到蛋白质溶解度的多种影响因素,使得蛋白质溶解度的预测更加准确,预测精度更高。

技术研发人员:刘家瀚,张慧锋,李加忠,董一英,于铁妹,潘俊锋,刘建
受保护的技术使用者:深圳瑞德林生物技术有限公司
技术研发日:
技术公布日:2024/2/1
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1