蛋白质序列生成模型的训练方法、装置及电子设备与流程

文档序号:36326258发布日期:2023-12-09 15:14阅读:49来源:国知局
蛋白质序列生成模型的训练方法与流程

本申请涉及人工智能领域,尤其涉及自然语言处理、深度学习等,具体涉及蛋白质序列生成模型的训练方法、装置及电子设备。


背景技术:

1、在蛋白质设计领域,针对不同的任务需求或场景,通常需要设计不同的结构模型,利用相应的结构模型,得到蛋白质序列。


技术实现思路

1、本申请提供了一种蛋白质序列生成模型的训练方法、装置及电子设备。具体方案如下:

2、根据本申请的一方面,提供了一种蛋白质序列生成模型的训练方法,包括:

3、获取目标场景对应的第一训练样本;

4、将第一训练样本输入到生成式大语言模型,以获取生成式大语言模型生成的目标蛋白质序列;

5、根据目标蛋白质序列与第一训练样本对应的参考蛋白质序列之间的差异,对生成式大语言模型进行第一训练,得到目标场景的蛋白质序列生成模型。

6、根据本申请的另一方面,提供了一种蛋白质序列生成方法,包括:

7、获取目标场景对应的模型输入数据;

8、将模型输入数据输入到目标场景的蛋白质序列生成模型,以获取蛋白质序列生成模型生成的目标蛋白质序列,其中,蛋白质序列生成模型是采用上述一方面实施例的方法训练得到。

9、根据本申请的另一方面,提供了一种蛋白质序列生成模型的训练装置,包括:

10、第一获取模块,用于获取目标场景对应的第一训练样本;

11、第二获取模块,用于将第一训练样本输入到生成式大语言模型,以获取生成式大语言模型生成的目标蛋白质序列;

12、第一训练模块,用于根据目标蛋白质序列与第一训练样本对应的参考蛋白质序列之间的差异,对生成式大语言模型进行第一训练,得到目标场景的蛋白质序列生成模型。

13、根据本申请的另一方面,提供了一种蛋白质序列生成装置,包括:

14、第一获取模块,用于获取目标场景对应的模型输入数据;

15、第二获取模块,用于将模型输入数据输入到目标场景的蛋白质序列生成模型,以获取蛋白质序列生成模型生成的目标蛋白质序列,其中,蛋白质序列生成模型是采用如上述另一方面实施例的装置训练得到。

16、根据本申请的另一方面,提供了一种电子设备,包括:

17、至少一个处理器;以及

18、与所述至少一个处理器通信连接的存储器;其中,

19、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述一方面实施例所述的方法,或者能够执行上述另一方面实施例所述的方法。

20、根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述一方面实施例所述的方法,或者执行根据上述另一方面实施例所述的方法。

21、根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述一方面实施例所述方法的步骤,或者实现上述另一方面实施例所述方法的步骤。

22、应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种蛋白质序列生成模型的训练方法,包括:

2.如权利要求1所述的方法,其中,所述根据所述目标蛋白质序列与所述第一训练样本对应的参考蛋白质序列之间的差异,对所述生成式大语言模型进行第一训练,得到所述目标场景的蛋白质序列生成模型,包括:

3.如权利要求2所述的方法,其中,所述根据所述目标蛋白质序列中每个位置上的氨基酸符号与所述参考蛋白质序列中相同位置上的真实氨基酸符号之间的差异,确定模型损失,包括:

4.如权利要求1所述的方法,其中,所述根据所述目标蛋白质序列与所述第一训练样本对应的参考蛋白质序列之间的差异,对所述生成式大语言模型进行第一训练,得到所述目标场景的蛋白质序列生成模型,包括:

5.如权利要求1所述的方法,其中,所述获取目标场景对应的第一训练样本,包括:

6.如权利要求1所述的方法,其中,所述获取目标场景对应的第一训练样本,包括:

7.如权利要求1所述的方法,其中,所述获取目标场景对应的第一训练样本,包括:

8.如权利要求1所述的方法,其中,所述获取目标场景对应的第一训练样本,包括:

9.如权利要求8所述的方法,其中,所述根据所述第一文本信息,获取所述第一训练样本,包括:

10.如权利要求1-9中任一项所述的方法,其中,所述将所述第一训练样本输入到生成式大语言模型,以获取所述生成式大语言模型生成的目标蛋白质序列,包括:

11.如权利要求1-9中任一项所述的方法,其中,所述生成式大语言模型是通过以下步骤训练得到的:

12.一种蛋白质序列生成方法,包括:

13.如权利要求12所述的方法,其中,还包括:

14.如权利要求13所述的方法,其中,所述获取提示模板,包括:

15.一种蛋白质序列生成模型的训练装置,包括:

16.如权利要求15所述的装置,其中,所述第一训练模块,用于:

17.如权利要求16所述的装置,其中,所述第一训练模块,用于:

18.如权利要求15所述的装置,其中,所述第一训练模块,用于:

19.如权利要求15所述的装置,其中,所述第一获取模块,用于:

20.如权利要求15所述的装置,其中,所述第一获取模块,用于:

21.如权利要求15所述的装置,其中,所述第一获取模块,用于:

22.如权利要求15所述的装置,其中,所述第一获取模块,用于:

23.如权利要求22所述的装置,其中,所述第一获取模块,用于:

24.如权利要求15-23中任一项所述的装置,其中,所述第二获取模块,用于:

25.如权利要求15-23中任一项所述的装置,还包括:

26.一种蛋白质序列生成装置,包括:

27.如权利要求26所述的装置,还包括:

28.如权利要求27所述的装置,其中,所述第三获取模块,用于:

29.一种电子设备,包括:

30.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法,或者执行根据权利要求12-14中任一项所述的方法。


技术总结
本申请公开了蛋白质序列生成模型的训练方法、装置及电子设备,涉及人工智能领域,尤其涉及自然语言处理、深度学习等。具体实现方案为:获取目标场景对应的第一训练样本;将第一训练样本输入到生成式大语言模型,以获取生成式大语言模型生成的目标蛋白质序列;根据目标蛋白质序列与第一训练样本对应的参考蛋白质序列之间的差异,对生成式大语言模型进行第一训练,得到目标场景的蛋白质序列生成模型。由此,通过根据不同场景的训练样本对生成式大语言模型进行微调,可以得到不同场景的蛋白质序列生成模型,从而将不同场景的蛋白质设计统一在生成式大语言模型下,无需针对不同的场景设计不同的结构模型,适用性比较强。

技术研发人员:陈致远,薛洋,方晓敏,张肖男,何径舟
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1