一种获取第一源抗体序列对应的第二源蛋白质序列的方法与设备与流程

文档序号:35678340发布日期:2023-10-08 11:31阅读:28来源:国知局
一种获取第一源抗体序列对应的第二源蛋白质序列的方法与设备与流程

本申请涉及生物信息,尤其涉及一种获取第一源抗体序列对应的第二源蛋白质序列的技术。


背景技术:

1、抗体(也称为免疫球蛋白)在人体免疫反应中发挥着重要作用,可以广泛应用于疾病的诊断和治疗。通常,每条抗体包含两条相同的重链和两条相同的轻链,它们之间由二硫键相连。每条重链和轻链都包含三个高可变区(也称为互补决定区,complementaritydetermining region,cdr)。重链和轻链的三个高变区共同形成抗体结合表位。

2、抗体人源化旨在将非人源的抗体通过序列改造降低其免疫原性,同时尽可能地保留其与抗原结合的特异性和亲和力。其是将非人源的抗体开发为可用于人的抗体药的必要步骤。目前行业中较成熟的、应用较多的抗体人源化方法是cdr移植。其通过找到一条合适的人源抗体作为受体(receptor),将人源抗体的cdr区替换为非人源抗体的来进行抗体人源化。通过该方法得到的新抗体的抗原亲和性相比原先的非人源抗体会显著下降。为了恢复其抗原亲和性,还需要对该新抗体进行回复突变,往往需要消耗大量人力物力及时间。学术界中也在研究基于计算方法来进行抗体人源化,例如,基于人源性打分的抗体人源化方法、基于能量计算的抗体人源化方法。该基于人源性打分的抗体人源化方法只考虑了抗体的人源性,而忽视了抗原亲和性。该基于能量计算的抗体人源化方法虽然同时考虑了抗体的人源性和抗原亲和性,但是其能量计算算法仍较为耗时,并且其有效性和能量计算算法的正确性高度相关。


技术实现思路

1、本申请的一个目的是提供一种获取第一源抗体序列对应的第二源蛋白质序列的方法与设备。

2、根据本申请的一个方面,提供了一种获取第一源抗体序列对应的第二源蛋白质序列的方法,该方法包括:

3、基于蛋白质序列集合,构建所述蛋白质序列集合对应的蛋白质子序列搜索池,其中,所述蛋白质序列集合包括多个蛋白质序列,所述蛋白质子序列搜索池包括多个蛋白质子序列以及每个蛋白质子序列对应的第一表征信息,所述多个蛋白质序列中每个蛋白质序列对应所述多个蛋白质子序列中至少一个蛋白质子序列;

4、确定第一源抗体序列对应的第二表征信息,其中,所述第二表征信息包括所述第一源抗体序列中每个氨基酸对应的第一氨基酸表征信息;

5、基于所述第二表征信息,从所述蛋白质子序列搜索池确定多个候选蛋白质子序列;

6、基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的第二源蛋白质序列。

7、根据本申请的一个方面,提供了一种获取第一源抗体序列对应的第二源蛋白质序列的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如上所述任一方法的步骤。

8、根据本申请的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上所述任一方法的步骤。

9、根据本申请的一个方面,提供了一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如上所述任一方法的步骤。

10、根据本申请的一个方面,提供了一种获取第一源抗体序列对应的第二源蛋白质序列的设备,该设备包括:

11、一一模块,用于基于蛋白质序列集合,构建所述蛋白质序列集合对应的蛋白质子序列搜索池,其中,所述蛋白质序列集合包括多个蛋白质序列,所述蛋白质子序列搜索池包括多个蛋白质子序列以及每个蛋白质子序列对应的第一表征信息,所述多个蛋白质序列中每个蛋白质序列对应所述多个蛋白质子序列中至少一个蛋白质子序列;

12、一二模块,用于确定第一源抗体序列对应的第二表征信息,其中,所述第二表征信息包括所述第一源抗体序列中每个氨基酸对应的第一氨基酸表征信息;

13、一三模块,用于基于所述第二表征信息,从所述蛋白质子序列搜索池确定多个候选蛋白质子序列;

14、一四模块,用于基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的第二源蛋白质序列。

15、与现有技术相比,本申请基于蛋白质序列集合,构建所述蛋白质序列集合对应的蛋白质子序列搜索池,其中,所述蛋白质序列集合包括多个蛋白质序列,所述蛋白质子序列搜索池包括多个蛋白质子序列以及每个蛋白质子序列对应的第一表征信息,所述多个蛋白质序列中每个蛋白质序列对应所述多个蛋白质子序列中至少一个蛋白质子序列;确定第一源抗体序列对应的第二表征信息,其中,所述第二表征信息包括所述第一源抗体序列中每个氨基酸对应的第一氨基酸表征信息;基于所述第二表征信息,从所述蛋白质子序列搜索池确定多个候选蛋白质子序列;基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的第二源蛋白质序列。本申请从第一源抗体序列中每个氨基酸的理化功能出发,解析第一源抗体序列中各氨基酸的理化特性及功能,确定相匹配的第二源蛋白质序列,从而在保证抗原亲和性的基础上,有效降低获得的第二源蛋白质序列的免疫原性。同时,本方案还可以确定第二源蛋白质序列中各氨基酸位点对应的候选氨基酸,以便于后续进行回复突变,提高回复突变效率。



技术特征:

1.一种获取第一源抗体序列对应的第二源蛋白质序列的方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述方法还包括:

3.根据权利要求2所述的方法,其中,所述基于所述多个候选蛋白质序列,构建蛋白质序列集合包括:

4.根据权利要求3所述的方法,其中,在所述基于所述多个候选蛋白质序列,构建蛋白质序列集合之前,所述方法还包括:

5.根据权利要求1所述的方法,其中,所述基于蛋白质序列集合,构建所述蛋白质序列集合对应的蛋白质子序列搜索池,其中,所述蛋白质序列集合包括多个蛋白质序列,所述蛋白质子序列搜索池包括多个蛋白质子序列以及每个蛋白质子序列对应的第一表征信息,所述多个蛋白质序列中每个蛋白质序列对应所述多个蛋白质子序列中至少一个蛋白质子序列包括:

6.根据权利要求5所述的方法,其中,所述基于所述蛋白质序列集合以及所述蛋白质序列集合中每个蛋白质序列对应的第三表征信息,确定蛋白质子序列搜索池,其中,所述蛋白质子序列搜索池包括多个蛋白质子序列以及每个蛋白质子序列对应的第一表征信息,所述多个蛋白质序列中每个蛋白质序列对应所述多个蛋白质子序列中至少一个蛋白质子序列,所述第一表征信息基于该蛋白质子序列对应的蛋白质序列的第三表征信息确定包括:

7.根据权利要求1所述的方法,其中,所述确定第一源抗体序列对应的第二表征信息,其中,所述第二表征信息包括所述第一源抗体序列中每个氨基酸对应的第一氨基酸表征信息还包括:

8.根据权利要求7所述的方法,其中,所述基于所述第二表征信息,从所述蛋白质子序列搜索池确定多个候选蛋白质子序列包括:

9.根据权利要求1所述的方法,其中,所述基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的第二源蛋白质序列包括:

10.根据权利要求9所述的方法,其中,所述基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的多个氨基酸位点中每个氨基酸位点对应的一个或多个氨基酸信息包括:

11.根据权利要求9所述的方法,其中,所述基于所述多个氨基酸位点中每个氨基酸位点对应的一个或多个氨基酸信息,确定所述第一源抗体序列对应的第二源蛋白质序列包括:

12.根据权利要求11所述的方法,其中,所述基于所述多个氨基酸位点中每个氨基酸位点对应的一个或多个氨基酸信息,确定所述第一源抗体序列对应的第二源蛋白质序列还包括:

13.一种获取第一源抗体序列对应的第二源蛋白质序列的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1至12中任一项所述方法的步骤。

14.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至12中任一项所述方法的步骤。


技术总结
本申请的目的是提供一种获取第一源抗体序列对应的第二源蛋白质序列的方法与设备,该方法包括:基于蛋白质序列集合,构建所述蛋白质序列集合对应的蛋白质子序列搜索池;确定第一源抗体序列对应的第二表征信息;基于所述第二表征信息,从所述蛋白质子序列搜索池确定多个候选蛋白质子序列;基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的第二源蛋白质序列。本申请从第一源抗体序列中氨基酸的理化功能出发,确定相匹配的第二源蛋白质序列,从而在保证抗原亲和性的基础上,有效降低获得的第二源蛋白质序列的免疫原性。本申请还可以确定第二源蛋白质序列中各氨基酸位点对应的候选氨基酸,以便于后续进行回复突变,提高回复突变效率。

技术研发人员:邹鸿刚,许锦波
受保护的技术使用者:北京分子之心科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1