感测蛋白质-蛋白质相互作用的制作方法

文档序号:36405800发布日期:2023-12-16 12:57阅读:27来源:国知局
感测蛋白质-蛋白质相互作用的制作方法

本文件描述了使用传感器数据来表征蛋白质-蛋白质结合的技术。


背景技术:

1、蛋白质-蛋白质相互作用(ppi)是由于包括静电力、氢键合和疏水效应的相互作用而在两个或更多个蛋白质分子之间建立的高特异性的物理接触。许多是在特定生物分子环境下发生在细胞或活生物体中的与链之间的分子缔合的物理接触。蛋白质很少单独起作用,因为它们的功能往往受到调节。细胞内的许多分子过程是由分子机器进行的,所述分子机器是由其ppi组织的大量蛋白质组分构建的。

2、在免疫学中,抗原(ag)是可以被抗原特异性抗体或b细胞抗原受体结合的分子或分子结构,诸如可以存在于病原体的外部。体内抗原的存在通常会引发免疫反应。


技术实现思路

1、在本文件中描述了表征蛋白质-蛋白质相互作用的技术。例如,当开发用于临床或生物用途的分子(例如,药物开发)时,可以利用该技术提供理解抗体如何与抗原相互作用。可以进行蛋白质复合物的cryo-em成像,并且可以用计算机系统处理来自所述成像的数据以选择描述两种蛋白质的相对位置、取向和结合的对接模型。

2、具有一个或多个计算机的系统可以被配置为借助于具有安装在系统上的软件、固件、硬件或它们的组合来执行特定的操作或动作,所述软件、固件、硬件或它们的组合在操作中使系统执行所述动作。一个或多个计算机程序可以被配置为通过包括指令来执行特定操作或动作,所述指令在由数据处理设备执行时使所述设备执行所述动作。一个一般方面包括一种用于感测蛋白质-蛋白质复合物相互作用的方法,所述方法可以包括:访问包括蛋白质-蛋白质复合物的样品的多个复合物图像的合成图像,所述蛋白质-蛋白质复合物包含第一蛋白质和第二蛋白质。所述方法还包括获取第一蛋白质的第一三维(3d)形状和第二蛋白质的第二3d形状。所述方法还包括获取多个对接模型,每个对接模型定义候选姿态对。所述方法还包括针对每个对接模型,应用第一3d形状、第二3d形状和候选姿态对,以针对所述对接模型生成描述姿态对与对接模型之间的拟合优度的对应拟合度得分。所述方法还包括基于拟合度得分选择对接模型中的一个作为蛋白质-蛋白质复合物的感测模型。该方面的其他实施方案包括对应的计算机系统、设备和记录在一个或多个计算机存储装置上的计算机程序,每个计算机存储装置被配置为执行所述方法的动作。

3、实现方式可以包括以下特征中的一个或多个。所述方法可以包括生成多个复合物图像。生成合成图像可以包括从复合物图像中提取蛋白质-蛋白质复合物的子图像;以及对子图像进行定向和分类。复合物图像是低温电子显微镜(cryoem)图像。每个复合物图像可以包括多个像素,每个像素具有地址并保持用于表示蛋白质-蛋白质复合物的样品的对应部分的颜色值。合成图像可以包括多个像素,每个像素具有地址并且保持颜色值,所述颜色值是在多个复合物图像中的每一个中具有相同地址的像素的颜色值的聚合。合成图像的掩蔽是在没有特定用户输入的情况下执行的。合成图像的掩蔽可以包括接收指定未经掩蔽部分的第一用户输入。接收指定未经掩蔽部分的第一用户输入可以包括:通过连接由第一用户输入指定的位置来生成边界框;以及将合成图像的在边界框内的部分记录为未经掩蔽部分。第一3d形状被索引化为第一蛋白质,并且第二3d形状被索引化为第二蛋白质。第一3d形状被索引化为第一蛋白质的第一同源物。第二3d形状被索引化为第二蛋白质的第二同源物。候选姿态对包括候选位置、候选取向和候选对接区域。拟合度得分是合成图像与通过将对接模型投射到2d空间上而生成的图像之间的互相关得分。基于拟合度得分选择对接模型中的一个作为蛋白质-蛋白质复合物的感测模型可以包括:通过组中的一个基于其对应的拟合度得分来标识对接模型的子集可以包括:i)选择具有n个最高拟合度得分的对接模型;以及ii)选择具有高于阈值m的拟合度得分的所有对接模型。选择对接模型中的一个作为蛋白质-蛋白质复合物的感测模型可以包括接收选择对接模型的子集中的一个作为感测模型的第二用户输入。所描述的技术的实现方式可以包括硬件、方法或过程、或计算机可访问介质上的计算机软件。

4、实现方式可以包括以下优点中的任一个、全部或不包括以下优点。该技术可以有利地使用更容易获得的cryo-em成像结果。例如,其他技术可能需要蛋白质复合物粒子的来自各种角度的cryo-em图像。与这些技术不同,本文件描述了可以从较少角度处理粒子图像的技术。这是特别有益的,因为一些蛋白质复合物倾向于在用于cryo-em的样品制备期间获得特定的空间取向。这有时被称为优选取向挑战。其他技术可能需要大量的实验来找到克服针对特定蛋白质复合物的该挑战的方法,并且可能仍然失败。而该技术可以一起避免所述挑战。这可能导致可以在几小时或几天的量级上完成的过程,其中一些其他过程需要几周或几个月的时间来完成。在极端情况下,该技术可能是唯一的手段,因为与其他技术不同,如果在cryo-em成像期间获得蛋白质粒子图像,它每次都有效。此外,该技术可以被有利地配置为在非常快速并且需要很少时间的过程中结合人类用户领域专业知识。然而,该技术还可以有利地被配置为在各个阶段在没有任何特定的人工输入的情况下进行,从而允许较少的人工时间和注意力来完成该过程。

5、根据所附描述和附图,其他特征、方面和潜在优势将变得清楚。



技术特征:

1.一种用于对蛋白质-蛋白质复合物相互作用进行感测的方法,所述方法包括:

2.根据权利要求1所述的方法,所述方法进一步包括生成所述多个复合物图像。

3.根据权利要求2所述的方法,所述方法进一步包括从所述多个复合物图像生成所述合成图像,其中,生成所述合成图像包括从所述复合物图像中提取所述蛋白质-蛋白质复合物的子图像;以及对所述子图像进行定向和分类。

4.根据权利要求1-3之一所述的方法,其中,所述复合物图像是低温电子显微镜(cryo-em)图像。

5.根据权利要求1所述的方法,其中,每个复合物图像包括多个像素,每个像素具有地址并保持用于表示所述蛋白质-蛋白质复合物的样品的对应部分的颜色值。

6.根据权利要求1-3之一所述的方法,其中,所述合成图像包括多个像素,每个像素具有地址并且保持颜色值,所述颜色值是在所述多个复合物图像中的每一个中具有相同地址的像素的颜色值的聚合。

7.根据权利要求1-3之一所述的方法,其中,所述合成图像是在没有特定用户输入的情况下被掩蔽的。

8.根据权利要求1所述的方法,其中,所述合成图像被掩蔽,所述掩蔽包括接收指定所述未经掩蔽部分的第一用户输入。

9.根据权利要求8所述的方法,其中,接收指定所述未经掩蔽部分的所述第一用户输入包括:

10.根据权利要求1-3之一所述的方法,其中,所述第一3d形状被索引化为所述第一蛋白质,并且所述第二3d形状被索引化为所述第二蛋白质。

11.根据权利要求1所述的方法,其中,所述第一3d形状被索引化为所述第一蛋白质的第一同源物。

12.根据权利要求11所述的方法,其中,所述第二3d形状被索引化为所述第二蛋白质的第二同源物。

13.根据权利要求1-3之一所述的方法,其中,所述候选姿态对包括候选位置、候选取向和候选对接区域。

14.根据权利要求1-3之一所述的方法,其中,所述拟合度得分是通过将对接模型投射到2d图像上而生成的互相关得分。

15.根据权利要求1所述的方法,其中,基于所述拟合度得分选择所述对接模型中的一个作为所述蛋白质-蛋白质复合物的感测模型包括:

16.根据权利要求15所述的方法,其中,选择所述对接模型中的一个作为所述蛋白质-蛋白质复合物的感测模型包括接收选择所述对接模型的子集中的一个作为所述感测模型的第二用户输入。

17.一种用于对蛋白质-蛋白质复合物相互作用进行感测的系统,所述系统包括:

18.根据权利要求17所述的系统,所述操作进一步包括生成所述多个复合物图像。

19.根据权利要求18所述的系统,所述操作进一步包括从所述多个复合物图像生成所述合成图像,其中,生成所述合成图像包括从所述复合物图像中提取所述蛋白质-蛋白质复合物的子图像;以及对所述子图像进行定向和分类。

20.根据权利要求17-19之一所述的系统,其中,所述复合物图像是低温电子显微镜(cryo-em)图像。

21.根据权利要求17所述的系统,其中,每个复合物图像包括多个像素,每个像素具有地址并保持用于表示所述蛋白质-蛋白质复合物的样品的对应部分的颜色值。

22.根据权利要求21所述的系统,其中,所述合成图像包括多个像素,每个像素具有地址并且保持颜色值,所述颜色值是在所述多个复合物图像中的每一个中具有相同地址的像素的颜色值的聚合。

23.根据权利要求17-19之一所述的系统,其中,所述合成图像是在没有特定用户输入的情况下被掩蔽的。

24.根据权利要求17所述的系统,其中,所述合成图像被掩蔽,所述掩蔽包括接收指定所述未经掩蔽部分的第一用户输入。

25.根据权利要求24所述的系统,其中,接收指定所述未经掩蔽部分的所述第一用户输入包括:

26.根据权利要求17-19之一所述的系统,其中,所述第一3d形状被索引化为所述第一蛋白质,并且所述第二3d形状被索引化为所述第二蛋白质。

27.根据权利要求17-19之一所述的系统,其中,所述第一3d形状被索引化为所述第一蛋白质的第一同源物。

28.根据权利要求17-19之一所述的系统,其中,所述第二3d形状被索引化为所述第二蛋白质的第二同源物。

29.根据权利要求17-19之一所述的系统,其中,所述候选姿态对包括候选位置、候选取向和候选对接区域。

30.根据权利要求17-19之一所述的系统,其中,所述拟合度得分是通过将对接模型投射到2d图像上而生成的互相关得分。

31.根据权利要求17所述的系统,其中,基于所述拟合度得分选择所述对接模型中的一个作为所述蛋白质-蛋白质复合物的感测模型包括:

32.根据权利要求31所述的系统,其中,选择所述对接模型中的一个作为所述蛋白质-蛋白质复合物的感测模型包括接收选择所述对接模型的子集中的一个作为所述感测模型的第二用户输入。


技术总结
获取合成图像,所述合成图像包括包含第一蛋白质和第二蛋白质的蛋白质‑蛋白质复合物的样品的多个复合物图像。对所述合成图像进行掩蔽以生成经掩蔽部分和未经掩蔽部分。获取所述第一蛋白质的第一三维(3d)形状和所述第二蛋白质的第二3d形状。获取各自定义候选姿态对的多个对接模型。对于每个对接模型,应用所述第一3d形状、所述第二3d形状和所述候选姿态对,以针对所述对接模型生成描述所述姿态对与所述对接模型之间的拟合优度的对应拟合度得分。基于所述拟合度得分选择所述对接模型中的一个作为所述蛋白质‑蛋白质复合物的感测模型。

技术研发人员:邱宇,周艳峰,Y·伊奥佐
受保护的技术使用者:赛诺菲
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1