用于生物分子鉴定及表征的方法和仪器的制作方法

文档序号:80737阅读:514来源:国知局
专利名称:用于生物分子鉴定及表征的方法和仪器的制作方法
1.简介本发明涉及计算机辅助的方法和仪器,其用于高效及系统地研究存在于生物学样品中的分子并测定它们在健康和疾病中的作用。尤其是,本发明涉及蛋白质图(protemics)的成像领域,其包括存在于生物学样品中的蛋白质的系统鉴定及表征,其中蛋白质包括糖基化的或展示其它翻译后修饰的蛋白质。蛋白质图方法对于鉴定对诊断、预后或监测应答治疗的有用之蛋白质以及在鉴定用于疾病预防和治疗的蛋白质目标中提供了极大的优点。
2.发明背景在分子遗传学上的最新进展揭示了用于在特定细胞或组织中核酸表达研究的高通量的测序技术和系统策略的益处。这些进展已经突出了对不依赖操作者的计算机介导的方法的需求,这些方法用于鉴定和选择来自蛋白质、寡糖及其它生物分子的复杂混合物的子集或个体分子,并分离这种选择的生物分子用于进一步分析。
用于靶物驱动的药物发现以及合理的药物设计的策略需要鉴定在因果关系上涉及疾病过程的关键细胞组分,例如蛋白质,以及使用这种组分作为治疗干预的靶物。然而,现在的分析生物分子例如蛋白质的方法耗费时间并且昂贵,而且在检测、成像、纯化及分析方面要受效率低下的困扰。
虽然基因组方法已经推进了我们对生物学过程之遗传基础的理解,但有明显的局限性。首先,鉴定的基因,尤其是部分cDNA序列编码的产物的功能经常是未知的。其次,有关蛋白质翻译后修饰的信息很少能从其基因序列的知识推导出,并且现在很明显大部分蛋白质经历能够深刻地影响其生物化学特性的翻译后修饰(例如糖基化及磷酸化)。第三,蛋白质表达通常受翻译后控制,所以细胞的mRNA水平不是必定与其基因产物的表达水平相关联。第四,自动化的核酸随机测序策略包括在确定其显示临床或科学意义(如果有的话)之前大量核酸分子的分析。
因为这些原因,需要补充基因组资料,方法是通过研究蛋白质和碳水化合物的表达模式以及通过对蛋白质、寡糖和其它生物分子的直接分析研究其在生物学或疾病过程中翻译后修饰的模式。然而,技术上的局限到现在为止已经阻碍了在生物学样品中蛋白质或其它生物分子的快速、经济、可重复的系统分析。
3.发明概述本发明涉及用于生物学样品中生物分子的鉴定、选择和表征的高效计算机辅助的方法及仪器。根据本发明,通过分离存在于复杂混合物中的生物分子产生一个二维阵列。本发明提供了一种计算机产生的数字化分布图,其表示在二维阵列中检测的多数生物分子的特征性及相对丰度,籍此允许计算机介导的来自多重生物学样品分布图的比较。这种筛选生物学样品并比较其分布图的自动化技术,实现了对个体生物分子快速高效的鉴定,这些分子的存在、缺乏或改变的表达与疾病或目标病况相联系。这种生物分子可用作治疗剂,用作用于治疗干预的靶物以及用作诊断、预后和评价对治疗反应的标记。这种技术也实现了快速并高效的鉴定成套的生物分子,其表达模式与疾病或目标病况相联系;这些成套的生物分子提供了用于诊断、预后及评价对治疗反应标记的图样。
本发明的高通量、自动化的方法和仪器进一步实现了根据预先规定标准对个体分离的生物分子(或分离的生物分子的子集)不依赖操作者的选择,而不需要任何序列信息或生物分子的其它结构特征的知识。而这又提供了在生物学样品中检测的多数所选生物分子的自动化、不依赖操作者的分离以及并行表征。因此,本发明在测序或结构表征之前,有利地实现了生物分子的自动化选择。在一个特定的实施方案中,本发明提供了一种适于生物分子(如蛋白质)电泳的凝胶并且其结合于固体支持物上以使凝胶具有二维空间稳定性,并且支持物基本上不干扰关于与凝胶中一个或多个生物分子相结合的标记的检测(例如结合于一个或多个蛋白质的荧光标记)。在另一个特定的实施方案中,本发明提供了一个综合的计算机程序,该计算机程序通过比较数字化分布图来选择在二维阵列中检测的一个或多个生物分子,并产生指令指导一种机器人装置从二维阵列中分离这种选择的生物分子。然而在进一步的实施方案中,这个程序也实现了实验室信息管理系统(LIMS),其跟踪实验室样品以及相关的数据例如临床数据,在样品上进行的操作和通过分析样品产生的数据。
4.附图简述
图1是根据本发明特定的实施方案,在不同蛋白质的混合物上进行的操作流程图。
图2是阐明在本发明特定的实施方案中依靠计算机执行的功能的流程图。
图3是用来从本发明的被支持的凝胶中分离生物分子的机器人装置的图解。
5.发明详述本发明提供了用来快速和有效地鉴定及表征生物学样品中生物分子如蛋白质的方法和仪器。在本发明的一个应用中,生物学样品进行两个连续的分离步骤。在第一个分离步骤中,生物分子根据一种物理或化学特性被分离,以产生包含生物分子的一维阵列;例如,蛋白质通过等电聚焦沿着第一轴被分离。在第二个分离步骤中,在该一维阵列中的生物分子根据第二种物理或化学特性被分离,以产生一个分离的生物分子的二维阵列;例如,通过等电聚焦分离的蛋白质沿着与第一个轴垂直的第二个轴进行SDS-PAGE。分离的生物分子稳定地保持在二维阵列中以随后成像。基于对来自成像数据的自动化计算机分析,稳定的二维阵列可保存或存档一段较长的时期(如数月或数年),并且选择的生物分子能在任何要求的时间从阵列中检索。
对每个检测的生物分子,通过检测器对二维阵列成像而产生包含一组x,y坐标及一个信号值的计算机可读的输出信号。如需要,在计算机介导的分析之前或之后计算机可读的输出信号能够在显示器或任何适当的媒介上以计算机产生的图像显示给人类操作者。对计算机可读的输出信号之计算机介导的分析导致计算机可读的分布图,对大多数检测的生物分子而言它表示每个这种生物分子的相对丰度以及从其在二维阵列中x,y坐标推断的属性。例如,来自包含通过等电聚焦后由SDS-PAGE分离蛋白质的凝胶成像的分布图,显示了大多数被检测蛋白质的等电点(pI)、表观分子量(MW)以及相对丰度。
本发明的计算机可读的分布图适于计算机介导的分析来鉴定满足特定标准的一个或多个生物分子。在一个实施方案中,第一组分布图与第二组分布图比较以鉴定在所有第一组分布图中存在(或以第一组分布图的第一个百分比)而在第二组分布图中缺失(或第二组分布图的第二个百分比缺失,第一和第二百分比可以独立地指定)的生物分子。在其它实施方案中,比较多组分布图以鉴定与另一样品组分布图的指定百分比相比,在一个样品组分布图中存在以指定的较高水平表达的生物分子,或鉴定一个样品组与另一个样品组在翻译后加工中不同的生物分子。
选择如此鉴定的一个或多个生物分子来进行分离。在一个实施方案中,这种选择是根据预先规定的编程的标准通过计算机自动进行的,没有更多的人类干预。在另一个实施方案中,人类操作者综合计算机介导的分析结果,然后输入计算机一个选择。为分离每个选择的生物分子,计算机产生指导机器人装置的机器可读性指令(a)取出包含选择的生物分子二维阵列的一个或多个部分并且(b)将取出的部分输运至一个或多个适当的容器用于进一步表征。例如,可以分析选择的蛋白质以确定其全部或部分的氨基酸序列,以检测并表征任何结合的寡糖部分,以及研究翻译后加工的其它方面,例如磷酸化、十四烷基化等等。本发明有利地实现了从二维阵列取出生物分子的自动化并行步骤,从而促进许多选择的生物分子快速及有效的表征。图一表示根据本发明的一个特定实施方案,一个样品的图解处理的流程图。
本发明可用于鉴定及分析蛋白质,但是一般地更适于鉴定及分析任何生物分子。如在此使用的,术语“生物分子”指的是存在于生物学样品中的任何有机分子,并包括肽、多肽、蛋白质、寡糖、脂类、类固醇、前列腺素、前列环素以及核酸(包括DNA和RNA)。如在此使用的,术语“蛋白质”包括糖基化的及非糖基化的蛋白质。5.1.生物学样品如在此使用的,术语“生物学样品”指的是从任何活生物体排泄或分泌物中获得的任何固体或液体样品,包括单细胞微生物(例如细菌和酵母)以及多细胞生物(例如植物和动物,如脊椎动物或哺乳动物,尤其是健康或表面上健康的人或由将被诊断或调查的病情或疾病侵袭的人类患者)。生物学样品可以是从任何部位(例如血液、血浆、血清、尿液、胆汁、脑脊液、含水的或玻璃样体液,或任何身体分泌物)获得的生物学液体,渗出液,分泌液(例如从脓肿或任何感染或发炎的其它部位获得的液体),或从关节(例如正常的关节或被疾病例如风湿性关节炎、骨关节炎、痛风或脓毒性关节炎侵袭的关节)获得的液体。另外,生物学样品可从任何器官或组织(包括活组织检查或尸体解剖样品)获得,或从包括细胞(无论是原代的或培养的细胞)或被任何细胞、组织或器官决定的介质中获得。如需要,生物学样品可以经过初步加工,包括初步分离技术。例如,可以提取细胞或组织并进行亚细胞分级分离,用来在特定的亚细胞部分分离分析生物分子,例如在细胞的不同部分发现的蛋白质或药物。见Deutscher(编),1990,酶学方法(Methods InEnzymology)182卷,147-238(在此引入其全部以供参考)。类似地,可以进行免疫沉淀以鉴定抗原相关的生物分子,例如蛋白质。见Firestone和Winguth在Duetscher中,出处同前,688-699(在此引入其全部以供参考)。
优选地,对分析有用的相关临床信息依相应的样品按目录分类并编为索引;基于计算机的实验室信息管理系统(LIMS)优选地用于此目的。这种信息优选地包括患者资料例如家族史、临床诊断、性别、年龄、民族、居住地、工作地以及病史。在LIMS中,涉及样品本身的信息也优选地编入索引;这种信息可包括样品类型、取样的精确位置、取样品的日时、采集与保存之间的时间、保存的方法及获得样品使用的方法。
将信息记录索引到适合的样品的方法可以包括对记录和样品分配匹配的编号。优选地通过使用条形码和条形码扫描器使这个过程自动化。处理每个样品时,扫描器用于将样品鉴定号码记录进LIMS,通过其不同操作追踪样品,因而在记录和样品之间保持链接。条形码的使用同样实现了自动归档并检索保存的样品及凝胶。5.2.蛋白质分析在一个实施方案中,使用本发明的方法及仪器鉴定并表征在生物学样品中的一个或多个蛋白质。5.2.1.第一步分离对那些本领域的技术人员来说,很多种分离蛋白质的技术是众所周知的,见例如,Deutscher(编),1990,酶学方法182卷,9-18页和285-554页(在此引入其全部以供参考),并可根据本发明进行应用。以举例方式但并不限于此,蛋白质可以基于等电点(例如通过层析聚焦或等电聚焦)、基于电泳迁移率(例如通过非变性电泳或通过在变性剂如尿素或十二烷基硫酸钠(SDS)存在情况下,在有或没有提前经还原剂例如2-巯基乙醇或二硫苏糖醇处理的电泳),通过在任何合适的基质上的包括FPIC和HPIC的层析(例如凝胶过滤层析,离子交换层析,反相层析或亲和层析,例如带有固定化抗体或凝集素),或通过离心(例如等密度离心或速度离心)分离。
任何分离技术,包括上面列举的任何技术,可以用于第一步分离。在一个实施方案中,第一步分离导致一个不连续的一维阵列(例如在亲和层析中收集的级分)。更优选地,第一步分离导致连续的一维阵列;特别优选的是在配有合适电解质的聚丙烯酰胺条形凝胶中的等电聚焦。5.2.2.第二步分离第二步分离应用一种不同于在第一步分离中使用的分离技术,产生一个分离蛋白质的二维阵列。在任何介质中可使用任何分离技术(包括上文列举的那些)只要(a)所得的生物分子(例如蛋白质)的二维阵列可以成像以检测在分离介质中许多生物分子的物理位置,并且(b)一个或多个选择的生物分子可以从进行第二步分离的介质中分离。在一个优选的实施方案中,第二步分离在凝胶如聚丙烯酰胺平板凝胶中应用电泳;特别优选的是在十二烷基硫酸钠存在下的聚丙烯酰胺凝胶电泳(SDS-PAGE)。如果第一步分离导致不连续的一维阵列,一维阵列的组分(或其等分样品)经受第二种分离技术。例如来自亲和层析的等分样品上样于进行SDS-PAGE的聚丙烯酰胺凝胶孔中。如果第一步分离导致连续的一维阵列,那么该阵列(或其部分)再经过第二种分离技术。例如通过等电聚焦将包含沿着第一轴分离的蛋白质的带状凝胶加样于聚丙烯酰胺平板凝胶,用于沿着与第一轴垂直的第二轴进行SDS-PAGE。5.2.3.被支持的聚丙烯酰胺凝胶本发明的一个方面是适用于电泳中的被支持的凝胶,其中凝胶稳固地结合于固体支持物上以便凝胶具有二维空间稳定性,此支持物是坚硬的并基本上不干扰结合或以其它方式联结凝胶中的一个或多个生物分子的标记的有关检测。优选地,支持物基本上不干扰荧光标记的有关检测;玻璃支持物适用于此目的,因为玻璃不象塑料,缺乏损害或阻碍荧光成像的光学活性。
由于凝胶与固体支持物间稳固的结合,现在凝胶的一个或多个部分可以移开(例如通过切除)而不伴有凝胶剩余部分的位置移动,或只有最小限度的变形,因此在操作及保存期间保持了分离蛋白质二维阵列的完整性;优选地,凝胶共价结合于固体支持物上。在成像确定分离蛋白质的x,y坐标之后,一个或多个部分的包含所选蛋白质的被支持的凝胶可以被移开用于进一步分析,而剩余的蛋白质稳定地保持于先前成像位置,如需要可随后移开。本发明被支持的凝胶代表了在促进分离生物分子精确的、可重复的切除及分离的生物分子的分离方面的主要进展。此外,被支持的凝胶可条形码化以提供在原始样品的特征性与分离的生物分子二维阵列之间不可分离的链接;这种链接可以使用本发明的LIMS来保持。
为制备被支持的凝胶,固体支持物可以被功能化,例如用双功能链接物如γ-异丁烯酰基氧基丙基三甲氧基硅烷;然后将凝胶浇注在功能化的支持物上。在一个优选的实施方案中,支持物通常是平板(如通常的平板玻璃);特别优选的是平直薄板玻璃。如需要,可以在例如低温(如在4℃、-20℃或-70℃)保存被支持的凝胶。保存的适当方法在1997年7月9日提交的国际专利申请号PCT/GB97/01846中描述,在此引入其全部以供参考。对于有些操作(例如凝胶一个或多个部分的切除),外露的被支持的凝胶是优选的;对其它的操作(例如电泳),凝胶可任选地夹在凝胶稳定结合的第一个固体支持物(例如用双功能链接物处理的玻璃板)与凝胶不稳定结合的第二个固体支持物(例如未处理的玻璃板或经硅烷化剂处理的玻璃板)之间。5.2.4.分离蛋白质的检测二维阵列中的蛋白质可用任何期望的技术检测。在一个实施方案中,如本领域内众所周知的,聚丙烯酰胺凝胶中的蛋白质用适当的染料(例如考马斯兰或荧光染料)或通过适当染色技术(例如银染)标记。在一个优选的实施方案中,聚丙烯酰胺凝胶中的蛋白质通过将凝胶用染料浸渍来标记,其中当染料结合或接触到蛋白质时,其变为荧光活性或改变其荧光特性,从而避免了在成像之前清除未结合染料的需要;Sypro Red(Molecular Bioprobes,Inc.,Eugene,俄勒冈州)适用于此目的。在另一个实施方案中,蛋白质可以通过将凝胶用抗体、凝集素或其它适当的配体浸渍来标记,这些配体与报告部分例如放射性核素、酶,或结合生物素的品种联结;清除未结合的抗体、凝集素或其它配体后,报告物可以用任何适当的技术检测。在进一步的实施方案中,蛋白质在分离之前被放射标记,例如用任何适当的放射性核素通过新陈代谢标记(例如氚,一种硫的放射性核素或碳的放射性核素)或用任何适当的放射性核素(例如放射性碘)通过化学或酶法标记。在又一实施方案中,蛋白质被电转移到适当的膜上形成一个二维阵列的复制品,将它用与报告部分联结的抗体、凝集素或其它适当配体探查;这种Western印迹技术在本领域内是众所周知的。
标记的蛋白质用任何能够检测所用的报告物(例如通过光密度测定法或光谱法、或通过检测荧光或放射活性)并产生计算机可读输出信号的检测器成像。在一个实施方案中,检测器是激光荧光扫描仪,其中旋转镜面沿着第一轴沿着凝胶扫描激光束,而凝胶沿着与第一轴垂直的第二轴前进。这种扫描仪中凝胶沿直线传送,穿过连续的扫描激光,使凝胶能够从箱中(例如染色箱)被自动地加载于传送机件,扫描并在扫描完成后自动密封,从而提高凝胶的通过量并减少手工处理。优选地,由凝胶发出的荧光进入波导并传送至光电检测器例如光电倍增管。在一个实施方案中,激光束从旋转镜面沿着与凝胶平行的平面传播直至达到第二个弓形镜面,其以直角反射激光到凝胶。由于弓形镜面,激光束的路径长度保持恒定而凝胶被从一边到另一边扫描。恒定的路径长度促进了相位敏感的检测,其中激光束的振幅是循环调制的;由蛋白质染料复合物(信号)发出的荧光信号显示了用于区分信号与背景荧光(干扰)的相位移,在背景荧光中没有观察到相位移(或较小的相位移)。这种激光荧光扫描仪在Basiji,1997,应用内部反射光学及相敏感检测的高通量荧光扫描仪的进展(博士论文,University of Washington,Seattle,WA)中描述,在此引入其全部以供参考。
需要提供一个或多个由成像装置可检测的参照点,用于确定在分离的蛋白质的二维阵列中检测的任何特征的x,y坐标。参照点可以在凝胶共价结合于其上的支持物(如通常功能化的平板玻璃面)上提供。另外,参照点可以在成像时凝胶固定于其上的框架上提供;匹配的框架可在机器人分离装置中提供。5.3.寡糖分析生物学样品中的寡糖(聚糖)可以用本发明的方法和仪器,利用已建立的切割、标记和分离寡糖技术鉴定并表征。见例如,Townsend和Hotchkiss(编),1997,糖生物学技术(Techniques in Glycobiology)(Marcel Dekker,Inc.,New York);Takahashi,1996,层析杂志(J.Chromatography)720217-225,在此引入各自的全部以供参考。
在一个优选的实施方案中,寡糖由荧光标记(如用邻位取代的苯胺衍生物如2-氨基苯甲脒或2-邻氨基苯甲酸)并通过二维聚丙烯酰胺凝胶电泳分离。见Starr等人,1996,层析杂志720295-321;Bigge等人,1995,分析生物化学(Analyt.Biochem.)230229-238(在此引入各自全部以供参考)。例如,为了达到主要基于寡糖内在荷质比的分离,荧光标记的寡糖在第一维中可以经历聚丙烯酰胺凝胶电泳(PAGE)(例如使用15%丙烯酰胺凝胶以及3(羟甲基)氨基甲烷(“Tris”)/N-3(羟甲基)甲基-3-氨基丙磺酸(“TAPS”)缓冲液,pH7.4)。然后,为了达到主要基于来自伴随寡糖的硼酸阴离子非共价络合物的诱导电荷的分离,寡糖的一维阵列在第二维中进行PAGE,使用20%丙烯酰胺凝胶及20mM Tris/硼酸缓冲液,pH8.5。所得的二维阵列中的寡糖用荧光扫描仪成像以产生计算机可读的信号输出信号。5.4.检测器输出信号的计算机分析本发明方便地提供了检测器输出信号的计算机介导的分析。以举例方式但不限于此,本发明的此方面在首先通过等电聚焦然后通过SDS-PAGE分离蛋白质的情况中讨论;然而,在此描述的方法和仪器同样地适用于分析来自分离的生物分子之任何二维阵列成像的输出信号,这对本领域的技术人员是显而易见的。
为了传递输出信号用于分析,检测器有效地连结于计算机上。如在此使用的,术语“有效地连接”包括直接连接(例如通过传导电缆、红外线通信设备等等永久的或间断的连接)或间接连接,籍此数据通过中间存储设备传输(例如服务器或软盘)。检测器的输出信号应该是能被计算机接受的格式,这是容易理解的。位图格式(例如GIF格式)优选地用于此目的。
一旦传输到合适的编程的计算机,输出信号就可以被处理以检测参照点;过滤并去除人为因素;检测并定量特征;并产生图像文件。特征可以通过计算机介导的潜在的蛋白质斑点与背景的比较来检测。例如,计算机程序可以选择对应于显示超过设定阈值的染色或荧光的凝胶区域的信号。
此外,计算机可以用于编辑检测的特征并对给定样品(或任何数目的复制品)进行匹配的复制品分析。输出信号可以被评价和比较并去掉不合格的图像文件,它们总体上异常或上样低或全部图像亮度太低,或分辨率太差,或复制品太不相似。如果复制品的一个图像文件不合格,那么属于该复制品的图像文件无论其图像质量如何也是不合格的。一经给人类操作者显示一个图像文件,所有这些功能可以根据操作者确定的标准,交互式地或自动地执行。
参照物鉴定可用于校正凝胶泳动中的任何可变性。这个过程包括在给定生物学样品中已知的或期望发现的一种或多种参照物蛋白质的鉴定,它们具有恒定的等电点以及电泳迁移率。这些参照物蛋白质可以作为内在标准以校正任何可能的凝胶变化或变形。或者,另外一个或多个蛋白质可加到样品中以作为外在的标准。被认为是人为因素的特征可以从分析中滤出;这种人为因素可能主要发生在凝胶边缘,并尤其在或接近样品作用点及染料前沿。
如需要,两个或多个试验中的输出信号可以经校准并结合形成全景图像文件;例如,含有蛋白质的样品可以通过双向电泳分离,在第一个试验中使用pH4.0到5.0梯度的等电聚焦,而在第二个试验中使用pH5.0到6.0梯度的等电聚焦。为了观察或进一步分析,现在计算机可以用于表示从这些试验中得到的为单一全景图像的输出信号。
复制品凝胶可通过参照物加以排列且进行匹配。匹配过程可包括复制品凝胶上对应特征的配对。因为配对的特征显示了分离的可重复性,这为随后的准确测量等电点及表观分子量提供了进一步的保证。处理的图像文件可以显示于屏幕上为肉眼观察,可作为图形表示打印出来并用于随后的分析。
在一个实施方案中,计算机用于测量所有检测蛋白质(或根据操作者确定的标准交互式或自动选择的子集)的x,y坐标。参考用于分离步骤中的实验参数、参照物蛋白质或外在标准,将这些坐标与特定的等电点及表观分子量关联。表示蛋白质特征的信号的强度也被测量和存贮。
图像处理的适当程序在本领域中是众所周知的。由BioRad实验室,Hercules,加利福尼亚发布的商业化程序(版本2.2,1997),商品名为MELANIE适用于此目的。在优选的实施方案中,MELANIE用来对检测器输出信号执行下面的操作(a)为了把列与行坐标转化为等电点(pI)及分子量(MW)值,通过参考参照物的定义校正凝胶;(b)凝胶图像中特征的检测;(c)复制品凝胶间的特征配对;(d)为每个检测的特征,计算其绝对特征强度(Vol.)、相对特征强度(%Vol.)、pI及MW;和(e)来自不同样品的凝胶间的特征配对。因此从MELANIE输出的信号可以包括特征报告、参照物报告和配对报告。5.5.分布图的计算机产生及分析图像处理程序(如MELANIE)的输出信号可用计算机进一步处理,产生适于比较分析的数字化分布图。5.5.1分布图的构建现在可以对MELANIE处理的每个图像文件构建数字化分布图。在优选的实施方案中,每个样品于两个或多个复制品(称为“同胞”) 中分析,其中之一被随意地指定为同胞集合的“代表性的”凝胶。对每个鉴定的特征,数字化分布图优选地包括1)唯一的随意鉴定代码,2)x,y坐标,3)等电点,4)分子量以及5)荧光强度。
对每个同胞凝胶集合来说,来自同胞图像的特征报告通过匹配特征之间的平均%Vol、pI及MW汇集成综合的合成画面。然后综合的合成画面由分配给取自同胞集合代表性凝胶的特征ID的平均特征参数组成。另外,%Vol的平均数的标准偏差通过下面的公式(用于复制凝胶)计算D=100*SQRT(sqr(<V>-V1)+sqr(<V>-V2))/<V>
其中<V>=(V1+V2)/2,而V1,V2是成对特征的%Vol值。
另外的信息,例如用于凝胶的蛋白质的总量及凝胶的条形码同样可与综合的合成画面相结合。在优选的实施方案中,综合的合成画面包括一个MELANIE格式的特征报告,参考代表性凝胶并为代表性凝胶的条形码提供线索。
可通过对用于产生图像的实际储存凝胶追踪分布图,由此构建综合合成画面图像,以致通过计算机分析分布图可检索到鉴定的蛋白质。分布图也可追溯到原始样品或患者。通过使用标准及参照物继之以与主凝胶(master gel)相关斑点的匹配,带有校正的凝胶系统的可重复性使在相同或不同时间用相同或不同样品进行电泳的多个凝胶的比较成为可能。而且,为了进行对基于如年龄或临床结果这样的信息选择的样品横断面的计算机分析,在收集原始生物学样品收集中汇合的数据(如在5.1节中描述)可以与凝胶数据再结合。
图2表示根据本发明的一个特定的实施方案阐明的计算机介导的分析的流程图。5.5.2.样品间的交叉匹配现在将来自不同样品分析中产生的资料进行计算机分析。在优选的实施方案中,每一有意义特征被分配一个索引(“分子簇索引”,“MCI”),其识别特征的分子内容并在所有凝胶的匹配特征中具有相同的值。对样品的每种类型来说,建立唯一地定义了每一凝胶连续映射到其上的坐标系统的“分子簇表”。这种方法消除了试图匹配凝胶集合中每一凝胶与其它凝胶的N×N问题。
为了产生分子簇表,随意选择代表性的凝胶作为主凝胶,优选地被认为对其样品类型是最佳的凝胶。对同胞集合的综合的合成画面的每个特征(分子簇)产生了分子簇表中的新条目,其中此代表性凝胶是该同胞集合的一员。当另外的分子簇在其它的凝胶中被观察到但在主凝胶中不具有代表性时,可加到表上。这样的其它凝胶被认为是“二级主凝胶”。
在一个实施方案中,通过pI/MW空间分层的象限树(quadtree)分解,从特征的pI和MW计算MCI。首先,计算包含整个pI/MW空间的2D坐标方格。作为例子但不限于此,pI可以取0到14的任意值,而MW可以取1000到1000000之间的任意值。因为蛋白质的行位置(代表其凝胶上的位移)与其分子量的对数是大约成比例的,就分子量的自然对数即ln(MW)计算坐标方格的位置。2D pI/ln(MW)空间可被接连的水平及垂直对分分为连续的较小象限,每个象限包括比其母体较少的特征,直到分辨率达到在2D空间的每个单元中特征的数目不太可能大于1。
在详细的实施方案中,生成9个连续的部分,所以全部的pI/ln(MW)空间被垂直和水平地分为512部分(RES=512)。现在从主坐标系统中的pI和MW,通过下面的公式计算主凝胶中特征的MCIMCI=((int)((ln(MWmax)-ln(MW))/dM)*8192+(int)(pI/dI))*8192/RES
其中ln(MWmax)=14;ln(MWmin)=7;dM=(ln(MWmax)-ln(MWmin))/RES=0.013672;pImax=14;pImin=0;dI=(pImax-pImin)/RES=0.027344给定类型的所有其它样品的代表性凝胶现在可以与那种样品类型的主凝胶及次级主凝胶匹配(使用MELANIE)。然后对每一匹配的特征,通过加上主凝胶或次级主凝胶分布图中特征的MCI注释数字化分布图。5.5.3.分布图的差分分析一旦分布图用MCI注释,就可进行计算机分析来选择一个或多个代表目标蛋白质或其它生物分子的特征。优选地,通过比较来自单个样品的同胞凝胶复制品分析的综合合成画面分布图进行分析。
一个图像集合是从数据库中用户可选择的样品列表中产生的。图像集合的每个成员包含同胞集合的综合合成画面分布图和用于匹配特征的主分子簇表。
然后定义特征集合,表示已经被发现的在图像集合中的特征集合。一个任意的阈值水平X被指定给一个特征集合;如果它出现在(即其中具有相同的MCI)图像集合至少X%的成员,那么给定特征被定义为该集合的一部分。对特征集合的每一成员来说,定义了下列的特性(1)MCI,(2)%Vol均值(特征出现的图像集合中所有成员的平均%Vol),(3)%Vol中值,以及(4)特征被鉴定的集合中的图像数目。
现在可以进行二元集合的运算以比较两图像集合(指的是“背景”和“前景”集合)之间的特征集合。基本二元运算是在两特征集合中匹配特征间折叠变化(fold-change)的计算。折叠变化(G)通过下面的算法确定使V1和V2分别为背景特征集合F1和前景特征集合F2中特征的%Vol均值,(其中缺失的特征用V=0表示),然后G=V2/V1(当V2>V1)G=V1/V2(当V1>V2)G=+MAX_G(当V1=0)
G=-MAX_G(当V2=0),其中MAX_G是一些合适的大数目。
在折叠变化计算中,这个算法可任选地使用%Vol中值代替%Vol均值进行。结果可以以棒图或其它任何方便的格式报告。
作为一些样品记录变量的一个函数,可以进行一系列的集合运算以确定特征集合中每一特征表达中的变动。例如这种比较可以用于(a)在一样品供体集合中表达变化的时间序列研究;(b)对患有不同疾病的个体集合的表达变化比较;或(c)对进行不同治疗个体集合的表达变化比较。一系列的集合运算产生一个结果的矩阵,其中的行计数了特征集合的个体成员,列计数了矩阵中不同的图像集合并且矩阵中的单元包含从上文描述的每一图像集合中每一特征的%Vol均值中计算的数目。
例如,为了比较一个关于三个图像集合(称为S1、S2和S3)的特征(称为MCI(F)),对每个样品V1、V2和V3的MCI(F)的%Vol是作为相应图像集合中MCI(F)的%Vol均值计算的。其次,均值、中值和最大值V1、V2和V3是跨行计算的。而一个样品集合不包括MCI(F),相应的%Vol取为零。使用者选择一个参照列,Vref,它可以是任何一个图像集合或均值或中值。然后每个单元如下计算P1=(V1-Vref)/VmaxP2=(V2-Vref)/VmaxP3=(V3-Vref)/Vmax这些数值全部在-1.0到+1.0范围内。这个范围可以分为期望的的亚区间数目(例如七个相等的亚区间),结果以图形显示并且用每个亚区间的符号代表的单元中的数值。
计算机介导的根据操作者指定标准的比较促进了大量分布图快速有效的分析,并允许被比较的分布图间较小差异的鉴定,即使每个分布图可代表成百上千个检测的生物分子。大量样品集合的快速有效的处理能力提高了检测统计学上显著性差异的可能性。
同样应该理解,本发明的操作者可以将新产生的每一分布图加到连续增长的数据库中,允许交叉试验比较,或者以原始研究者未想象到的组合进行比较。分布图数据库可以允许进行虚拟试验,其中来自任何研究的分布图可以与来自任何其它研究的分布图比较,而不必重新产生实际的临床资料。例如,提供蛋白质分子量和等电点的任何数据库可以与本发明的来自蛋白质分析的分布图比较。
本领域技术人员能够理解,这种分析可采取多种形式,并且随后的实施例通过举例而非限制方式提供。
可比较患病以及正常个体的分布图以鉴定两人群间一贯不同的斑点模式。这些斑点可以包括有治疗或诊断意义的蛋白质。
可比较来自单个个体的患病和正常组织的分布图以鉴定在患病与正常组织间一贯不同的斑点模式。这些斑点可以包括用于治疗或诊断目的的感兴趣的生物分子。因为比较是在取自单个个体的样品之间进行的,这对不同个体间变化的控制具有特殊优势。
可比较治疗以及未治疗个体的分布图以鉴定与某些治疗或药物处理相关的斑点模式。这在研究抗药性或药物开发中对阐明药物的机理是有帮助的。
健康、患病和已治疗的患病个体的三方比较可以鉴定哪种药物能够将患病的分布图恢复到更接近类似正常的分布图。无论在临床试验还是在常规治疗中这种方法均可用于筛选药物、监测治疗效果及检测或预测副作用的发生,并可用于鉴定哪些斑点对疾病的显示及治疗更重要。
未治疗、用药物A治疗或用药物B治疗的患病个体的三方比较也可以鉴定感兴趣的生物分子。例如,如果已知A是有效的而B是无效的,那么在治疗组A(一方面)与未治疗组及与治疗组B(另一方面)之间不同的生物分子对预后有用,并且是用于治疗目标研究的任选物。
5.6.被支持凝胶的选择部分的移出一旦被分离,生物学分子被约束于稳定的阵列中,这是本发明的被支持的凝胶的一个特征。现在可以移出一部分包含单一被检测特征的凝胶而不影响阵列中剩余部分的空间完整性。以举例方式,通过切除部分凝胶、通过局部应用液化凝胶的试剂以使期望的物质可以通过吸出或溢出被转移、或通过局部应用电洗脱装置可以完成转移。基于分布图,包含需要分析物质的部分凝胶的移出能够准确及重复地实施;这些部分可以从已经成像的凝胶中或从复制品或其它成像凝胶的复制物中移出。很容易理解,这很适于计算机控制的分析及选择。
优选地,使用本发明的仪器切除选择的凝胶部分。因此,提供了软件控制的机器人装置,它使用在生物分子分离之后获得的生物学分子分布图作参照。这种装置可以有效地与计算机连接并通过机器可读的指令驱动,根据指令以不依赖操作者的方式在凝胶上进行切除及操作,这些指令是通过计算机介导的对来自多种生物分子混合物分析的多种分布图的分析产生的。计算机设计x,y运动并指引机器人装置的切割头采取单一切割或一系列重叠切割以分离并移走鉴定的特征。
这种装置可以包括(1)与在成像中凝胶放于其中的框架相同或匹配的规定的一个框架。(2)一个用于控制带有凝胶框架的位置的底板。(3)一个带有附着到可变操作的驱动的可移动的x,y坐标定位机械装置,和用于定位操作者规定的感兴趣的定位凝胶区域的由软件指导的切除部件,并且能够执行要求的操作,输运凝胶或凝胶衍生物到接受盒中规定位置。这种装置的一个实施方案在图3中阐明。
这种设备能够从背面为玻璃的凝胶中转移凝胶片段并将转移的凝胶片段转移到适当的容器中。单独的反应管(例如Eppendorf管)可用于每一凝胶片段;更优选地,凝胶片段转移到试管架或盒子中的多容量容器例如96孔收集微量培养板上。将要操作的背面为玻璃的凝胶安装在设备底板上的导轨上,因此用切割装置对正玻璃和凝胶。根据机器可读的指令,这个设备移出一个或多个选择的凝胶部分。在一个实施方案中,对每个特征和用于打断凝胶与玻璃的连接并移出凝胶片段的核心切割、剪切和抽吸的过程,均选择新的尖头。优选地,剪切过程包括尖头沿着第一轴从一边到另一边运动,接着尖头以与第一轴成一定角度(最优选地直角)沿着第二轴从一边到另一边运动。每一凝胶片段被转移到收集板上并排出,优选地投到液体中以帮助凝胶片段从尖头移出。为了预防凝胶片段在切割过程中被抽吸进真空泵并在排出过程将凝胶片段推出尖头的双重目的,优选地在尖头中包含一个可移动的梭形阀。为了在不同特征之间将遗留减到最小,切割工具可以在整体的自动清洁站中清洁。更优选地,切割工具是可更换的,所以对每一特征使用一种新的切割工具,因此防止任何遗留。
大的特征通过制作多种相邻或重叠切割被切除,相同特征的所有的部分在收集平板的同一孔中沉淀,或不同的特征部分在不同的孔中沉淀。另外,沿着大特征的周边界切割分布图;然后当在凝胶下面进行切割时,凝胶被提起以从支持物上分离,所有的特征被转移到收集容器中。已经设置这个系统以允许多个凝胶被切割进一个收集板,并且同样允许一个凝胶被切割进任何数目的采集板中,因此允许所有特征被进一步处理。一旦收集板充满或完成,即可进一步处理或保存。在选择的凝胶片段已经切除后,凝胶的剩余部分可以保存,例如在如上文描述的低温条件下。5.7.处理凝胶转移的部分凝胶的一个或多个转移部分被传送至工作站,例如一个普通的模块化化学单元,其完全可编程并设置用于蛋白质水解。这个工作站允许任何规程的操作,包括试剂增加、用滴管吸取并转移、孵育、混合、冷却、真空干燥和固相提取技术、或模块能够开发的任何其它技术。板被安装到托架上,通过一个集成的托架操作器托架重新安装在设备的底板上。这些板可以为任意形式,优选地为一种孔的正交阵列,更优选地采取9mm间距微量培养板形式。特别优选地为在每孔的底部带有允许液体流过的管口的微量培养板,如由英国,Shepperton的Porvair有限公司制造的板。在这样的微量培养板中,液体和凝胶片段通过聚四氟乙烯板保留,依靠移液管组件以从上面施加的空气压力通过板提取液体。在提取过程中液体可以作为废物扔掉或在肽洗脱过程中收集于位于管口下面的第二块板中。
一种根据本发明分离的蛋白质可以如下面所述进行分析,或用于产生针对分离蛋白质的多克隆或单克隆抗体向实验动物如小鼠、大鼠或兔施用。这种抗体在诊断及预后试验中有用,并用于大量蛋白质的纯化,例如通过抗体亲和层析。
5.8.蛋白质分析工作站可以被设计用于化学法蛋白质水解,或用于单独或结合使用一种或多种适当的酶(例如胰蛋白酶或糜蛋白酶)的酶法蛋白质水解。见如Shevchenko等人,1996,分析化学68850-858和Houthaeve等人,1995,FEBS Letters 37691-94(在此引用每篇的全部以供参考)。如需要,电洗脱可任选地用于从凝胶薄片中提取蛋白质。在一个优选的实施方案中,工作站被编程,以使移出的凝胶片段中的蛋白质被切割,产生适于进一步表征的肽库。因此,工作站接收在适当托架中切割的凝胶块的样品,并且将这些凝胶块经历洗涤、还原、烷化、洗涤以及胰蛋白酶水解步骤。所得的肽被提取到第二块板中用于进一步清洗或在分析之前额外制备。见例如Shevchenko,出处同前。孵育可以在高达100℃及以上的任意温度进行;工作站包括一个密封结构,以便在高温或延长期间进行孵育时防止或最小化液体损失。设备被设计成可无人操作,理想地为整夜,并有全面的检测、监视及自检机制,以确保编程的规程正确地执行、报告任何错误、并在预先规定的偶然事故发生时中断操作。多个平板可以并行处理,并且如需要可以根据不同的规程进行处理。工作站也能进行肽的提纯以及其他处理例如肼解和标记。
5.8.1.氨基酸序列的确定现在可以确定来自转移的蛋白质的一个或多个肽之氨基酸序列,例如通过适当的质谱技术,例如矩阵辅助的与飞行时间质量分析(MALDI-TOF MS)或电喷离子化质谱(ESI MS)结合的激光解吸附作用/离子化。见Jensen等人,1997,通过质谱的蛋白质分析,Creighton编,蛋白质结构,实用方法(牛津大学出版社),牛津,29-57页;Patterson和Aebersold,1995,电泳161791-1841;Figeys等人,1996,分析化学(Analyt.Chem.)681822-1828(在此引入每篇的全部以供参考)。优选地,一种分离技术例如HPIC或毛细管电泳被直接或间接地与质谱仪结合。见Ducret等人,1996,电泳17866-876;Gevaert等人,1996,电泳,17918-924;Clauser等人,1995,美国国家科学院院报(Proc.Natl.Acad.Sci.USA)925072-5076(在此引入每篇的全部以供参考)。特别优选地是在美国专利申请08/877,605中描述的从头测序技术(在此引入其全部以供参考)。在从头测序中,肽的分子量通过适当的技术,优选地用质谱仪被精确测定。考虑到形成肽键时的水丢失、质子化、改变测量的氨基酸质量的其它因素以及制约氨基酸的容许组合的实验因素,用计算机确定加入到测量的肽的分子量的氨基酸的所有可能的组合。然后计算机构建在许可组合中氨基酸所有线性组合的容许文库。然后对组合的容许文库中每一成员计算理论上的片段质谱,并与未知肽的通过质谱测定获得的实验片段质谱比较,以确定未知肽的氨基酸序列。最优选地,使用串联的质谱仪以测定未知肽的氨基酸序列。
一旦分离的蛋白质之全部或部分氨基酸序列已经用实验方法测定,可用计算机在可得到的数据库中搜寻匹配的氨基酸序列或核苷酸序列,包括表达的序列标记(EST),其预测的氨基酸序列与实验方法测定的氨基酸序列匹配。如果没有发现匹配的核苷酸序列,通过本领域内熟知的技术反向构建编码实验测定的氨基酸序列的一组简并性核苷酸序列;这样的一组简并性核苷酸序列可用于克隆编码经分离的蛋白质的基因及用于表达测序的蛋白质或肽片段的。另外,仅使用蛋白质从其所获得的物种中偏好的密码子(例如在人类中偏好的密码子,其中蛋白质为人类蛋白质),可以反向构建简并性的核苷酸序列组的亚组;如需要,这个亚组可被限定为相关物种中最高度优选的一个核苷酸序列。
一旦编码分离蛋白质的基因在公共或私人数据库中鉴定,这个基因就可以克隆并转入细菌、酵母或哺乳动物宿主细胞中。如果这种基因在数据库中没有被鉴定,那么可以使用简并性组探针克隆这个基因,这个探针编码通过本发明的方法和仪器确定的蛋白质的氨基酸序列。如果数据库包含一个或多个编码实验上确定的蛋白质的氨基酸序列之部分核苷酸序列,那么这样的部分核苷酸序列(或其互补序列)可用作克隆基因的探针,从而避免了使用简并性组的需要。
表达这种重组蛋白质的经基因工程构建的细胞可以在筛选程序中使用,从而鉴定与重组蛋白质有特定相互作用的其它的蛋白质或药物,或生产大量的重组蛋白质,用于如治疗施用。拥有克隆的基因实现了以替代或补充与疾病相关的蛋白质的表达缺失或减少的基因治疗。拥有克隆的基因同样实现了以抑制其存在或其增强表达与疾病相关的蛋白质表达反义或三螺旋治疗。5.8.2.翻译后加工的分析许多蛋白质用化学基团而不是用氨基酸进行翻译后修饰,例如磷酸基团及寡糖。这些基团在蛋白质中的存在、定位及化学特性可以通过使用本发明的仪器及方法获得的蛋白质特异性多肽之片段来分析。在一个实施方案中,从凝胶片段中分离的蛋白质中获得的肽库被分开。如上面5.8.1.节中所描述,一部分用于蛋白质的鉴定。其余一部分或多部分通过本领域已知的标准方法用于鉴定个体的翻译后修饰。例如,磷酸化分析在Carr等人,1996,分析生物化学(Analyt.Biochem.)239180-192以及Townsend等人,1996,蛋白质科学(Protein Science)51865-1873中有描述(在此引入每篇的全部以供参考)。聚糖分析在Dwek等人,1993,分析生物化学,6265-100中(在此引入其全部以供参考)以及上面5.3.节中的参考文献中描述。
6.实施例来自风湿性关节炎患者血清和滑液的蛋白质风温性关节炎(RA)患者血清和滑液中的蛋白质通过等电聚焦随后SDS-PAGE被分离并比较。6.1.等电聚焦对于等电聚焦(IEF),将每一样品用于ImmobilineDryStrip试剂盒(Pharmacia Biotech),随后的步骤在制造商说明书中描述,见ImmobilineDryStrip试剂盒说明书,Pharmacia,#18-1038-63,AB版(在此引入其全部以供参考),带有可选择的修饰,被Sanchez等人,1997,电泳18324-327描述(在此引入其全部以供参考)。
在某些事例中,为了增加在特定pH范围内的分辨率或加载大量目标蛋白质到凝胶上,根据Westermeier,1993,电泳实践(Electrophorsis inPractice),(VCH,Weinheim,德国),197-209页(在此引入其全部作为参考)中所描述,使用了pH范围为2pH单位或更小的窄范围的“放大凝胶”(zoom gel)。6.2.凝胶平衡和SDS-PAGE如Sanchez等人,同上所描述,通过在SDS缓冲系统中平衡,制备用于SDS-PAGE的IEF凝胶,平衡根据一个两步程序进行,包括最初二硫键的还原,随后烷化游离巯基团。其后,根据Hochstrasser等人,1988,分析生物化学173412-423(在此引入其全部以供参考)的描述,如下面详细说明修改,进行SDS-PAGE。6.3.被支持的凝胶的制备通过在凝胶附着的玻璃板上(“底板”)使用0.4%Y-异丁烯酰基-氧基丙基三甲氧基硅烷的乙醇溶液,SDS-PAGE凝胶共价粘附到玻璃支持物上。通过用水冲洗将过剩的试剂清除,并使底板干燥。在此阶段,既作为凝胶的标识,又作为鉴定平板涂层面的标记,粘性的条形码被粘到底板不会接触凝胶基质的位置。
用RepelSilane(pharmacia Biotech)处理相对的玻璃板(“顶板”)以最小化凝胶的粘附。应用了试剂之后,通过将热空气流(如从热空气枪中)作用于板的表面加热顶板。过量的试剂再次用水冲洗清除并使顶板干燥。
干燥的平板被装配进带有13个凝胶夹层的浇注箱中。一些浇注箱可以平行地装配以在相同的条件下浇注更多的凝胶。每个夹层的顶板和底板用1mm厚的隔板隔开。夹层用醋酸层间隔以促进在凝胶聚合后夹层的分离。然后根据Hochstrasser等人,出处同前进行浇注。6.4.SDS-PAGE来自IEF步骤的凝胶条加于浇注的SDS-PAGE凝胶上部并开始电泳。为了确保电泳进行中凝胶平均冷却,基本上如Amess等人,1995,电泳,161255-1267(再次引入其全部以供参考)所描述,设计了一个系统。甚至还需要更有效的冷却,以便在凝胶电泳过程中最小化温度的波动并因此保持蛋白质迁移的一致性。进行电泳直到示踪染料达到凝胶的底边。然后将凝胶立即转移进行染色。6.5.染色小心移去凝胶盒子的顶板,剩下结合到底板的凝胶。然后将带有结合凝胶的底板放进能容纳12片凝胶的染色设备中。凝胶完全浸入固定液中过夜,固定液包括40%(v/v)乙醇,10%(v/v)乙酸,50%(v/v)水。然后将固定液从箱中排出,并且将凝胶浸入7.5%(v/v)乙酸,0.05%(w/v)SDS中引发30分钟。然后将引发液排出,将凝胶完全浸入染色液染色4小时。荧光染色储存液根据制造商的说明书,通过稀释SyproRed(Molecular Bioprobes,Inc.,Eugene,俄勒冈州(Oregon))制备。稀释的溶液通过0.4μm滤器真空过滤。
为了达到不同溶液连续地、甚至循环地经过所有12片凝胶,溶液通过分配杆被引入箱中,沿着箱的底部扩散跨过其全部宽度并提供使溶液均匀地流过每一凝胶的洞。6.6.凝胶成像根据制造商的说明书,(见Storm使用指南,1995,版本4.0,号码149-355,在此引入其全部以供参考),如下文所述修改,通过使用Storm扫描仪(Molecular Dynamics,Sunnyvale,加利福尼亚)对荧光染色的凝胶成像生成计算机可读的输出信号。因为凝胶坚固地结合到玻璃板上,在成像过程中凝胶保持与扫描仪的接触。为了避免由于凝胶与扫描仪工作台不一致的接触产生的干涉图案,在凝胶下面导入水膜,小心避免气泡。而且,将凝胶放于带有两个与凝胶共同成像的荧光按钮的框架中,提供用于确定凝胶中检测的其它特征的x,y坐标的参照点(命名为M1和M2)。为了保持准确的凝胶定位,在机器人凝胶切除器上提供了匹配的框架。在成像之后,凝胶密封于包含少量染色溶液的聚乙烯袋中,然后保存于4℃。
来自扫描仪的输出信号首先使用MELANIE处理以自动检测记录的点,M1和M2;自动修剪图像(即除去源自凝胶边界,如参考框架之外区域的扫描的图像的信号);滤出由于灰尘的人为因素;检测并定量特征;以及产生GIF格式的图像文件。通过计算机介导的与背景比较潜在的蛋白质斑点以选择与超过代表背景染色给定阈值的信号相关的凝胶区域进行特征检测。
使用第二个程序对检测的特征进行交互式编辑并对每一样品匹配复制品凝胶。首先,要估计图像以丢弃总体上不正常的或上样量太低或全部图像亮度太低,或分辨率太差,或复制品太不相似的图像。如果一个复制品的图像被丢弃,那么属于这个复制品的其它图像无论图像的质量如何也被丢弃。安排时间对丢弃的样品进行重复分析。
参照物的鉴定用于校正凝胶电泳中的任何变动。这个方法包括鉴定期望在任何给定的生物学样品中发现的某些蛋白质。因为这些普通蛋白质在不同的样品中表现一致的等电点和分子量,它们可以用作校正任何可能的凝胶变异或变形的标准。在参照凝胶中参照物的pI和分子量值通过样品与大肠杆菌蛋白质共同电泳来确定,大肠杆菌蛋白质先前已经用人类血清中的已知蛋白质标定。认为是人为因素的特征(主要地在凝胶图像的边缘,特别是由于样品上样点及染料前沿的那些)被清除掉。然后复制的凝胶通过参照物排列,进行匹配使得在复制的凝胶上有成对的一致斑点。因为成对的斑点显示了分离的可重复性,这为后来测定等电点及分子量是准确的提供了更多保证。校正的凝胶,除了用于随后的分析,也被打印出来进行肉眼检察。
图像的产生继之以计算机测量每一蛋白质的x,y坐标,它通过参考已知的参照物蛋白质或标准与特定等电点和分子量相关联。测量每一蛋白质斑点强度并保存。每一蛋白质斑点被分配一个识别代码并与主凝胶(即在每型样品中可见的包含的多数或全部蛋白质斑点并且用作与其它样品的蛋白质斑点匹配的模板的参考凝胶)上的一个斑点匹配。这一步骤允许横跨许多不同凝胶的假设的相关斑点的鉴定。在原始生物学样品的收集中收集的资料,如在5.1.节中所描述,与凝胶数据再结合,籍此实现了基于如年龄或临床结果等信息的样品之计算机选择的横断面分析。
此方面分析的最终结果是数字化分布图的生成,对每一鉴定的斑点,它包含1)唯一的随机识别代码,2)x,y坐标,3)等电点,4)分子量,5)信号值,6)每一前述方法的标准偏差,以及7)主凝胶上斑点的与其匹配的指向MCI的指针。依靠LIMS,对分布图其所产生于的实际保存的凝胶是可追踪的,所以,通过计算机分析凝胶分布图数据库鉴定的蛋白质可以被检索到。LIMS也可使分布图被追溯到原始样品或患者。6.7.凝胶的数字分析一旦生成分布图,就针对于有兴趣蛋白质的选择进行分析。
来自成对血清和关节滑液样品的个体图像之蛋白质特征被电子化比较。与在2-D分离中位置的特征性一样,整个图像集合的任一特征的分子特征性在此分析中被阐述。在个体图像中个体特征丰度的定量测定是基于测定该图像中特征的标准化荧光强度。在多个血清及关节滑液样品集合之间丰度不同的那些蛋白质通过在所有相关图像中所有检测特征的电子比较被揭示。6.8.选择的蛋白质的回收和分析差异地表达的蛋白质被机器人切除并处理,产生胰蛋白酶肽;通过质谱分析,使用从头测序,确定这些肽的部分氨基酸序列。6.9.结果这些最初实验鉴定的12种蛋白质在人类RA关节滑液中水平高于匹配的血清样品,而在人类RA关节滑液中9种蛋白质比匹配的血清样品中存在的水平要低。对每一种差异地表达的蛋白质,确定了部分氨基酸序列。公共数据库的计算机分析揭示了这些部分测序蛋白质中的16种在本领域内是已知的,而5种在检查的所有公共数据库中没有描述。
权利要求
1.一种用于选择和指导在经如下方法制备的二维阵列中存在的一种或多种生物分子分离的计算机辅助方法,其中所述二维阵列的制备方法包括第一个分离步骤,其中多种生物分子根据第一种物理或化学特性被分离以形成生物分子的一维阵列;和第二个分离步骤,其中根据第二种物理或化学特性分离所述生物分子的一维阵列以形成所述二维阵列;所述计算机辅助方法包括对所述二维阵列或其复制品成像生成计算机可读的输出信号包括,对于所述二维阵列中检测的多种生物分子的每一个而言,一对x,y坐标和一个信号值;在至少一台计算机中处理所述的输出信号,以根据先前规定的或操作者制定的标准选择一种或多种所述检测的生物分子;并且生成机器可读的指令,其指导机器人装置从所述二维阵列中分离至少一种所选的生物分子;且根据所述机器可读的指令由该机器人装置从所述二维阵列中分离至少一种所选的生物分子。
2.权利要求
1的方法,其中通过第一种装置对二维阵列成像,而与之物理上分离的第二种机器人装置分离所选的生物分子。
3.权利要求
1的方法,其中计算机可读的输出信号包括,对于所述二维阵列中存在的多种生物分子的每一个而言,一对x,y坐标,和指导机器人装置x和y运动的机器可读的指令。
4.权利要求
1的方法,其中二维阵列成像用荧光扫描仪进行。
5.权利要求
1的方法,其中产生了指导机器人装置从二维阵列中分离一种以上所选生物分子的机器可读指令。
6.权利要求
1的方法,其中多种生物分子来自生物学样品。
7.权利要求
1的方法,其中由生物学样品产生复制的阵列,且由凝胶成像产生的计算机可读信号与之相匹配。
8.根据权利要求
1的方法,其中所述生物分子为寡糖。
9.根据权利要求
1的方法,其中所述生物分子为蛋白质。
10.根据权利要求
9的方法,其中所述蛋白质为糖蛋白。
11.根据权利要求
1的方法,其中所述二维阵列包含于凝胶中。
12.根据权利要求
11的方法,其中所述二维阵列包含于聚丙烯酰胺凝胶中。
13.根据权利要求
12的方法,其中所述二维阵列通过等电聚焦制备,随后在十二烷基硫酸钠存在下进行电泳。
14.根据权利要求
11的方法,其中所述凝胶键合到一种普通平面固体支持物上,以使凝胶有二维空间稳定性,而且支持物基本上不干扰生物分子携带的可检测标记的相关检测。
15.根据权利要求
14的方法,其中所述聚丙烯酰胺凝胶共价键合到所述固体支持物上。
16.根据权利要求
14的方法,其中所述可检测标记为一种荧光标记。
17.根据权利要求
14的方法,其中所述固体支持物为玻璃。
18.根据权利要求
11的方法,其中所选生物分子的分离包括切割含有所选生物分子的凝胶部分。
19.根据权利要求
18的方法,其还包括分析含于切割的凝胶部分中的生物分子。
20.根据权利要求
19的方法,其中生物分子是蛋白质,分析包括蛋白质水解。
21.根据权利要求
20的方法,其还包括通过质谱确定蛋白质的肽序列。
22.用于对存在于二维阵列中的一种或多种选择的生物分子进行计算机辅助分离的仪器,其中所述二维阵列含于如下方法制备的聚丙烯酰胺凝胶中,其中所述二维阵列的制备方法包括第一个分离步骤,其中多种生物分子根据第一种物理或化学特性被分离以形成生物分子的一维阵列;和第二个分离步骤,其中根据第二种物理或化学特性分离所述生物分子的一维阵列以形成所述二维阵列;一种能够对所述二维阵列成像生成一种计算机可读的输出信号的检测器,对每一种在该二维阵列中的多种生物分子来说,其包括一对x,y坐标以及一个信号值;一台或多台编程的计算机,其根据先前规定的或操作者制定的标准,选择在所述输出信号中描述的一种或多种生物分子,并且生成机器可读的指令来指导机器人装置分离至少一种所选的生物分子;并且根据所述指令能够通过移除含有所述生物分子的凝胶部分分离至少一种所选的生物分子的一种机器人装置,其中所述检测器有效地连接到一台或多台计算机中的至少一台,并且所述的一台或多台计算机中的至少一台有效地连接到所述机器人装置。
23.根据权利要求
22的仪器,其中所述检测器与机器人装置物理上分离。
24.根据权利要求
22的仪器,其中机器人装置经调整适于依机器可读指令进行x和y运动。
25.根据权利要求
22的仪器,其中机器人装置含有一切割头,其中包括带有移动梭的尖头。
26.根据权利要求
22的仪器,其中检测器是荧光扫描仪。
27.根据权利要求
22的仪器,其中生物分子如权利要求
8所定义。
28.根据权利要求
22的仪器,其中所述聚丙烯酰胺凝胶键合到普通平面固体支持物上,以使凝胶具有二维空间稳定性,并且支持物基本上不干扰生物分子携带的可检测标记的相关检测。
29.根据权利要求
28的仪器,其中所述聚丙烯酰胺凝胶共价地键合到所述固体支持物。
30.根据权利要求
28的仪器,其中所述固体支持物为玻璃。
专利摘要
本发明提供了用于鉴定、选择和表征生物学样品中的分子的计算机辅助的方法和仪器。通过分离存在于复杂混合物中的生物分子产生一个二维阵列。构建一种计算机可读的分布图,其表示通过对二维阵列成像检测的多数生物分子的特征性及相对丰度。计算机介导的来自多重样本分布图的比较允许自动鉴定满足预先规定标准的生物分子子集。根据计算机产生的指令,通过机器人装置鉴定的生物分子可从二维阵列中被自动分离。提供了一种适用于电泳的被支持的凝胶,它结合于固体支持物上以使凝胶具有二维空间稳定性,并且固体支持物基本上不干扰与凝胶中的一个或多个生物分子结合的标记如荧光标记的有关检测。
文档编号G01N27/62GKCN1125981SQ97181104
公开日2003年10月29日 申请日期1997年12月1日
发明者R·B·帕里克, R·阿麦斯, J·A·布鲁斯, S·B·普瑞姆, A·E·普拉特, R·M·斯托尼 申请人:牛津糖科学(英国)有限公司导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1