利用基因表达分布图检测蛋白质活性水平的方法

文档序号:3551509阅读:443来源:国知局
专利名称:利用基因表达分布图检测蛋白质活性水平的方法
根据35U.S.C.ζ119(e),本申请要求1998年5月8日申请的美国临时专利申请No.60/084742,和1998年6月19日申请的美国临时专利申请No.60/090046的优先权,在此这两个专利全文引入作为参考。
1.发明领域本发明领域涉及测定细胞中蛋白质的部分灭活的方法,和分析其中蛋白质活性水平被部分破坏的局势的方法。本发明还涉及应用这些方法鉴定具有破坏重要基因的功能的基因多态性和突变的个体的用途。此外,本发明涉及应用这些方法体内鉴定药物活性的用途。
2.发明背景在过去的十年里,出现了多种方法使得有可能监测任何时间细胞内大量转录物的表达水平(参见,例如,Schena等,1995,用互补DNA微阵列定量监测基因表达模式,Science 270467-470;Lockort等,1996,通过与高密度寡核苷酸阵列杂交监测表达,Nature Biotechnology141675-1680;Blanchard等,1996,序列至阵列探测基因组分泌物,Nature Biotechnology 141649;1996,Ashby等人1996年十月29日申请的美国专利5569588,发明名称是“药物筛选的方法”)。在全基因组已知的生物体内,有可能分析细胞中所有基因的转录物。对于其它生物体,例如人,对于其基因组了解越来越多,有可能同时监测细胞内的大量基因。
该项技术的早期专利涉及各种疾病态中上调或下调的基因的鉴定。转录物阵列的其它应用包括了分析信号途径的成员和鉴定各种药物的靶物。但是,因为蛋白质是受很多过程所调节的,所述的过程不仅仅包括转录,还包括翻译调控和翻译后调控,所以以前没有认识到转录物阵列在分析不同活性的蛋白质时是有益的。
但是,监测蛋白质活性水平的较小的差异的能力具有极大的对人和对商业的价值。例如,大多数导致病态的基因突变是通过破坏相应的基因产物的活性水平而导致病态的。因此,测定细胞中特定基因产物,即特定蛋白质,的活性的破坏或部分破坏的能力对于鉴定那些具有破坏重要蛋白质的功能的基因突变和/或多态性的个体提供了有用的手段。特别地,有很多癌症易感性基因,很多决定药物代谢的基因,和决定各种疾病状态存在的基因,如果两个等位基因中的一个发生变化,则可能使大量与健康相关的问题的危险增大。这里称之为“易感性基因”的这样的基因的例子包括但不限于BRCA1和BRCA2,它们与大大增大的乳腺癌和卵巢癌的易感性相关(Cannon-Albright和Skolnick,1996,肿瘤学研讨(Seminars in Oncology)231-5),APC,其与结肠癌增大的易感性相关(Tomlinson等,1997,癌症与转移(Cancerand Metastasis Reviews)1667-79;和Cunningham and Dunlop,1996,英国外科杂志(British Journal of Surgery)83321-329),p16/CDKN2A,其与皮肤黑素瘤增大的易感性相关(Haluska和Hodi,1998,临床肿瘤学杂志(Journal of Clinical Oncology)16670-682),RET和VHL,它们与嗜铬细胞瘤和高血压增大的易感性相关(Hartrmut等,1996,美国肾病杂志(American Journal of Kidney Diseases)28329-333),ATlR,其与糖尿病性肾病有关(Chowdhury等,1997,糖尿病药物(Diabet.Med.)14837-840),IRS1,其与II型糖尿病有关(Stern等,1996,糖尿病(Diabetes)45563-568),apoE,其与早老性痴呆有关(Weisgraber和Mahley,1996,FASEB J.101485-1494),p53,其与几种类型的人癌症有关(参见,例如,Friend,1994,Science 265334-335;Frebourg和Friend,1992,临床研究杂志(J.Clin.Invest.)901637-1641;和Li等,1992,J.Natl.Cancer Inst.841156-1160)。对于影响人药物代谢的多态性的综述参见,例如,Smith等,1995,CancerSurvevs,vol.25“Genetics and CancerA Second Look”,英国皇家癌症研究基金会。
特别地,存在对于用于鉴定具有杂合突变,即其中一个基因的两个等位基因中的其中之一发生变化的突变,的个体的方法的需要。使用PCR直接检测杂合突变是存在问题的,因为同时还存在野生型基因拷贝。此外,一般局势下,突变的基因拷贝的精确序列是未知的。另外,该突变的基因型并不象蛋白质本是蛋白质功能的直接表征。因此与基因型相比,蛋白质功能的检测常常是疾病状态或疾病易感性的最佳指示,因为蛋白质的活性水平更直接地与生物体功能相关(参见,例如,Brown和Hartwell,1998,自然遗传学(Nature Genetics)1891-93)。而且直接检测杂合载体中的蛋白质功能经常是困难的,因为测试是复杂的,检测总的活性减小50%或更小在生物化学上是困难的。
分析蛋白质不同功能的方法对于体内监测细胞中药物的活性也是有用的。目前,如果人们能够以不依赖于独立地确定个体代谢分解产物的性质的方式监测药物随时间减小的活性则是非常有益的。
因此,存在对监测细胞内蛋白质活性水平的方法的需要。特别地,存在对监测细胞内蛋白质活性的方法的需要。通过上述方法可能鉴定具有破坏重要的蛋白质的活性相关联并且与疾病状态或者与一些疾病状态增加的易感性的基因突变和/或多态性的个体,此外,存在对用于体内鉴定药物的活性的监测细胞内蛋白质活性的方法的需要。
这里对参考文献的讨论或引用不应该被认为承认这样的参考是本发明的先前技术。
3.发明概述本发明提供用于测定细胞内细胞成分例如蛋白质由于例如部分失活的活性水平的方法。本发明还提供了分析其中特定细胞成分,特别是特定蛋白质的活性发生变化的局势(例如破坏,部分破坏或者提高)的方法。本发明的方法涉及将通过测定其中具体“靶物”蛋白质的活性被怀疑为部分改变的细胞中的RNA或蛋白质丰度或活性获得的“诊断分布”和通过测定应答于受控的已知的微扰的靶蛋白质的细胞中RNA或蛋白质丰度或活性获得的“反应曲线”相比较。已知的蛋白质微扰在极大的跨度内被控制得具有不同的作用程度,从完全破坏蛋白质活性到没有破坏蛋白质活性,或者到提高蛋白质活性的水平。
本发明的方法还可以用来通过将诊断分布图与其活性待测的各蛋白质的反应曲线的组合相比较来测定细胞中多种蛋白质的活性水平。
本发明还提供鉴定具有破坏重要基因和它们相应的基因产物,即这样的基因所编码的细胞成分,的功能的基因多态性或突变的个体的方法。该方法涉及将通过测定来自被怀疑具有直接破坏或部分破坏靶蛋白质的活性的基因突变或多态性的个体的细胞中基因或蛋白质丰度而获得的诊断分布图与通过测定响应靶蛋白质受控的已知的微扰的细胞内RNA或蛋白质丰度或活性而获得的反应曲线相比较。
本发明进一步提供体内测定药物活性水平的方法。特别地,本发明提供鉴定抑制特定细胞成分特别是特定蛋白质的活性的药物的活性的方法。所述方法涉及将通过测定已经用直接抑制靶蛋白质的药物治疗一段时间的细胞中基因或蛋白质丰度获得的诊断分布图和通过测定应答于靶蛋白质的受控的已知微扰的细胞中基因或蛋白质丰度获得的反应曲线相比较。
本发明的方法的基础在于发现细胞内一种给定蛋白质的活性的破坏导致其它基因的转录物和活性的特征性变化,并且这样的变化可以用来确定与该蛋白质的功能的破坏相关的特定转录物改变的“特征”。即使该给定蛋白质的活性水平只是被部分破坏,例如活性水平的破坏小于50%,也是如此。
更详细地说,本发明提供测定或估算细胞内蛋白质活性水平部分破坏的方法(i)通过测定其中具体蛋白质活性被怀疑为被部分破坏的细胞内细胞成分的丰度来获得诊断分布图;(ii)通过首先通过测定细胞内存在的对所述蛋白质微扰作出应答的细胞成分的丰度获得反应分布图,其次内推(interpolate)如此获得的反应分布图来获得反应曲线;和(iii)根据一些客观测量(objective measure),测定蛋白质活性水平,在该水平下,从反应曲线求出的反应分布图最好地拟合(fit)测定的诊断分布图。在各种实施方案中,通过测定基因表达,蛋白质丰度,蛋白质活性或者这样的测定的组合可以测定所述细胞的分布图。在各种实施方案中,通过使用可滴定表达系统,使用转染系统,改变蛋白质RNA的丰度,改变蛋白质的丰度,或者改变蛋白质的活性都可能会微扰蛋白质活性。
在第一个实施方案中,本发明提供测定一种细胞型中一种或多种蛋白质的活性水平的方法,包括测定对每一种所述蛋白质微扰的水平,在该水平下,诊断分布图和从每一种所述蛋白质就所述微扰测定水平的微扰反应曲线求出的微扰反应分布图的组合之间的相似性最大。其中所述诊断分布图是由一种方法提供的,该方法包括测定所述细胞型的细胞内多种细胞成分,其中每一种所述蛋白质的所述微扰反应曲线是一种方法的产物,所述方法包括(i)提供所述细胞型的所述蛋白质的微扰反应分布图,其中所述微扰反应分布图是通过在所述蛋白质微扰的多个不连续水平下测定所述细胞型的细胞内多种细胞成分而获得的,和(ii)内推所述微扰反应分布图,从而就所述蛋白质的任何微扰水平可以求出微扰反应分布图,其中所述的内推的反应分布图包括所述微扰反应曲线,其中对每一种所述蛋白质的所述微扰水平代表所述细胞型中每一种所述蛋白质的活性水平。
在第一个实施方案的一个优选的方面,就所述蛋白质的每一微扰水平定量测定蛋白质活性表达水平,而所述定量的蛋白质活性水平归一化为(normalized into)野生型蛋白质活性水平,微扰水平因而可以表示为蛋白质活性百分数的函数。在第一个实施方案的另一个优选的方面,本发明还提供了所述测定步骤进一步包括测定所述目标函数的实际最小值。
在第一个实施方案的另一个优选的方面,步骤(C)中测定的微扰水平是使诊断分布图和从微扰反应曲线求出的微扰反应分布图之差的目标函数最小化的微扰水平。
在第二个实施方案中,本发明提供一种鉴定具有破坏它们的相应的基因产物的活性的基因突变或多态性的细胞型的细胞的方法。该第二实施方案的方法包括测定对各所述基因产物的微扰水平,在该水平下诊断分布图和从对于每一种所述蛋白质就所述微扰测定水平的微扰反应曲线求出的微扰反应分布图之间的相似性最大,所述诊断分布图通过下面的方法获得,包括测定所述细胞型细胞内多种细胞成分,其中各所述基因产物的微扰反应曲线是下面方法的产物,所述方法包括(i)提供所述细胞型的所述基因产物的微扰反应分布图,其中所述微扰反应分布图是通过在所述基因产物微扰的多个不连续水平下测定所述细胞型的细胞内多种细胞成分而获得的,和(ii)内推所述微扰反应分布图,从而就所述基因产物的任何微扰水平求出微扰反应分布图,其中所述的内推的反应分布图包括所述微扰反应曲线,其中对每一种所述基因产物的所述微扰水平代表所述细胞型中各所述蛋白质的活性水平。
在第二实施方案的一个方面,该方法用来自所述个体的细胞来测试所述蛋白质活性水平,鉴定具有破坏相应基因产物的蛋白质活性的遗传突变的个体。在第二实施方案的另一个方面,该方法被用来鉴定具有使一个基因的两个等位基因的其中之一失去能力的杂合突变的细胞。
在第三个实施方案中,本发明提供了体内测定药物活性的方法,包括根据第一实施方案的方法,测定用一种或多种与所述蛋白质相互作用的药物治疗了一段时间的细胞内一种或多种蛋白质的活性水平,其中所述蛋白质活性水平被破坏的程度是所述药物活性的一个指征。
在第四个实施方案中,本发明还提供了测定在患者中达到期望的临床效果的一种或多种药物的剂量的方法。该方法包括测定一种或多种药物的剂量,在该剂量下,诊断分布图和与期望的临床效果相关的微扰反应分布图之间的相似性最大。在这样一个实施方案中,所述微扰反应分布图优选地是从微扰反应曲线求出的(即从多种内推的微扰反应分布图求出),所述微扰反应曲线以所述一种或多种药物的临床效果的形式校准(be calibrated)。在第四实施方案的一个替代方案中,本发明的方法被用来确定在患者中达到期望的临床效果的药物治疗。该替换的方法包括确定药物治疗使得诊断分布图和与期望的临床效果相关的微扰反应分布图之间的相似性最大。
在第五个实施方案中,本发明提供了分析细胞型中一种或多种蛋白质的活性水平的计算机系统。本发明的计算机系统包括处理器和与处理器连接的存储器,所述存储器编码一个或多个程序,所述一个或多个程序引导所述处理器完成包括下面步骤的方法(a)接收所述细胞型细胞的诊断分布图,所述诊断分布图是通过包括测定所述细胞型细胞中多种细胞成分的方法获得的;(b)接收所述细胞型的各所述蛋白质的所述活性水平的微扰反应曲线,其中各所述蛋白质的所述微扰反应曲线是一种方法的产物,所述方法包括(i)接收所述细胞型所述蛋白质的微扰反应分布图,其中所述微扰反应分布图是通过对所述蛋白质多个不连续微扰水平下测定所述细胞型细胞内多种细胞成分获得的,和(ii)内推所述微扰反应分布图使得微扰反应分布图可以对于所述蛋白质的任何水平的微扰而求出,其中所述内推的反应分布图包括所述微扰反应曲线;(c)测定所述诊断分布图和从对各所述蛋白质微扰水平的所述微扰反应曲线求出的微扰反应分布图的组合之差的目标函数的值;和(d)通过改变对各所述蛋白质微扰的水平获得将所述目标函数的所述测定值最小化的微扰反应分布图的组合来将所述目标函数所述测定值最小化,其中对各所述蛋白质的所述微扰水平代表所述细胞型中各所述蛋白质的活性水平。
在第五实施方案的一个特殊方面,所述程序引导所述处理器完成内推所述微扰反应分布图的所述步骤(b)(ii)。
4.附图的简要说明

图1说明响应啤酒糖酵母中SUN2基因两个(二倍体)拷贝中的一个缺失的例示性表达反应;缺失突变体中mRNA表达水平与野生型菌株中的表达水平之比的log10为纵轴,杂交强度为横轴作图,所述杂交强度通常与转录物的分子丰度成正比;在重复5次的试验中mRNA水平都一致地增加或减少的基因被标记,并且用表示5次重复测定的标准差的误差棒特征标志。
图2说明对氨甲喋呤药物处理具有最大表达比例变化的大约6000个测定的酵母基因中的30个基因的反应曲线;氨甲喋呤处理水平是3,6,25,50,100和200μM;100μM滴度导致50%生长缺陷;在-0.5相对横轴处将反应设定为0。
图3说明本发明的方法的实施方案的流程图。
图4说明图2中基因YOL031C的反应与Hill函数相拟合。
图5说明本发明计算机系统的例示实施方案。
5.发明详述本部分是本发明及其应用的详细描述。本说明书以更加详细和具体的几种例示的详细说明的方式说明本发明的一般方法。这些实施例是非限制性的,并且对于本领域技术人员显而易见的相关的变化为后面的权利要求书所包括。下面这些实施例描述伴随一般方法的数据收集步骤的实施方案。
5.1 前言本发明包括测定生物系统(例如,细胞,特别是真核细胞或者生物体,包括人)中的蛋白质部分失活的方法。这些方法涉及将蛋白质活性待测的细胞的生物学状态的测定结果与应答于蛋白质活性的已知的、受控的微扰的细胞的生物学状态的变化的测定结果相比较。
本部分首先给出一些概念,包括蛋白质活性水平和生物学状态。接着给出了本发明方法的简要的非限制性综述。下面部分更详细地描述本发明方法。
尽管为了简化起见,本说明书公开经常参考单细胞(例如,“从单基因被微扰的一个细胞中分离RNA”),但是本领域技术人员应该理解更经常的是使用多个遗传学相似细胞,例如从培养的细胞系,进行本发明的任何特定步骤。这样的类似的细胞在这里称之为“细胞型”。这样的细胞或者来自天然的单细胞生物体或者得自多细胞高级生物体(例如人细胞系)。
特别地,5.1部分描述一些本发明的初步的概念。5.2部分一般性描述本发明的方法。5.3部分描述本发明方法的优选的分析实施方案。5.4部分描述微扰生物学途径的方法。5.5部分描述测定细胞成分的方法。最后,5.6部分描述本发明的一些应用,首先,鉴定具有破坏重要基因的功能的基因突变和/或多态性的个体,第二,体内鉴定药物活性。蛋白质活性水平根据本发明,蛋白质活性指通过已知或未知的机理对生物学系统状态所产生的蛋白质介导的作用。所述的蛋白质生物学作用可以是,特别是,下面现象的结果一种或多种RNA的转录或降解的蛋白质介导的调控,一种或多种多肽翻译或翻译后加工的蛋白质介导的调控,生物化学反应的蛋白质介导的催化,生物学活性分子例如营养物的蛋白质介导的转运或储存,等等。
除了蛋白质以外,本发明同样应用于其它细胞成分,即影响生物学系统的状态的细胞成分。这样的成分可以包括,例如核酶和转运RNA。如这里所使用的,术语“细胞成分”不被用以指代已知的亚细胞器,例如线粒体,溶酶体等等。
因此,一种蛋白质或者其它细胞成分的活性水平是蛋白质或者其它细胞成分影响生物系统程度的量度。蛋白质或者其它细胞成分的活性水平在这里也称之为“生物学活性水平”。生物学活性水平,特别是蛋白质活性水平特别受影响蛋白质功能的因素的影响,包括与蛋白质作用的药物和编码蛋白质的突变形式的基因突变或多态性,以及影响生物学系统中蛋白质的量的因素,例如影响编码蛋白质的基因的转录的药物,影响编码蛋白质的mRNA的翻译的药物,或者影响蛋白质降解比例的药物,以及影响转录,翻译或者基因产物,即蛋白质,的降解的基因突变或多态性。这样的突变包括其中一个二倍体基因的一个等位基因失去功能,即编码具有改变的或者没有活性的突变蛋白,的杂合突变。尽管本发明的大部分描述涉及测定蛋白质活性水平,但是本发明的方法同样适用于测定其它细胞成分的活性水平,这一点对于本领域技术人员来说是显而易见的。生物学状态在本发明中通过观察细胞的生物学状态来测定蛋白质(或者其它生物学活性成分)的活性水平。这里所使用的细胞的生物学状态是指细胞成分的总的状态,其足以为了一定的目的,例如为了表征药物的效果,来表征细胞。对这些成分状态所做的测定和/或观察可以是它们的丰度(即细胞中的量或者浓度),或者它们的活性,或者它们的修饰的状态(例如磷酸化),或者与药物作用的特征相关的其它测定。在各种实施方案中,本发明包括对细胞成分不同的集合作出的这样的测定和/或观察。细胞成分的这样的不同的集合在这里也称之为细胞的生物学状态的方面。
在本发明中被有用地测定的细胞的生物学状态的一个方面是其转录状态。细胞的转录态包括在给定的条件下细胞内构成性各种RNA,特别是mRNA的特征和丰度。优选地,测定细胞内所有构成性各种RNA的大部分组分,但是,至少测定足够的组分来表征所感兴趣的药物的作用。所述转录态是本发明测定的生物学状态的目前优选的方面。其可以方便地通过例如通过几种存在的基因表达技术测定cDNA丰度来测定。
本发明中有用地测定的细胞的生物学状态的另一个方面是它的翻译态。细胞的翻译态包括在给定的条件下细胞内组成蛋白质物质的特征和丰度。优选地,测定细胞内所有构成性蛋白质种类的大部分组分,但是,至少测定足够的部分来表征所感兴趣的药物的作用。本领域技术人员公知,转录态常常是翻译态的代表。
细胞的生物学状态的其它方面也在本发明中使用。例如,这里所使用的术语,细胞的活性状态,包括在给定的条件下细胞内组成性蛋白质物质(也可任选地包括催化活性核酸种类)的活性。本领域技术人员公知,翻译态常常是活性态的代表。
相关地,本发明还可适应于其中结合了细胞的生物学状态的不同方面的测定的细胞的生物学状态“混合”方面。例如,在一个混合方面中,一些各种RNA和一些蛋白质种类的丰度与一些其它蛋白质种类的活性的测定组合。此外,从下文中会理解本发明也适于可测定的细胞的生物学状态的其它方面。
活性水平的微扰将影响本发明的具体实施方案测定和/或观察的细胞的生物学状态的任何方面的很多成分。特别地,作为已知存在于细胞内的调控的、稳态的、和补偿性网络和系统的结果,甚至是直接破坏细胞内单一成分而不直接影响任何其它成分,将产生复杂的并且经常是不可预计的非直接的作用。
此处将对单一的假拟的蛋白质,蛋白质P的抑制作用作为实施例。尽管只有蛋白质P的活性被直接破坏,但是受蛋白质P抑制或刺激的,或者增加或者减少以补偿蛋白质P活性的减小的另外的细胞成分也将受到影响。还有其它的细胞成分将受到该第二分级成分的水平或活性的变化的影响,等等。其它细胞成分中的这些变化可以用来确定与一种给定细胞成分的破坏相关的特定细胞成分的改变的“特征”。
本发明优选细胞的转录态的测定,这不只是因为其相对容易测定而且因为即使所感兴趣的蛋白质不直接调控转录,细胞内蛋白质活性的破坏通过直接或间接作用几乎总是导致转录态中可测定的变化。蛋白质活性水平破坏改变细胞的转录态的一个原因是因为先前提到的反馈系统,或网络,它们对感染,基因改变,环境改变,给药等产生补偿性方式的反应,并且主要通过改变基因表达或转录的模式来实现这一点。作为内部补偿的结果,很多对生物学系统的微扰尽管对该系统的外部行为有弱的影响,但是不管怎样可以显著地影响细胞内各元件,例如基因表达,的内部反应。
5.2 从表达分布图测定蛋白质活性本部分首先给出了本发明方法的综述,其次,给出了这些方法的原理的详细说明实施例。本发明方法的综述本发明的方法测定细胞内蛋白质的体内活性水平,更具体地说,检测由例如一个基因的一个或两个等位基因的突变或者由药物对蛋白质的抑制所引起的蛋白质体内活性水平的变化。如这里所使用的,“表达分布图”包括测定指示细胞几方面的生物学状态的多种细胞成分。这样的测定可以包括,例如RNA或蛋白质丰度或活性水平。
根据5.5部分所述测定细胞的几方面生物学状态,例如转录态,翻译态或者活性态。这些测定结果的集合,任选地以图表示,在这里称之为“诊断分布图”。应答于多种分级的蛋白质微扰强度,即多个“微扰水平”,测定类似于诊断分布图中测定的那些的细胞的几方面生物学状态,例如转录态。这些测定的集合,任选地以图表示,在这里称之为“反应分布图”或“微扰反应分布图”。内推反应分布图以预计测定的反应活性范围内蛋白质活性的所有水平的反应分布图。这些内推的反应分布图的集合,任选地以图表示,在这里称之为“反应曲线”。
优选在其中蛋白质或者其基因的活性或丰度变化的实验中测定反应分布图。反应曲线也优选表示为蛋白质活性百分数的函数,或者,较不优选地,作为用来操作所述蛋白质的微扰参数的函数。
为了测出微扰强度,即蛋白质活性水平,将诊断分布图中的细胞成分与反应曲线中变化的细胞成分相比较,在强度下该微扰分布图匹配所有的或者几乎所有的诊断分布图。当发现在反应曲线中不同的细胞成分的大多数在两个分布图中基本上具有相同值时,诊断分布图基本上完全与反应分布图匹配。优选地,反应曲线中不同的细胞成分的至少75%可以匹配,更优选地至少90%可以如此匹配。当从实验误差的角度来看两套数据可能是相同的时,细胞成分在两个分布图中基本上具有相同的值。
在一个优选的实施方案中,通过一种方法进行诊断分布图与反应曲线的比较,所述方法中进行测定的诊断分布图和就某些微扰水平即某些蛋白质活性水平的微扰反应曲线求出的微扰反应分布图之差的客观测量。可以通过调整微扰曲线中蛋白质活性水平,并且相应于经调整的蛋白质活性水平求出微扰反应分布图将客观测量最小化。可以通过标准数据分析技术进行客观测量的最小化。参见,例如,Press等,1996,Numerical Recipes in C,第二版,剑桥大学出版社,第10章;Branch等,1996,Matlab Optimization Toolbox User’s Guide,Mathworks(Natick,MA)。本发明方法的详细说明下面几段以实施例的方式给出了参照图1和图2的本发明几种方法的一般性详细说明,但不是限制本发明。在真核细胞中,有成百上千内部连接的信号传导途径。因此,对细胞内蛋白质功能的微扰对通过第一,第二,有时第三途径连接的其它蛋白质和其它基因的转录具有多种影响。各种蛋白质功能之间的大量相互联系意味着任何一种蛋白质的变化都可能导致很多其它蛋白质的补偿性变化。特别地,即使例如通过加入药物或者通过通过调节基因拷贝数而改变蛋白质的水平的细胞内单一蛋白质的部分破坏也导致足够的其它基因的转录的特征性变化,这些转录物的变化可以用来确定与给定蛋白质的功能即活性的破坏相关的特定转录改变的“特征”。
图1说明其中SUN2基因两个(二倍体)拷贝中的一个缺失的啤酒糖酵母的一个缺失突变体中测定的诊断分布图的一个实施例。该图详细说明了该酵母基因组中大约6000个基因的mRNA表达水平。具体地,缺失突变体中mRNA表达水平与野生型菌株中的表达水平的比例的log10对横轴杂交强度的纵轴上作图,所述杂交强度通常与分子丰度成正比。根据5.4部分所述,用基因转录物阵列进行这些基因表达水平测定。在重复试验中保持上调或下调的基因被标记,并且用虚线表示。这些虚线表示对于从5个微阵列获得的各基因转录物的5次重复测定的标准偏差。
尽管不知道SUN2基因产物是一个转录因子,但是受应答于该杂合缺失的两个因子中的一个以上的上调或下调的有15个基因。下面表I给出了该因子的log10值,借助于该因子,其表达被多于两个因子之一改变的那些基因的mRNA表达改变了,这些变化中很多明显大于标准误差。SUN2基因本身的转录水平的测定显示其mRNA表达水平通过将基因拷贝数从2减小到1而减小小于两个系数。因此,蛋白质活性水平几乎当然减小小于两个系数。毋庸置疑,其它基因的表达分布图中存在特征反应。
表I
通过测定蛋白质靶物不同百分抑制率时的基因表达,有可能建立显示给定蛋白质在远未达到蛋白质功能50%抑制时的抑制作用的反应曲线。当蛋白质活性水平被破坏或部分破坏时细胞内基因的上调和下调的结果代表细胞为了保持稳态所发生的补偿性变化。因为转录中的这些补偿性变化发生在细胞表现出可辨别出的生理学变化之前,所以这些表达分布图是蛋白质功能抑制的非常敏感的指征。当用于诊断两个等位基因中的一个存在失活突变时,以及在监测是药物靶物的蛋白质的抑制作用中,该敏感性具有显著的价值。
图2说明了在二氢叶酸还原酶的不连续蛋白质活性水平下测定的微扰反应分布图的实施例。具体地,该图说明了啤酒糖酵母基因组中6000个基因中的30个基因的mRNA表达水平响应氨甲喋呤药物6个不同滴定度具有最大表达变化,已知氨甲喋呤主要作用是破坏二氢叶酸还原酶的活性。根据5.5部分所述,用基因转录物阵列进行这些基因表达水平测定。可以根据下面5.4部分公开的方法内推图2的微扰反应分布图,以对于二氢叶酸还原酶的任何活性水平提供微扰反应分布图,即微扰反应曲线。
图2定性表明蛋白质活性随着药物浓度的增加而减小,但是不进行蛋白质定量就不知道对于任何药物浓度的实际蛋白质活性百分率。如果可以建立药物浓度与蛋白质活性百分率之间的关系,则任何表达分布图,即对于特定浓度下药物治疗的任何一套表达水平的变化可以通过找到反应曲线上与所研究的分布最匹配的水平方向上的一点,而看作某一蛋白质活性百分率。例如,观测到的一套转录变化可以匹配图2中反应曲线与标有“x%”垂直线的交叉点确定的模式,而另一套可以匹配“y%”线确定的模式。从而图2中这套反应曲线变成蛋白质活性百分率的经过校正的“参照系”。较不优选地,蛋白质活性水平可以以药物的浓度表示,其中应该理解,在本实施例中,较高浓度的氨甲喋呤相应于较低浓度的二氢叶酸还原酶。
例如图2中所示的那些微扰反应分布图可以通过下面5.3部分描述的微扰方法建立和测定。这样的微扰方法包括但不限于调节转录速度的可调控基因的启动子,改变基因量的转染,和已知抗所研究的蛋白质的特异性作用的药物。特别地,通过使用与啤酒糖酵母基因组序列一致的基因表达分析技术,对于该生物体中的几乎所有的基因可以经实验产生这样的反应曲线。尽管本发明的大多数描述针对基因表达数据的测定和模型构建,但是本发明同样适用细胞其它方面的生物学状态,例如蛋白质丰度或活性的测定。
直接测定蛋白质活性的方法是本领域技术人员公知的。这样的方法包括例如以具有所述蛋白质的抗体配体为基础的方法,例如蛋白质印迹(参见,例如,Burnette,1981,A.Anal.Biochem.112195-203)。这样的方法还包括酶活性测试,这对于大多数研究充分的蛋白质药物靶物来说是可行的,包括但不限于HMG CoA还原酶(Thorsness等,1989,Mol.Cell.Biol.95702-5712),钙调磷酸酶(Cyert等,1992,Mol.Cell.Biol.123460-3469)。Deshaies等,1988,Nature 332800-805中给出了通过关闭可调控的启动子并且通过蛋白质印迹用蛋白质缺失对其校正来关闭特异基因功能的实施例。
通过同时定量测定用于测定微扰参数各值的生物样品中的蛋白质活性和基因表达,并且将其归一化为野生型蛋白质活性水平,这样的反应曲线可以表示为蛋白质活性百分率的函数而不是作为用来操作蛋白质的微扰参数的函数。或者,也可能在一些实施方案中,不用必须直接定量测定蛋白质活性。例如,用选择的可调控启动子系统试验可以以对照化合物的浓度为基础估算蛋白质活性百分率而不用证实所研究的每一种蛋白质的实际蛋白质活性水平。
如图2不连续点所提示的,实际上对蛋白质的微扰仅适于有限的不连续值,并且微扰曲线实际上是内推了这些不连续微扰控制参数值的表达比值,即该曲线实际上由内推的不连续的微扰反应分布图组成。期望为了令人信服地解释微扰反应曲线中任何蛋白质活性水平,对于表达分布图和蛋白质活性测定,每十个微扰参数粗略需要三个样品。例如,优选地,需要7个或更多的微扰参数值来覆盖20个参数值。更优选地,选择并定位不连续的微扰值使得途径反应曲线的最陡区被充分取样,使得有至少5个,更优选10个或更多微扰控制参数值位于该反应曲线的该区域,其中反应从未暴露水平到饱和水平不等。
在另一个实施方案中,期望微扰控制参数值的数目是有限的。例如,微扰过程的范围可以控制在人系统内,因为对于试验几乎没有自由度。因此在这样的系统中使用了为了获得需要的基因表达反应曲线和蛋白质活性数据的被动过程。用以获得基因表达反应曲线和蛋白质活性数据的被动过程包括,例如,从已经接受不同剂量药物治疗方案的个体取组织或血样,还有使用具有已知的杂合突变的个体作为至少一个中间蛋白质活性数据点。
图2中的微扰反应曲线详细说明了这样的曲线一般预期的形状。预期的形状包括低微扰控制参数的阀值下区域,该区域之上实际上对微扰没有细胞成分的反应。在该阀值下区域之后,药物或微扰开始有效,细胞成分的特征值被微扰。预期被微扰的值的曲线通常在饱和时向着一个渐进水平单调(monotonic)增加或减小,此外没有观察到其他的变化。反应曲线在该饱和区终止。
事实上,更复杂地,在某些局势下非单调反应曲线是可能的和预期的。例如,在其中微扰具有毒性作用的局势下,因为毒性导致细胞成分的增大的丰度可能开始降低,而正在降低的丰度可能会开始降低得更快。生物学系统中已知存在的非线性和反馈机理可以导致非单调性的多阶段的反应。这样一种反应可能首先增强并且然后随着增强的微扰振幅或者药物暴露而减弱。例如,微扰可以通过具有不同阀值和对立作用的两条途径对一些细胞成分作用,以产生增强的和然后是减弱(或者反之)的反应。虽然针对单调性反应曲线详细说明和主要描述了本发明的方法,例如象图中描述的那些,根据接下来的描述,这对于本领域技术人员是显而易见的,但是这些方法同样应用于非单调性反应曲线。
5.3 分析实施方案本发明的方法的分析实施方案包括通过一些目标函数评价特定蛋白质活性水平处的诊断分布图和反应分布图之差的实施方案。图3给出了本发明方法的优选的实施方案的流程图。该实施方案确定多个不连续的受控的已知蛋白质活性水平的特殊蛋白质的代表性微扰反应分布图数据301。诊断分布图数据302然后与303步骤的反应分布图数据相比较,从中测定蛋白质活性水平。
在本发明的其他实施方案中,图3中详述的一些步骤可以省略或者以不同于详述的顺序进行。例如,在一些实施方案中,对于某种蛋白质或者对于几种,优选地是相关的,蛋白质,已经产生了获得微扰反应分布图数据的步骤301,并且对于各蛋白质活性分析不需要分开进行。
5.3.1.表达分布图描述蛋白质活性水平的分析优选通过测定微扰反应分布图从步骤301开始。很多局势下,对已经就选定的蛋白质的微扰作用测定了微扰反应分布图。在其他局势下,该反应数据一定要在本发明接下来的步骤之前测定。如上所述,一种蛋白质的微扰分布图包括就蛋白质活性的多种已知的受控的微扰水平,对于细胞成分的相关特性中的相关变化的测定测定结果。更具体地说,所感兴趣的蛋白质的活性以分级的方式受到微扰,并且测定微扰的基因表达水平所固有的比例(或者这些比例的对数)。一般局势下,表达分布图和蛋白质活性测定优选地每十次微扰取大约三个样品。例如,优选地取用7个或更多个微扰参数值来覆盖20个参数值。此外,优选选择微扰控制水平,使得其中细胞成分特征从天然水平迅速变化为饱和水平的区域内存在5个或更多的,更优选10个或更多的微扰控制水平。
下面,变量“p”一般指微扰控制水平,其优选表示为蛋白质活性百分率。变量“R”一般指微扰反应数据。详细地,将第一微扰控制水平指定为“p1”。第k种细胞成分的微扰反应是Rk。因此,Rk(p1)是第一微扰控制参数水平下的第k种细胞成分的反应。
类似地,在步骤302获得诊断分布图数据,并且如果不是已经得到的则必须测定。如上所述,通过测定感兴趣的细胞内细胞成分的水平获得数据,所述细胞即人们期望测定特定蛋白质的蛋白质活性水平的细胞。当获得该数据时,实际蛋白质活性水平,p,通常是未知的。下面,变量“D”一般指诊断分布图数据。详细地,第k种细胞成分的诊断分布图是Dk。因此,Dk(p)是具有蛋白质水平p的细胞的第k种细胞成分的诊断分布图。典型地,Dk(p)和Dk的值是各细胞成分的表达比例的对数log10。该表达比例是受到微扰的或者药物处理过的系统中的水平和野生型或未处理过的系统中的水平之间的比例。
一般局势下,获得诊断分布图数据时的实际蛋白质活性水平不对应于实际获得微扰反应分布图时任何微扰控制水平。因此,需要提供步骤303来内推微扰反应曲线以获得需要的值。优选地,该内推方法或者通过拟合曲线适配或者通过模型拟合适配完成。在步骤303中完成内推方法和任何必要的参数的选择。
在拟合曲线适配中,通过合适的曲线规则内推函数,s,之和,乘以测定的数据值来内推微扰反应数据,如下面的等式所示。Rk(u)=Σls(u-P1)Rk(P1)---(1)]]>变量“u”指一个任意的蛋白质活性水平的值,在该值处评价微扰反应数据。一般局势下,S可以是任意平滑的,或者至少一部分(piece-wise)连续的具有反应函数中期望的结构的广泛特征有限支持的函数。可以选择的示例性宽度可被选定为这样的距离,经该距离被内推的反应函数从其渐近值的10%提高到90%。示例性的S函数包括线性或Gaussian内推法。
在模型拟合中,以单一参数化的函数逐一逼近来内推微扰反应。适于估算转录态数据的列举性的模型拟合函数是Hill函数,其具有可调节参数a,u0和n。H(u)=a(u/u0)n1+(u/u0)n---(2)]]>对于微扰反应的各细胞成分独立选择可调节的参数。优选地,选择可调节的参数,使得对于每一个细胞成分自Rk(p1)的距离H(p1)的平方和最小。该优选的参数调节方法在本领域公知为H( )至Rk最小平方拟合。其它可能的模型函数以多项式拟合为基础,例如通过各种已知的多项式。
参照图2和图4详细说明了采用Hill函数的模型拟合。如所讨论的,图2详细说明了氨甲喋呤微扰的例子并且通过测定进行了鉴定。该图说明针对氨甲喋呤6个不同的暴露水平,啤酒糖酵母的基因组中的大约6000个基因中的30个基因的RNA表达水平具有最大的表达变化。图4说明这些基因表达水平中的一个的微扰反应通过Hill函数的拟合局势。特别地,酵母基因YOL031C拟合Hill函数,通过上文描述的最小平方方法选择参数n=2,a=-0.61,和log10(u0)=1.26。
因为具有最大反应的所有30个基因行为单调性,即没有反应随着药物暴露的增加而从其最大振幅明显减小(或者从其最小振幅明显增大),所以Hill函数是一个合适的模型拟合函数。对于非单调性行为则不是如此。
如果给定了蛋白质活性的任何值(指定为p)的微扰反应的内推,诊断表达分布图D可以与微扰反应曲线R(p)相比较以发现对于所有可能的p值的最佳拟合点。根据一个优选的方法,从相关的最小平方逼近的最小化确定对于所有可能的p值的最佳拟合点。min{p}{Σk(Rk(p)-Dk)2}---(3)]]>在等式3中,对于分布图中所有细胞成分取内推的反应分布图和诊断分布图之差的绝对平方之和,下标为“k”。将该蛋白质活性水平p之和最小化确定以反应曲线表示的诊断分布图的最佳拟合点。使用现行的很多数学方法的任一种进行最小平方等式3的最小化,参见,例如,Press等,Numerical Recipes in C,第二版,剑桥大学出版社,第10,14章;Branch等,1996,Matlab Optimization Toolbox User’s Guide,Mathworks(Natick,MA)。
典型地,实验与按计划重复的实验之间反应的渐近值有所不同。在重复实验中,各细胞成分具有类似的相对的反应振幅,但是在一个实验中所有反应可能系统性地增大或减小。这可以使得等式3中测定的p值偏高或偏低。防止这些系统振幅偏差偏离求出的p的另一种拟合方法是将诊断微扰反应分布图和诊断分布图之间的相关性(correlation)最大化。该方法在数学上与最小平方方法紧密相关。根据该方法,从等式4的答案确定蛋白质活性水平p。max{p}{ΣkRk(p)Dk[(ΣkRk2(p))(ΣkDk2)]1/2}---(4)]]>
等式4可以通过在最小平方方法局势中所描述的方法计算。对于本领域技术人员显而易见的是上述拟合方法等价于将等式4的负值最小化。
在某些局势下,等式4非常浅显,因此测定的最大位置非常不准。具体地说,很多局势下,除了总体上渐增的p值计数,不同p值处反应分布图R(p)看起来非常相似。在这些局势下,优选通过等式3中的最小平方方法确定所有可能的p值的最佳拟合点。在不同细胞成分的相对反应振幅随着蛋白质活性变化而明显变化的局势下,例如,图2中详述的反应曲线,优选通过等式4最大化确定所有可能的p值的最佳拟合点。
在具体的实施方案中,本发明的方法可以用来确定细胞内多种蛋白质的活性水平。在这样的实施方案中,对于第i种蛋白质分开测定第1微扰水平处第k种细胞成分的微扰反应分布图,Ri,k(pi,l)。如上所述,内推对于各蛋白质的微扰反应分布图,产生对于各蛋白质内推的反应分布图,所述蛋白质的活性水平是要测定的,Ri,k(pi)。然后将诊断表达分布图D与各蛋白质的微扰反应曲线Ri(pi)的组合相比较,发现所有可能的{pi}值的最佳拟合点。
在特别优选的实施方案中,治疗的效果和/或疾病的程度足够低,如上所述,没有发现非线性或反馈效果。在这样一个实施方案中,可以简单地将微扰反应分布图与每种蛋白质的微扰反应曲线之和,即∑Ri(pi),相比较。因此,在通过将最小平方问题最小化而确定了最佳拟合点的实施方案中,最佳拟合点是等式5的答案。min{pi}{Σk(Dk-ΣiRi,k(pi))2}---(5)]]>5.3.2 评价统计学显著性求出最佳拟合诊断分布图的微扰反应分布图后,优选地,尽管是任选地,在一些实施方案中,对相应的拟合定义统计学显著性。
通过将从等式3的答案确定的最小残数值与预计的残数的概率分布图相比较,确定反应分布图与诊断分布图拟合的统计学显著性。越是不可能以这样一种分布图表示最小残数,相应的拟合显著性越大。在相关性最大化方法的局势下,对于等式4中发现的最大值可以使用相同的方法。特别地,可以发现最大值的预期分布图(如下所述),确定从该分布图确定的实际获得的最大值的统计学显著性。
可以通过本领域公知的方法估算残数的预期的概率分布图。典型地,以在关于输入概率分布图的现有假说基础上,分析估算该分布图。因为在这种局势下这样的分析学估算是困难的,优选以Fisher描述的方法为基础通过模型估算残数的分布图,参见,例如,Conover,第二版,1980,Practical Nonparametric Statistics,John Wiley。该方法通过处理输入数据的排列和随机子集提供经验残数分布图。详细地,这里,输入可以就诊断分布图中测定的细胞成分排列。
根据优选的方法,通过用随机化输入数据重复解答等式3(或等式4)并且积累残数来形成经验式残数分布图来确定残数分布图。借此,从与实际数据具有同样整体统计学的随机数据产生绘制的经验式残数分布图。详细地,首先,就细胞成分指数使诊断分布图数据或者反应分布图数据之一(但不是两者)随机化。下面的变换代表该随机化变换。
Dk-D∏(k)(6)Rk(pl)-R∏(k)(pl)在等式6中,∏代表对于每一分布图独立选择的微扰作用。根据等式6将诊断分布图或者各反应分布图之一(但不是两者)随机化。因此,通过测定点的独立的微扰作用从测定数据产生随机化的表达分布图数据。其次,然后通过选择数字近似技术(chosen namericalapproxination techniqne)来解答等式3(或者等式4),并且保存(save)得到的残数的值。重复这些步骤,使之足以随机化以确立足够的统计学显著性期望的残数概率分布图。为了获得99%或更好的可信水平(即p值小于0.01),需要大于100的随机度。
确立了经验式残数分布图,将实际测定的残数与确立的分布图相比较,从该分布图出发确定其概率。该概率是用于定义求出的反应分布图与诊断分布图相拟合的显著性。换句话说,通过设定的蛋白质活性水平比实际数据更好地拟合随机化数据的概率的最小值,在优选的实施方案中给出了细胞成分的组合与诊断分布图的任一拟合的统计学显著性。
在其中拟合至少具有药物科学中普遍使用的标准的95%概率阈值的局势下,可以认为相应的蛋白质活性水平具有合适的统计学显著性。在其它局势下,不可能满足可接受的统计学显著性阀值。如果这样,则在一些实施方案中,为了发现拟合具有选择的统计学显著性阀值的诊断分布图,优选地对于不同的蛋白质,可以有利地选择新的微扰分布图数据。
例如,在其中使用这些方法来鉴定具有基因突变或多态性的个体的本发明的实施方案中,微扰反应分布图数据常常由来自具有已知的由于药物治疗或基因突变的蛋白质微扰的个体的表达分布图数据组成。在这样的实施方案中,优选将统计学显著性定义为使已知的蛋白质微扰的微扰反应分布图与未表征的个体的诊断分布图相拟合。在其中拟合至少具有药物科学中普遍使用的标准的95%概率阈值的局势下,个体可以被确诊为具有相应的已知基因突变。或者,如果该拟合不具有至少95%的统计学显著性,那么将使用从具有其他的不同的已知蛋白质微扰的个体获得的微扰反应分布图,直到微扰反应分布图被鉴定为确实具有至少95%的统计学显著性来定义统计学显著性为一个或多个其他微扰反应分布图与诊断分布图的拟合。
5.3.3.执行系统和方法可以优选通过使用下面的计算机系统和根据下面的程序和方法执行前面部分中描述的分析方法。图5说明了适合执行本发明分析方法的例示的计算机系统。计算机系统501被详细说明为包括内部元件和连接的外部元件。该计算机系统的内部元件包括与主存储器503连接的处理器部件502。例如计算机系统501可以是200Mhz或更大时钟频率和具有32MB或更大主存储器的基于英特尔奔腾的处理器。
外部元件包括大容量存储器504。该大容量存储器可以是一个或多个硬盘(其一般与处理器和存储器一起包装)。这样的硬盘一般具有1GB或更大存储量。其他外部元件包括用户界面装置505,其可以是监视器和键盘,还有点击装置506,其可以是鼠标,或者其他图形输入装置(没有示出)。一般局势下,计算机系统501也连接网络链接507,其可以是与其他本地计算机系统,远程计算机系统Ethernet链接的部分,或者广域通信网络例如Internet链接的部分。该网络链接使得计算机系统501与其他计算机系统分享数据和处理任务。
在该系统操作期间加载到存储器中的是软件成分,其在本领域是标准的而对于本发明是具体的。这些软件成分集合起来使得计算机系统根据本发明方法运作。这些软件成分一般保存在大容量存储器504上。软件成分510代表操作系统,其负责运作计算机系统501及其网络连接。该操作系统可以是,例如Windows98或者WindowsNT。软件成分511代表该系统上通常存在的通用语言或功能,以有助于执行本发明特定的方法的程序。可以用来编辑本发明分析方法的程序的语言包括C和C++,或者较优选地,JAVA。最优选地,本发明的方法被汇编在算法软件包中,使得等式和处理的高级说明以符号进入,包括要使用的算法,从而使得使用者不需要过程性编程各等式或算法程序。这样的软件包包括来自Mathworks(Natick,MA)的Matlab,WolframResearch(Champaign,Illinois)的Mathematica,或来自Math Soft(Seattle,Washington)的S-Plus。因此软件成分512代表了如汇编于过程语言或符号程序包中的本发明的分析方法。在优选的实施方案中,计算机系统也包含特定蛋白质的微扰反应曲线的数据库513。更优选地,数据库513包含几种蛋白质的微扰反应曲线。
在例示的执行中,为了实施本发明的方法,使用者首先将诊断分布图数据加载到计算机系统501中。使用者从监视器和键盘505,或者从网络连接507链接的其他计算机系统,或者在可移动存储介质例如CD-ROM或软盘(没有示出)直接输入这些数据。接着使用者执行表达分布图分析软件512,其进行从一些蛋白质活性水平的微扰反应曲线数据测定的反应分布图和诊断分布图之差的目标函数的测定和最小化的步骤。在一个较优选的实施方案中,使用者加载微扰反应分布图数据并且通过分析软件512进行内推反应分布图数据以产生微扰反应曲线的步骤。
本发明还提供在根据本发明的方法测定蛋白质活性水平中使用的微扰反应曲线的数据库。本发明的数据库包括一种蛋白质,优选地几种不同的蛋白质,的微扰反应曲线,使得可以使用相同的数据库来测定几种不同的蛋白质的蛋白质活性水平。优选地,这样的数据库是电子形式的,其可以加载到例如图5中说明的并且上文描述过的计算机系统中。这样的电子形式包括加载到用来执行本发明方法的计算机系统的主存储器503中,或者通过网络连接507链接的其他计算机的主存储器中,或者大容量储存介质504上,或者可移动储存介质例如CD-ROM或软盘上的数据库。
在优选的实施方案中,可以通过使用测定细胞内特定蛋白质的活性水平的试剂盒来执行本发明的分析方法。这样的试剂盒含有微阵列,例如下面5.5.1部分中描述的那些。这样的试剂盒中包含的微阵列包括一个固相,例如一个表面,探针与该表面杂交或结合于该固相的已知位置上。优选地,这些探针由已知的核酸,不同的序列,组成,每一个核酸能与各种RNA或者与从其衍生的cDNA物质杂交。特别地,本发明的试剂盒中包含的探针是能与从各种RNA衍生的核酸序列特异性杂交的核酸,所述各种RNA已知应答于通过该试剂盒测定其活性的特定蛋白质的微扰会增加或减少。本发明的试剂盒中包含的探针优选基本上排除与应答于通过该试剂盒测定其活性的特定蛋白质的微扰不增加的各种RNA杂交的核酸。
在优选的实施方案中,本发明的试剂盒还包含微扰反应分布图数据库,例如本部分上文描述的数据库。
在另一个优选的实施方案中,本发明的试剂盒还包含能加载到例如本部分上文描述的并且在图5中详细说明的计算机系统的存储器中的表达分布图分析软件。本发明的试剂盒中包含的表达分布图分析软件与上文描述的表达分布图分析软件512基本相同。这样的软件能执行本发明的分析步骤。优选地,该软件引导计算机系统的处理器执行下面的步骤(a)接收所述细胞型细胞的诊断分布图,(b)接收所述细胞型的蛋白质的微扰反应曲线,和(c)测定对所述蛋白质的微扰水平,在该水平处,所述诊断分布图和从所述微扰反应曲线求出的微扰反应分布图之间的相似性最大。
执行本发明的分析方法的可替换系统和方法对本领域技术人员来说是显而易见的,并且在后面的权利要求书中包括。特别地,后面的权利要求书意要包括对于本领域技术人员显而易见的执行本发明方法的可替换的程序结构。
5.4 蛋白质微扰方法用于定向微扰细胞内蛋白质活性水平的方法越来越为人广泛公知并且在本领域中使用。进行这样的微扰时可以使用能特异性瞄向和可控性改变(例如,或者通过分级增加或激活或者通过分级减少或抑制)特定细胞成分(例如基因表达,RNA浓度,蛋白质丰度,蛋白质活性等等)任何这样的方法。优选的改变方法能各自瞄向多种细胞成分,并且最优选地,这样的细胞成分的大量部分,的每一种。
下面的方法是可以用来改变细胞成分从而产生蛋白质活性水平微扰的那些方法的示例,其中的微扰产生如前所述在本发明方法的步骤中使用的反应分布图。本发明可采用制造对蛋白质活性水平受控的微扰的其它方法。
优选在得自任何生物体的细胞型的细胞内进行对蛋白质活性的微扰,对于所述生物体其基因或表达序列信息是可知的,并且对于所述生物体具有可控性改变特异基因的表达的方法。目前正在进行对于几种真核生物包括人,线虫,Arabidopsis和蝇的基因组测序。在优选的实施方案中,使用酵母进行本发明,最优选使用啤酒糖酵母,因为已经测定了啤酒糖酵母菌株的全基因组的序列。另外,已有已被良好确立的方法可被用以对酵母基因的表达进行可控的改变。优选的酵母菌株是啤酒糖酵母菌株,其酵母基因组序列是公知的,例如S288C菌株或者其基本上等基因菌株(参见,例如,Nature 369,371-8(1994);P.N.A.S.923809-13(1995);E.M.B.O.J.135795-5809(1994);Science 2652077-2082(1994);E.M.B.O.J.152031-49(1996)),所有这些在此引用。但是,也可以使用其它菌株。从美国模式培养物保藏中心,Rockville,MD 20852可以获得酵母菌株。操作酵母的标准技术描述于C.Kaiser,S.Michaelis,和A.Mitchell,1994,酵母遗传学方法冷泉港实验室课程手册(Method in Yeast GeneticsA Cold SpringHarbor Laboratory Course Manual),冷泉港实验室出版社,纽约,和Sherman等,1986,酵母遗传学方法实验室手册(Method in YeastGeneticsA Laboratory Manual),冷泉港实验室,纽约,为了所有的目的将这两者全文在此引作参考。
下面描述的例示的方法包括使用可滴定表达系统,使用转染或病毒转导系统,直接改变RNA丰度或活性,直接改变蛋白质丰度,和直接改变蛋白质活性,包括使用具有特定的已知的作用的药物(或者一般的化学部分)。可滴定的表达系统适合用于啤酒糖酵母的任何已知的可滴定的或者相当的可控的表达系统都适合本发明(Mumbery等,1994,啤酒糖酵母的可调控表达转录活性的比较及其对异源表达的用途,核酸研究(Nucl.Acids Res.)225767-5768)。通常,转录调控控制基因表达,要调控的基因的启动子通过可控的外源启动子放置在其染色体上。酵母中最常使用的可调控启动子是GAL1启动子(Johnston等,1984,调节啤酒糖酵母中分岐的GAL1-GAL10启动子的序列,分子细胞生物学(Mol Cell.Biol.)81440-1448)。生长培养基中葡萄糖的存在强烈阻抑GAL1启动子,并且通过降低葡萄糖的丰度和加入半乳糖以分级的方式逐渐接通GAL1启动子至高水平表达。GAL1启动子对所感兴趣的基因表达的控制通常可以达到5-100倍范围。
其它常用的启动子系统包括MET25启动子(Kerjan等,1986,啤酒糖酵母MET25基因的核苷酸序列,核酸研究(Nucl.Acids Res.)147861-7871),其在生长培养基中不存在蛋氨酸时被诱导,和CUP1启动子,其由铜诱导(Mascorro-Gallardo等,1996,构建CUP1启动子基载体以调控啤酒糖酵母中的基因表达,Gene 172169-170)。所有这些启动子系统的可控性在于基因表达可以通过生长培养基中调控部分的丰度的增大的变化而被增强调控。
上面列出的表达系统的一个缺点在于启动子活性的控制(例如受碳源变化,一些氨基酸的去除的影响)经常引起细胞生理学的其他变化,这些变化独立地改变其他基因的表达水平。最近研制出的对于酵母的系统,Tet系统,很大程度减轻了这一问题(Gari等,1997,用于调节啤酒糖酵母中基因表达的四环素可调节启动子系统的一套载体,Yeast 13837-848)。哺乳动物表达系统中采用的Tet启动子(Gossen等,1995,哺乳动物细胞中四环素激活转录,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)895547-5551)受抗生素四环素或结构相关的化合物多西环素的浓度的控制。因此,当不存在西环素时,启动子诱导高水平的表达,加入提高水平的多西环素引起对启动子活性的增强的抑制。通过加入中等水平的药物可以在稳定态实现中等水平的基因表达。此外,给出启动子活性最大抑制的多西环素水平(10微克/毫升)对野生型酵母细胞的生长速度没有显著影响(Gari等,1997,用于调节啤酒糖酵母中基因表达的四环素可调节启动子系统的一套载体,Yeast13837-848)。
在哺乳动物细胞中,几种滴定基因表达的方法是可行的(Spencer,1996,对哺乳动物产生条件突变,遗传学动向(Trends Genet.)12181-187)。如上所述,Tet系统被广泛使用,在其原始形式中,其中加入多西环素抑制转录的“正向”系统,和在新的其中多西环素的加入刺激转录的“逆向”系统中(Gossen等,1995,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)895547-5551;Hoffmann等,1997,核酸研究(Nucl.Acids Res.)251078-1079;Hoffmann等,1996,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)835185-5190;Paulus等,1996,病毒学杂志(Journal of Virology)7062-67)。另一种常用的哺乳动物细胞可调控启动子系统是Evans及其同事发明的蜕皮激素诱导的系统(No等,1996,哺乳动物细胞和转基因小鼠蜕皮激素诱导的基因表达,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)933346-3351),其中表达受到加入到培养的细胞的muristerone的水平的控制。最后,可以使用Schreiber,Crabtree及其同事发明的“化学诱导的二聚化作用”(CID)系统(Belshaw等,1996,用诱导蛋白质异源二聚化作用的合成配体控制蛋白质缔合和亚细胞定位,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)934604-4607;Spencer,1996,对哺乳动物产生条件突变,遗传学动向(Trends Genet.)12181-187)和酵母中的相似系统调控表达。在该系统中,所感兴趣的基因置于CID-响应启动子的控制之下,并且转染到细胞中表达两种不同的杂合蛋白,一种由结合FK506的融合FKBP12的DNA-结合区组成。另一种杂合蛋白含有也融合FKBP12的转录激活区。CID诱导分子是FK1012,它是能同时结合DNA结合和转录激活杂合蛋白的FK506的同源二聚体版本。当FK1012分级存在时,受控基因的分级转录被激活。
正如本领域技术人员广泛公知的,对于上文描述的每一种哺乳动物表达系统,感兴趣的基因置于可调控启动子的调控下,携带该构建物的质粒与抗生素抗性基因一起被转染到培养的哺乳动物细胞中。一般局势下,将质粒DNA整合到基因组中,选择药物抗性菌落并且筛选受调控基因的合适的表达。或者受调控基因可以内推到附加型质粒例如pCEP4(Invitrogen,Inc.)中,所述质粒包含质粒复制所需要的EB病毒成分。
在优选的实施方案中,例如如上所述的可滴定表达系统被诱导在缺失相应的内源基因和/或基因活性的细胞或生物体,例如其中内源基因被破坏或缺失的生物体,中使用。产生这样的“剔除”的方法是本领域公知的,参见,例如,Pettitt等,1996,发育(Development)1224149-4157;Spradling等,1995,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)9210824-10830;Ramirez-Solis等,1993,酶学方法(Methods Enzymol.)225855-878;和Thomas等,1987,Cell 51503-512。用于哺乳动物细胞的转染系统靶基因的转染或病毒转导可以可控性引导哺乳动物细胞蛋白质活性水平的微扰。优选地,可以使用天然不表达所感兴趣的靶基因的细胞进行靶基因的转染或转导。这样的非表达细胞可以来自正常局势下不表达靶基因的组织或者靶基因可以在细胞内特异性突变。感兴趣的靶基因可以克隆到很多哺乳动物表达质粒,例如pcDNA3.1+/-系统(Invitrogen,Inc.)或逆转录病毒载体的一个中,并且导入到非表达宿主细胞中。可以通过选择该表达载体编码的药物抗性标记来分离表达靶基因的被转染或转导的细胞。基因转录水平单向性地与转染剂量相关。以该种方法,可以研究不同水平靶基因的效果。
使用该方法的一个具体的例子是筛选针对src家族蛋白质酪氨酸激酶,lak,T细胞受体激活途径的关键成分的药物(Anderson等,1994,T细胞信号和胸腺细胞发育中涉及的蛋白质酪氨酸激酶p56(lck),免疫学进展(Adv.Immunol.)56171-178)。该酶的抑制剂作为潜在的免疫抑制药物引起人们兴趣(Hanke JH,1996,发现新的有效力的src家族选择性酪氨酸激酶抑制剂,生物化学杂志(J.Biol.Chem)271(2)695-701)。可以得到不表达lck激酶的Jurkat T细胞系(JcaM1)的特异突变体(Straus等,1992,通过T细胞抗原受体的信号转导中涉及lck酪氨酸激酶的遗传学证据,Cell 70585-593)。因此,通过转染或转导将lck基因导入JCaM1允许通过lck激酶的调节的T细胞激活的特定微扰途径。转染或转导的效率以及微扰水平与剂量相关。该方法一般用于对正常局势下不表达要微扰的基因的细胞内基因表达或蛋白质丰度进行微扰。改变RNA丰度或活性的方法目前改变RNA丰度或活性的方法分三种,核酶,反义物质,和RNAaptamers(Good等,1997,基因治疗445-54)。将细胞可调控地应用于或暴露给这些本体允许对RNA的丰度进行可调控微扰。
核酶是能催化RNA裂解反应的RNA(Cech,1987,Science 2361532-1539;1990年10月4日公开的PCT国际公开WO90/11364;Sarver等,1990,Science 2471222-1225)。可以设计“发夹结构”和“锤头状”RNA核酶以特异性裂解特定靶mRNA。已经确立了用于设计具有核酶活性的短RNA分子的规则,所述短RNA分子能够以高度序列特异性方式裂解其它RNA分子并且可以瞄向基本上所有种类的RNA(Haseloff等,1988,Nature 334585-591;Koizumi等,1988,FEBSLett.,228228-230;Koizumi等,1988,FEBS Lett.,239285-288)。核酶方法涉及细胞暴露给这样的小RNA核酶分子并诱导其在细胞内表达(Grassi和Marini,1996,药学年报(Annals of Medicine)28,499-510;Gibson,1996,癌症和转移论述(Cancer and Metastasis Reviews)15287-299)。
核酶可以在体内被常规地表达并产生在裂解mRNA中有效催化,从而改变细胞内mRNA丰度的量(Cotten等,1989,体内核酶介导的RNA的破坏,The EMBO J.83861-3866)。特别地,根据先前原则设计并合成(例如通过标准的亚磷酰胺化学方法)的核酶编码DNA序列可以连接到编码tRNA的基因的反密码子干和环中的限制酶位点中,其然后可以通过本领域常规方法被转化到所感兴趣的细胞中并表达。优选地,也将可诱导的启动子(例如糖皮质激素或四环素反应元件)引入该构建物,使得可以选择性控制核酶表达。在该应用中tDNA基因(即tRNA的编码基因)是有用的,因为它们尺寸小,转录速度高,并在不同种类的组织中普遍表达。因此,核酶可以被常规设计以基本上裂解所有的mRNA序列,可以用编码这样的核酶序列的DNA常规转化细胞,使得表达可调控的、催化有效量的核酶。因此,基本上细胞内任何各种RNA的丰度都可以被微扰。
在另一个实施方案中,靶RNA(优选mRNA)物质的方法,特别是其翻译速度,可以通过可调控应用反义核酸来可调控抑制。这里所使用的“反义”核酸是指根据与编码区和/或非编码区的序列互补性能杂交靶RNA的具体序列(例如非聚腺苷酸)部分,例如其翻译起始区,本发明的反义核酸可以是能直接以可调控方式给与细胞的或者可以通过以足以微扰靶RNA的翻译的可调控量转录外源诱导的序列细胞内产生的双链或单链的寡核苷酸,RNA或DNA或者其修饰物或衍生物。
优选地,反义核酸至少有6个核苷酸,并且优选是寡核苷酸(范围自6个至大约200个寡核苷酸)。在具体方面,所述寡核苷酸有至少10个核苷酸,至少15个核苷酸,至少100个核苷酸,或者至少200个核苷酸。所述寡核苷酸可以是单链或双链的DNA或RNA或者其嵌合混合物或衍生物或修饰的版本。所述寡核苷酸可以在碱基部分,糖基部分或磷酸骨架处被修饰。所述寡核苷酸可以包括其它附加基团,例如肽,或者有利于跨细胞膜运送的试剂(参见,例如,Letsinger等,1989,美国国家科学院院刊(Pro.Natl.Acad.Sci.U.S.A.)866553-6556;Lemaitre等,1987,美国国家科学院院刊(Pro.Natl.Acad.Sci.U.S.A.)84648-652;1988年12月15日公开的PCT公开No.WO88/09810),启动杂交的裂解剂(参见,例如,Krol等,1988,生物技术(BioTechniques)6958-976)或嵌入剂(参见,例如,Zon,1988,药物研究(Pharm.Res.)5539-549)。
在本发明的优选方面,反义寡核苷酸,被优选地以单链DNA的形式提供。可以用本领域公知的成分在其结构的任何位置修饰所述寡核苷酸。
所述反义寡核苷酸可以包括至少一个修饰的碱基部分,其选自包括但不限于下面物质的组5-氟代尿嘧啶,5-溴代尿嘧啶,5-氯代尿嘧啶,5-碘代尿嘧啶,次黄嘌呤,黄嘌呤,4-乙酰基胞嘧啶,5-(羧基羟基甲基)尿嘧啶,5-羧基甲基氨基甲基-2-硫尿苷,5-羧基甲基氨基甲基尿嘧啶,二氢尿嘧啶,β-D-半乳糖queosine,肌苷,N6-异戊烯腺嘌呤,1-甲基鸟嘌呤,1-甲基肌苷,2,2-二甲基鸟嘌呤,2-甲基腺嘌呤,2-甲基鸟嘌呤,3-甲基胞嘧啶,5-甲基胞嘧啶,N6-腺嘌呤,7-甲基鸟嘌呤,5-甲基氨基甲基尿嘧啶,5-甲氧基氨基甲基-2-硫尿嘧啶,β-D-甘露糖queosine,5’-甲氧基羧基甲基尿嘧啶,5-甲氧基尿嘧啶,2-甲硫基-N6-异戊烯腺嘌呤,尿嘧啶-5-羟基乙酸(v),wybutoxosine,假尿嘧啶,queosine,2-硫胞嘧啶,5-甲基-2-硫尿嘧啶,2-硫尿嘧啶,4-硫尿嘧啶,5-甲基尿嘧啶,尿嘧啶-5-羟基乙酸甲酯,尿嘧啶-5-羟基乙酸(v),5-甲基-2-硫尿嘧啶,3-(3-氨基-3-N-2-羧基丙基)尿嘧啶,(acp3)w和2,6-二氨基嘌呤。
在另一个实施方案中,所述寡核苷酸包括至少一个修饰的糖基部分,所述糖基部分选自包括但不限于下面的组阿拉伯糖,2-氟代阿拉伯糖,木酮糖和己糖。
在另一个实施方案中,所述寡核苷酸包括至少一个修饰的磷酸骨架,选自硫代磷酸酯,二硫代磷酸酯,硫代磷酰胺,磷酰胺,磷酰二胺,甲基磷酸酯,烷基磷酸三酯和它们的甲缩醛(formacetal)或类似物。
在另一个实施方案中,所述寡核苷酸是2-α-端基异构体寡核苷酸。α-端基异构体寡核苷酸与其中链相互平行的与通常的β-单元相反的互补RNA形成特异的双链杂交物(Gautier等,1987,核酸研究(Nucl.Acids.Res.)156625-6641)。
所述寡核苷酸可以与另一种分子,例如肽,杂交触发交联剂,运送剂,杂交触发裂解剂等等接合。
根据本发明使用的反义核酸包括与靶各种RNA的至少一特异序列部分互补的序列。但是,尽管绝对互补是优选的,但这却不是必须的。“与RNA至少一部分互补”的序列在这里指具有足够的能与RNA杂交形成稳定双链的互补性的序列;在双链反义核酸局势下,双链DNA的单链可以这样进行试验,或者可以测试三链体生成。杂交的能力将取决于互补的程度和反义核酸的长度。一般局势下,杂交的核酸越长,其可能包含的与靶RNA的碱基错配就会越多并且仍然形成稳定的双链(或者三链体,这种局势是可能的)。本领域技术人员可以通过利用测定杂交复合体的熔点的标准方法确定可允许的错配程度。通过标准测试技术可以测定有效抑制靶RNA的翻译的反义核酸的量。
可以通过本领域公知的方法合成本发明的寡核苷酸,例如,通过使用DNA自动合成仪(例如从Biosearch,Applied Biosystems等购得)。例如,硫磷酸寡核苷酸可以通过Stein等的方法合成(1988,核酸研究(Nucl.Acids Res.)163209),甲基磷酸寡核苷酸可以使用控制的大孔玻璃聚合物载体制备(Sarin等,1988,美国国家科学院院刊857448-7451)等等。在另一个实施方案中,所述寡核苷酸是2’O-甲基核糖核苷酸(Inoue等,1987,核酸研究(Nucl.Acids Res.)156131-6148),或者嵌合的RNA-DNA类似物(Inoue等,1987,FEBSLett.215327-330)。
然后可以以可控方式将合成的反义寡核苷酸给与细胞。例如,反义寡核苷酸可以以控制的水平放置于它们可以被细胞摄取的细胞的生长环境。利用本领域公知的方法可以有助于反义寡核苷酸的摄取。
在一个可选择的实施方案中,本发明的反义核酸可以通过从外源序列转录而在细胞内调控性表达。例如,可以体内导入载体使其被细胞摄取,在细胞内该载体或者其部分被转录,产生本发明的反义核酸(RNA)。这样一种载体可以含有编码所述反义核酸的序列。这样一种载体可以保持附加型或者变成与染色体整合,只要它可以被转录生成期望的反义RNA。这样的载体可以通过本领域标准的重组DNA技术方法来构建。载体可以是用于哺乳动物细胞复制和表达的本领域公知的质粒,病毒或者其它。编码反义RNA的序列的表达可以通过在所感兴趣的细胞内起作用的本领域公知的任何启动子。这样的启动子可以是可诱导的或者组成型的。更优选地,通过为了实现所述反义寡核苷酸的调控表达而给与外源部分来调控或诱导启动子。这样的可调控启动子包括Tet启动子。较优选地,对于哺乳动物细胞可以使用的启动子包括但不限于SV40早期启动子区(Bernoist和Chambon,1981,Nature 290304-310),Rous肉瘤病毒的3’-长末端重复中包含的启动子(Yamamoto等,1980,Cell 22787-797),疱疹胸苷激酶启动子(Wagner等,1981,美国国家科学院院刊,781441-1445),金属硫蛋白基因的调控序列(Brinster等,1982,Nature 29639-42)等等。
因此,反义核酸可以被常规设计以基本上瞄向任何mRNA序列,细胞可以常规地用编码这样的反义序列的核酸或者通过暴露给编码这样的反义序列的核酸来转化,使得表达有效而可控量的反义核酸。因此,细胞内基本上所有的各种RNA的翻译都可以被可控地微扰。
最后,在另一个实施方案中,RNA aptamers可以被导入细胞内或者在细胞内表达。RNA aptamers是蛋白质的特异性RNA配体,例如可以特异性抑制它们的翻译的对于Tat和Rev RNA的配体(Good等,1997,基因治疗(Gene Therapy)445-54)。改变蛋白质丰度的方法改变蛋白质丰度的方法特别包括改变蛋白质降解速度的那些和使用抗体的那些(其结合影响天然靶蛋白质物质的活性的丰度的蛋白质)。提高(或降低)蛋白质物质的降解速度就降低(或提高)该物质的丰度。本发明可以使用本领域公知的响应升高的温度和/或暴露给特定的药物而可控性提高靶蛋白质的降解速度的方法。例如,一种这样的方法使用热诱导或药物诱导N-末端降解决定子(degron),其是在较高温度下(例如37℃)暴露降解信号从而促进蛋白质快速降解并且在较低温度下(例如23℃)潜伏以防止快速降解的N-末端蛋白质片段(Dohmen等,1994,Science 2631273-1276)。这样一种例示的降解决定子是Arg-DHFRts,一种其中N-末端Val被Arg置换和66位的Pro被Leu置换的鼠二氢叶酸还原酶变体。根据该方法,例如,通过本领域公知的标准的基因定向方法用编码融合蛋白质Ub-Arg-DHFRts-P(遍在蛋白的“Ub”链)的基因置换靶蛋白质P的基因(Lodish等,1995,细胞分子生物学,W.H.Freeman and Co.纽约,特别是第8章)。暴露其N-末端降解决定子翻译后N-末端遍在蛋白快速裂解。在较低温度下,Arg-DHFRts内在的赖氨酸没有暴露,没有发生融合蛋白的遍在蛋白化作用,降解程度低,活性靶蛋白质水平高。在较高温度(没有氨甲喋呤存在)下,Arg-DHFRts内在的赖氨酸暴露,发生融合蛋白的遍在蛋白化作用,降解快,活性靶蛋白质水平低。通过暴露氨甲喋呤可控性阻断降解的热激活。该方法适合响应其它诱导因子例如药物和温度变化的其它N-末端降解决定子。
(中和的)抗体也可以降低靶蛋白质丰度和直接或间接地降低它们的活性。通过可控性暴露给这样的抗体,可以可控性改变蛋白质丰度和/或活性。例如,通过将活性形式聚结为与野生型未聚结的野生型形式相比具有更小活性的复合体识别,蛋白质表面上合适的表位的抗体可以降低靶蛋白质的野生型活性形式的丰度,从而间接地降低其活性。或者,通过例如与活性位点直接作用或者通过阻断底物进入活性位点,抗体可以直接降低蛋白质活性。相反地,在某些局势下,(激活的)抗体也可以与蛋白质或者它们的活性位点相互作用来提高最后的活性。在任何条件下,(通过要描述的方法)可以产生抗特异性蛋白质种类的(各种要描述类型的)抗体并且筛选它们的效能。可以测定抗体的作用并且选择提高或降低靶蛋白质物质浓度和/或活性的合适的抗体。这样的测定涉及将抗体引入细胞(见下文),通过本领域公知的标准方法(例如免疫测定)测定靶蛋白质的野生型量的浓度或活性。通过适合靶蛋白质的已知活性的测定方法可以测定野生型的净活性。
可以以多种方式将抗体引入细胞,包括,例如将抗体微注射到细胞内(Morgan等,1988,今日免疫学(Immunology Today)984-86)或者将编码期望的抗体的杂交瘤mRNA转化到细胞中(Burke等,1984,Cell 36847-858)。在另一项技术中,可以以基因工程方法制备重组抗体并且在多种非淋巴结细胞型中异位表达,以结合靶蛋白质并且阻断靶蛋白质活性(Biocca等,1995,细胞生物学动态(Trends in CellBiology)5248-252)。优选地,所述抗体的表达是在可调控启动子例如Tet启动子的控制下进行的。第一步是选择对于靶蛋白质具有合适的特异性的特殊单克隆抗体(见下文)。然后可以将编码选择的抗体的可变区的序列克隆到各种基因工程制备的抗体版本中,包括但不限于整个抗体,Fab片段,Fv片段,单链Fv片段(由一连接肽连接在一起的Vh和VL区)(“ScFv”片段),diabodies(具有不同特异性的两个结合的ScFv片段),等等(Hayden等,1997,免疫学最新见解(Current Opinion in Immunology)9210-212)。通过将其以与各种已知的细胞内前导序列的融合物的形式表达可以将细胞内表达的各种版本的抗体定向进入细胞组成部分(例如细胞质,细胞核和线粒体等等)(Bradbury等,1995,抗体过程(Antibody Engineering)(第2卷)(Borrebaeck编著),第295-361页,IRL Press)。特别地,ScFv版本表现出特别适合细胞质定向。
抗体类型包括但不限于多克隆抗体,单克隆抗体,嵌合抗体,单链,Fab片段,和Fab表达库。可以使用各种本领域公知的方法制备对于靶蛋白质的多克隆抗体。对于制备所述抗体,可以通过用靶蛋白质注射来免疫各种宿主,例如宿主动物,包括但不限于兔子,小鼠,大鼠等等。根据宿主物种,可以使用各种佐剂来提高免疫应答,包括但不限于弗氏(完全和不完全)佐剂,矿物凝胶,例如氢氧化铝,表面活性物质,例如溶血卵磷脂,多聚醇,聚阴离子,肽类,油状乳化剂,二硝基苯酚和潜在的人佐剂,例如杆菌Calmette-Guerin(BCG)和小型棒状杆菌。
对于制备定向靶蛋白质的单克隆抗体,可以使用通过在培养基中连续培养细胞系产生抗体分子的任何技术。这样的技术包括但不限于Kohler和Milstein(1975,Nature 256495-497)发明的杂交瘤技术,人B-细胞杂交瘤技术(Kozbor等,1983,今日免疫学(ImmunologyToday)472),和产生人单克隆抗体的EBV杂交瘤技术(Cole等,1985,单克隆抗体和癌症治疗,Alan R.Liss.Inc.,第77-96页)。在本发明另外的实施方案中,可以使用最近的技术(PCT/US90/02545)在无菌动物中产生单克隆抗体。根据本发明,可以使用人抗体,并且通过使用人杂交瘤(Cote等,1983,美国国家科学院院刊802026-2030),或者通过用EBV病毒体外转化人B细胞(Cole等,1985,单克隆抗体和癌症治疗,Alan R.Liss.Inc.,第77-96页)可以获得人抗体。事实上,根据本发明,可以使用通过剪接来自靶蛋白质特异性小鼠抗体分子的基因和来自适合生物学活性的人抗体分子的基因产生“嵌合抗体”的技术(Morrison等,1984,美国国家科学院院刊816851-6855;Neuberger等,1984,Nature 312604-608);Takeda等,1985,Nature 314452-454);这样的抗体包括于本发明的范围之内。
另外,在单克隆抗体是有益的局势下,可以使用噬菌体展示技术(Marks等,1992,生物化学杂志(J.Biol.Chem.)26716007-16010)从大的抗体库择一地选择。使用该技术,多达1012不同抗体的文库在fd丝状噬菌体的表面上表达,体外产生可用于单克隆抗体选择的抗体的免疫系统“单容库”(Griffiths等,1994,EMBO J.133245-3260)。可以通过本领域公知的技术从这样的文库中选择抗体,包括使噬菌体接触固定化的靶蛋白质,选择和克隆结合该靶物的噬菌体,将编码抗体可变区的序列亚克隆到表达期望的抗体版本的合适的载体中。
根据本发明,可以采用关于产生单链抗体的技术(美国专利4946778)来产生靶蛋白质特异性单链抗体。本发明另外的实施方案使用关于构建Fab表达文库的技术(Huse等,1989,Science 2461275-1281),快速而容易地鉴定具有靶蛋白质期望的特异性的单克隆Fab片段。
通过本领域公知的技术可以产生包含靶蛋白质独特型的抗体片段。例如,这样的片段包括但不限于F(ab’)2片段,其可以通过抗体分子的胃蛋白酶消化而产生;Fab’片段,其可以通过还原F(ab’)2片段的二硫桥键而产生;Fab片段,其可以通过用木瓜蛋白酶和还原剂处理抗体分子而产生;和Fv片段。
在抗体制备中,可以通过本领域公知的技术例如ELISA(酶联免疫吸附测定)完成对期望的抗体的筛选。为了筛选靶蛋白质特异性抗体,人们可以对产生的杂交瘤或者噬菌体展示抗体文库测定结合靶蛋白质的抗体。改变蛋白质活性的方法直接改变蛋白质的方法特别包括显性失活突变(dominant negutiremutation),特异性药物(在本申请意义下使用)或者一般的化学部分,还有如上所述的,使用抗体。
显性失活突变是当在细胞内表达时破坏靶蛋白质物质的活性的内源基因突变或外源基因突变。根据靶蛋白质的结构和活性,存在指导构建破坏该靶物的活性的显性失活突变的合适的策略的选择的一般规则(Hershkowitz,1987,Nature 329219-222)。在活性单体形式局势下,失活形式的过量表达可以引起对天然底物或配体的竞争,足以明显降低靶蛋白质的净活性。这样的超表达可以通过例如缔合一个提高活性的启动子,优选可调控或可诱导启动子,和所述突变基因来实现。或者,可以改变活性位点残基使得与靶配体发生基本上不可逆的缔合作用。这可以通过用某些酪氨酸激酶小心置换活性位点丝氨酸残基来实现(Perlmutter等,1996,免疫学最新见解(Current Opinion inImmunology)8258-290)。
在活性多聚体形式下,几种策略可以指导显性失活突变的选择。通过表达结合多聚体缔合区并且防止多聚体形成的外源蛋白质片段编码基因可以可控性降低多聚体活性。或者,特定类型的失活蛋白质单元的可调控超表达可以阻碍失活多聚体中的野生型活性单元,从而降低多聚体活性(Nocka等,1990,The EMBO J.91805-1813)。例如,在二聚体DNA结合蛋白局势下,DNA结合区可以从DNA结合单元缺失,或者活性区可以从活性单元缺失。还有,在这种局势下,DNA结合区单元可以在没有引起与活性单元缔合的区存在下被表达。因此,DNA结合位点被束缚,没有任何激活表达的可能。在特定类型的单元在活化过程中正常经历构象变化的局势下,刚性单元的表达可以使得到的复合体失活。对于另一个实施例,细胞机制例如细胞游动性,有丝分裂过程,细胞结构等等,中涉及的蛋白质一般由几种类型的很多亚单位的缔合组成。这些结构常常对包含了一些结构有缺陷的单体单元而逆成的破坏高度敏感。这样的突变体单体破坏相关的蛋白质活性并且可以在细胞内被可调控地表达。
除了显性失活突变外,通过本领域公知的突变和筛选方法可以发现对温度(或者其它外界因素)敏感的突变体靶蛋白质。
本领域技术人员还应该理解可以使用结合和抑制靶蛋白质的抗体的表达作为另一种显性失活策略。具体的已知作用的药物一些靶蛋白质的活性可以通过暴露给外源药物或配体而可控性改变。在优选的局势下,已知一种药物只与细胞内一种靶蛋白质作用并且只改变那一种靶蛋白质的活性。将细胞分级暴露给不同量的那种药物,从而引起对于那种蛋白质的分级微扰途径。该改变可以降低或者提高活性。较优选地,药物是已知的并且使用只改变几种(例如2-5)具有分开的截然不同的和非重叠作用的靶蛋白质的活性的药物。分级暴露给这样一种药物引起对于那种靶蛋白质的几种途径的分级微扰。已知基因的杂合突变如上所述,存在大量的蛋白质,它们的功能严重影响具体的生理途径。在蛋白质活性水平被破坏了两个等位基因的一个的活性的突变所破坏的局势下,有可能分析来自已知具有杂合突变的一系列个体的表达分布图以鉴定可能有助于鉴定未表征的携有类似的失活突变的个体的反应分布图。
5.5.测定方法通过测定通过微扰蛋白质活性水平改变的细胞成分获得诊断和微扰反应分布图,用于本发明。这些细胞特征可以是细胞生物学状态的任何方面。它们可以是转录态,其中测定RNA丰度,翻译态,其中测定蛋白质丰度,激活态,其中测定蛋白质活性。细胞特征也可以是混合方面,例如,其中测定一种或多种蛋白质的活性和细胞成分的RNA丰度(基因表达)。本部分举例描述了受破坏的或微扰的蛋白质活性水平影响的细胞成分的测定方法。本发明可采用这种测定的其它方法。
以测定药物的转录态和途径响应为基础的本发明的实施方案是优选的。可以通过下面部分描述的与核酸阵列或核酸模拟探针杂交的技术或者通过下面部分描述的其它基因表达技术来测定转录态。不管是用何种技术进行测定,结果是包括代表RNA丰度比例的值的反应数据,其通常反映DNA表达比例(RNA降解速度没有不同)。这样的测定方法在5.5.1.部分中描述。
在本发明各种实施方案中,可以测定除了转录态以外的其它生物学状态方面,例如翻译态,激活态或者混合方面。在该部分详细描述了这些实施方案。这样的测定方法在5.5.2.部分中描述。
5.5.1.转录态测定优选地,通过与在本分部中描述的转录阵列杂交进行转录态的测定。本分部的后面部分描述转录态测定的一些其它方法。一般性描述转录阵列在本发明优选的实施方案中使用“转录物阵列”(这里也称之为“微阵列”)。转录物阵列可以用来分析细胞内的转录态,特别是测定暴露给分级水平的感兴趣的药物或者感兴趣的生物学途径的分级微扰的细胞的转录态。
在一个实施方案中,可以通过使代表细胞内存在的mRNA转录物的可检测的标记的多核苷酸(例如从总的细胞mRNA合成的荧光标记的cDNA)与微阵列杂交来制备转录物阵列。微阵列是具有细胞或生物体的基因组中的很多基因,优选大多数基因或几乎所有基因,的产物的有序排列的结合(例如杂交)位点的平面。微阵列可以以多种方法制备,其中几种方法在下文中描述。制备时,微阵列具有一些特征阵列可重复产生,使得产生给定阵列的的多个拷贝并且容易相互比较。优选地,微阵列要小,通常小于5cm2,可以用在结合(例如核酸杂交)条件下稳定的材料制备。微阵列中给定结合位点或者独特一套结合位点将特异性结合细胞内单一基因的产物。尽管对于每个特定的mRNA可能存在一个以上的物理结合位点(下面称之为“位点”),但是为了清楚起见,下面的讨论将假设只有单一位点。
应该明白当制备与细胞RNA互补的cDNA并且在合适的杂交条件下与微阵列杂交时,相应于任何特定基因的阵列中的位点杂交的水平将反映从那个基因转录的mRNA的细胞内优势。例如,当与总的细胞mRNA互补的经过可检测标记的(例如用荧光团)cDNA与微阵列杂交时,相应于细胞中没有转录的基因(即能特异性结合基因产物)的阵列上的位点几乎没有或者没有信号(例如荧光信号),编码的mRNA是优势的基因将具有相对强的信号。
在优选的实施方案中,来自两种不同的细胞的cDNAs与微阵列的杂交位点杂交。在药物反应的局势下,一个细胞暴露给药物,另一个相同类型的细胞没有暴露给药物。在途径反应的局势下,一个细胞暴露给途径微扰,另一个相同类型的细胞没有暴露给途径微扰。将从两种细胞型的每一种衍生的cDNA进行不同的标记使得可以区别它们。在一个实施方案中,例如使用荧光标记的dNTP合成用药物(或者暴露给途径微扰)处理过的细胞的cDNA,而使用罗丹明标记的dNTP合成来自没有暴露给药物的第二细胞的cDNA。当两种cDNA混合并且与微阵列杂交时,对于阵列上的每一个位点测定来自每一套cDNA的信号相对强度,并且测定特定mRNA丰度的所有相对差异。
在上面描述的实施例中,当激发荧光基团时,来自药物处理过的(或者途径微扰)细胞的cDNA将发射绿荧光,而来自未处理的细胞的cDNA将发射红荧光。作为结果,当直接或间接药物处理对细胞内特定mRNA丰度没有影响时,mRNA在两种细胞中同样处于优势,逆转录时,红标记的和绿标记的cDNA将同样占优势。当与微阵列杂交时,针对那个各种RNA的结合位点将发射两种荧光基团的特征波长(当组合时呈棕色)。相反,当直接或间接用药物处理暴露给药物的细胞时,细胞内mRNA的优势提高,则绿与红荧光的比例将提高。当药物降低mRNA优势时,该比例将降低。
曾描述过用双色荧光标记和检测确定基因表达改变的方案,例如Shena等,1995,用互补DNA微阵列定量监测基因表达模式,Science270467-470,其全文为了所有目的在此引作参考。使用用两种不同的荧光团标记的cDNA的优点在于可以进行相应于两种细胞状态中各自的呈阵点排列的基因的mRNA水平的直接的内部控制的比较,由于实验条件(例如杂交条件)的较小差别而引起的差别将不影响随后的分析。但是,要理解也可以使用来自单细胞的cDNA,并且,例如,比较例如药物处理过的或途径微扰的细胞和没有处理过的细胞中特定的mRNA的绝对量。微阵列的制备微阵列是本领域公知的并且由一个表面组成,其序列与基因的产物相对应的探针(例如cDNAs,mRNAs,多肽及其片段)可以在该表面的已知位点特异性杂交或结合。在一个实施方案中,微阵列是一种阵列(即矩阵),其中每一个位置代表一个基因编码的产物(例如蛋白质或RNA)的分立的结合位点,其中对于生物体基因组中的大多数基因或者基本上所有的基因存在结合位点。在优选的实施方案中,“结合位点”(下文称之为“位点”)是核酸或核酸类似物,特定的相关的cDNA可以特异性与之杂交。结合位点的核酸或类似物可以是例如合成的寡聚物,全长cDNA,小于全长的cDNA,或者基因片段。
尽管在优选的实施方案中,微阵列中包含对于靶生物体基因组中的所有的或者几乎所有的基因的产物的结合位点,但是这种完整度并非是必需的。通常微阵列具有相应于基因组基因至少大约50%的结合位点,通常至少大约75%,更经常至少大约85%,更经常大于大约90%,最经常至少大约99%。优选地,所述阵列具有针对与感兴趣的药物的作用相关的或者与感兴趣的生物学途径相关的基因的结合位点。“基因”定义为在生物体中(例如,如果是单细胞生物)或者在多细胞生物体中的一些细胞中转录信使RNA的优选至少50,75或99个氨基酸的开读框(ORF)。基因组中的基因数目可以从生物体表达的mRNA的数目估算,或者通过从基因组完全表征的部分外推。当对感兴趣的生物体的基因组测序时,可以测定ORF的数目并且通过分析DNA序列来鉴定mRNA的编码区。例如,已经对啤酒糖酵母的基因组完全测序并且报道具有大约6275个比99个氨基酸长的可读框(ORFs)。对这些ORF的分析表明有5885个ORF可能规定蛋白质产物(Goffeau等,1996,具有6000个基因的生命,Science 274546-567,其全文为了所有目的在这里引作参考)。相反,估算人基因组包含大约105个基因。制备用于微阵列的核酸如上所述,关联的cDNA与之特异性杂交的“结合位点”通常是附接在结合位点的核酸或核酸类似物。在一个实施方案中,微阵列的结合位点是相应于生物体基因组中各基因的至少一部分的DNA多核苷酸。通过例如基因组DNA,cDNA(例如通过RT-PCR)或者克隆的序列的聚合酶链反应(PCR)扩增可以获得这些DNA。根据基因或cDNA的已知序列选择PCR引物,以获得单一的片段(即与微阵列上的任何其它片段不共同具有10个碱基以上的连续的相同的序列)的扩增。在设计具有要求的特异性和最佳扩增性质的引物中计算机程序是有用的。参见,例如,Oligo 5.0版本(National Bioscience)。在结合位点对应于非常长的基因的局势下,有时期望扩增接近基因的3’末端的片段使得当寡脱氧胸苷引物cDNA探针与微阵列杂交时,小于全长的探针将有效结合。微阵列上的每一个基因片段一般将在大约50bp和大约2000bp之间,更一般地在大约100bp和大约1000bp之间,通常长度在大约300bp和大约800bp之间。PCR方法是公知的,并且描述于例如Innis等编著,PCR方法方法和应用指南,Acadmic Press Inc.San Diego,CA,其全文为了所有目的在此引作参考。计算机自动控制系统对于分离和扩增核酸是有用的这一点是显而易见的。
产生用于微阵列的核酸的替代方法是通过使用N-磷酸酯或亚磷酰胺化学方法合成合成的多核苷酸或寡核苷酸(Froehler等,1986,核酸研究(Nucleic Acid Res)145399-5407;McBride等,1983,四面体快讯(Tetrahedron Lett.)24245-248)。合成的序列长度在大约15和大约500个碱基之间,更典型地在大约20和大约50个碱基之间。在一些实施方案中,合成的核酸包括非中性碱基,例如肌苷。如上所述,核酸类似物可以用作用于杂交的结合位点。合适的核酸类似物的实施例是肽核酸(参见,例如,Egholm等,1993,PNA与互补寡核苷酸杂交遵守Watson-Crick氢健成键规则,Nature 365566-568;也参见美国专利No.5539083)。
在另一个实施方案中,从基因,cDNA(例如表达的序列尾端)的质粒或噬菌体克隆或者其内推物制备结合(杂交)位点(Nguyen等,1995,通过排列的cDNA克隆的定量杂交评价鼠胸腺中不同的基因表达,基因组(Genomics)29207-209)。在另一个实施方案中,结合位点的寡核苷酸是RNA。将核酸附着于固体表面将核酸或类似物附着于固体载体,所述固体载体可以用玻璃,塑料(例如聚丙烯,尼龙),聚酰胺,硝基纤维素或者其它材料制备。将核酸附着于表面上的优选的方法是通过印到玻璃板上,这一点Schena等人一般性描述过,1995,用互补DNA微阵列定量检测基因表达模式,Science 270-470。该方法特别适用于制备cDNA微阵列。也参见DeRisi等,1996,使用cDNA微阵列分析人癌症中基因表达模式,NatureGenetics 14457-460;Shalon等,1996,使用两色荧光探针杂交分析复合DNA样品的DNA微阵列系统,Genome Res.6639-645;和Schena等,1995,平行人基因组分析;1000个基因的基于微阵列的表达,美国国家科学院院刊9310539-11286。所有提到的文献的全文为了所有目的引作参考。
制备微阵列的第二个优选的方法是通过制备高密度的寡核苷酸阵列。用于使用原位合成的光刻技术制备包含上千个与表面上确定的位置处确定的序列互补的寡核苷酸的阵列的技术是已知的(参见,Fodor等,1991,光导向空间可寻址平行化学合成Science 251767-773);Pease等,1994,用于快速DNA序列分析的光导向寡核苷酸阵列,美国国家科学院院刊915022-5026;Lockhart等,1996,通过与高密度寡核苷酸阵列杂交监测表达,自然生物技术(Nature Biotech)141675;美国专利5578832;5556752;和5510270,这些文献为了所有的目的全文引作参考。或者可以引用用于快速合成和存贮确定的寡核苷酸的其它方法(Blanchard等,1996,高密度寡核苷酸阵列,Biosensors& Bioelectronicsll687-90)。当使用这些方法时,在表面上,例如在衍生的载玻片上,直接合成已知序列的寡核苷酸(例如20个单体)。通常,制备的阵列是丰余的,对于每一个RNA有几个寡核苷酸分子。可以选择寡核苷酸探针可选地检测被剪接的mRNA。制备微阵列的另一种优选的方法是使用喷墨印刷方法在固相上直接合成寡核苷酸,例如在Blanchard于1998年1月16日申请的未决美国专利申请登记号No.09/008120,发明标题“使用溶剂微点滴的化学合成”描述的,其全文在此引作参考。
也可以使用制备微阵列的其它方法,例如光刻掩膜(masking)(Maskos和Southern,1992,核酸研究(Nuc.Acids Res.)201679-1684)。基本地,可以使用任何类型的阵列,例如尼龙杂交膜上的点印迹(参见Sambrook等,分子克隆-实验室手册(第二版),Vol.1-3,冷泉港实验室,冷泉港,纽约,1989,为了所有目的其全文引作参考),但是,正如本领域技术人员公知的,非常小的阵列是优选的,因为杂交体积将较小。产生标记的探针制备总的和poly(A)+RNA的方法是公知的并且一般性描述于上文Sambrook等的文献中。在一个实施方案中,使用硫氰酸胍裂解后通过CsCl离心从本发明感兴趣的各种类型的细胞提取RNA(Chirgwin等,1979,生物化学(Biochemistry)185294-5299)。通过用寡-dT纤维素筛选来选择Poly(A)+RNA(参见上文Sambrook等的文献)。感兴趣的细胞包括野生型细胞,暴露给药物的野生型细胞,修饰的细胞和暴露给药物的修饰的细胞。
通过寡脱氧胸苷引物或随机引物逆转录从mRNA制备标记的cDNA,所述两种方法是本领域公知的(参见,例如Klug和Berger,1987,酶学方法(Methods Enzymol.)152316-325)。逆转录可以在与可检测的标记物接合的dNTP,优选地荧光标记的dNTP,的存在下进行。或者,分离的mRNA可以被转化为通过在标记的dNTPs的存在下体外转录双链cDNA合成的标记的反义RNA(Lockhart等,1996,通过与高密度寡核苷酸阵列杂交监测表达,自然生物技术(Nature Biotech)141675,其全文为了所有的目的引作参考)。在另一个实施方案中,可以在没有可检测标记存在下合成cDNA或RNA探针并且可以接着通过例如内推生物素化的dNTPs或rNTP标记,或者通过一些类似的方法(例如使生物素的补骨脂素衍生物与RNA交联),接着加入标记的链霉亲和素(例如用藻红蛋白缀合的链霉亲和素)或其等价物来进行标记。
当使用荧光标记的探针时,很多合适的荧光团是已知的,包括荧光素,丽丝胺,藻红蛋白,诺丹明(Perkin Elmer Cetus),Cy2,Cy3,Cy3.5,Cy5,Cy5.5,Cy7,FluorX(Amersham)和其它(参见,例如,Kricka,1992,非同位素DNA探针技术,Academic Press San Diego,CA)。要明白要选择具有不同发射谱的荧光团对使得它们可以容易被区分。
在另一个实施方案中,使用了不是荧光标记的标记。例如,可以使用放射性标记,或者具有特征发射谱线的放射性标记对(参见Zhao等,1995,高密度cDNA过滤分析大规模定量分析基因表达的新的方法,Genel56207;Pietu等,1996,高密度cDNA阵列的定量杂交发现人肌肉内优先表达的新的基因转录物,基因组研究6492)。但是,由于放射性颗粒的散射,导致需要多的结合位点,使用放射性同位素是较优选的实施方案。
在一个实施方案中,通过在42℃下将含有0.5mM dGTP,dATP和dCTP加0.1mM dTTP加荧光脱氧核糖核苷酸(例如0.1mM诺丹明110UTP(Perken Elmer Cetus)或0.1mM Cy3 dUTP(Amersham)与逆转录酶(例如SuperScriptTMII,LTI Inc.)培养60分钟来合成标记的cDNA。与微阵列杂交选择核酸杂交和洗涤条件,使得探针与特异性阵列位点“特异性结合”或“特异性杂交”,即探针与具有互补核酸序列的序列阵列位点杂交,形成双链或结合但是不与具有非互补核酸序列的位点杂交。如这里所使用的,当多核苷酸的较短的片段小于或等于25个碱基,而且应用标准碱基配对规则没有发生错配时,或者当多核苷酸的较短的片段大于25个碱基,而且其错配不大于5%时,该寡核苷酸序列被认为与另一个互补。优选地,多核苷酸完全互补(没有错配)。通过进行杂交测试,包括阴性对照,容易证明具体的杂交条件导致具体的杂交(参见,例如,上文Shalon等的文献和Chee等的文献)。
最佳杂交条件将取决于标记探针和固定化多核苷酸或寡核苷酸的长度(例如寡聚物比多核苷酸多200个碱基以上)和类型(例如RNA,DNA,PNA)。对于核酸的特异(即严格)杂交条件的一般参数描述于Sambrook等,上文,和Ausubel等,1987,分子生物学最新方法,GreenePublishing and Wiley-Interscience,纽约,其全文为了所有的目的引作参考。当使用Schena等的cDNA微阵列时,典型的杂交条件是在5×SSC加0.2%SDS中在65℃下杂交4小时,接着在低严格度洗涤缓冲液(1×SSC加0.2%SDS)中在25℃下冲洗,接着在高严格度洗涤缓冲液(0.1×SSC加0.2%SDS)中在25℃下培养10分钟(Shena等,1996,美国国家科学院院刊9310614)。例如Tijessen,1993,与核酸探针杂交,Elsevier Science Publisher B.V.and Kricka,1992,非同位素探针技术,Academic Press San Diego,CA。信号检测和数据分析当使用荧光标记的探针时,可以优选地通过扫描共聚焦激光显微术检测转录物阵列的每一个位点处的荧光发射。在一个实施方案中,使用合适的激发线,对所使用的两个荧光团的每一个进行分开扫描。或者,可以使用激光,使在对两种荧光团特异性的波长下同时照射样品,并且可以同时分析两种荧光团的发射(参见Shalon等,1996,使用两色荧光探针杂交分析复合DNA样品的DNA微阵列系统,基因组研究6639-645,其全文为了所有目的引作参考)。在优选的实施方案中,用带有可用计算机控制的X-Y载物台和显微镜物镜的激光荧光扫描器扫描阵列。用多线路混合气激光器连续激发两种荧光团,并且用波长分辨发射光并用两个光电倍增器管检测。荧光激光扫描装置描述于Schena等,1996,基因组研究6639-645以及这里引述的其它参考文献。或者可以使用Ferguson等,1996,自然生物技术(NatureBiotech.)141681-1684中描述的纤维光学束来同时在很多点监测mRNA丰度水平。
用计算机对信号进行记录并且在一个优选的实施方案中,进行分析,例如使用口位模拟数字板。在一个实施方案中,使用图形程序(例如Hijaak Graphics Suite)将扫描的图象去斑点然后使用各波长下在各位点处产生平均杂交的扩展面的图象分格程序分析。如果需要,可以通过实验确定两种荧光频道之间重叠的校正。对于转录物阵列上任何特定的杂交位点,可以计算两种荧光团的发射比例。该比例与同源基因的绝对表达水平无关,但是对于那些表达明显受给药,基因缺失或者任何其它被测试的事件的调控的基因是有用的。
根据本发明方法,以其微扰和其测定的幅度(即试验的两种来源的mRNA的丰度不同),或者以没有被微扰(即相对丰度是相同的)评价两种细胞或细胞系中mRNA的相对丰度。如这里所使用的,两种来源的RNA之差达到至少大约25%(来自一个来源的RNA在一个来源比在另一个来源丰度多25%),更通常大约50%,更经常大约2倍(为丰度的2倍),3倍(为丰度的3倍)或5倍(为丰度的5倍)的被评价为微扰。目前的检测方法可靠地检测大约3倍至大约5倍的差异,但是期望开发出更敏感方法。
优选地,除了鉴定微扰为阳性或阴性外,测定微扰的数值是有利的。如上所述,可以通过计算用于不同标记的两种荧光团的发射的比例,或者通过对本领域技术人员显而易见的类似方法进行该数值测定。反应分布图的测定在本发明的一个实施方案中,通过各对应于(即互补于)所感兴趣的不同细胞的mRNA的两种不同标记的探针的混合物与微阵列进行杂交来制备反映感兴趣细胞的转录态的转录物阵列。根据本发明,两种细胞是同型的,即相同的物种和菌株,但是其少量(例如一个,两个,三个或五个,优选一个)位点在遗传学上可以不同。或者,它们是等基因的但是环境经历(例如暴露给药物相对于没有暴露)不同。
为了测定反应分布图,在存在对感兴趣的蛋白质的活性的分级微扰的局势下制备或培养细胞。使用暴露给微扰的细胞和没有暴露给微扰的细胞构建转录物阵列,测定该阵列以发现具有改变的表达的mRNA和由于暴露给药物的改变的程度。这样,获得反应分布图。
分级微扰控制参数(graded pertarbation control parament)的水平的密度受个体基因反应的锐度和结构左右-反应的最岐部分越岐,适当分辨该反应所需的水平越密集。图2的实施例大体指明例示的密度。那里,上百倍浓度范围下六次暴露给氨甲喋呤刚好足以分辨基因表达反应。但是,优选更多次暴露以更详细地表达该途径。
此外,为了减小实验误差,交换两色差别杂交试验中的荧光标记以减小各基因或阵列点位点特殊的误差。换句话说,优选首先用要测定的两个细胞的mRNA的一个标记(例如,用第一种荧光染料标记的微扰细胞和用第二种荧光染料标记的未微扰的细胞)测定基因表达,其次测定交换标记的两个细胞(例如,用第二种荧光染料标记的微扰细胞和用第一种荧光染料标记的未微扰的细胞)的基因表达。对暴露水平和微扰控制参数水平多次测定提供了附加的实验误差对照。通过足够的取样,当选择用来内推平均误差和反应函数中格结构缺失之间的反应数据的仿样函数S的阔度时可以进行折衷。用荧光标记变换对药物暴露和微扰控制参数间隔重复测定大约10次,并且对于每个药物反应或微扰反应需要大约20次杂交试验,实现对途径和它们的成员基因和蛋白质的可靠的鉴定。诊断分布图的测定对于其中可能期望分析一些蛋白质的活性水平的任何细胞型可以获得诊断分布图。优选地,蛋白质一定是其微扰反应分布图是已知的或者可以产生的蛋白质。可能期望获得诊断分布图的细胞包括,例如,怀疑具有破坏蛋白质活性水平的基因突变或多态性的细胞,以及暴露给可以影响蛋白质活性水平的药物或药物组合物的细胞。
为了测定怀疑具有影响蛋白质活性的基因突变或多态性的细胞的诊断分布图,使用怀疑具有的基因突变或多态性的细胞和相同细胞型的野生型细胞构建转录物阵列,测定该阵列以发现具有由于基因突变或多态性的改变的表达的mRNA。因此获得诊断分布图。
为了测定暴露给药物的细胞的诊断分布图,将细胞暴露给一定水平的感兴趣的药物,优选地,所述水平对应于药物的临床剂量。当体外培养细胞时,通常将药物加入它们的营养培养基中。在酵母局势下,优选在早对数期收集酵母,因为那时收获时表达模式相不敏感。根据药物的特定特性,以分级的量加入药物,但是通常在大约1ng/ml和100mg/ml之间。在一些局势下,将药物溶解于溶剂,例如DMSO中。
使用暴露给药物的细胞和没有暴露给药物的细胞构建转录物阵列,测定该阵列以发现具有由于暴露给药物而改变的表达的mRNA。因此获得药物反应。
类似于反应分布图的测定,还优选用于诊断分布图,在两色差别杂交局势下,也使用交换标记进行测定。转录态测定的其它方法通过本领域公知的其它基因表达技术可以测定细胞的转录态。几种这样的技术形成电泳分析有限复杂度的限制性片段的集合,例如将相引物与双限制酶消化相结合的方法(参见,例如,Zabeau等,1992年9月24日申请的欧洲专利0534858A1,),或者用与确定的mRNA末端最接近的位点选择限制片段的方法(参见,例如,Prashar等,1996,美国国家科学院院刊93659-663)。统计学取样cDNA库的其它方法,例如对多个cDNA的每一个通过测序足够的碱基(例如20-50个碱基)以鉴定每一个cDNA,或者通过对在相对于确定的mRNA尾端的已知位点处产生的短的尾端(例如9-10个碱基)进行测定(参见,例如,Velculescu,1995,Science 270484-487)。
5.5.2.测定生物学状态的其它方面在本发明的各实施方案中,为了获得药物和途径反应,可以测定转录态以外的其它方面的生物学状态,例如翻译态,激活态或者混合方面。本部分详细描述这些实施方案。以翻译态测定为基础的实施方案根据几种方法可以测定翻译态。例如,通过构建微阵列可以进行蛋白质的全基因组监测(即“蛋白质组(proteome)”,Goffeau等,),上文所述微阵列中结合位点包括固定化的,优选单克隆的,对于细胞基因组编码的多种蛋白质物质特异性的抗体。优选地,对于大部分编码的蛋白质存在抗体,或者至少对于那些与感兴趣的药物的作用相关的蛋白质存在抗体。制备单克隆抗体的方法是公知的(参见,例如,Harlow和Lane,1988,抗体实验室手册,冷泉港,纽约,其为了所有目的全文引作参考)。在优选的实施方案中,产生抗以细胞的基因组序列为基础设计的合成的肽片段的单克隆抗体。使用这样的抗体阵列,将来自细胞的蛋白质与该阵列接触,并且用本领域公知的测试方法测定它们的结合。
或者,可以通过双向凝胶电泳系统分离蛋白质。双向凝胶电泳是本领域公知的并且一般涉及沿着第一向进行等电聚焦电泳然后沿着第二向进行SDS-PAGE电泳。参见,例如,Hames等,1990,蛋白质凝胶电泳实验方法,IRL Press,纽约;Shevchenko等,1996,美国国家科学院院刊931440-1445;Sagliocco等,1996,酵母(Yeast)121519-1533;Lander,1996,Science 274536-539。可以通过多种技术分析得到的电泳图,包括质谱技术,蛋白质印迹和使用多克隆和单克隆抗体的免疫印迹分析,和内部和N-末端微测序。使用这些技术,可能鉴定在给定生理条件下,包括在暴露给药物的细胞(例如酵母)中,或者在通过例如特异基因的缺失或超表达改变的细胞中产生的所有蛋白质的大部分组分。以其它方面生物学状态为基础的实施方案尽管测定除mRNA丰度以外的细胞成分目前存在监测mRNA所没有遇到的一些技术困难,但是本发明方法的应用,包括各种已知途径微扰方法的应用,适用于可以监测的任何细胞成分,这对于本领域技术人员是显而易见的。
特别地,在可以测定与药物作用的特征相关的蛋白质的活性的局势下,本发明的实施方案可以以这样的测定为基础。活性测定可以通过适合要表征的特定活性的任何功能,生物化学或物理方法来进行。在活性涉及化学转化的局势下,细胞蛋白质可以接触天然底物,并且测定转化速度。活性涉及多聚体单元缔合时,例如激活的DNA结合复合体与DNA缔合,可以测定缔合的蛋白质的量或缔合的第二产物的量,例如转录的mRNA的量。在只有功能活性已知的局势下,例如在细胞周期控制中,可以发现功能的效率。不管是如何已知或测定的,蛋白质活性的变化形成通过上述本发明方法分析的反应数据。
在替代的和非限制性实施方案中,细胞的生物学状态的混合方面可以形成反应数据。可以由,例如,一些mRNA丰度的变化,一些蛋白质丰度的变化,和一些蛋白质活性的变化构成反应数据。
5.6 本发明的应用本发明在生物学和药学领域具有多种用途,这里介绍其中几种。很多其它用途对于本领域技术人员来说是显而易见的,并且为后面的权利要求书的范围所包括。
在一个应用中,本发明提供一种鉴定具有破坏重要的基因的功能的突变和/或多态性的个体的方法。如上文所述,存在多种癌症易感性基因,决定药物代谢的多种基因,和确定多种疾病状态存在的基因,一旦这些基因的两个等位基因的一个被改变,它们就会增大很多与健康相关的问题的风险。
但是,经常不可能测定杂合局势下有缺陷的基因型,因为也存在该基因的野生型拷贝。而且,突变的拷贝的精确序列一般不可得知。本发明方法提供了这样的信息。
例如,当被提供有与特定疾病状态相关并且也与特定基因产物,优选地特定的蛋白质,相关的易感性基因时,本发明的方法可以用来鉴定具有影响其相关的基因产物的活性水平的基因的突变和/或多态性的个体,从而鉴定具有与特定基因的突变和/或多态性相关的疾病状态增大的易感性的个体。
可通过直接应用5.2部分一般性描述的方法,特别是下面的5.3部分,特别是参考图3的方法来实施本发明。因此,一方面,通过下面步骤实现本发明(i)通过测定细胞内,或者更典型地,从怀疑具有破坏特定蛋白质的活性的基因突变和/或多态性的个体获得的细胞样品内(例如细胞结构)细胞成分的丰度,获得诊断分布图;(ii)通过测定响应特定蛋白质的已知的受控的微扰作用的细胞内细胞成分的丰度获得反应分布图,并且内推这样获得的反应分布图,获得其活性被基因突变或多态性破坏的特定蛋白质的反应曲线;和(iii)测定蛋白质活性水平,在该水平下,从反应曲线求出的反应分布图与根据一些客观测量测得的诊断分布图最好地拟合。如果在步骤(iii)测得的蛋白质活性水平与野生型细胞的不同,则将该个体鉴定为具有破坏特定蛋白质的活性的基因突变或多态性的个体。
更通常地,本发明方法可以用来鉴定具有改变它们相应的基因产物的活性的一个或多个基因的基因突变或多态性的个体。在这样的实施方案中,对于其相应的基因中基因突变和/或多态性破坏的每一种基因产物各自获得微扰反应曲线。然后如下面5.3部分所述,将该诊断分布图与在每一种蛋白质活性水平下求出的反应分布图的组合相比较。
上述方法可以用来鉴定具有杂合突变(即基因的两个等位基因中只有一个突变)的个体和单倍不充足的个体。此外,通过上述方法鉴定具有突变的个体不需要知道突变基因本身的序列。
在某些局势下,根据上面5.4部分中讨论的方法可能无法获得一种蛋白质的反应曲线。例如,可能还没有鉴定或者还没有表征易感性基因编码的蛋白质或基因产物,使得在已知的受控的活性水平下其活性不能受到微扰以产生反应分布图。在这样的局势下,为了鉴定可以用来鉴定怀疑携带类似的突变的未表征的个体的反应分布图,可以分析具有已知的杂合突变的一组个体的表达分布图。
通过比较根据上述方法获得的诊断分布图和通过分析来自具有已知的杂合突变的个体的表达分布图鉴定的反应分布图以及通过分析来自不具有杂合突变的野生型个体的表达分布图鉴定的反应分布图,并且测定哪一个反应分布图最好地拟合根据一些客观测量的诊断分布图,可以来鉴定这样的未表征的个体。如果微扰分布图与一个个体的诊断分布图的拟合具有合适的根据上文5.3.2部分中描述的细胞成分指数的随机性推导的统计学显著性,则将该个体鉴定为具有相同的基因突变。优选地,拟合至少具有药物科学中通用的标准的95%可能性阈值。
在另一个应用中,本发明方法可以用来鉴定体内药物活性。如这里所使用的,药物可以是通过已知的或未知的机理微扰生物学系统的任何复杂性程度的化合物,不管它们是否被应用于临床。因此药物包括具有研究或治疗意义的典型的小分子;天然存在的因子,例如内分泌,旁分泌或自分泌因子,或者与所有类型的细胞受体作用的因子;细胞内因子,例如细胞内信号途径的元件;从其它天然来源分离的因子;等等。大多数药物通过与蛋白质相互作用来实施影响。因此,药物可以或者刺激或者提高蛋白质的活性水平,或者抑制或减低蛋白质的活性水平。提高蛋白质活性水平的药物在这里称之为“激活药物”,而减低蛋白质活性水平的药物在这里称之为“抑制药物”。
因此,通过使用本发明方法测定与感兴趣的一种或多种药物相互作用的一种或多种蛋白质的活性水平就可以体内测定药物的活性。一方面,通过下面几方面实现该用途(i)通过测定用特定的感兴趣的药物处理过的细胞内细胞成分的丰度获得诊断分布图;(ii)通过测定响应已知的受控的蛋白质微扰的细胞内细胞成分的丰度来获得反应分布图,并且内推这样获得的反应分布图来获得对于与感兴趣的药物相互作用的每一种特定蛋白质的反应曲线;和(iii)测定蛋白质活性水平,在该水平下,对于每一种蛋白质从反应曲线求出的反应分布图的组合最好拟合根据一些客观测量所测定的诊断分布图。这样测定的蛋白质活性水平是感兴趣的一种药物或几种药物的活性的度量。具体地说,蛋白质活性水平大于野生型细胞的那些(即大于100%蛋白质活性)表明激活药物的药物活性,而蛋白质活性水平小于野生型细胞的那些(即小于100%蛋白质活性)表明抑制药物的药物活性。一般局势下,蛋白质活性水平越高表明激活药物的药物活性越高,而蛋白质活性水平越低表明抑制药物的药物活性水平越高。
在这些方法的一些优选的实施方案中对受药物影响的蛋白质的活性水平本身没有进行测定,但是间接进行了测定,例如通过对药物的一种或多种临床效果校正微扰反应分布图。再回到图2详细说明的例示的反应分布图,在一个优选的实施方案中,这样的图的横轴可以以药物治疗的临床或治疗效果校正和/或表示,对于所述效果获得或提供这样的微扰反应分布图。通过调节剂量可以让接受药物治疗的患者接受个人化的剂量,使得基因表达反应程度匹配与特定临床效果(例如特定水平的临床效果)相关的程度。例如,通过使用接受治疗的患者的过去的治疗反应(即反应分布图)可以对横轴进行校正。或者,也可以通过使用来自不同患者的治疗反应(即反应分布图)进行这样的校正。优选地,不同的患者是例如具有与接受治疗的患者类似的基因背景(即遗传学相似)和/或对所述药物具有类似临床反应的类似患者。
例如,在一个例示的非限制性实施方案中,药物治疗可以包括施用一种或多种降低胆甾醇的药物。在这些实施方案中,临床或治疗效果的水平可以包括临床测定(例如一些不期望的副作用的LDL水平)。通过对这样的临床效果校正微扰反应分布图集合的横轴,通过调节药物剂量直到患者细胞成分分布图(例如患者基因分布图)在期望的临床效果水平下(即在横轴上相应于或者对于期望的临床效果的水平校正的位置)匹配校正的反应分布图中获得的分布图,对于特定患者就可以容易地实现期望的临床效果。尽管事实上通过药物实现一定水平的蛋白质抑制作用,但是没有测定这样的蛋白质活性水平本身。实际上,在这样的临床应用中,抑制作用的实际水平一般不重要或者不令人感兴趣,因为感兴趣的实际效果是根据从其它临床测定确定的药物的实际药效。
这样的方法也可以用来通过调节或测定对患者施用的药物治疗来选择对患者的合适的药物治疗,使得基因表达反应的程度匹配与特定临床效果相关的程度。特别地,对患者施用的药物治疗将包括选择一种或多种特定药物和选择施用的一种或多种特定药物的每一种的剂量。因此,对患者施用的药物治疗可以例如通过调节或确定对患者施用的一种或多种特定药物和/或调节或测定一种或多种特定药物施用的剂量来调节或确定。
在这样的实施方案中,对于多种药物治疗获得微扰反应分布图,其中施用的药物和/或药物剂量是不同的。通过对临床效果校正这些微扰反应分布图,通过调节药物治疗直到患者细胞成分分布图匹配在期望的临床效果水平下校正反应分布图获得的分布图,就可以对特定患者容易地实现期望的临床效果。
6.引用的参考文献这里引用的所有文献其全文和为了所有目的在这里引作参考,其程度就和各公开物或专利或专利申请所被具体地各自地指明其为了所有的目的全文被引作参考一样。
不超出本发明精神和范围可以进行很多改变和变化,这一点对于本领域技术人员来说是显而易见的。本发明只是以举例的方式提供这里描述的具体实施方案,它只受后面的权利要求书以及这样的权利要求所给予权利的等价物的全范围所限制。
权利要求
1.一种测定细胞型中蛋白质活性水平的方法,包括测定诊断分布图和从对于所述测定的对所述蛋白质的微扰水平的微扰反应曲线求出的微扰反应分布图之间的相似性最大时的对所述蛋白质的微扰水平,通过包括测定所述细胞型的细胞中第一多种(firstplurality)细胞成分的方法获得所述诊断分布图,其中所述微扰反应曲线是包括下面步骤的方法的产物(i)提供所述细胞型所述蛋白质的微扰反应分布图,其中通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对所述蛋白质微扰的水平代表所述细胞型中所述蛋白质活性水平。
2.权利要求1的方法,其中在所述的提供微扰反应分布图的步骤中,对于每一水平的对所述蛋白质的微扰定量测定蛋白质活性水平,将所述定量的蛋白质活性水平归一化为野生型蛋白质活性水平,使得可以以蛋白质活性百分率单位表示微扰水平,并且其中所述的测定的蛋白质活性水平从而表示为蛋白质活性水平百分率。
3.权利要求2的方法,其中通过进行蛋白质功能的生物学测定来定量测定所述蛋白质活性水平。
4.权利要求2的方法,其中通过测定所述蛋白质丰度水平来定量测定所述蛋白质活性水平。
5.权利要求1的方法,其中所述内推包括通过仿样函数之和逼近。
6.权利要求1的方法,其中所述内推包括通过Hill函数逼近。
7.权利要求1的方法,其中所述微扰的测定水平是将所述诊断分布图和从对于所述测定的微扰水平的所述微扰反应曲线求出的微扰反应分布图之差的目标函数的值最小化的水平。
8.权利要求7的方法,其中所述目标函数包括诊断分布图和从所述微扰反应曲线求出的微扰反应分布图之差的平方之和。
9.权利要求7的方法,其中所述目标函数包括所述药物反应和所述模型药物反应的关联关系的负值。
10.权利要求1的方法,其中所述细胞型与啤酒糖酵母基本上等基因。
11.权利要求1的方法,其中所述细胞型来自人。
12.权利要求11的方法,其中所述蛋白质参与疾病或失调的易感性或抗性中。
13.权利要求1的方法,其中所述第一多种细胞成分和所述第二多种细胞成分包括所述细胞型中存在的多种各种RNA的丰度。
14.权利要求13的方法,其中通过一种方法测定所述第一多种和第二多种的各种RNA的丰度,所述方法包括使基因转录物阵列与来自所述细胞型的细胞的RNA或者与从其衍生的cDNA接触,其中基因转录物阵列包括具有核酸或核酸模拟物的表面,所述核酸或核酸模拟物能与所述多种各种RNA或者与从其衍生的cDNA杂交。
15.权利要求14的方法,其中所述对所述第二多种各种RNA的丰度的测定通过一种方法进行,所述方法包括(i)用来自其中所述蛋白质活性是已知的或者怀疑被微扰的所述细胞型的细胞的RNA或者用从其衍生的cDNA,和(ii)用来自其中所述蛋白质活性没有被微扰的所述细胞型的细胞的RNA或者用从其衍生的cDNA,接触一个或多个基因转录物阵列。
16.权利要求13的方法,其中所述第一多种各种RNA组成已知在对所述蛋白质微扰时在所述细胞型中增加或减少的各种RNA的大多数。
17.权利要求14的方法,其中所述第一多种各种RNA组成已知在对所述蛋白质微扰时在所述细胞型中增加或减少的各种RNA的大多数。
18.权利要求1的方法,其中所述细胞成分包括所述细胞型中存在的多种蛋白质物质的丰度。
19.权利要求18的方法,其中通过一种方法测定所述多种蛋白质物质的丰度,所述方法包括使抗体阵列与来自所述细胞型的细胞的蛋白质接触,其中所述抗体阵列包括载有被接触抗体的表面,所述抗体能与所述多种蛋白质物质结合。
20.权利要求18的方法,其中通过一种方法测定所述多种蛋白质物质的丰度,所述方法包括进行来自所述细胞型的细胞的蛋白质的双向电泳。
21.权利要求1的方法,其中所述细胞成分包括所述细胞型中存在的多种蛋白质物质的活性。
22.权利要求1的方法,其中通过一种方法实现对所述蛋白质多个不连续水平的微扰,所述方法包括在可调控重组表达系统的控制下引发所述细胞型中所述蛋白质的诱导型表达。
23.权利要求12的方法,其中所述诱导型表达在其中内源表达被剔除的所述细胞型中实现。
24.权利要求1的方法,其中通过包括表达所述蛋白质的基因的可调控转染的方法实现对所述蛋白质多个不连续水平的微扰。
25.权利要求1的方法,其中通过包括可调控降低编码所述细胞型的细胞中所述一种或多种具体细胞成分的各种RNA的丰度的方法实现对所述蛋白质多个不连续水平的微扰。
26.权利要求25的方法,其中所述可调控降低所述各种RNA的丰度的方法包括将所述细胞型的细胞暴露给瞄向裂解所述各种RNA的核酶。
27.权利要求1的方法,其中通过包括可调控降低编码所述细胞型的细胞中所述一种或多种具体细胞成分的各种RNA的翻译速度的方法实现对所述蛋白质多个不连续水平的微扰。
28.权利要求27的方法,其中所述可调控降低各种RNA的翻译速度的方法包括将所述细胞型的细胞暴露给与所述各种RNA或者与编码所述各种RNA的DNA杂交的反义核酸或反义核酸模拟物。
29.权利要求1的方法,其中通过包括可调控降低所述细胞型的细胞中所述蛋白质的丰度的方法实现对所述蛋白质的多个不连续水平的微扰。
30.权利要求29的方法,其中所述可调控降低所述蛋白质的丰度的方法包括在所述细胞型的细胞中引发作为包括所述蛋白质物质和降解决定子(degron)的融合蛋白的所述一种或多种蛋白质物质的表达,其中降解决定子是可调控的,用以提高所述蛋白质的降解速度。
31.权利要求29的方法,其中所述可调控降低所述丰度的方法包括将所述细胞型的细胞暴露给抗体,其中所述抗体结合所述蛋白质。
32.权利要求1的方法,其中通过包括将所述细胞型的细胞暴露给不同水平的直接且特异性地抑制所述蛋白质活性水平的药物的方法实现对所述蛋白质的多个不连续水平的微扰。
33.权利要求1的方法,其中通过包括将所述细胞型的细胞暴露给不同水平的显性失活突变蛋白物质的方法实现对所述蛋白质的多个不连续水平的微扰,其中所述显性失活突变蛋白物质是抑制所述蛋白质的所述活性的蛋白质。
34.权利要求1的方法,其中所述诊断分布图来自用药物处理过的所述细胞型的细胞,并且所述蛋白质是或怀疑为所述药物的靶物。
35.一种鉴定具有一种或多种破坏相应的基因产物的活性的基因突变或多态性的细胞型的细胞的方法,包括测定诊断分布图和从对于所述测定的对所述基因产物的微扰的水平的微扰反应曲线求出的微扰反应分布图之间的相似性最大时的对所述基因产物的微扰水平,通过包括测定所述细胞中第一多种细胞成分的方法获得所述诊断分布图,其中所述微扰反应曲线是包括下面步骤的方法的产物(i)提供所述细胞型所述基因产物的微扰反应分布图,其中通过在对所述基因产物的微扰的多个不连续水平下测定所述细胞型的野生型细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述基因产物微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对所述基因产物微扰的水平代表被破坏的所述基因产物的活性的程度,并且其中测定的基因产物活性被破坏的细胞鉴定为具有所述基因突变或多态性。
36.权利要求35的方法,其中所述细胞型来自人。
37.一种鉴定怀疑具有破坏相应的基因产物的活性的一个或多个基因突变或多态性的个体的方法,包括根据权利要求35的方法鉴定来自个体的细胞为具有所述基因突变或多态性。
38.权利要求37的方法,其中所述个体是人。
39.权利要求36或38的方法,其中在对疾病或失调的易感性或抗性中涉及所述基因。
40.权利要求37的方法,其中通过包括分析来自具有所述基因突变或多态性的个体的表达分布图,并且将所述表达分布图与来自野生型个体的类似表达分布图相比较的方法获得所述微扰反应分布图。
41.权利要求35的方法,其中相应的基因产物是蛋白质。
42.权利要求35的方法,其中基因突变或多态性是杂合突变或多态性。
43.一种测定体内药物的活性的方法,包括根据一种方法测定用所述药物处理过的细胞内蛋白质的活性水平,所述方法包括测定诊断分布图和从对于所述测定的对所述蛋白质的微扰水平的微扰反应曲线求出的微扰反应分布图之间的相似性最大时的对所述蛋白质的微扰水平,其中(a)通过包括测定用所述药物处理过的细胞内第一多种细胞成分的方法获得诊断分布图;和(b)通过一种方法提供微扰反应曲线,所述方法包括(i)提供细胞的所述蛋白质的微扰反应分布图,其中通过包括在对所述蛋白质的微扰的多个不连续水平下测定细胞内第二多种细胞成分的方法获得所述微扰反应分布图,(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对所述蛋白质微扰的水平代表用所述药物处理过的所述细胞中蛋白质活性水平,所述蛋白质活性水平是所述药物活性的一个度量。
44.权利要求43的方法,其中所述药物提高所述蛋白质的活性。
45.权利要求43的方法,其中所述药物降低所述蛋白质的活性。
46.权利要求43的方法,其中以所述药物的一种或多种临床作用校准(be calibrated to)所述微扰反应分布图。
47.一种测定对患者实现期望的临床效果的一种或多种药物的剂量的方法,包括测定一种或多种药物的剂量使得诊断分布图和与期望的临床效果相关的微扰反应分布图之间的相似性最大,其中(a)通过包括测定用所述一种或多种药物处理过的所述患者的一种或多种细胞内第一多种细胞成分的方法获得诊断分布图;和(b)通过一种方法提供与期望的临床效果相关的微扰反应分布图,所述方法包括(i)提供一个或多个患者一种或多种细胞的所述一种或多种药物的多个微扰反应分布图,其中通过包括在暴露给所述一种或多种药物的多个不连续水平下测定一种或多种细胞内第二多种细胞成分的方法获得所述多个微扰反应分布图,(ii)以一种或多种药物的临床效果校准所述多个微扰反应分布图。
48.权利要求47的方法,其中所述提供与期望的临床效果相关的微扰反应分布图进一步包括内推所述多个微扰反应分布图步骤,使得可以在对所述蛋白质微扰的水平的一定范围内求出微扰反应分布图。
49.一种测定对患者实现期望的临床效果的药物治疗的方法,包括测定药物治疗使得诊断分布图和与期望的临床效果相关的微扰反应分布图之间的相似性最大,其中(a)通过包括测定用所述药物治疗处理过的所述患者的一种或多种细胞内第一多种细胞成分的方法获得诊断分布图;和(b)通过一种方法提供与期望的临床效果相关的微扰反应分布图,所述方法包括(i)提供多个药物治疗的多个微扰反应分布图,其中通过包括测定多个药物治疗的一种或多种细胞内第二多种细胞成分的方法获得所述多个微扰反应分布图,和(ii)以多个药物治疗的临床效果校准所述多个微扰反应分布图。
50.权利要求49的方法,其中所述提供与期望的临床效果相关的微扰反应分布图的方法进一步包括内推所述多个微扰反应分布图步骤,使得可以在对所述蛋白质微扰的水平的一定范围内求出微扰反应分布图。
51.权利要求49的方法,其中所述多个药物治疗包括其中所施用的一种或多种药物不同的药物治疗。
52.权利要求49的方法,其中所述多个药物治疗包括其中所施用的一种或多种药物剂量不同的药物治疗。
53.一种用于测定蛋白质活性水平的计算机系统,包括处理器和与所述处理器连接的存储器,所述存储器编辑一种或多种程序,所述一种或多种程序引导所述处理器完成一种方法,所述方法包括测定诊断分布图和从对于所述测定的对所述蛋白质的微扰的水平的微扰反应曲线求出的微扰反应分布图之间的相似性最大时的对所述蛋白质的微扰水平,通过包括测定所述细胞型的细胞中第一多种细胞成分的方法获得所述诊断分布图,其中所述微扰反应曲线是包括下面步骤的方法的产物(i)提供所述细胞型所述蛋白质的微扰反应分布图,其中通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对所述蛋白质微扰的水平代表所述细胞型中蛋白质活性水平。
54.权利要求53的计算机系统,其中通过一种方法实现微扰水平的测定,所述方法包括(a)测定所述诊断分布图和从对于对所述蛋白质的微扰水平的所述微扰反应曲线求出的微扰反应分布图之差的目标函数的值;和(b)通过变化对所述蛋白质的微扰水平将所述目标函数的所述测定值最小化,以测定将所述目标函数的所述测定水平最小化的微扰水平。
55.权利要求53的计算机系统,其中在所述存储器中可获得所述诊断分布图和所述微扰反应曲线。
56.权利要求55的计算机系统,其中所述程序引导所述处理器完成所述的内推所述微扰反应分布图的步骤。
57.权利要求54的计算机系统,其中所述目标函数包括诊断分布图和从所述微扰反应曲线求出的微扰反应分布图之差的平方之和。
58.权利要求54的计算机系统,其中所述目标函数包括诊断分布图和从所述微扰反应曲线求出的微扰反应分布图的关联关系的负值。
59.权利要求54的计算机系统,其中所述最小化包括进行Levenberg-Marquandt方法。
60.一种测定细胞型中蛋白质的活性水平的试剂盒,所述试剂盒包括固相,该固相的表面上包括多种已知的不同序列的核酸,每一种核酸位于所述固相的已知部位,每一个核酸能与各种RNA或者从其衍生的cDNA物质杂交,已知所述各种RNA响应所述细胞型中对所述蛋白质的微扰而增加或减少,所述多种核酸基本上排除能与不响应所述微扰而增加或减少的各种RNA杂交的核酸。
61.一种测定细胞型中蛋白质活性水平的试剂盒,包括(a)一种固相,该固相的表面上包括多种已知的不同序列的核酸,每一种核酸位于所述固相的已知部位,每一个核酸能与各种RNA或者从其衍生的cDNA物质杂交,已知所述各种RNA响应对所述细胞型中所述蛋白质的微扰而增加或减少;和(b)所述细胞型的所述蛋白质的微扰反应曲线,其中所述微扰反应曲线是电子形式,其中所述微扰反应曲线是一种方法的产物,所述方法包括(i)提供所述细胞型所述蛋白质的微扰反应分布图,其中通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线。
62.权利要求60的试剂盒,进一步包括,电子或书写形式的上述细胞型的上述蛋白质的微扰反应曲线,其中上述的微扰反应曲线是一种方法的产物,该方法包括(a)提供所述细胞型的所述蛋白质的微扰反应分布图,其中上述的微扰反应分布图是通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞多数成分获得的,以及(b)内推所述的微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图其中所述的内推的反应分布图包括所述的微扰反应曲线。
63.权利要求61或62的试剂盒,其中所述微扰反应曲线是电子形式,其中所述试剂盒进一步包括计算机可读介质上的表达分布图分析软件,所述软件能被编码于也具有处理器的计算机的存储器中,所述被编码的软件引导所述处理器完成一种方法,包括(a)接收所述细胞型的细胞的诊断分布图,通过包括测定来自所述细胞型的各种RNA或从其衍生的cDNA的丰度的方法,通过包括使所述细胞型的细胞内的所述RNA或cDNA与所述固相表面上所述多种核酸杂交的方法获得所述诊断分布图;(b)接收所述微扰反应曲线;和(c)在所述诊断分布图和从所述微扰反应曲线求出的微扰反应分布图之间的相似性最大处测定对所述蛋白质的微扰水平,其中对所述蛋白质的微扰的测定水平代表蛋白质活性水平。
64.包括来自一种或多种细胞型的一种或多种蛋白质的微扰反应曲线的数据库,其中对于每一种所述细胞型的每一种蛋白质的所述微扰反应曲线是一种方法的产物,所述方法包括(a)提供所述细胞型所述蛋白质的微扰反应分布图,其中通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定连续范围内求出微扰反应分布图,其中所述内推的微扰反应分布图包括所述微扰反应曲线。
65.一种测定细胞型中一种或多种蛋白质的每一种的活性水平的方法,包括测定诊断分布图和从对于每一所述测定的微扰水平的每一种所述蛋白质的微扰反应曲线求出的微扰反应分布图的组合之间的相似性最大时的对每一种所述蛋白质的微扰水平,通过包括测定所述细胞型的细胞中第一多种细胞成分的方法获得所述诊断分布图,其中所述蛋白质的每一种的所述微扰反应曲线是包括下面步骤的方法的产物(i)提供所述细胞型所述蛋白质的微扰反应分布图,其中通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对每一种所述蛋白质微扰的水平代表所述细胞型中每一种所述蛋白质的所述活性水平。
66.一种鉴定具有破坏一种或多种相应的基因产物的活性的一种或多种基因突变或多态性的细胞型的细胞的方法,包括测定诊断分布图和从对于每一种所述测定的微扰水平的对于每一种基因产物的微扰反应曲线求出的微扰反应分布图的组合之间的相似性最大时的对每一种所述基因产物的微扰水平,通过包括测定所述细胞中第一多种细胞成分的方法获得所述诊断分布图,其中对于每一种基因产物的所述微扰反应曲线是包括下面步骤的方法的产物(i)提供所述细胞型所述基因产物的微扰反应分布图,其中通过在对所述基因产物的微扰的多个不连续水平下测定所述细胞型的野生型细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述基因产物微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对每一种所述基因产物的微扰水平代表所述基因产物的活性被破坏的程度,并且其中相应的基因产物活性被破坏的细胞被鉴定为所述基因中具有基因突变或多态性。
67.一种用于测定蛋白质活性水平的计算机系统,包括处理器和与所述处理器连接的存储器,所述存储器编码一种或多种程序,所述一种或多种程序引导所述处理器完成一种方法,所述方法包括测定诊断分布图和从对于每一种所述测定的微扰水平的每一种所述蛋白质的微扰反应曲线求出的微扰反应分布图的组合之间的相似性最大时的对每一种所述蛋白质的微扰水平,通过包括测定所述细胞型的细胞中第一多种细胞成分的方法获得所述诊断分布图,其中对于每一种所述蛋白质的所述微扰反应曲线是包括下面步骤的方法的产物(i)提供所述细胞型所述蛋白质的微扰反应分布图,其中通过在对所述蛋白质的微扰的多个不连续水平下测定所述细胞型的细胞内第二多种细胞成分获得所述微扰反应分布图,和(ii)内推所述微扰反应分布图,使得可以在对所述蛋白质微扰水平的一定范围内求出微扰反应分布图,其中所述内推的反应分布图包括所述微扰反应曲线,其中所述测定的对每一种所述蛋白质微扰的水平代表所述细胞型中每一种所述蛋白质的活性水平。
68.权利要求67的计算机系统,其中通过一种方法实现微扰水平的测定,所述方法包括(a)测定所述诊断分布图和从对于对每一种所述蛋白质的微扰水平的所述微扰反应曲线求出的微扰反应分布图的组合之差的目标函数的值;和(b)通过变化对每一种所述蛋白质的微扰水平将所述目标函数的所述测定值最小化,以测定将所述目标函数的所述测定值最小化的对每一种蛋白质的微扰水平。
全文摘要
本发明提供测定细胞内蛋白质活性水平的方法,包括:(ⅰ)测定其中具体蛋白质的活性要被测定的细胞内细胞成分的丰度从而获得诊断分布图;(ⅱ)测定响应所述蛋白质的活性的微扰的细胞内存在的细胞成分的丰度以获得反应分布图,并且内推所述反应分布图以产生反应曲线;和(ⅲ)根据一些客观测量,测定蛋白质活性水平,在该水平下从反应曲线求出的反应分布图最好地拟合测定的诊断分布图。在可选择的实施方案中,本发明还提供了鉴定具有破坏蛋白质活性的基因突变或多态性的个体的方法,和通过测定与所述药物相互作用的蛋白质的活性水平体内鉴定药物活性的方法。
文档编号C07K14/47GK1308740SQ99808372
公开日2001年8月15日 申请日期1999年5月7日 优先权日1998年5月8日
发明者S·H·弗里恩德, R·斯托顿 申请人:罗斯塔英法美蒂克斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1