肝癌生物标志物的制作方法

文档序号:1093549阅读:447来源:国知局
专利名称:肝癌生物标志物的制作方法
本申请要求享有2003年11月3日提交的美国临时申请No.60/516,853的优先权。以上申请的全部教导经引用并入本文。
1.发明领域本发明涉及在肝癌中差异表达的新生物标志物的鉴定和选择与在肝癌中差异表达的新生物标志物组合的鉴定和选择,以及选择所述新生物标志物组合的方法。本发明还涉及与本发明生物标志物的产物特异性杂交的多核苷酸和/或蛋白质以诊断肝癌的用途及其试剂盒。本发明还涉及监测治疗方案效果、鉴定治疗肝癌的治疗靶点和鉴定与肝癌相关的单核苷酸点突变的筛选方法。
2.发明背景肝癌是一种具有高死亡率的癌症。肝癌或者开始于肝本身,或者来源于另一种来源(当癌症从身体的一些其它部位扩散到肝时)。
起始于肝内的肝癌在美国是相当少见的疾病,占所有恶性肿瘤的约2%和新诊断癌症的4%。
成年人中开始于肝组织自身的多数肝癌属于两种类型之一肝瘤或肝细胞癌(HCC);和胆管瘤或胆管癌,这是在肝中的胆管发生的癌症。
约80%-90%起始于肝的肝癌是肝瘤。在美国,每20万人中约5个人发生肝瘤(原发性肝癌病例的70%-75%是HCC)。在非洲和亚洲,每20万人中超过40人将发生这种形式的癌症(原发性肝癌病例的超过90%是HCC)。肝细胞癌是世界上最常见的8种癌症之一。然而,它在美国以外更常见,占非洲和部分亚洲的恶性肿瘤的10%-50%。HCC在男性中的发生率至少比女性高2到3倍。在高危地区(东亚和东南亚、撒哈拉以南非洲),男性比女性甚至更可能发生HCC。
发生起始于另外部位的肝癌在美国是起始于肝内的肝癌的约20倍。因为身体所有部位的血必须经肝滤过,其它器官和组织的癌细胞容易到达肝,它们可以在此定居并生长为继发性肿瘤。结肠、胃、胰、直肠、食管、乳房、肺或皮肤的原发癌最可能转移(扩散)到肝。转移到肝中的癌经常是开始于另一个器官的癌症的首先注意到的症候。肝硬化以后,转移性肝癌是致死性肝病的最常见原因。
肝癌的诊断肝癌的早期症状经常不明显,并且不是肝脏疾病独有的。肿瘤开始生长与首次出现征兆之间的长时间是疾病具有如此高死亡率的主要原因。
可以用血测试测试肝功能或评估患者历史的风险因素。本领域已知50%-75%的原发性肝癌患者具有异常高的甲胎蛋白(AFP)血清水平。然而AFP测试不能单独用于确认肝癌诊断,因为肝硬化或慢性肝炎也能产生高甲胎蛋白水平。测试碱性磷酸酶、胆红素、乳酸脱氢酶和其它化学物指示肝不能正常发挥功能。约75%的肝癌患者表现出肝炎感染的迹象。然而,同样地,异常肝功能测试结果不是肝癌特异性的。
影像研究可以用于定位肝中异常组织的具体面积。一英寸小的肝肿瘤现在可以经超声或计算机断层扫描(CT扫描)检测到。然而,影像研究不能区分肝瘤和肝中组织(结节)的其它异常团或块。
当前的技术限制要求肝组织样品进行活组织检查以明确诊断肝癌。CT或超声可用于指导医生选择获得组织活检样品的最佳部位。胸X射线可用于观察肝肿瘤是原发性还是从肺的原发性肿瘤转移而来。对于肝组织活检,用细针取肝脏或组织液的样品并在显微镜下检查是否存在癌细胞。约70%病例中活组织检查是癌症阳性。多数情况下,活组织检查操作对患者很少有风险。然而约0.4%的病例中,患者由于活组织检查而发生致死性出血,因为一些肿瘤有大量血管,非常容易出血。
由于这些限制,需要简单的非侵入性诊断测试以检测肝癌。
3.发明内容本发明涉及新生物标志物的鉴定和选择与新生物标志物组合的鉴定和选择,所述新生物标志物在血液中差异表达并可用于诊断肝癌以及监测治疗效果。本发明生物标志物和生物标志物组合的产物表达的测定结果被用于诊断肝癌。为了测定本发明生物标志物的产物的表达,与本发明的生物标志物的产物特异性和/或选择性杂交的多核苷酸和蛋白质、以及含所述多核苷酸和蛋白质的试剂盒也包括在本发明范围内。本发明还包括所述多核苷酸和蛋白质用于监测治疗方案效果的用途。本发明还提供使用本发明的生物标志物的产物鉴定肝癌的新治疗靶点的鉴定方法。
4.


参考以下详细说明和附图可以更好理解本发明的目的和特征。
图1是选择可用于诊断肝癌的生物标志物的列表。
图2表示用QRT-PCR分析,与正常个体相比较,假想的淋巴细胞G0/G1开关基因(G0S2)、BCL2相关蛋白A1(BCL2A1)和受致有丝分裂途径调节的磷酸化蛋白(C8FW)在肝癌患者血样中的差异基因表达。
图3的表表示在本发明的一个实施方案中,已被鉴定为本发明生物标志物的SNP。
图4的表表示在本发明的一个实施方案中,本发明的两种生物标志物的多种选择。
图5的表表示在本发明的一个实施方案中,本发明的三种生物标志物的多种选择。
图6是ROC>0.9的分类符的一个实例。
图7是ROC>0.9的分类符的一个实例。
5.具体实施方式
本发明涉及从血液中鉴定和选择在肝癌患者与正常患者之间差异表达和可单独和联合用于诊断的基因。如此,本发明涉及能用于检测和监测生物标志物和生物标志物组合的差异基因表达以诊断和监测治疗性处理的多核苷酸和多肽。本发明还涉及鉴定特别有用的生物标志物组合的方法。此外,本发明涉及本发明的生物标志物用于筛选治疗靶点和鉴定本发明基因内的单核苷酸多态性的用途,所述单核苷酸多态性可以被监测以确定诊断个体中肝癌的其他手段。
5.1定义除非另外指明,本发明的实施将利用分子生物学、微生物学和重组DNA技术的常规技术,它们在本领域技术人员能力范围内。这些技术在文献中已被解释。例如见Sambrook,Fritsch & Maniatis,1989,Molecular CloningA Laboratory Manual,Second Edition;Oligonucleotide Synthesis(M.J.Gait,ed.,1984);Nucleic AcidHybridization(B.D.Harnes & S.J.Higgins,eds.,1984);A Practical Guide toMolecular Cloning(B.Perbal,1984);和丛书Methods in Enzymology(AcademicPress,Inc.);Short Protocols In Molecular Biology(Ausubel et al.,ed.,1995)。本文提及的所有专利、专利申请和公开出版物,包括在此之前和之后,其全部内容经引用并入本文。
对用于以下书面说明中的具体术语提供以下定义。本文所用“5’端”表示从mRNA的第一个核苷酸开始的mRNA的末端,可达mRNA的前1000个核苷酸或前1/3(mRNA的全长不包括多聚A尾)。基因的“5’区”表示位于基因的5’端内或5’端处的多核苷酸(双链或单链),包括但不限于基因的5’非翻译区(如果存在)和5’蛋白质编码区。5’区长度不短于8个核苷酸,不长于1000个核苷酸。5’区的其它可能长度包括但不限于10、20、25、50、100、200、400和500个核苷酸。
本文所用“3’端”表示mRNA的末端,可达mRNA的最后1000个核苷酸或mRNA的最后1/3,其中3’末端核苷酸是临近多聚A尾(如果存在)的编码或非翻译区的末端核苷酸。也就是说,mRNA的3’端不包括多聚A尾(如果存在)。基因的“3’区”表示位于基因的3’端内或3’端处的多核苷酸(双链或单链),包括但不限于基因的3’非翻译区(如果存在)和3’蛋白质编码区。3’区长度不短于8个核苷酸,不长于1000个核苷酸。3’区的其它可能长度包括但不限于10、20、25、50、100、200、400和500个核苷酸。如本文所用,基因的“内部编码区”表示位于本文定义的基因的5’区和3’区之间的多核苷酸(双链或单链)。“内部编码区”长度不短于8个核苷酸,不长于1000个核苷酸。“内部编码区”的其它可能长度包括但不限于10、20、25、50、100、200、400和500个核苷酸。5’、3’和内部区是非重叠的,可以但不必是连续的,可以但不必合计达相对应基因的全长。
本文所用多肽的“氨基端”区表示位于基因5’端内或5’端处的多核苷酸序列(双链或单链)编码的多肽序列,所述多核苷酸序列包括但不限于基因的5’蛋白质编码区。本文所用“氨基端”区表示从多肽的第一个氨基酸开始的多肽的氨基末端,可达多肽的前300个氨基酸或前1/3。多肽的“氨基端”区长度不短于3个氨基酸,不长于350个氨基酸。多肽的“氨基端”区的其它可能长度包括但不限于5、10、20、25、50、100和200个氨基酸。
本文所用多肽的“羧基端”区表示位于基因3’端内或3’端处的多核苷酸序列(双链或单链)编码的多肽序列,所述多核苷酸序列包括但不限于基因的3’蛋白质编码区。本文所用“羧基端”区表示多肽的羧基末端,从多肽的最后一个氨基酸开始可达多肽的300个氨基酸或1/3。“3’端”不包括多聚A尾(如果存在)。多肽的“羧基端”区长度不短于3个氨基酸,不长于350个氨基酸。多肽的“羧基端”区的其它可能长度包括但不限于5、10、20、25、50、100和200个氨基酸。
如本文所用,多肽的“内部多肽区”表示位于本文定义的多肽的氨基端区和羧基端区之间的多肽序列。“内部多肽区”长度不短于3个氨基酸,不长于350个氨基酸。多肽的“内部多肽区”的其它可能长度包括但不限于5、10、20、25、50、100和200个氨基酸。多肽的氨基端、羧基端和内部多肽区是非重叠的,可以但不必是连续的,可以但不必合计达相对应多肽的全长。
本文所用术语“扩增”当用于核酸序列时,表示从模板核酸产生一个或多个拷贝的特定核酸序列的过程,优选用聚合酶链式反应的方法产生(Mullis and Faloona,1987,Methods Enzymol.,155335)。“聚合酶链式反应”或“PCR”表示扩增特异性核酸模板序列的体外方法。PCR反应涉及一系列重复的温度循环,典型的在50-100μl体积中进行。反应混合物包含dNTP(四种脱氧核苷酸dATP、dCTP、dGTP和dTTP中的每一种)、引物、缓冲剂、DNA聚合酶和核酸模板。PCR反应包括提供一组多核苷酸引物,其中第一种引物含有与核酸模板序列的一条链中区域互补的序列并引发互补DNA链的合成,第二种引物含有与靶核酸序列的第二条链中区域互补的序列并引发互补DNA链的合成;和在允许PCR循环步骤的条件下用一种核酸聚合酶作为模板依赖的聚合剂扩增核酸模板序列,所述PCR循环步骤为(i)使扩增需要的引物退火到模板序列中的靶核酸序列上,(ii)延伸引物,其中核酸聚合酶合成引物延伸产物。“一组多核苷酸引物”或“一组PCR引物”可以包含两个、三个、四个或更多个引物。在一个实施方案中,exo-Pfu DNA聚合酶用于在PCR反应中扩增核酸模板。其它扩增方法包括但不限于连接酶链式反应(LCR)、基于多核苷酸特异性的扩增(NSBA)或任何本领域已知的其它方法。
根据本发明,“阵列”包括固定到固相支持物上的一组特异性基因,或一组对应的5’端或一组对应的3’端或一组对应的内部编码区。当然,一种基因的5’端混合物可用作靶或探针与另一种基因的3’端组合以获得肝癌诊断的相同结果。
本文所用的术语“类似物”对于蛋白质物质(例如蛋白质、多肽、肽和抗体)而言表示与第二种蛋白质物质具有相似或相同功能但未必包含与第二种蛋白质物质相似或相同氨基酸序列、或具有第二种蛋白质物质相似或相同结构的蛋白质物质。具有相似氨基酸序列的蛋白质物质表示满足以下至少一条的第二种蛋白质物质(a)具有与第二种蛋白质物质的氨基酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%一致性的氨基酸序列的蛋白质物质;(b)在严谨条件下与编码第二种蛋白质物质中至少5个连续氨基酸残基、至少10个连续氨基酸残基、至少15个连续氨基酸残基、至少20个连续氨基酸残基、至少25个连续氨基酸残基、至少40个连续氨基酸残基、至少50个连续氨基酸残基、至少60个连续氨基酸残基、至少70个连续氨基酸残基、至少80个连续氨基酸残基、至少90个连续氨基酸残基、至少100个连续氨基酸残基、至少125个连续氨基酸残基或至少150个连续氨基酸残基的核苷酸序列杂交的核苷酸序列编码的蛋白质物质;(c)与编码第二种蛋白质物质的核苷酸序列具有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%一致性核苷酸序列编码的蛋白质物质。与第二种蛋白质物质具有相似结构的蛋白质物质表示与第二种蛋白质物质具有相似的二级、三级或四级结构的蛋白质物质。蛋白质物质的结构可通过本领域技术人员已知的方法确定,这些方法包括但不限于肽测序、X-射线晶体衍射、核磁共振、园二色性分析和晶体衍射电镜分析。
为确定两种氨基酸序列或两种核酸序列的百分一致性,根据最优比较目的(如,为了与第二种氨基酸或核酸序列最优匹配,可以向第一种氨基酸或核酸序列中引入间隙)进行序列比对。然后比较相对应氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当第一个序列中的位置被与第二种序列中相应位置相同的氨基酸残基或核苷酸占据时,那么分子在该位置是相同的。这两种序列之间的百分一致性是两种序列共有的相同位置数目的函数(即,%一致性=相同重叠位置数/总位置数×100%)。在一个实施方案中,这两种序列是相同的长度。
也可以用数学算法确定两种序列之间的百分一致性。用于比较两种序列的数学算法的优选的、非限制性的实例是Karlin and Altschul,1990,Proc.Natl.Acad.Sci.U.S.A.872264-2268中的算法,并在Karlin and Altschul,1993,Proc.Natl.Acad.Sci.U.S.A.905873-5877中改进。这种算法整合到Altschul et al.,1990,J.Mol.Biol.215403的NBLAST和XBLAST程序中。BLAST核苷酸搜索可用NBLAST核苷酸程序参数组进行,例如评分=100(score=100)、字长=12(wordlength=12),以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST核苷酸程序参数组进行,例如评分-50、字长=3,以获得与本发明的蛋白质分子同源的氨基酸酸序列。为比较目的获得带间隙的匹配,可以使用Altschul et al.,1997,NucleicAcids Res.253389-3402描述的Gapped BLAST。作为替代方案,可以使用PSI-BLAST进行叠代搜索以检测分子之间的远相关性(Id.)。当使用BLAST、GappedBLAST和PSI-BLAST程序时,可以使用各程序(如XBLAST和NBLAST)的默认参数(例如见NCBI网址)。用于序列比较的数学算法的另一种优选非限制性实例是Myers and Miller,1988,CABIOS 411-17的算法。这种算法整合入ALIGN程序(2.0版)中,它是GCG序列比对软件包的一部分。当使用ALIGN程序比较氨基酸序列时,可以使用PAM120重量残基表、间隙长度罚分12和间隙罚分4。
可用与上述技术相似的技术确定两种序列之间的百分一致性,可以允许或不允许间隙。计算百分一致性时,通常只计算确切匹配。
本文所用术语“类似物”对于非蛋白质类似物而言表示与第一种有机或无机分子具有相似或相同功能、并且与第一种有机或无机分子结构相似的第二种有机或无机分子。术语“类似物”包括核心结构与第一种分子相同或紧密相关、但具有化学或物理修饰的分子。术语“类似物”包括可以连接到其它原子或分子上的第一种分子的共聚物。“生物活性类似物”和“类似物”在本文可以互换使用,表示表现出与第一种有机或无机分子基本相同的激动或拮抗作用的有机或无机分子。
本文所用的“核苷酸类似物”表示戊糖和/或一个或多个磷酸酯被各自的类似物替换的核苷酸。磷酸酯类似物的实例包括但不限于烷基膦酸酯、甲基膦酸酯、氨基磷酸酯(phosphoramidates)、磷酸三酯、硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、phosphoroanilothioates、phosphoroanilidates、氨基磷酸盐(phosphoroamidates)、硼磷酸酯等,包括可能存在的任何相关的反离子。在“核苷酸类似物”定义内还包括能聚合成多核苷酸类似物的核酸碱基(nucleobase)单体,其中DNA/RNA磷酸酯和/或糖磷酸酯骨架被不同类型的连接键替换。“核苷酸类似物”还包括具有非常规即不同于G、A、T、U或C之一的核酸碱基结构的核苷酸。非常规核酸碱基一般具有与相邻反向多核苷酸链上的至少一个核酸碱基结构形成氢键的能力,或提供非相互作用、非干扰的碱基。
术语“抗体”还包括抗体的抗原结合片段。本文所用的术语抗体的“抗原结合片段”(或简称“抗体部分”或“片段”)表示保留特异性结合多肽能力的全长抗体的一个或多个片段,所述多肽由本发明生物标志物的基因之一编码。在术语抗体的“抗原结合片段”范围内,结合片段的实例包括(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包含通过铰链区的二硫桥连接的两个Fab片段的双价片段;(iii)Fd片段,由VH和CH1结构域组成;(iv)Fv片段,由抗体单臂的VL和VH结构域组成,(v)dAb片段(Ward et al.,(1989)Nature341544-546),由VH结构域组成;和(vi)分离的互补性决定区(CDR)。而且,尽管Fv片段的两个结构域VL和VH由单独的基因编码,它们可以用重组方法通过合成使它们成为单个蛋白质链的连接子而连接,所述单个蛋白质链中VL和VH区成对形成单价分子(称为单链Fv(scFv);例如见Bird et al.(1988)Science 242423-426;和Huston et al.(1988)Proc.Natl.Acad.Sci.USA 855879-5883)。这种单链抗体也包含在术语抗体的“抗原结合片段”之内。用本领域技术人员已知的常规技术获得这些抗体片段,并筛选以和完整抗体相同方式使用的片段。抗体优选是单特异性的,例如单克隆抗体,或其抗原结合片段。术语“单特异性抗体”表示对特定靶如表位显示单结合特异性和亲和性的抗体。该术语包括“单克隆抗体”或“单克隆抗体组合物”,用于本文中表示单分子组成的抗体或其片段的制剂。
本文所用术语“附着”和“点斑”表示将核酸沉积到基质上形成核酸阵列使得核酸通过共价键、氢键或离子相互作用而稳定结合到基质上的过程。
本文所用术语“生物标志物”表示在肝癌个体和正常个体(无肝癌个体)之间受差异调节的基因。
本文所用“血核酸样品”表示来自血液的核酸,可以包括来自全血、离心裂解血、无血清全血或外周血白细胞(PBL)的核酸。全血是指未分离的全血,例如一滴全血。离心裂解血或“裂解血”是指与裂解缓冲液混合并如本文所述离心的全血(见实施例2)。无血清血是指经本文所述离心除去血清或血浆的全血(见实施例2)。血核酸样品优选是全血或离心裂解血,并可以是总RNA、mRNA或是对应mRNA的核酸,例如从所述血分离的cDNA。核酸样品还可以包括来自总RNA、mRNA或cDNA的PCR产物。
本文所用术语“离心”表示在4℃以2000rpm(800g)离心无血清全血或裂解血5分钟。
本文所用术语“分类符”用于描述根据区分两种或更多种表型性状例如患有或不患有肝癌的能力而产生的数学模型的输出。
本文所用术语“化合物”和“剂”可互换使用。
本文所用“基本由……组成”表示使用生物标志物鉴定肝癌所需要的基因的最大数目。在一个实施方案中,诊断肝癌的生物标志物基本由本发明的生物标志物中至少2、3、4、5、6、7、8、9、10、15、20个或全部组成。在一个实施方案中,诊断肝癌的生物标志物基本由图1所示的至少3个基因组成。
本文所用术语“对照”或“对照样品”在本发明中表示从被分类为患有肝癌或不患有肝癌的一个个体或一组个体分离的一种或多种组织核酸样品和/或血核酸样品,对“对照”或“对照样品”的诊断已经被确认。术语对照或对照样品也可以表示来自已被确诊为正常(没有肝癌)的一个或多个个体或已被确诊为肝癌的一个或多个个体的样品的数据汇编。
“编码区“表示编码mRNA的DNA序列。
本文所用术语“化合物”和“剂”可互换使用。
本文所用术语“衍生物”对于蛋白质物质(如蛋白质、多肽、肽和抗体)而言表示包含通过引入氨基酸残基替换、缺失和/或添加而被改变的氨基酸序列的蛋白质物质。本文所用术语“衍生物”还表示修饰的蛋白质物质,即通过将任何类型的分子共价连接到所述蛋白质物质上而修饰的蛋白质物质。例如但不限于,抗体可以被修饰,例如通过糖基化、乙酰化、PEG化、磷酸化、酰胺化、经已知保护/封闭基团衍生化、蛋白质水解性切割、与细胞配体或其它蛋白质连接等而被修饰。蛋白质物质的衍生物可以用本领域技术人员已知的技术经化学修饰产生,所述化学修饰包括但不限于化学切割、乙酰化、甲酰化、衣霉素代谢合成等。而且,蛋白质物质的衍生物可以含有一个或多个非典型氨基酸。蛋白质物质的衍生物与所来源的蛋白质物质具有相似或相同功能。
本文所用术语“衍生物”对于非蛋白质性衍生物而言表示基于第一种有机或无机分子的结构而形成的第二种有机或无机分子。有机分子的衍生物包括但不限于例如通过添加或删除羟基、甲基、乙基、羧基或氨基而修饰的分子。有机分子还可以被酯化、烷基化和/或磷酸化。
本文所用“诊断”表示确定个体是否受疾病或小病影响的过程。“肝癌诊断”或“肝癌的诊断”表示确定个体是否受肝癌影响的过程,包括诊断肝癌的传统医学诊断技术,以及本发明涉及的诊断方法。传统医学诊断技术包括检查一般健康体征的身体检查和病史,包括检查疾病症候、如肿块或看起来不寻常的任何其它症候,确定血红细胞、白细胞和血小板数目、血红细胞中血红蛋白量,和血红细胞组成的样品的部分;腹腔镜检查,观察腹内器官以检查疾病症候;肝活检;CT扫描(CAT扫描);MRI(磁共振成像)或核磁共振成像(NMRI);和超声。在一个具体实施方案中,“肝癌的诊断”或“肝癌诊断”表示在两个选项之间确定,即个体患有肝癌或个体不患有肝癌。在另一个实施方案中,“诊断”还可以表示在三个选项之间确定,即个体患有肝癌、个体不患有肝癌或不能以足够确定的程度确定个体是否患有肝癌。本领域技术人员理解,在此处“足够确定的程度”依赖于诊断灵敏度核特异性的医学需要。足够确定的程度更具体地包括大于50%灵敏度和/或特异性、大于60%灵敏度和/或特异性、大于70%灵敏度和/或特异性、大于80%灵敏度和/或特异性、大于90%灵敏度和/或特异性,以及100%灵敏度和/或特异性。根据本发明,是指确定个体是否受原发性或转移性肝癌影响。
本文所用“正常”或“非肝癌”对于不依赖于本发明生物标志物的常规诊断而言表示不表现任何肝癌症状并且已知不患有肝癌的个体或一组个体。所述正常个体优选不接受影响肝癌的药物。如果可能,所述个体或个体组不被诊断为具有任何其它疾病。正常个体更优选具有与测试样品相似的性别和年龄。根据本发明,“正常”还表示从正常个体分离的样品,包括从正常个体分离的血、总RNA或mRNA。从正常个体获取的样品可以包括从血样分离的RNA,其中所述血样是全血、裂解血或外周血白细胞(PBL),并且其中所述血来自在分离血的时候诊断为不患有肝癌并且不表现任何肝癌症状的个体。
本文所用“肝癌”是指癌症开始于肝中的原发性肝癌。原发性肝癌包括开始于肝中的肝瘤或肝细胞癌(HCC)和癌症在肝中胆管中发生的胆管瘤。
肝癌症状包括胸廓正下方右侧有硬块,右侧上腹部不适、右肩胛周围疼痛、不明原因体重降低、黄疸、不正常劳累、恶心和食欲减退。
本文所用术语“差异表达”表示与第二种样品中相同的一种或多种本发明生物标志物的表达水平比较,经测定mRNA的量或水平,在一个样品中本发明的一种或多种生物标志物的RNA和/或所述生物标志物mRNA的一种或多种剪接变体表达水平的差异。“差异表达的”还可以包括与第二种样品或样品群中蛋白质表达量或水平比较,对样品或样品群中本发明生物标志物编码的蛋白质的测定。差异表达可以如本文所述和本领域技术人员理解的方法确定。术语“差异表达”或“表达水平的变化”表示与第二种样品中给定生物标志物的可测定表达水平比较,经测定RNA的量和/或蛋白质的量,样品中给定生物标志物可测定表达水平的增加或降低。术语“差异表达”或“表达水平的变化”还可以表示与第二个样品群中生物标志物的可测定表达水平比较,样品群中给定生物标志物可测定表达水平的增加或降低。本文所用“差异表达”可以用给定生物标志物的表达水平相对于对照中给定生物标志物的平均表达水平的比率进行测定,其中比率不等于1.0。还可以用p值测定差异表达。当使用p值时,当p值小于0.1时生物标志物被鉴定为在第一和第二群体之间差异表达。更优选p值小于0.05。甚至更优选p值小于0.01。还更优选p值小于0.005。最优选p值小于0.001。当基于比率确定差异表达时,如果第一种和第二种样品中表达水平的比率大于或小于1.0,则RNA或蛋白质是差异表达的。举例来说,大于1.2、1.5、1.7、2、3、4、10、20的比率,或小于1的比率,例如0.8、0.6、0.4、0.2、0.1、0.05。在本发明的另一个实施方案中,如果第一群体的平均表达水平与第二群体的平均表达水平的比率大于或小于1.0,则核酸转录本是差异表达的。举例来说,大于1.2、1.5、1.7、2、3、4、10、20的比率,或小于1的比率,例如0.8、0.6、0.4、0.2、0.1、0.05。在本发明的另一个实施方案中,如果第一个样品中表达水平与第二个群体中平均表达水平的比率大于或小于1.0,例如包括比率大于1.2、1.5、1.7、2、3、4、10、20,或比率小于1,例如0.8、0.6、0.4、0.2、0.1、0.05,则核酸转录本是差异表达的。
“表达差异增加”或“上调”表示基因相对于对照而言,基因表达(以RNA表达或蛋白质表达测定)显示增加至少10%或更多,例如20%、30%、40%或50%、60%、70%、80%、90%或更多或1.1倍、1.2倍、1.4倍、1.6倍、1.8倍或更多。
“表达差异降低”或“下调”表示基因相对于对照而言,基因表达(以RNA表达或蛋白质表达测定)显示降低至少10%或更多,例如20%、30%、40%或50%、60%、70%、80%、90%或少于1.0倍、0.8倍、0.6倍、0.4倍、0.2倍、0.1倍或更少的基因。例如,上调基因包括与从正常个体分离的mRNA或蛋白质的表达相比,从以患有肝癌为特征的个体分离的血中mRNA或蛋白质表达水平增加的基因。例如,下调基因包括与从正常个体分离的血相比,从以患有肝癌为特征的个体分离的血中mRNA或蛋白质表达水平降低的基因。
本文所用术语“差异杂交”表示与不具有互补性核酸的一种性状的第二个个体或第二组个体的核酸样品与互补性核酸靶的杂交比较,具有所述性状的第一个个体或第一组个体的核酸样品与相同互补性核酸靶的杂交的定量水平差异。“差异杂交”是指第一种样品的杂交水平与第二种样品的比率不等于1.0。例如,第一种样品与靶的杂交水平相对于第二种样品的比率大于或小于1.0,包括大于1.7和小于0.7,大于2和小于0.5。如果在一个样品中检测到杂交而在另一个样品中未检测到,也存在差异杂交。
本文所用术语“药物效果”表示药物的有效性。“药物效果”通常由已经或正在用药物治疗的患者的临床反应测定。如果获得预期临床结果,例如反映本文所述肝癌的基因表达和基因表达模式改变,药物被认为具有高度效果。药物吸收量可用于预测患者反应。一般规律是当药物剂量增加时患者中可见更大效果,直至达到最大预期效果。如果在达到最大点以后施用更多药物,一般将增加副作用。
本文所用术语“有效量”表示足以降低或改善肝癌或其一种或多种症状的进程、严重程度和/或持续时间、预防肝癌或其一种或多种症状的发生、复发或发作、预防肝癌或其一种或多种症状恶化、或增强或改善另一种治疗的预防或治疗作用的化合物的量。
本文所用术语“片段”对于蛋白质物质而言表示肽或多肽,其中包含另一种多肽或蛋白质的氨基酸序列中至少5个连续氨基酸、至少10个连续氨基酸、至少15个连续氨基酸、至少20个连续氨基酸、至少25个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少125个连续氨基酸、至少150个连续氨基酸、至少175个连续氨基酸、至少200个连续氨基酸或至少250个连续氨基酸的氨基酸序列。在一个具体实施方案中,蛋白质或多肽的片段保留所述蛋白质或多肽的至少一种功能。在另一个实施方案中,蛋白质或多肽的片段保留所述蛋白质或多肽的至少二、三、四或五种功能。优选地,抗体的片段保留免疫特异性结合抗原的能力。
本文所用术语“融合蛋白”表示包含第一种蛋白质或多肽或其功能片段、类似物或衍生物的氨基酸序列和异源蛋白质、多肽或肽(即不同于第一种蛋白质或其片段、类似物或衍生物的第二种蛋白质或多肽或其片段、类似物或衍生物)的氨基酸序列的多肽。在一个实施方案中,融合蛋白包含与异源蛋白质、多肽或肽融合的预防或治疗剂。根据该实施方案,所述异源蛋白质、多肽或肽可以是或不是不同类型的预防或治疗剂。
本文所用“基因表达模式”或“基因表达谱”指两种或更多种本发明生物标志物(包括3、4、5、6、7、8、9、10、11、12或所有的本发明生物标志物)的表达水平分析结果的组合模式。基因表达模式或基因表达谱可以经测定本发明生物标志物的产物的表达而得到,并可以使用任何已知技术。例如测定本发明生物标志物的RNA产物表达的技术包括基于PCR的方法(包括RT-PCR)和不基于PCR的方法,以及微阵列分析。为测定本发明生物标志物的蛋白质产物,技术包括Western印迹和ELISA分析。
本文所用术语“与……杂交”或“杂交”表示与互补性核酸的序列特异性非共价结合相互作用,例如靶核酸序列与阵列上核酸成员之间的相互作用。
本文所用术语“免疫球蛋白”表示基本由免疫球蛋白基因编码的一种或多种多肽组成的蛋白质。已知的人免疫球蛋白基因包括κ、λ、α(IgA1和IgA2)、γ(IgG1、IgG2、IgG3、IgG4)、δ、ε和μ恒定区基因,以及数量极大的免疫球蛋白可变区基因。全长免疫球蛋白“轻链”(约25Kd或214个氨基酸)由位于氨基端(约110个氨基酸)的可变区基因和位于羧基端的κ或λ恒定区基因编码。相似地,全长免疫球蛋白“重链”(约50Kd或446个氨基酸)由位于氨基端(约116个氨基酸)的可变区基因和其它前述恒定区基因之一例如γ(编码约330个氨基酸)编码。
本文所用术语“组合”当涉及治疗性处理时表示使用超过一种类型的治疗(例如超过一种预防剂和/或治疗剂)。使用术语“组合”不限制向对象使用治疗的顺序。第一种治疗(例如第一种预防或治疗剂)可以在向对象施用第二种治疗(例如第二种预防或治疗剂)之前(例如5分钟、15分钟、30分钟、45分钟、1小时、2小时、4小时、6小时、12小时、24小时、48小时、72小时、96小时、1周、2周、3周、4周、5周、6周、8周或12周之前)、同时或之后(例如5分钟、15分钟、30分钟、45分钟、1小时、2小时、4小时、6小时、12小时、24小时、48小时、72小时、96小时、1周、2周、3周、4周、5周、6周、8周或12周之后)施用。
本文所用“疾病指标”当涉及表达模式时是指疾病诊断性的表达模式,使得所述表达模式在疾病患者中比在无所述疾病的患者中明显更经常发现(如用常规统计方法设定置信水平在最小95%进行确定)。疾病指标的表达模式优选在至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或更多的患有所述疾病的患者中发现,而在少于10%、少于8%、少于5%、少于2.5%或少于1%的不患有所述疾病的患者中发现。“疾病指标”还指疾病诊断性的表达模式,通过使用本领域技术人员理解并且例如见商业程序如Silicon Genetics提供的那些(例如GeneSpringTM)的类型预测统计算法,与没有疾病的个体的对照表达模式比较,使得表达模式更恰当分类到患有疾病个体的对照表达模式。
本文所用“分离的”或“纯化的”当用于核酸时是指天然存在的序列已经从其正常细胞(如染色体)环境中取出或者在非天然环境下合成(如人工合成)。因此,“分离的”或“纯化的”序列可以是在无细胞溶液中或在不同的细胞环境中。术语“纯化的”不隐含序列仅有核苷酸存在,而是它基本无(约90-95%纯)与它天然结合的非核苷酸物质,从而不同于分离的染色体。
本文所用术语“分离的”和“纯化的”对于蛋白质物质(如肽、多肽、蛋白质或抗体)而言表示基本无细胞物质的、有些实施方案中基本无所来源细胞或组织的异源蛋白质物质(即污染蛋白质)的、或当化学合成时基本无化学前体或其它化学物的蛋白质物质。短语“基本无细胞物质”包括蛋白质物质的制备物,其中蛋白质物质与分离或重组生产它的细胞的细胞组分分离。因此,基本无细胞物质的蛋白质物质包括具有少于约30%、20%、10%或5%(干重)异源蛋白质物质(如蛋白质、多肽、肽或抗体;也称“污染蛋白质”)的蛋白质物质的制备物。当重组生产所述蛋白质物质时,还优选基本无培养基的,即培养基占蛋白质制备物体积的少于约20%、10%或5%。当化学合成蛋白质物质时,优选基本无化学前体或其它化学物,即与参与合成所述蛋白质物质的化学前体或其它化学物分离。因此,除了感兴趣的蛋白质物质以外,蛋白质物质的这种制备物具有少于约30%、20%、10%、5%(干重)的化学前体或其它化学物。本文公开的蛋白质物质优选是分离的。
本文所用术语“表达水平”当涉及RNA时表示经杂交测定或如实时RT-PCR测定给定核酸的可测定的量,所述实时RT-PCR包括使用SYBR绿和TaqMan技术并且它与基因表达程度成正比。核酸的表达水平经本领域技术人员公知的方法确定。对于微阵列分析,根据本领域公知方法,用对应从一或多个个体分离的RNA的标记核酸经杂交分析测定表达水平。用于杂交的核酸标记物可以是发光标记物、酶标记物、放射性标记物、化学标记物或物理标记物。靶核酸优选用荧光分子标记物。优选的荧光标记物包括但不限于荧光素、氨基香豆素乙酸、四甲基罗丹明异硫氰酸酯(TRITC)、德克萨斯红、Cyanine 3(Cy3)和Cyanine 5(Cy5)。
本文所用“配体”是特异性结合本发明生物标志物基因之一所编码多肽的分子。配体可以是核酸(RNA或DNA)、多肽、肽或化合物。本发明的配体可以是肽配体,如骨架肽、线性肽或环肽。在一个优选实施方案中,多肽配体是抗体。抗体可以是人抗体、嵌合抗体、重组抗体、人源化抗体、单克隆抗体或多克隆抗体。抗体可以是完整免疫球蛋白,如IgA、IgG、IgE、IgD、IgM或其亚型。抗体可以与功能性结构(如具有生物或化学功能的化合物,它可以是第二种不同多肽、治疗药物、细胞毒性剂、可检测结构或固相支持物)偶联。本发明的多肽配体如抗体与生物标志物基因之一所编码的多肽以高亲和性和特异性相互作用。例如,多肽配体结合生物标志物基因之一所编码的多肽,其亲和常数为至少107M-1,优选至少108M-1、109M-1或1010M-1。
本文所用“肝癌”表示原发性肝癌和转移性肝癌。原发性肝癌包括开始于肝中的肝瘤或肝细胞癌(HCC);和癌症在肝中胆管中发生的胆管瘤或胆管癌。肝癌也包括转移性肝癌,其中来自其它器官和组织的癌细胞定位于肝中并生长为继发性肿瘤。
“mRNA”是指与基因互补的RNA;mRNA包括蛋白质编码区,还可以包括5’端和3’非翻译区(UTR)。
本文所用术语“大多数”表示占组成总数的50%(如51%、60%、或70%、或80%、或90%或直至100%)以上的数目。术语“大多数”当用于阵列时,是指与阵列的固相基质稳定结合的核酸成员总数的50%(如51%、60%、或70%、或80%、或90%或直至100%)以上。
本文所用术语“控制”(”manage”、”managing”和”management”)表示不导致治愈肝癌的治疗(如预防或治疗剂)对象的有益作用。在某些实施方案中,向对象施用一种或多种“控制”肝癌的治疗以改善肝癌症状和/或预防和/或阻碍肿瘤大小的增加、肿瘤扩散到整个肝脏和/或转移到肝脏以外。
肝癌预防在本文中定义为阻碍或阻止肝癌疾病的发作。肝癌改善在本文中定义为提供肝癌的物理或生理性缓解,可以包括缓解症状以及减轻疾病本身(如肿瘤大小减小)。肝癌治疗在本文中定义为提供对抗疾病自身、疾病症状和/或肝癌进程的医学辅助手段。这些治疗可以作为帮助缓解症状和改善生活质量的对症治疗给予。
本文所用“mRNA完整性”表示来自组织样品或血液样品的mRNA提取物的质量。当用本领域公知方法检查时,例如通过RNA琼脂糖凝胶电泳(如Ausubel et al.,John Weley & Sons,Inc.,1997,Current Protocols in Molecular Biology)检查时,具有良好完整性的mRNA提取物不显示降解。mRNA样品优选具有良好完整性(如少于10%、优选少于5%、更优选少于1%的mRNA被降解),以真实代表所提取来源的组织或血液样品的基因表达水平。
本文所用术语“非反应性的”和“难治的”描述用当前可用的肝癌治疗(如预防或治疗剂)处理的患者,所述当前可用的肝癌治疗在临床上不适于改善与其相关的一种或多种症状。这些患者通常患有严重的、持续活动的疾病,需要其它治疗以改善与肝癌相关的症状。
本文所用“核酸”可与术语“多核苷酸”互换使用,一般表示任何多聚核糖核苷酸或多聚脱氧核糖核苷酸,它可以是未修饰的RNA或DNA,或修饰的RNA或DNA,或其任何组合。“核酸”包括但不限于单链和双链核酸。本文所用术语“核酸”还包括含一个或多个修饰碱基的上述DNA或RNA。因此为了稳定性或其它原因而具有修饰骨架的DNA或RNA是“核酸”。本文所用术语“核酸”包括核酸的化学、酶促或代谢修饰形式,以及病毒和细胞特征性的DNA和RNA的化学形式,所述细胞例如包括简单和复杂细胞。“核酸”或“核酸序列”还可以包括单链或双链RNA或DNA或其任意组合的区域,并且根据本发明的一些实施方案可以包括表达序列标签(EST)。EST是基因的表达序列的一部分(即序列的“标签”),通过逆转录mRNA一个区域制备cDNA而得到。
本文所用“核酸阵列”表示附着于支持物上的多个核酸(或“核酸成员”),其中每个核酸成员附着到支持物上独特的预先选定的区域。在一个实施方案中,附着到支持物表面的核酸成员是DNA。在一个优选实施方案中,附着到支持物表面的核酸成员是cDNA或寡核苷酸。在另一个优选实施方案中,附着到支持物表面的核酸成员是经聚合酶链式反应(PCR)合成的cDNA。本文所用术语“核酸”可与术语“多核苷酸”互换。在另一个优选实施方案中,“核酸阵列”表示附着到硝酸纤维素或用于Southern和/或Northern印迹技术的其它膜上的多个独特的核酸。
本文所用“用于和阵列杂交的核酸样品”定义为能通过包括互补碱基配对相互作用的一组非共价键合相互作用与结合到互补序列阵列上的核酸结合的核酸。用于和阵列杂交的核酸样品可以是与样品中分离的基因或其部分、总RNA或mRNA对应的分离核酸序列。用于和阵列杂交的核酸样品优选来源于人血(包括全血、裂解血、离心裂解血或外周血白细胞(PBL))。核酸样品更优选是单链或双链DNA、RNA或DNA-RNA杂交体,来自人血,优选来自RNA或mRNA提取物。
本文所用“阵列上的核酸成员”或“核酸成员”包括固定在阵列上并能通过包括互补碱基配对相互作用的一组非共价键合相互作用与核酸探针或互补序列样品结合的核酸。本文所用核酸成员或靶可以包括天然(即A、G、C或T)或修饰碱基(7-去氮杂鸟嘌呤核苷、肌苷等)。此外,核酸中碱基可以通过磷酸二酯键以外的连接键而连接,只要它不干扰杂交(即,在标准严谨性或选择性杂交条件下核酸靶仍然特异性结合其互补序列)。因此,核酸成员可以是肽核酸,其中组成的碱基通过肽键而不是磷酸二酯键被连接起来。在一个实施方案中,与阵列结合的“靶”序列的常规核酸阵列可以代表人全基因组,例如Affymetrix芯片,并且由图1所述3个基因或基因探针中2个或更多个组成或包含它们的生物标志物或分离的生物标志物被施加到该常规阵列上。在另一个实施方案中,与阵列结合的序列可以是根据本发明的生物标志物或分离的生物标志物,并且总细胞RNA被施加到阵列上。
本文所用术语“寡核苷酸”定义为包含两个或更多并优选超过3个脱氧核糖核苷酸和/或核糖核苷酸的分子。其确切大小依赖于很多因素,这些因素又依赖于寡核苷酸的最终功能和用途。寡核苷酸可以长约8到约1,000个核苷酸。尽管8-100个核苷酸的寡核苷酸可用于本发明,优选地寡核苷酸长度范围是约8-约15个碱基,长约8-约20个碱基,长约8-约25个碱基,长约8-约30个碱基,长约8-约40个碱基,或长约8-约50个碱基。
本文所用“患者”或“个体”表示被诊断为患有肝癌的哺乳动物,并且进一步包括被诊断为患有原发性或转移性肝癌的哺乳动物。
本文所用短语“药学上可接受的盐”包括但不限于酸性或碱性基团盐,可以用本发明方法鉴定的化合物形式存在。碱性化合物能与多种无机和有机酸形成各种盐。可用于制备这些碱性化合物的药学上可接受的酸加成盐的酸是可以形成无毒酸加成盐的那些,即含有药学上可接受的阴离子的盐,包括但不限于硫酸、柠檬酸、马来酸、乙酸、草酸、盐酸、氢溴酸、氢碘酸、硝酸盐、硫酸盐、硫氢酸盐、磷酸盐、酸式磷酸盐、异烟酸盐、乙酸盐、乳酸盐、水杨酸盐、柠檬酸盐、酸式柠檬酸盐、酒石酸盐、油酸盐、单宁酸盐、泛酸盐、氢酒石酸盐、抗坏血酸盐、琥珀酸盐、马来酸盐、gentisinate、富马酸盐、葡萄糖酸盐、glucaronate、蔗糖酸盐、甲酸盐、苯甲酸盐、谷氨酸盐、甲磺酸盐、乙磺酸盐、苯磺酸盐、对甲苯磺酸盐和pamoate(即1,1’-亚甲基-双-(2-羟基-3-萘酸))盐。除了上述酸以外,包括氨基结构的化合物还可以与各种氨基酸形成药学上可接受的盐。酸性化合物能与多种药学上可接受的阳离子形成碱式盐。这些盐的实例包括碱金属或碱土金属盐,尤其是钙盐、镁盐、钠盐、锂盐、锌盐、钾盐和铁盐。
本文所用“多核苷酸”包括超过8个核苷酸长的双链DNA、单链DNA和双链或单链RNA。术语“多核苷酸”包括任意长度的聚合物形式的核苷酸,包括核糖核苷酸或脱氧核糖核苷酸,其中包含嘌呤和嘧啶碱基、或其它天然的、化学或生化修饰的、非天然的或衍生化的核苷酸碱基。多核苷酸的骨架可以包含通常可以在RNA或DNA中发现的糖和磷酸基团,或者修饰或取代的糖或磷酸基团。多核苷酸可以包含修饰核苷酸,如甲基化核苷酸和核苷酸类似物。核苷酸序列可以被非核苷酸成分中断。
本文所用“由……编码的多肽序列”表示如本文所定义的基因的蛋白质编码区翻译之后获得的氨基酸序列。本发明每个基因的mRNA核苷酸序列用其GenBank登记号识别(见表3),对应的多肽序列用蛋白质登记号识别(见表3)。表3中识别的GenBank登记号提供本发明每个基因的mRNA核苷酸序列内的5’UTR、蛋白质编码区(CDS)和3’UTR的位置。当蛋白质或蛋白质片段用于免疫宿主动物时,该蛋白质的很多区域可以诱导产生抗体,这些抗体可以与蛋白质上的给定区域或三维结构特异性结合,这些区域或结构被称为表位或抗原决定簇。本文所用“抗原性片段”表示含一个或多个表位的多肽部分。表位可以是线性的,基本包含抗原的线性序列,或者是构象性的,包含被其它序列遗传隔离但在多肽配体的结合位点处成一体结构的序列。“抗原性片段”可以长5000、1000、500、400、300、200、100、50或25或20或10或5个氨基酸。
本文所用术语“预防”(prevent,preventing和prevention)表示通过施用根据本发明方法鉴定的一种或多种化合物或者施用这种化合物和另一种治疗的组合从而防止肝癌或其一种或多种症状的发生、复发或发作。
本文所用术语“引物”表示寡核苷酸,不管是在纯化的限制性消化物中天然存在还是合成产生,当置于诱导与核酸链互补的引物延伸产物合成的条件下,即在存在核苷酸和诱导剂如DNA聚合酶并在合适温度和pH下时它能作为合成起点。引物可以是单链或双链,并且必须足够长以在诱导剂存在下引发合成预期的延伸产物。引物的确切长度依赖于很多因素,其中包括温度、引物来源和使用方法。例如,对于诊断应用,依赖于靶序列的复杂性,寡核苷酸引物通常含有15-25个或更多核苷酸,尽管它可以含有更少核苷酸。参与确定引物适当长度的因素对于本领域技术人员容易知道。
本文所用术语“探针”是指寡核苷酸及其类似物,并涉及通过与靶序列的核苷酸碱基的氢键相互作用而识别多核苷酸靶序列的一系列化学物质。探针或靶序列可以是单链或双链RNA或单链或双链DNA或DNA与RNA碱基的组合。探针至少长8个核苷酸,并少于全基因的长度。探针可以长10、20、30、50、75、100、150、200、250、400、500和长至2000个核苷酸,只要小于靶基因全长即可。探针可以包括修饰寡核苷酸,以具有可通过荧光、化学发光等检测的标签。探针还可以被修饰以具有可检测标签和淬灭分子,例如Taqman和Molecular Beacon探针。
寡核苷酸及其类似物可以是RNA或DNA,或RNA或DNA的类似物,通常称为反义寡聚物或反义寡核苷酸。这些RNA或DNA类似物包含但不限于2’-O-烷基糖修饰,甲基膦酸酯、硫代磷酸酯(phosphorothiate)、二硫代磷酸酯、formacetal、3’-thioformacetal、砜、氨基磺酸酯和硝基氧骨架修饰,和其中碱基结构已被修饰的类似物。此外,寡聚物的类似物可以是下述聚合物,其中糖结构已经被修饰或替换为另一个合适的结构而得到聚合物,包括但不限于吗啉代类似物和肽核酸(PNA)类似物(Egholm,et al.Peptide Nucleic Acids(PNA)--Oligonucleotide Analogues with anAchiral Peptide Backbone,(1992))。
探针还可以是任何寡核苷酸类似物类型与天然DNA或RNA一起或组合的混合物。同时,寡核苷酸及其类似物可以单独使用或与一种或多种另外的寡核苷酸或其类似物组合使用。
本文所用“多个”或“成组的”表示超过两个,例如3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、或10个或更多等。
本文所用“预先选定的区域”、“预定区域”或“独特位置”表示基质上的局部区域,该区域是、已经是或准备是用于沉积核酸,在本文中也被称为“选定区域”或简单称为“区域”。预先选定的区域可以具有任何方便的形状,如圆形、长方形、椭圆形、楔形等。在一些实施方案中,预先选定的区域小于约1cm2,更优选小于1mm2,还更优选小于0.5mm2,在一些实施方案中小于0.1mm2。“预先选定的区域”、“预定区域”或“独特位置”的核酸成员可以通过在区域上的位置或独特位置确定身份(例如序列)。
本文所用术语“生物标志物的产物”或“本发明生物标志物的产物”表示对应于本发明生物标志物的基因表达的RNA和/或蛋白质。对于RNA,它表示由对应于本发明生物标志物的基因转录的RNA转录本。对于蛋白质,它表示由对应于本发明生物标志物的基因翻译的蛋白质。“本发明生物标志物的RNA产物”包括mRNA转录本、和/或mRNA的特定剪接变体,根据本文公开的教导其表达量可以用作生物标志物。“本发明生物标志物的蛋白质产物”包括从本发明生物标志物的RNA产物翻译的蛋白质。
本文所用术语“预防剂”表示可用于预防肝癌的任何化合物。在某些实施方案中,术语“预防剂”表示在本文所述筛选测试中鉴定的化合物。在某些其它实施方案中,术语“预防剂”表示本文所述筛选测试中所鉴定化合物以外的、已知可用于或已经或当前正用于预防或阻碍肝癌或其一种或多种症状发作、发生和/或进程的药剂。
本文所用短语“预防有效量”表示足以导致预防肝癌或其一种或多种症状发生、复发或发作的治疗(如预防剂)的量。
本文所用术语“蛋白质”和“多肽”可互换使用,用于表示由肽键连接在一起的氨基酸链。在具体的一个实施方案中,蛋白质由通过肽键连接在一起的少于200、少于175、少于150、少于125、少于100、少于50、少于45、少于40、少于35、少于30、少于25、少于20、少于15、少于10或少于5个氨基酸组成。在另一个实施方案中,蛋白质由通过肽键连接在一起的至少200、至少250、至少300、至少350、至少400、至少450、至少500或更多个氨基酸组成。
“蛋白质编码区”表示mRNA中编码多肽的部分。
本文所用“参考群体”或“测试群体”表示用于形成分类符以区分肝癌和非肝癌的“对照样品”的群体。“参考群体”或“测试群体”由多个对照样品组成,其中一些来自用常规诊断技术诊断为患有肝癌的个体,一些来自用常规诊断技术诊断为不患有肝癌的个体。在一个优选实施方案中,“参考群体”或“测试群体”由来自患有肝癌和不患有肝癌的相等数目的个体的“对照样品”组成。在另一个实施方案中,“参考群体”根据患有或不患有肝癌的个体的状态以外的表型进行匹配,所述表型例如相似年龄、性别、药物状态等。
本文所用术语“选择性结合”对于本发明涉及的蛋白质而言表示任意两种肽、蛋白质、多肽和抗体的特异性相互作用,其中与任意其它的肽、蛋白质、多肽和抗体比较,相互作用优先发生在任意两种肽、蛋白质、多肽和抗体之间。例如,当所述两个分子是蛋白质分子时,第一个分子上的结构识别并结合第二个分子上的结构,而不是其它蛋白质。如本文所用“选择性结合”是指分子以比它结合非特异性分子至少2倍以上的亲和力结合其特异性结合伴侣,优选以至少10倍、20倍、50倍、100倍或更高亲和力结合其特异性结合伴侣。
本文所用“选择性杂交”在本发明中表示发生在本发明涉及的多核苷酸和本发明生物标志物的RNA或蛋白质产物之间的杂交,其中所述杂交使得所述多核苷酸相对于所研究基因组中其它基因的RNA产物而言优先结合本发明生物标志物的RNA产物。在一个优选实施方案中,“选择性杂交”的多核苷酸以大于70%、大于80%、大于90%和最优选100%的选择性杂交(即与其它RNA的交叉杂交小于30%、小于20%、小于10%)。本领域技术人员理解,考虑到其长度和组成,可以确定与本发明生物标志物的RNA产物“选择性杂交”的多核苷酸。
本文所用“特异性杂交”表示当两个核酸序列基本互补时(在至少14-25个核苷酸长度范围内至少约65%互补,优选至少约75%互补,更优选至少约90%互补)发生的杂交。见Kanehisa,M.,1984,Nucleic Acids Res.,12203,经引用并入本文。因此期望耐受某种程度的错配。这种错配可以是小的,如单、二、或三核苷酸。作为替代方案,错配区可以包括环(loop),环被定义为存在不间断的四个或更多个核苷酸错配的区域。很多因素影响两个核酸杂交的效率和选择性,例如阵列上核酸成员与靶核酸序列杂交的效率和选择性。这些因素包括核酸成员长度、核苷酸序列和/或组成、杂交温度、缓冲液组成和核酸成员需要杂交区域的位阻能力。在核酸长度与核酸退火到靶序列上的效率和准确性之间存在正相关。具体而言,较长序列比较短序列具有更高融链温度(TM),并且更不可能在给定靶序列内重复,因此最小化非特异性杂交。杂交温度随核酸成员退火效率反向变化。相似地,杂交混合物中有机溶剂如甲酰胺浓度随退火效率反向变化,而杂交混合物中盐浓度增加有助于退火。在严谨性退火条件下,较长的核酸比较短核酸杂交更有效,所述较短核酸对于较宽松条件是足够的。
本文所用“点斑”或“附着”表示将核酸成员沉积到固相基质上形成核酸阵列使得核酸通过共价键、氢键或离子相互作用而稳定结合到固相基质上的过程。
本文所用“稳定结合”表示核酸通过共价键、氢键或离子相互作用而与固相基质稳定结合从而形成阵列,使得在阵列通常被分析的条件下,所述核酸相对于与阵列稳定结合的所有其它核酸或相对于固相基质上所有其他预先选定的区域(即在一或多步骤的杂交、洗涤和/或扫描等期间)保持其独特的预先选定的位置。
本文所用“基质”或“支持物”当用于阵列时表示具有刚性或半刚性表面的材料。支持物可以是生物、非生物、有机、无机或这些的任意组合,存在形式为颗粒、链(strand)、沉淀、凝胶、薄片(sheet)、管、球、珠、容器、毛细管、垫、切片、膜、板、载片(slide)、块(chip)等。基质经常是硅或玻璃表面、(聚)四氟乙烯、(聚)偏二氟乙烯、聚苯乙烯、聚碳酸酯、带电膜如尼龙66或硝酸纤维素,或其组合。在一个优选实施方案中,支持物是玻璃。基质的至少一个表面优选是基本上平的。固相支持物优选含有活性基团,包括但不限于羧基、氨基、羟基、硫羟基等。在一个实施方案中,固相支持物可选是透明的。
本文所用“特异性杂交”表示当两个核酸序列基本互补时(在至少14-25个核苷酸长度范围内至少约65%互补,优选至少约75%互补,更优选至少约90%互补)发生的杂交。见Kanehisa,M.,1984,Nucleic Acids Res.,12203,经引用并入本文。因此期望耐受某种程度的错配。这种错配可以是小的,如单、二、或三核苷酸。作为替代方案,错配区可以包括环(loop),环被定义为存在不间断的四个或更多个核苷酸错配的区域。很多因素影响两个核酸杂交的效率和选择性,例如阵列上核酸成员与靶核酸序列的杂交效率和选择性。这些因素包括核酸成员长度、核苷酸序列和/或组成、杂交温度、缓冲液组成和核酸成员需要杂交区域的位阻能力。在核酸长度与核酸退火到靶序列上的效率和准确性之间存在正相关。具体而言,较长序列比较短序列具有更高融链温度(TM),并且更不可能在给定靶序列内重复,因此最小化随意性杂交。杂交温度随核酸成员退火效率反向变化。相似地,杂交混合物中有机溶剂如甲酰胺浓度随退火效率反向变化,而杂交混合物中盐浓度增加有助于退火。在严谨性退火条件下,较长的核酸比较短核酸杂交更有效,所述较短核酸对于较宽松条件是足够的。
本文所用术语“标准严谨性条件”是指仅在序列之间具有至少95%、优选至少97%一致性时发生杂交,其中一致性区域包含至少10个核苷酸。在一个实施方案中,序列在严谨性条件下将杂交,包括序列在42℃孵育过夜,随后进行严谨性洗涤(0.2×SSC,65℃)。可以通过改变温度、pH、离子强度、二价阳离子浓度、洗涤体积和时间而改变洗涤严谨性程度。例如,通过在探针融链温度以下的不同温度杂交可以改变杂交严谨性。探针的融链温度可以用下式计算对于长度在14-70个核苷酸之间的寡核苷酸探针,以摄氏度表示的融链温度(Tm)可以用下式计算Tm=81.5+16.6(log[Na+])+0.41(G+C比例)-(600/N),其中N是寡核苷酸的长度。
例如,在含约1M的Na+浓度的杂交缓冲液中,杂交温度可以以5℃间隔从68℃降低到42℃。杂交以后,可以用2×SSC,0.5%SDS在杂交温度下洗膜。这些条件在50℃以上被认为是“中等严谨性”条件,在50℃以下被认为是“低严谨性”条件。“中等严谨性”杂交条件的具体实例是在55℃进行上述杂交的条件。“低严谨性”杂交条件的具体实例是在45℃进行上述杂交的条件。
如果在含甲酰胺的溶液中进行杂交,融链温度可以用以下方程式计算Tm=81.5+16.6(log[Na+])+0.41(G+C比例)-(0.63%甲酰胺)-(600/N),其中N是寡核苷酸的长度。
例如,可以在含甲酰胺的缓冲液如6×SSC在42℃的温度下进行杂交。在此情况下,杂交缓冲液中甲酰胺浓度可以以5%间隔从50%减少到0%以鉴定与探针具有递减水平同源性的克隆。杂交以后,可以用6×SSC,0.5%SDS在50℃下洗膜。这些条件在25%甲酰胺以上时被认为是“中等严谨性”条件,在25%甲酰胺以下时被认为是“低严谨性”条件。“中等严谨性”杂交条件的具体实例是用30%甲酰胺进行上述杂交的条件。“低严谨性”杂交条件的具体实例是用10%甲酰胺进行上述杂交的条件。
本文所用术语“显著匹配”当用于核酸序列时,是指使用本领公知的比较方法,两种核酸序列表现出至少65%、至少70%、至少75%、至少80%、至少85%、优选至少90%一致性(即Altschul,S.F.et al.,1997,Nucl.Acids Res.,253389-3402;Schffer,A.A.et al.,1999,Bioinformatics 151000-1011)。本文所述“显著匹配”包括非连续或散布的相同核苷酸,只要所述序列在使用本领域常规比对方法进行最大比对时表现出至少65%、优选至少70%、至少75%、至少80%、至少85%和优选至少90%一致性即可。
本文所用术语“协同”表示用本文所述方法之一鉴定的化合物和另一种治疗(如剂)的组合比所述治疗的叠加作用更有效。所述其它治疗优选已经或当前正在预防、治疗、控制或改善肝癌或其症状。治疗(如预防或治疗剂)组合的协同作用允许施用更低剂量的一种或多种治疗和/或所述治疗向肝癌患者更低频率给药。使用更低剂量治疗(如预防或治疗剂)和/或更低频率施用所述治疗的能力降低与向患者施用所述药剂相关的毒性,而不降低所述治疗预防、治疗、控制或改善肝癌的效果。此外,协同作用可以导致提高肝癌预防、治疗、控制或改善的治疗(如药剂)效果。最后,治疗(如预防或治疗剂)组合的协同作用可以避免或降低与单独使用治疗相关的不利或不期望的副作用。
本文所用“治疗剂”或“药剂”表示增加或降低多核苷酸序列表达的化合物,与正常个体相比,所述多核苷酸序列在患有肝癌的个体来源的组织或血液样品中差异表达。本发明提供这样的“治疗剂”,其在施用于患者时,1)预防肝癌发作;2)减轻、推迟或消除肝癌的恶化和/或转移和/或3)恢复患者的一种或多种疾病指示性核酸的一种或多种表达谱为与正常个体更相似的谱。
本文所用术语“治疗剂”表示能用于治疗、控制或缓解肝癌或其一种或多种症状的任意化合物。在一个具体实施方案中,术语“治疗剂”表示增加或降低肝癌细胞或细胞系中差异表达的多核苷酸序列表达的化合物。本发明提供这样的“治疗剂”,其在施用于患者时,1)预防肝癌发作;2)减轻、推迟或消除肝癌症状;3)减缓、推迟或消除肿瘤生长;和/或4)恢复患者的一种或多种疾病指示性核酸的一种或多种表达谱为与正常个体更相似的谱。在某些实施方案中,术语“治疗剂”表示在本文所述筛选测试中鉴定的化合物。在另一些实施方案中,术语“治疗剂”表示本文所述筛选测试中所鉴定化合物以外的、已知可用于或已经或当前正用于治疗、控制或缓解肝癌或其一种或多种症状的药剂。
本文所用短语“治疗有效量”表示足以导致缓解肝癌或其一种或多种症状、预防肝癌恶化、引起肝癌消退或增强或提高另一种治疗(如治疗剂)的治疗效果的治疗(如治疗剂)的量。在一个具体实施方案中,治疗有效量表示降低肝癌细胞的细胞增殖的治疗(如治疗剂)的量。相对于对照如磷酸盐缓冲液(“PBS”),治疗有效量的治疗(如治疗剂)优选降低细胞增殖至少5%、优选至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
本文所用术语“治疗”(treat,treatment and treating)表示通过施用一种或多种根据本发明方法鉴定的化合物或者一种或多种根据本发明方法鉴定的化合物与另一种治疗的组合,从而降低或缓解肝癌或其一种或多种症状的进程、严重性和/或时间。
本文所用“组织核酸样品”表示来源于组织、优选肝组织、更优选癌性肝组织的核酸。组织核酸样品优选是总RNA、mRNA或是对应RNA的核酸,例如cDNA。组织核酸样品还可以包括来源于总RNA、mRNA或cDNA的PCR产物。
5.2小结本发明的实施部分利用分子生物学、微生物学和重组DNA技术的常规技术,它们在本领域技术人员的能力范围内。这些技术在文献中被全面解释。例如见Sambrook,Fritsch & Maniatis,1989,Molecular CloningA Laboratory Manual,Second Edition;Oligonucleotide Synthesis(M.J.Gait,ed.,1984);Nucleic Acid Hybridization(B.D.Harnes & S.J.Higgins,eds.,1984);A Practical Guide to Molecular Cloning(B.Perbal,1984);和丛书Methods in Enzymology(Academic Press,Inc.);Short Protocols InMolecular Biology,(Ausubel et al.,ed.,1995)。本文以上和以下提及的所有专利、专利申请和公开出版物的全部内容经引用并入本文。
本文公开的发明从血中鉴定可用于诊断肝癌的生物标志物和生物标志物组合。为了使用这些生物标志物,本发明教导测定这些生物标志物的RNA和/或蛋白质产物的表达。本发明进一步公开了与本发明生物标志物的RNA产物特异性和/或选择性杂交从而能测定所述生物标志物的RNA产物表达的寡核苷酸、cDNA、DNA、RNA、PCR产物、合成DNA、合成RNA或修饰核苷酸的其它组合。本发明还公开了与本发明生物标志物的蛋白质产物特异性和/或选择性杂交从而能测定本发明本发明蛋白质产物表达的蛋白质、肽、抗体、配体,还公开了含有这些多肽和/或多核苷酸的试剂盒。
通过使用特异性和/或选择性针对本发明生物标志物的RNA产物的那些多核苷酸定量RNA产物的表达,可以测定本发明生物标志物和生物标志物组合的RNA产物的表达。在本发明的具体实施方案中,特异性和/或选择性针对所述RNA产物的多核苷酸是探针或引物。在一个实施方案中,这些多核苷酸是能点斑到阵列上从而测定待诊断个体血中RNA的核酸探针形式。在另一个实施方案中,可使用商品阵列测定所述RNA产物的表达,本发明教导分析哪种基因组合。在另一个实施方案中,特异性和/或选择性针对本发明生物标志物的RNA产物的多核苷酸以探针和引物形式使用于如定量实时RT PCR的技术中,其中使用例如SYBRGreen,或使用TaqMan或Molecular Beacon技术,其中所用多核苷酸以正向引物、反向引物、TaqMan标记探针或Molecular Beacon标记探针的形式使用。在一个具体实施方案中,可以将测定本发明RNA产物的表达水平产生的结果输入用于鉴定如本文公开用于确诊的生物标志物组合的模型中。在一个优选实施方案中,使用相同方法产生表达数据,所述表达数据用于产生数学模型,该模型如用于诊断测试个体。
本发明还涉及本文公开的并且本领域技术人员将知道的蛋白质或多肽用于测定本发明生物标志物的蛋白质产物的用途。然后可利用本领域技术人员已知的技术(例如,诸如Western印迹、免疫沉淀、ELISA、蛋白质微阵列分析等的技术)测定对应本发明生物标志物的蛋白质产物的水平。本领域技术人员将会明白,测定本发明生物标志物的蛋白质产物的表达水平要求一种蛋白质,这种蛋白质特异性和/或选择性结合到对应本发明每种生物标志物的蛋白质产物的一种或多种。然后可以将本发明生物标志物的蛋白质产物的表达水平的代表性数据输入模型,所述模型用于鉴定所述组合以确定所述模型定义的诊断。在一个优选实施方案中,使用相同方法产生表达数据,所述表达数据用于产生数学模型,该模型如用于诊断测试个体。
本发明还涉及蛋白质或多肽与多核苷酸组合用于测定本发明生物标志物的一种或多种产物的用途。
本发明还涉及含有两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸与至少两种本发明生物标志物选择性杂交,其中所述生物标志物选自表1中列出的以下基因β-淀粉样蛋白(A4)前体样蛋白2(APLP2);BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);补体成分5(C5);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);组织蛋白酶B(CTSB);cortactin(CTTN);ficolin(含有胶原/纤维蛋白原结构域)1(FCN1);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);IGF-II mRNA结合蛋白3(IMP-3);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);2’,5’-寡腺苷酸合成酶1(OAS1);2’-5’-寡腺苷酸合成酶3(OAS3);RAR相关孤儿受体A(RORA);相关的RAS病毒(r-ras)癌基因同源物2(RRAS2);α-synuclein(淀粉样蛋白前体的非A4组分(SNCA));人丝氨酸苏氨酸激酶17b(凋亡诱导型)(STK17B);转录因子EC(TFEC);杀伤细胞凝集素样受体亚家族B,其中所述组合物用于测定所述生物标志物的表达水平。
本发明还涉及含有两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸选择性结合到至少两种生物标志物的RNA产物上,其中所述生物标志物选自表1中列出的以下基因β-淀粉样蛋白(A4)前体样蛋白2(APLP2);BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);补体成分5(C5);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);组织蛋白酶B(CTSB);cortactin(CTTN);ficolin(含有胶原/纤维蛋白原结构域)1(FCN1);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);IGF-II mRNA结合蛋白3(IMP-3);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);2’,5’-寡腺苷酸合成酶1(OAS1);2’-5’-寡腺苷酸合成酶3(OAS3);RAR相关孤儿受体A(RORA);相关的RAS病毒(r-ras)癌基因同源物2(RRAS2);α-synuclein(淀粉样蛋白前体的非A4组分(SNCA));人丝氨酸苏氨酸激酶17b(凋亡诱导型)(STK17B);转录因子EC(TFEC)。在一个方面中,所述组合物包含用于定量RT-PCR(QRT-PCR)的多核苷酸。
本发明还涉及含有两种或更多种分离蛋白质的集合的组合物,所述蛋白质选择性结合到至少两种生物标志物的蛋白质产物上,其中所述生物标志物选自表1中列出的以下基因β-淀粉样蛋白(A4)前体样蛋白2(APLP2);BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);补体成分5(C5);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);组织蛋白酶B(CTSB);cortactin(CTTN);ficolin(含有胶原/纤维蛋白原结构域)1(FCN1);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);IGF-II mRNA结合蛋白3(IMP-3);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);2’,5’-寡腺苷酸合成酶1(OAS1);2’-5’-寡腺苷酸合成酶3(OAS3);RAR相关孤儿受体A(RORA);相关的RAS病毒(r-ras)癌基因同源物2(RRAS2);α-synuclein(淀粉样蛋白前体的非A4组分(SNCA));人丝氨酸苏氨酸激酶17b(凋亡诱导型)(STK17B);转录因子EC(TFEC)。
本发明还涉及含有两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸选择性结合到至少两种生物标志物上,其中所述生物标志物选自表2中列出的以下基因BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);或α-synuclein(淀粉样蛋白前体的非A4组分(SNCA))。
本发明还涉及含有两种或更多种分离蛋白质的集合的组合物,所述蛋白质选择性结合到生物标志物的蛋白质产物上,其中所述生物标志物选自表2中列出的以下基因BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);或α-synuclein(淀粉样蛋白前体的非A4组分(SNCA))。
本发明还涉及含有选择性结合到生物标志物的RNA产物上的分离多核苷酸集合的组合物,其中所述生物标志物选自表2中列出的以下基因BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);或α-synuclein(淀粉样蛋白前体的非A4组分(SNCA))。
本发明还涉及含有两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸选择性结合到至少两种生物标志物的RNA产物上,其中所述RNA产物选自表3中列出的RNA转录本。
本发明还涉及含有两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸选择性结合到至少两种生物标志物的RNA产物上,其中所述RNA产物选自表4中列出的RNA转录本。
本发明还涉及含有两种或更多种分离蛋白质的集合的组合物,所述蛋白质选择性结合到至少两种生物标志物的蛋白质产物上,其中所述蛋白质产物选自表3中列出的RNA转录本。
本发明还涉及含有两种或更多种分离蛋白质的集合的组合物,所述蛋白质选择性结合到至少两种生物标志物的蛋白质产物上,其中所述蛋白质产物选自表4中列出的RNA转录本。
本发明还涉及本发明任一种组合物的实施方案,其中所提到的分离蛋白质是配体。本发明还涉及本发明任一种组合物的实施方案,其中所提到的分离蛋白质是抗体的配体。本发明还涉及本发明任一种组合物的实施方案,其中所提到的分离蛋白质是单克隆抗体的配体。
本发明还涉及本发明任一种组合物的实施方案,其中所提到的分离寡核苷酸是单链或双链RNA。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,其中步骤b)的比较中检测到所述一种或多种RNA转录本的每种的差异表达是步骤a)的个体中肝癌的指标。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表2的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,其中步骤b)的比较中检测到所述一种或多种RNA转录本的每种的相同水平是步骤a)的个体中癌症的指标。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,c)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,d)确定步骤a)的所述一种或多种RNA转录本的水平是否相对于步骤c)的所述转录本的水平而归类于步骤b)中所述转录本的水平,其中所述确定是步骤a)的所述个体患有肝癌的指标。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,c)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,d)确定步骤a)的所述一种或多种RNA转录本的水平是否相对于步骤b)的所述转录本的水平而归类于步骤c)中所述转录本的水平,其中所述确定是步骤a)的所述个体不患有肝癌的指标。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)用步骤a)的结果与分类符组合以确定对于肝癌的诊断。
本发明还涉及所提及血样由全血组成的刚公开方法。本发明还涉及所提及血样由一滴血组成的刚公开方法。本发明还涉及所提及血样由裂解血组成的刚公开方法。
本发明也涉及下述特征的刚公开方法,其中具有还包括从所述血样分离RNA的步骤的步骤。
本发明还涉及具有下列特征的刚公开方法,其中确定所述一种或多种RNA转录本的每种的水平的所提及步骤包括定量RT-PCR(QRT-PCR),其中所述一种或多种转录本来自以上所公开方法的步骤a)和/或步骤b)。本发明还涉及具有下列特征的刚公开方法,其中所提及的QRT-PCR使用与所述一种或多种转录本或其互补物杂交的引物,其中所述一种或多种转录本来自以上公开方法的步骤a)和/或步骤b)。本发明还涉及所提及引物长15-25个核苷酸的本文所公开方法。本发明还涉及具有下列特征的刚公开方法,其中所提到的确定所述一种或多种转录本的每种的水平的步骤包括使对应于所述一种或多种转录本的第一组分离核酸分子与包含第二组分离核酸分子的阵列杂交。本发明还涉及具有下列特征的刚公开方法,其中所提到的第一组分离核酸分子包括RNA、DNA、cDNA、PCR产物或EST。本发明还涉及具有下列特征的刚公开方法,其中所提到的阵列包含多种分离核酸分子,所述分离核酸分子包括RNA、DNA、cDNA、PCR产物或EST。本发明还涉及具有下列特征的刚公开方法,其中多提到的所述阵列上的第二组分离核酸分子包括对应于表1的一种或多种生物标志物的多核苷酸。本发明还涉及具有下列特征的刚公开方法,其中所提到的所述阵列上的第二字分离核酸分子包括对应于表2的一种或多种生物标志物的多核苷酸。
本发明还涉及具有下列特征的刚公开方法,其中所提到的所述阵列上的第二组分离核酸分子包括对应于表3的一种或多种RNA产物的多核苷酸。本发明还涉及具有下列特征的刚公开方法,其中所提到的所述阵列上的第二组分离核酸分子包括对应于表4的一种或多种RNA产物的多核苷酸。
本发明还涉及诊断或预测肝癌的试剂盒,其包含a)两种生物标志物特异性引发物,设计用于产生与选自表1的生物标志物互补的双链DNA;其中所述第一种引发物含有可以选择性杂交到与所述生物标志物互补的RNA、cDNA或EST上的序列,以产生延伸产物,所述第二种引发物能选择性与所述延伸产物杂交;
b)具有逆转录酶活性的酶,c)具有热稳定的DNA聚合酶活性的酶,和d)标记物质;其中所述引物用于检测测试对象中所述生物标志物的定量表达水平。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质由表1列出的一种或多种生物标志物编码,和b)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与不患有肝癌的一个或多个个体所得血中所述一种或多种蛋白质的每种的水平进行比较,其中步骤b)中的比较中检测到所述一种或多种蛋白质的每种的水平的差异是步骤a)个体中肝癌的指标。
本发明还涉及具有下列特征的刚公开方法,其中所提到的诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质由表1列出的一种或多种生物标志物编码,和b)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与患有肝癌的一个或多个个体所得血中所述一种或多种蛋白质的每种的水平进行比较,其中步骤b)中的比较中检测到所述一种或多种蛋白质的每种的相同水平是步骤a)个体中肝癌的指标。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质由表1列出的一种或多种生物标志物编码,和b)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与患有肝癌的一个或多个个体所得血中所述一种或多种蛋白质的每种的水平进行比较,c)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与不患有肝癌的一个或多个个体所得血中所述一种或多种蛋白质的每种的水平进行比较,d)确定步骤a)的所述一种或多种蛋白质的水平是否相对于步骤c)中所述蛋白质的水平而言归类于步骤b)中所述蛋白质的水平,其中所述确定是步骤a)中所述个体患有肝癌的指标。
本发明还涉及诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质对应于表1列出的一种或多种生物标志物,和b)使用步骤a)的结果与分类符组合以确定关于肝癌的诊断。
本发明还涉及具有下列特征的刚公开方法,其中所提到的确定所述一种或多种蛋白质的每种的水平的步骤包括使用一种或多种抗体,其中所述一种或多种抗体的每种对表1列出的生物标志物的蛋白质产物特异。
本发明还涉及具有下列特征的刚公开方法,其中所提到的一种或多种抗体选自单克隆抗体、fv.scfv、dab、fd、fab和fab’2。
本发明还涉及筛选调节表1列出的生物标志物的一种或多种产物的水平的试剂的方法,包括使表达所述产物的细胞与所述试剂接触,其中相对于未接触所述试剂的相同细胞检测到所述产物的水平改变,指示所述化合物调节所述一种或多种产物的水平。
本发明还涉及所述肝癌生物标志物基因的所提及产物是蛋白质的刚公开方法。
本发明还涉及所述肝癌生物标志物的所提及产物是RNA转录本的刚公开方法。
本发明还涉及筛选与肝癌特异性相关的一种或多种SNP的方法,其中所述方法包括以下步骤(a)分析个体群体内每个个体的DNA,以确定在对应于图3中所鉴定SNP位置的位置上所述群体的每个个体的DNA的序列,其中所述群体包含两个亚组,第一亚组诊断患有肝癌,所述第二亚组诊断为不患有肝癌。
(b)鉴定在所述第一亚组和所述第二亚组之间变化的步骤(a)中分析的DNA序列,其中所鉴定的那些DNA序列被确认是与肝癌相关的SNP。
(c)在表1列出的生物标志物的一种或多种产物的调节水平之间进行区分,包括使表达所述产物的细胞与所述试剂接触,其中相对于未接触所述试剂的相同细胞检测到所述产物水平的改变,指示所述化合物调节所述一种或多种产物的水平。
本发明还涉及产生用于诊断肝癌的分类符的方法,所述方法包括(a)测定训练群体中表1鉴定的生物标志物的产物的表达水平,其中所述训练群体包括两个亚组,第一亚组诊断为患有肝癌,而所述第二亚组诊断为不患有肝癌。
(b)将一种或多种数学模型应用于步骤(a)的表达水平,以产生区分所述第一亚组和所述第二亚组的一种或多种分类符。
本发明还涉及权利要求47的方法,进一步包括评价步骤(b)的一种或多种所述分类符正确表征训练群体中每个个体的分类能力。
本发明还涉及具有下列特征的刚公开方法,它进一步包括评价步骤(b)的一种或多种所述分类符正确表征不是训练群体的群体的一个或多个个体的分类能力。
5.3用于本发明的样品除非本文中另外指明,从任何对象获得的血样可以根据本发明方法使用。可以从中获得这种样品并根据本发明方法使用这些样品的对象的实例包括但不限于无症状的对象、呈现或表现肝癌的1、2、3、4个或更多个症状的对象、临床诊断为患有肝癌的对象、易患肝癌的对象(如患有肝癌家族史的对象、患有肝癌遗传易感性的对象、怀疑患有肝癌的对象、正接受肝癌治疗的对象、患有肝癌和至少一种其它疾病的对象(如具有2、3、4、5种或更多疾病的对象)、没有正接受肝癌治疗的对象、医学从业者(如医生)确定为健康或无肝癌的对象(即正常)、已治愈肝癌的对象、正控制其肝癌的对象和未诊断为肝癌的对象。
在进一步的实施方案中,可从中获得样品的对象是测试个体,其中不知道该人是否患有肝癌,和/或如果有的话,不知道测试个体可能患有哪个阶段的肝癌。
5.3.1血在本发明的一个方面中,根据本领域公知的方法从对象中获取血样。血样可以从对象获得,例如患有肝癌或不患有肝癌的对象。在一些实施方案中,从对象皮肤的简单针刺收集血滴。可以用本领域技术人员已知的技术,尤其是已知的采血方法,从对象的任何身体部位(如指、手、腕、臂、腿、足、踝、胃和颈)取血。
采血量将根据采血部位、本发明方法需要的量和对象的舒适性而变化。然而,本发明一个实施方案的优点是实施本发明方法所需要的血量可以很小,使得不需要更侵入性方法获得样品。例如,在一些实施方案中,全部需要量是一滴血。这滴血例如可以从简单的针刺获得。在一些实施方案中,收集任意量的血足以检测表1所列的一、二、三、四、五、十、12、15、20个或更多个基因的表达。如此,在一些实施方案中,采血量是1μl或更少、0.5μl或更少、0.1μl或更少或0.01μl或更少。然而本发明不限于这些实施方案。在一些实施方案中可以获得更多血,并且在一些实施方案中,更多血可用于实施本发明的方法。如此,在多种具体的实施方案中,从对象收集0.001ml、0.005ml、0.01ml、0.05ml、0.1ml、0.15ml、0.2ml、0.25ml、0.5ml、0.75ml、1ml、1.5ml、2ml、3ml、4ml、5ml、10ml、15ml或更多血。在另一个实施方案中,从对象收集0.001ml-15ml、0.01ml-10ml、0.1ml-10ml、0.1ml-5ml、1ml-5ml血。
在本发明的一些实施方案中,血保存于K3/EDTA管中。在另一个实施方案中,可以使用含稳定剂的血保存管,如公开于美国专利No.6,617,170(经引用并入本文)。在另一个实施方案中,可使用一个Qiagen/BD公司PreAnalytiX提供的PAXgeneTM血RNA系统收集血。在另一个实施方案中,可以使用由Applied Biosystems提供的TempusTM血RNA收集管。TempusTM收集管提供含RNA稳定剂的密闭真空塑料管用于全血收集。
收集的血优选立即使用,或在1小时、2小时、3小时、4小时、5小时或6小时以内使用,或任选地根据本发明方法在使用前保存于如4℃或-20℃的温度。在一些实施方案中,一部分血样根据本发明方法在第一时间使用,而一个或多个剩余部分的血样保存一段时间供以后使用。对于更长期的保存,可以使用本领域公知的保存方法,如保存于冷冻温度(如低于-60℃)。在一些实施方案中,除了保存血以外或者代替血保存,根据本领域已知方法保存分离核酸或蛋白质一段时间供以后使用。
在一个方面,根据本领域公知的采血方法从个体取全血。全血包括可直接使用的血,并包括已经除去血清或血浆并且已经根据本领域公知的方法(例如优选在300-800×g温和离心5-10分钟)从剩余血样中分离RNA或mRNA的血。在一个具体的实施方案中,从对象获取的全血(即未分级血)与裂解缓冲液(如裂解缓冲液(1L)0.6g EDTA;1.0g KHCO2,8.2g NH4Cl,用NaOH调节到pH7.4)混合,离心样品并保留细胞沉淀,根据本领域公知的方法提取RNA或mRNA(“裂解血”)(例如见Sambrook et al.)。优选使用未分级全血,因为它避免了耗费成本和时间的分离血内细胞类型的步骤(Kimoto,1998,Mol.Gen.Genet 258233-239;Chelly J et al.,1989,Proc.Nat.Acad.Sci.USA 862617-2621;Chelly J et al.,1988,Nature 333858-860)。
在本发明的一些实施方案中,从对象收集的全血进行分级(即分离成成分)。在本发明的具体实施方案中,用本领域已知技术从收集自对象的全血分离血细胞。例如,可以对从对象收集的血进行Ficoll-Hypaque(Pharmacia)梯度离心。这种离心将红细胞(血红细胞)与各种类型的有核细胞和血浆分离开。具体而言,Ficoll-Hypaque梯度离心可用于分离外周血白细胞(PBL),它们可用于根据本发明的方法。
通过实例而非限制,可以如下获得巨噬细胞。通过注射器取血接着经Ficoll-Hypaque梯度离心,从对象的外周血分离单核细胞。用对象自己的血清或用AB+人血清预包被组织培养皿并在37℃孵育1小时。吸弃非贴壁细胞。向培养皿中存留的贴壁细胞加入含1mM EDTA的冷(4℃)磷酸盐缓冲液,将培养皿在室温保持15分钟。收获细胞,用RPMI缓冲液洗涤,并重悬于RPMI缓冲液中。通过在37℃与巨噬细胞集落刺激因子(M-CSF)一起孵育可以获得更多数量的巨噬细胞。可以通过偶联亲合化合物到这种分子上标记抗巨噬细胞特异性表面标志物如Mac-1的抗体,从而促进检测和分离巨噬细胞。可以使用的亲合化合物包括但不限于生物素、光生物素、荧光素异硫氰酸酯(FITC)或藻红蛋白(PE)或本领域已知的其它化合物。然后用本领域已知技术,例如但不限于各种细胞分选方法、亲合层析和淘选(panning),将保留标记抗体的细胞与不结合这种抗体的细胞分离开。
可以用荧光激活细胞分选仪(FACS)分选血细胞。荧光激活细胞分选(FACS)是已知的分离颗粒物包括细胞的方法,它基于颗粒物的荧光特性。例如见Kamarch,1987,Methods Enzymol 151150-165。激光激发单个颗粒上的荧光基团导致小电荷,这允许从混合物中电磁分离阳性和阴性颗粒。用荧光物质如FITC或藻红蛋白标记用于检测特定血细胞的细胞表面上存在的血细胞抗原决定簇的抗体或配体。细胞与荧光标记的抗体或配体充分孵育一段时间,使得标记抗体或配体与细胞结合。使细胞通过细胞分选仪,使得感兴趣的细胞与其它细胞分离开。FACS分选的颗粒可直接存放于微滴定板的单个孔中以促进分离。
在本发明的一些实施方案中也可以使用磁珠分离血细胞。例如,可以用磁性激活细胞分选(MACS)技术分选血细胞,这是一种基于颗粒结合磁珠(0.5-100m直径)的能力分离颗粒的方法。可以对磁性微球进行多种有用的修饰,包括共价添加特异性识别细胞-固相表面分子或半抗原的抗体。然后施加磁场,以物理操作选择的磁珠。在一个具体实施方案中,抗血细胞表面标志物的抗体与磁珠偶联。然后将磁珠与血细胞培养物混合以使之结合。再将细胞通过磁场以分离具有感兴趣的血细胞表面标志物的细胞。然后可以分离这些细胞。
在一些实施方案中,培养皿表面可以用抗体包被,并用称为淘选的方法分离血细胞。不同的皿可以用特异性针对特定血细胞的抗体包被。首先将细胞加入包被感兴趣的血细胞特异性抗体的培养皿中。彻底漂洗后,保持结合于皿上的细胞将是表达感兴趣的血细胞标志物的细胞。细胞表面抗原决定簇或标志物的实例包括但不限于T淋巴细胞和自然杀伤细胞的CD2、T淋巴细胞的CD3、白细胞的CD11a、T淋巴细胞的CD28、B淋巴细胞的CD19、B淋巴细胞的CD20、B淋巴细胞的CD21、B淋巴细胞的CD22、B淋巴细胞的CD23、白细胞的CD29、单核细胞的CD14、血小板的CD41、血小板的CD61、粒细胞的CD66、粒细胞的CD67和单核细胞与巨噬细胞的CD68。
全血可以分离成诸如白细胞、血小板、红细胞等的细胞类型,这些细胞类型可用于根据本发明的方法。白细胞可以用标准技术进一步分成粒细胞和无粒细胞,这些细胞可用于根据本发明的方法。粒细胞可以用标准技术分成诸如中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞的细胞类型,这些细胞可用于根据本发明的方法。无粒细胞可以用标准技术分成淋巴细胞(如T淋巴细胞和B淋巴细胞)和单核细胞,这些细胞可用于根据本发明的方法。用标准技术可以将T淋巴细胞和B淋巴细胞分开,并将辅助性T细胞和细胞毒性T细胞分开,这些细胞可用于根据本发明的方法。可以在用于本发明方法之前用标准技术冷冻分离的血细胞(如白细胞)。
根据本发明可用的血样的量应足以检测根据本发明的一种或多种核酸或氨基酸序列。在一个具体实施方案中,根据本发明可用的血样的量为1μl-100ml,优选10μl-50ml,更优选10μl-25ml,最优选10μl-1ml。
在本发明的一个方面中,从个体分离RNA以测定本发明的生物标志物的RNA产物。从诊断患有肝癌的个体、不患有肝癌的个体或测试个体的血样中分离RNA。
优选用以下方案从血中分离RNA。按3份裂解缓冲液比1份血的比例向血样中加入裂解缓冲液(裂解缓冲液(1L)0.6g EDTA;1.0g KHCO2,8.2g NH4Cl,用NaOH调节到pH7.4)。将样品混合并在冰上放置5-10分钟直至透明。裂解后样品在4℃于1000rpm离心10分钟,并吸出上清液。将沉淀重悬于5mL裂解缓冲液,并再次在4℃于1000rpm离心10分钟。按每10ml起始血样约6ml TRIzol(GIBCO/BRL)的比例用TRIzol匀浆沉淀细胞并充分振荡。样品在室温放置5分钟。用1.2ml氯仿/1ml TRIzol提取RNA。样品在4℃于12,000xg离心5分钟并收集上层。按0.5ml/1ml TRIzol的比例向上层中加入异丙醇。样品在-20℃放置过夜或在-20℃放置1小时。根据已知方法沉淀RNA,空气干燥RNA沉淀,并将沉淀重悬于DEPC处理的ddH2O中。也可以将RNA样品保存于75%乙醇中,这样的样品在室温下稳定以供运输。
可以通过260/280nm吸光度和琼脂糖凝胶电泳随后在紫外光下检查来评价RNA的纯度和完整性。优选用更灵敏的技术如Agilent 2100 Bioanalyzer 6000 RNA NanoChip评价RNA完整性。
5.5本发明的生物标志物在一个方面中,本发明提供生物标志物和生物标志物组合,其中所述生物标志物的产物表达水平的测定是存在肝癌的指标。
表1提供本发明生物标志物的基因名称和相关locus link ID的列表,其中生物标志物的表达水平的量,或者单独或者组合,可用于诊断个体是否患有肝癌。
表1
表2表示本发明生物标志物的一个选集,并根据其名称、Hugo基因名称和locus linkID识别这些基因。
表2
本领域技术人员将会理解,locus link ID可用于确定对应本发明生物标志物的所有RNA转录本和所有蛋白质的序列。
在本发明的一个实施方案中,表3提供对应本发明生物标志物的RNA产物的序列的选集,并且所述序列可使用本领域技术人员已知的技术用于测定本发明生物标志物的表达水平。在本发明的一个实施方案中,表3还提供对应本发明生物标志物的蛋白质的序列,所述序列可用于测定本发明生物标志物的表达水平。
表3
表4表示在一个实施方案中对应于表2列出的本发明生物标志物的mRNA转录本和蛋白质的登记号。
表4
本发明因此涉及本领域技术人员已知的那些方法用于为上列每个目的而测定这些生物标志物和生物标志物组合的表达的用途。
5.6生物标志物的组合在一个实施方案中,本发明的生物标志物的组合包括表1列出的生物标志物中2、3、4、5、6、7、8、10、12个或全部的任意组合。例如,n个基因的子集m的可能组合的数目描述于Feller,Intro to Probability Theory,Third Edition,volume 1,1968,ed.J.Wiley,使用以下通式m!/(n)!(m-n)!
在一个实施方案中,其中n是2,m是10,有10!=10×9×8×7×6×5×4×3×2×12!(10-2)!(2×1)(8×7×6×5×4×3×2×1)=3,628,800/80640=45个独特的两基因组合。测定这些两基因组合的每种的基因表达可以独立地用于确定患者是否有肝癌。在m是10、n是3的另一个实施方案中,有10!/3!(10-3)!个独特的三基因组合。这些独特的三基因组合的每一个可以独立地用作确定患者是否患有肝癌的模型。
在本发明的另一个实施方案中,本发明生物标志物的组合包括选自表1的列表的生物标志物的任意组合。在本发明的另一个实施方案中,生物标志物组合包括选自表2列表的生物标志物的任意组合。在本发明的另一个实施方案中,生物标志物组合包括选自图1列表的生物标志物的任意组合。
5.7用数学模型鉴定和评价生物标志物组合在本发明的一个方面中,我们已经发现鉴定和评价组合区分患有肝癌的患者和不患有肝癌的患者的能力的手段。
为了鉴定生物标志物的组合,使用数学模型生成“分类符”用于区分肝癌和非肝癌。输入数学模型的数据可以是代表待评价生物标志物的产物表达水平的任何数据。用本发明的数学模型生成的分类符有助于鉴定特别有用的生物标志物组合以及应用于组合内每种生物标志物的权重(weighting)。这些分类符基于参考群体生成,并且设计用来和开发该分类符的数学模型一起使用以区分两种表型组。
根据本发明可用的数学模型包括使用有监督和无监督学习的模型。在本发明的一个优选实施方案中,所选数学模型使用有监督学习与“训练群体”一起来评价本发明的每种可能的生物标志物组合。在本发明的一个实施方案中,所用数学模型选自以下回归模型、逻辑回归模型、神经网络、聚类模型、主成分分析、最近相邻分类符分析、线性判别分析、二次判别分析、支持向量机、决策树、遗传算法、使用bagging的分类符优化、使用boosting的分类符优化、使用随机子空间方法的分类符优化、投影追踪(projection pursuit)和加权投票。在一个实施方案中,使用逻辑回归模型。在另一个实施方案中,使用神经网络模型。在又一实施方案中,可以组合使用数学模型。
数学模型的输出是分类符;并且可以通过确定分类符正确判断每个个体为有或无肝癌的能力进行评价。在一个优选实施方案中,用于获得分类符的训练群体中个体与用于测试分类符的训练群体中个体不同。本领域技术人员将理解,这允许评价每个分类符正确诊断个体患有或不患有肝癌的能力。
所得分类符可用于诊断未知或测试个体患有或不患有肝癌。在本发明的一个实施方案中,诊断肝癌的答案可以是非确定性的答案。
在本发明的一个优选实施方案中,用以下一种或多种方法评价分类符交叉验证、留一交叉验证(leave one out cross validation)、n-倍交叉验证、用标准统计学方法和公开的折叠刀分析。在本发明的一个优选实施方案中,评价每个分类符正确表征不用于产生分类符的训练群体中个体的能力。
在一个实施方案中,用于评价分类符正确表征训练群体中每个个体的能力的方法是评价分类符的灵敏度(TPF、真阳性分数)和1-特异性(TNF,真阴性分数)的方法。在一个优选实施方案中,用于测试分类符的方法是接收器工作特性(receiveroperating characteristic)(“ROC”),它提供评价所生成分类符的诊断结果灵敏度和特异性的几个参数。在一个特别优选的实施方案中,ROC面积(曲线下的面积)用于评价方程。在一个优选实施方案中,ROC面积大于0.5、0.6、0.7、0.8、0.9,最优选1.0。完美的ROC面积评分1.0指示分类符具有100%灵敏度和100%特异性。
本领域技术人员将会理解,数学模型鉴定的分类符的实用性依赖于用于产生输入模型的数据的群体中个体的表型。
5.7.1输入数学模型的群体用于输入的群体应该如此选择,使得导致统计学显著的结果性生物标志物组合。在一些实施方案中,参考或训练群体包括10-30个对象。在另一个实施方案中,训练群体含有30-50个对象。在另外的实施方案中,参考群体包括2个或更多个群体,其中每个群体含有50-100、100-500、500-1000或超过1000个对象。训练群体优选包括大致相等数目的患有肝癌和不患有肝癌的个体。为了表征个体群体为患有肝癌或不患有肝癌,可以使用任何传统的肝癌诊断方法。在一个优选实施方案中,除了患有或不患有肝癌的表形特征以外,用于训练组的两个群体的表形特征尽可能相似。在另一个优选实施方案中,两个群体是年龄和性别匹配的。
5.7.2用于输入数学模型以鉴定诊断分类符的数据输入数学模型的数据是代表本发明生物标志物的产物的基因表达水平的数据。因此所述数据是本发明生物标志物的产物包括mRNA和/或蛋白质表达的测定值。
在本发明的一个实施方案中,被测定的本发明生物标志物的RNA产物是RNA产物的群体,其中包括mRNA和所有的mRNA剪接变体。在本发明的另一个实施方案中,测定的产物是血中表达的mRNA。在本发明的另一个实施方案中,测定的产物是血中表达mRNA的剪接变体。在本发明的另一个实施方案中,测定的产物是表2列出的RNA产物。
本发明生物标志物的蛋白质产物也包括在本发明范围内。为了实施本发明,本发明生物标志物的蛋白质产物的测定可用于诊断目的。更具体地,生物标志物的蛋白质产物中那些在肝癌期间差异表达的群体的测定可用于诊断目的,并包括在本发明内。
在本发明的一个实施方案中,蛋白质产物是从表1列出的生物标志物翻译的。在另一个实施方案中,蛋白质产物是血中表达的。在本发明的另一个实施方案中,蛋白质产物对应血中表达的RNA剪接变体。在另一个实施方案中,蛋白质产物是表3列出的那些。
在另一个实施方案中,使用反映生物标志物的蛋白质产物和RNA产物组合的表达水平的数据。本领域技术人员理解,可以利用输入数据的其它组合以产生可根据本发明使用的分类符。
5.7.3数学模型回归模型在一些实施方案中,本发明鉴定的一些或全部生物标志物的表达数据用于回归模型,优选逻辑回归模型中,以鉴定用于诊断肝癌的分类符。回归模型用于测试表1鉴定的两种或更多种生物标志物的多种组合,以产生分类符。对于回归模型,产生的分类符是方程的形式,其中代表方程中每种生物标志物表达的数据乘以回归模型产生的权重系数。产生的分类符可以用于分析测试个体的表达数据并提供诊断。一般来说,感兴趣的多重回归方程可以写作Y=α+β1X1+β2X2+…+βkXk+ε其中从属变量Y表示与第一亚组相关的生物特征(如缺少或存在肝癌)的存在(当Y为正)或缺少(当Y为负)。该模型显示从属变量Y依赖于k个解释变量(对于参考群体中第一和第二亚组的对象的k个选择基因(如生物标志物)测定的特征值),加上涉及多种不明确的忽略因素的误差项。在上述模型中,参数β1表示保持其它解释变量为常数的条件下,第一解释变量X1对从属变量Y的影响(如权重因子)。相似地,参数β1表示保持其它解释变量为常数的条件下,解释变量X2对Y的影响。
逻辑回归模型是线性回归的非线性变换。逻辑回归模型被称为“分对数”(logit)模型并可以表达为ln[p/(1-p)]=α+β1X1+β2X2+…+βkXk+ε或[p/(1-p)]=expαexpβ1X1expβ2X2×···×expβkXkexpϵ]]>其中,ln是自然对数logexp,其中exp=2.71828...,p是事件Y发生的概率,p(Y=1),p/(1-p)是“让步比”(odds ratio),ln[p/(1-p)]是让步比的对数,或“分对数”,并且模型的所有其它成分与上述的一般回归方程相同。本领域技术人员将会理解,α和ε项可以合并(fold)为相同常数。事实上,在优选的实施方案中,单一项用于代表α和ε。“逻辑”分布是S形分布函数。分对数分布限制估计概率(p)在0和1之间。
在本发明的一些实施方案中,逻辑回归模型用最大可能性估计(MLE)拟合。换句话说,系数(如α,β1,β2,...)由最大可能性确定。可能性是条件概率(如P(Y|X),给定X的Y的概率)。可能性函数(L)测定相同数据组中发生的具体组的从属变量值(Y1,Y2,...,Yn)所观察到的概率。它被写作从属变量的积的概率L=Prob(Y1*Y2***Yn)可能性函数越高,在样品中观察到Ys的概率越高。MLE涉及发现这样的系数(α,β1,β2,...),所述系数使可能性函数(LL<0)的对数尽可能大或者可能性函数的对数的-2倍(-2LL)尽可能小。在MLE中,进行参数α,β1,β2,...的一些初始估计。然后给定这些参数估计下计算数据的可能性。改善参数估计,重新计算数据的可能性。重复这个过程,直至参数估计不再有大改变(例如概率的改变小于0.01或0.001)。逻辑回归和拟合逻辑回归模型的实例可在Hastie,The Elements of Statistical Learning,Springer,New York,2001,pp.95-100中查到,其全部内容并入本文。
神经网络在另一个实施方案中,测定的本发明每种生物标志物的表达可以用于训练神经网络。神经网络是两阶段回归或分类模型。神经网络具有分层结构,其中包括输入单元层(和偏置),它经权重层与输出单元层连接。对于回归,输出单元层通常包括仅一个输出单元。然而,神经网络可以无缝方式处理多重定量应答。如此,神经网络可应用于鉴定区分超过两个群体的生物标志物。在一个具体实施例中,可以用表1的生物标志物的表达数据训练神经网络,以和不患有肝癌相比较鉴定肝癌特异性的生物标志物的组合。结果,训练后的神经网络可以用于直接鉴定用作肝癌诊断性生物标志物的生物标志物组合。在一些实施方案中,使用含有十个神经元的单隐藏层(十个隐藏单元)的后向传播神经网络(例如见Abdi,1994,“A neural network primer”,J.BiolSystem.2,247-283),它们可以发现于EasyNN-Plus version 4.0g软件包(NeuralPlanner Software Inc.)。
神经网络描述于Duda et al.,2001,Pattern Classification,Second Edition,JohnWiley & Sons,New York;和Hastie et al.,2001,The Elements of Statistical Learning,Springer-Verlag,New York,其全部内容引入本文。
其它数学模型上述模式分类和统计技术仅仅是可用于构建用于诊断肝癌的分类符的模型类型例子,例如描述于下文211-256页的聚类分析Duda and Hart,Pattern Classificationand Scene Analysis,1973,John Wiley & Sons,Inc.,New York,其全部内容经引用并入本文;主成分分析(见Jolliffe,1986,Principal Component Analysis,Springer,NewYork,经引用并入本文);最近相邻分类符分析(例如见Duda,Pattern Classification,Second Edition,2001,John Wiley & Sons,Inc;和Hastie,2001,The Elements ofStatistical Learning,Springer,New York);线性判别分析(例如见Duda,PatternClassification,Second Edition,2001,John Wiley & Sons,Inc;和Hastie,2001,TheElements of Statistical Learning,Springer,New York;Venables & Ripley,1997,Modern Applied Statistics with s-plus,Springer,New York);支持向量机(例如见Cristianini and Shawe-Taylor,2000,An Introduction to Support Vector Machines,Cambridge University Press,Cambridge,Boser et al.,1992,″A training algorithm foroptimal margin classifiers,in Proceedings of the 5thAnnual ACM Workshop onComputational Learning Theory,ACM Press,Pittsburgh,PA,pp.142-152;Vapnik,1998,Statistical Learning Theory,Wiley,New York,经引用并入本文)。
5.8本发明的生物标志物用于诊断的用途本领域技术人员可以理解,鉴定一种或多种生物标志物可以用于通过测定待诊断个体(“测试个体”)中生物标志物(基因)的产物表达而诊断肝癌。
在一个实施方案中,来自测试个体的结果与对照进行比较,其中对照可以是来自一个或多个患有肝癌的个体或者一个或多个不患有肝癌的个体。在另一个实施方案中,来自测试个体的结果既与患有肝癌的对照群体、也与不患有肝癌的对照群体进行比较。
在另一个实施方案中,可以将测试个体的生物标志物的产物表达的表达数据输入本发明的分类符中,从而确定所述测试个体是患有肝癌还是不患有肝癌。在一个优选实施方案中,将使用用于产生生物标志物的相同分类符以诊断个体,但这不是必需的。代表本发明生物标志物的RNA或蛋白质产物的数据被输入本发明的分类符中以确定诊断。可以用测定本发明生物标志物的RNA和蛋白质产物的表达水平的任何已知技术生成数据。
使用分类符导致确定测试个体是患有肝癌还是不患有肝癌。例如,使用逻辑回归作为模型,Y用作肝癌的预测值,其中当Y>0时人被诊断为患有肝癌,而当Y<0时人被诊断为不患有肝癌。在另一个实施方案中,还可以包括其中诊断不能确定的第三类预测。例如,可以确定用于测定生物标志物的基因表达的方法中固有的标准偏差(δ)。如果Y<δ但>0,或Y>-δ但<0,那么诊断被认为不能确定。
5.9用于测定本发明生物标志物的产物的多核苷酸使用能特异性或选择性结合到本发明生物标志物上的多核苷酸来测定本发明生物标志物的RNA产物的表达水平。例如根据本发明,与本发明生物标志物的一种或多种RNA产物特异性和/或选择性杂交的寡核苷酸、cDNA、DNA、RNA、PCR产物、合成DNA、合成RNA或修饰核苷酸的天然存在的其它组合是有用的。
在一个优选实施方案中,使用与本发明生物标志物的一种或多种RNA产物特异性且选择性杂交的寡核苷酸、cDNA、DNA、RNA、PCR产物、合成DNA、合成RNA或修饰核苷酸寡核苷酸的天然存在的其它组合。
5.10测定本发明生物标志物的RNA产物的技术5.10.1阵列杂交在本发明的一个实施方案中,用于测定本发明RNA产物的多核苷酸可以使用作与支持物稳定结合的核酸成员,以组成根据本发明的一个方面的阵列。核酸成员的长度范围可以是8-1000个核苷酸长,并可以选择特异性针对本发明生物标志物的RNA产物。在一个实施方案中,这些成员对本发明生物标志物的RNA产物是选择性的。所述核酸成员可以是单链或双链,和/或可以是寡核苷酸或从cDNA扩增的PCR片段。寡核苷酸优选是约20-30个核苷酸长。EST优选是100-600个核苷酸长。本领域技术人员将理解,可以使用本发明生物标志物的部分表达区作为阵列上的探针。更具体地可以使用与本发明基因互补的多核苷酸和/或来源于本发明基因的cDNA或EST。对于基于寡核苷酸的阵列,选择可用作探针的对应感兴趣基因的寡核苷酸在本领域公知。更具体地,选择允许杂交到靶核酸上的区域是重要的。诸如寡核苷酸的Tm、GC百分含量、二级结构程度和核酸长度的因素是重要的因素。例如见美国专利No.6,551,784。
构建核酸阵列在所述方法中,与实质性固相支持物的表面稳定结合的核酸成员的阵列与含有靶核酸的样品在足以产生互补性核酸成员/靶复合物的杂交模式的杂交条件下接触。在所述复合物中,阵列的独特位置上的一个或多个互补性核酸成员特异性与靶核酸杂交。通过参考核酸成员在阵列上的位置可以确定杂交的所述靶核酸的身份。
可以用公认的技术如聚合酶链式反应(PCR)和逆转录(RT)产生核酸成员。这些方法与本领域当前已知的方法相似(例如见PCR Strategies,Michael A.Innis(Editor),et al.(1995)和PCRIntroduction to Biotechniques Series,C.R.Newton,A.Graham(1997))。用本领域公知技术(如柱纯化或醇沉淀)纯化扩增的核酸。当核酸已经被分离使得基本无引物和合成期望核酸期间生成的不完全产物时,核酸被认为是纯的。纯化的核酸优选也是基本无污染,这些污染可能阻碍或掩盖分子的特异性结合活性。
根据本发明的一个方面,阵列包含以超过20种不同核酸/cm2的密度附着到固相支持物一个表面上的多个核酸,其中每个核酸附着在固相支持物表面上不相同的预选区域内(如微阵列)。阵列上每个结合的样品包含已知身份、通常已知序列的核酸组成,如下更详细描述。任何可以想到的基质可以用于本发明中。
在一个实施方案中,附着到固相支持物表面的核酸是DNA。在一个优选实施方案中,附着到固相支持物表面的核酸是cDNA或RNA。在另一个优选实施方案中,附着到固相支持物表面的核酸是经聚合酶链式反应(PCR)合成的cDNA。根据本发明,阵列中核酸成员优选是至少10、25或50个核苷酸长。在一个实施方案中,核酸成员至少150个核苷酸长。核酸成员优选长度小于1000个核苷酸。更优选核酸成员长度小于500个核苷酸。
在本发明阵列中,核酸成分与支持物表面稳定结合,其中支持物可以是柔性或刚性固体支持物。“稳定结合”是指每个核酸成员在杂交和洗涤条件下维持在相对于固相支持物的独特位置上。这样,样品共价或非共价地与支持物表面稳定结合。非共价结合的实例包括非特异性吸附、基于静电相互作用(如离子对相互作用)的结合、疏水相互作用、氢键相互作用、通过共价附着到固相表面的特异性结合对成员而特异性结合等。共价结合的实例包括核酸与刚性支持物表面上的官能团(如-OH)形成的共价键,其中官能团可以是天然存在的或作为引入连接基团的成员而存在,如下更详细描述。
每种组成的核酸量将足以提供在使用阵列进行测试期间充分杂交和检测靶核酸序列。一般来说,稳定结合到阵列的固相支持物上的每种核酸成员的量是至少约0.001ng,优选至少约0.02ng,更优选至少约0.05ng,在此所述量可以高达1000ng或更高,但通常不超过约20ng。当核酸成员“点斑”到支持物上整体圆形的斑点中时,“斑点”的直径一般约10-5,000μm,通常约20-2,000μm,更通常约100-200μm。
对照核酸成员可以存在于阵列上,包括包含对应基因组DNA、管家基因、载体序列、植物核酸序列、阴性和阳性对照基因等的寡核苷酸或核酸的核酸成员。对照核酸成员是校准或对照基因,其功能不是显示感兴趣的特定“关键”基因是否表达,而是提供其它有用的信息,如表达的背景或基础水平。
其它对照核酸点斑到阵列上并用作靶表达对照核酸和错配对照核酸,以监测与样品中探针所针对靶以外的其它核酸的非特异性结合或交叉杂交。因此错配探针指示杂交是否是特异性的。例如,如果有靶存在,完全匹配的探针应该相应地比错配探针更亮。此外,如果存在全部对照错配,错配探针用于检测突变。
微阵列基质根据本发明的阵列包含柔性或刚性基质。柔性基质能被弯曲、折叠或类似操作而不被破坏。本发明相关的柔性固体支持物的固体材料的实例包括膜,如尼龙、柔性塑料膜等。“刚性”是指支持物是固体并且不容易弯曲,即支持物不是柔性的。如此,所述阵列的刚性基质足以在使用阵列的测试条件下、尤其是在高通量处理条件下向其上结合的核酸提供物理支持和结构。
基质可以是生物的、非生物的、有机的、无机的或这些的任意组合,作为颗粒、链(strand)、沉淀、凝胶、薄片(sheet)、管、球、珠、容器、毛细管、垫、切片(slice)、膜、板、载片(slide)、块等而存在。基质可以具有任何方便的形状,如盘、方形、球形、圆形等。基质优选是平的或平面状,但可以采用多种替代性表面构型。基质可以是聚合的LB膜、功能化玻璃、Si、Ge、GaAs、GaP、SiO2、SIN4、改性硅或各种凝胶或聚合物中的任一种,如聚四氟乙烯、聚偏二氟乙烯((poly)vinylidenedifluoride)、聚苯乙烯、聚碳酸酯或其组合。通过阅读本公开内容,其它基质材料对于本领域技术人员将是显而易见的。
在一个优选实施方案中,基质是平玻璃或单晶硅。根据一些实施方案,基质表面用公知技术蚀刻以提供期望的表面特性。例如,通过形成沟、v-槽、台面结构或其它,合成区可以更紧密地放置于入射光的焦点内,提供使收集自荧光源的光最大化的反射“镜”结构等。
尽管不总是如此,固相支持物表面通常由与基质相同的材料组成。作为替代,表面可以由任意的各种材料组成,例如聚合物、塑料、树脂、多糖、硅石或硅石基材料、碳、金属、无机玻璃、膜或任意上述基质材料。在一些实施方案中,表面可以提供被罩起来的(caged)结合成员的使用,它们牢固附着于基质表面。表面优选含有活性基团,它们是羧基、氨基、羟基等。最优选地,表面是光学透明的,并且具有表面Si--OH官能团,例如这可以在硅石表面发现。
基质表面优选提供接头分子层,尽管可以理解接头分子不是本发明的必需的元件。接头分子优选足够长以允许本发明的基质上的核酸与其它核酸分子杂交并与暴露于基质的分子自由相互作用。
基质经常是硅或玻璃表面、聚四氟乙烯、聚偏二氟乙烯、聚苯乙烯、聚碳酸酯、带电膜、如尼龙66或硝酸纤维素,或其组合。在一个优选实施方案中,固相支持物是玻璃。基质的至少一个表面优选是基本平的。固相支持物优选含有活性基团,包括但不限于羧基、氨基、羟基、硫羟基等。在一个实施方案中,表面可以是光学透明的。在一个优选实施方案中,基质是聚赖氨酸包被的载片或γ-氨基丙基硅烷包被的Corning Microarray Technology-GAPS或CMT-GAP2包被的载片。
核酸成员可以附着的任何支持物可以用于本发明。合适固体支持物材料的实例包括但不限于硅酸盐如玻璃和硅胶、纤维素和硝酸纤维素纸、尼龙、聚苯乙烯、聚甲基丙烯酸酯、乳胶、橡胶和氟碳树脂如TEFLONTM。
支持材料可以使用各种形状,包括但不限于载片和珠。载片提供几种功能优点并因此是优选的固相支持物形式。由于其平的表面,使用载玻片使探针和杂交试剂被最小化。载片还使靶向应用试剂成为可能,容易保持在恒定温度,容易洗涤并有助于直接观察固定在固相支持物上的RNA和/或DNA。使用载片也有利于去除固定在固相支持物上的RNA和/或DNA。
选作支持物的具体材料对本发明不是关键的,只要它提供所述功能。正常情况下,制造或使用本发明的人将基于成本经济性和可用性、最终产品的预期应用要求和整体制造工艺的需要而选择最佳的商品材料。
点斑方法在一个方面中,本发明提供阵列,其中组成阵列的每个核酸成员点斑到固相支持物上。
优选的是,点斑如下进行。本发明生物标志物的PCR产物(~40μl),在用于扩增的相同96-孔管中,用4μl(1/10体积)3M乙酸钠(pH5.2)和100μl(2.5体积)乙醇沉淀,并在-20℃保存过夜。然后将它们在4℃以3,300rpm离心1小时。所得沉淀用50μl冰冷的70%乙醇洗涤,然后再离心30分钟。然后空气干燥沉淀并重悬于20μl 3×SSC中或50%二甲基亚砜(DMSO)中过夜。然后用机器人GMS 417或427阵列仪(Affymetrix,Ca)将样品单次或重复点斑在载片上。
微阵列上斑点的边界可以用钻石刻刀(因为处理以后斑点不可见)标记。将载片悬于温的无颗粒ddH2O皿中约1分钟(斑点将轻微溶胀但将不互相接触)以再水化阵列,在70-80℃倒置加热块上快速干燥3秒。然后在杂交之前将核酸紫外交联到载片上(Stratagene,Stratalinker,65mJ-设置显示为“650”,表示650×100μJ)或者在80℃烘阵列2-4小时。阵列放置于片架上。准备空片室并充入以下溶液3.0g琥珀酸酐(Aldrich)溶于189ml 1-甲基-2-吡咯烷酮(迅速加入试剂很关键);最后的琥珀酸酐薄片溶解以后立即混合入21.0ml 0.2M硼酸钠并将溶液倒入片室内。迅速且均匀地将片架置入片室并剧烈地上下摇几秒,确保片绝不离开溶液,然后在水平回转式振荡器(orbital shaker)上混合15-20分钟。然后将片架轻轻置入95℃ ddH2O中2分钟,随后插入95%乙醇中5次。使过量乙醇滴到纸巾上,空气干燥载片。阵列室温保存于片盒中备用。
很多方法可以用于将本发明的核酸成员附着到基质上(称为“点斑”的过程)。例如使用例如美国专利5,807,522中的技术附着核酸,该专利经引用并入本文,其中教导聚合物附着的方法。
作为替代方案,可以用本领域已知的接触印刷技术进行点斑。
微阵列用途根据本发明的核酸阵列可以用于测试包含一种或多种靶核酸序列的样品中的核酸。本发明的阵列可发现多种应用,如诊断肝癌、筛选治疗靶点等。
所述阵列还可用于药物发现和研究中的大规模表达筛选,如特定活性剂对本发明生物标志物的表达模式的影响,其中这些信息用于揭示药物效果和毒性、环境监测、疾病研究等。
可使用至少一种、更优选这些序列的组合作为诊断肝癌的物质来制造阵列。
本领域技术人员完全明白标准样品的选择,它包括与从一个或多个正常个体分离的RNA互补的样品,其中正常个体是不患有肝癌的个体。
制备用于与阵列杂交的核酸样品用于与根据本发明的阵列杂交的样品优选来源于血的总RNA。在另一个实施方案中,阵列的靶来源于血的mRNA。
核酸样品能通过一种或多种类型的化学键、通常通过碱基互补配对、通常通过形成氢键来结合互补序列的核酸成员。
本文所用“来源于mRNA转录本的核酸”或“对应mRNA的核酸”表示mRNA转录本或其子序列最终用作合成模板的核酸。因此,从mRNA逆转录的cDNA、从该cDNA转录的RNA、从该cDNA扩增的DNA、从该扩增DNA转录的RNA等都来源于或对应所述mRNA转录本,并且检测到这种来源或相对应的产物可以指示样品中初始转录本的存在和/或丰度或者与之成比例。因此,合适的核酸样品包括但不限于基因的mRNA转录本、从该mRNA逆转录的cDNA、从该cDNA转录的cRNA、从基因扩增的DNA、从该扩增DNA转录的RNA等。用于此处的核酸样品优选来源于血。核酸可以是单链或双链DNA、RNA或DNA-RNA杂合体,它们用本领域已知方法例如经逆转录或PCR从人血合成。
在最简单的实施方案中,这种核酸样品包含从血样分离的总mRNA或对应mRNA的核酸样品(如cDNA)。在另一个实施方案中,使用例如酸性胍-酚-氯仿提取法从给定样品分离总mRNA,并用oligo dT柱层析或用(dT)n磁珠分离polyA+mRNA(例如见Sambrook et al.,Molecular CloningA Laboratory Manual(2nd ed.),Vols.1-3,Cold Spring Harbor Laboratory,(1989),或Current Protocols in MolecularBiology,F.Ausubel et al.,ed.Greene Publishing and Wiley-Interscience,New York(1987))。在一个优选实施方案中,用TRIzol试剂(GIBCO/BRL,Invitrogen LifeTechnologies,Cat.No.15596)提取总RNA。用260/280nm吸光度和琼脂糖凝胶电泳随后紫外光检查评价RNA纯度和完整性。
在一些实施方案中,期望在杂交之前扩增核酸样品,例如当仅有有限量的样品可以使用时(例如血滴)。本领域技术人员知道无论使用何种扩增方法,如果期望定量结果,必须小心使用维持或控制所扩增核酸相对频率的方法。“定量”扩增的方法对本领域技术人员是公知的。例如定量PCR涉及用相同引物同时共扩增已知量的对照序列。这提供可用于校准PCR反应的内部标准。高密度阵列因而可以包括对内部标准特异性的引物以定量所扩增核酸。定量PCR的详细操作提供于PCR Protocols,AGuide to Methods and Applications,Innis et al.,Academic Press,Inc.N.Y.,(1990)。
其它合适的扩增方法包括但不限于聚合酶链式反应(PCR)(Innis,et al.,PCRProtocols.A Guide to Methods and Application.Academic Press,Inc.San Diego,(1990))、连接酶链式反应(LCR)(见Wu and Wallace,1989,Genomics,4560;Landegren,et al.,1988,Science,2411077和Barringer,et al.,1990,Gene,89117)、转录扩增(Kwoh,et al.,1989,Proc.Natl.Acad.Sci.USA,861173)和自支持的序列复制(Guatelli,et al.,1990,Proc.Natl.Acad.Sci.USA,871874)。
在一个特别优选的实施方案中,用逆转录酶和由oligo dT与编码噬菌体T7启动子的序列组成的引物逆转录核酸样品mRNA,以提供单链DNA模板。第二条DNA链用DNA聚合酶聚合。合成双链cDNA以后,加入T7 RNA聚合酶,从cDNA模板转录RNA。从每个单个cDNA模板的连续转录循环得到扩增的RNA。体外转录方法对本领域技术人员是公知的(例如见Sambrook,同上),这种具体的方法详细描述于Van Gelder,et al.,1990,Proc.Natl.Acad.Sci.USA,871663-1667,其中证明根据这种方法的体外扩增保持各种RNA转录本的相对频率。此外,Eberwine et al.Proc.Natl.Acad.Sci.USA,893010-3014提供了使用经体外转录的两轮扩增以实现超过起始材料106倍扩增的操作方案,从而即使生物样品有限时也允许表达监测。
标记核酸样品或核酸探针标记核酸探针以允许检测与本发明阵列的杂交。与分子结合或掺入分子中的任何分析检测性标志物可以用于本发明。分析检测标志物表示可以被分析性检测和定量的任何分子、基团或原子。
适用于本发明的可检测标记物包括可以通过光谱、光化学、生物化学、免疫化学、电、光或化学手段检测的任何组分。可用于本发明的标记物包括用标记的链亲合素偶联物染色的生物素、磁珠(如DynabeadsTM)、荧光染料(如荧光素、德克萨斯红、罗丹明、绿色荧光蛋白等)、放射性标记物(如3H、125I、35S、14C或32P)、酶(如辣根过氧化物酶、碱性磷酸酶和其它常用于ELISA的酶)和比色标记物如胶体金或有色玻璃或塑料(如聚苯乙烯、聚丙烯、乳胶等)珠。教导这些标记物用途的专利包括美国专利No.3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149和4,366,241,它们的全部内容经引用并入本文。
检测这些标记物的手段对本领域技术人员是公知的。因此,例如,可以用照相胶片或闪烁计数器检测放射性标记物,可以用检测发射光的光检测器检测荧光标记物。酶标记物通常通过向酶提供底物并检测酶作用于底物生成的反应产物进行检测,比色标记物通过简单观察有色标记物来检测。
可以通过本领域技术人员公知的许多手段中的任意一种引入标记物。然而,在一个优选实施方案中,在制备核酸样品中的扩增步骤期间同时引入标记物。因此,例如,使用标记引物或标记核苷酸的聚合酶链式反应(PCR)将提供标记的扩增产物。在一个优选实施方案中,使用标记核苷酸(如荧光素标记的UTP和/或CTP)的上述转录扩增将标记物掺入转录的核酸中。
作为替代方案,可以将标记物直接加入起始核酸样品(如mRNA、polyA mRNA、cDNA等)或在完成扩增以后加入扩增产物中。将标记连接到核酸上的手段对于本领域技术人员是公知的,例如包括缺口翻译或末端标记(如用标记RNA),包括激酶处理核酸,随后接合(连接)核酸接头,将样品核酸连接到标记(如荧光物质)上。
在一个优选实施方案中,通过花青染料如Cy-3/Cy-5 dUTP、Cy-3/Cy-5 dCTP(Amersham Pharmacia)或alexa染料(Khan,et al.,1998,Cancer Res.585009-5013)进行荧光修饰。
在一个优选实施方案中,用于比较的两种核酸样品用产生可区分检测信号的不同的荧光染料标记,例如,从正常肝细胞制备的核酸样品用Cy5标记,从轻度肝癌细胞制备的核酸样品用Cy3标记。不同标记的靶样品同时杂交到同一微阵列上。在一个优选实施方案中,标记核酸样品用本领域公知方法纯化,例如通过乙醇纯化或柱纯化。
在一个优选实施方案中,核酸样品将包括一种或多种对照分子,它们与微阵列上的对照探针杂交以标准化微阵列产生的信号。优选的是,标记的标准化核酸样品是与上述点到微阵列上的对照寡核苷酸完全互补的核酸序列。杂交以后从标准化对照获得的信号提供对杂交条件、标记强度、“阅读”效率和可能引起完全杂交信号在阵列之间变化的其它因素变异的控制。在一个优选实施方案中,从阵列中所有其它探针阅读的信号(如荧光强度)除以从对照探针阅读的信号(如荧光强度),从而标准化测定。
选择优选的标准化核酸样品以反映样品中存在的其它核酸样品的平均长度,然后可以选择它们覆盖一个长度范围。也可以选择标准化对照以反映阵列中其它探针的(平均)碱基组成,然而在一个优选实施方案中,仅使用一种或几种标准化探针,并且它们的选择使得它们良好杂交(即没有二级结构并且不自杂交)并且不匹配阵列上任何核酸。
标准化探针位于阵列中任意位置或者阵列上的多个位置以控制杂交效率的空间变异。在一个优选实施方案中,标准化对照位于阵列的角落或边缘以及中间。
杂交条件核酸杂交涉及在一定条件下提供核酸样品,所述条件下样品和互补性核酸成员能通过互补性碱基配对形成稳定的杂合双链。不形成杂合双链的核酸然后被洗去,留下杂交的核酸进行检测,通常通过检测连接的可检测标记物而进行检测。一般认为增加温度或降低含核酸的缓冲液的盐浓度可以变性核酸。在低严谨性条件(如低温和/或高盐)下,甚至在退火序列不完全互补时也将形成杂合双链(如DNADNA、DNARNA或RNARNA)。因此在较低严谨性下杂交特异性降低。相反,在较高严谨性(如较高温度或较低盐)时成功的杂交要求较少错配。
本发明提供的杂交条件包括Dig杂交混合物(Boehringer);或基于甲酰胺的杂交溶液,例如描述于Ausubel et al.,同上和Sambrook et al.,同上。
优化杂交条件的方法是本领域技术人员公知的(例如见Laboratory Techniques inBiochemistry and Molecular Biology,Vol.24Hybridization With Nucleic acid Probes,P.Tijssen,ed.Elsevier,N.Y.,(1993))。
杂交以后,方便地通过洗涤从支持物表面除去未杂交标记或未标记核酸,从而在基质表面上产生杂交靶核酸的模式。本领域技术人员已知多种洗涤溶液并且可以使用。标记、杂交寡核苷酸和/或核酸的所得杂交模式可以用多种方式观察或检测,所选择的具体检测方式基于测试核酸的特定标记物,其中代表性检测手段包括闪烁计数、放射自显影、荧光测定、量热测定、发光测定等。
图像获取和数据分析如上述,杂交和任何洗涤步骤和/或后续处理之后,检测所得杂交模式。检测或观察杂交模式时,标记物的强度或信号值将不仅被检测而且被定量,这意味着将测定每个杂交斑点的信号并与已知量末端标记靶核酸所发出信号对应的单位值进行比较,以获得杂交模式中与阵列上特定斑点杂交的每种末端标记靶的拷贝数的计数或绝对值。
分析从与阵列的杂交所收集数据的方法在本领域公知。例如,当杂交检测涉及荧光标记物时,数据分析可以包括下列步骤确定荧光强度作为所收集数据的基质位置的函数;去除异常值,即偏离预定统计分布的数据;和从剩余数据计算测试核酸的相对结合亲和力。所得数据显示为图像,其中每个区域中的强度根据结合的寡核苷酸和/或核酸与测试核酸之间的结合亲和力而变化。
以下检测操作用于同时分析两种待比较样品,其中每种样品用不同的荧光染料标记。
针对第一种荧光颜色扫描微阵列的每个元素。每个阵列元素处的荧光强度与样品中该基因的表达水平成比例。
对第二种荧光标记重复扫描操作。两种荧光强度的比例提供两种样品中相对基因表达水平的高度精确和定量的测定。
在一个优选实施方案中,从装备激光激发源和适用于Cy3和Cy5荧光的干涉滤光器的定制共聚焦显微镜获取的图像确定固定化核酸序列的荧光强度。每种荧光分别在分辨率225μm2/像素和65,536灰阶下进行扫描。图像分割以识别杂交区域,标准化两个荧光图像之间的强度,并计算每个靶处标准化的平均荧光值,这些如文献所述(Khan,et al.,1998,Cancer Res.585009-5013.Chen,et al.,1997,Biomed.Optics2364-374)。图像之间的标准化用于调整两种不同荧光的不同标记和检测效率。这通过将点在阵列上的一组内对照基因的信号强度比平衡为1的值而实现。
在另一个优选实施方案中,在Cy3和Cy5通道扫描阵列并保存为独立的16位TIFF图像。引入图像并用软件分析,所述软件包括格栅化处理以从阵列上每个点获取杂交强度数据。收集每个点的荧光强度和背景扣除以后的杂交强度并计算测定的Cy5/Cy3平均强度比。使用线性回归方法进行标准化并假设测定的Cy5/Cy3强度的散点图的斜率为1。计算比率的平均值并用于重新衡量数据并调整斜率为1。表达比率不等于1用作差异基因表达的指标。
在一个特别优选的实施方案中,当期望定量样品中一种或多种核酸序列的转录水平(及相应表达)时,核酸样品中基因的mRNA转录本的浓度或来源于mRNA转录本的核酸的浓度与该基因的转录水平(及相应表达水平)成比例。相似地,杂交信号强度优选与杂交核酸的量成比例。尽管优选比例性相对严格(如转录速率加倍导致样品核酸库中mRNA转录本加倍和杂交信号加倍),技术人员将知道比例性可以更宽松,甚至是非线性的,而仍然提供有意义的结果。因此,例如,样品mRNA浓度的5倍差异导致杂交强度的3-到6-倍差异的分析对于多数目的是足够的。当需要更精确定量时,使用适当对照以校正本文所述的样品制备和杂交中引入的变异。此外,根据本领域技术人员公知的方法使用系列稀释“标准”mRNA样品制备标准曲线。当然,如果需要简单检测转录本的存在或缺少,则不需要精细的对照或校正。
例如,如果阵列上核酸成员在杂交以后未被标记,这指示包含该核酸成员的基因不在任一样品中表达。如果核酸成员具有单色标记,这指示标记基因仅在一种样品中表达。组成阵列的核酸成员被双色标记指示该基因在两种样品中都表达。甚至检测到每个细胞仅表达一次的基因(1/100,000灵敏度)。待比较的两种样品中表达强度的差异指示差异表达,两种样品的强度比不等于1.0,优选小于0.7或大于1.2,更优选小于0.5或大于1.5。
5.10.2RT-PCR在本发明的一个方面中,本发明生物标志物的RNA产物表达水平可通过用逆转录(RT)结合聚合酶链式反应(PCR)从样品中扩增生物标志物的RNA产物来测定。根据本发明的一个实施方案,RT可以是定量的,正如本领域技术人员所知。
样品的总RNA或mRNA用作模板,使用对本发明生物标志物的转录部分特异的引物启动逆转录。将RNA逆转录为cDNA的方法是公知的,描述于Sambrook et al.,1989,同上。可用商业软件(如Primer Designer 1.0,Scientific Software等)进行引物设计。随后逆转录产物用作PCR模板。
通过使用多循环的依赖于DNA的DNA聚合酶催化的DNA复制,PCR提供迅速扩增特定核酸序列的方法,从而扩增感兴趣的靶序列。PCR要求存在待扩增核酸、两种位于待扩增序列旁侧的单链寡核苷酸引物、DNA聚合酶、脱氧核糖核苷三磷酸、缓冲液和盐。
PCR方法在本领域中公知。PCR如Mullis and Faloona,1987,Methods Enzymol.,155335中所述进行,其经引用并入本文。PCR使用模板DNA(至少1fg;更有用的是1-1000ng)和至少25pmol寡核苷酸引物进行。典型的反应混合物包括2μl DNA、25pmol寡核苷酸引物、2.5μl 10H PCR缓冲液1(Perkin-Elmer,Foster City,CA)、0.4μl 1.25μM dNTP、0.15μl(或2.5单位)Taq DNA聚合酶(Perkin-Elmer,FosterCity,CA)和去离子水加到总体积25μl。覆盖矿物油并用可编程热循环仪进行PCR。
根据实际需要的严谨性调整PCR循环每一步的长度和温度以及循环数。退火温度和时间都根据期望引物退火到模板上的效率和可耐受的错配程度确定。优化引物退火条件严谨性的能力良好地在本领域技术人员的知识范围内。使用30℃-72℃之间的退火温度。模板分子的起始变性通常于92℃-99℃之间进行4分钟,随后是20-40个循环,由以下组成变性(94℃-99℃持续15秒-1分钟)、退火(由上述讨论确定;1-2分钟)和延伸(72℃持续1分钟)。最后延伸步骤一般在72℃进行4分钟。并可以跟随无限的4℃步骤(0-24小时)。
QRT-PCR(定量RT-PCR)本质是定量性的,也可以用于提供基因表达水平的定量测定。在QRT-PCR中逆转录和PCR可以分两步进行,或者逆转录与PCR可以同时进行。这些技术之一,对此有商品试剂盒如TaqMan(Perkin Elmer,Foster City,CA),使用转录特异性反义探针进行。这种探针对PCR产物(如来源于基因的核酸片段)是特异性的,并且在寡核苷酸的5’端复合有淬灭剂和荧光报告探针。不同的荧光标志物连接到不同报告子上,允许在一个反应中测定两种产物。当Taq DNA聚合酶被活化时,通过其5’-3’核酸外切酶活性将结合到模板上的探针的荧光报告子切除。无淬灭剂时,报告子发荧光。报告子颜色的改变与每种特异性产物的量成比例并可以用荧光计测定;因此,每种颜色的量得以测定,PCR产物得以定量。PCR反应在96孔板中进行,使得来源于很多个体的样品可以同时处理和测定。TaqMan系统还具有不需要凝胶电泳的优点,允许在使用标准曲线时进行定量。
用于定量检测PCR产物第二种技术是使用intercolating染料如可通过商业途径获得的QuantiTect SYBR Green PCR(Qiagen,Valencia California)。用SYBR Green作为荧光标记进行RT-PCR,染料在PCR期间掺入PCR产物并产生与PCR产物量成比例的荧光。
RNA逆转录之后TaqMan和QuantiTect SYBR系统都可以使用。可以在与CPR步骤相同的反应混合物中进行逆转录(一步法),或者可以在用PCR扩增之前先进行逆转录(两步法)。
此外,已知定量测定mRNA表达产物的其它系统,包括Molecular Beacons,它使用含荧光分子和淬灭分子的探针,该探针能形成发夹结构使得当处于发夹形式时,荧光分子被淬灭,而当杂交时荧光增加,从而定量测定基因表达。
定量测定RNA表达的其它技术包括但不限于聚合酶链式反应、连接酶链式反应、Qbeta复制酶(例如见国际申请号PCT/US87/00880)、等温扩增法(例如见Walker et al.(1992)PNAS 89382-396)、链置换扩增(SDA)、修复链反应、非对称定量PCR(例如见美国公开号US200330134307A1)和多重微球珠测试,描述于Fuja et al.,2004,Journal of Biotechnology 108193-205。
可以通过用基于转录的扩增系统(TAS)从样品扩增RNA来测定基因表达水平,包括核酸序列扩增(NASBA)和3SR。例如见Kwoh et al(1989)PNAS USA 861173;国际公开No.WO 88/10315;和美国专利No.6,329,179。在NASBA中,可以用传统酚/氯仿提取、热变性、裂解缓冲液和小离心柱处理分离DNA和RNA或盐酸胍提取RNA来制备核酸用于扩增。这些扩增技术涉及具有靶特异性序列的引物退火。聚合之后,DNA/RNA杂合体用RNaseH消化,而双链DNA分子再次热变性。在每种情况下通过加入第二种靶特异性引物然后聚合将单链DNA制成双链。然后用聚合酶如T7或SP6重复转录双链DNA分子。在等温循环反应中,RNA被逆转录为双链DNA,并用聚合酶如T7或SP6转录一次。所得产物,无论截短或完全的所得产物,都指示靶特异性序列。
几种技术可以用于分离扩增产物。例如,可以用琼脂糖、琼脂糖-丙烯酰胺或聚丙烯酰胺凝胶电泳经常规方法分离扩增产物。见Sambrook et al.,1989。无需电泳定量检测PCR产物的几种技术也可以根据本发明使用(例如见PCR Protocols,AGuide to Methods and Applications,Innis et al.,Academic Press,Inc.N.Y.,(1990))。例如,可以使用色谱技术进行分离。有很多种色谱可以用于本发明吸附、分配、离子交换和分子筛、HPLC和很多使用它们的专用技术,包括柱、纸、薄层和气相色谱(Freifelder,Physical Biochemistry Applications to Biochemistry and MolecularBiology,2nd ed.,Wm.Freeman and Co.,New York,N.Y.,1982)。
通过用多种类型的小分子配体共价标记用于PCR反应的寡核苷酸引物而实施分离方法的另一种实例。在一种这样的分离中,每种寡核苷酸上带不同配体。使用特异性结合一种配体的分子包被板如96孔ELISA板的表面,如果配体是生物素,则所述特异性结合配体的分子可能是抗体或亲合素。当PCR反应体系施加到这样制备的板的表面时,PCR产物与表面特异性结合。洗涤板去除未结合试剂以后,加入含结合第一配体的第二种分子的溶液。这第二种分子与一些类型的报告系统连接。如果PCR产物已经产生,其中两种寡核苷酸引物都掺入最终的PCR产物中,则第二种分子仅结合到板上。然后用如检测和定量ELISA反应中所使用的商品化读板仪来检测和定量PCR产物的量。诸如此处所述的一个ELISA样系统由Raggio Italgene company开发,商品名为C-Track。
必须观察扩增产物以确认感兴趣核酸序列的扩增。一种典型的观察方法涉及用溴化乙锭染色凝胶并在紫外光下观察。作为替代方案,如果扩增产物用放射性或荧光标记的核苷酸整合标记,则分离以后可以将扩增产物对x射线胶片曝光或在适当的刺激光谱下观察。
在一个实施方案中,间接进行观察。分离扩增产物以后,使标记的核酸探针与感兴趣的扩增核酸序列接触。探针优选与发色物偶联,但也可以被放射性标记。在另一个实施方案中,探针偶联到结合伴侣上,如抗体或生物素,而结合对的其它成员携带可检测基团。
在另一个实施方案中,通过用标记探针经Southern印迹和杂交进行检测。Southern印迹涉及的技术对本领域技术人员是公知的,并可以在很多关于分子操作的标准书籍中查到。见Sambrook et al.,1989,同上。简单的说,经凝胶电泳分离扩增产物。然后使凝胶与膜如硝酸纤维素接触,使核酸转移和非共价结合。随后,将膜与偶联发色物的探针一起孵育,所述探针能与靶扩增产物杂交。通过膜对x射线胶片的曝光或离子发射检测装置进行检测。
前述的一个实例描述于美国专利5,279,721中,该专利经引用并入本文,其中公开了自动化电泳和转移核酸的装置和方法。所述装置允许电泳和印迹而无需外部操作凝胶,理想地适用于实施根据本发明的方法。
5.10.3核酸酶保护分析在本发明的另一个实施方案中,可以用核酸酶保护分析(包括核糖核酸酶保护分析和S1核酸酶分析)检测和定量本发明生物标志物的RNA产物。在核酸酶保护分析中,反义探针(例如用放射性标记或非同位素标记)在溶液中与RNA样品杂交。杂交以后,单链、未杂交的探针和RNA被核酸酶降解。用丙烯酰胺凝胶分离剩余的受保护片段。通常溶液杂交比基于膜的杂交更有效,并且它可以适用于高达100μg的样品RNA,而印迹杂交最多为20-30μg。
核糖核酸酶保护分析是最常见的核酸酶保护分析,要求使用RNA探针。寡核苷酸和其它单链DNA探针只能用于含S1核酸酶的分析中。单链、反义探针通常必须与靶RNA完全同源,以防止核酸酶切割探针靶杂合体。
5.10.3 Northern印迹根据本领域普通技术人员已知的常规Northern杂交技术,标准Northern印迹分析还可以用于确认RNA转录本大小,鉴定选择性剪接的RNA转录本和本发明生物标志物的RNA产物的相对量。在Northern印迹中,首先在变性条件下经琼脂糖凝胶电泳按大小分离RNA样品。然后将RNA转移到膜上,交联,并与标记探针杂交。可以使用非同位素或高比活的放射性标记探针,包括随机引发、缺口翻译或PCR产生的DNA探针、体外转录的RNA探针和寡核苷酸。此外,仅具有部分同源性的序列(如不同物种的cDNA或可能含有外显子的基因组DNA片段)可以用作探针。标记探针,如放射性标记的cDNA,其含有全长单链DNA或该DNA序列的片段,可以长至少20、至少30、至少50或至少100个连续核苷酸。可以用本领域技术人员已知的很多不同方法的任一种来标记探针。这些研究中最常用的标记物是放射性元素、酶、暴露于紫外光时发荧光的化学品等。多种荧光物质是已知的并可以用作标记物。这些包括但不限于荧光素、罗丹明、金胺、德克萨斯红、AMCA蓝和Lucifer黄。具体的检测物质是山羊中制备并经异硫氰酸酯与荧光素偶联的抗兔抗体。也可以用放射性元素或酶标记蛋白质。可以用当前可用的任何计数方法检测放射性标记。同位素的非限制性实例包括3H、14C、32P、35S、36Cl、51Cr、57Co、58Co、59Fe、90Y、125I、131I和186Re。同样可以使用酶标记物,并可以用当前使用的比色、光谱、荧光光谱、电流分析或气体分析技术的任何技术进行检测。通过与桥联分子如碳二亚胺、二异硫氰酸酯、戊二醛等反应将酶偶联到选定的颗粒上。可以使用本领域技术人员已知的任何酶。这种酶的实例包括但不限于过氧化物酶、β-D-半乳糖苷酶、脲酶、葡萄糖氧化酶加过氧化物酶和碱性磷酸酶。作为实例参考美国专利No.3,654,090、3,850752和4,016,043,其中公开了替代性标记物质和方法。
5.11测定本发明生物标志物的蛋白质产物的技术5.11.1基于抗体的方法也可以用标准技术确定样品中存在的感兴趣蛋白质的量。例如可以使用标准技术,例如使用免疫测试如Western印迹、免疫沉淀随后十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)、免疫细胞化学等确定样品中存在的感兴趣蛋白质的量。检测感兴趣蛋白质的优选试剂是能结合感兴趣蛋白质的抗体,优选带可检测标记的抗体。
对于这样的检测方法,可以用本领域技术人员公知的技术容易地分离待分析样品中的蛋白质。蛋白质分离方法例如可以是Harlow和Lane(Harlow,E.and Lane,D.,AntibodiesA Laboratory Manual,Cold Spring Harbor Laboratory Press.Cold SpringHarbor,New York(1988))描述的那些。
检测感兴趣蛋白质的优选方法涉及通过与蛋白质特异性抗体的相互作用进行检测。例如,如本文所述可使用针对感兴趣蛋白质的抗体。可以用本领域技术人员公知的标准技术产生抗体。这些抗体产生技术的更详细讨论例如见本申请15.13.2节和美国公开号20040018200中5.2节,所述内容经引用并入本文。简单的说,这些抗体可以是多克隆的,或更优选是单克隆的。例如,可以使用完整抗体或抗体片段(如Fab或F(ab’)2)。抗体优选是人抗体或人源化抗体。
表5表示在本发明的一个实施方案中,用于检测本发明生物标志物的蛋白质的抗体。
表5
例如,可以使用对感兴趣蛋白质特异的抗体或抗体片段定量或定性检测该蛋白质的存在。例如这可以通过免疫荧光技术实现。此外,抗体(或其片段)可用于组织学如免疫荧光或免疫电镜分析,以原位检测感兴趣蛋白质。通过从患者取组织学样品(如活组织检查样品)并向其使用针对一种蛋白质的标记抗体,从而可以实现原位检测。优选通过将标记抗体(或其片段)覆盖到生物样品上来使用抗体(或其片段)。通过使用这种方法,不仅可以确定样品内感兴趣蛋白质的存在性,而且可以确定其分布、细胞(如肝癌细胞和淋巴细胞)内存在性。为了实现这种原位检测可以使用各种公知组织学方法(如染色法)。
感兴趣蛋白的免疫测试通常包括将生物样品与能鉴定感兴趣蛋白质的可标记检测的抗体一起孵育,并通过任何的多种公知技术检测结合抗体。下面将更详细讨论,术语“标记”可以表示直接标记抗体,例如通过将可检测物质偶联(即物理连接)至抗体上,并且还可以表示间接标记抗体,通过与直接标记的另一种试剂的反应性。间接标记的实例包括用荧光标记的第二抗体检测第一抗体。
例如,可以使生物样品与固相支持物或载体如硝酸纤维素或能固定细胞、细胞颗粒或可溶性蛋白质的其它固相支持物接触并固定在其上。然后可以用合适缓冲液洗涤支持物,随后用可检测标记的指纹基因特异性抗体处理。然后可以用缓冲液第二次洗涤固相支持物以去除未结合抗体。然后可用常规手段检测结合到固相支持物上的标记物量。
对于蛋白质物质而言,“固相支持物或载体”表示能结合抗原或抗体的任何支持物。公知的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉、天然和改性纤维素、聚丙烯酰胺、辉长岩和磁石。根据本发明目的,载体的性质可以是一定程度可溶的或不溶性的。支持物材料可以具有几乎任何可能的构型,只要偶联分子能结合抗原或抗体即可。因此,支持物构型可以是球形,如珠;或圆柱形,如试管的内表面或棒的外表面。作为替代方案,表面可以是平的,如薄片、测试条等。优选的支持物包括聚苯乙烯珠。本领域技术人员知道很多其它的适用于结合抗体或抗原的载体,或者能使用常规实验确认它们。
可检测性标记特异性抗体的方式之一是将抗体与酶连接并用于酶免疫测试(EIA)(Voller,A.,″The Enzyme Linked Immunosorbent Assay(ELISA)″,1978,Diagnostic Horizons 21-7,Microbiological Associates Quarterly Publication,Walkersville,MD);Voller,A.et al.,1978,J.Clin.Pathol.31507-520;Butler,J.E.,1981,Meth.Enzymol.73482-523;Maggio,E.(ed.),1980,Enzyme Immunoassay,CRCPress,Boca Raton,FL;Ishikawa,E.et al.,(eds.),1981,Enzyme Immunoassay,KgakuShoin,Tokyo)。与抗体结合的酶将与适当的底物反应,优选与发色底物反应,以此方式产生例如通过光谱、荧光光谱或观察手段检测的化学结构。可用于可检测性标记抗体的酶包括但不限于苹果酸脱氢酶、葡萄球菌核酸酶、δ-5-类固醇异构酶、酵母醇脱氢酶、α-甘油磷酸、脱氢酶、三糖磷酸异构酶、辣根过氧化物酶、碱性磷酸酶、天冬酰胺酶、葡萄糖氧化酶、β-半乳糖苷酶、核糖核酸酶、脲酶、过氧化氢酶、葡萄糖-6-磷酸脱氢酶、葡萄糖淀粉酶和乙酰胆碱酯酶。可以通过比色方法使用酶的发色底物进行检测。还可以通过酶催化底物反应的程度与相似制备的标准品之间的观察比较进行检测。
还可以用多种其它免疫测试的任一种进行检测。例如,通过放射性标记抗体或抗体片段,可以通过使用放射免疫测试(RIA)检测感兴趣蛋白质(例如见Weintraub,B.,Principles of Radioimmunoassays,Seventh Training Course on Radioligand AssayTechniques,The Endocrine Society,March,1986,该文经引用并入本文)。放射性同位素(如125I、131I、35S或3H)可以通过诸如使用γ计数器或闪烁计数器或放射自显影的方式进行检测。
也可以用荧光化合物标记抗体。当荧光标记的抗体暴露于适当波长的光时,可以由荧光检测其存在。最常用的荧光标记化合物中有荧光素异硫氰酸酯、罗丹明、藻红蛋白、藻蓝蛋白、别藻蓝蛋白、邻苯二甲醛(o-phthaldehyde)和荧光胺。
也可以用发荧光金属如152Eu或其它镧系元素可检测性标记抗体。可以用金属螯合基团如二亚乙基三胺五乙酸(DTPA)或乙二胺四乙酸(EDTA)将这些金属连接到抗体上。
还可以将抗体偶联到化学发光化合物上可检测性标记抗体。然后通过检测是否存在化学反应期间产生的发光确定化学发光标记抗体的存在性。特别有用的化学发光标记化合物的实例是鲁米诺、异鲁米诺、theromatic acridinium ester、咪唑、acridinium盐和草酸酯。
同样,生物发光化合物可用于标记本发明的抗体。生物发光是一种在生物系统中发现的化学发光,其中催化性蛋白质增加化学发光反应的效率。对于标记目的,重要的生物发光化合物是荧光素、荧光素酶和水母发光蛋白。
5.11.2蛋白质阵列特异性和/或选择性结合到本发明生物标志物的蛋白质产物上的多肽可以被固定化到蛋白质阵列上。蛋白质阵列可以用作诊断工具,如用于筛选医学样品(如分离的细胞、血、滑液、血清、活组织样品等)是否存在本发明生物标志物的多肽蛋白质产物。蛋白质阵列还可以包括抗体以及其它配体,如结合到本发明生物标志物编码的多肽上的抗体或配体。
产生多肽阵列的方法已经描述,如见De Wildt et al.,2000,Nature Biotech.18989-994;Lueking et al.,1999,Anal.Biochem.270103-111;Ge,2000,Nuc.AcidsRes.28e3;MacBeath and Schreiber,2000,Science 2891760-1763;国际公开No.WO01/40803和WO 99/51773A1;和U.S.Patent No.6,406,921。用于阵列的多肽可以高速点斑,如使用商品机器人装置,如来自Genetic MicroSystems和Affymetrix(SantaClara,California,USA)或BioRobotics(Cambridge,UK)的机器人装置。阵列基质例如可以是硝酸纤维素、塑料、玻璃,如表面改性玻璃。阵列还可以包括多孔基质,如丙烯酰胺、琼脂糖或另一种聚合物。
例如,阵列可以是抗体阵列,如De Wildt同上所述。产生多肽配体的细胞可以阵列格式生长在滤膜上。诱导多肽产生,并且表达的抗体被固定到滤膜的细胞位置处。关于阵列上每个地址的结合程度的信息可以作为谱图例如保存于计算机数据库中。
在一个实施方案中,阵列是1、2、3、4、5、6、7、8、9、10、15、20或全部或任何组合的本发明生物标志物的蛋白质产物的阵列。在一个方面,本发明提供结合到阵列上的抗体,所述抗体选择性结合到本发明生物标志物的蛋白质产物上。
5.12蛋白质生成可以使用标准重组核酸方法表达本发明的多肽或抗体(如本发明生物标志物的蛋白质产物)。一般来说,将编码多肽的核酸序列克隆到核酸表达载体中。当然,如果蛋白质包括多条多肽链,每条链必须被克隆入表达载体中,如相同或不同载体中,在相同或不同细胞中表达。如果蛋白质足够小,即蛋白质是小于50个氨基酸的肽,可以用自动有机合成方法合成蛋白质。从仅含有与生物标志物的5’区、3’区或内部编码区对应的核酸序列的核酸表达载体表达包含本发明生物标志物的5’区、3’区或内部编码区的多肽。产生针对本发明生物标志物的蛋白质产物或由本发明生物标志物的5’区、3’区或内部编码区所编码多肽的抗体的方法。
除了编码多肽或其片段的部分以外,表达多肽的表达载体还可以包括与感兴趣核酸可操作连接的调节序列,例如包括启动子。大量合适的载体和启动子对本领域技术人员已知,并且可以商业获得,以产生本发明的重组构建体。示例性提供以下载体。细菌pBs、phagescript、PsiX174、pBluescript SK、pBs KS、pNH8a、pNH16a、pNH18a、pNH46a(Stratagene,La Jolla,California,USA);pTrc99A、pKK223-3、pKK233-3、pDR540和pRIT5(Pharmacia,Uppsala,Sweden)。真核pWLneo、pSV2cat、pOG44、PXTI、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。一种优选类型的优选文库是展示文库,以下将描述。
本领域技术人员公知的方法可以用于构建含本发明多核苷酸和适当转录/翻译控制信号的载体。这些方法包括体外重组DNA技术、合成技术和体内重组/遗传重组。例如见,描述于下文的技术Sambrook & Russel,Molecular CloningA LaboratoryManual,3rd Edition,Cold Spring Harbor Laboratory,N.Y.(2001)和Ausubel et al.,Current Protocols in Molecular Biology(Greene Publishing Associates and WileyInterscience,N.Y.(1989)。启动子区可以选自任意期望的基因,使用CAT(氯霉素转移酶)载体或其它带选择标记的载体。两种适当的载体是pKK232-8和pCM7。具体名称的细菌启动子包括lacI、lacZ、T3、T7、gpt、λP和trc。真核启动子包括CMV立即早期、HSV胸苷激酶、早期和晚期SV40、逆转录病毒的LTR、小鼠金属硫蛋白-I和多种已知组织特异性启动子。在具体实施方案中,启动子是诱导型启动子。在其它一些实施方案中,启动子是组成型启动子。在另外的一些实施方案中,启动子是组织特异性启动子。
一般来说,重组表达载体将包括复制起点和允许转化宿主细胞的选择标记,如大肠杆菌的氨苄青霉素抗性基因和酿酒酵母的营养缺陷标记(如URA3、LEU2、HIS3和TRP1基因),和来源于高表达基因、指导下游结构序列转录的启动子。这种启动子可以来源于编码糖酵解酶如3-磷酸甘油激酶(PGK)的操纵子、a-因子、酸性磷酸酶或热休克蛋白。本发明的多核苷酸以适当形式与翻译起始和终止序列组装,优选的是与能指导翻译蛋白质分泌到周质区或细胞外介质中的前导序列组装。任选地,本发明核酸可以编码包括N-末端鉴定肽的融合蛋白,所述肽赋予期望的特性,如稳定或简化纯化所表达重组产物。通过插入本发明的多核苷酸以及合适的翻译起始和终止信号,任选地与可操作阅读形式的功能性启动子,从而构建可用于细菌的表达载体。载体将包含一或多种表型选择标记和复制起点,以确保载体维持,当期望时提供宿主内扩增。适用于转化的原核宿主包括大肠杆菌、枯草杆菌、鼠伤寒沙门氏菌和假单孢菌属、链霉菌属和葡萄球菌属的多种物种,尽管其它物种也可以作为选择。
作为代表性但非限制性的实例,可用于细菌的表达载体可以包含选择标记和细菌复制起点,它们来源于商品化质粒,其中包含公知克隆载体pBR322(ATCC 37017)的遗传元件。这些商品化载体例如包括pKK223-3(Pharmacia Fine Chemical,Uppsala,Sweden)和pGEM1(Promega,Madison,Wisconsin,USA)。
本发明提供含有本发明多核苷酸的基因工程化宿主细胞。例如,这样的宿主细胞可以含有用已知转化、转染或感染方法导入宿主细胞的本发明核酸。本发明还提供表达本发明多核苷酸的基因工程化宿主细胞,其中这些多核苷酸与和宿主细胞异源的调节序列可操作连接,所述调节序列驱动所述多核苷酸在细胞中表达。
本发明还提供含有本发明载体的宿主细胞,其中所述核酸已经用已知转化、转染或感染方法导入宿主细胞中。宿主细胞可以是真核宿主细胞,如哺乳动物细胞、低等真核宿主细胞如酵母细胞,或者宿主细胞可以是原核细胞,如细菌细胞。例如,通过磷酸钙转染、DEAE、葡聚糖介导的转染或电穿孔可以实现重组构建体向宿主细胞的导入(Davis,L.et al.,Basic Methods in Molecular Biology(1986))。也可以利用无细胞翻译系统用来源于本发明的DNA构建体的RNA来产生这些蛋白质。
可用任何宿主/载体系统表达表2列出的一种或多种蛋白质。用于原核和真核宿主的适当克隆和表达载体描述于Sambrook et al.,in Molecular CloningA LaboratoryManual,Second Edition,Cold Spring Harbor,New York(1989),其全部公开内容经引用并入本文。最优选的宿主细胞是正常不表达特定多肽或低天然水平表达所述多肽的细胞。
在一个具体实施方案中,宿主细胞被工程化以在诱导型调节元件控制下表达包含本发明多核苷酸的内源基因,该情况下所述内源基因的调节元件可以通过同源重组而置换。如本文所述,基因打靶可用于将基因的已存在调节区替换为从不同基因分离的调节序列或经基因工程方法合成的新调节序列。这些调节序列可以包含启动子、增强子、骨架附着区、负调节元件、转录起始位点、调节性蛋白质结合位点或所述序列的组合。作为替代方案,影响所生成RNA或蛋白质的结构或稳定性的序列可以被替换、去除、添加或经靶向修饰,包括多聚腺苷酸化信号、mRNA稳定性元件、剪接位点、增强或修饰蛋白质转运或分泌性质的前导序列,或者改变或提高蛋白质或RNA分子的功能或稳定性的其它序列。
本发明的宿主还可以是酵母或其它真菌。在酵母中,可以使用含组成型或诱导型启动子的多种载体。综述请见Ausubel et al.(eds),Current Protocols in MolecularBiology,Vol.2,Greene Publish.Assoc.& Wiley Interscience,Ch.13(1988);Grant etal.,1987,″Expression and Secretion Vectors for Yeast″,Methods Enzymol.153516-544;Glover,DNA Cloning,Vol.II,IRL Press,Wash.,D.C.,Ch.3(1986);Bitter,1987,″Heterologous Gene Expression in Yeast″,Methods Enzymol.152673-684;和Strathern et al.(eds),The Molecular Biology of the YeastSaccharomyces,Cold Spring Harbor Press,Vols.I and II(1982)。
潜在适用的酵母菌株包括酿酒酵母、粟酒裂殖酵母、克鲁维酵母菌株、念珠菌或能表达异源蛋白质的任何酵母菌株。潜在适用的细菌株包括大肠杆菌、肠杆菌科如粘质沙雷氏菌、芽孢杆菌如枯草杆菌、鼠伤寒沙门氏菌、假单孢菌或能表达异源蛋白质的任何细菌株。如果在酵母或细菌中生产蛋白质,可能有必要修饰产生的蛋白质,例如通过磷酸化或糖基化适当的位点,以获得功能性蛋白质。这些共价连接可以用已知化学或酶方法实现。
也可以用多种哺乳动物细胞培养系统表达重组蛋白质。哺乳动物表达系统的实例包括猴COS细胞如描述于Gluzman,1981,Cell 23175(1981)的COS-7猴肾成纤维细胞系、中国仓鼠卵巢(CHO)细胞、人肾293细胞、人上皮A431细胞、人Colo205细胞、3T3细胞、CV-1细胞、正常二倍体细胞、来源于原代组织体外培养的细胞株,原代外植体、HeLa细胞、小鼠L细胞、BHK、HL-60、U937、HaK、C127、3T3或Jurkat细胞,以及能表达兼容性载体的其它细胞系。哺乳动物表达载体将包含复制起点、合适的启动子以及任何必要的核糖体结合位点、多聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’旁侧非转录序列。
用于表达蛋白质的微生物细胞可以用任何方便的方法破碎,包括反复冻融、超声、机械破碎或使用细胞裂解剂。通常通过从细胞沉淀中初步提取和随后一或多步的盐析、水性离子交换或体积排阻层析步骤,从而分离细菌培养物产生的重组多肽。在一些实施方案中,模板核酸还编码多肽标签,如五或六组氨酸。
可以用本领域公知技术分离重组蛋白质。例如,Scopes(Protein PurificationPrinciples and Practice,Springer-Verlag,New York(1994))提供了多种纯化重组(和非重组)蛋白质的一般性方法。这些方法例如包括离子交换层析、体积排阻层析、亲合层析、选择性沉淀、透析和疏水相互作用层析。
不偏离本发明的实质和范围,本领域技术人员将可以进行本文所述内容的变化、改进和其它实现方式。
为了所述本发明可以更全面理解,给出以下实施例。应该理解,这些实施例仅用于示例性目的,而不应认为以任何方式限制本发明。
5.13鉴定用于预防、治疗、控制或改善肝癌或其症状的化合物的方法5.13.1鉴定调节生物标志物的表达或活性的化合物的方法本发明提供鉴定结合到本发明生物标志物的产物上的化合物的方法。本发明还提供鉴定调节本发明生物标志物的产物的表达和/或活性的化合物的方法。通过这些方法鉴定的化合物可用于建立研究肝癌的一种或多种动物模型。而且,通过这些方法鉴定的化合物可作为先导化合物用于开发预防、治疗、控制和/或改善肝癌或其症状的预防和治疗性组合物。这些方法特别有用,因为它们使得体内测试潜在预防剂和治疗剂相关的努力和支出高效率地集中于经本文所述体外和离体方法鉴定的化合物上。
本发明提供鉴定待测试化合物的预防、治疗、控制或改善肝癌或其症状的能力的方法,所述方法包括(a)使表达本发明一种或多种生物标志物的蛋白质产物或其片段或者本发明一种或多种生物标志物的RNA产物或其片段的细胞与测试化合物接触;和(b)确定测试化合物结合蛋白质产物、蛋白质片段、RNA产物或RNA部分的能力,使得如果化合物结合到所述蛋白质产物、蛋白质片段、RNA产物、RNA部分上,则鉴定到待测试化合物具有预防、治疗、控制或改善肝癌或其症状的能力。例如,所述细胞可以是酵母细胞或哺乳动物来源的细胞。例如,通过将测试化合物与放射性同位素或酶标记物偶联,使得可以通过检测复合物中的标记化合物来确定测试化合物与蛋白质产物、蛋白质片段、RNA产物或RNA部分的结合,从而可以确定测试化合物结合蛋白质产物、蛋白质片段、RNA产物或RNA部分的能力。例如,测试化合物可以用125I、35S、14C或3H直接或间接标记,通过直接计数放射活性或通过闪烁计数来检测放射性同位素。作为替代方案,可以用酶标记测试化合物,例如用辣根过氧化物酶、碱性磷酸酶或荧光素酶标记,并通过确定适当底物向产物的转化来检测酶标记物。在一个具体实施方案中,测试包括使表达本发明的一或多种生物标志物的蛋白质产物或其片段或者本发明的一或多种生物标志物的RNA产物或其部分的细胞与结合所述蛋白质产物、蛋白质片段、RNA产物或RNA部分的已知化合物接触,以形成测试混合物,将测试混合物与测试化合物接触,并确定测试化合物与所述蛋白质产物、蛋白质片段、RNA产物或RNA部分相互作用的能力,其中确定测试化合物与所述蛋白质产物、蛋白质片段、RNA产物或RNA部分相互作用的能力包括确定测试化合物与所述已知化合物相比优先结合到所述蛋白质产物、蛋白质片段、RNA产物或RNA部分上的能力。
本发明提供鉴定待测化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,所述方法包括(a)使本发明一种或多种生物标志物的蛋白质产物或其片段、或者本发明一种或多种生物标志物的RNA产物或其部分与测试化合物接触;和(b)确定测试化合物结合蛋白质产物、蛋白质片段、RNA产物或RNA部分的能力,使得如果化合物结合到所述蛋白质产物、蛋白质片段、RNA产物或RNA部分上,则鉴定到待测试化合物具有预防、治疗、控制或改善肝癌或其症状的能力。可以直接或间接确定测试化合物与蛋白质产物或蛋白质片段的结合。在一个具体实施方案中,测试包括使本发明的一或多种生物标志物的蛋白质产物或其片段或者本发明的一或多种生物标志物的RNA产物或其部分与结合所述蛋白质产物、蛋白质片段、RNA产物或RNA部分的已知化合物接触,以形成测试混合物,将测试混合物与测试化合物接触,并确定测试化合物与所述蛋白质产物、蛋白质片段、RNA产物或RNA部分相互作用的能力,其中确定测试化合物与所述蛋白质产物、蛋白质片段、RNA产物或RNA部分相互作用的能力包括确定测试化合物与所述已知化合物相比优先结合到所述蛋白质产物、蛋白质片段、RNA产物或RNA部分上的能力。可使用本领域公知技术确定测试化合物与本发明的生物标志物的蛋白质产物或其片段或者本发明的生物标志物的RNA产物或其部分之间的结合。
在本发明以上测试方法的一些实施方案中,可能希望固定本发明的生物标志物的RNA产物或其部分或者其靶分子,以促进复合形式与未复合形式的RNA产物或RNA部分、靶分子或二者的分离,并容许测试自动化。在本发明的以上测试方法的超过一种实施方案中,可能希望固定本发明的生物标志物的蛋白质产物或其片段或者其靶分子,以促进复合形式与未复合形式的一种或全部两种蛋白质的分离,并容许测试自动化。可以在适于含有反应物的任何容器中进行测试化合物与本发明生物标志物的蛋白质产物或其片段的结合。这种容器的实例包括微滴定板、试管和微离心管。在一个实施方案中,可以提供融合蛋白质,其中增加一个结构域,允许一种或全部两种蛋白质与基质结合。例如,谷胱甘肽-S-转移酶(GST)融合蛋白可以吸附到谷胱甘肽Sepharose珠(Sigma Chemical;St.Louis,MO)或谷胱甘肽衍生化的微滴定板上,然后与测试化合物或者测试化合物与非吸附的靶蛋白或者本发明生物标志物的蛋白质产物或其片段组合,并将混合物在有益于形成复合物的条件下(如生理盐和pH条件)孵育。孵育以后,洗涤珠子或微滴定板孔以去除任何未结合成分,并例如上述直接或间接测定复合物的形成。作为替代方案,复合物可以从基质解离,并可以用标准技术确定本发明生物标志物的蛋白质产物或其片段的结合水平。
固定蛋白质到基质上的其它技术也可以用于本发明的筛选测试中。例如,本发明生物标志物的蛋白质产物或其片段或者靶分子可以用生物素和亲合素的偶联被固定化。可以用本领域公知的技术(如生物素化试剂盒,Pierce Chemicals;Rockford,IL)从生物素-NHS(N-羟基琥珀酰亚胺)制备生物素化的本发明生物标志物的蛋白质产物或靶分子,并固定化到链亲和素包被的96孔板(Pierce Chemical)的孔中。作为替代方案,可以将与本发明生物标志物的蛋白质产物或其片段反应的抗体衍生化到板孔中,蛋白质通过抗体偶联被捕获到孔中。除了对于GST固定化复合体所述的以外,检测这些复合物的方法还包括用可与本发明生物标志物的蛋白质产物反应的抗体免疫检测复合物,以及依赖于检测与本发明生物标志物的蛋白质产物或其片段或靶分子相关的酶活性的酶联测试。
本发明生物标志物的蛋白质产物或其片段与测试化合物的相互作用或结合也可以用这些蛋白质或蛋白质片段作为“诱饵蛋白”在双杂交测试或三杂交测试中进行确定(例如见美国专利号5,283,317;Zervos et al.(1993)Cell 72223-232;Madura et al.(1993)J.Biol.Chem.26812046-12054;Bartel et al.(1993)Bio/Techniques 14920-924;Iwabuchi et al.(1993)Oncogene 81693-1696;和国际公开No.WO 94/10300)。
本发明提供鉴定待测化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,所述方法包括(a)使表达本发明一种或多种生物标志物的蛋白质或RNA产物的细胞与测试化合物接触;(b)确定(a)中存在的蛋白质或RNA产物的量;和(c)将(a)中的量和未与测试化合物接触的对应对照细胞中的存在量比较,使得如果蛋白质或RNA产物的量相对于对照中的量发生变化,则鉴定到待测化合物具有预防、治疗、控制或改善肝癌或其症状的能力。在一个具体实施方案中,用本文所述测试(如微阵列或RT-PCR)或本领域技术人员公知的测试确定表达水平相对于对照中的表达水平改变了5%、10%、15%、25%、30%、40%、50%、5-25%、10-30%、至少1倍、至少1.5倍、至少2倍、4倍、5倍、10倍、25倍、1-10倍或5-25倍。在替代性实施方案中,这种方法包括确定细胞中存在的本发明生物标志物中至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、1-5种、1-10种、5-10种、5-25种、全部或任意组合的蛋白质或RNA产物的量,以及比较对照中存在的那些的量。
用于本文所述基于细胞的测试的细胞可以用本领域已知技术被工程化,以表达本发明的生物标志物。例如见美国专利号6,245,527中标题为“重组表达载体和宿主细胞”的第三节,其内容经引用并入本文。作为替代方案,可以使用内源性表达本发明生物标志物的细胞。例如,可以使用肝癌细胞。
在一个具体实施方案中,肝癌细胞分离自“正常”个体或患有肝癌的个体,并在存在和缺少测试化合物的条件下孵育不同时间(即30分钟、1小时、5小时、24小时、48小时和96小时)。筛选预防或治疗剂时,本发明生物标志物的全序列或其功能部分的克隆被用于转染肝癌细胞。转染的肝癌细胞在存在和缺少测试化合物的条件下培养不同时间(即1、2、3、5、7、10或14天)。孵育以后,从肝癌细胞制备靶核酸样品并与对应肝癌中差异表达的核酸序列的核酸探针杂交。根据本领域公知方法和本文所述标记核酸探针,例如使用放射性标记物标记。通过Northern印迹进行杂交,例如同上Ausubel et al或同上Sambrook et al中所述。如本文定义,相对于来自肝癌的RNA,靶与来自正常的阵列上的样品的差异杂交指示对应于差异表达的特异性核酸序列的RNA表达水平。存在测试化合物下的孵育步骤导致靶序列表达水平的改变,指示为增加或降低相应的肝癌生物标志物特异性核酸序列表达的化合物。
本发明还提供鉴定待测化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,所述方法包括(a)使无细胞提取物(如肝细胞提取物)与编码本发明一种或多种生物标志物的蛋白质或RNA产物的核酸序列以及测试化合物接触;(b)确定(a)中存在的蛋白质或RNA产物的量;和(c)将(a)中的量和未与测试化合物接触的相应对照中存在的量进行比较,使得如果蛋白质或RNA产物的量相对于对照中的量发生变化,则鉴定到待测化合物具有预防、治疗、控制或改善肝癌或其症状的能力。在一个具体实施方案中,用本文所述测试(如微阵列或RT-PCR)或本领域技术人员公知的测试确定表达水平相对于对照中的表达水平改变了5%、10%、15%、25%、30%、40%、50%、5-25%、10-30%、至少1倍、至少1.5倍、至少2倍、4倍、5倍、10倍、25倍、1-10倍或5-25倍。在替代性实施方案中,这种方法包括确定提取物中存在的本发明生物标志物中至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种、至少30种、至少35种、至少40种、至少45种、至少50种、1-5种、1-10种、5-10种、5-25种或10-25种、全部或任意组合的蛋白质或RNA产物的量,以及比较对照中存在的那些的量。
在某些实施方案中,确定本发明生物标志物的RNA产物的量,在另一些实施方案中,确定本发明生物标志物的蛋白质产物的量,而在又一些实施方案中,确定本发明生物标志物的RNA和蛋白质产物的量。可以使用确定本发明生物标志物的RNA或蛋白质产物的量的标准方法和组合物。这样的方法和组合物在以上已详细描述。
在具体实施方案中,在本文所述筛选测试中,用试剂盒确定本发明生物标志物的RNA或蛋白质产物的量。这样的试剂盒包含测定至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、全部或任意组合的本发明生物标志物的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个或更多个蛋白质或RNA产物表达需要的材料和试剂。在具体实施方案中,试剂盒还可以包含用于所述多种方法的一或多种附加的试剂,如(1)从血、肝癌细胞纯化RNA的试剂;(2)产生测试核酸的引物;(3)dNTP和/或rNTP(预混的或分离的),任选具有一或多种独特标记的dNTP和/或rNTP(如生物素化或Cy3或Cy5标记的dNTP);(4)合成后标记实际,如荧光染料的化学活性衍生物;(5)酶,如逆转录酶、DNA聚合酶等;(6)多种缓冲介质,如杂交和洗涤缓冲液;(7)标记探针纯化试剂和成分,如离心柱等;和(8)蛋白质纯化试剂;(9)信号产生和检测试剂,如链亲合素-碱性磷酸酶偶联物、化学荧光或化学发光底物等。在具体实施方案中,试剂盒包含预标记的质量控制的蛋白质和/或RNA转录本(优选mRNA)用作对照。
在一些实施方案中,试剂盒是RT-PCR试剂盒。在另一些实施方案中,试剂盒是核酸阵列和蛋白质阵列。根据本发明的这些试剂盒将至少包含具有本发明的相关蛋白质或核酸成员的阵列及其包装物。作为替代方案,本发明的蛋白质或核酸成员可以预包装到阵列上。
在具体实施方案中,测定本发明生物标志物的RNA产物的试剂盒包含测定RNA产物表达必需的材料和试剂。例如可以使用微阵列或RT-PCR试剂盒,其仅含有测定至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、全部或任意组合的本发明生物标志物的RNA产物水平所必需的试剂和材料。或者,在一些实施方案中,试剂盒可以包含不限于测定1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、全部或任意组合的本发明生物标志物的RNA产物水平所必需的材料和试剂。例如,除了测定至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个或更多个本发明生物标志物以外的基因的RNA产物水平所必需的材料和试剂以外,微阵列试剂盒可以含有测定1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、全部或任意组合的本发明生物标志物的RNA产物水平所必需的材料和试剂。在一个具体实施方案中,微阵列或RT-PCR试剂盒含有测定至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、全部或任意组合的本发明生物标志物、和1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450个或更多个不是本发明生物标志物的基因、或1-10、1-100、1-150、1-200、1-300、1-400、1-500、1-1000、25-100、25-200、25-300、25-400、25-500、25-1000、100-150、100-200、100-300、100-400、100-500、100-1000或500-1000个不是本发明生物标志物的基因的RNA产物水平所必需的材料和试剂,对于核酸微阵列试剂盒,试剂盒一般包含附着到固相支持物表面的探针。可用可检测标记物标记探针。在一个具体实施方案中,探针特异性针对1、2、3、4、5、6、7、8、9、10、15、20、25个、全部或任意组合的本发明生物标志物的5’区、3’区、内部编码区、外显子、内含子、外显子连接处或外显子-内含子连接处。微阵列试剂盒可以包含实施测试和方法的说明书,以解释和分析实施测试所得的数据。试剂盒还可以包含杂交试剂和/或检测探针与靶核酸序列杂交时产生的信号所必需的试剂。一般来说,微阵列试剂盒的材料和试剂在一个或多个容器中。试剂盒的每种组分一般在各自的合适容器中。
对于RT-PCR试剂盒,试剂盒一般包含预选的引物,它们特异性针对1、2、3、4、5、6、7、8、9、10、15、20、25个、全部或任意组合的本发明生物标志物的特定RNA产物(如外显子、内含子、外显子连接处、或外显子-内含子连接处)。RT-PCR试剂盒还可以包含适于逆转录和/或扩增核酸的酶(如聚合酶,诸如Taq),和进行逆转录反应与扩增的反应混合物所需要的脱氧核苷酸和缓冲液。RT-PCR试剂盒还可以包含特异性针对1、2、3、4、5、6、7、8、9、10、15、20、25个、全部或任意组合的本发明生物标志物的探针。所述探针可以标记或不标记可检测标记物(如荧光标记物)。RT-PCR试剂盒的每种组分一般在各自的合适容器中。因此,这些试剂盒一般包含适于每种试剂、酶、引物和探针的不同容器。而且,RT-PCR试剂盒可以包含实施测试和方法的说明书,用于解释和分析实施测试所得的数据。
对于基于抗体的试剂盒,试剂盒例如可以包含(1)第一抗体(可以与固相支持物连接或不连接),它结合感兴趣蛋白质(如1、2、3、4、5、6、7、8、9、10、15、20、25个、全部或任意组合的本发明生物标志物的蛋白质产物);和任选地,(2)不同的第二种抗体,它结合所述蛋白质或第一抗体,并与可检测标记物(如荧光标记物、放射性同位素或酶)偶联。基于抗体的试剂盒还可以包含进行免疫沉淀的珠子。基于抗体的试剂盒的每种组分一般在各自的合适容器中。因此,这些试剂盒一般包含适于每种抗体的不同容器。而且,基于抗体的试剂盒可以包含实施测试和方法的说明书,用于解释和分析实施测试所得的数据。
还可以进行基于报告基因的测试以鉴定待测试化合物预防、治疗、控制或改善肝癌或其症状的能力。在一个具体实施方案中,本发明提供鉴定待测试化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,所述方法包括(a)使化合物与表达报告基因构建体的细胞接触,所述报告基因构建体包含与本发明生物标志物的调节元件(如启动子/增强子元件)可操作连接的报告基因;(b)测定所述报告基因的表达;和(c)将(a)中的量和未与测试化合物接触的对应对照细胞中的存在量比较,使得如果报告基因表达量相对于对照中的量发生变化,则鉴定到待测化合物具有预防、治疗、控制或改善肝癌或其症状的能力。根据这种实施方案,所述细胞可以天然表达所述生物标志物或被工程化表达所述生物标志物。在另一个实施方案中,本发明提供鉴定待测试化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,所述方法包括(a)使化合物与无细胞提取物和报告基因构建体接触,所述报告基因构建体包含与本发明生物标志物的调节元件(如启动子/增强子元件)可操作连接的报告基因;(b)测定所述报告基因的表达;和(c)将(a)中的量和未与测试化合物接触的对应对照中的存在量比较,使得如果报告基因表达量相对于对照中的量发生变化,则鉴定到待测化合物具有预防、治疗、控制或改善肝癌或其症状的能力。
本领域技术人员公知的任何报告基因可以用于根据本发明方法使用的报告基因构建体中。报告基因表示编码通过其存在(如通过RT-PCR、Northern印迹、Western印迹、ELISA等)或活性而容易检测的RNA转录本或蛋白质的核苷酸序列。报告基因的非限制性实例列于下表6。通过本领域技术人员公知的任何方法可以获得报告基因并确定所述元件的核苷酸序列。报告基因的核苷酸序列例如可以从文献或数据库如GenBank中获得。作为替代方案,编码报告基因的多核苷酸可以从合适来源的核酸产生。如果含编码特定报告基因的核酸的克隆不可获得,但所述报告基因的序列已知,编码所述报告基因的核酸可以化学合成或经PCR从合适来源(如cDNA文库、或从中产生的cDNA文库、或核酸,优选优选polyA+RNA,分离自表达所述报告基因的任何组织或细胞)获得。一旦确定报告基因的核苷酸序列,可以用操作核苷酸序列的本领域公知方法,如重组DNA技术、定点突变、PCR等(例如见以下描述的技术Sambrook et al.,1990,Molecular Cloning,A Laboratory Manual,2d Ed.,ColdSpring Harbor Laboratory,Cold Spring Harbor,NY和Ausubel et al.,eds.,1998,Current Protocols in Molecular Biology,John Wiley & Sons,NY,二者的全部内容经引用并入本文)操作所述报告基因的核苷酸序列,以产生具有不同氨基酸序列的报告基因,例如创建氨基酸替换、缺失和/或插入。
表6报告基因和报告基因产物的性质
根据本发明,天然或正常表达一或多种、全部或任意组合的本发明生物标志物的细胞可用于本文所述的方法。作为替代方案,可以用本领域公知的技术和用于本文所述方法的技术将细胞工程化以表达一或多种、全部或任意组合的本发明生物标志物或报告基因。这些技术的实例包括但不限于磷酸钙沉淀(例如见Graham & Van derEb,1978,Virol.52546)、葡聚糖介导的转染、磷酸钙介导的转染、polybrene介导的转染、原生质体融合、电穿孔、核酸包裹于脂质体中和直接将核酸微注射到核中。
在一个具体实施方案中,用于本文所述方法的细胞是肝癌细胞或细胞系、淋巴细胞(T或B细胞)、单核细胞、嗜中性粒细胞、巨噬细胞、嗜酸性粒细胞、嗜碱性粒细胞、红细胞或血小板。在一个优选实施方案中,用于本文所述方法的细胞是肝癌细胞。在一个优选实施方案中,用于本文所述方法的细胞是淋巴细胞。在另一个优选实施方案中,用于本文所述方法的细胞是永生化细胞系,例如来源于组织。
根据本发明所述方法可以使用允许核酸的翻译和任选但优选转录的任何无细胞提取物。所述无细胞提取物可以从任何物种来源的细胞分离。例如,无细胞提取物可以分离自人细胞、培养小鼠细胞、培养大鼠细胞、中国仓鼠卵巢(CHO)细胞、爪蟾卵母细胞、兔网织红细胞、小麦胚或黑麦胚(例如见Krieg & Melton,1984,Nature308203和Dignam et al.,1990 Methods Enzymol.182194-203)。作为替代方案,无细胞提取物,例如兔网织红细胞和小麦胚提取物,可以购自例如Promega(Madison,WI)。在一个优选实施方案中,无细胞提取物是分离自人细胞的提取物。在一个具体实施方案中,所述人细胞是HeLa细胞、淋巴细胞或肝癌细胞或细胞系。
除了调节本发明生物标志物的RNA和/或蛋白质产物表达水平的能力以外,至少在某些情况下,可以期望化合物调节本发明生物标志物的蛋白质产物的活性。因此,本发明提供鉴定待测试化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,其包括鉴定调节本发明一种或多种生物标志物的蛋白质产物活性的化合物的方法。这样的方法包括(a)使表达本发明一种或多种生物标志物的蛋白质产物的细胞与测试化合物接触;(b)确定所述蛋白质产物的活性水平;和(c)将活性水平和未与测试化合物接触的对应对照细胞中的相比较,使得如果(a)中的活性水平相对于对照中的活性水平发生变化,则鉴定到待测化合物具有预防、治疗、控制或改善肝癌或其症状的能力。在一个具体实施方案中,用本文所述测试(如微阵列或RT-PCR)或本领域技术人员公知的测试确定活性水平相对于对照中的活性水平改变了5%、10%、15%、25%、30%、40%、50%、5-25%、10-30%、至少1倍、至少1.5倍、至少2倍、4倍、5倍、10倍、25倍、1-10倍或5-25倍。在替代性实施方案中,这种方法包括确定细胞中存在的至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、1-5种、1-10种、5-10种、5-25种或10-40种、全部或任意组合的本发明生物标志物的蛋白质产物的活性水平,以及与对照中存在的活性水平进行比较。
本发明提供鉴定待测试化合物预防、治疗、控制或改善肝癌或其症状的能力的方法,其中包括鉴定调节本发明一种或多种生物标志物的蛋白质产物活性的化合物的方法。这样的方法包括(a)使无细胞提取物与编码本发明一种或多种生物标志物的蛋白质产物的核酸以及测试化合物接触;(b)确定所述蛋白质产物的活性水平;和(c)将活性水平和未与测试化合物接触的对应对照中的相比较,使得如果(a)中的活性水平相对于对照中的活性水平发生变化,则鉴定到待测化合物具有预防、治疗、控制或改善肝癌或其症状的能力。在一个具体实施方案中,用本文所述测试(如微阵列或RT-PCR)或本领域技术人员公知的测试确定活性水平相对于对照中的活性水平改变了5%、10%、15%、25%、30%、40%、50%、5-25%、10-30%、至少1倍、至少1.5倍、至少2倍、4倍、5倍、10倍、25倍、1-10倍或5-25倍。在替代性实施方案中,这种方法包括确定样品中存在的至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种、至少30种、至少35种、至少40种、至少45种、至少50种、1-5种、1-10种、5-10种、5-25种或10-40种、全部或任意组合的本发明生物标志物的蛋白质产物的活性水平,以及与对照中存在的活性水平进行比较。
可用标准技术确定本发明生物标志物的蛋白质产物的活性水平。本发明生物标志物的蛋白质产物的活性可以用本领域公知技术确定。
5.13.2利用化合物的生物活性的方法为了鉴定待测试化合物预防、治疗、控制或改善肝癌或其症状的能力(为方便起见,本文中称为“先导”化合物),可以进一步研究所述化合物。例如,经本发明方法鉴定的化合物可以进一步在认可的肝癌动物模型中进行体内测试。而且,可以分析经所述方法鉴定的化合物的特异性。这些另外的化合物研究技术对本领域技术人员是公知的。
在一个实施方案中,可以通过测定靶细胞的细胞生长或活力来评价先导化合物的作用。可以用肝癌中涉及的细胞类型的代表性细胞(如肝癌细胞)进行这样的测试。作为替代方案,可以用细胞系的细胞代替培养的患者细胞来筛选先导化合物。
可以用本领域公知的很多测试来评价暴露于先导化合物以后患者细胞或细胞系的存活和/或生长;例如,细胞增殖的测定可以通过测定溴脱氧尿嘧啶(BrdU)掺入(例如见Hoshino et al.,1986,Int.J.Cancer 38,369;Campana et al.,1988,J.Immunol.Meth.10779)或(3H)-胸腺嘧啶掺入(例如见Chen,J.,1996,Oncogene131395-403;Jeoung,J.,1995,J.Biol.Chem.27018367-73),通过直接细胞计数,通过检测已知基因如原癌基因(如fos、myc)或细胞周期标志物(Rb、cdc2、细胞周期蛋白A、D1、D2、D3、E等)转录、翻译或活性改变。这种蛋白质和RNA(如mRNA)和活性的水平可以用本领域公知的任何方法确定。例如可以用已知的免疫诊断方法如Western印迹或免疫沉淀用商品抗体定量蛋白质。可以用本领域公知和常用的方法例如用Northern分析、RNase保护、逆转录结合聚合酶链式反应来定量mRNA。可以用台盼蓝染色或本领域已知的其它细胞死亡或活力标志物评价细胞活力。在一个具体实施方案中,测定细胞ATP的水平以确定细胞活力。例如可以通过基于形态学改变的观察评价分化。
5.13.3动物模型化合物在用于人之前可以在合适的动物模型系统中加以测试。这些动物模型系统包括但不限于大鼠、小鼠、鸡、牛、猴、猪、狗、兔等。可以使用本领域公知的任何动物系统。在某些实施方案中,在小鼠模型中测试化合物。可以重复给予化合物。
可以用公认的动物模型确定经上述方法鉴定到的化合物预防、治疗、控制和/或改善肝癌或其症状的效果。
5.13.4毒性可以通过标准药学方法在细胞培养物或试验动物中确定根据本发明鉴定到的化合物的毒性和/或效果,例如确定LD50(群体中50%致死的剂量)和ED50(群体中50%有治疗效果的剂量)。可以用于评价根据本发明鉴定到的化合物的细胞毒性的细胞和细胞系包括但不限于外周血单核细胞(PBMC)、Caco-2细胞和Huh7细胞。毒性和治疗作用之间的剂量比是治疗指数,它可以表示为LD50/ED50的比。优选根据本发明鉴定的表现大治疗指数的化合物。虽然可以使用根据本发明鉴定的表现毒副作用的化合物,应该仔细设计递送系统,使这些药剂靶向受影响组织的部位,以最小化对未感染细胞的潜在破坏并因而降低副作用。
从细胞培养测试和动物研究中获得的数据可以用于配制根据本发明鉴定的化合物用于人时的剂量范围。这些药剂的给药剂量优选处于包括ED50而有很少或没有毒性的循环浓度范围内。根据所用剂量形式和给药途径可以在此范围内改变给药剂量。对于任何用于本发明方法的药剂,可以从细胞培养测试初步估计治疗有效剂量。剂量可以配制成在动物模型中达到循环血浆浓度范围,包括细胞培养确定的IC50(即达到症状最大抑制作用一半的化合物浓度)。这些信息可以用于更精确的确定用于人的剂量。例如通过高效液相层析可以测定血浆水平。
5.13.5同源物或类似物设计显示期望生物活性的化合物可以用作先导化合物,以开发或设计具有有用药理活性的同源物或类似物。例如,一旦鉴定到先导化合物,就可以用分子建模技术设计该化合物的可能更有效的变体。分子建模系统的实例是CHARM和QUANTA程序(Polygen Corporation,Waltham,MA)。CHARM执行能量最小化和分子动力学函数。QUANTA执行构建、图形建模和分子结构分析。QUANTA允许构建、修饰、显示和分析分子间的行为。
很多论文评论了与特异性蛋白质相互作用的药物计算机建模,如Rotivinen et al.,1988,Acta Pharmaceutical Fennica 97159-166;Ripka,1998,New Scientist 54-57;McKinaly & Rossmann,1989,Annu.Rev.Pharmaeol.Toxiciol.29111-122;Perry &Davies,OSARQuantitative Structure-Activity Relationships in Drug Design pp.189-193(Alan R.Liss,Inc.1989);Lewis & Dean,1989,Proc.R.Soc.Lond.236125-140 and 141-162;Askew et al.,1989,J.Am.Chem.Soc.1111082-1090。筛选和图形描述化学物的其它计算机程序可以从一些公司获得,如BioDesign公司(Pasadena,California)、Allelix公司(Mississauga,Ontario,Canada)和Hypercube公司(Cambridge,Ontario)。尽管这些主要设计用于特异性针对特定蛋白质的药物,可以修改它们用于设计特异性针对任何鉴定区域的药物。可以用上述生物活性的筛选测试类似物和同源物与感兴趣蛋白质(即本发明生物标志物的蛋白质产物)的结合。作为替代方案,筛选中确认的具有很少或没有生物活性的先导化合物也可以用于设计化合物的具有生物活性的类似物和同源物。
5.13.6化合物可以用本文所述方法测试和鉴定的化合物可以包括但不限于从任何商业来源获得的化合物,包括Aldrich(1001 West St.Paul Ave.,Milwaukee,WI 53233),SigmaChemical(P.O.Box 14508,St.Louis,MO 63178),Fluka Chemie AG(Industriestrasse25,CH-9471 Buchs,Switzerland(Fluka Chemical Corp.980 South 2nd Street,Ronkonkoma,NY 11779)),Eastman Chemical Company,Fine Chemicals(P.O.Box431,Kingsport,TN 37662),Boehringer Mannheim GmbH(Sandhofer Strasse 116,D-68298 Mannheim),Takasago(4 Volvo Drive,Rockleigh,NJ 07647),SSTCorporation(635 Brighton Road,Clifton,NJ 07012),Ferro(111 West Irene Road,Zachary,LA 70791),Riedel-deHaen Aktiengesellschaft(P.O.Box D-30918,Seelze,Germany),PPG Industries Inc.,Fine Chemicals(One PPG Place,34th Floor,Pittsburgh,PA 15272)。而且,用本发明方法可以筛选任何类型的天然产物,包括微生物、真菌、植物或动物提取物。
可以筛选来自大的合成或天然化合物库的化合物。当前有很多手段可用于随机和直接合成基于糖、肽和核酸的化合物。合成化合物库可以从很多公司商业获得,包括Maybridge Chemical Co.(Trevillet,Cornwall,UK)、Comgenex(Princeton,NJ)、Brandon Associates(Merrimack,NH)和Microsource(New Milford,CT)。稀有化学物库可以从Aldrich(Milwaukee,WI)获得。可以获得也可以制备组合化学库。作为替代方案,细菌、真菌、植物和动物提取物形式的天然化合物库例如可以从PanLaboratories(Bothell,WA)或MycoSearch(NC)获得,或者容易用本领域公知的方法可重现地制备。此外,容易通过常规化学、物理和生化手段修饰天然和合成制备的库和化合物。
另外,可以利用包括小分子测试化合物的测试化合物的多样性库。用本发明方法筛选的库可以包含多种类型的化合物。可以根据本发明方法筛选的库的实例包括但不限于类肽;随机生物寡聚物;diversomers,如乙内酰脲、苯二氮和二肽;插烯(vinylogous)多肽;非肽的肽模拟物;寡聚氨基甲酸酯;肽膦酸酯;肽核酸库;抗体库;糖库;和小分子库(优选小有机分子库)。在一些实施方案中,筛选库中的化合物是核酸或肽分子。在非限制性的实例中,肽分子可以存在于噬菌体展示文库中。在另一些实施方案中,化合物的类型包括但不限于肽类似物,包括含非天然氨基酸如D-氨基酸的肽,氨基酸的磷类似物如α-氨基磷酸和α-氨基磷酸,或具有非肽键的氨基酸,核酸类似物如硫代磷酸酯和PNA,激素,抗原,合成或天然药物,阿片,多巴胺,血清素,儿茶酚胺,凝血酶,乙酰胆碱,前列腺素,有机分子,信息素,腺苷,蔗糖,葡萄糖,乳糖和半乳糖。多肽或蛋白质的库也可以用于本发明测试中。
在一个具体实施方案中,组合化学库是小有机分子库,包括但不限于苯二氮类、类异戊二烯、噻唑烷酮、metathiazanones、吡咯烷酮类、吗啉代化合物和苯二氮类。在另一个实施方案中,组合化学库包含类肽;随机生物寡聚物;苯二氮类;diversomers如乙内酰脲、苯二氮类和二肽;插烯(vinylogous)多肽;非肽的肽模拟物;寡聚氨基甲酸酯;肽膦酸酯;肽核酸库;抗体库;或糖库。组合化学库自身是可以商业获得的。例如库可以从以下商业途径获得例如Specs and BioSpecs B.V.(Rijswijk,The Netherlands),Chembridge Corporation(San Diego,CA),ContractService Company(Dolgoprudny,Moscow Region,Russia),Comgenex USA Inc.(Princeton,NJ),Maybridge Chemicals Ltd.(Cornwall PL34 OHW,United Kingdom),Asinex(Moscow,Russia),ComGenex(Princeton,New Jersey),Ru,Tripos,Inc.(St.Louis,Missouri),ChemStar,Ltd(Moscow,Russia),3D Pharmaceuticals(Exton,Pennsylvania)和Martek Biosciences(Columbia,Maryland)。
在一个优选实施方案中,预选择所述库,使得库中的化合物更易于被细胞吸收。例如,基于特定参数选择化合物,所述参数例如但不限于大小、亲脂性、亲水性和氢键,它们增强化合物进入细胞的可能性。在另一个实施方案中,用三维或四维计算机运算程序分析化合物。
根据本发明方法使用的组合化合物库可以合成。对于创建小有机化合物的大集合或库的合成方法有很多关注,它们可用于药理、生物或其它活性的筛选。用于创建大组合化学库的合成方法在溶液或在固相即固相支持物上进行。固相合成使得更容易进行多步反应并驱动反应以高产率完成,因为每个反应步骤以后可以容易地添加和洗去过量试剂。固相组合合成也倾向于改善分离、纯化和筛选。然而,更传统的液相化学支持比固相化学更宽范围的有机反应。
本发明的组合化合物库可以用Kilcoin等人的美国专利No.6,190,619所述的装置合成,所述专利的全部内容经引用并入本文。美国专利No.6,190,619公开了能支持多个反应容器平行合成多种不相关的化合物或组合化合物库的合成装置。
在一个实施方案中,组合化合物库可以在溶液中合成。Boger等人的美国专利No.6,194,612公开的方法表征了用作液相合成组合库的模板的化合物,该专利的全部内容经引用并入本文。设计模板,使得容易用液/液或固/液萃取使反应产物与未反应的反应物分离。用所述模板经组合合成产生的化合物优选是小有机分子。库中的一些化合物可以模拟非肽或肽的作用。与固相合成组合化合物库比较,液相合成不要求使用监测多步骤固相合成的各步骤的专门操作(Egner et al.,1995,J.Org.Chem.602652;Anderson et al.,1995,J.Org.Chem.602650;Fitch et al.,1994,J.Org.Chem.597955;Look et al.,1994,J.Org.Chem.497588;Metzger et al.,1993,Angew.Chem.,Int.Ed.Engl.32894;Youngquist et al.,1994,Rapid Commun.Mass Spect.877;Chu et al.,1995,J.Am.Chem.Soc.1175419;Brummel et al.,1994,Science264399;和Stevanovic et al.,1993,Bioorg.Med.Chem.Lett.3431)。
用于本发明方法的组合化合物库可以在固相支持物上合成。在一个实施方案中,使用裂分(split)合成法(在合成期间分离并混合固相支持物的操作方案)合成固相支持物上的化合物库(例如见Lam et al.,1997,Chem.Rev.9741-448;Ohlmeyer etal.,1993,Proc.Natl.Acad.Sci.USA 9010922-10926及其中引用的参考文献)。最终库中的每种固相支持物具有连接在其表面的基本一种类型的化合物。在固相支持物上合成组合化合物库的其它方法对本领域技术人员是公知的,其中一种产物连接到一种支持物上(例如见Nefzi et al.,1997,Chem.Rev.97449-472)。
在本发明的一些实施方案中,化合物可以经接头附着到固相支持物上。接头可以是整合在固相支持物上或是其部分,或者它们可以是非整合的,或者合成到固相支持物上或者在合成以后附着到其上。接头不仅可用于提供化合物附着到固相支持物上的点,而且根据接头的性质,允许在不同条件下从固相支持物上切除不同类型的分子。例如,接头可以被亲电切割、亲核切割、光切割、酶切割、金属切割、还原条件下切割或氧化条件下切割。在一个优选实施方案中,在高通量筛选化合物之前从固相支持物上切割化合物。
如果库包含化合物的阵列或微阵列,其中每种化合物具有一个地址或标识符,所述化合物可以被去卷积(deconvoluted),例如通过将阳性样品交叉参考至应用于单个测试的原化合物列表上。
如果库是肽或核酸库,可以通过对肽或核酸直接测序来确定化合物的序列。这种方法对本领域技术人员是公知的。
很多物理化学技术可用于全新表征化合物。这些技术的实例包括但不限于质谱、NMR光谱、X-射线晶体衍射和振动光谱。
5.14鉴定到的化合物预防、治疗、控制或改善肝癌或其症状的应用本发明提供预防、治疗、控制或改善肝癌或其症状的方法,所述方法包括向需要的对象给予一种或多种根据本发明方法鉴定的化合物。在某些实施方案中,所述对象患有轻度、中度、明显或严重的肝癌。在一个优选实施方案中,所述对象是人。
在一个实施方案中,本发明提供预防、治疗、控制或改善肝癌或其症状的方法,所述方法包括向需要的对象给予预防或治疗有效量的一种或多种根据本发明方法鉴定的化合物。在一个具体实施方案中,如果根据本发明方法鉴定的化合物之前已经用于预防、治疗、控制或改善肝癌或其症状,则不给予这种化合物来预防、治疗、控制或改善肝癌或其症状。在另一个实施方案中,如果根据本发明方法鉴定的化合物已经被建议用于预防、治疗、控制或改善肝癌或其症状,则不给予这种化合物来预防、治疗、控制或改善肝癌或其症状。在另一个实施方案中,根据本发明方法鉴定的化合物特异性结合到本发明的仅一种生物标志物的蛋白质或RNA产物上和/或改变其表达和/或活性水平。在另一个实施方案中,如果根据本发明方法鉴定的化合物结合到表1的一种、两种、三种、全部或任意组合的以下生物标志物的蛋白质或RNA产物上和/或改变其表达和/或活性水平,则不给予这种化合物来预防、治疗、控制或改善肝癌或其症状。在另一个实施方案中,根据本发明方法鉴定的化合物结合到本发明的至少2种、至少3种、至少4种、至少5种、至少10种、至少15种、至少20种、至少25种或更多种生物标志物的蛋白质或RNA产物上和/或改变其表达和/或活性水平。
本发明还提供预防、治疗、控制或改善肝癌或其症状的方法,所述方法包括向需要的对象给予一种或多种根据本文所述筛选方法鉴定的化合物,和一或多种其它治疗(如预防或治疗剂和手术)。在一个具体实施方案中,这些治疗当前正在用于、已经用于或已知可用于预防、治疗、控制或改善肝癌或其症状(包括但不限于本文所列举的预防或治疗剂)。本发明的组合治疗的治疗(如预防或治疗剂)可以依次给予或同时给予。在一个具体实施方案中,本发明的组合治疗包括根据本发明鉴定的化合物和具有与所述化合物相同机制的至少一种其它治疗。在另一个具体实施方案中,本发明的组合治疗包括根据本发明方法鉴定的化合物和具有与所述化合物不同机制的至少一种其它治疗(如预防或治疗剂)。通过与具有叠加或协同作用的化合物一起发挥功能,本发明的组合治疗提高本发明化合物的预防或治疗效果。本发明的组合治疗降低与所述治疗(如预防或治疗剂)相关的副作用。
可以在相同药物组合物中向对象给予所述组合治疗的预防或治疗剂。作为替代方案,可以在分离的药物组合物中同时向对象给予所述组合治疗的预防或治疗剂。可以经相同或不同的给药途径向对象给予所述预防或治疗剂。
在具体实施方案中,将包含本文所述测试中鉴定的一种或多种化合物的药物组合物给予对象,优选人,以预防、治疗、控制或改善肝癌或其症状。根据本发明,所述药物组合物还可以包含一种或多种预防或治疗剂。这些药剂优选当前正在用于、已经用于或已知可用于预防、治疗、控制或改善肝癌或其症状。
根据本发明方法鉴定的化合物可以用作肝癌的一线、二线、三线、四线或五线治疗。本发明向不适合常规肝癌治疗的对象提供治疗、控制或改善肝癌或其症状的方法,所述方法包括向所述对象给予预防或治疗有效剂量的根据本发明方法鉴定的化合物。
本发明向不适合现有的单药剂肝癌治疗的对象提供治疗、控制或改善肝癌或其症状的方法,所述方法包括向所述对象给予预防或治疗有效剂量的根据本发明方法鉴定的化合物和预防或治疗有效剂量的一种或多种其它治疗(如预防或治疗剂)。本发明还提供通过向已证明抗其它治疗且不再进行这些治疗的患者给予根据本发明方法鉴定的化合物以及任何其它治疗(如手术)的组合而治疗或控制肝癌的方法。本发明还提供治疗或控制患有肝癌以及因之前接受其它治疗而受到免疫抑制的患者的方法。本发明还提供当激素治疗和/或生物治疗/免疫治疗对于正在治疗或控制的对象已经证明或可能证明毒性太大时,即导致不可接受或不能忍受的副作用时治疗或控制肝癌的替代性方法。
5.15本发明的化合物根据本发明方法可用于预防、治疗、控制和/或改善肝癌或其症状的化合物的代表性、非限制性实例在下面详细描述。
第一,这样的化合物例如可以包括能下调本发明生物标志物的蛋白质或RNA产物表达或活性的反义、核酶或三螺旋化合物。这些化合物将在下面的小节中详细描述。
第二,这样的化合物例如可以包括能调节本发明生物标志物的蛋白质或RNA产物的表达、或者本发明生物标志物的蛋白质产物活性的抗体组合物。在一个具体实施方案中,所述抗体组合物下调本发明生物标志物的蛋白质或RNA产物的表达,或本发明生物标志物的蛋白质产物的活性。这些化合物将在下面的小节中详细描述。
第三,这样的化合物例如可以包括本发明生物标志物的蛋白质产物。本发明涉及选用于模拟本发明生物标志物的蛋白质产物的肽或肽模拟物用于预防、治疗、控制或改善肝癌或其症状的用途。而且,这样的化合物例如可以包括能调节本发明生物标志物的蛋白质或RNA产物的表达、或本发明生物标志物的蛋白质产物的活性的显性失活多肽。
所述方法还涉及本发明生物标志物的蛋白质产物的衍生物、类似物和片段用于预防、治疗、控制或改善肝癌或其症状的用途。具体而言,本发明涉及本发明生物标志物的蛋白质产物的片段用于预防、治疗、控制或改善肝癌或其症状的用途,所述片段包含这种蛋白质的一个或多个结构域。在另一个具体实施方案中,本发明涉及本发明生物标志物的蛋白质产物或这种蛋白质的衍生物、类似物和片段的用途,所述蛋白质及其衍生物、类似物和片段表达为融合体或嵌合蛋白质产物(包含经肽键与异源蛋白质序列连接的蛋白质、片段、类似物或衍生物)。
在具体实施方案中,给予至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少15种、至少20种、至少25种或更多本发明生物标志物的反义寡核苷酸,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,给予一种或多种本发明生物标志物的蛋白质产物或其片段、类似物或衍生物,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,给予特异性结合本发明的蛋白质产物的一种或多种抗体,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,给予一种或多种显性失活多肽以预防、治疗、控制或改善肝癌或其症状。
5.15.1反义、核酶、三螺旋组合物可用标准技术制备与表1-4中列出的一或多个基因反应的反义、三螺旋或核酶分子,以及表1-4中列出的基因的转录本,以用作本文所述方法的部分。首先,可用标准技术制备反义核酸分子,即与编码感兴趣多肽的正义核酸互补的分子,例如与双链cDNA分子的编码链互补或与mRNA序列互补的分子。因此,反义核酸可与正义核酸形成氢键。反义核酸可与全部编码链或仅一部分编码链互补,例如蛋白质编码区(或开放读码框)的全部或部分。反义核酸分子可以是对编码感兴趣多肽的核酸序列的编码链的非编码区的全部或部分反义的。所述非编码区(“5’和3’非翻译区”)是编码区旁侧的5’和3’序列,不翻译成氨基酸。
反义寡核苷酸例如可以长约5、10、15、20、25、30、35、40、45或50个核苷酸或更长。本发明的反义核酸可以用化学合成和酶促连接反应用本领域已知方法构建。例如,可以用天然存在的核苷酸或各种修饰核苷酸化学合成反义核酸(如反义寡核苷酸),所述修饰核苷酸设计用于增加分子的生物学稳定性或增加反义和正义核酸之间形成的双链体的物理稳定性,例如可以使用硫代磷酸衍生物和吖啶取代的核苷酸。可用于生成反义核酸的修饰核苷酸的实例包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫尿核苷(thiouridine)、5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基queosine(β-D-galactosylqueosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、5-甲氧基氨甲基-2-硫代尿嘧啶、beta-D-mannosylqueosine、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲基硫代-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-硫代胞嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫代尿嘧啶、3-(3-氨基-3-N-2羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。作为替代方案,可以用已经以反义方向(即从插入的核酸转录的RNA将和感兴趣靶核酸是反义取向的)亚克隆有核酸的表达载体生物学制备反义核酸。
反义核酸分子被给予对象或原位产生,使得它们杂交或结合至编码感兴趣多肽的细胞mRNA上从而抑制表达,例如通过抑制转录和/或翻译而抑制表达。杂交可以通过常规核苷酸互补性形成稳定的双链体,或者,例如,对于结合DNA双链体的反义核酸分子,通过在双螺旋的大沟中特异性相互作用。给予本发明反义核酸分子的途径的实例包括直接注射到组织部位,例如关节(如膝、髋、肘和指节)。作为替代方案,可以修饰反义核酸分子使之靶向选定的细胞然后系统性给药。例如,为了系统性给药,可以修饰反义分子,使得它们特异性结合至选定细胞如T细胞或肝细胞表面上表达的受体或抗原,例如,这种结合通过将反义核酸分子与结合到细胞表面受体或抗原的肽或抗体连接而实现。反义核酸分子还可以用载体如下述基因治疗载体递送到细胞。为达到足够的细胞内反义分子浓度,优选在载体中将反义核酸分子置于强pol II或pol III启动子控制之下。
感兴趣的反义核酸分子可以是α-端基异构(anomeric)的核酸分子。α-端基异构的核酸分子与互补性RNA形成特异性双链杂合体,其中,与通常的α-单元相反,链互相平行(Gaultier et al.,1987,Nucleic Acids Res.156625-6641)。反义核酸分子还可以包含2’-o-甲基核糖核苷酸(Inoue et al.,1987,Nucleic Acids Res.156131-6148)或嵌合RNA-DNA类似物(Inoue et al.,1987,FEBS Lett.215327-330)。
核酶是具有核糖核酸酶活性的催化性RNA分子,它能切割与之有互补区的单链核酸如mRNA,也可以用标准技术制备。因此,核酶(如锤头核酶(描述于Haselhoffand Gerlach,Nature 334585-591))可用于催化性切割mRNA转录本,从而抑制由该mRNA编码的蛋白质的翻译。可以基于本文公开的cDNA的核苷酸序列设计对编码感兴趣多肽的核酸分子有特异性的核酶。例如,可以构建四膜虫L-19 IVS RNA的衍生物,其中活性位点的核苷酸序列与待切割核苷酸序列互补,见Cech et al.U.S.Patent No.4,987,071;和Cech et al.U.S.Patent No.5,116,742。作为替代方案,可用编码感兴趣多肽的mRNA从RNA分子库中选择具有特异性核糖核酸酶活性的催化性RNA。例如见Bartel and Szostak,1993,Science 2611411-1418。
三螺旋结构也可以用公知技术制备。例如,通过靶向与编码感兴趣多肽的基因的调节区互补的核苷酸序列,以形成阻止靶细胞中所述基因转录的三螺旋结构,从而可以抑制所述多肽的表达。一般可见Helene,1991,Anticancer Drug Des.6(6)569-84;Helene,1992,Ann.N.Y.Acad.Sci.66027-36;和Maher,1992,Bioassays 14(12)807-15。
在多种实施方案中,可以在碱基、糖基或磷酸骨架处修饰核酸组成,从而例如提高分子的稳定性、杂交或溶解性。例如,核酸的脱氧核糖磷酸骨架可以被修饰以制备肽核酸(见Hyrup et al.,1996,Bioorganic & Medicinal Chemistry 45-23)。本文所用术语“肽核酸”或“PNA”表示核酸模拟物,如DNA模拟物,其中脱氧核糖磷酸骨架被假肽骨架替换而仅四种天然核酸碱基被保留。PNA的中心骨架已经显示允许在低离子强度下与DNA和RNA特异性杂交。PNA寡聚物的合成可以使用标准固相肽合成方法,如下文所述Hyrup et al.,1996,同上;Perry-O′Keefe et al.,1996,Proc.Natl.Acad.Sci.USA 9314670-675。
例如,通过将亲脂性或其它辅助基团连接到PNA、通过形成PNA-DNA嵌合体、或通过使用脂质体或本领域已知的其它药物递送技术,可以修饰PNA,从而例如增强其稳定性或细胞吸收。例如,可以制备PNA-DNA嵌合体,它可以组合PNA和DNA的有益特性。这些嵌合体允许DNA识别酶如RNase H和DNA聚合酶与其DNA部分相互作用,而PNA部分提供高结合亲和力和特异性。PNA-DNA嵌合体可以用适当长度的接头连接,根据碱基堆积、核碱基之间的键数和取向选择合适的长度(Hyrup,1996,同上)。PNA-DNA嵌合体的合成如下述进行Hyrup,1996,同上,和Finn etal.,1996,Nucleic Acids Res.24(17)3357-63。例如,可以用标准的亚磷酰胺偶联化学和修饰的核苷类似物在固相支持物上合成DNA链。化合物如5’-(4-甲氧基三苯甲基)氨基-5’-脱氧-胸腺嘧啶亚磷酰胺可以用作PNA和DNA的5’端之间的连接(Mag et al.,1989,Nucleic Acids Res.175973-88)。然后逐步偶联PNA单体,以产生具有5’PNA节段和3’DNA节段的嵌合分子(Finn et al.,1996,Nucleic Acids Res.24(17)3357-63)。作为替代方案,可以合成具有5’DNA节段和3’PNA节段的嵌合分子(Peterser et al.,1975,Bioorganic Med.Chem.Lett.51119-11124)。
在另一些实施方案中,所述寡核苷酸可以包括其它附加基团如肽(例如为体内靶向宿主细胞受体),或辅助跨细胞膜转运(例如见Letsinger et al.,1989,Proc.Natl.Acad.Sci.USA 866553-6556;Lemaitre et al.,1987,Proc.Natl.Acad.Sci.USA 84648-652;国际公开号WO 88/09810)或血脑屏障(例如见国际公开号WO 89/10134)的因子。此外,可以用杂交触发的切割剂(例如见Krol et al.,1988,Bio/Techniques6958-976)或嵌入剂(例如见Zon,1988,Pharm.Res.5539-549)修饰寡核苷酸。为此,寡核苷酸可以与另一个分子例如肽、杂交触发的交联剂、转运剂、杂交触发的切割剂等连接。
5.15.2抗体组成在一个实施方案中,将特异性结合一或多种本发明生物标志物的一或多种蛋白质产物的抗体给予对象,优选人,以预防、治疗、控制或改善肝癌或其症状。在另一个实施方案中,将特异性结合一或多种本发明生物标志物的一或多种蛋白质产物的抗体的任意组合给予对象,优选人,以预防、治疗、控制或改善肝癌或其症状。在一个具体实施方案中,将特异性结合本发明一或多种生物标志物的一或多种蛋白质产物的一或多种抗体与其它类型治疗(如NSAIDS)一起给予对象,优选人,以预防、治疗、控制或改善肝癌或其症状。在某些实施方案中,将本领域已知的特异性结合一或多种本发明生物标志物的一或多种蛋白质产物的抗体单独或与其它类型治疗(如NSAIDS)一起给予对象,优选人,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,不将本领域已知的特异性结合一或多种本发明生物标志物的一或多种蛋白质产物的抗体单独或与其它类型治疗(如NSAIDS)一起给予对象,优选人,以预防、治疗、控制或改善肝癌或其症状。
可以用本领域技术人员已知的多种递送系统将特异性结合一或多种本发明生物标志物的一或多种蛋白质产物的一或多种抗体给予对象,优选人。例如,可以通过脂质体包裹、微颗粒或微胶囊给予这些抗体。例如见美国专利No.5,762,904、美国专利No.6,004,534和国际公开No.WO99/52563。此外,可以用能表达抗体的重组细胞或能表达抗体的逆转录病毒、其他病毒载体或非病毒载体给予这些抗体。
可以从任何已知来源获得特异性结合一或多种本发明生物标志物的一或多种蛋白质产物的抗体。例如,表5提供特异性针对一或多种本发明生物标志物的一或多种蛋白质产物的商业抗体的列表。作为替代方案,特异性结合本发明一或多种生物标志物的一或多种蛋白质产物的抗体可以用本领域已知的合成抗体的任何方法制备,尤其是用化学合成或优选重组表达技术制备。
抗体包括但不限于多克隆抗体、单克隆抗体、双特异性抗体、多特异性抗体、人抗体、人源化抗体、骆驼化(camelised)抗体、嵌合抗体、单链Fv(scFv)(例如见Bird et al.(1988)Science 242423-426;和Huston et al(1988)Proc.Natl.Acad.Sci.USA 855879-5883)、单链抗体、单结构域抗体、Fab片段、F(ab’)片段、二硫键连接的Fv(sdFv)和抗独特型(抗Id)抗体(例如,包括抗本发明抗体的抗Id抗体),以及以上任一种的表位结合片段。本文所用术语“抗体”表示免疫球蛋白分子和免疫球蛋白分子的免疫活性片段,即含有抗原结合位点的分子。免疫球蛋白分子可以是任何类型(如IgG、IgE、IgM、IgD、IgA和IgY)、任何类(如IgG1、IgG2、IgG3、IgG4、IgA1和IgA2)或亚类。免疫球蛋白分子的免疫活性片段的实例包括F(ab)片段(由VL、VH、CL和CH1结构域组成的单价片段)和F(ab’)2片段(包含在铰链区经二硫桥连接的两个F(ab)片段的双价片段),它们可以通过用酶如胃蛋白酶或木瓜蛋白酶处理相应抗体而产生。免疫活性片段还包括但不限于Fd片段(由VH和CH1结构域组成)、Fv片段(由抗体单臂的VL和VH结构域组成)、dAb片段(由VH结构域组成;Ward et al.,(1989)Nature 341544-546)和分离的互补性决定区(CDR)。特异性结合抗原的抗体可以用本领域已知的合成抗体的任何方法制备,尤其是用化学合成或优选重组表达技术制备。
特异性结合抗原的多克隆抗体可以用本领域公知的多种方法制备。例如,可以将人抗原给予多种宿主动物,包括但不限于兔、小鼠、大鼠等,以诱导产生含特异性针对所述人抗原的多克隆抗体的血清。根据宿主物种,可以使用多种佐剂以增加免疫应答,包括但不限于弗氏佐剂(完全和不完全)、矿物凝胶如氢氧化铝、表面活性物质如溶血卵磷脂、pluronic多元醇、聚阴离子、肽、油乳液、匙孔血蓝蛋白、二硝基苯酚和潜在有用的人佐剂如BCG(卡介苗)和小棒状杆菌。这些佐剂也是本领域公知的。
术语“单特异性抗体”表示对特定靶如表位表现单结合特异性和亲和力的抗体。该术语包括单克隆抗体。单克隆抗体可以用本领域已知的各种技术制备,包括使用杂交瘤、重组和噬菌体展示技术、或这些技术的组合。例如见美国专利No.RE 32,011、4,902,614、4,543,439、4,411,993和4,196,265;Kennett et al(eds.),MonoclonalAntibodies,HybridomasA New Dimension in Biological Analyses,Plenum Press(1980);和Harlow and Lane(eds.),Antibodies.A Laboratory Manual,Cold Spring HarborLaboratory Press(1988),它们经引用并入本文。例如,单克隆抗体可用杂交瘤技术制备,包括本领域已知的技术和下文教导的技术,例如Harlow et al.,AntibodiesALaboratory Manual,(Cold Spring Harbor Laboratory Press,2nd ed.1988);Hammerling,et al.,inMonoclonal and T-cell Hybridomas 563-681(Elsevier,N.Y.,(所述参考的全部内容经引用并入本文)。也可使用经重组技术而制备抗体的其它技术来构建单克隆抗体(例如下述的技术William D.Huse et al.,1989,Science,2461275-1281;L.Sastry et al.,1989,Proc.Natl.Acad.Sci.USA,865728-5732;和Michelle Alting-Mees et al.,Strategies in Molecular Biology,31-9(1990),其中提到了可从Stratacyte,La Jolla,Calif.获得的商业系统)。本文所用术语“单克隆抗体”不限于经杂交瘤技术产生的抗体。术语“单克隆抗体”表示来源于单个克隆的抗体,包括来源于任何真核、原核生物或噬菌体克隆,不涉及生产所述抗体的方法。
用杂交瘤技术生产和筛选特异性抗体的方法是常规的和本领域公知的。简单的说,可以用本发明生物标志物的蛋白质产物免疫小鼠,一旦检测到免疫应答,例如,在小鼠血清中检测到对所述蛋白质有特异性的抗体,则收获小鼠脾并分离脾细胞。然后用公知技术将所述脾细胞与任何合适的骨髓瘤细胞融合,如可从ATCC获得的细胞系SP20的细胞。用有限稀释法选择和克隆杂交瘤。此外,可以使用RIMMS(多点重复免疫)技术来免疫动物(Kilptrack et al.,1997,Hybridoma 16381-9,全部内容经引用并入本文)。然后用本领域已知方法测试杂交瘤克隆中分泌能结合本发明多肽的抗体的细胞。通常含高水平抗体的腹水中可以用阳性杂交瘤克隆免疫小鼠而制备。
因此,本发明提供通过培养分泌本发明抗体的杂交瘤细胞来制备抗体的方法,其中所述杂交瘤的制备优选通过将分离自用本发明生物标志物的蛋白质产物免疫的小鼠的脾细胞与骨髓瘤细胞融合,然后筛选融合所得杂交瘤中分泌能结合所述蛋白质或蛋白质片段的杂交瘤克隆。
识别本发明生物标志物的蛋白质产物的特异性表位的抗体片段可以用本领域技术人员已知的任何技术来制备。例如,本发明的Fab和F(ab’)2片段可以通过用酶如木瓜蛋白酶(制备Fab片段)或胃蛋白酶(制备F(ab’)2片段)蛋白水解性切割免疫球蛋白分子来制备。F(ab’)2片段含有可变区、轻链恒定区和重链的CH1结构域。而且,本发明抗体还可以用本领域已知的多种噬菌体展示方法制备。
在噬菌体展示方法中,功能性抗体结构域被展示到携带编码它们的多核苷酸序列的噬菌体颗粒表面。具体来说,从动物cDNA文库(如人或小鼠受感染组织的cDNA文库)中扩增编码VH和VL结构域的DNA序列。编码VH和VL结构域的DNA经PCR与scFv接头重组在一起并克隆到噬粒载体中。载体电穿孔到大肠杆菌中,并用辅助噬菌体感染大肠杆菌。用于这些方法的噬菌体典型地是丝状噬菌体,包括fd和M13,并且VH和VL结构域通常被重组融合到噬菌体基因III或基因VIII上。可以用抗原选择或鉴定表达结合到特定抗原的抗原结合结构域上的噬菌体,例如使用标记抗原或结合或捕获到固相表面或珠子上的抗原。可用于制备本发明抗体的噬菌体展示方法的实例包括以下公开的那些Brinkman et al.,1995,J.Immunol.Methods 18241-50;Ames et al.,1995,J.Immunol.Methods 184177-186;Kettleborough et al.,1994,Eur.J.Immunol.24952-958;Persic et al.,1997,Gene 1879-18;Burton et al.,1994,Advances in Immunology 57191-280;PCT申请No.PCT/GB91/O1 134;国际公开No.WO 90/02809、WO 91/10737、WO 92/01047、WO 92/18619、WO 93/1 1236、WO 95/15982、WO 95/20401和WO97/13844;以及美国专利No.5,698,426、5,223,409、5,403,484、5,580,717、5,427,908、5,750,753、5,821,047、5,571,698、5,427,908、5,516,637、5,780,225、5,658,727、5,733,743和5,969,108;其中每篇的全部内容经引用并入本文。
如以上参考文献所述,噬菌体选择以后,可以从噬菌体分离抗体编码区并用于制备完整抗体,包括人抗体,或者任何其它的期望的抗原结合片段,并在任何期望宿主中表达,包括哺乳动物细胞、昆虫细胞、植物细胞、酵母和细菌,例如下述。也可以用本领域公知方法使用重组制备Fab、Fab’和F(ab’)2片段的技术,如以下公开国际公开No.WO 92/22324;Mullinax et al.,1992,BioTechniques 12(6)864-869;Sawai et al.,1995,AJRI 3426-34;和Better et al.,1988,Science 2401041-1043(所述参考的全部内容经引用并入本文)。
为制备完整抗体,可以使用包括VH或VL核苷酸序列、限制性位点和保护限制性位点的旁侧序列的PCR引物来扩增scFv克隆中的VH或VL序列。可以使用本领域技术人员已知的克隆技术,将PCR扩增的VH结构域克隆至表达VH恒定区如人γ4恒定区的载体中,将PCR扩增的VL结构域克隆到表达VL恒定区如人κ或λ恒定区的载体中。表达VH或VL结构域的载体优选包含EF-1α启动子、分泌信号、可变结构域、恒定结构域的克隆位点以及选择标志物如新霉素。VH和VL结构域还可以克隆入表达必要的恒定区的一种载体中。然后用本领域技术人员已知的技术将重链转换载体和轻链转换载体共转染入细胞系,以产生表达全长抗体如IgG的稳定或瞬时细胞系。
对于一些应用,包括抗体体内使用于人和体外检测测试,可以优选使用人或嵌合抗体。对于人对象的治疗性处理,特别期望完全的人抗体。通过本领域已知的多种方法可以制备人抗体,包括使用来源于人免疫球蛋白序列的抗体库的上述噬菌体展示方法。也见美国专利No.4,444,887和4,716,111;和国际公开No.WO 98/46645、WO98/50433、WO 98/24893、WO 98/16654、WO 96/34096、WO 96/33735和WO 91/10741;其中每个的全部内容经引用并入本文。
还可以通过转基因动物制备抗体。具体来说,可以用不能表达功能性内源免疫球蛋白但能表达人免疫球蛋白基因的转基因小鼠制备人抗体。例如,人重链和轻链免疫球蛋白基因复合物可以随机或经同源重组导入小鼠胚胎干细胞。作为替代方案,除了人重链和轻链基因以外,也可以将人可变区、恒定区和多样性区导入小鼠胚胎干细胞。可以在经同源重组导入人免疫球蛋白座位的同时或不同时使小鼠轻链和重链免疫球蛋白基因无功能。具体而言,纯合缺失JH区防止内源性抗体生成。可以扩增修饰的胚胎干细胞并微注射入胚泡以产生嵌合小鼠。然后繁殖嵌合小鼠产生表达人抗体的纯合后代。用选定的抗原如全部或部分的本发明多肽以常规方式免疫转基因小鼠。抗所述抗原的单克隆抗体可以用常规杂交瘤技术从免疫的转基因小鼠获得。转基因小鼠携带的人免疫球蛋白转基因在B细胞分化期间重排,随后经历类型转换和体细胞突变。因此,使用这样的技术,可以制备治疗有用的IgG、IgA、IgM和IgE抗体。这种制备人抗体的技术的全面评述见Lonberg and Huszar(1995,Int.Rev.Immunol.1365-93)。对于制备人抗体和人单克隆抗体的这种技术和制备这些抗体的操作方案的详细讨论,例如见国际公开No.WO 98/24893,WO 96/34096和WO 96/33735;和美国专利No.5,413,923、5,625,126、5,633,425、5,569,825、5,661,016、5,545,806、5,814,318和5,939,598,其中全部内容经引用并入本文。此外,可以让公司如Abgenix,Inc.(Freemont,CA)和Genpharm(San Jose,CA)用与上述相似的技术提供抗选定抗原的抗体。
例如,美国专利No.5,849,992描述了在转基因哺乳动物乳腺中表达抗体的方法。构建转基因使之包括乳汁特异性启动子和编码感兴趣抗体和分泌信号序列的核酸。雌性的这种转基因动物产生的乳汁包括分泌到其中的感兴趣抗体。可以从乳汁中纯化抗体,或在一些应用中直接使用。
嵌合抗体是抗体的不同部分来源于不同免疫球蛋白分子的一种分子。制备嵌合抗体的方法在本领域已知。例如见Morrison,1985,Science 2291202;Oi et al.,1986,BioTechniques 4214;Gillies et al.,1989,J.Immunol.Methods 125191-202;和美国专利No.5,807,715、4,816,567、4,816,397和6,331,415,其中全部内容经引用并入本文。
人源化抗体是能结合预定抗原的抗体或其变体或片段,其包含基本具有人免疫球蛋白氨基酸序列的框架区和基本具有非人免疫球蛋白氨基酸序列的CDR。人源化抗体基本包含全部的至少一个、通常两个可变结构域(Fab、Fab’、F(ab’)2、Fabc、Fv),其中全部或基本全部的CDR区对应非人免疫球蛋白(即供体抗体)的CDR区,全部或基本全部的框架区是人免疫球蛋白共有序列的框架区。优选地,人源化抗体还包含免疫球蛋白恒定区(Fc)的至少一部分,通常是人免疫球蛋白的至少一部分。一般地,所述抗体将含有轻链以及重链的至少可变结构域。抗体还可以包括重链的CH1、铰链、CH2、CH3和CH4区。人源化抗体可以从任何类型和任何同种型的免疫球蛋白中选择,所述类型包括IgM、IgG、IgD、IgA和IgE,所述同种型包括IgG1、IgG2、IgG3和IgG4。期望人源化抗体表现细胞毒活性时,通常恒定结构域是固定补体的恒定结构域,典型的类型是IgG1。如果不期望这种细胞毒活性时,恒定区可以是IgG2类型。人源化抗体可以包含来自一种以上类型或同种型的序列,并且选择特定恒定区以优化期望的效应子功能是在本领域技术人员的能力范围内。人源化抗体的框架和CDR区不必精确对应母体序列,如供体CDR或共有框架区可以通过替换、插入或缺失至少一个残基而被突变,使得该位点的CDR或框架残基不对应共有序列或来源抗体。然而这些突变将不是昂贵的。通常,人源化抗体残基的至少75%将对应母体FR和CDR序列中的残基,更经常90%,最优选大于95%。可以用多种本领域已知的技术制备人源化抗体,包括但不限于CDR移植(欧洲专利No.EP 239,400;国际公开No.WO 91/09967;和美国专利No.5,225,539、5,530,101和5,585,089),表面覆盖(veneering)或表面再造(resurfacing)(欧洲专利No.EP 592,106和EP519,596;Padlan,1991,Molecular Immunology 28(4/5)489-498;Studnicka et al.,1994,Protein Engineering 7(6)805-814;和Roguska et al.,1994,PNAS 91969-973),链重排(chain shuffling)(美国专利No.5,565,332)和例如下文中公开的技术美国专利No.6,407,213、美国专利No.5,766,886、WO 9317105、Tan et al.,2002,J.Immunol.1691119-25,Caldas et al.,2000,Protein Eng.13(5)353-60,Morea et al.,2000,Methods 20(3)267-79,Baca et al.,1997,J.Biol.Chem.272(16)10678-84,Roguska etal.,1996,Protein Eng.9(10)895-904,Couto et al.,1995,Cancer Res.55(23 Supp)5973s-5977s,Couto et al.,1995,Cancer Res.55(8)1717-22,Sandhu JS,1994,Gene150(2)409-10,和Pedersen et al.,1994,J.Mol.Biol.235(3)959-73。框架区的框架残基经常被CDR供体抗体的相对应残基替换,以改变、优选提高抗原结合。这些框架替换通过本领域公知的方法鉴定,例如,通过模拟CDR和框架残基的相互作用鉴定对抗原结合重要的框架残基,进行序列比较以鉴定在特定位置不常见的框架残基。(例如见Queen et al.,美国专利No.5,585,089;和Riechmann et al.,1988,Nature332323,其全部内容经引用并入本文)。
可以通过本领域公知方法制备单结构域抗体,例如缺乏轻链的抗体。见Riechmann et al.,1999,J.Immune.23125-38;Nuttall et al.,2000,Curr.Pharm.1(3)253-263;Muylderman,2001,J.Biotechnol.74(4)277302;美国专利No.6,005,079;和国际公开No.WO 94/04678,WO 94/25591和WO 01/44301,其中每个的全部内容经引用并入本文。
而且,可以用本领域技术人员公知的技术将特异性结合抗原的抗体再用于产生“模拟”抗原的抗独特型抗体。(例如见Greenspan & Bona,1989,FASEB J.7(5)437-444;和Nissinoff,1991,J.Immunol.147(8)2429-2438)。这些抗体可以单独或与其它治疗组合使用,以预防、治疗、控制或改善肝癌或其症状。
本发明涉及包含编码特异性结合抗原的抗体或其片段的核苷酸序列的多核苷酸。本发明还涉及在高严谨、中等或低严谨杂交条件下与编码本发明抗体的多核苷酸杂交的多核苷酸。
可以通过本领域已知的任何方法获得所述多核苷酸并确定所述多核苷酸的核苷酸序列。编码已知抗体的核苷酸序列可以用本领域公知方法确定,即将已知编码特定氨基酸的核苷酸密码子装配成产生编码所述抗体的核酸。编码所述抗体的这种多核苷酸可以从化学合成的寡核苷酸组装(例如描述于Kutmeier et al.,1994,BioTechniques17242),简单的说,它包括合成含有部分的编码所述抗体或其片段或变体的序列的重叠寡核苷酸,退火并连接这些寡核苷酸,然后经PCR扩增连接的寡核苷酸。
作为替代方案,编码抗体的多核苷酸可以从合适来源的核酸制备。如果含编码特定抗体的核酸的克隆不可获得,但抗体分子的序列已知,则编码所述免疫球蛋白的核酸可以化学合成而获得,或用可与所述序列的3’和5’端杂交的合成引物经PCR扩增或用特异性针对特定基因的寡核苷酸探针经克隆鉴定例如来自编码所述抗体的cDNA文库的cDNA克隆从合适来源(例如,从表达所述抗体的任何组织或细胞中,如筛选表达本发明抗体的杂交瘤细胞中制备的抗体cDNA文库或cDNA文库,或从中分离的核酸,优选polyA+RNA)而获得。经PCR制备的扩增核酸然后可以用本领域公知的任何方法克隆入复制型克隆载体。
确定抗体的核苷酸序列以后,可以用本领域公知的操作核苷酸序列的方法,例如用重组DNA技术、定点突变、PCR等(例如见以下描述的技术Sambrook et al.,1990,Molecular Cloning,A Laboratory Manual,2d Ed.,Cold Spring HarborLaboratory,Cold Spring Harbor,NY and Ausubel et al.,eds.,1998,CurrentProtocols in Molecular Biology,John Wiley & Sons,NY,二者的全部内容经引用并入本文)操作所述抗体的核苷酸序列,以产生具有不同氨基酸序列的抗体,例如创建氨基酸替换、缺失和/或插入。
获得编码本发明的抗体分子、抗体分子的轻或重链或其片段(优选但不必须,含有重或轻链可变结构域)的多核苷酸以后,可以用本领域公知的技术经重组DNA技术制备产生所述抗体分子的载体。
在一个优选实施方案中,在哺乳动物细胞中制备单克隆抗体。表达所述克隆抗体或其抗原结合片段的优选哺乳动物宿主细胞包括中国仓鼠卵巢(CHO细胞)(包括dhfr-CHO细胞,描述于Urlaub and Chasin(1980,Proc.Natl.Acad.Sci.USA774216-4220),与例如描述于Kaufman and Sharp(1982,Mol.Biol.159601-621的DHFR选择标记一起使用;淋巴细胞系,例如NS0骨髓瘤细胞和SP2细胞、COS细胞,以及来自转基因动物如转基因哺乳动物的细胞。例如所述细胞是哺乳动物上皮细胞。
除了编码多样化免疫球蛋白结构域的核酸序列以外,重组表达载体可以携带另外的序列,如调节载体在宿主细胞中复制的序列(如复制起点)和选择标记基因。选择标记基因有利于选择已经导入了载体的宿主细胞(例如见美国专利No.4,399,216、4,634,665和5,179,017)。例如,选择标记基因通常赋予已经导入了载体的宿主细胞以药物抗性,如G418、潮霉素或氨甲喋呤抗性。优选的选择标记基因包括二氢叶酸还原酶(DHFR)基因(和氨甲喋呤选择/扩增一起用于dhfr-宿主细胞)和neo基因(用于G418选择)。
在重组表达本发明的抗体或其抗原结合部分的示例性系统中,编码抗体重链和抗体轻链的重组表达载体经磷酸钙介导的转染导入dhfr-CHO细胞。在重组表达载体内,抗体重链和轻链基因分别与增强子/启动子调节元件(如来源于SV40、CMV、腺病毒等,如CMV增强子/AdMLP启动子调节元件和SV40增强子/AdMLP启动子调节元件)可操作的连接,以驱动所述基因的高水平转录。重组表达载体还携带DHFR基因,它允许用氨甲喋呤选择/扩增选择已经转染了载体的CHO细胞。培养筛选的转化体宿主细胞,以使之表达抗体重链和轻链并从培养基中回收完整抗体。使用标准分子生物学技术制备重组表达载体、转染宿主细胞、筛选转化体、培养宿主细胞和从培养基回收抗体。例如,一些抗体可以通过蛋白A和蛋白G亲合层析分离。
对于包括Fc结构域的抗体,抗体生产系统优选合成Fc区被糖基化的抗体。例如,IgG分子的Fc区在CH2结构域的297位天冬酰胺处被糖基化。该天冬酰胺是双天线型寡糖修饰的位点。已经证明Fcγ受体和补体C1q介导的效应子功能需要这种糖基化(Burton and Woof,1992,Adv.Immunol.511-84;Jefferis et al.,1998,Immunol.Rev.16359-76)。在一个优选实施方案中,在适当糖基化对应297位天冬酰胺的残基的哺乳动物表达系统中制备Fc结构域。Fc结构域还可以包括其它真核翻译后修饰。
重组表达制备了抗体分子以后,可以用本领域已知的纯化免疫球蛋白分子的任何方法纯化,例如经层析(如离子交换、亲合、尤其是蛋白A以后再经特异性抗原亲合,和体积排阻柱层析)、离心、差异溶解性,以及经任何其它的纯化蛋白质的标准技术。而且,所述抗体或其片段可以与本领域已知的异源多肽融合以促进纯化。
5.15.3基因治疗技术基因治疗表示经向对象给予表达的或可表达的核酸而进行的治疗。本领域可用的任何基因治疗的方法可以根据本发明使用。实例性方法见下述。
在具体实施方案中,可以通过基因治疗的方式给予本发明一或多种生物标志物的一或多种反义寡核苷酸,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,通过基因治疗的方式给予包含编码特异性结合本发明一或多种生物标志物的一或多种蛋白质产物的一或多种抗体的核苷酸的一或多种核酸分子,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,通过基因治疗的方式给予包含编码本发明一或多种生物标志物的一或多种蛋白质产物或其类似物、衍生物或片段的核苷酸的一或多种核酸分子,以预防、治疗、控制或改善肝癌或其症状。在另一些实施方案中,通过基因治疗的方式给予包含编码本发明一或多种生物标志物的一或多种蛋白质产物的一或多种显性失活多肽的核苷酸的一或多种核酸分子,以预防、治疗、控制或改善肝癌或其症状。
对于基因治疗方法的一般性综述见Goldspiel et al.,1993,Clinical Pharmacy 12488-505;Wu and Wu,1991,Biotherapy 387-95;Tolstoshev,1993,Ann.Rev.Pharmacol.Toxicol.32573-596;Mulligan,1993,Science 260926-932;和Morganand Anderson,1993,Ann.Rev.Biochem.62191-217;May,1993,TIBTECH11(5)155-215)。可以使用的重组DNA技术领域的公知方法描述于Ausubel et al.(eds.),1993,Current Protocols in Molecular Biology,John Wiley & Sons,NY;和Kriegler,1990,Gene Transfer and Expression,A Laboratory Manual,Stockton Press,NY。
在一个方面中,本发明组合物包含编码特异性结合本发明一或多种生物标志物的一或多种蛋白质产物的一或多种抗体的核酸序列,所述核酸序列是在合适宿主中表达一或多种抗体的表达载体的一部分。具体而言,这些核酸序列具有与所述抗体可操作连接的启动子,所述启动子是诱导型或组成型,并任选是组织特异性的。
在另一个方面中,本发明组合物包含编码本发明一或多种生物标志物的一或多种蛋白质产物的显性失活多肽的核酸序列,所述核酸序列是在合适宿主中表达显性失活多肽的表达载体的一部分。具体而言,这些核酸序列具有与所述显性失活多肽可操作连接的启动子,所述启动子是诱导型或组成型,并任选是组织特异性的。在另一个具体实施方案中,使用这样的核酸分子,其中所述显性失活编码序列和任何其它期望的序列的旁侧是促进在基因组中期望位点发生同源重组的区域,从而提供显性失活核酸的染色体内表达(Koller and Smithies,1989,Proc.Natl.Acad.Sci.USA868932-8935;Zijlstra et al.,1989,Nature 342435-438)。
可以直接或者间接向患者递送所述核酸,在直接递送情况下患者直接暴露于所述核酸或携带核酸的载体,在此间接递送情况下首先用所述核酸体外转化细胞,然后移植入患者。这两种方法已知分别是体内或离体基因治疗。
在一个具体实施方案中,直接体内给予所述核酸序列,这时它表达产生编码产物。这可以通过本领域已知的很多方法的任何一种实施,例如通过将它构建为适当核酸表达载体的一部分并给予使它们成为细胞内的,如通过用缺陷型或减毒逆转录病毒或其它病毒载体感染(见美国专利No.4,980,286),或直接注射裸DNA,或使用微粒轰击(如基因枪;Biolisitic,Dupont),或用脂质或细胞表面受体或转染试剂包被,包裹于脂质体、微粒或微胶囊中,或将它们与已知进入核的肽连接进行给予,通过将其与参与受体介导的细胞内吞的配体连接进行给予(例如见Wu and Wu,1987,J.Biol.Chem.2624429-4432)(可用于靶向特异性表达该受体的细胞类型)等。在另一个实施方案中,可以形成核酸-配体复合物,其中配体包含致溶性病毒肽以破坏内体,从而使所述核酸免于溶酶体降解。在另一个实施方案中,通过靶向特异性受体,所述核酸可以体内打靶用于细胞特异性吸收和表达(例如见国际公开No.WO 92/06180
公开日1992年4月16日(Wu et al.);WO 92/2263
公开日1992年12月23日(Wilsonet al.);WO 92/2031
公开日1992年11月26日(Findeis et al.);WO 93/14188
公开日1993年7月22日(Clarke et al.),WO 93/2022
公开日1993年10月14日(Young))。作为替代方案,通过同源重组,所述核酸可以细胞内导入并整合入宿主细胞DNA中进行表达(Koller and Smithies,1989,Proc.Natl.Acad.Sci.USA 868932-8935;Zijlstra et al.,1989,Nature 342435-438)。
例如,可以使用逆转录病毒载体。这些逆转录病毒载体已经被修饰,删除了不是包装病毒基因组和整合入宿主细胞DNA必需的逆转录病毒序列。用于基因治疗的编码感兴趣抗体、或感兴趣蛋白质或其片段的核酸序列被克隆入一或多种载体中,它有利于将所述基因递送入患者。关于逆转录病毒的更详细描述可见Boesen et al.,1994,Biotherapy 6291-302,其中描述了使用逆转录病毒递送mdr1基因到造血干细胞以使造血干细胞更耐受化疗。说明逆转录病毒载体在基因治疗中应用的其它参考文献是Clowes et al.,1994,J.Clin.Invest.93644-651;Kiem et al.,1994,Blood 831467-1473;Salmons and Gunzberg,1993,Human Gene Therapy 4129-141;和Grossman andWilson,1993,Curr.Opin.in Genetics and Devel.3110-114。
腺病毒是能用于基因治疗的其它病毒载体。腺病毒是向呼吸道上皮递送基因特别有吸引力的载体。腺病毒天然感染呼吸道上皮,引起轻度疾病。基于腺病毒的递送系统的其它目标是肝、中枢神经系统、内皮细胞和肌肉。腺病毒具有能感染非分裂细胞的优点。Kozarsky and Wilson,1993,Current Opinion in Genetics and Development3499-503提供了基于腺病毒的基因治疗的综述。Bout et al.,1994,Human GeneTherapy 53-10证明了腺病毒载体将基因转移到恒河猴的呼吸道上皮细胞中的用途。腺病毒在基因治疗中应用的其它实例可以见Rosenfeld et al.,1991,Science 252431-434;Rosenfeld et al.,1992,Cell 68143-155;Mastrangeli et al.,1993,J.Clin.Invest.91225-234;PCT公开WO94/12649;和Wang,et al.,1995,Gene Therapy2775-783。在一个优选实施方案中,使用腺病毒载体。
也已经建议将腺相关病毒(AAV)用于基因治疗(Walsh et al.,1993,Proc.Soc.Exp.Biol.Med.204289-300;美国专利No.5,436,146)。
另一种基因治疗方法涉及通过诸如电穿孔、脂质体转染、磷酸钙介导的转染或病毒感染的方法将基因转移到组织培养中的细胞中。转移方法通常包括将选择标记转入细胞。然后将细胞置于选择下以分离已经摄入并表达转移基因的那些细胞。然后将那些细胞转入患者。
在这种实施方案中,在体内给予所得重组细胞之前将核酸导入细胞。这种导入可以用本领域已知的任何方法实现,包括但不限于转染、电穿孔、微注射、用含所述核酸序列的病毒或噬菌体载体感染、细胞融合、染色体介导的基因转移、微细胞介导的基因转移、原生质球融合等。本领域已知很多技术用于将外源基因导入细胞(例如,见Loeffler and Behr,1993,Meth.Enzymol.217599-618;Cohen et al.,1993,Meth.Enzymol.217618-644;Cline,1985,Pharmac.Ther.2969-92),并且可以根据本发明使用,只要接受细胞的必要发育和生理功能不被破坏即可。所述技术应该提供核酸向细胞的稳定转移,使得所述核酸可以被该细胞表达,并优选可被其后代细胞遗传并表达。
可以用本领域已知的多种方法将所得重组细胞递送给患者。重组血细胞(如造血干细胞或祖细胞)和/或肝癌细胞优选静脉内给予。预使用的细胞的量取决于期望的效果、患者状态等,并可以由本领域技术人员确定。
可以导入核酸用于基因治疗的细胞包括任何期望的可用的细胞类型,包括但不限于上皮细胞、内皮细胞、角化细胞、肝癌细胞、成纤维细胞、肌肉细胞、肝细胞;血细胞如T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜酸性粒细胞、巨核细胞、粒细胞;各种干细胞或祖细胞,尤其是造血干细胞或祖细胞,如从骨髓、脐带血、外周血、胎肝等获得的那些。
在一个优选实施方案中,用于基因治疗的细胞是患者自体的。
在一个将重组细胞用于基因治疗的实施方案中,将编码感兴趣抗体、感兴趣蛋白质或其片段的核酸序列导入细胞,使得它们可以被该细胞或其后代表达,然后体内施用重组细胞以产生治疗效果。在一个具体实施方案中,使用干细胞或祖细胞。能体外分离和维持的任何干细胞和/或祖细胞可以有利地根据本发明的这个实施方案使用。(例如见公开于1994年4月28日的国际公开No.WO 94/08598;Stemple andAnderson,1992,Cell 71973-985;Rheinwald,1980,Meth.Cell Bio.21A229;和Pittelkow and Scott,1986,Mayo Clinic Proc.61771)。
可用于控制编码感兴趣抗体、感兴趣蛋白质或其片段的核酸序列表达的启动子可以是组成型、诱导型或组织特异性的。非限制性的实例包括SV40早期启动子区(Bernoist and Chambon,1981,Nature 290304-310)、劳斯肉瘤病毒的3’长末端重复中含有的启动子(Yamamoto,et al.,1980,Cell 22787-797)、疱疹胸苷激酶启动子(Wagner et al.,1981,Proc.Natl.Acad.Sci.USA 781441-1445)、金属硫蛋白基因的调控序列(Brinster et al.,1982,Nature 29639-42);原核表达载体如β-内酰胺酶启动子(Villa-Kamaroff et al.,1978,Proc.Natl.Acad.Sci.USA 753727-3731)或tac启动子(DeBoer et al.,1983,Proc.Natl.Acad.Sci.USA 8021-25);也见″Useful proteins fromrecombinant bacteria″in Scientific American,1980,24274-94;植物表达载体,其中包含胭脂碱合成酶启动子区(Herrera-Estrella et al.,Nature 303209-213)或花椰菜花叶病毒35S RNA启动子(Gardner et al.,1981,Nucl.Acids Res.92871)和光合作用酶二磷酸核酮糖羧化酶(Herrera-Estrella et al.,1984,Nature 310115-120);来自酵母或其它真菌的启动子元件如Gal 4启动子、ADC(醇脱氢酶)启动子、PGK(甘油磷酸激酶)启动子、碱性磷酸酶启动子,以及表现组织特异性并已被用于转基因动物的以下动物转录调控区在胰腺腺泡细胞中有活性的弹性蛋白酶I基因调控区(Swift etal.,1984,Cell 38639-646;Ornitz et al.,1986,Cold Spring Harbor Symp.Quant.Biol.50399-409;MacDonald,1987,Hepatology 7425-515);在胰腺β细胞中有活性的胰岛素基因调控区(Hanahan,1985,Nature 315115-122);在淋巴样细胞中有活性的免疫球蛋白基因调控区(Grosschedl et al.,1984,Cell 38647-658;Adames et al.,1985,Nature 318533-538;Alexander et al.,1987,Mol.Cell.Biol.71436-1444)、在睾丸、乳房、淋巴样和肥大细胞中有活性的小鼠乳腺肿瘤病毒调控区(Leder et al.,1986,Cell45485-495)、在肝脏中有活性的白蛋白基因调控区(Pinkert et al.,1987,Genes andDevel.1268-276)、在肝脏中有活性的甲胎蛋白基因调控区(Krumlauf et al.,1985,Mol.Cell.Biol.51639-1648;Hammer et al.,1987,Science 23553-58;在肝脏中有活性的α1-抗胰蛋白酶基因调控区(Kelsey et al.,1987,Genes and Devel.1161-171)、在髓样细胞中有活性的β-珠蛋白基因调控区(Mogram et al.,1985,Nature 315338-340;Kollias et al.,1986,Cell 4689-94;在脑的少突胶质细胞中有活性的髓鞘碱性蛋白基因调控区(Readhead et al.,1987,Cell 48703-712);在骨骼肌中有活性的肌球蛋白轻链-2基因调控区(Sani,1985,Nature 314283-286)和在下丘脑中有活性的促性腺释放激素基因调控区(Mason et al.,1986,Science 2341372-1378)。
在一个具体实施方案中,待导入用于基因治疗的核酸包含与编码区可操作连接的诱导型启动子,使得通过控制适当转录诱导剂的存在或缺失而控制所述核酸的表达。
5.13.4抗炎治疗已经表明抗炎药成功的用于治疗、控制和改善肝癌,并且现在是这种疾病的常用而标准的治疗。可以将本领域技术人员公知的任何抗炎药用于本发明的组合物和方法中。抗炎药的非限制性实例包括非甾体类抗炎药(NSAID)、甾体类抗炎药、β-激动剂、抗胆碱能剂和甲基黄嘌呤类。NSAID的实例包括但不限于阿司匹林、布洛芬、塞来昔布(CELEBREXTM)、双氯芬酸(VOLTARENTM)、依托度酸(LODINETM)、非诺洛芬(NALFONTM)、吲哚美辛(INDOCINTM)、酮洛酸(ketoralac)(TORADOLTM)、丙嗪(DAYPROTM)、萘普酮(RELAFENTM)、舒林酸(CLINORILTM)、托美汀(TOLECTINTM)、罗非昔布(VIOXXTM)、萘普生(ALEVETM、NAPROSYNTM)、酮洛芬(ACTRONTM)和萘普酮(RELAFENTM)。这些NSAID通过抑制环氧合酶(如COX-1和/或COX-2)而发挥功能。甾体抗炎药的实例包括但不限于糖皮质激素类、地塞米松(DECADRONTM)、可的松、氢化可的松、强的松(DELTASONETM)、强的松龙、去炎松、柳氮磺胺吡啶和二十酸类,如前列腺素、血栓烷和白三烯。
5.16药物组合物用本发明方法鉴定的生物活性化合物或其药学上可接受的盐可以给予患肝癌的患者,优选哺乳动物,更优选人。在一个具体实施方案中,化合物或其药学上可接受的盐被给予患肝癌的患者,优选哺乳动物,更优选人。在另一个实施方案中,化合物或其药学上可接受的盐作为抗肝癌的预防措施被给予患肝癌的患者,优选哺乳动物,更优选人。根据这些实施方案,患者可以是儿童、成人或老年人,其中“儿童”是年龄在24个月和18岁之间的对象,“成人”是年龄在18岁或更老的对象,而“老年人”是年龄在65岁或更老的对象。
当施用于患者时,所述化合物或其药学上可接受的盐优选作为组合物的成分施用,所述组合物任选地包含药学上可接受的载体。所述组合物可以经口施用或经任何其它方便的途径施用,例如经输注或快速浓注,经上皮或粘膜内层(如口腔粘膜、直肠和肠粘膜等)吸收,并可以与另一种生物活性剂一起施用。可以系统性或局部施用。已知多种递送系统,如脂质体包裹、微粒、微胶囊、胶囊等,并可以用于施用所述化合物及其药学上可接受的盐。
施用方法包括但不限于皮内、肌内、腹膜内、静脉内、皮下、鼻内、硬膜外、经口、舌下、鼻内、脑内、阴道内、透皮、经直肠、吸入或外用,尤其是外用于耳、鼻、眼或皮肤。施用模式留给医生判断。多数情况下,施用将导致所述化合物或其药学上可接受的盐释放到血流中。
在具体实施方案中,可能期望局部施用所述化合物或其药学上可接受的盐。这可以通过以下方式实现,例如但不限于手术期间局部输注,表面涂敷如手术后与创伤敷料一起表面涂敷,注射,经导管,以栓剂方式,或以植入物方式,所述植入物是多孔的、无孔的或凝胶材料,包括膜如sialastic膜,或纤维。在一个具体实施方案中,化合物局部施用于受肝癌影响的肝的一或多个部位。
在某些实施方案中,可能期望将所述化合物或其药学上可接受的盐以任何合适的途径导入中枢神经系统,所述方式包括心室内、胸内和硬膜外注射。心室内注射可以用心室内导管辅助,例如与储药器如Ommaya储药器连接的导管。
也可以经肺施用,例如使用吸入器或喷雾器,和带气溶胶化剂的制剂,或经在氟碳或合成肺表面活性剂中灌输。在某些实施方案中,所述化合物及其药学上可接受的盐可以与传统粘合剂和赋形剂如甘油三酯一起配制成栓剂。
在另一个实施方案中,所述化合物及其药学上可接受的盐可以在小泡中尤其是脂质体中递送(见Langer,1990,Science 2491527-1533;Treat et al.,in Liposomes inthe Therapy of Infectious Disease and Cancer,Lopez-Berestein and Fidler(eds.),Liss,New York,pp.353-365(1989);Lopez-Berestein,同前,pp.317-327;一般的见前)。
在另一个实施方案中,所述化合物及其药学上可接受的盐可以在控释系统中递送(例如见Goodson,in Medical Applications of Controlled Release,同上,vol.2,pp.115-138(1984))。也可以使用以下综述中讨论的其它控释系统Langer,1990,Science2491527-1533。在一个实施方案中,可以使用泵(见Langer,同上;Sefton,1987,CRCCrit.Ref.Biomed.Eng.14201;Buchwald et al.,1980,Surgery 88507;Saudek et al.,1989,N.Engl.J.Med.321574)。在另一个实施方案中,可以使用聚合物材料(见Medical Applications of Controlled Release,Langer and Wise(eds.),CRC Pres.,BocaRaton,Florida(1974);Controlled Drug Bioavailability,Drug Product Design andPerformance,Smolen and Ball(eds.),Wiley,New York;Ranger and Peppas,1983,J.Macromol.Sci.Rev.Macromol.Chem.2361;也见Levy et al.,1985,Science 228190;During et al.,1989,Ann.Neurol.25351;Howard et al.,1989,J.Neurosurg.71105)。在另一个实施方案中,控释系统可以放置在所述化合物或其药学上可接受的盐的靶RNA附近,从而只需要系统性剂量的若干分之一。
本文所述化合物可以引入适于施用的药物组合物中。这些组合物通常包含活性化合物和药学上可接受的载体。本文所用表述“药学上可接受的载体”包括任何和所有的与药物施用相容的溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗和吸收延迟剂等。对于药物活性物质使用的这些介质和试剂在本领域公知。考虑在组合物中使用不与所述活性化合物相容的任何常规介质或试剂以外的介质和试剂。也可以向组合物中引入辅助性活性化合物。
本发明包括制备用于调节感兴趣多肽或核酸的表达或活性的药物组合物的方法。这样的方法包括将药学上可接受的载体与调节感兴趣多肽或核酸的表达或活性的药剂一起配制。这种组合物还可以包括其他的活性剂。因此,本发明还包括通过将药学上可接受的载体与调节感兴趣多肽或核酸的表达或活性的药剂以及一或多种另外的活性化合物一起配制来制备药物组合物的方法。
本发明的药物组合物配制成与其期望的给药途径相容。给药途径的实例包括胃肠道外给药,如静脉内、皮内、皮下、经口(如吸入)、透皮(外用)、透粘膜和直肠给药。优选静脉内给药。用于胃肠道外、皮内或皮下应用的溶液或悬剂可以包括以下成分无菌稀释剂如注射用水、盐水溶液、不挥发性油、聚乙二醇、甘油、丙二醇或其它合成溶剂;抗细菌剂如苯甲醇或对羟基苯甲酸甲酯(methyl parabens);抗氧化剂如抗坏血酸或亚硫酸氢钠;鳌合剂如乙二胺四乙酸;缓冲剂如乙酸盐、柠檬酸盐或磷酸盐,和渗透压调节剂如氯化钠或右旋糖。pH可以用酸或碱如盐酸或氢氧化钠调节。胃肠道外制剂可以密封于安瓿、可弃型注射器或玻璃或塑料制造的多剂量小管中。
适于注射用途的药物组合物包括无菌水溶液(当可以水溶时)或分散液和用于即时制备无菌注射溶液或分散液的无菌粉末。对于静脉内给药,合适的载体包括生理盐水、抑菌水、Cremophor ELTM(BASF;Parsippany,NJ)或磷酸盐缓冲液(PBS)。在所有情况下,组合物必须是无菌的,并且应该是一定程度上存在易注射性的流体。它必须在制造和保存条件下是稳定的,并且必须抗微生物如细菌和真菌的污染作用。载体可以是溶剂或分散介质,其中例如含有水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等),及其合适的混合物。例如,可以通过使用包衣如卵磷脂,对于分散体系通过维持需要的颗粒大小并通过使用表面活性剂,可以维持适当的流动性。多种抗细菌和抗真菌剂,例如对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞等可以实现阻止微生物的作用。在很多情况下,组合物中将优选包括等渗剂,例如糖、多元醇如甘露醇、山梨醇、氯化钠。通过在组合物中包括延迟吸收的成分例如单硬脂酸铝和明胶可以实现注射组合物的吸收时间延长。
通过将需要量的活性化合物(如多肽或抗体)引入适当溶剂中,如果需要其中还引入一种成分或成分的组合,然后过滤除菌,从而可以制备无菌注射溶液。一般来说,可以通过将活性化合物引入无菌赋形剂中来制备分散体系,所述赋形剂中含有基础分散介质和需要的上述其它成分。对于用于制备无菌注射溶液的无菌粉末,优选的制备方法是真空干燥和冷冻干燥预先无菌过滤的溶液,从而获得活性成分和另外的期望成分的粉末。
经口组合物一般包括惰性稀释剂或可食性载体。它们可以密封在明胶胶囊中或压成片剂。对于经口治疗性施用的目的,活性化合物可以与赋形剂掺在一起并以片剂、锭剂或胶囊形式使用。经口组合物还可以用流动载体制备,用作漱口剂,其中流动载体中的化合物经口使用和漱口并吐出或吞咽下。
药学上相容性粘合剂和/或辅助材料可以作为组合物的一部分被包括在内。片剂、丸剂、胶囊、锭剂等可以含有以下任何一种的成分或相似性质的化合物粘合剂如微晶纤维素、黄芪胶或明胶;赋形剂如淀粉或乳糖,崩解剂如海藻酸、Primogel或玉米淀粉;润滑剂如硬脂酸镁或Sterotes;助流剂如胶体二氧化硅;甜味剂如蔗糖或糖精;或调味剂如薄荷、水杨酸甲酯或橙味香精。
对于吸入给药,化合物以气溶胶喷雾的形式从含有合适推进剂的压力容器或分配器中或喷雾器中出来,所述推进剂例如气体如二氧化碳。
也可以通过透粘膜或透皮方式系统性给药。对于透粘膜或透皮给药,可以在制剂中使用对于待透过屏障适当的通透剂。这些通透剂是本领域公知的,对于透粘膜给药例如包括去污剂、胆汁盐和梭链孢酸衍生物。透粘膜给药可通过使用喷鼻剂或栓剂实现。对于透皮给药,活性化合物配制成本领域公知的软膏、油膏、凝胶或乳霜。
化合物还可以制备成栓剂形式(如用常规栓剂基质如可可脂和其它甘油三酯)或用于直肠递送的保留灌肠剂。
在一个实施方案中,活性化合物与保护化合物免于从身体快速清除的载体一起制备,如控释配方,包括植入物和微胶囊化递送系统。可以使用生物降解性、生物相容性聚合物,如乙烯-醋酸乙烯共聚物、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。制备这些制剂的方法对于本领域技术人员将是显而易见的。所述材料还可以从AlzaCorporation和Nova Pharmaceuticals,Inc.商业获得。脂质体悬液(包括用抗病毒抗原的单克隆抗体靶向受感染细胞的脂质体)也可以用作药学上可接受的载体。这些可以根据本领域技术人员已知的方法制备,如美国专利No.4,522,811所述。
特别有利的是将经口或胃肠道外组合物配制成剂量单位形式,以便于给药和剂量均一性。本文所用的剂量单位形式表示适用作单位剂量给予待治疗对象的物理分离的单位;每个单位含有经计算产生期望治疗效果的预定量的活性化合物以及需要的药学上可接受的载体。本发明剂量单位形式的规格遵从并直接依赖于活性化合物的独特性质和要获得的具体治疗效果,以及混合这样的活性化合物用于个体治疗领域中固有的限制。
对于抗体,优选的剂量是0.1mg/kg-100mg/kg体重(更优选0.1-20mg/kg、0.1-10mg/kg或0.1-1.0mg/kg)。如果抗体在脑内起作用,通常50mg/kg-100mg/kg的剂量是适当的。一般来说,部分人抗体和完全人抗体比其它抗体在人体内具有更长半衰期。因此,更低剂量和更少频次的给药经常是可能的。修饰如脂化可用于稳定抗体并增强摄入和组织通透性(如脑中)。脂化抗体的方法由Cruikshank等人描述(1997,J.Acquired Immune Deficiency Syndromes and Human Retrovirology 14193)。
在一个具体实施方案中,蛋白质或多肽的有效量(即有效剂量)范围是约0.001mg/kg-30mg/kg体重,优选约0.01-25mg/kg体重,更优选0.1-20mg/kg体重,甚至更优选0.1-1.0mg/kg、1-10mg/kg、2-9mg/kg、3-8mg/kg、4-7mg/kg或5-6mg/kg体重。
技术人员将知道某些因素可以影响有效治疗对象需要的剂量,包括但不限于疾病或病症的严重程度、之前的治疗、一般健康状况和/或对象的年龄以及是否存在其它疾病。而且,用治疗有效量的蛋白质、多肽或抗体治疗对象可以包括单个治疗,或优选的是可以包括一系列治疗。
除了上述化合物以外,本发明包括调节感兴趣核酸或多肽的表达或活性的小分子的用途。小分子的非限制性实例包括肽、肽模拟物、氨基酸、氨基酸类似物、多核苷酸、多核苷酸类似物、核苷酸、核苷酸类似物、分子量小于约10,000g/mol的有机或无机化合物(即包括异源有机化合物和有机金属化合物)、分子量小于约5,000g/mol的有机或无机化合物、分子量小于约1,000g/mol的有机或无机化合物、分子量小于约500g/mol的有机或无机化合物,和盐、酯及这些化合物的其它药学上可接受的形式。
可以理解,小分子药剂的适当剂量依赖于具有普通技术的医生、兽医或研究人员知识范围内的很多因素。小分子的剂量的变化例如将依赖于被处理的对象或样品的身份、大小和状况而变化,还取决于待给药的组合物的途径(如果适用的话),以及医生期望小分子对本发明核酸或多肽的作用。示例性剂量包括毫克或微克量的小分子每千克对象或样品重量(如约1微克/千克到约500毫克/千克、约100微克/千克到约5毫克/千克,或约1微克/千克到约50微克/千克)。而且可以理解,小分子的适当剂量依赖于所述小分子对待调节的表达或活性的功效。这些适当剂量可以用本文所述测试确定。当一或多种这些小分子给予对象(如人)以调节本发明多肽或核酸的表达或活性时,医生、兽医或研究人员例如可以首先开相对低剂量的处方,随后增加剂量直至获得适当反应。此外,可以理解对于任何特定动物对象的具体剂量水平将依赖于多种因素,包括所使用具体化合物的活性、对象的年龄、体重、一般健康状况、性别和饮食、给药时间、给药途径、排泄速率、任意药物组合和待调节的表达或活性的程度。
所述药物组合物可以与给药说明一起包括在容器、包装或分配器中。
5.17试剂盒本发明提供试剂盒,以测定至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的蛋白质和RNA产物的表达。这些试剂盒包含测定这些蛋白质和RNA产物的表达所需要的材料和试剂。在具体实施方案中,所述试剂盒还可以包含所述多种方法中使用的一或多种其它试剂,如(1)从血中纯化RNA的试剂;(2)产生受试核酸的引物;(3)dNTP和/或rNTP(预混或分离的),任选地具有一或多种独特标记的dNTP和/或rNTP(如生物素化或带Cy3或Cy5标签的dNTP);(4)合成后标记试剂,如荧光染料的化学活性衍生物;(5)酶,如逆转录酶、DNA聚合酶等;(6)多种缓冲介质,如杂交和洗涤缓冲剂;(7)标记探针纯化试剂和成分,如离心柱等;和(8)蛋白质纯化试剂;(9)信号产生和检测试剂,如链亲合素-碱性磷酸酶偶联物、化学荧光或化学发光底物等。在具体实施方案中,所述试剂盒包含从样品(如血)中分离以用作对照的预标记的质量控制蛋白质和/或RNA。
在一些实施方案中,试剂盒是RT-PCR试剂盒。在另一些实施方案中,试剂盒是核酸阵列和蛋白质阵列。根据本发明的这些试剂盒将至少包含具有本发明的相关蛋白质或核酸成员的阵列及其包装物。作为替代方案,本发明的蛋白质或核酸成员可以预包装到阵列上。
在一些实施方案中,试剂盒是定量RT-PCR试剂盒。在一个实施方案中,定量RT-PCR试剂盒包括以下(a)用于扩增本发明生物标志物的各种组合的引物;(b)缓冲剂和酶,包括逆转录酶;(c)一或多种热稳定聚合酶;和(d)SybrGreen。在一个优选实施方案中,本发明的试剂盒还包括(a)参考对照RNA和(b)带标记的(spiked)对照RNA。
本发明提供可用于诊断肝癌的试剂盒。例如,在本发明一个具体实施方案中试剂盒包含正向和反向引物,其中正向和反向引物的设计使得可以定量与表2中鉴定的各种生物标志物对应的所有种类mRNA的表达。在某些实施方案中,至少一种引物设计为跨外显子连接处。
本发明提供的用于检测、诊断、监测和预测肝癌的试剂盒基于样品中至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的蛋白质和RNA产物的表达。在某些实施方案中,这些试剂盒不包括测定已经被现有技术暗示与肝癌有关的本发明生物标志物的蛋白质或RNA产物表达的材料和试剂。在另一些实施方案中,这些试剂盒包括测定已经被现有技术暗示与肝癌有关的本发明生物标志物和本发明生物标志物以外的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或更多基因的蛋白质或RNA产物表达的材料和试剂。
本发明提供的用于监测对象所接受的一或多种治疗的效果的试剂盒基于样品中至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的蛋白质和RNA产物的表达。在某些实施方案中,这些试剂盒不包括测定已经被现有技术暗示与肝癌有关的本发明生物标志物的蛋白质或RNA产物表达的材料和试剂。在另一些实施方案中,这些试剂盒包括测定已经被现有技术暗示与肝癌有关的本发明生物标志物和本发明生物标志物以外的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、或更多基因的蛋白质或RNA产物表达的材料和试剂。
本发明提供的用于确定对象是否对治疗有反应的试剂盒基于样品中至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的蛋白质和RNA产物的表达。在某些实施方案中,这些试剂盒不包括测定已经被现有技术暗示与肝癌有关的本发明生物标志物的蛋白质或RNA产物表达的材料和试剂。在另一些实施方案中,这些试剂盒包括测定已经被现有技术暗示与肝癌有关的本发明生物标志物和本发明生物标志物以外的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少15种、至少20种、至少25种或更多基因的蛋白质或RNA产物表达的材料和试剂。
本发明提供测定样品中至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的RNA产物的表达的试剂盒。在一个具体实施方案中,这些试剂盒包含测定本发明生物标志物的RNA产物表达必需的材料和试剂。例如,可以制备用于肝癌的微阵列或RT-PCR试剂盒,并且其仅含有测定至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的RNA产物的水平必需的试剂和材料。作为替代方案,在一些实施方案中,所述试剂盒可以包含不限于测定1、2、3、4、5、6、7、8、9、10、12、15、20、25个或全部或任意组合的本发明生物标志物的RNA产物的水平需要的那些材料和试剂。例如,除了测定至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物的RNA产物的水平必需的试剂和材料以外,微阵列试剂盒还可以含有测定未必与肝癌相关或未必是肝癌指标的RNA产物的水平所需的材料和试剂。在一个具体实施方案中,微阵列或RT-PCR试剂盒含有测定以下的RNA产物的水平所需的试剂和材料至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少12种、至少15种、至少20种、至少25种或全部或任意组合的本发明生物标志物,以及本发明生物标志物以外的1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450个或更多基因,或本发明生物标志物以外的1-10、1-100、1-150、1-200、1-300、1-400、1-500、1-1000、25-100、25-200、25-300、25-400、25-500、25-1000、100-150、100-200、100-300、100-400、100-500、100-1000、500-1000个基因。
对于核酸微阵列试剂盒,所述试剂盒通常包含附着到固相支持物表面的探针。所述探针可以用可检测的标记物标记。在一个具体实施方案中,探针特异性针对1、2、3、4、5、6、7、8、9、10、12、15、20或25个或全部或任意组合的本发明生物标志物的RNA产物的外显子、内含子、外显子连接处或外显子-内含子连接处。所述微阵列试剂盒可以包含实施测试的说明和解释与分析实施测试所得数据的方法。在一个具体实施方案中,所述试剂盒包含诊断肝癌的说明。所述试剂盒还可以包含杂交试剂和/或检测当探针与靶核酸序列杂交时所产生信号必需的试剂。一般来说,微阵列试剂盒的材料和试剂处于一或多个容器中。试剂盒的每种组分一般在各自的合适容器中。
对于RT-PCR试剂盒,试剂盒通常包含预选的引物,它们特异性针对1、2、3、4、5、6、7、8、9、10、12、15、20、25个或全部或任意组合的本发明生物标志物的特定RNA产物(如外显子、内含子、外显子连接处或外显子-内含子连接处)。RT-PCR试剂盒还可以包含适于逆转录和/或扩增核酸的酶(例如聚合酶,如Taq),和逆转录和扩增的反应混合物需要的脱氧核苷酸和缓冲液。RT-PCR试剂盒还可以包含特异性针对1、2、3、4、5、6、7、8、9、10、12、15、20、25个或全部或任意组合的本发明生物标志物的RNA产物的探针。所述探针可以标记或不标记可检测标记物(如荧光标记物)。RT-PCR试剂盒的每种组分一般在各自的合适容器中。因此,这些试剂盒通常包含适于每种相应试剂、酶、引物和探针的不同容器。而且,RT-PCR试剂盒可以包含实施测试的说明和解释与分析实施测试所得数据的方法。在一个具体实施方案中,所述试剂盒含有诊断肝癌的说明。
在一个具体实施方案中,所述试剂盒是实时RT-PCR试剂盒。这种试剂盒可以包含96孔板和SYBR Green检测所需的材料和试剂。所述试剂盒可以包含可以使用β-肌动蛋白校正结果的试剂和材料。所述试剂盒还可以包含对照,如水、磷酸盐缓冲液和噬菌体MS2 RNA。而且,所述试剂盒可以包含实施测试的说明和解释与分析实施测试所得数据的方法。在一个具体实施方案中,说明中指出应该在差别如5倍到10倍的两个浓度检查1、2、3、4、5、6、7、8、9、10、15、20、25个或全部或任意组合的本发明生物标志物的RNA产物水平。
对于基于抗体的试剂盒,试剂盒例如可以包含(1)第一抗体(可以与固相支持物附着或不附着),它结合感兴趣蛋白质(如1、2、3、4、5、6、7、8、9、10、12、15、20、25个或全部或任意组合的本发明生物标志物的蛋白质产物);和任选地(2)不同的第二抗体,它结合所述蛋白质或第一抗体,并与可检测标记物(如荧光标记物、放射性同位素或酶)偶联。基于抗体的试剂盒还可以包含进行免疫沉淀的珠子。基于抗体的试剂盒的每种组分一般在各自的合适容器中。因此,这些试剂盒通常包含适于每种抗体的不同容器。而且,基于抗体的试剂盒可以包含实施测试的说明和解释与分析实施测试所得数据的方法。在一个具体实施方案中,试剂盒含有诊断肝癌的说明。
5.19SNP单核苷酸多态性(SNP)是不同个体的基因组中特定位置处的单个核苷酸变异。在基因组DNA的编码区和非编码区中都发现有SNP。尽管可以评价的表型极少,但在人基因组中发现大量的SNP(Cooper et al.,Hum Genet 69210-205,1985)。SNP是在基因中经常发现的稳定遗传性变异,并且对生物中发现的各种表型变异有贡献。单核苷酸多态性(SNP)在鉴定很多遗传病以及表型特征中可以具有预测价值。例如已知某些SNP导致引起疾病的突变,如与遗传性乳癌相关的SNP(Cannon-Albrightand Skolnick,Semin Oncol 231-5,1996)。
可以用本领域公知的多种方法鉴定生物体DNA中的SNP,包括但不限于通过DNA测序、通过扩增PCR产物并测序PCR产物、通过寡核苷酸连接测定(OLA)、通过双码OLA(Doublecode OLA)、通过单碱基延伸测定、通过等位基因特异性引物延伸或通过错配杂交来鉴定SNP。
通过鉴定到在患有肝癌的个体血中差异表达的基因集合,本发明提供更集中而有效的筛选SNP以鉴定与肝癌特异性相关的那些SNP的方法。在本发明的一个方面中,选择的待筛选的SNP是表1和3中所列基因中发现的那些SNP。在本发明的另一个方面中,待筛选的SNP是图3中列出的那些SNP。在本发明的又一个方面中,可以用上述方法在疾病相关的生物标志物中鉴定新SNP。
具体地说,本发明关注通过仅筛选本文鉴定的生物标志物中的那些SNP而鉴定与肝癌相关的SNP的方法。用本文公开的方法鉴定的那些SNP将是方便的诊断标志物。鉴定与肝癌相关的SNP的一个优选方面涉及从样品如成群个体的血中分离DNA,筛选图3中鉴定的SNP基因以鉴定一或多种SNP作为肝癌的诊断标志物,所述个体中的一些已被诊断患有肝癌,那些个体中的一些不患有肝癌。更具体地说,如果患有肝癌的个体在SNP基因座处相对于不患有肝癌的个体具有不同的多态性,则SNP被认为是肝癌相关的SNP。而且,如果发现SNP的特定多态性以比不患有肝癌的个体统计学显著更高的频率存在于患有肝癌的个体中,则特定的SNP被认为对肝癌具有诊断性。统计学显著性指标包括p<0.05,p<0.001,p<0.01和p<0.10。然而,本发明不限于从图3中鉴定肝癌诊断性SNP,包括在表1和2中所列肝癌生物标志物基因中鉴定新SNP的方法,和确定它们对肝癌的诊断价值的方法。
将会理解,优选的样品是血,但这些方法包括可以从中获得DNA的任何样品,包括上皮细胞、口腔细胞、毛发、唾液、组织细胞等。有很多可用于获得并保存组织和/或血液样品的方法。这些替代性方法允许以适于从样品中回收基因组DNA以进行基因型分析的形式保存并运输组织和血液样品。可以将DNA样品收集并保存于多种固体介质上,包括Whatmann纸、Guthrie卡、管、药签、滤纸、载片或其它容器。当将全血收集在滤纸上时,例如,它可以在室温干燥并保存。
在本发明的另一个方面中,肝癌相关的SNP可以从表1和2中所列肝癌生物标志物基因的RNA转录本中鉴定,而不是从基因组DNA中鉴定。在一个实施方案中,从患有和不患有给定疾病或病症的个体的样品如血中分离RNA,并将这些肝癌生物标志物基因编码的转录本逆转录成cDNA。扩增并分析cDNA以确定肝癌生物标志物基因中是否存在SNP。然后可以通过比较患有肝癌的个体与不患有肝癌的个体中差异表达的肝癌相关的生物标志物基因中鉴定的各种SNP的分布,鉴定肝癌相关的SNP。在这种实施方案的进一步变换方案中,不分析cDNA中是否存在SNP,而是分析疾病特异性生物标志物基因的RNA转录本或其扩增产物中是否存在SNP。
分析包含肝癌生物标志物基因的基因组DNA具有在编码区以及调节区中鉴定SNP的潜力,所述调节区可能对所述基因表达水平的变化有贡献。分析cDNA编码的SNP具有仅鉴定肝癌生物标志物基因的编码区中SNP的能力,这可能有助于解析肝癌的基于蛋白质的机制。分析cDNA编码的SNP的方法可以通过分析本文所述RT-PCR反应中产生的cDNA进行,所述RT-PCR反应用于鉴定患者和非患者的样品中生物标志物的水平。
肝癌相关的SNP可以通过本领域技术人员公知的很多方法在肝癌生物标志物基因的DNA中鉴定(例如见美国专利No.6,221,592和5,679,524),包括但不限于经以下方法鉴定SNPPCR或DNA扩增、寡核苷酸连接测定(OLA)(Landegren et al.,Science 2411077,1988)、双码OLA、错配杂交、质谱、单碱基延伸测试、(US6638722)、基于等位基因特异性限制性内切酶切割的RFLP检测(Kan and Dozy,Lancetii910-912,1978)、用等位基因特异性寡核苷酸探针杂交(Wallace et al.,Nucl AcidsRes 63543-3557,1978)、包括固定化寡核苷酸(Saiki et al.,Proc Natl Acad Sci USA866230-6234,1989)或寡核苷酸阵列(Maskos and Southern,Nucl Acids Res212269-2270,1993)、等位基因特异性PCR(Newton et al.,Nucl Acids Res 172503-16,1989)、错配修复检测(MRD)(Faham and Cox,Genome Res 5474-482,1995)、MutS蛋白的结合(Wagner et al.,Nucl Acids Res 233944-3948,1995)、单链构象多态性检测(Orita et al.,Genomics 5874-879,1983)、错配碱基对处的RNA酶切割(Myers et al.,Science 2301242,1985)、化学品(Cotton et al.,Proc Natl Acad SciUSA 854397-4401,1988)或酶促(Youil et al.,Proc Natl Acad Sci USA 9287-91,1995)切割异源双链DNA、基于等位基因特异性引物延伸的方法(Syvanen et al.,Genomics8684-692,1990)、遗传位分析(GBA)(Nikiforov et al.,Nuci Acids Res 224167-4175,1994)和用本领域公知的标准方法进行放射性和/或荧光DNA测序。
筛选SNP的亚组以鉴定肝癌生物标志物基因中肝癌相关SNP的本发明方法还包括DNA的非PCR方法。这些方法包括连接酶链式反应(“LCR”),公开于欧洲专利申请No.320,308;Qβ复制酶,描述于PCT专利申请No.PCT/US87/00880;等温扩增方法,Walker et al.(Nucleic Acids Res 20(7)1691-6,1992);链置换扩增(SDA),描述于美国专利No.5,712,124、5,648,211和5,455,166;循环探针反应;基于转录的扩增,包括基于核酸序列的扩增(NASBA)和3SR,Kwoh et al.,Proc Natl Acad SciUSA,861173-77,1989;PCT专利申请WO 88/10315 et al.,1989;其它扩增方法,如描述于英国专利申请No.GB 2,202,328,和PCT专利申请No.PCT/US89/01025,Davey et al.,欧洲专利申请No.329,822,Miller et al.,PCT专利申请WO 89/06700;“race”和“one-sided PCR.TM.”,描述于Frohman,InPCR ProtocolsA Guide ToMethods And Applications,Academic Press,N.Y.,1990;基于在具有所得“双寡核苷酸”序列的核酸存在下连接两种(或更多种)寡核苷酸的方法,描述于Wu et al.,Genomics 4560-569,1989。
尽管一般认为所用聚合酶将是热稳定的,但非热稳定的聚合酶也可以用于本发明公开的内容中。聚合酶和可用于此处公开内容的核酸修饰酶的实例包括热稳定聚合酶OmniBase测序酶、Pfu DNA聚合酶、Taq DNA聚合酶、Taq DNA聚合酶(测序级)、TaqBead热启动聚合酶、AmpliTaq Gold、Vent DNA聚合酶、Tub DNA聚合酶、TaqPlus DNA聚合酶、Tfl DNA聚合酶、Tli DNA聚合酶、Tth DNA聚合酶;DNA聚合酶DNA聚合酶I、Klenow片段、外切核酸酶Minus、DNA聚合酶I、DNA聚合酶I大(Klenow)片段、末端脱氧核苷酰转移酶、T7 DNA聚合酶、T4 DNA聚合酶;逆转录酶AMV逆转录酶和M-MLV逆转录酶;T4 DNA连接酶和T4多核苷酸激酶。
掺入引物、扩增期间掺入扩增产物或与探针连接的识别基团可用于鉴定扩增分子。很多不同的标记物可用于这种目的,例如荧光物质、发色物质、放射性同位素、酶标签、抗体、化学发光、电发光、亲合标记物等。本领域技术人员将认识到这些和本文未提及的其它荧光物质也可以成功用于本公开内容。亲合标记物的实例包括但不限于以下抗体、抗体片段、受体蛋白、激素、生物素、DNP或与亲合标记物结合并可用于分离扩增基因的任何多肽/蛋白质。酶标记物的实例包括酶标签,如脲酶、碱性磷酸酶或过氧化物酶。另外,比色指示底物可用于提供人眼或分光光度计可观察的检测手段,以鉴定与含互补性核酸的样品的特异性杂交。所有这些实例都是本领域公知的,并且技术人员将认识到本公开不限于上述实例。具体考虑将以下荧光物质用于本公开中Alexa 350、Alexa 430、AMCA、BODIPY 630/650、BODIPY 650/665、BODIPY-FL、BODIPY-R6G、BODIPY-TMR、BODIPY-TRX、Cascade Blue、Cy2、Cy3、Cy5、6-FAM、荧光素、HEX、6-JOE、Oregon Green 488、Oregon Green 500、Oregon Green 514、Pacific Blue、REG、Rhodamine Green、Rhodamine Red、ROX、TAMRA、TET、四甲基罗丹明和德克萨斯红。
在本公开中,具体考虑用DNA芯片或微阵列分析所公开方法的DNA扩增产物以检测SNP。然后可以将扩增的DNA产物通过含寡核苷酸或多核苷酸探针的DNA芯片或微阵列。扩增的DNA能或不能与微阵列或DNA芯片杂交将有助于表征编码样品中存在的转录本的生物标志物基因中是否存在SNP。
以下实施例不是限制性的,而仅仅是本发明多个方面和特性的代表。
5.18实施例实施例1从裂解血中分离RNA将10ml全血收集于Vacutainer中并在4℃以2,000rpm离心5分钟,除去血浆层。以3份裂解缓冲液比1份血的比例加入裂解缓冲液(裂解缓冲液(1L)0.6g EDTA;1.0g KHCO2,8.2g NH4Cl,用NaOH调节到pH7.4)。混合样品放置于冰上5-10分钟直至透明。在4℃以1000rpm离心裂解的样品10分钟,并吸弃上清液。将沉淀重悬于5ml裂解缓冲液,在4℃以1000rpm再次离心裂解的样品10分钟。以每10ml原始血样大致6ml TRIzol的比例用TRIzol(GIBCO/BRL)匀浆沉淀细胞并充分振荡。样品在室温静置5分钟。用1.2ml氯仿/1ml TRIzol提取RNA。在4℃以12,000×g离心样品5分钟并收集上层。按0.5ml/1ml TRIzol的比例向上层中加入异丙醇。样品于-20℃静置过夜或在-20℃放置1小时。根据已知方法沉淀RNA,空气干燥RNA沉淀,并将沉淀重悬于DEPC处理的ddH2O中。RNA样品也可以保存于75%乙醇中,在此条件下样品在室温下稳定,以便运输。
实施例2从全血中分离RNA100μl全血收集于微离心管中,在4℃以2,000rpm(800g)离心5分钟,去除上清液。以每10μl原始血样大致6μl TRIzol的比例用TRIzol(GIBCO/BRL)匀浆沉淀细胞并充分振荡。样品在室温静置5分钟。用12μml氯仿/10μl TRIzol提取RNA。在4℃以12,000×g离心样品5分钟并收集上层。按5μl/10μl TRIzol的比例向上层中加入异丙醇。样品于-20℃静置过夜或在-20℃放置1小时。根据已知方法沉淀RNA,空气干燥RNA沉淀,并将沉淀重悬于DEPC处理的ddH2O中。RNA样品也可以保存于75%乙醇中,在此条件下样品在室温下稳定,以便运输。
从离心裂解血中分离RNA将10ml全血收集于Vacutainer中并在4℃以2,000rpm(800g)离心5分钟,除去血浆层。以3份裂解缓冲液比1份血的比例加入裂解缓冲液(裂解缓冲液(1L)0.6g EDTA;1.0g KHCO2,8.2g NH4Cl,用NaOH调节到pH7.4)。混合样品放置于冰上5-10分钟直至透明。在4℃以1000rpm离心裂解后样品10分钟,并吸弃上清液。沉淀重悬于5ml裂解缓冲液,在4℃以1000rpm再次离心裂解后样品10分钟。以每10ml原始血样大致6ml TRIzol的比例用TRIzol(GIBCO/BRL)匀浆沉淀细胞并充分振荡。样品在室温静置5分钟。用1.2ml氯仿/1ml TRIzol提取RNA。在4℃以12,000×g离心样品5分钟,并收集上层。按0.5ml/1ml TRIzol的比例向上层中加入异丙醇。样品于-20℃静置过夜或在-20℃放置1小时。根据已知方法沉淀RNA,空气干燥RNA沉淀,并将沉淀重悬于DEPC处理的ddH2O中。RNA样品也可以保存于75%乙醇中,在此条件下样品在室温下稳定,以便运输。
从无血清全血中分离RNA将10ml全血收集于Vacutainer中并在4℃以2,000rpm(800g)离心5分钟,除去血浆层。以每10ml原始血样大致6ml TRIzol的比例用TRIzol(GIBCO/BRL)匀浆沉淀细胞并充分振荡。样品在室温静置5分钟。用1.2ml氯仿/1ml TRIzol提取RNA。在4℃以12,000×g离心样品5分钟,并收集上层。按0.5ml/1ml TRIzol的比例向上层中加入异丙醇。样品于-20℃静置过夜或在-20℃放置1小时。根据已知方法沉淀RNA,空气干燥RNA沉淀,并将沉淀重悬于DEPC处理的ddH2O中。RNA样品也可以保存于75%乙醇中,在此条件下样品在室温下稳定,以便运输。
实施例3靶核酸制备和杂交从mRNA制备荧光DNA探针制备RNA的荧光标记的靶核酸样品,以用本发明的阵列进行分析。
通过在70℃加热10分钟,并在冰上冷却,将1μg Oligo-dT引物退火到总体积10μl的10μg总RNA上,所述总RNA从诊断患有肝癌或怀疑患有肝癌的患者的血中分离。在25μl体积中将样品在42℃孵育40分钟以逆转录mRNA,所述25μl体积中含有终浓度50mM Tris-HCl(pH8.3)、75mM KCl、3mM MgCl2、25mM DTT、25mM未标记dNTP、400单位Superscript II(200U/μl,BRL)和15mM Cy3或Cy5(Amersham)。通过加入2.5μl 55500mM EDTA和5μl 1M NaOH并在65℃孵育10分钟,从而终止反应。加入12.5μl 1M TrisHCl(pH7.6)中和反应混合物。
在Centricon-30微浓缩器(Amicon)中离心来纯化标记的靶核酸样品。如果两种不同的靶核酸样品(如来源于不同患者的两个样品)通过与同一阵列杂交进行分析和比较,每种靶核酸样品用不同的荧光标记物(如Cy3和Cy5)标记并分别浓缩。分别浓缩的靶核酸样品(Cy3和Cy5标记的)合并到新Centricon中,用500μl TE洗涤,并再次浓缩到少于7μl的体积。加入1μL 10μg/μl polyA RNA(Sigma,#P9403)和1μL 10μg/μl tRNA(GIBCO-BRL,#15401-011)并用蒸馏水调节体积到9.5μl。对于最终的靶核酸制备物,加入2.1μl 20×SSC(1.5M NaCl,150mM柠檬酸钠(pH8.0))和0.35μl 10%SDS。
杂交100℃加热2分钟变性标记的核酸,在37℃孵育20-30分钟,然后放置于核酸阵列上,用22mm×22mm盖玻片盖上。在用3×SSC的小储器维持湿润的定制玻片室中在65℃下杂交14-18小时。依次浸入含0.1%SDS的2×SSC、1×SSC和0.1×SSC中并搅拌2-5分钟洗涤阵列。最后,在Beckman GS-6台式离心机中在650 RPM 2分钟的Microlus载体中在玻片架中离心2分钟以干燥阵列。
实施例4实时RT PCR使用Qiagen的SYBRGreen试剂盒(产品号204143)对表1公开的基因进行实时RT PCR。表1中选择的基因的实验结果表示于以下实施例6。
可以使用一步(逆转录和PCR组合)或两步(首先逆转录,然后再进行PCR)法。在两步操作方案中,首先用Applied Biosystems的High-Capacity cDNA Archive试剂盒(产品号4322171)并根据其中使用的操作方案进行逆转录。
更具体地,将本文前面所述的纯化RNA与逆转录缓冲液、dNTP、随机引物和逆转录酶一起孵育,在25℃孵育10分钟,随后在37℃孵育2小时,所得混合物用作定量PCR的起始产物。
将逆转录获得的cDNA与按提供形式而不调节镁浓度的QuantiTect SYBRGreen PCR Master Mix一起孵育。不加入尿嘧啶-N-糖基化酶。加入5μM的对本发明基因特异性的正向引物和反向引物,孵育反应,并根据标准操作用ABI PRISM7700/ABI GeneAmp 5700/iCycler/DNA Engine Opticon监测。
表7用于实时RT PCR的引物
实施例5TAQMAN还可以用Qiagen的QuantiTectTM探针RT-PCR系统(产品号204343)组合对应感兴趣基因的TaqMan双标记探针和引物进行定量实时RT-PCR。可以从AppliedBiosystems Assays-On-DemandTM定购TaqMan探针和引物。
双标记探针同时含有荧光和淬灭分子。淬灭分子邻近荧光报告分子阻止报告分子发荧光,但在PCR延伸步骤期间,Taq DNA聚合酶的5’-3’核酸外切酶活性释放荧光分子使得它可以发荧光。因此,荧光的量与生成的PCR产物量相关。
实施例6统计分析实时PCR结果用已知方法统计分析对从分类为正常或患有肝癌的个体分离的血样进行的实时PCR分析,以确认公开为生物标志物的基因的有用性。
优选选择具有相似年龄和性别的个体进行进一步分析。可在年龄和性别基础上进行比较的样品选择用本领域技术人员已知的t-检验确定。
对年龄和性别匹配的约4-20个样品的组进行t-检验。对样品组中的每一个进行分析以确定所述组之间的变化倍数区别(见下表8)。图2示出对从离心裂解血分离的总RNA分析所述三种已鉴定生物标志物。
表8
实施例7特异性分析为了验证血中鉴定基因的特异性,我们验证了在肝癌和对照患者之间显示显著差异的四种基因的表达水平,并测试结肠癌和胃癌患者中的所述相同基因。CD14抗原(CD14)、α-synuclein(SNCA)和Clusterin(CLU)在HCC中显著高于对照中(分别是1.5、2.4和1.8倍)。CDC样激酶(CLK1)的基因表达水平在HCC中比对照中低30%(p=0.006)。
也检测了胃癌和结肠癌患者的血中这些基因的表达。除了CLU在结肠癌中被下调(p<0.05)(数据未示出)以外,没有显著变化。
实施例8用逻辑回归鉴定生物标志物组合用ABI High Capacity cDNA Archive试剂盒(Cat#4322171)在Perkin-ElmerDNA热循环仪上进行第一链cDNA合成。用Qiagen Quantitect SYBRGreen PCR试剂盒(Cat#204143)进行特定cDNA的定量,并用琼脂糖凝胶确认期望产物。在每个样品中,用其Ct值定量靶基因的表达水平,Ct值是扩增子可以与背景区分的浓度依赖的PCR循环数。通过减去管家基因β-肌动蛋白的Ct值,每个Ct值与内标相关。为了获得更大区分能力,用逻辑回归生成ΔCt的线性组合。用MedCalc(MedCalc;Mariakerke,Belgium)、XLSTAT(AddinSoft;Paris,France)和我们自己的软件经ROC(接受器工作特征)曲线分析定量评价所述组合的诊断准确性(即真与假阳性和真与假阴性报告的可能性)。分析用逻辑回归生成的分类符的ROC分析。ROC>0.9的分类符的实例表示于图6和图7。
实施例9本发明的分类符可以如上实施例8所述或用本文所述其它数学模型生成。例如图6所示的分类符写作以下
X=45.721-12.133*APLP2+13.946*CLK1-3.76*SNCA-2.88*TFEC为使用分类符进行诊断,测定测试个体的APLP2、CLK1、SNCA和TFEC的ΔCt(如实施例8概述)并代入以上等式。当x<0时测试个体被考虑诊断为对照(不患有肝癌)。与之相似,当x>0时测试个体被考虑诊断为患有肝癌。本领域技术人员将会理解,在等式X=-45.721+12.133*APLP2-13.946*CLK1+3.76*SNCA-2.88*TFEC中,当x>0时测试个体被考虑诊断为对照,当x<0时诊断为患有肝癌。
实施例10用图1所述的分离生物标志物分析与正常个体的基因表达谱相比肝癌个体血样的基因表达谱本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用TRIzol试剂(GIBCO)从每个患者的一滴血中分离总mRNA,然后制备每种血样的荧光标记探针,使探针变性并杂交到含有表1、表2或图1所述的每个基因的全长cDNA序列的微阵列上。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性杂交。通过用t-检验进行统计分析来确定与健康患者相比肝癌患者血样中所述三种基因的差异表达(GlantzSA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical PublishingDivision,2002)。
实施例11用图1所述3种基因的5’区分析与健康个体的基因表达谱相比肝癌个体血样的基因表达谱本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用TRIzol试剂(GIBCO)从每个患者的一滴血中分离总mRNA,然后制备每种血样的荧光标记探针,使探针变性并杂交到含有与表3、表4或图1所述3种基因的每个的5’区对应的长25个核苷酸的DNA序列的微阵列上。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性杂交。通过用t-检验进行统计分析来确定与健康患者相比肝癌患者血样中所述三种基因的差异表达(Glantz SA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical Publishing Division,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
实施例12用图1所述基因的3’区分析与健康个体的基因表达谱相比肝癌个体血样的基因表达谱本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用TRIzol试剂(GIBCO)从每个患者的一滴血中分离总mRNA,然后制备每种血样的荧光标记探针,使探针变性并杂交到含有与表3、表4或图1所述3种基因的每个的3’区对应的长50个核苷酸的DNA序列的微阵列上。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性杂交。通过用t-检验惊醒统计分析来确定与健康患者相比肝癌患者血样中所述三种基因的差异表达(Glantz SA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical Publishing Division,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
实施例13用图1所述基因的内部编码区分析与健康个体的基因表达谱相比肝癌个体血样的基因表达谱本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用TRIzol试剂(GIBCO)从每个患者的一滴血中分离总mRNA,然后制备每种血样的荧光标记探针,使探针变性并杂交到含有与表3、表4或图1所述3种基因的每个的内部编码区对应的长70个核苷酸的DNA序列的微阵列上。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性杂交。通过用t-检验进行统计分析确定与健康患者相比肝癌患者血样中所述三种基因的差异表达(Glantz SA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical Publishing Division,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
实施例14用抗由表3、表4或图1所述基因编码多肽的单克隆抗体分析与健康个体血样相比的肝癌个体血样本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用BD Clontech蛋白质提取和标记试剂盒(目录号#K1848-1或#631786)从每个患者获取的血中分离并标记总细胞蛋白质。简单的说,提取操作主要由三步组成机械破碎细胞、溶解细胞和离心提取物。操作可以从细胞沉淀或冷冻组织开始,并可以使用任何机械破碎方法-French press、超声、切碎或研磨。破碎以后,加入提取/标记缓冲液(1∶20w/v)溶解样品。因为该缓冲液为使用N-羟基琥珀酰亚胺(NHS)-酯染料(如Cy3和Cy5染料)标记而配制,它不含与染料反应竞争的任何蛋白酶抑制剂或还原剂。提取以后,离心样品以沉淀不溶物质如染色体DNA。然后用Cy3和Cy5荧光染料(单功能NHS-酯)标记可溶性提取物。然后将标记的蛋白质与单克隆抗体阵列一起孵育,所述单克隆抗体针对由表3、表4或图1所述三种基因编码的全长多肽。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性结合。通过用Wilcox Mann Whitney秩和检验进行统计分析确定与健康患者相比肝癌患者血样中所述三种基因的差异表达(GlantzSA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical PublishingDivision,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
实施例15用抗由表3、表4或图1所述基因的5’区编码的多肽氨基末端区的单克隆抗体,分析与健康个体的血样相比肝癌个体的血样本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用BD Clontech蛋白质提取和标记试剂盒(目录号#K1848-1或#631786)从每个患者获取的血中分离并标记总细胞蛋白质。简单的说,提取操作主要由三步组成机械破碎细胞、溶解细胞和离心提取物。操作可以从细胞沉淀或冷冻组织开始,并可以使用任何机械破碎方法-French press、超声、切碎或研磨。破碎以后,加入提取/标记缓冲液(1∶20w/v)溶解样品。因为该缓冲液为使用N-羟基琥珀酰亚胺(NHS)-酯染料(如Cy3和Cy5染料)标记而配制,它不含与染料反应竞争的任何蛋白酶抑制剂或还原剂。提取以后,离心样品以沉淀不溶物质如染色体DNA。然后用Cy3和Cy5荧光染料(单功能NHS-酯)标记可溶性提取物。然后将标记的蛋白质与单克隆抗体阵列一起孵育,所述单克隆抗体针对由表3、表4或图1所述基因的5’区编码的多肽的氨基末端区。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性结合。通过用WilcoxMann Whitney秩和检验进行统计分析确定与健康患者相比肝癌患者血样中所述三种基因的差异表达(Glantz SA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical Publishing Division,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
实施例16用抗由表3、表4或图1所述基因的3’区编码的多肽羧基末端区的单克隆抗体,分析与健康个体的血样相比肝癌个体的血样本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用BD Clontech蛋白质提取和标记试剂盒(目录号#K1848-1或#631786)从每个患者获取的血中分离并标记总细胞蛋白质。简单的说,提取操作主要由三步组成机械破碎细胞、溶解细胞和离心提取物。操作可以从细胞沉淀或冷冻组织开始,并可以使用任何机械破碎方法-French press、超声、切碎或研磨。破碎以后,加入提取/标记缓冲液(1∶20w/v)溶解样品。因为该缓冲液为使用N-羟基琥珀酰亚胺(NHS)-酯染料(如Cy3和Cy5染料)标记而配制,它不含与染料反应竞争的任何蛋白酶抑制剂或还原剂。提取以后,离心样品以沉淀不溶物质如染色体DNA。然后用Cy3和Cy5荧光染料(单功能NHS-酯)标记可溶性提取物。然后将标记的蛋白质与单克隆抗体阵列一起孵育,所述单克隆抗体针对由表3、表4或图1所述基因的3’区编码的多肽的羧基末端区。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性结合。通过用WilcoxMann Whitney秩和检验进行统计分析确定与健康患者相比肝癌患者血样中所述基因的差异表达(Glantz SA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical Publishing Division,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
实施例17用抗由表3、表4或图1所述基因的内部编码区编码的多肽的内部多肽区的单克隆抗体,分析与健康个体的血样相比肝癌个体的血样本实施例证明了要求保护的本发明通过检测与健康患者血样相比肝癌患者血样中的差异基因表达而诊断肝癌的用途。
血样取自如本文所述临床诊断患有肝癌的患者。然后分析基因表达谱,并与不受肝癌影响的患者的表达谱比较。在每种情况下,由熟练的执业医生确认肝癌诊断。
首先用BD Clontech蛋白质提取和标记试剂盒(目录号#K1848-1或#631786)从每个患者获取的血中分离并标记总细胞蛋白质。简单的说,提取操作主要由三步组成机械破碎细胞、溶解细胞和离心提取物。操作可以从细胞沉淀或冷冻组织开始,并可以使用任何机械破碎方法-French press、超声、切碎或研磨。破碎以后,加入提取/标记缓冲液(1∶20w/v)溶解样品。因为该缓冲液为使用N-羟基琥珀酰亚胺(NHS)-酯染料(如Cy3和Cy5染料)标记而配制,它不含与染料反应竞争的任何蛋白酶抑制剂或还原剂。提取以后,离心样品以沉淀不溶物质如染色体DNA。然后用Cy3和Cy5荧光染料(单功能NHS-酯)标记可溶性提取物。然后将标记的蛋白质与单克隆抗体阵列一起孵育,所述单克隆抗体针对由表3、表4或图1所述基因的内部编码区编码的多肽的内部多肽区。通过用GMS扫描仪418扫描并用Scananalyzer软件(Michael Eisen,Stanford University)处理试验数据,随后用GeneSpring软件(Silicon Genetics,CA)分析,从而测定检测与阵列的特异性结合。通过用WilcoxMann Whitney秩和检验进行统计分析确定与健康患者相比肝癌患者血样中所述基因的差异表达(Glantz SA.Primer of Biostatistics.5th ed.New York,USAMcGraw-Hill Medical Publishing Division,2002)。表3、表4或图1所述每种基因的差异表达可用于诊断肝癌。
序列表<110>基因信息公司<120>肝癌生物标志物<130>4231/2078<150>US 60/516,853<151>2003-11-03<160>46<170>PatentIn version 3.1<210>1<211>20<212>DNA<213>人工的<220>
<223>GOS2基因的正向引物<400>1gagaggagga gaacgctgag 20<210>2<211>19<212>DNA<213>人工的<220>
<223>GOS2基因的反向引物<400>2gaggcgggag tgaccttag 19<210>3<211>19<212>DNA<213>人工的<220>
<223>BCL2A1基因的正向引物<400>3ccccggatgt ggataccta 19<210>4<211>19<212>DNA<213>人工的<220>
<223>BCL2A1基因的反向引物<400>4attttcccag cctccgttt 19<210>5<211>22<212>DNA<213>人工的<220>
<223>C8FW的正向引物
<400>5cgctgcaagg tgtttcccat ta 22<210>6<211>22<212>DNA<213>人工的<220>
<223>C8FW的反向引物<400>6ggatcacttc cacaatgcca gt 22<210>7<211>22<212>DNA<213>人工的<220>
<223>APLP2的正向引物<400>7tggaggttga tccaatgctc ac 22<210>8<211>22<212>DNA<213>人工的<220>
<223>APLP2的反向引物<400>8tccctgccac ctaaatctgc at 22<210>9<211>22<212>DNA<213>人工的<220>
<223>CD14的正向引物<400>9tcacaagtgt gaagcctgaa gc 22<210>10<211>22<212>DNA<213>人工的<220>
<223>CD14的反向引物<400>10gcgctccatg gtcgataagt ct 22<210>11<211>20<212>DNA<213>人工的<220>
<223>CD5的正向引物
<400>11tgtactaacg ctgagctggt 20<210>12<211>23<212>DNA<213>人工的<220>
<223>CD5的反向引物<400>12agggtagatg tacctgaaac tga 23<210>13<211>20<212>DNA<213>人工的<220>
<223>CLEC2的正向引物<400>13caaccggaac attgtggagt 20<210>14<211>22<212>DNA<213>人工的<220>
<223>CLEC2的反向引物<400>14tctgagataa ccgagccatc ct 22<210>15<211>22<212>DNA<213>人工的<220>
<223>CLK1的正向引物<400>15actgggatga acacagttct gc 22<210>16<211>22<212>DNA<213>人工的<220>
<223>CLK1的反向引物<400>16gaggtcaaag agacgctcat gt 22<210>17<211>20<212>DNA<213>人工的<220>
<223>CLU的正向引物<400>17aacttccacg ccatgttcca 20<210>18<211>20<212>DNA<213>人工的<220>
<223>CLU的反向引物<400>18tcatcgtcgc cttctcgtat 20<210>19<211>20<212>DNA<213>人工的<220>
<223>CTSB的正向引物<400>19ccatgtaggg tgcagaccgt 20<210>20<211>22<212>DNA<213>人工的<220>
<223>CTSB的反向引物<400>20aggctcacag atcttgctac ac 22<210>21<211>21<212>DNA<213>人工的<220>
<223>CTTN(EMS1)的正向引物<400>21actatcccgc agaggacagc a21<210>22<211>19<212>DNA<213>人工的<220>
<223>CTTN(EMS1)的反向引物<400>22atctcatcat cgcccgcag 19<210>23<211>22<212>DNA<213>人工的
<220>
<223>FCN1的正向引物<400>23ggcagtgcgg gtaattctct aa 22<210>24<211>22<212>DNA<213>人工的<220>
<223>FCN1的反向引物<400>24ttgaagcatg acagtcggcg ta 22<210>25<211>22<212>DNA<213>人工的<220>
<223>IL23a的正向引物<400>25cagtcagttc tgcttgcaaa gg 22<210>26<211>20<212>DNA<213>人工的<220>
<223>IL23A的反向引物<400>26agtagggagg catgaagctg 20<210>27<211>22<212>DNA<213>人工的<220>
<223>IMP3的正向引物<400>27tcagttcaag gctcagggaa ga 22<210>28<211>22<212>DNA<213>人工的<220>
<223>IMP3的反向引物<400>28aactctgcca gcagcaaagg at 22<210>29<211>24<212>DNA<213>人工的
<220>
<223>ITGB3的正向引物<400>29agctcattgt tgatgcttat ggga 24<210>30<211>22<212>DNA<213>人工的<220>
<223>ITGB3的反向引物<400>30atacaagact tgaggccagg ga 22<210>31<211>26<212>DNA<213>人工的<220>
<223>KLRB1的正向引物<400>31ggatgaattg atacacacac agaacc 26<210>32<211>22<212>DNA<213>人工的<220>
<223>KLRB1的反向引物<400>32gagccgttta tccacttcca gt 22<210>33<211>20<212>DNA<213>人工的<220>
<223>OAS1的正向引物<400>33tgtggactgt tccaccaaca 20<210>34<211>22<212>DNA<213>人工的<220>
<223>OAS1的反向引物<400>34tggtaggact ttagcagctc gt 22<210>35<211>22<212>DNA
<213>人工的<220>
<223>OAS3的正向引物<400>35atgtgatgcc agccctcctt ta 22<210>36<211>20<212>DNA<213>人工的<220>
<223>OAS3的反向引物<400>36atcaacggcc ttgttcacct 20<210>37<211>26<212>DNA<213>人工的<220>
<223>RORA的正向引物<400>37ccttaggttg tgaagacttt attagc 26<210>38<211>19<212>DNA<213>人工的<220>
<223>RORA的反向引物<400>38ttgcagccat gagcgatct 19<210>39<211>20<212>DNA<213>人工的<220>
<223>RRAS2的正向引物<400>39aacgaccggc agagtttcaa 20<210>40<211>22<212>DNA<213>人工的<220>
<223>RRAS2的反向引物<400>40tgtgactcca gatctgcctt gt 22<210>41<211>22
<212>DNA<213>人工的<220>
<223>SNCA的正向引物<400>41tgggcaagaa tgaagaagga gc 22<210>42<211>22<212>DNA<213>人工的<220>
<223>SNCA的反向引物<400>42tgataccctt cctcagaagg ca 22<210>43<211>20<212>DNA<213>人工的<220>
<223>STK17B的正向引物<400>43acaggattgt cgggcagaaa 20<210>44<211>22<212>DNA<213>人工的<220>
<223>STK17B的反向引物<400>44tctccacctg cagcatattc ca 22<210>45<211>21<212>DNA<213>人工的<220>
<223>TFEC的正向引物<400>45aggacaacca caacctcatt g21<210>46<211>20<212>DNA<213>人工的<220>
<223>TFEC的反向引物<400>46tgttccagcg catatcagga 20
权利要求
1.包含两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸与至少两种本发明生物标志物选择性杂交,其中所述生物标志物选自表1所列出的以下基因β-淀粉样蛋白(A4)前体样蛋白2(APLP2);BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);补体成分5(C5);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);组织蛋白酶B(CTSB);cortactin(CTTN);ficolin(含有胶原/纤维蛋白原结构域)1(FCN1);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);IGF-II mRNA结合蛋白3(IMP-3);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);2’,5’-寡腺苷酸合成酶1(OAS1);2’-5’-寡腺苷酸合成酶3(OAS3);RAR相关孤儿受体A(RORA);相关的RAS病毒(r-ras)癌基因同源物2(RRAS2);α-synuclein(淀粉样蛋白前体的非A4组分(SNCA));人丝氨酸苏氨酸激酶17b(凋亡诱导型)(STK17B);转录因子EC(TFEC);杀伤细胞凝集素样受体亚家族B,其中所述组合物用于测定所述生物标志物的表达水平。
2.包含两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸与至少两种生物标志物的RNA产物选择性结合,其中所述生物标志物选自表1所列出的以下基因β-淀粉样蛋白(A4)前体样蛋白2(APLP2);BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);补体成分5(C5);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);组织蛋白酶B(CTSB);cortactin(CTTN);ficolin(含有胶原/纤维蛋白原结构域)1(FCN1);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);IGF-II mRNA结合蛋白3(IMP-3);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);2’,5’-寡腺苷酸合成酶1(OAS1);2’-5’-寡腺苷酸合成酶3(OAS3);RAR相关孤儿受体A(RORA);相关的RAS病毒(r-ras)癌基因同源物2(RRAS2);α-synuclein(淀粉样蛋白前体的非A4组分(SNCA));人丝氨酸苏氨酸激酶17b(凋亡诱导型)(STK17B);转录因子EC(TFEC)。
3.权利要求2的组合物,其中所述多核苷酸用于定量RT-PCR(QRT-PCR)。
4.包含两种或更多种分离蛋白质的集合的组合物,所述蛋白质与至少两种生物标志物的蛋白质产物选择性结合,其中所述生物标志物选自表1所列出的以下基因β-淀粉样蛋白(A4)前体样蛋白2(APLP2);BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);补体成分5(C5);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);组织蛋白酶B(CTSB);cortactin(CTTN);ficolin(含有胶原/纤维蛋白原结构域)1(FCN1);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);IGF-II mRNA结合蛋白3(IMP-3);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);2’,5’-寡腺苷酸合成酶1(OAS1);2’-5’-寡腺苷酸合成酶3(OAS3);RAR相关孤儿受体A(RORA);相关的RAS病毒(r-ras)癌基因同源物2(RRAS2);α-synuclein(淀粉样蛋白前体的非A4组分(SNCA));人丝氨酸苏氨酸激酶17b(凋亡诱导型)(STK17B);转录因子EC(TFEC)。
5.包含两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸与至少两种生物标志物选择性结合,其中所述生物标志物选自表2所列出的以下基因BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);或α-synuclein(淀粉样蛋白前体的非A4组分(SNCA))。
6.包含分离蛋白质的集合的组合物,所述分离蛋白质与生物标志物的蛋白质产物选择性结合,其中所述生物标志物选自表2所列出的以下基因BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);或α-synuclein(淀粉样蛋白前体的非A4组分(SNCA))。
7.包含分离多核苷酸的集合的组合物,所述多核苷酸与生物标志物的RNA产物选择性结合,其中所述生物标志物选自表2所列出的以下基因BCL2相关蛋白A1(BCL2A1);受致有丝分裂途径调节的磷酸化蛋白(C8FW);CD14抗原(CD14);C型凝集素样受体2(CLEC2);CDC样激酶1(CLK1);Clusterin(CLU);假想的淋巴细胞G0/G1开关基因(G0S2);白细胞介素23A(IL23A);杀伤细胞凝集素样受体亚家族B,成员1(KLRB1);或α-synuclein(淀粉样蛋白前体的非A4组分(SNCA))。
8.包含两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸与至少两种生物标志物的RNA产物选择性结合,其中所述RNA产物选自表3所列出的RNA转录本。
9.包含两种或更多种分离多核苷酸的集合的组合物,所述多核苷酸与至少两种生物标志物的RNA产物选择性结合,其中所述RNA产物选自表4所列出的RNA转录本。
10.包含两种或更多种分离蛋白质的集合的组合物,所述分离蛋白质与至少两种生物标志物的蛋白质产物选择性结合,其中所述蛋白质产物选自表3所列出的RNA转录本。
11.包含两种或更多种分离蛋白质的集合的组合物,所述分离蛋白质与至少两种生物标志物的蛋白质产物选择性结合,其中所述蛋白质产物选自表4所列出的RNA转录本。
12.权利要求3、5、9或10中任一项的组合物,其中所述分离蛋白质是配体。
13.权利要求3、5、9或10中任一项的组合物,其中所述配体是抗体。
14.权利要求12的组合物,其中所述抗体是单克隆抗体。
15.权利要求1、2、4、6、7或8中任一项的组合物,其中所述分离多核苷酸是单链或双链RNA。
16.权利要求1、2、4、6、7或8中任一项的组合物,其中所述分离多核苷酸是单链或双链DNA。
17.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,其中在步骤b)的比较中检测到所述一种或多种RNA转录本的每种的差异表达是步骤a)的个体中肝癌的指标。
18.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表2的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,其中在步骤b)的比较中检测到所述一种或多种RNA转录本的每种的相同水平是步骤a)的个体中癌症的指标。
19.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,c)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,d)确定步骤a)的所述一种或多种RNA转录本的水平相对于步骤c)的所述转录本的水平而言归类于步骤b)中所述转录本的水平,其中所述确定是步骤a)的所述个体患有肝癌的指标。
20.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,c)将根据步骤a)的所述血中所述一种或多种RNA转录本的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种RNA转录本的每种的水平进行比较,d)确定步骤a)的所述一种或多种RNA转录本的水平相对于步骤b)的所述转录本的水平而言归类于步骤c)中所述转录本的水平,其中所述确定是步骤a)的所述个体不患有肝癌的指标。
21.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体获得的血中表达的一种或多种RNA转录本的水平,其中所述一种或多种RNA转录本对应于表1的所述一种或多种生物标志物,和b)用步骤a)的结果与分类符组合以确定对于肝癌的诊断。
22.权利要求17-21中任一项的方法,其中所述血样由全血组成。
23.权利要求17-21中任一项的方法,其中所述血样由血滴组成。
24.权利要求17-21中任一项的方法,其中所述血样由已裂解的血组成。
25.权利要求17-21中任一项的方法,还包括从所述血样分离RNA的步骤。
26.权利要求17-21中任一项的方法,其中确定所述一种或多种RNA转录本的每种的水平的步骤包括定量RT-PCR(QRT-PCR),其中所述一种或多种转录本来自权利要求17-21中的步骤a)和/或步骤b)。
27.权利要求26的方法,其中所述QRT-PCR使用与所述一种或多种转录本或其互补物杂交的引物,其中所述一种或多种转录本来自权利要求17-21中的步骤a)和/或步骤b)。
28.权利要求27的方法,其中所述引物长15-25个核苷酸。
29.权利要求17-21中任一项的方法,其中确定所述一种或多种转录本的每种的水平的步骤包括使对应于所述一种或多种转录本的第一组分离核酸分子与包含第二组分离核酸分子的阵列杂交。
30.权利要求29的方法,其中所述第一组分离核酸分子包括RNA、DNA、cDNA、PCR产物或EST。
31.权利要求29的方法,其中所述阵列包含多种分离核酸分子,所述分离核酸分子包括RNA、DNA、cDNA、PCR产物或EST。
32.权利要求29的方法,其中所述阵列上的所述第二组分离核酸分子包括对应于表1的一种或多种生物标志物的多核苷酸。
33.权利要求29的方法,其中所述阵列上的所述第二组分离核酸分子包括对应于表2的一种或多种生物标志物的多核苷酸。
34.权利要求29的方法,其中所述阵列上的所述第二组分离核酸分子包括对应于表3的一种或多种RNA产物的多核苷酸。
35.权利要求29的方法,其中所述阵列上的所述第二组分离核酸分子包括对应于表4的一种或多种RNA产物的多核苷酸。
36.诊断或预测肝癌的试剂盒,包含a)两种生物标志物特异性引发物,设计用于产生与选自表1的生物标志物互补的双链DNA;其中所述第一种引发物含有可以选择性杂交到与所述生物标志物互补的RNA、cDNA或EST上的序列,以产生延伸产物,所述第二种引发物能与所述延伸产物选择性杂交;b)具有逆转录酶活性的酶,c)具有热稳定的DNA聚合酶活性的酶,和d)标记物质;其中所述引物用于检测受试对象中所述生物标志物的定量表达水平。
37.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质由表1列出的一种或多种生物标志物编码,和b)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种蛋白质的每种的水平进行比较,其中在步骤b)的比较中检测到所述一种或多种蛋白质的每种的水平的差异是步骤a)的个体中肝癌的指标。
38.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质由表1列出的所述一种或多种生物标志物编码,和b)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种蛋白质的每种的水平进行比较,其中在步骤b)的比较中检测到所述一种或多种蛋白质的每种的相同水平是步骤a)的个体中肝癌的指标。
39.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质的水平,其中所述一种或多种蛋白质由表1列出的所述一种或多种生物标志物编码,和b)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与患有肝癌的一个或多个个体的血中所述一种或多种蛋白质的每种的水平进行比较,c)将根据步骤a)的所述血中所述一种或多种蛋白质的每种的水平与不患有肝癌的一个或多个个体的血中所述一种或多种蛋白质的每种的水平进行比较,d)确定步骤a)的所述一种或多种蛋白质的水平相对于步骤c)中所述蛋白质的水平而言归类于步骤b)中所述蛋白质的水平,其中所述确定是步骤a)中所述个体患有肝癌的指标。
40.诊断或预测个体中肝癌的方法,包括以下步骤a)确定从所述个体所得血中表达的一种或多种蛋白质产物的水平,其中所述一种或多种蛋白质产物对应于表1列出的一种或多种生物标志物,和b)使用步骤a)的结果与分类符组合以确定关于肝癌的诊断。
41.权利要求37-40中任一项的方法,其中确定所述一种或多种蛋白质的每种的水平的步骤包括使用一种或多种抗体,其中所述一种或多种抗体的每种特异性针对表1列出的生物标志物的蛋白质产物。
42.权利要求41的方法,其中所述一种或多种抗体选自单克隆抗体、fv.scfv、dab、fd、fab和fab’2。
43.产生用于诊断肝癌的分类符的方法,所述方法包括(a)测定训练群体中表1鉴定的生物标志物的产物的表达水平,其中所述训练群体包括两个亚组,第一亚组诊断为患有肝癌,而所述第二亚组诊断为不患有肝癌。(b)将一种或多种数学模型应用于步骤(a)的表达水平,以产生区分所述第一亚组和所述第二亚组的一种或多种分类符。
44.权利要求43的方法,还包括评价步骤(b)的一种或多种所述分类符正确表征训练群体中每个个体的分类能力。
45.权利要求43的方法,还包括评价步骤(b)的一种或多种所述分类符正确表征不是训练群体的群体中一个或多个个体的分类能力。
全文摘要
本发明涉及在识别患有肝癌的个体方面表现出独特优势的生物标志物的鉴定和选择。本发明进一步涉及用于诊断肝癌的生物标志物的有用组合。本发明还提供用作诊断疾病和监测治疗方案效果的工具的多核苷酸和多肽及其试剂盒。本发明还提供选择生物标志物组合的方法和用于诊断肝癌的由此鉴定的组合。本发明还涉及鉴定用于治疗肝癌的治疗靶点和鉴定与肝癌相关的单核苷酸点突变的筛选方法。
文档编号A61K39/395GK101039951SQ200480036460
公开日2007年9月19日 申请日期2004年11月3日 优先权日2003年11月3日
发明者刘宗正, 汤姆·亚格, 亚当·登普西, 塞缪尔·尚 申请人:基因信息公司, 凯思琳·M·威廉姆斯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1