浸润性和预后的乳腺癌生物标志物标签的制作方法与工艺

文档序号:13108562阅读:218来源:国知局
本申请是申请号为201380012282.0的分案申请。发明人:CarloM.Croce,StefanoVolinia相关申请的交叉参考本申请要求2012年1月20日提交的美国临时申请号61/588,790的利益,为了所有目的,将所述美国临时申请的完整公开内容通过引用明确地并入本文。关于联邦政府资助的研究的声明本发明是在国立卫生研究院授予的基金号U01-CA152758和U01-CA154200下由政府资助进行的。政府具有本发明的某些权利。技术领域本发明总地来说涉及分子生物学领域。更具体地,其涉及癌症相关技术。本发明的某些方面包括在乳腺癌的诊断、治疗和预后中的应用。发明背景乳腺癌(BC)是复杂疾病,特征在于遗传改变的异质性,并且受几个环境因子影响。原位导管癌(DCIS)是反映恶性细胞在乳腺导管内的增殖(而无穿过基膜的浸润)的异质性的病变群体。约80%的所有乳腺癌为浸润性导管癌(IDC),这是最常见的BC类型。具有不同分子亚型(管腔A/B、HER2+和基底样)的乳腺肿瘤具有明显不同的mRNA特征谱。直至1980年,DCIS很少被诊断,并且代表<1%的BC。随着乳房x线摄影术的使用增加,DCIS成为最快速增加的BC的亚组,在美国占据15%–25%的新诊断的BC病例。MicroRNA(miRNA)是一类具有调节功能的保守非编码RNA,其在癌症中发挥重要作用。miRNA的微阵列分析近年来已产生许多新的知识。仍然存在对关于miRNA的功能和活性的信息以及可用于它们的表征和分析的方法及组合物的需要。然而,全基因组mRNA表达研究不能鉴定进展期特异性基因。发明概述在第一广泛方面,本文中描述了显示增加的不良预后乳腺癌的风险的乳腺癌标签。标签包括来自人受试者的组织的测试样品中miRNA/mRNA标签的水平变化的测定。在一个实施方案中,miRNA/mRNA标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;和mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成。测试样品的miRNA和mRNA基因产物的水平相对于无癌症组织的对照样品的对应miRNA和mRNA基因产物水平的变化表明人受试者具有不良的BC的存活预后。在另一个方面,本文中提供了确定人受试者是否具有不良的乳腺癌(BC)存活预后的方法。方法通常包括测量来自人受试者的组织的测试样品的miRNA/mRNA标签的水平,其中所述miRNA/mRNA标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成。方法通常还包括测定受试者的存活预后;其中测试样品的miRNA和mRNA基因产物水平相对于无癌组织的对照样品的对应miRNA和mRNA基因产物水平的变化表明人受试者具有不良的BC存活预后。在另一个方面,本文中提供了诊断人受试者是否具有与不良预后相关的BC或处于发生所述BC的风险中的方法,其包括:(1)从获自人受试者的组织的测试样品逆转录RNA以提供一组靶寡脱氧核苷酸;(2)将所述靶寡脱氧核苷酸与包含miRNA-特异性探针寡核苷酸的微阵列杂交以提供所述测试样品的杂交特征谱,其中所述微阵列包含针对miRNA/mRNA标签的mRNA-特异性探针寡核苷酸,所述标签由如下基因产物组成:miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1;(3)将测试样品杂交特征谱与从无转移组织的对照样品产生的杂交特征谱相比较,和,(4)基于miRNA/mRNA基因产物标签的变化,诊断人受试者是否患有与不良预后相关的BC或处于发生所述BC的风险中。在某些实施方案中,测定患有浸润性导管癌(IDC)乳腺癌(BC)的受试者的存活预后的步骤。在某些实施方案中,测定受试者的存活预后的步骤预测总体存活期(OS)。在某些实施方案中,相对于对照样品,miRNA和mRNA的标签组与特异于这样的miRNA和mRNA的探针杂交,表明人患者的不良存活的预后。在另一个方面,本文中提供了用于确定具有乳腺癌(BC)的人受试者是否具有不良存活结果的方法,其包括:测定获自人受试者的乳腺细胞的核酸样品以测定所述核酸样品的miRNA/mRNA标签的表达水平,所述miRNA/mRNA标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成;以及确定所述人受试者具有不良存活结果,如果与对照核酸样品相比较,核酸样品的miRNA/mRNA标签的表达水平存在变化的话。在另一个方面,本文中提供了用于测试结肠癌相关疾病的DNA芯片,在所述芯片上探针已被固定来测定miRNA/mRNA标签,所述标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成。在另一个方面,本文中提供了包含至少一种结合至少一种miRNA/mRNA标签的标志物的捕获试剂的制品,所述miRNA/mRNA标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成。在另一个方面,本文中提供了用于筛查乳腺癌的试剂盒,其中所述试剂盒包括:miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1的至少一个标志物的一种或多种试剂。在某些实施方案中,使用包含与至少一种标志物特异性结合的抗体或抗体片段的试剂检测标志物的存在。在某些实施方案中,试剂被标记、放射性标记或生物素标记,和/或其中抗体或抗体片段被放射性标记、生色团标记、荧光团标记或酶标记。在某些实施方案中,试剂包括抗体、所述试剂连接于或可连接于的探针以及固定的金属螯合剂的一种或多种。在另一个方面,本文中提供了用于预测受试者的乳腺癌相关疾病的存在的微阵列,其包含针对miRNA/mRNA标签的抗体,所述标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成。在某些实施方案中,标志物的表达水平通过检测转录的多核苷酸或其部分的存在来评估,其中转录的多核苷酸包含标志物的编码区。在某些实施方案中,样品为乳腺癌相关体液或组织。在某些实施方案中,样品包含获自所述患者的细胞。在某些实施方案中,至少miRNA/mRNA标签包括其分离的变体或生物活性片段或功能等同物或与其结合的抗体。在某些实施方案中,乳腺癌相关疾病是浸润性导管癌(IDC)。在某些实施方案中,样品包含随时间采集的从患者获得的细胞。在某些实施方案中,所述方法还包括基于诊断设计治疗方案。在某些实施方案中,方法还包括基于诊断施以治疗。在某些实施方案中,标准miRNA和/或mRNA表达水平来自代表性的个体库,并且为受试者的对照组织的miRNA和miRNA水平的平均、中位或其它统计学处理的或另外地概括的或合计的代表性miRNA和/或mRNA表达水平。在另一个方面,本文中提供了计算机可读介质,其包含具有多个数字编码的参照特征谱的数据库,其中至少第一参照特征谱代表来自一个或多个显示乳腺癌相关疾病反应的指征的受试者的一个或多个样品的至少miRNA/mRNA标签的水平,所述miRNA/mRNA标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成。在某些实施方案中,计算机可读介质包括至少第二参照特征谱,所述第二参照特征谱代表来自一个或多个显示乳腺癌相关疾病反应的指征的受试者或具有乳腺癌相关疾病的受试者的一个或多个样品的至少一种另外的miRNA或mRNA的水平。在另一个方面,本文中提供了用于确定受试者是否具有乳腺癌相关疾病,是否易患所述疾病,或是否具有所述疾病的不良存活预后的计算机系统,其包括权利要求17的数据库和包含计算机可执行代码的服务器,所述计算机可执行代码用于使计算机接受受试者的特征谱,从数据库鉴定在诊断上与受试者特征谱相关的匹配参照特征谱,以及产生表明所述受试者是否具有乳腺癌相关疾病或是否易患所述疾病的指征。在另一个方面,本文中提供了用于评价受试者的乳腺癌相关疾病的存在、不存在、性质或程度的计算机辅助法,其包括:(1)提供包括用于分类来自获自所述受试者的样品的数据的模型或算法的计算机,其中所述分类包括分析至少一种miRNA/mRNA标签的存在、不存在或量的数据,并且其中miRNA/mRNA标签由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成;(2)输入来自获自所述受试者的生物样品的数据;和,(3)将所述生物样品分类以表明乳腺癌相关疾病的存在、不存在、性质或程度。在另一个方面,本文中提供了用于预测乳腺癌患者的预后的方法,其包括:检测来自患有乳腺癌的受试者的生物测试样品的一组标签的测试表达水平;将风险评分赋予所述测试表达水平;并且当测试表达水平被赋予高风险评分时,预测不良预后;以及当测试表达水平被赋予低风险评分时,预测良好预后,其中所述标签包括由miRNA基因产物:hsa-miR-103、hsa-miR-1307、hsa-miR-148b、hsa-miR-324、hsa-miR-326、hsa-miR-328、hsa-miR-365、hsa-miR-484、hsa-miR-874a、hsa-miR-93;以及mRNA基因产物:ADAT1、ANKRD52、BIRC6、C10orf18、C2CD2、CHD9、CHM、CPT1A、DAAM1、DIP2B、DPY19L3、FAM91A1、GMCL1、ME1、NCOA2、OTUD6B、PDSS2、PIK3CA、SMG1、TRIM23、TTC3、UBR5、UBXN7和ZFC3H1组成的miRNA/mRNA标签。在某些实施方案中,预后是总体癌症存活。在某些实施方案中,测试表达水平通过微阵列来测定。在某些实施方案中,测试表达水平通过RT-PCR来测定。在某些实施方案中,miRNA/mRNA标签包括乳腺细胞相对于乳腺癌细胞的miRNA和mRNA的表达的统计上显著的变化。在另一个方面,在本文中提供了用于检测受试者的乳腺浸润性导管癌(IDC)的标志物,包括miR-210基因产物。在另一个方面,在本文中提供了用于检测受试者的乳腺浸润性导管癌的方法,包括检测相较于测试样品的miR-210基因产物的增加。在另一个方面,在本文中提供了用于区分浸润性导管癌(IDC)与原位导管癌(DCIS)的microRNA标签,包括:i)IDC中let-7d、miR-181a、miR-210和miR-221的至少之一的上调;和ii)IDC中miR-10b、miR-126、miR-143、miR-218和miR-335-5p的至少之一的下调。在另一个方面,本文中提供了用于患有乳腺癌的受试者的总体存活期预后和转移时间预后的microRNA标签,包括:miR-210、miR-21、miR-106b*、miR-197和/或let-7i。在另一个方面,本文中提供了用于检测患有乳腺癌的受试者的从DCIS至IDC的转化的microRNA标志物,包括miR-210基因产物。在另一个广泛的方面,本文中提供了用于区分浸润性导管癌(IDC)与原位导管癌(DCIS)的microRNA标签,包括在原位下调的let-7d、miR-210和miR-221以及在浸润转化中上调的let-7d、miR-210和miR-221的至少一种。在另一个方面,本文中提供了乳腺癌的总体存活期和转移时间的microRNA标签,包括:miR-210、miR-21、miR-106b*、miR-197和let-7i。在另一个方面,本文中提供了浸润转化的标志物,包括具有与miR-210逆相关的特征谱的蛋白质编码基因,其中BRCA1、FANCD、FANCF、PARP1、E-钙粘蛋白、Rb1的一个或多个在原位癌中被激活和在浸润性癌中被下调。在另一个方面,本文中提供了原位导管癌的标志物,包括至少一个差别剪接同种型,例如不存在激酶结构域的截短EGFR,其中这样的标志物仅在原位导管癌中过表达。在另一个方面,本文中提供了用于基于miR-210表达的增加将患者鉴定为具有与乳腺浸润性导管癌(IDC)相关的标志物的方法,其包括:a)分析来自怀疑具有IDC的患者的乳腺癌样品中miR-210的表达;和b)将所述患者鉴定为:i)如果检测到来自所述患者的样品相较于非癌性乳腺样品的miR-210表达的增加,则具有与IDC癌相关的标志物或ii)如果未检测到所述增加,则不具与IDC癌相关的标志物。在某些实施方案中,方法还包括分析相较于非癌性乳腺样品,测试样品的let-7d、miR-221和miR-181a的一个或多个的增加;和/或miR-10b、miR-126、miR-143、miR-218和miR-335-5p的一个或多个的增加。在另一个方面,本文中提供了用于诊断受试者是否具有乳腺导管浸润性癌(IDC)的方法,其包括:测量来自所述受试者的测试样品的至少一种miR-210基因产物的水平,其中所述测试样品的至少miR-210基因产物的水平相较于对照样品的对应miR基因产物的水平的升高表明所述受试者具有IDC。在另一个方面,本文中提供了本文中提供了测试受试者的乳腺癌的浸润性的方法,其包括:a)测定来自具有乳腺癌的受试者的样品的至少一种标志物的表达水平;所述至少一种标志物包括至少一种miR-210基因产物;b)将步骤(a)中测定的表达水平与来自健康受试者的样品的标志物的对照表达水平相比较;和c)当步骤(b)中比较的结果表明所述测试受试者中至少一种标志物的表达水平高于对照中的所述表达水平时,则判断所述受试者具有乳腺浸润性导管癌(IDC)的诊断。在某些实施方案中,样品包含乳腺组织。在某些实施方案中,在体外进行所述方法步骤。在另一个方面,本文中提供了诊断受试者是否具有乳腺浸润性导管癌(IDC)的方法,其包括:a)从获自所述受试者的测试样品逆转录RNA,以提供一组靶寡脱氧核苷酸,其中所述受试者具有乳腺IDC;b)使所述靶寡脱氧核苷酸与包含miR-210特异性探针寡核苷酸的微阵列杂交,以提供所述测试样品的杂交特征谱;和c)将所述测试样品的杂交特征谱与从对照样品产生的杂交特征谱相比较,其中miR-210的信号的增强表明所述受试者具有IDC。在某些实施方案中,方法还包括其中步骤c)包括将测试样品的杂交特征谱与和非癌性样品相关的miR水平的数据库、统计资料或表相比较。在某些实施方案中,方法还包括其中将至少一种另外的miR包括在微阵列中。在某些实施方案中,方法还包括其中通过检测转录的多核苷酸或其部分的存在来评估miR-210基因产物的表达水平,其中所述转录的多核苷酸包含miR-210基因产物的编码区。在某些实施方案中,方法还包括其中所述样品包含随时间采集的获自患者的细胞。在某些实施方案中,方法还包括其中至少一种miR-210基因产物包括其分离变体或生物活性片段。在另一个广泛的方面,本文中提供了包含本文中描述的标志物的试剂盒。在某些实施方案中,方法还包括试剂盒,所述试剂盒还包含关于筛查从具有乳腺癌或怀疑具有乳腺癌的受试者采集的样品的说明书。在另一个方面,本文中提供了诊断受试者的乳腺浸润性导管癌(IDC)的方法,其包括:a)鉴定相较于对照的相对miR-210表达;和b)诊断所述受试者为:i)如果所述受试者相较于对照具有增加的miR-210表达,则具有IDC;或,ii)如果所述受试者相较于对照不具有增加的miR-210表达,则不具有IDC。在某些实施方案中,方法还包括鉴定let-7d和miR-221的至少一种相较于对照的相对表达。在某些实施方案中,方法还包括其中相较于对照减少的let-7d和/或miR-221表达确认浸润性乳腺癌的诊断。在某些实施方案中,方法还包括基于诊断设计治疗方案。在某些实施方案中,方法还包括基于诊断施以治疗。在某些实施方案中,方法还包括如果IDC被诊断,则施用抗血管生成治疗。在某些实施方案中,方法还包括基于诊断测定预后。在另一个方面,本文中提供了诊断受试者的乳腺浸润性导管癌(IDC)的方法,其包括:a)鉴定相较于对照的相对miR-210表达,和鉴定相较于对照的let-7d表达以及鉴定相较于对照的miR-221表达;和b)诊断所述受试者为:i)如果所述受试者相较于对照具有增加的miR-210表达,相较于对照具有增加的let-7d表达,以及相较于对照具有增加的miR-221,则具有IDC,或ii)如果所述受试者相较于对照不具有增加的miR-210表达,相较于对照不具有增加的let-7d表达以及相较于对照不具有增加的miR-221表达,则不具有IDC。在另一个方面,本文中提供了用于治疗具有乳腺浸润性导管癌(IDC)的人受试者的方法,其包括:给具有IDC的人受试者施用抑制人ER+和/或HER2+表达或活性的试剂,其中所述试剂包括通过RNA干扰起作用的寡核苷酸,并且其中所述寡核苷酸包括至少miR-210基因产物。在另一个方面,本文中提供了用于测定乳腺癌进展的可能性的方法,其包括:a)测定包含来自具有乳腺癌的受试者的乳腺癌细胞的样品的hsa-miR-210的表达水平,和b)将表达水平与对照组织中的标准miRNA表达水平相比较,其中具有乳腺癌的受试者的hsa-miR-210的更高表达与更高的进展风险相关。在某些实施方案中,方法还包括其中对照组织包括来自具有乳腺癌的代表性个体或具有乳腺癌的个体库的组织,其中所述乳腺癌还未进展。在某些实施方案中,方法还包括其中对照样品包括相对于步骤a)的测定表达水平的时间在更早的时间点从所述受试者采集的组织。在某些实施方案中,方法还包括其中标准miRNA表达水平来自代表性的个体库,并且为受试者的对照组织的miRNA水平的平均、中位或其它统计学处理的或另外地概括的或合计的代表性miRNA表达水平。在某些实施方案中,方法还包括其中还测量相对于对照组织的表达水平let-7d和/或miR-221的一个或多个的表达水平,并且其中let-7d和/或miR-221的一个或多个的升高的表达水平与更高的进展风险相关。在某些实施方案中,方法还包括其中还测量相对于对照组织的表达水平miR-10b、miR-126、miR-143、miR-218和miR-335-5p的一个或多个的表达水平,并且其中miR-10b、miR-126、miR-143、miR-218和miR-335-5p的一个或多个的降低的表达水平与更高的进展风险相关。在检查下列附图和详述后,本发明的其它系统、方法、特性和有利方面对于本领域技术人员将是明显的或将变得明显。所有这样的另外的系统、方法、特性和有利方面意欲包括在本说明书内,在本发明的范围内,以及受所附权利要求保护。附图概述专利或申请文件可包括一个或多个以彩色制作的附图和/或一张或多张照片。具有彩色附图和/或照片的本专利或专利申请公开案的拷贝可在要求和支付必要费用后由专利局提供。图1.在4个IDC临床亚组(ER+/HER2-、HER2+/ER-、ER+/HER2+和三阴性)中以及DCIS和正常乳腺中下调的miRNA。乳腺癌细胞系为(BT474、HCC38、MCF7、MDA-MB134、ZR-751)。显示每一个种类中的每一种miRNA的平均表达。表达为以每一种miRNA为中心的平均值。图2.3个粗体显示的miRNA是具有逆向表达的miRNA,如通过颜色指示的(红色,上调;绿色,下调)。66个miRNA在第一转化(正常乳腺至DCIS)中被下调(仅列出最显著的miRNA)。9个miRNA在浸润转化(DCIS至IDC)中被下调,并且被列出。该第二标签被鉴定为浸润性微标签。参与浸润转化的miRNA在第一癌转化中都未被以相同趋势差异调节。图3A-3B.浸润性导管癌患者的miR-210在转移时间(图3B)和总体存活期(图3A)上的卡普兰迈耶曲线。该数据显示miR-210为唯一的与预后相关并且存在于浸润性微标签中的miRNA。图3C-3K.针对转移时间的IDC的预后标签中的其它miRNA的卡普兰迈耶曲线(对数秩检验,p<0.05)。图3L-3S.针对总体存活期的IDC的预后标签中的其它miRNA的卡普兰迈耶曲线(对数秩检验,p<0.05)。图4.每一个BC亚型和正常乳腺的成熟miR-210、其初级RNA(pri-mir-210)和HIF1A的表达。不同组间该RNA的平均值在每一个组内计算,并报告为总体百分比。图5.与乳腺癌途径相关的并与miR-210反相关的基因。乳腺癌是鉴定的唯一显著的疾病(25个基因;富集p<0.001)。沿着DCIS/IDC进展轴以与miR-210相对的形式调节的乳腺癌基因包括RB1,BRCA1,FANCD,FANCF,PP2CA,PARP1,NLK,CDH1和EHMT1。在BC中与miR-210反相关的途径为:细胞凋亡中的半胱天冬酶级联、HER2受体再循环、TNFR1信号转导、FAS信号转导(CD95)以及癌易感性中的BRCA1、BRCA2和ATR。途径中的一些基因具有其剪接同种型的差异调节。例如,EGFR的经典同种型在正常乳腺中表达,在DCIS中被下调。不存在酪氨酸激酶结构域的更短的EGFR变体(uc003tqi.2)在DCIS中特异性过表达。图6.某些乳腺癌基因与miR-210反相关并且显示沿着乳腺癌进展途径的逆向表达。图7.复杂度50(即可用于从测序运行产生代表性miRNA特征谱的最小复杂度)的测定。复杂度50对应于运行的复杂度,其具有miRNA种类的代表50数目。代表被定义为处于特定计数阈值或高于特定计数阈值的不同mRNA种类的数目。代表50为代表Max(在数据集的单个运行中鉴定的miRNA种类的最大数目)的一半。复杂度是运行(或被测序的样品)中的miRNA读数的总数目。散布图显示在运行之间在数据集内递增的复杂度处的最大代表。不同的计数阈值用于定义miRNA种类的存在:紫色十字>=20个读数,蓝色方块>=10个计数,红色方块>=5个读数,绿色三角形>=3,蓝绿色星号>=1。复杂度(X轴)是以千为单位的读数(K个读数)。图8.DCIS相对正常乳腺样品的聚类树。图9.(表1)。在原位导管癌(DCIS)与正常乳腺的比较中66个差异表达的miRNA的表达水平(误检率<0.05)。图10.(表2)。在IDC相对DCIS的比较中差异表达的6个miRNA。在该比较中仅考虑HER2+/EP-样品(误检率<0.05)。图11.(表3)。当与原位导管癌(DCIS)相比较时,9个miRNA在浸润性导管癌(IDS)中差异表达。将所有可获得的IDC样品包括在分析中,无论亚型如何(误检率<0.05)。图12.(表4)。当与ER-IDC比较时,10个miRNA在ER+IDC中差异表达(误检率<0.05)。图13.(表5)。miR-342是当与所有其它IDC相比较时在HER2+/ER-IDC中差异表达的唯一miRNA(误检率<0.05)。图14.(表6)。当与其它IDC亚型相比较时,在HER2+/ER-IDC中差异表达的miRNA全部被下调(误检率<0.05)。图15.(表7)。当与其它IDC亚型比较时,在TNBCIDC中差异表达的miRNA(误检率<0.05)。图16.(表8)。在IDC的分子亚型中差异表达的miRNA(误检率<0.05)。图17.(表9)。IDC中与转移时间相关的miRNA。图18.(表10)。IDC中与总体存活期相关的miRNA。图19.(表11)。使用DAVID数据库进行的正常/DCIS和DCIS/IDC转化中与miR-210反相关的基因的功能分析。来自遗传关联DB的25个基因与乳腺癌相关(富集P值=1.4E-3)。乳腺癌为唯一的与这些基因相关的疾病。图20.(表12)。具有原发性浸润性导管癌的患者的TCGA队列。图21.(表13)。4个BC队列的RNA标签的预后值。图22.用于导出和验证横跨不同亚类的乳腺癌的共同预后mRNA和miRNA(34-基因集)的策略。将mRNA和miRNA整合在IDC(TCGA队列,n=466)的单个RNA特征谱中。在下列临床和分子种类的不同亚组内进行存活分析:疾病分期、淋巴结受累(N期)、手术切缘、绝经前或绝经后、内部亚型(intrinsicsubtype)、体细胞突变(TP53、PIK3CA途径、TP53/PIK3CA双突变体、GATA3和其余不太频繁改变的基因)。种类中的亚类代表不相关的患者组,从而使得能够直接验证该种类的预后RNA。计算TCGA队列的每一个独立亚类的RNA的危害比(HR)和卡普兰-迈耶曲线。选择在至少两个亚类中具有显著的HR和对数秩检验(p<0·05)的RNA。编码基因的选择所需的另外标准是DNA甲基化与OS的关联性以及COSMIC数据库中的体细胞突变的存在。将7个独立的验证队列(总共n=2104个患者)用于再评估在TCGA队列上产生的预后34-基因集。图23.在不同临床和分子亚类的浸润性导管癌(TCGA队列)中与OS相关的mRNA和miRNA。矩阵使得TCGAIDC队列的34个预后编码基因和miRNA(按照图22中的方法并在图28中被列出)的显著危害比(HR)可视化。在log2标尺上显示具有显著的单变量Cox回归(p<0·05)的mRNA或miRNA的HR,不考虑对数秩检验。红色方块表示HR>1,蓝色方块表示HR<1。显示了至少基因或miRNA对于其是重要的种类。图24A-24B.IDC(TCGA队列)的预后34-基因集的卡普兰-迈耶和ROC曲线:图24A.使用预后34-基因集从TCGA队列(n=466)获得的IDC风险组的交叉验证的卡普兰-迈耶曲线。风险组之间的对数秩检验统计数值的排列p值基于1000个排列(p<0·001)。图24B.ROC曲线具有0·71的曲线下面积(AUC)(p<0·001)。使用1000个排列计算检验无效假设(AUC=0·5)的排列p值。图25A-25B.UK验证队列的预后34-基因集的卡普兰-迈耶和ROC曲线:图25A.使用预后34-基因集从验证队列(n=207)获得的乳腺癌风险组的交叉验证的卡普兰-迈耶曲线。风险组之间的对数秩检验统计数值的排列p值基于1000个排列(p=0·001)。图25B.ROC曲线具有0.69的AUC(p<0·001)。使用1000个排列计算检验无效假设(AUC=0·5)的排列p值。图26.显示PIK3CA的mRNA表达与CpGDNA甲基化之间的负相关性(FDR<0.001)的表。图27.显示IDC中与总体存活期相关的DNA甲基化CpG位点(P值<0.05)的表。图28.显示与临床结果相关并且在独立的IDC亚类间得到验证的二十四个(24)mRNA和十个(1)miRNA的表。编码基因受DNA甲基化/OS分析以及体细胞突变的存在的进一步限制。方括号标明用于验证的独立IDC亚类。MargNeg=边缘阴性。HormRec+意指ER+和/或PR+肿瘤。突变率:在外显子组中<25个突变为低,25<=中等<=50,高>50。突变:PI3K(PIK3CA、AKT1、PTEN、PIK3R1),TP53PIK3CA为双突变体。noMajorMut=除PI3K、TP53、MAPK和GATA3外的突变。图29.显示TCGA队列(n=466)的结果的整合的RNA线性风险预测的表。图30.浸润性导管癌的局部淋巴结受累(N)的卡普兰一迈耶存活评价(总体对数秩检验,P值=0.005)。图31.浸润性导管癌的远端转移(M)的卡普兰一迈耶存活评估(总体对数秩检验,P值=0.026)。图32.浸润性导管癌的内部亚型的卡普兰一迈耶存活评价(总体对数秩检验,P值=0.042)。图33.浸润性导管癌的AJCC疾病分期的卡普兰一迈耶存活评价(总体对数秩检验,P值=0.002)。图34.浸润性导管癌的T期的卡普兰一迈耶存活评价(总体对数秩检验,P值<0.001)。图35.浸润性导管癌的雌激素受体(ER)状态的卡普兰一迈耶存活评价(Breslow检验,P值=0.016)。图36.浸润性导管癌的三阴性(TNBC)状态的卡普兰一迈耶存活评价(Breslow检验,P值=0.041)。图37.浸润性导管癌的TP53体细胞突变状态的卡普兰一迈耶存活评价(对数秩检验,非显著的)。图38.浸润性导管癌的PIK3CA途径体细胞突变状态的卡普兰一迈耶存活评价(对数秩检验,非显著的)。详述在整个本公开内容中,通过标识引用参考各种出版物、专利和公开的专利说明书。将这些出版物、专利和公开的专利说明书的公开内容通过引用并入本公开内容以更全面地描述本发明所属领域的技术水平。定义和一般讨论如本文中可互换使用的,“miR基因产物”、\microRNA\、\miR\或“miRNA”是指来自miR基因的未加工的或加工的RNA转录物。由于miR基因产物不被翻译成蛋白质,因此术语“miR基因产物”不包括蛋白质。未加工的miR基因转录物也称为“miR前体”,并且通常包含在长度上约70-100个核苷酸的RNA转录物。可通过使用RNA酶(例如Dicer、Argonaut、RNA酶III(例如,大肠杆菌(E.coli)RNA酶III))消化来将miR前体加工成具有活性的19-25个核苷酸的RNA分子。该具有活性的19-25个核苷酸的RNA分子也称为“加工的\miR基因转录物或\成熟的\miRNA。具有活性的19-25个核苷酸的RNA分子可通过天然加工途径(例如,使用完整细胞或细胞裂解物)或通过合成加工途径(例如,使用分离的加工酶,例如分离的Dicer、Argonaut或RNA酶III)来从miR前体获得。应理解,具有活性的19-25个核苷酸的RNA分子还可通过生物或化学合成直接产生而不必从miR前体加工而来。当在本文中通过名称提及microRNA时,除非另有所指,否则名称对应于前体和成熟形式。DNA脱氧核糖核酸mRNA信使RNAmeDNADNA甲基化miRmicroRNAPCR聚合酶链式反应pre-miRNA前体microRNAqRT-PCR定量逆转录酶聚合酶链式反应RNA核糖核酸应理解,本文中的描述仅为示例性和解释性的,无意限定本教导的范围。在本申请中,除非明确地另有所指,否则单数的使用包括复数。除非另外指出,否则根据常规用法使用技术术语。分子生物学中一般术语的定义可见于BenjaminLewin,GenesV,由OxfordUniversityPress出版,1994(ISBN0-19-854287-9);Kendrew等人(编辑),TheEncyclopediaofMolecularBiology,由BlackwellScienceLtd.出版,1994(ISBN0-632-02182-9);和RobertA.Meyers(编辑),MolecularBiologyandBiotechnology:aComprehensiveDeskReference,由VCHPublishers,Inc.出版,1995(ISBN1-56081-569-8)。为了帮助综述本公开内容的各种实施方案,提供特定术语的下列解释:辅助治疗:与主要治疗组合使用以改善主要治疗的作用的治疗。临床结果:是指在疾病或障碍的治疗后或在治疗不存在的情况下患者的健康状态。临床结果包括但不限于直至死亡的时间长度的增加、直至死亡的时间长度的减少、存活机会的增加、死亡风险的增加、存活、无疾病存活、慢性疾病、转移、晚期或侵袭性疾病、疾病复发、死亡以及有利的或不良的对治疗的反应。存活的减少:如本文中所用,“存活的减少”是指患者死亡前时间长度的减少,或患者死亡风险的增加。检测表达的水平:例如,“检测miR或miRNA表达的水平”是指定量存在于样品中的miR或miRNA的量。检测特定miR或任何microRNA的表达可使用本领域已知的或本文中描述的任何方法,例如通过qRT-PCR来实现。检测miR的表达包括检测与miRNA表达相关的miRNA的成熟形式或前体形式的表达。通常地,miRNA检测法包括序列特异性检测(例如通过RT-PCR)。可使用前体和成熟miR核酸序列设计miR特异性引物和探针,所述核酸序列在本领域是已知的。DNA甲基化是生物化学过程,其包括甲基至胞嘧啶嘧啶环的5位置或腺嘌呤嘌呤环的编号为6的氮的添加。DNA甲基化稳定地改变细胞的基因表达模式,并且为基因转录的重要调节器。异常DNA甲基化模式与大量人恶性肿瘤相关并且以两种不同的形式被发现:相较于正常组织的超甲基化和低甲基化。超甲基化通常在启动子区域的CpG岛上发生,并且与基因失活相关。总体的低甲基化也牵涉癌症的发生和进展。信使RNA(mRNA)是将遗传信息从DNA传递至核糖体的RNA分子的大家族,其中它们指定基因表达的蛋白质产物的氨基酸序列。在RNA聚合酶转录mRNA后,mRNA被翻译成氨基酸的聚合物即蛋白质。MicroRNA(miRNA):调节基因表达的单链RNA分子。MicroRNA在长度上通常为约22个核苷酸。MicroRNA从被称为pri-miRNA的初级转录物加工成被称为前体(pre)-miRNA的短茎环结构,最终加工成为功能性成熟microRNA。成熟microRNA分子与一个或多个信使RNA分子部分互补,它们的主要功能是下调基因表达。MicroRNA通过RNAi途径调节基因表达。miR表达:如本文中所用,“低miR表达”和“高miR表达”是指样品中发现的miRNA的水平的相对术语。在一些实施方案中,通过比较一组对照样品和测试样品中的miRNA水平来测定低和高miR表达。随后基于样品中一种或多种miR的表达是高于(高)还是低于(低)平均或中位miR表达水平来将低和高表达赋予每一个样品。对于单个样品,可通过将样品与已知具有正常、高或低表达的对照或参照样品相比较,或通过与标准值相比较来确定高或低miR表达。低和高miR表达可包括miRNA的前体或成熟形式或两者的表达。患者:如本文中所用,术语“患者”包括人和非人动物。进行治疗的优选患者为人。“患者”和“受试者”在本文中可互换使用。药学可接受的媒介物:可用于本公开内容的药学上可接受的载体(媒介物)是常规的。Remington’sPharmaceuticalSciences,E.W.Martin著,MackPublishingCo.,Easton,PA,第15版(1975)描述了适合用于一种或多种治疗性化合物、分子或试剂的药物递送的组合物和制剂。一般而言,载体的性质将取决于使用的具体施用方式。例如,胃肠外制剂通常包含可注射液作为媒介物,所述可注射液包含药学上和生理上可接受的液体例如水、生理盐水、平衡盐溶液、含水葡萄糖、甘油等。对于固体组合物(例如,粉剂、丸剂、片剂或胶囊形式),常规无毒固体载体可包括例如药物级甘露醇、乳糖、淀粉或硬脂酸镁。除了生物学中性载体以外,待施用的药物组合物可包含少量无毒辅助物质,例如湿润剂或乳化剂、防腐剂和pH缓冲剂等,例如醋酸钠或脱水山梨醇单月桂酸酯。预防、治疗或缓解疾病:“预防”疾病是指抑制疾病的完全发生。“治疗”是指在疾病已开始发生后缓解疾病或病理病况的体征或症状的治疗性干预。“缓解”是指疾病的体征或症状的数目或严重度的减少。不良预后:通常是指存活的减少,或换句话说,死亡风险的增加或直至死亡的时间的减少。不良预后还可指疾病的严重度的增加,例如癌症至其它组织和/或器官的扩散(转移)的增加。筛查:如本文中所用,“筛查”是指用于评价和鉴定影响这样的疾病的候选剂的方法。可使用本领域已知的和本文中描述的许多技术的任一技术,例如利用微阵列分析或利用qRT-PCR定量microRNA的表达。小分子:通常具有低于约1000道尔顿,或在一些实施方案中低于约500道尔顿的分子量的分子,其中分子能够以某一可测量的程度调节靶分子的活性。治疗:包括诊断和治疗的一般术语。治疗剂:当给受试者正确地施用时能够诱导期望的治疗或预防效果的化合物、小分子或其它组合物,例如反义化合物、抗体、蛋白酶抑制剂、激素、趋化剂或细胞因子。如本文中所用,“候选剂”或“测试化合物”是被选择用于筛选以确定其是否可用作治疗剂的化合物。“温育”包括用于试剂与细胞或组织相互作用的充足量的时间。“接触”包括将以固体或以液体形式存在的试剂与细胞或组织一起温育。利用试剂“治疗”细胞或组织包括将试剂与细胞或组织接触或一起温育。治疗有效量:足以在用试剂治疗的受试者或细胞中实现期望的效应的特定药物或治疗剂的量。试剂的有效量将取决于几个因素,包括但不限于接受治疗的受试者或细胞,治疗性组合物的施用方式。在本方法的一些实施方案中,对照的使用是期望的。在这一方面,对照可以是获自相同患者的非癌性组织样品,或获自健康受试者例如健康组织供体的组织样品。在另一个实例中,对照是从历史值计算的标准。在一个实施方案中,对照是乳腺癌的癌性组织样品。对照可来源于具有已知的发育不良、已知的癌症类型、已知的突变状态和/或已知的肿瘤分期的组织。在一个实施方案中,对照是来源于浸润性导管癌的历史平均值。在另一个实施方案中,对照是来源于原位导管癌的历史平均值。在一个实施方案中,对照来自处于更早时间点的患者的肿瘤样品;当评价乳腺癌的进展或缓解时,该实施方案可以是特别有用的。可按照本领域已知的任何方法获得肿瘤样品和非癌性组织样品。例如,肿瘤和非癌性样品可获自已经历切除术的癌症患者,或可使用皮下针头通过抽取,通过显微解剖,或通过激光捕获来获得它们。对照(非癌性)样品可以例如获自尸体供体或健康供体。获自受试者的样品的miR基因产物的水平相较于对照样品的对应miR基因产物的水平的改变(例如,升高或降低)表示受试者中存在癌症相关疾病。在一个实施方案中,测试样品的至少一种miR基因产物的水平高于对照样品的对应miR基因产物的水平(即,miR基因产物的表达被\上调\)。如本文中所用,当来自受试者的细胞或组织样品的miR基因产物的量高于对照细胞或组织样品的相同基因产物的量时,miR基因产物的表达被“上调”。在另一个实施方案中,测试样品的至少一种miR基因产物的水平低于对照样品的对应miR基因产物的水平(即,miR基因产物的表达被\下调\)。如本文中所用,当来自受试者的细胞或组织样品的miR基因产生的miR基因产物的量低于对照细胞或组织样品中从相同基因产生的量时,miR基因的表达被“下调”。可测定相对于一种或多种RNA表达标准的对照和正常样品的相对miR基因表达。标准可包括例如零miR基因表达水平、标准细胞系的miR基因表达水平、受试者的未受影响的组织的miR基因表达水平,或先前获得的正常人对照群体的平均miR基因表达水平。样品的miR基因产物的水平可使用适合用于检测生物样品的RNA表达水平的任何技术来测量。用于测定生物样品(例如,细胞、组织)的RNA表达水平的适当的技术(例如,Northern印迹分析、RT-PCR、原位杂交)对于本领域技术人员来说是公知的。在具体实施方案中,使用Northern印迹分析检测至少一种miR基因产物的水平。例如,可通过在核酸提取缓冲液存在的情况下匀浆,随后通过离心从细胞纯化总的细胞RNA。沉淀核酸,通过用DNA酶处理和沉淀除去DNA。随后按照标准技术在琼脂糖凝胶上通过凝胶电泳分离RNA分子,将所述RNA分子转移至硝酸纤维素滤膜。随后通过加热将RNA固定在滤膜上。使用适当地标记的与所述RNA互补的DNA或RNA探针检测和定量特定RNA。参见,例如,MolecularCloning:ALaboratoryManual,J.Sambrook等人,编辑,第2版,ColdSpringHarborLaboratoryPress,1989,第7章,将其完整公开内容通过引用并入本文。在一些实施方案中,筛选包括将候选剂/测试化合物与细胞接触。细胞可以是获自患者的原代细胞,或细胞可以是永生化或转化细胞。候选剂/测试化合物可以是任何类型的试剂,例如蛋白质、肽、小分子、抗体或核酸。在一些实施方案中,候选剂是细胞因子。在一些实施方案中,候选剂是小分子。筛选包括高通量筛选和筛选单个或小组的候选剂。MicroRNA检测在本文中的一些方法中,期望鉴定存在于样品中的miRNA。前体microRNA(pre-miRNA)和成熟miRNA的序列是可以例如通过miRBase数据库(可通过SangerInstitute(参见Griffiths-Jones等人,NucleicAcidsRes.36:D154-D158,2008;Griffiths-Jones等人,NucleicAcidsRes.34:D140-D144,2006;和Griffiths-Jones,NucleicAcidsRes.32:D109-D111,2004)在线获得的)公共获得的。本文中提供了本文公开的优选家族成员的前体和成熟形式的序列。RNA表达的检测和定量可通过本领域公知的许多方法的任一种来实现。通过使用RNA家族成员的已知序列,适当时可设计用于下文中描述的检测法的特定探针和引物。在一些情况下,RNA检测法需要从样品例如细胞或组织样品分离核酸。可使用本领域已知的任何适当技术分离核酸,包括RNA,特别地miRNA。例如,基于酚的提取是用于RNA分离的常用方法。基于酚的试剂包含用于细胞和组织破裂以及RNA与污染物的随后分离的变性剂和RNA酶抑制剂的组合。基于酚的分离法可回收在10-200个核苷酸范围内的RNA种类(例如,前体和成熟miRNA,5S和5.8S核糖体RNA(rRNA)以及U1小核RNA(snRNA))。此外,提取法例如使用TRIZOLTM或TRIREAGENTTM的提取法将纯化所有RNA(大的和小的),并且是用于从包含miRNA和小干扰RNA(siRNA)的生物样品分离总RNA的高效方法。在一些实施方案中,微阵列的使用是期望的。微阵列是核酸、蛋白质、小分子、细胞或其它物质的微观有序阵列,其使得能够平行分析复杂的生物化学样品。DNA微阵列具有不同的被称为捕获探针的核酸探针,其被化学地连接于固体基底,这可以是微芯片、载玻片或微球体尺寸的珠粒。微阵列可用于例如同时测量大量信使RNA(mRNA)和/或miRNA的表达水平。可使用多种技术,包括用细针尖打印至载玻片上,使用预制掩膜进行的光刻法,使用动态微镜装置进行的光刻法,喷墨打印或在微电极阵列上进行的电化学,来制造微阵列。miRNA的微阵列分析,例如(尽管这些方法可以以改进形式用于任何RNA分析)可按照本领域中已知的任何方法来实现。在一个实例中,从细胞或组织样品提取RNA,使用变性聚丙烯酰胺凝胶电泳从总RNA尺寸选择小RNA(18-26个核苷酸RNA)。将寡核苷酸接头连接于小RNA的5'和3'末端,将所得的连接产物用作RT-PCR反应(使用10个循环的扩增)的模板。有义链PCR引物具有连接于其5'末端的荧光基团,从而荧光标记PCR产物的有义链。将PCR产物变性,随后与微阵列杂交。与阵列上的对应miRNA捕获探针序列互补的被称为靶核酸的PCR产物将通过碱基配对与其上附着有捕获探针的点杂交。当使用微阵列激光扫描仪激发时,所述点将发荧光。随后使用许多阳性和阴性对照以及阵列数据标准化法,根据特定miRNA的拷贝数评价每一个点的荧光强度,这将导致特定miRNA的表达水平的评估。在替代方法中,将从细胞或组织样品提取的包含小RNA级分(包括miRNA)的总RNA直接使用而不进行小RNA的尺寸选择,使用T4RNA连接酶和任一荧光标记的短的RNA接头标记3'末端。通过在30℃温育2小时,随后在80℃对T4RNA连接酶热灭活5分钟来标记RNA样品。与阵列上对应的miRNA捕获探针序列互补的荧光基团标记的miRNA将通过碱基配对与其上附着有捕获探针的点杂交。如上所述进行微阵列扫描和数据处理。存在几种类型的可使用的微阵列,包括点样的寡核苷酸微阵列、预制的寡核苷酸微阵列以及点样的长寡核苷酸阵列。在点样的寡核苷酸微阵列中,捕获探针为与miRNA序列互补的寡核苷酸。该类型的阵列通常与来自待比较的两个样品(例如非癌性组织和癌性或样品组织)的经尺寸选择的小RNA的扩增PCR产物杂交,所述PCR产物标记有两种不同的荧光基团。或者,从两个样品提取包含小RNA级分(包括miRNA)的总RNA,将其直接使用而不进行小RNA的尺寸选择,使用T4RNA连接酶和标记有两个不同的荧光基团的短的RNA接头标记3'末端。可将样品混合,使样品与一个单个微阵列杂交,随后扫描所述微阵列,从而使得能够在一个测定中将上调和下调的miRNA基因可视化。在预制寡核苷酸微阵列或单通道微阵列中,探针被设计来匹配已知的或预测的miRNA的序列。存在覆盖完整基因组的商购可得的设计(例如,来自Affymetrix或Agilent)。这些微阵列提供基因表达的绝对值的评估,从而两个条件的比较需要使用两个单独的微阵列。点样的长寡核苷酸阵列由50至70聚体的寡核苷酸捕获探针组成,通过喷墨或机器打印产生。短的寡核苷酸阵列由20-25聚体的寡核苷酸探针组成,通过光刻合成(Affymetrix)或通过机器打印产生。在一些实施方案中,期望使用定量RT-PCR。定量RT-PCR(qRT-PCR)是用于快速测量聚合酶链式反应的产物的量的聚合酶链式反应的改进形式。qRT-PCR通常用于确定遗传序列例如miR是否存在于样品中,以及如果其存在,则测定样品中的拷贝数。可测定核酸分子包括miRNA的表达的PCR的任何方法落在本公开内容的范围内。存在几种本领域内已知的qRT-PCR法的变型,下面描述其中的3种。用于定量聚合酶链式反应的方法包括但不限于通过琼脂糖凝胶电泳、SYBR绿(双链DNA染料)的使用以及荧光报道探针的使用。可实时分析后两者。对于琼脂糖凝胶电泳,利用已知浓度的靶DNA的相似尺寸部分进行扩增来制备未知样品和已知样品。使两个反应在相同条件(优选使用相同引物,或至少具有相似退火温度的引物)下运行相同的时间长度。琼脂糖凝胶电泳用于将反应的产物与它们的原始DNA和多余引物分离。测量已知和未知样品的相对量以测定未知样品的量。SYBR绿染料的使用比琼脂糖凝胶法更精确,并且可实时产生结果。DNA结合染料结合所有新合成的双链DNA,测量荧光强度的增强,从而使得初始浓度能够被测定。然而,SYBR绿会标记所有双链DNA,包括任何预料之外的PCR产物以及引物二聚体,从而导致潜在的复杂化和假象。如通常一样,通过添加荧光双链DNA染料来准备反应。运行反应,监控荧光的水平(染料仅当结合于双链DNA时才发荧光)。参照标准样品或标准曲线,可测定PCR中双链DNA的浓度。荧光报道探针方法使用基于序列特异性核酸的探针,以便仅定量探针序列,而非所有双链DNA。这通常利用具有保持在相邻位置上的荧光报道分子和淬灭剂的基于DNA的探针(所谓的双标记探针)来进行。报道分子对淬灭剂的紧密靠近阻止其发荧光;只有当探针被分解时才可检测到荧光。该过程依赖于使用的聚合酶的5'至3'外切核酸酶活性。通过添加双标记探针来准备实时定量PCR反应。在双链DNA模板变性后,探针能够结合模板DNA的目标区域中的其互补序列。当将PCR反应混合物加热以激活聚合酶时,聚合酶开始合成引发的单链模板DNA的互补链。随着聚合继续进行,其到达结合于互补序列的探针,所述探针随后因聚合酶的5'-3'外切核酸酶活性而被水解,从而将荧光报道分子与淬灭分子分离。这导致可被检测的荧光的增强。在实时PCR反应的热循环过程中,监控荧光(如在每一个PCR循环中从水解的双标记探针释放的)的增强,这允许精确地测定DNA的最终量以及从而初始量。在一些实施方案中,期望使用原位杂交。原位杂交(ISH)将核酸杂交的技术应用和延伸至单细胞水平,并且与细胞化学、免疫细胞化学和免疫组织化学的技术组合,允许形态学的维持以及待维持和鉴定的细胞标志物的鉴定,以及允许序列至群体例如组织和血液样品内的特定细胞的定位。ISH是使用互补核酸来将一个或多个特定核酸序列定位在组织的部分或切片(原位)中,或如果组织足够小,定位在整个组织中(全标本包埋ISH)的杂交类型。RNAISH可用于测定组织的表达模式,例如miRNA的表达。处理样品细胞或组织以增加它们的通透性来允许探针例如miRNA特异性探针进入细胞。将探针添加至已处理的细胞,使其在适当的温度杂交,洗掉过量探针。用放射性、荧光或抗原性标志标记互补探针,以便探针在组织中的位置和量可使用放射自显影、荧光显微镜检查或免疫测定来进行测定。样品可以是本文中描述的任何样品,例如非癌性或癌性组织样品。由于特定miR的序列是已知的,因此可相应地设计miR特异性探针,以便探针特异性结合特定miR基因产物。还可使用特异于mRNA的探针。为了检测RNA,可在原位PCR之前将细胞内逆转录步骤用于从RNA模板产生互补DNA。这使得能够检测低拷贝RNA序列。细胞内PCR产物的检测通常通过技术例如间接原位PCR(利用PCR产物特异性探针,通过ISH进行的),或直接原位PCR(通过直接检测标记核苷酸(例如地高辛-11-dUTP、荧光素-dUTP、3H-CTP或生物素-16-dUTP)而无需ISH进行的,所述标记核苷酸在热循环过程中被掺入PCR产物)来实现。一般讨论雌激素受体(ER)阳性和ER阴性乳腺癌在分子方面是不同的疾病。两个关键分子标签:PR和人表皮生长因子受体2型(HER2)现被认为在分类和治疗的描述中是非常重要的。“三阴性”乳腺癌(TNBC)(不存在ER、孕酮受体(PR)和HER2表达)是对目前的靶向疗法不起反应的侵袭性恶性肿瘤。原位导管癌(DCIS)是反映乳腺导管内恶性细胞的增殖(无穿过基膜的浸润)的异质性的病变群体。约80%的所有乳腺癌为浸润性导管癌(IDC),这是最常见的BC类型。具有不同分子亚型(管腔A/B型、HER2+和基底样)的乳腺肿瘤具有显著不同的mRNA特征谱。乳腺肿瘤形成的一个假说假定从上皮增殖过度至DCIS和随后至浸润性癌(IDC)的逐步转化。该进展模型获得临床和流行病学数据以及分子克隆性研究的强有力支持。直至1980,DCIS很少被诊断并且代表<1%的BC。随着乳房x线摄影术的使用增加,DCIS成为最快速增加的BC的亚组,在美国占据15%–25%的新诊断的BC病例。在正常-至-DCIS转化过程中发生了显著变化,但令人惊讶地,具有相同组织学亚型的原位和浸润性乳腺癌通常共有相同的遗传和表观遗传改变以及表达模式。相反地,不同亚型(管腔、HER2+和基底样)的乳腺肿瘤的mRNA特征谱显著不同。已在DCIS和IDC中分析了许多肿瘤抑制基因和癌基因(包括TP53、PTEN、PIK3CA、ERBB2、MYC)的表达和突变状态,并且已发现了根据肿瘤亚型而非组织学分期的差异。例如,相较于管腔肿瘤,TP53的突变在基底样和HER2+亚型中更频繁;在基底样病例中,PIK3CA极少突变,但PTEN经常丢失,ERBB2的扩增对于HER2+亚型是特异性的。还在DCIS中分析了几个基于它们的生物功能而选择的候选基因的表达。本文中显示了针对正常乳腺至原位导管癌的转化建立的microRNA特征谱在原位导管癌至浸润性导管癌的转化中大多得到保持。此外,已显示9-microRNA标签可用于区分浸润性癌与原位癌。具体地,已显示let-7d、miR-210和-221在原位癌中被下调,在浸润转化中被上调,从而表征了沿着癌症进展途径的逆向表达。还描述了总体存活期和转移时间的microRNA标签。5个非编码基因与这两种预后标签相关:miR-210、miR-21、miR-106b*、miR-197和let-7i;miR-210是唯一一个也参与浸润转化的基因。为了查明在浸润转化中受影响的至关重要的细胞功能,鉴定了具有与miR-210反相关的特征谱的蛋白质编码基因:BRCA1、FANCD、FANCF、PARP1、E-钙粘蛋白、Rb1,所述基因在原位癌中全部被激活,并且在浸润性癌中被下调。此外,本文中描述了具有特殊特征的差异剪接同种型,例如不存在激酶结构域并且仅在原位导管癌中过表达的截短的EGFR。研究来自深度测序的MicroRNA数据以发现对于乳腺癌提供丰富信息的miRNA特征谱,包括正常乳腺、原位导管癌和浸润性导管癌。如本文中描述的本发明的实施方案大大地扩展了在BC进展中应用miRNA,进行诊断,预测进展,评估存活时间以及预测转移的知识和方法。本文中描述了参与正常乳腺/DCIS和DCIS/IDC转化的miR-210和其它关键miRNA的作用。本文中还描述了在组织学和分子BC类型中被差异调节的microRNA。这是特别有用的,并且具有特别的临床相关性,因为现在其鉴定了与转移时间和总体存活期相关的microRNA。除miR-21外,所有在预后标签中被鉴定的非编码基因与不良结果相关。miR-21的表达(在DCIS中大量增加)在IDC中得到维持或甚至更低。如本文中的实施例中指出的,在平衡后的数据集中,通过多变量Cox回归和通过单变量分析,miR-423-3p在总体存活期中仍然是显著的。与预后相关的miRNA的数目得到扩充,miR-210得到确认。在本文中的实施例中,miR-126和-335是在DCIS/IDC转化中被下调的5个miRNA中的2个miRNA。然而,它们与转移时间或总体存活期无关。另一个在DCIS/IDC转化中被下调的miRNA为miR-10b;然而,miR-10b与转移没有关联性。通过使用本文中描述的浸润性microRNA标签,进行进一步的分析来鉴定与BC进展相关的基因和功能。在浸润性标签的9个miRNA中,miR-210是唯一一个与预后相关并且显示逆向表达的miRNA。因此,本发明人随后测定在BC进展中与miR-210相对地表现的蛋白质编码基因。对于这些基因,本发明人鉴定了失调途径,这从而,对应于一小组至关重要的乳腺癌基因。这些在DCIS中被激活并且在IDC中被下调的基因包括BRCA1、RB1、FANCD、FANCF、PP2CA、EGFR、PARP1、NLK、CDH1和EHMT1(图5和图6)。因此,在一个广泛的方面,本文中描述了特异于浸润性的9个miRNA微标签和与IDC患者的转移时间和总体存活期相关的5个miRNA。在具体方面,本文中描述了如下发现:miR-210在BC进展中被调节并且也是两个预后标签的组分。在另一个具体方面,本文中描述了一组以与miR-210相对的方式表达的高度显著的BC基因。在下列实施例中进一步定义本发明,其中除非另有所指,否则所有部分和百分比是按重量计的,并且度数为摄氏度。应当理解这些实施例,尽管显示了本发明的优选实施方案,但仅以举例说明的方式给出。根据上文的讨论和这些实施例,本领域技术人员可确定本发明的基本特征,并且在不背离其精神和范围的情况下,可对本发明进行各种变化和修改来使其适应各种用途和条件。本说明书中提及的所有出版物包括专利和非专利文献明确地通过引用并入本文。除非这样指出,否则下列实施例意欲举例说明本发明的某些优选实施方案,并且不应当被解释为限制权利要求中定义的本发明的范围。本发明的价值从而可通过参考本文中的实施例来显示。实施例实施例1材料和方法通过使用复杂度50测定了乳腺miRNA特征谱的最佳代表的98,000个读数的最小运行复杂度。计算作为以代表50为中心的最近邻的中位复杂度的复杂度50(图7)。因此,本研究中仅包括那些具有大于复杂度50的复杂度的运行(185个样品中保留107个样品)。使用RPKM(MortazaviA,WilliamsBA,McCueK,SchaefferL,&WoldB(2008)MappingandquantifyingmammaliantranscriptomesbyRNA-Seq.NatMethods5(7):621-628)的改进法进行不同运行的标准化。一些短的RNA序列的原始数据获自Farazi等人(2011)MicroRNASequenceandExpressionAnalysisinBreastTumorsbyDeepSequencing,”CancerRes.71(13):4443-4453。由于不同miRNA种类的长度几乎恒定,因此标准化不包括miRNA长度,这因此只计算为每百万读数(RPM)。表达数据始于200RPM,并且不包括对于其少于20%的表达值在任一方向上与miRNA中值具有小于1.5倍的变化的miRNA。最终的表达矩阵包含107个样品中的159个miRNA的测量。双样本T检验用于双类型比较(即,IDC对DCIS)。基于1000个随机排列计算多变量排列检验。误检率用于评估多个检验误差。错误发现率评估的置信水平为80%,允许的假阳性基因的最大比例为5%。本发明人通过使用Cox比例危险度模型发现了其表达与转移时间和总体存活期显著相关的miRNA。进行其中次数和检查指标在样品间被随机变换的排列检验。基于10000个随机排列计算显著基因的排列p-值。计算miRNA表达水平的2倍变化的危害比。对于每一个基于Cox回归显著的miRNA,绘制卡普兰-迈耶存活曲线,其中按中位表达将患者分成两组,利用对数秩检验评估曲线之间的差异。人正常乳腺、DCIS和IDC的全转录组特征谱来源于Affymetrix人基因组U133Plus2.0阵列。42个正常乳腺、17个DCIS、51个ER+/HER2-IDC、17个HER2+/ER-IDC、17个HER2+/ER+IDC和33个三阴性IDC样品(25,29)。CEL文件或RMA数据获自GEO数据库(GSE3893、GSE2109、GSE21422和GSE21444)。将RMA与分位数标准化一起使用。将注释、可视化和集成发现表达分析系统浏览器的数据库(DAVIDEASE)用于基因本体论、疾病相关和Biocarta途径分析。miRNA定义原位导管癌至浸润性导管癌的转化发现了浸润性导管癌(IDC)、原位导管癌(DCIS)和正常乳腺的miRNA特征谱。通过使用无偏方法来进行测序运行的复杂度选择,获得了可靠的具有丰富信息的乳腺癌的miRNA特征谱本文中描述了测定对于产生人所有组成成分的代表性miRNA特征谱是必需的读数的最小数目的方法(图7)。对于该BC数据集,最小所需复杂度具有98,000个读数。通过应用该阈值,排除78个(43%)低复杂度乳腺癌运行,保留107个(57%)以进行进一步的统计分析。通过使用该平衡后的数据集,产生了代表高、中和低丰度miRNA种类的表达矩阵。66个miRNA在DCIS中相较于正常乳腺被差异调节(图9-表1和图1)。为了鉴定特别地在肿瘤浸润中被改变的miRNA,比较DCIS与IDC样品。9个miRNA在DCIS至IDC转化中被差异调节(图10-表2和图11-表3)。该差异调节在本文中一般被称为“浸润性微标签”,其中:miR-210、let-7d、miR-181a和miR-221被激活,然而miR-10b、miR-126、miR-218、miR-335-5p和miR-143被抑制(图1)。在这9个miRNA当中,let-7d、miR-210和miR-221是表达变化最强烈的那些miRNA,相对于正常情况,首先在DCIS中被下调,随后在IDC中被上调。参与DCIS/IDC转化的miRNA都未以相似的趋势参与早期的正常/DCIS转化。无miRNA与肿瘤分级相关。分析表达,并鉴定在IDC亚型中差异表达的miRNA,如图12-表4、图13-表5、图14-表6和图15-表7中显示的。实例为:miR-190在ER+/HER2-IDC中过表达;三阴性IDC的特征在于Myc调节的miR17/92oncomir簇、miR-200c和miR-128的激活;miR-200c与miR-148a和miR-96一起是在ER+/HER2+双阳性BC中表达抑制最强的miRNA中的miRNA。4个IDC临床亚组(ER+/HER2-、HER2+/ER-、ER+/HER2+和三阴性)中的失调的miRNA与DCIS和正常乳腺中的那些显著的miRNA一起示于图2。分析包括乳腺癌细胞系。还检查了BC分子亚型的已检查的miRNA特征谱。管腔B型和基底型是通过miRNA最佳表征的亚型。miR-190和miR-425与管腔B型相关。miR-452、miR-224、miR-155、miR-9和miR-17/92簇与基底型相关(图16-表8)。存在于肿瘤中,但不存在于正常乳腺中以及不存在于BC细胞系中的miRNA可能是污染性细胞类型的结果;miR-142和miR-223是两种这样的miRNA(图2)。应指出,miR-142和miR-223,与miR-342(相同表达簇中的另一种miRNA)一样,都高度特异于造血系统(图2)。该非乳腺基因簇中的其它造血miRNA包括miR-29和miR-26。实施例2乳腺癌的转移时间和总体存活期的预后miRNA标签使用两个临床参数:转移时间和总体存活期,来发现miRNA与预后之间的关联性。鉴定了在正常/DCIS、DCIS/IDC转化和不同IDC亚型中差异表达的miRNA(图2)。miR-127-3p、miR-210、miR-185、miR-143*和let-7b是与转移时间显著相关的miRNA中的miRNA,如通过单变量和多变量分析测定的(图17-表9)。miR-210、miR-21、miR-221和miR-652是与总体存活期相关的那些miRNA之中的miRNA(图18-表10),miR-210、miR-21、miR-106b*、miR-197和let-7i对于两个预后标签都相关。在这5个共同的miRNA当中,miR-210是唯一一个存在于浸润性微标签中的miRNA。转移时间中miR-210的卡普兰迈耶曲线示于图3B中,IDC患者的总体存活期示于图3A中。IDC中与转移时间相关的miRNA的卡普兰迈耶曲线示于图3C-3J中,其中图3C显示miR-127;图3D显示miR-185;图3E显示miR-145*;图3F显示let-7b;图3G显示miR-197;图3H显示miR-106*;图3I显示miR-21;以及图3J显示let-7i。IDC中与总体存活期相关的miRNA的卡普兰迈耶曲线示于图3K-3S中,其中图3K显示miR-21;图3L显示miR-221;图3M显示miR-652;图3N显示miR-106b*;图3O显示miR-28-3p;图3P显示miR-197;图3Q显示let-7i;图3R显示miR-423-3p;以及图3S显示miR-278。实施例3miR-210和HIF1A在乳腺癌进展中偶联由于miR-210可通过缺氧诱导并调节参与肿瘤引发的基因,因此使用Affymetrix微阵列数据分析了乳腺癌进展中的HIF1A和miR-210的初级RNA(pri-mir-210)。数据显示了HIF1A与pri-mir-210RNA之间的良好相关性(p<0.001)。比较了每一个BC亚型的成熟miR-210、pri-mir-210和HIF1A的相对量(图4)。对于每一个BC亚型和正常乳腺,将成熟miR-210的表达与pri-mir-210和HIF1ARNA的表达并排显示。RNA测量显示为每一个RNA在组内的总体百分比。HIF1A、pri-mir-210和成熟miR-210的水平在HER2+/ER-肿瘤中总是最高的,然而在正常乳腺中HIF1A和pri-mir-210的水平是最低的。HIF1A的水平据信指示缺氧,而正常乳腺组织中HIF1A的低水平则与常氧一致。HIF1AmRNA在DCIS中被强烈地诱导,其中缺氧从而可能发生。由缺氧敏感型启动子驱动的pri-mir-210转录在DCIS中被相应地激活。HIF1A/pri-mir-210比在不同IDC亚组间得到保持。唯一例外是成熟miR-210和pri-mir-210RNA在DCIS中的偶联。DCIS表达高水平的HIF1A和pri-mir-210,这表明缺氧,但在系列中显著最低的成熟miR-210水平显示强烈的严格下调压力。实施例4有限的一组乳腺癌基因定义原位和浸润转化鉴于本文中描述的结果和miR-210在浸润和预后中的独特作用,进一步研究了BC中受其表达控制的蛋白质和功能。检查来自42个正常乳腺、17个DCIS和118个IDC样品(51个ER+/HER2-、17个HER2+/ER-、17个HER2+/ER+和33个TNBC)的Affymetrix特征谱的全转录组。搜索可相容地为miR-210的直接或间接靶的基因,即具有与miR-210的行为相对抗的行为、在DCIS中被上调并在IDC中被下调的那些基因。DCIS病例具有4524个上调的探针组(来自8930个,FDR<0.05);其中,1761个探针组(对应于1353个基因)在IDC中被下调,从而代表miR-210靶或其下游作用。乳腺癌是与这些基因(25个基因;富集p<0.001;图19-表11)显著相关的唯一疾病。以与miR-210相对的方式调节的乳腺癌基因,沿着DCIS/IDC进展轴,包括RB1、BRCA1、FANCD、FANCF、PP2CA、PARP1、NLK、E-钙粘蛋白(CDH1)和EHMT1(图5和图6)。BC中与miR-210反相关的基因调节的途径为:细胞凋亡中的半胱天冬酶级联、HER2受体再循环、TNFR1信号转导、FAS信号转导(CD95)以及癌症易感性中的BRCA1、BRCA2和ATR。根据它们的剪接同种型,这些基因中的一些基因也受到差异调节。EGFR的经典同种型在正常乳腺中表达,并且在DCIS中被下调。有趣地,不存在全酪氨酸激酶结构域的截短的EGFR变体(uc003tqi.2)不在正常乳腺或IDC中表达,但在DCIS中特异性过表达。其它基因的显示肿瘤亚型差异表达的剪接变体为nibrin和ErbB3。实施例5TCGAIDC队列中的患者特征和整合特征谱在来自未经预治疗的女性患者的466个原发性IDC(TCGAIDC队列)中研究整合的miRNA/mRNA肿瘤特征谱(19262个mRNA和581个miRNA)。研究仅包括具有完全表征(mRNA和miRNA特征谱)的肿瘤和具有至少一个月的总体存活期(OS)的患者。由TCGA协会表征的这些患者的扩展的人口统计数据提供于图20中。原始的RNA、DNA甲基化(meDNA)、体细胞突变和临床的数据获自TCGA数据门户。为了建立整合的mRNA/miRNA表达特征谱,将mRNA标准化为RPKM,将miRNA标准化为总的比对的miRNA读数的每百万读数。将每一个基因的log2标准化读数的方差与所有方差的中位数相比较。将比中位基因更可变的基因保留在整合特征谱中(p<0·05)。在使用该差异强度滤过器后,7735个mRNA和247个miRNA存在于整合RNA特征谱中。使用Infinium450K平台对来自相同IDC队列的296名患者进行DNA甲基化(meDNA)的研究。M值,即甲基化探针相对其对应的未甲基化的探针的强度的log2比率,用于测量CpG甲基化。癌症的体细胞突变目录数据库(CatalogueOfSomaticMutationsInCancerdatabase)(第60版)用于鉴定已知在癌症中具有功能性体细胞突变的基因。用高度相关的卵巢癌数据集来扩增乳腺癌数据集以评估大的肿瘤样本大小。鉴定了具有至少两个已验证的导致一级蛋白质结构改变的体细胞突变的基因。存活分析IDC肿瘤和患者的临床协变量概述于图20中。为了计算卡谱兰迈耶分布,将具有基因过表达的组分配至具有大于中位表达的表达的样品。除当明确地提及外,否则使用对数秩检验法(Mantel-Cox)进行存活分布的等效性检验。计算每一个独立亚类中的RNA的危害比(HR)和卡普兰-迈耶曲线。选择在至少两个亚类中(在相同的临床或分子种类中)具有显著的HR和对数秩检验(p<0·05)的RNA。选择编码基因所需的其它标准是DNA甲基化与OS的关联性和COSMIC数据库中的体细胞突变的存在。使用单变量Cox回归进行DNA甲基化与OS之间的关联(图26.-图27)。将多数决定原则投票程序应用于每一个预后基因的CpG位点的所有显著危害比(FDR<0·001);例如,具有小于1的最显著的CpGHR的基因的DNA甲基化会被定义为与结果负相关,或反之亦然。对于多变量分析,将Cox比例危险度模型应用于已在单变量水平上显示统计显著性(p<0·05)的所有协变量。将Wald检验用于向后逐步选择程序以鉴定具有显著的独立预测值的基因或协变量以及评价危害比(HR)和95%的置信区间(CI)。所有报告的p值是双侧的。使用SPSS(21版)或R/BioConductor(2.10版)进行所有分析。风险预测因子和ROC曲线的定义使用监督主成分分析法计算线性RNA风险预测因子的基因权重。使用十倍交叉验证产生经预测具有低或高风险(中位切分(mediancut))的病例的卡普兰-迈耶存活曲线。类似地构建合并协变量例如N期、疾病分期、内部亚型、年龄、ER状态、PR状态、TP53突变和PIK3CA突变的多变量模型。通过对存活数据的随机排列重复方法1000次来测定交叉验证的卡普兰-迈耶曲线和对数秩统计数据的统计显著性。对于RNA模型,p值检验无效假说(表达数据与存活之间无关联)。对于组合的RNA和临床协变量模型,p值解释当与协变量相比较时基因的表达数据是否显著地增加风险预测。通过比较各自ROC曲线的AUC来评估模型预测结果的能力。使用R中的survivalROC包进行受者作用特征特征(ROC)曲线的曲线下面积(AUC)的分析,从而允许利用截尾数据进行时间依赖性ROC曲线评估。由于在所有存活分析中较少的事件在60个月后发生(参见卡普兰-迈耶曲线),因此比较模型在该时间点和该时间点附近预测结果的能力。ROC曲线将真阳性针相对假阳性预测作图,从而更高的AUC表示更高的模型表现(AUC=0·5表示随机表现)。RNA风险评分和分组(上文中定义的风险-高或-低)基于线性风险预测因子中的权重。用于34-基因预后标签的验证的独立队列为了验证从TCGAIDC队列获得的预后标签,使用具有完整的10年随访的原发性乳腺癌患者(总共2104个患者)的7个回顾性系列。在UK队列(n=207)中,74%的患者具有IDC,而其余乳腺癌主要是小叶的(12%)或混合的(7%)。UK队列针对无远端复发存活(distantrelapse-freesurvival)(DRFS)的临床终点是远端转移检测或死亡,或无任何这样的事件的最后评估的日期(终检值)。使用IlluminamiRNAv.1微珠芯片测量miRNA(GSE22216)的表达,使用IlluminaHumanRefSeq-8微珠芯片测量mRNA(GSE22219)的表达。该测定测量了24332个mRNA和488个miRNA。将分位数标准化用于两个阵列,以及用于整合的特征谱。在另外6个Affymetrix乳腺癌特征谱上进行mRNA预后成分的验证。Wang队列由180个淋巴结阴性无复发患者和106个发生远端转移的淋巴结阴性患者(GSE2034,n=286)组成。将Hatzis队列用于研究新辅助疗法紫杉烷-蒽环霉素化学疗法后的反应和存活(GSE25066,n=508)。将Kao队列用于通过327个乳腺癌样品的基因表达特征谱鉴定乳腺癌的分子亚型和测定不同乳腺癌亚型的分子和临床特征(GSE20685,n=327)。将Bos队列用于研究脑转移(成人中一种最可怕的癌症并发症且是最常见的颅内恶性肿瘤)(GSE12276,n=195)。从德国患者收集TNBC队列以表征三阴性乳腺癌(GSE31519,n=383)。TRANSBIG队列由比利时患者组成,用于验证用于预测淋巴结阴性患者的远端转移的76-基因预后标签(GSE7390,n=198)。DRFS是所有验证队列的临床终点,除其中使用OS的Kao和TRANSBIG外。还将7个验证队列用于34-基因整合标签与其它预后BC标签的比较。与共同风险基因相关的生物过程为了研究与单个基因甚至microRNA相关的细胞功能,对与该基因具有阳性或阴性斯皮尔曼等级相关(FDR<0.001)的mRNA进行GO分析。将Cytoscape中的BiNGO插件用于检索相关GO注释,将它们通过GO等级向上传送。将其中取样在无置换存在的情况下发生的超几何检验用于以P-值的形式评估存活基因集中基因本体(GO)术语的富集。使用Benjamini和Hochberg法校正GOP-值。检查与共同风险基因相关的被激活的或抑制的生物过程。除脂质修饰和磷酸肌醇磷酸化(PIK3CA、SMG1和CPT1)外,当风险预测因子中的所有编码基因被一起考虑时,不存在功能性富集。该发现与影响独立途径的风险基因一致。通过对mRNA进行GO分析研究每一个单个基因(无论是mRNA还是miRNA),所述基因与所述mRNA在其在整合RNA特征谱中相关。参与有丝分裂细胞周期和细胞核分裂的基因与miR-484正相关。miR-328与M期和DNA修复的基因相关,miR-874与参与细胞附着的基因相关。miR-484与形态发生和血管生成,以及表皮的发育和半桥粒的装配中的基因负相关,所述半桥粒将上皮细胞锚定于细胞外基质组分例如基片。CPT1A与参与乳房初发育(出生后乳腺发育的开始(通常在青春期开始时发生))的乳腺分枝以及RalGTP酶调节相关。C2CD2与参与性腺中胚层的发育和苗勒氏管的退化的基因,包括NME1和NME2(抗转移NM23家族的成员)的抑制相关。PIK3CA的表达与蛋白质磷酸化和转录起始的活化以及与线粒体ATP合成偶联的质子运输的抑制相关。结果TCGAIDC队列的整合分子特征谱和临床参数研究了TCGAIDC队列中466个原发性IDC的整合miRNA/mRNA肿瘤特征谱(7735个mRNA和247个miRNA)(图20)。miR-210与原位导管癌(DCIS)至IDC的转化和与不良预后相关,并且是在具有远端转移的原发性肿瘤中上调最多的miRNA(p=0·02)。在研究DNA甲基化和RNA表达的预后值之前,进行单变量存活检验来评估TCGAIDC队列中临床参数与结果之间的关系。N期、M期、疾病分期、T期和内部亚型(图30-图34)与OS显著相关。ER阳性患者显示更加有利的结果,具有三阴性乳腺癌的患者显示更差的预后(图35-图36)。绝经状态和年龄与OS无关。尽管IDC中的体细胞突变与特定内部亚型相关(TP53与基底样和HER2-富集相关,而PIK3CA与管腔A型相关),但它们与OS无关(图37-图38)。该评估的结果显示TCGAIDC队列的存活数据,尽管包含大部分截尾数据,仍然富含信息,并且适合用于进一步分子研究。TCGAIDC队列中OS与miRNA/mRNA/meDNA的关联性随后详细地研究了TCGAIDC队列中OS与miRNA、mRNA和DNA甲基化特征谱的关联性。目的是鉴定一组共同的基因,如果存在的话,所述基因在不同的临床或分子亚型间一致地驱动疾病的结果。策略和基本原理图示于图22中。在下列独立种类的每一个中使用整合mRNA/miRNA特征谱进行OS的单变量存活分析:疾病分期、淋巴结受累、手术切缘、绝经前或后、内部亚型、体细胞突变(TP53、PIK3CA途径、TP53/PIK3CA双突变体、GATA3、MAPK和其余不太频繁改变的基因)。具有不同临床或分子特征的患者亚类代表了每一类中的不相关的组。只有当在来自相同种类的至少两个独立亚类中显著时,才选择mRNA或miRNA。由于DNA甲基化是转录控制中的关键机制,因此将编码基因的DNA甲基化用作与OS关联的另外标准。通过使用PIK3CA预后基因作为模型,第一焦点是CpG甲基化与mRNA表达之间的关系。与PIK3CA表达相关的甲基化CpG位点全都位于其第一外显子周围的2·2Kb区域(具有组蛋白H3中赖氨酸27的强乙酰化和转录因子的高密度结合的区域)中(图26)。该区域中的大部分(6个中的5个)显著CpG位点具有预期的DNA甲基化与PIK3CA表达之间的负相关性。基于该发现,将多数决定原则用于确定基因的甲基化与OS之间的关联性的类型。当基因的大多数显著甲基化位点(图27)具有低于1的HR时,将基因的甲基化与结果之间的相互关系定义为“负”。该方法允许发现这样的基因:具有不良结果与RNA过表达和DNA低甲基化的成对关联性,或反之亦然。DNA甲基化检验不用于miRNA,因为这些极小基因中测定的CpG位点数目有限。然而大多数miRNA通过了甲基化检验(数据未显示)。作为精炼风险基因-集的最终步骤,仅保留在癌症中具有已知的蛋白质突变的mRNA(根据癌症的体细胞突变目录)。使用的如图22中所示的严格的多步骤选择导致以下发现:i)与IDC患者间的临床结果相关、不限定于特定肿瘤亚类的共同RNA的鉴定,ii)预后基因在非重叠患者亚类中的验证,iii)DNA甲基化用作确认RNA表达的独立分子参数的用途,和iv)具有真正的癌症活性的预后基因的鉴定(图28)。预后矩阵(图23)使得满足提出的标准的24个mRNA和10个miRNA的所有显著危害比可视化(p<0·05)。矩阵中的基因在本文中称为“预后34-基因集”。一些已知的BC基因(例如,NME3(NM23家族的同种型))仅在单个亚类内与结果相关,从而不满足选择要求。本质上,所有选择的mRNA和miRNA具有大于1的危害比,从而它们的过表达与不良结果相关。DAAM1(被认为用作用于Wnt诱导的松散(Dvl)-Rho复合物的装配的支架蛋白)是具有最高的与淋巴结受累的相关性的预后基因(斯皮尔曼相关性检验,p<0·001,FDR=0·001)。TCGAIDC队列的整合IDC风险预测因子将预后34-基因集用于开发两个多变量模型和预测具有IDC的患者的OS:a)“RNA模型”,仅使用mRNA和miRNA表达数据,仅由基因组成;和,b)“组合模型”,该模型另外地包括分子和临床协变量。使用监督主成分分析法构建存活高和低风险组。随后发现IDC中OS的线性风险预测因子(图29和图24A)。进行受者作用特征(ROC)的曲线下面积(AUC)的分析,从而允许利用截尾数据进行时间依赖性ROC曲线评估(图24B)。整合IDC风险预测因子的AUC在60个月的OS时为0·71(p<0·001)。为了评价整合RNA预测因子的独立预后值,开发组合模型,其还包括淋巴结受累(N期)、疾病分期、T期、分子亚型、诊断时的年龄、TP53突变状态、PIK3CA途径突变状态、ER状态和PR状态。最终的组合模型包括线性风险预测因子和N期作为仅剩的临床或分子协变量。组合模型的ROC曲线具有显著的AUC,但不大于RNA模型的AUC。因此,IDC风险预测因子中RNA水平具有独立的预后值,然而其它临床和分子协变量,除N期外,不具有独立的预后值。独立BC队列中34-基因预后标签的验证对3个独立BC队列进行34-基因预后标签的验证。首先使用的是207个乳腺癌患者的UK队列。此处再评估miRNA/mRNA预后基因集对无远端复发存活(DRFS)的预测。在UK队列中测量9个miRNA和11个mRNA(少于34个预后基因的2/3)。然而,预后标签的KM曲线(p=0·013)和ROC曲线(AUC=0·65,p=0·001)都是显著的(图25a-25B)。由于没有针对大队列的其它可获得的mRNA和miRNA组合的表达数据,因此还评价了关于Hatzis(n=508)、Kao(n=327)、TNBC(n=383)、Bos(n=195)、Wang(n=286)和TRANSBIG(n=198)队列的预后标签的mRNA组分。预后标签可预测通过Affymetrix特征谱表征的这些BC队列(图21)。34-基因标签与其它预后BC标签的比较将34-基因整合标签的预后值与BC的风险分层的5个不同标签:21-基因、用作基因组学等级指数的97-基因、70-基因、76-基因和10-miRNA标签的预后值相比较。将6个预后标签的每一个标签用于8个不同的BC队列(总共2570个患者)(图21)。计算每一个标签/队列组合的ROC曲线的AUC,从而产生预后值的矩阵(图21)。10-miRNA标签在UK数据集中预测在所述数据集中测定的DRFS(AUC=0·75,p<0·001),而在TCGA队列中不显著。在TNBC队列中,所有测试的标签是成功的,具有相似的表现(p<0·001)。21-基因标签在所有队列中的表现非常好,除明显地TCGAIDC队列外,在所述TCGAIDC队列中21-基因标签不显著(AUC=0·58,p=0·12)。在Bos队列中,仅整合34-基因、21-基因和70-基因标签具有良好的预后值。34-基因(p<0·001)和97-基因(尽管具有临界p=0·053)标签是仅有的两个在大的异质TCGAIDC队列中具有显著预后值的标签。实施例5的讨论IDC的特征在于不同的分子亚型,其影响与临床结果相关的细胞途径。本发明人在本文中确定了共同机制是否在IDC分子和临床种类间与总体存活期(OS)相关。microRNA(miRNA)是负责癌症的细胞过程的调节剂,其由进而受DNA甲基化调节的mRNA编码。由于这些多重关系,因此使用mRNA/miRNA表达和DNA甲基化的全基因组数据对466个患者的乳腺癌大队列进行综合存活分析。发现的34-基因预后标签在总共2104个另外患者的7个乳腺癌队列中得到成功地验证。34-基因标签由于这些队列不是初治的,因此鉴定的RNA可不仅具有预后性还可预测对治疗的反应。然而,患者接受不同治疗,从而RNA是独立于治疗的。此外,miRNA和mRNA特征谱的整合增强了风险预后因子的预后强度。并且,DNA甲基化用作确认mRNA表达与OS之间的关联性的标准。被发现的生物标志物在总共2500多个患者的8个不同的异质乳腺癌队列间是一致的。值得注意地,34个预后基因的大多数先前在BC中未被描述过。在预后标签的少数已知的癌基因当中,PIK3CA是最显著的一个。PIK3CA是癌基因成瘾的实例,同样地当其未被突变时亦为癌基因成瘾的实例,从而为治疗的主要靶点。相反地,TP53(BC中的另一个频繁突变的癌基因)不显示这样的关联性。最后,TP53或PIK3CA的基因型未将预后值添加至基于RNA的风险预测因子。当将标志物用于一组不依赖于产生关联性的数据时,标志物的有效性得到增强。预后34-基因集经证明是这样的有效标志物,因为其在所有研究的队列中具有预后性。实施例6用于癌症相关疾病的诊断、分期、预后、监控和治疗的方法、试剂和试剂盒应理解,本文中的所有实例在它们的范围上将被认为是非限定性的。在下列小节中将进一步详细地描述各个方面。.诊断方法在一个实施方案中,提供了评估患者是否具有癌症相关疾病或具有比正常更高的发生癌症相关疾病的风险的诊断方法,其包括步骤:将患者样品的标志物的表达水平与对照例如来自无癌症相关疾病的患者的样品的标志物的正常表达水平相比较。患者样品的标志物的表达水平相较于正常水平的显著改变表明患者患有癌症相关疾病或具有比正常更高的发生癌症相关疾病的风险。在某些实施方案中,这样选择标志物,以便所述方法的阳性预测值为至少约10%,在某些非限定性实施方案中,为约25%、约50%或约90%。同样地,优选地用于所述方法的是在至少约20%,在某些非限定性实施方案中约50%或约75%的细胞中相较于正常细胞差异表达至少2倍的标志物。在评估患者是否患有癌症相关疾病的一个诊断方法(例如,新的检测(\筛查\)、复发的检测、反射测定)中,方法包括将a)患者样品的标志物的表达水平,与b)对照的非癌相关疾病样品的标志物的正常表达水平相比较。患者样品的标志物的表达水平相较于正常水平的显著改变表明患者患有癌症相关疾病。还提供了用于评估用于抑制患者的癌症相关疾病的疗法的效力的诊断方法。这样的方法包括将a)在给患者提供至少部分疗法之前获自患者的第一样品的标志物的表达,与b)在提供部分疗法之后获自患者的第二样品的标志物的表达相比较。第二样品的标志物的表达水平相较于第一样品的标志物的表达水平的显著改变表明疗法对于抑制患者的癌症相关疾病是有效的。应理解,在这些方法中,\疗法\可以是用于治疗癌症相关疾病的任何疗法,包括但不限于药物组合物、基因疗法和生物疗法例如抗体和趋化因子的施用。因此,本文中描述的方法可用于在治疗之前、期间和之后评价患者,例如评价疾病状态的减轻。在某些方面,诊断方法涉及使用化学或生物试剂的疗法。这些方法包括将a)获自患者并且在化学或生物试剂存在的情况下维持的第一样品的标志物的表达,与b)获自患者并且在试剂不存在的情况下维持的的第二样品的标志物的表达相比较。第二样品的标志物的表达水平相对于第一样品的标志物的表达水平的显著改变表明所述试剂对于抑制患者的癌症相关疾病是有效的。在一个实施方案中,第一和第二样品可以是获自患者的单个样品的部分或获自患者的混合样品的部分。用于评价预后的方法还提供了用于评价患者的癌症相关疾病的进展的监控方法,所述方法包括:a)在第一时间点检测患者样品的标志物的表达;b)在随后的时间点上重复步骤a);和c)将在步骤a)和b)中检测的表达水平相比较,由此监控患者的癌症相关疾病的进展。在随后的时间点上样品的标志物的表达水平相较于在第一时间点上样品的标志物的表达水平的显著改变表明癌症相关疾病已经进展,然而表达水平在相反方向上的显著改变表明癌症相关疾病已消退。还提供了用于确定癌症相关疾病是否已恶化或可能在将来恶化的诊断方法,所述方法包括将a)患者样品的标志物的表达水平,与b)对照样品的标志物的正常表达水平相比较。患者样品的表达水平相较于正常水平的显著改变表明癌症相关疾病已恶化或可能在将来恶化。用于评估抑制性、治疗性和/或有害性组合物的方法还提供了用于选择用于抑制患者的癌症相关疾病的组合物的测试方法。该方法包括步骤:a)获得包含患者的细胞的样品;b)分别地在多种测试组合物存在的情况下维持样品的等分;c)比较每一个等分的标志物的表达;和d)选择测试组合物的一个,其相较于在其它测试组合物存在的情况下标志物的表达水平,显著地改变包含该测试组合物的等分的标志物的表达水平。另外地提供了评估化合物在引发癌症相关疾病上的有害潜能的测试方法。该方法包括步骤:a)在所述化合物存在和不存在的情况下维持分开的细胞等分;和b)比较每一个等分的标志物的表达。在化合物存在的情况下维持的等分的标志物的表达水平相对于在所述化合物不存在的情况下维持的等分的标志物的表达水平的显著改变表明所述化合物具有这样的有害潜能。此外,还提供了抑制患者的癌症相关疾病的方法。该方法包括步骤:a)获得包含患者的细胞的样品;b)在多种组合物存在的情况下单独地维持样品的等分;c)比较每一个等分的标志物的表达;和d)给患者施用至少一种组合物,所述组合物,相对于在其它组合物存在的情况下标志物的表达水平,显著地改变包含该组合物的等分的标志物的表达水平。可以例如通过检测如下物质在样品中的存在来评估样品的标志物的表达水平:对应标志物蛋白或所述蛋白的片段(例如,通过使用试剂,例如抗体、抗体衍生物、抗体片段或单链抗体,所述试剂特异性结合所述蛋白或蛋白片段)、对应标志物核酸(例如,核苷酸转录物或其互补序列),或所述核酸的片段(例如,通过将获自样品的转录的多核苷酸与已将一个或多个具有固定于其的所述核酸序列的整体或区段或其互补序列的核酸的基底接触)、通过对应标志物蛋白直接(即,催化的)或间接产生的代谢物。可使用至少一种(1)或多种(例如,2、3、5或10或更多种)癌症相关疾病标志物进行上述方法的任何方法。在这样的方法中,将多种标志物(其至少一种为标志物)的每一种在样品中的表达水平与在获自未患有癌症相关疾病的对照人的相同类型的样品中多种标志物的每一种的正常表达水平相比较。一种或多种标志物或其某一组合在样品中的表达水平相对于该标志物的对应正常或对照水平的显著改变(即,如使用单个标志物的上述方法中指定的升高或降低)表明患者患有癌症相关疾病。对于所有上述方法,这样选择标志物,以便所述方法的阳性预测值为至少约10%。候选试剂的实例候选试剂可以是本领域已知的药理试剂或可以是先前未知具有任何药理活性的试剂。试剂可以是天然产生的或实验室中设计的。它们可从微生物、动物或植物分离而来,或可重组地产生,或通过任何适当的化学方法合成。它们可以是小分子、核酸、蛋白质、肽或拟肽。在某些实施方案中,候选试剂是具有超过50并且小于约2,500道尔顿的分子量的小的有机化合物。候选试剂包含与蛋白质的结构性相互作用所必需的官能团。候选试剂还可见于生物分子中,包括但不限于肽、糖、脂肪酸、类固醇、嘌呤、嘧啶、衍生物、结构类似物或其组合。候选试剂获自许多来源,包括合成或天然化合物的文库。例如,存在许多可用于多种有机化合物和生物分子的随机和定向合成(包括随机化寡核苷酸和寡肽的表达)的方法。或者,以细菌、真菌、植物和动物提取物的形式存在的天然化合物的文库是可获得的或容易产生的。此外,天然或合成产生的文库和化合物可通过常规化学、物理和生物化学方法来容易地修饰,并且可用于产生组合文库。在某些实施方案中,可使用组合文库方法领域中的许多方法的任何方法获得候选试剂,所述方法包括但不限于:生物文库、可空间上寻址的平行固相或液相文库、需要去卷积的合成文库法、“一珠一化合物”文库法以及使用亲和层析选择的合成文库法。在某些其它实施方案中,可将某些药物试剂经历直接或随机化学修饰,例如酰化、烷化、酯化、酰胺化等以产生结构类似物。用于鉴定用于治疗癌症相关疾病的治疗性试剂的相同方法也可用于验证从体外研究产生的前导化合物/试剂。候选试剂可以是上调或下调一个或多个癌症相关疾病反应途径的试剂。在某些实施方案中,候选试剂可以是影响这样的途径的拮抗剂。用于治疗癌症相关疾病的方法本文中提供了用于治疗、抑制、减轻或逆转癌症相关疾病反应的方法。在本文中描述的方法中,给有此需要的个体例如但不限于这样的并发症在其中还不明显的癌症相关疾病患者和已具有至少一个癌症相关疾病反应的那些患者,施用干扰信号转导级联的试剂。在前一种情况下,这样的治疗用于预防这样的癌症相关疾病反应的发生和/或减轻它们发生所达到的程度。在后一种情况下,这样的治疗用于减轻这样的癌症相关疾病反应发生所达到的程度,阻止它们的进一步发展或逆转癌症相关疾病反应。在某些实施方案中,干扰癌症相关疾病反应级联的试剂可以是特异于这样的反应的抗体。标志物的表达和/或检测可以以许多方式抑制/增强标志物的表达,包括以非限定性实例为例,可给癌症相关疾病细胞提供反义寡核苷酸以抑制/增强标志物的转录、翻译或两者。或者,可给细胞提供多核苷酸以产生可抑制/增强蛋白质的功能或活性的细胞内抗体,所述多核苷酸编码特异性结合标志物蛋白的抗体、抗体衍生物或抗体片段,并且可操作地与适当的适当启动子/调控区连接。还可通过用特异性结合标志物蛋白的抗体、抗体衍生物或抗体片段处理癌症相关疾病细胞来抑制/增强标志物的表达和/或功能。通过使用本文中描述的方法,可筛选多种分子,特别地包括足够小以便其能够穿过细胞膜的分子,以鉴定抑制/增强标志物的表达或抑制标志物蛋白的功能的分子。可给患者施用所鉴定的化合物以抑制患者的癌症相关疾病细胞。任何标志物或标志物的组合,以及与所述标志物组合的任何特定标志物可用于本文中描述的组合物、试剂盒和方法。一般而言,期望使用这样的标志物,对于所述标志物,癌症相关疾病细胞的所述标志物的表达水平与正常细胞的相同标志物的表达水平之间的差异尽可能大。尽管该差异可小至用于评估标志物的表达的方法的检测限,但仍期望差异至少大于评估方法的标准误差,在某些实施方案中,差异为正常组织的相同标志物的表达水平的至少0.5、1、2、3、4、5、6、7、8、9、10、15、20、100、500、1000倍或更大。已认识到,某些标志物蛋白被分泌至细胞周围的细胞外空间。归因于可在癌症相关体液样品中检测到这样的标志物蛋白的事实,这些标志物用于组合物、试剂盒和方法的某些实施方案,所述体液样品可比组织活检样品更容易地从人患者收集。此外,用于检测标志物蛋白的体内技术包括将针对所述蛋白的标记抗体引入受试者。例如,可用放射性标记物标记抗体,所述标记物在受试者中的存在和位置可利用标准成像技术来检测。.为了确定任何特定标志物蛋白是否是分泌性蛋白质,在例如哺乳动物细胞例如人细胞系中表达标志物蛋白,收集细胞外液,随后评估所述蛋白在细胞外液中的存在或不存在(例如使用与所述蛋白特异性结合的标记抗体)。应当理解,包含细胞的患者样品可用于本文中描述的方法。在这些实施方案中,标志物的水平可通过评估样品中标志物的量(例如,绝对量或浓度)来进行评估。当然,可将细胞样品经历多种收集后制备和贮存技术(例如,核酸和/或蛋白质提取、固定、贮存、冷冻、超滤、浓缩、蒸发、离心等),随后评估样品中标志物的量。组合物、试剂盒和方法可用于检测标志物蛋白的表达,所述标志物蛋白具有至少一个在表达其的细胞的表面上展示的部分。例如,免疫学方法可用于检测全细胞上的这样的蛋白,或基于计算机的序列分析法可用于预测至少一个细胞外结构域(即,包括分泌的蛋白和具有至少一个细胞表面结构域的蛋白)的存在。可检测具有至少一个在表达其的细胞的表面上展示的部分的标志物蛋白的表达而不必裂解细胞(例如,使用与所述蛋白的细胞表面结构域特异性结合的标记抗体)。可通过许多用于检测转录的核酸或蛋白质的表达的方法中的任何方法评估标志物的表达。这样的方法的非限定性实例包括用于检测分泌的蛋白、细胞表面蛋白、细胞质蛋白或细胞核蛋白的免疫学方法、蛋白质纯化法、蛋白质功能或活性测定法、核酸杂交法、核酸逆转录法和核酸扩增法。在具体实施方案中,标志物的表达通过使用抗体(例如,放射性标记的、生色团标记的、荧光基团标记的或酶标记的抗体)、抗体衍生物(例如,缀合有底物或蛋白质或蛋白质-配体对的配体的抗体)或抗体片段(例如,单链抗体、分离的抗体高变结构域等)来评估,所述抗体、抗体衍生物或抗体片段与标志物蛋白或其片段,包括已经历全部或部分其正常翻译后修饰的标志物蛋白特异性结合。在另一个具体实施方案中,标志物的表达通过从患者样品的细胞制备mRNA/cDNA(即,转录的多核苷酸),和通过将所述mRNA/cDNA与作为标志物核酸的互补序列或其片段的参照多核苷酸杂交来进行评估。可任选地使用多种聚合酶链式反应法中的任何方法扩增cDNA,随后与参照多核苷酸杂交;优选地,不扩增其。同样地可使用评估标志物的表达水平的定量PCR检测一个或多个标志物的表达。或者,可将许多检测标志物的突变或变体(例如,单核苷酸多态性、缺失等)的方法中的任何方法用于检测标志物在患者中的存在。在相关实施方案中,将获自样品的转录的多核苷酸的混合物与已将与标志物核酸的至少部分(例如,至少7、10、15、20、25、30、40、50、100、500或更多个核苷酸残基)互补或同源的多核苷酸固定于其的基底接触。如果互补或同源的多核苷酸可在基底上被差异地检测到(例如,可使用不同的发色团或荧光基团检测的,或固定于不同的选择的位置),则可使用单个基底(例如,固定在选择的位置上的多核苷酸的\基因芯片\微阵列)同时评估多个标志物的表达水平。当使用包括一个核酸与另一个核酸的杂交的评估标志物表达的方法时,期望在严格杂交条件下进行杂交。生物标志物测定在某些实施方案中,可使用质谱法或表面等离子体共振术进行生物标志物测定。在不同的实施方案中,鉴定具有抗癌症相关疾病的活性的试剂的方法可包括a)提供包含一个或多个标志物或其衍生物的细胞的样品;b)从细胞制备提取物;c)将提取物与包含标志物结合位点的标记核酸探针混合;和,d)测定在测试试剂存在或不存在的情况下标志物与核酸探针之间的复合物的形成。测定步骤可包括将提取物/核酸探针混合物经历电泳迁移位移测定。在某些实施方案中,测定步骤包括选自酶联免疫吸附测定(ELISA)、基于荧光的测定和超高通量测量,例如表面等离子体共振(SPR)或荧光相关光谱(FCS)测定的测定。在这样的实施方案中,SPR传感器对于生物分子相互作用的直接实时观察是有用的,因为SPR对金属电介质表面上的微小折射率变化非常敏感。SPR是对在约200nm的SPR传感器/样品界面内的105至10-6折射率(RI)单位的变化敏感的表面技术。因此,SPR光谱学可用于监控沉积在传感层上的有机薄膜的生长。因为组合物、试剂盒和方法依赖于一个或多个标志物的表达水平的差异的检测,因此期望标志物的表达水平显著高于用于评估正常细胞和癌症影响细胞的至少之一中的表达的方法的最小检测限。应理解,通过使用一种或多种标志物对另外的患者样品进行常规筛查,将认识到在不同类型(包括特定的癌症相关疾病)的细胞中某些标志物是表达不足或过表达的。此外,当评估更大数量的患者样品的标志物的表达和关联从其获得所述样品的个体患者的结果时,还可确认某些标志物的改变的表达与癌症相关疾病强烈相关,以及其它标志物的改变的表达与其它疾病强烈相关。因此组合物、试剂盒和方法可用于表征患者的癌症相关疾病的分期、等级、组织学类型和性质中的一项或多项。当组合物、试剂盒和方法用于表征患者的癌症相关疾病的分期、等级、组织学类型和性质中的一项或多项时,期望这样选择标志物或一组标志物,以便在至少约20%,在某些实施方案中,至少约40%、60%或80%以及大体上全部的患有对应分期、等级、组织学类型或性质的癌症相关疾病的患者中获得阳性结果。可以这样选择标志物或一组标志物,以便对于一般群体获得大于约10%的阳性预测值(在非限定性实例中,偶联有大于80%的测定特异性)。当多个标志物用于组合物、试剂盒和方法时,可在单个反应混合物(即对于每一个标志物,使用试剂,例如不同的荧光探针)中或在对应于一个或多个标志物的个体反应混合物中,将患者样品的每一个标志物的表达水平与相同类型的非癌样品的多个标志物的每一个的正常表达水平相比较。在一个实施方案中,样品中多个标志物的超过一个标志物的表达水平相对于对应正常水平的显著改变表明患者患有癌症相关疾病。当使用多个标志物时,可使用2,3,4,5,8,10,12,15,20,30或50或更多个单独的标志物;在某些实施方案中,可能期望使用更少的标志物。为了使组合物、试剂盒和方法的灵敏度最大化(即,因可归因于患者样品中非组织和/或液体来源的细胞的干扰),期望本文中使用的标志物是具有受限制的组织分布,例如通常不在非组织细胞中表达的标志物。应认识到,组合物、试剂盒和方法对于具有增加的发生癌症相关疾病的风险的患者和他们的医学顾问特别有用。被认为具有增加的发生癌症相关疾病的风险的患者包括例如具有癌症相关疾病家族史的患者。可以以多种方式评估正常人细胞的标志物的表达水平。在一个实施方案中,通过评估一部分表现正常的细胞的标志物的表达水平,随后通过将该正常表达水平与一部分怀疑为不正常的细胞中的表达水平相比较来评估该正常表达水平。或者,和特别地当其它信息由于本文中描述的方法的常规表现而变得可获得时,可使用标志物的正常表达的群体平均值。在其它实施方案中,可通过评估获自未患癌症的患者的患者样品、在患者的癌症相关疾病的怀疑发作前获自患者的患者样品和归档的患者样品等的标志物的表达,测定标志物的“正常”表达水平。本文中还提供了用于评估癌症相关疾病细胞在样品(例如,归档组织样品或获自患者的样品)中的存在的组合物、试剂盒和方法。这些组合物、试剂盒和方法上文描述的组合物、试剂盒和方法大体上相同,除了在必要时,将组合物、试剂盒和方法进行改造以与除患者样品外的样品一起使用。例如,当待使用的样品是石蜡包埋的归档的人组织样品时,可能必须调整用于评估样品的标志物表达水平的组合物中、试剂盒中或方法中的化合物的比率。产生抗体的方法本文中还提供了制备分离的杂交瘤的方法,所述杂交瘤产生用于评估患者是否患有癌症相关疾病的抗体。在该方法中,合成或分离(例如,通过从其中表达其的细胞纯化或通过在体内或体外转录和翻译编码蛋白质或肽的核酸)包含标志物蛋白的整体或部分的蛋白质或肽。使用所述蛋白质或肽免疫脊椎动物,例如哺乳动物例如小鼠、大鼠、兔或绵羊。可任选地(和优选地)利用蛋白质或肽至少另外地免疫一次脊椎动物,以便脊椎动物显示强劲的对所述蛋白质或肽的免疫反应。使用多种方法中的任何方法从免疫的脊椎动物分离脾细胞并将其与永生化细胞系融合以形成杂交瘤。随后使用标准方法筛选以该方式形成的杂交瘤,以鉴定一个或多个产生特异性结合标志物蛋白或其片段的抗体的杂交瘤。在本文中还提供了通过该方法制备的杂交瘤和使用这样的杂交瘤制备的抗体。评估效力的方法本文中还提供了评估测试化合物抑制癌症相关疾病细胞的效力的方法。如本文中所述,标志物的表达水平中的差异与细胞的异常状态相关。尽管已认可某些标志物的表达水平的变化可能由细胞的异常状态引起,但同样地已认识到其它标志物的表达水平的变化诱发、维持和促进这些细胞的异常状态。因此,抑制患者的癌症相关疾病的化合物将使一个或多个标志物的表达水平变化至更接近该标志物的正常表达水平(即,标志物在正常细胞中的表达水平)的水平。该方法从而包括将在测试化合物存在的情况下维持的第一细胞样品的标志物的表达与在测试化合物不存在的情况下维持的第二细胞样品的标志物的表达相比较。在测试化合物存在的情况下标志物的显著改变的表达表明所述测试化合物抑制癌症相关疾病。细胞样品可以例如是获自患者的正常细胞的单个样品的等分、获自患者的正常细胞的混合样品、正常细胞系的细胞、获自患者的癌症相关疾病细胞的单个样品的等分、获自患者的癌症相关疾病细胞的混合样品、癌症相关疾病细胞系的细胞等。在一个实施方案中,样品是获自患者的癌症相关疾病细胞,测试多种据信对于抑制各种癌症相关疾病是有效的化合物,以鉴定可能最佳抑制患者的癌症相关疾病的化合物。该方法同样地可用于评估疗法用于抑制患者的癌症相关疾病的效力。在该方法中,评估一对样品(一个经历疗法,另一个未经历所述疗法)的一个或多个标志物的表达水平。与评估测试化合物的效力的方法一样,如果疗法诱导显著改变的标志物表达水平,则疗法对于抑制癌症相关疾病是有效的。如上所述,如果来自选择的患者的样品用于该方法,则可在体外评估替代疗法,以选择最可能有效地抑制患者的癌症相关疾病的疗法。用于评估有害潜能的方法如本文中所述,人细胞的异常状态与标志物表达水平的变化相关。还提供了用于评估测试化合物的有害潜能的方法。该方法包括在测试化合物存在和不存在的情况下维持人细胞的单独的等分。比较每一个等分的标志物的表达。在测试化合物存在的情况下维持的等分(相对于在测试化合物不存在的情况下维持的等分)的标志物的显著改变的表达水平表明测试化合物具有有害潜能。可通过比较相关标志物的表达水平的增强或抑制的程度,通过比较其表达水平被增强或抑制的标志物的数目,或通过比较上述两者来评估不同测试化合物的相对有害潜能。分离的蛋白质和抗体一个方面涉及分离的标志物蛋白及其生物活性部分,以及适合用作产生针对标志物蛋白或其片段的抗体的免疫原的多肽片段。在一个实施方案中,可使用标准蛋白质纯化技术,通过适当的纯化方案从细胞或组织来源分离天然标志物蛋白。在另一个实施方案中,通过重组DNA技术产生包含标志物蛋白的整体或部分的蛋白质或肽。作为重组表达的另外选择,可使用标准肽合成技术来化学地合成这样的蛋白质或肽。\分离的\或\纯化的\蛋白质或其生物活性部分大体上不含来自所述蛋白质所源自的细胞或组织来源的细胞材料或其它污染性蛋白质,或当化学合成时,大体上不含化学前体或其它化学药品。短语\大体上不含细胞材料\包括其中蛋白质与从其分离或重组地产生所述蛋白质的细胞的细胞组分分离的蛋白质的制剂。因此,大体上不含细胞材料的蛋白质包括具有少于约30%、20%、10%或5%(按干重计)的异源蛋白质(在本文中也称为\污染性蛋白质\)的蛋白质制剂。当重组地产生蛋白质或其生物活性部分时,其也优选地大体上不含培养基,即,培养基代表低于约20%、10%或5%的蛋白质制剂的体积。当通过化学合成产生蛋白质时,其优选大体上不含化学前体或其它化学药品,即,其与参与蛋白质合成的化学前体或其它化学药品分离。因此这样的蛋白质制剂具有低于约30%、20%、10%、5%(按干重计)的化学前体或除目标多肽外的化合物。标志物蛋白的生物活性部分包括包含与标志物蛋白的氨基酸序列充分一致或来源于标志物蛋白的氨基酸序列的氨基酸序列的多肽,其包括比全长蛋白质更少的氨基酸,并且显示对应全长蛋白质的至少一个活性。通常地,生物活性部分包含具有对应的全长蛋白质的至少一个活性的结构域或基序。标志物蛋白的生物活性部分可以是例如在长度上为10、25、50、100或更多个氨基酸的多肽。此外,可通过重组技术制备其中标志物蛋白的其它区域缺失的其它生物活性部分,并评价其的标志物蛋白的天然形式的一个或多个功能活性。在某些实施方案中,有用的蛋白质与这些序列之一具有大体上的同一性(例如,至少约40%,在某些实施方案中,50%、60%、70%、80%、90%、95%或99%),并且保持对应的天然存在的标志物蛋白的功能活性,但因天然等位基因变异或诱变而在氨基酸序列上相异。此外,标志物蛋白的区段的文库可用于产生用于筛选和随后选择变体标志物蛋白或其区段的变化多样的多肽群体。预测医学本文中还提供了动物模型和标志物在预测医学领域中的用途,其中诊断测定、预后测定、药物基因组学和监控临床试验用于预后(预测)目的,从而预防性地治疗个体。因此,本文中还提供了用于测定一个或多个标志物蛋白或核酸的表达水平,以确定个体是否处于发生癌症相关疾病的风险中的诊断测定。这样的测定可用于预后或预测目的,从而在癌症相关疾病发作之前预防性治疗个体。在另一个方面,方法用于至少相同个体的定期筛查以判断该个体是否已暴露于改变他/她的表达模式的化学药品或毒素。另一个方面涉及在临床试验中监控试剂(例如,被施用来抑制癌症相关疾病或治疗或预防任何其它障碍的药物或其它化合物)对标志物的表达或活性的影响(例如,以理解这样的治疗可具有的任何全身性作用)。药物基因组学标志物还用作药物基因组学标志物。如本文中所用,\药物基因组学标志物\是其表达水平与患者的特定临床药物反应或易感性相关的客观生物化学标志物。药物基因组学标志物表达的存在或量与预测的患者(更具体地患者的肿瘤)对利用特定药物或特定种类的药物的疗法的反应相关。通过评估一个或多个药物基因组学标志物在患者中的表达的存在或量,可选择最适合于患者,或经预测具有更大程度的成功的药物疗法。监控临床试验监控试剂(例如,药物化合物)对标志物的表达水平的影响不仅可用于基础药物筛选,而且还可用于临床试验。例如,可在接受症状相关疾病的治疗的受试者的临床试验中监控试剂影响标志物表达的效力。在一个非限定性实施方案中,本发明提供了用于监控利用试剂(例如,激动剂、拮抗剂、拟肽、蛋白质、肽、核酸、小分子或其它药物候选者)对受试者的治疗的效力的方法,所述方法包括步骤:(i)在施用试剂之前从受试者获得施用前样品;(ii)检测施用前样品的一个或多个选择的标志物的表达水平;(iii)从受试者获得一个或多个施用后样品;(iv)检测施用后样品的标志物的表达水平;(v)将施用前样品的标志物的表达水平与施用后样品的标志物的表达水平相比较;和(vi)相应地改变试剂至受试者的施用。例如,在治疗过程中标志物基因的增加的表达可表示无效剂量和增加剂量的需要。相反地,标志物基因的减少的表达可表明有效治疗,从而无需改变剂量。电子装置可读介质、系统、阵列和使用其的方法如本文中所用,\电子装置可读介质\是指用于存储、保持或包含可通过电子装置直接读取和访问的数据或信息的任何适当介质。这样的介质可包括但不限于:磁存储器,例如软盘、硬盘存储介质和磁带;光存储器例如光盘;电子存储介质例如RAM、ROM、EPROM、EEPROM等;和一般硬盘和这些种类的嵌合体例如磁性/光学存储介质。介质被改造或构造来将本文中描述的标志物记录在其上。如本文中所用,术语\电子装置\意欲包括任何适当的计算或处理装置,或被构造或改造来存储数据或信息的其它装置。适合与本发明的实施方案一起使用的电子装置的实例包括独立计算装置;网络,包括局域网(LAN)、广域网(WAN)因特网、企业内部网和外联网;电子器械例如个人数字助理(PDA)、手机、页面管理程序等;以及局部和分布式处理系统。如本文中所用,\记录\是指在电子装置可读介质上存储或编码信息的过程。本领域技术人员可容易地采用任何用于在介质上记录信息的方法来产生包含本文中描述的标志物的材料。多种软件程序和格式可用于在电子装置可读介质上存储本发明的实施方案的标志物信息。许多数据处理器结构化格式(例如,文本文件或数据库)可用以获得或产生在其上记录标志物的介质。通过以可读形式提供标志物,可常规地为了许多目的来存取标志物序列信息。例如,本领域技术人员可使用以可读形式存在的核苷酸或氨基酸序列来比较靶序列或靶结构基序与存储在数据存储装置内的序列信息。搜索工具用于鉴定匹配特定靶序列或靶基序的序列的片段或区域。因此,本文中还提供了用于保存进行用于确定受试者是否具有癌症相关疾病或对癌症相关疾病易感的方法的指令的介质,其中所述方法包括步骤:测定标志物的存在或不存在,基于标志物的存在或不存在,确定受试者是否具有癌症相关疾病或对癌症相关疾病易感,和/或推荐用于癌症相关疾病或癌前相关疾病病况的特定治疗。可预见的是不同的实体可进行涉及的方法的步骤,并且一个或多个用于电子通信的装置可用于存储和传输数据。可预见的是会在实体之间传达原始数据、处理的数据、诊断和/或预后,所述实体可包括:初级护理医师、患者、专家、保险供应商、基金会、医院、数据库、顾问、治疗学家、药剂师和政府的一个或多个。本文中还提供了电子系统和/或方法(在网络中),其用于确定受试者是否具有癌症相关疾病或对与标志物相关的癌症相关疾病易感,其中所述方法包括步骤:测定标志物的存在或不存在,基于标志物的存在或不存在,确定受试者是否具有癌症相关疾病或对癌症相关疾病易感,和/或推荐用于癌症相关疾病或癌前相关疾病病况的特定治疗。方法还可包括接受与受试者相关的表型信息和/或从网络获取与受试者相关的表型信息的步骤。本文中还提供了网络,用于确定受试者是否具有癌症相关疾病或对与标志物相关的癌症相关疾病易感的方法,所述方法包括步骤:接受与标志物相关的信息,接受与受试者相关的表型信息,从网络获取对应于标志物和/或癌症相关疾病的信息,以及基于表型信息、标志物和获得的信息的一项或多项,确定受试者是否具有癌症相关疾病或对癌症相关疾病易感。方法还可包括推荐用于癌症相关疾病或癌前相关疾病病况的特定治疗的步骤。本文中还提供了用于确定受试者是否具有癌症相关疾病或对癌症相关疾病易感的商业方法,所述方法包括步骤:接受与标志物相关的信息,接受与受试者相关的表型信息,从网络获取对应于标志物和/或癌症相关疾病的信息,以及基于表型信息、标志物和获得的信息的一项或多项,确定受试者是否具有癌症相关疾病或对癌症相关疾病易感。方法还可包括推荐用于癌症相关疾病或癌前相关疾病病况的特定治疗的步骤。阵列本文中还提供了可用于在阵列中测定一个或多个基因的表达的阵列。在一个实施方案中,阵列可用于测定组织的基因表达以在阵列中确定基因的组织特异性。这样,可同时测定多至约7000个或更多个基因的表达。这允许产生显示一系列在一个或多个组织中特异性表达的基因的特征谱。除了这样的定性测定外,本文中提供了基因表达的定量。因此,不仅组织特异性,而且一系列基因在组织中的表达水平都是可确定的。因此,可基于它们本身的组织表达和在该组织中的表达水平将基因分类。这在例如确定两个组织之间或多个组织间的基因表达的关系中是有用的。因此,可扰乱一个组织,随后可测定对第二组织的基因表达的作用。在该上下文中,可测定一个细胞类型响应生物学刺激对另一个细胞类型的作用。这样的测定例如对于在基因表达的水平上了解细胞间相互作用的效应是有用的。如果试剂被治疗性施用来治疗一个细胞类型但对另一个细胞类型具有不期望的作用,那么方法提供了确定不期望的作用的分子基础的测定,从而提供了共施用中和试剂或另外地治疗不期望的作用的可能性。类似地,即使在单个细胞类型内,可在分子水平上测定不期望的生物作用。因此,可确定和抵消试剂对除靶基因外的基因的表达的作用。在另一个实施方案中,阵列可用于监控在阵列内一个或多个基因的表达的时间过程。这可在如本文中公开的不同生物学背景(例如癌症相关疾病的发生、癌症相关疾病的进展,以及过程,例如与癌症相关疾病相关的细胞转化)中发生。阵列还可用于确定基因的表达或其它基因的表达在相同细胞或不同细胞中的作用。如果不能调节最终或下游靶标,这为治疗干预提供了例如替代分子靶标的选择。阵列还用于确定一个或多个基因在正常和异常细胞中的差异表达模式。这提供了一系列可用作用于诊断或治疗干预的分子靶的基因。替代标志物标志物可用作一个或多个障碍或疾病状态或导致癌症相关疾病状态的病况的替代标志物。如本文中所用,\替代标志物\是与疾病或障碍的不存在或存在,或与疾病或障碍的进展相关的客观生物化学标志物。这样的标志物的存在或量不依赖于疾病。因此,这些标志物可用于表明特定的治疗过程在缓解疾病状态或障碍中是否有效。当疾病状态或障碍的存在或程度难以通过标准方法来评估时,或当期望在潜在危险临床终点到来之前评估疾病进展时,替代标志物特别有用。药效标志物标志物也用作药效标志物。如本文中所用,\药效标志物\是与药物效应特异性相关的客观生物化学标志物。药效标志物的存在或量与对其施用药物的疾病状态或障碍无关;因此,标志物的存在或量表明药物在受试者中的存在或活性。例如,药效标志物可表明药物在生物组织中的浓度,因为标志物在该组织中的表达或转录或不表达或不转录与药物水平相关。这样,可通过药效标志物监控药物的分布或吸收。类似地,药效标志物的存在或量可与药物的代谢产物的存在或量相关,这样标志物的存在或量显示药物在体内的相对分解率。药效标志物在增加药物效应的检测灵敏度中特别有用,特别地当以低剂量施用药物时。由于甚至少量的药物可足以激活多轮标志物转录或表达,因此扩增的标志物可以是大量存在的,从而比药物本身更容易检测。同样地,标志物因标志物本身的性质而可被更容易地检测到;例如,通过使用本文中描述的方法,可将抗体用于蛋白质标志物的基于免疫的检测系统,或可将标志物特异性放射性标记探针用于检测mRNA标志物。此外,药效标志物的使用可提供在可能的直接观察的范围外的因药物治疗而引起的风险的基于机制的预测。测试方案测试癌症相关疾病的方法包括例如随时间测量受试者的生物样品的每一个标志物基因的表达水平,和将该水平与对照生物样品的所述标志物基因的表达水平相比较。当标志物基因是本文中描述的基因之一并且表达水平差异表达(例如,比对照中的水平更高或更低)时,受试者被判断为患有癌症相关疾病。当标志物基因的表达水平落在容许范围内时,受试者不可能患有癌症相关疾病。可通过测量标志物基因在对照中的表达水平来预定对照的标准值,以比较表达水平。例如,可基于上述标志物基因在对照中的表达水平来确定标准值。例如,在某些实施方案中,容许范围采用为标准值±2S.D.。一旦确定标准值,就可通过仅测量受试者的生物样品中的表达水平,将该值与测定的对照的标准值相比较来进行测试法。标志物基因的表达水平包括标志物基因至mRNA的转录和至蛋白质的翻译。因此,基于对应于标志物基因的mRNA的表达强度或由标志物基因编码的蛋白质的表达水平的比较来进行测试癌症相关疾病的一个方法。探针可按照各种基因分析法在癌症相关疾病的测试中测量标志物基因的表达水平。具体地,可使用例如使用与这些基因杂交的核酸作为探针的杂交技术,或使用与标志物基因杂交的DNA作为引物的基因扩增技术。用于测试的探针或引物可基于标志物基因的核苷酸序列来进行设计。本文中描述了各自标志物基因的核苷酸序列的标识号。此外,应理解,高等动物的基因通常伴随高频率的多态性。还存在许多在剪接过程中产生包含相互不同的氨基酸序列的同种型的分子。具有与标志物基因的活性相似的活性的任何与癌症相关疾病相关的基因被包括在标志物基因中,即使其因多态性或为同种型而具有核苷酸序列差异。还应理解,标志物基因可包括除人外的其它物种的同源物。因此,除非另外指定,否则表述\标志物基因\是指对于物种是独特的标志物基因的同源物或已被引入个体的外来标志物基因。同样地,应理解,\标志物基因的同源物\是指来源于除人外的物种的基因,其可在严格条件下作为探针与人标志物基因杂交。这样的严格条件对于可通过实验或凭经验选择适当的条件来产生等同的严格度的本领域技术人员来说是已知的。可将包含标志物基因的核苷酸序列或与标志物基因的核苷酸序列的互补链互补并且具有至少15个核苷酸的核苷酸序列的多核苷酸用作引物或探针。因此,\互补链\意指双链DNA的相对于另一条链的并且由A:T(对于RNA,U)和G:C碱基对组成的一条链。此外,\互补\不仅意指与至少15个连续核苷酸的区域完全互补的那些序列,而且还指在某些情况下具有至少40%,在某些情况下50%,在某些情况下60%,在某些情况下70%,至少80%、90%和95%或更高的核苷酸序列同源性的那些序列。核苷酸序列之间的同源性程度可通过算法BLAST等来测定。这样的多核苷酸用作探针来检测标志物基因,或用作引物来扩增标志物基因。当用作引物时,多核苷酸通常包含15bp至100bp,在某些实施方案中15bp至35bp的核苷酸。当用作探针时,DNA包含标志物基因(或其互补链)的完整核苷酸序列,或具有至少15bp核苷酸的其部分序列。当用作引物时,3'区域必须与标志物基因互补,然而5'区域可连接于限制性内切酶识别序列或标记。\多核苷酸\可以是DNA或RNA。这些多核苷酸可以是合成的或天然存在的。并且,通常标记用作用于杂交的探针的DNA。本领域技术人员容易地理解这样的标记方法。在本文中,术语\寡核苷酸\意指具有相对低的聚合程度的多核苷酸。寡核苷酸包括在多核苷酸中。癌症相关疾病的检测可使用例如Northern杂交、斑点印迹杂交或DNA微阵列技术,进行使用杂交技术的癌症相关疾病的检测。此外,可使用基因扩增技术例如RT-PCR法。通过在RT-PCR的基因扩增步骤中使用PCR扩增监控法,可获得标志物基因表达的更加定量的分析。在PCR基因扩增监控法中,将检测靶(DNA或RNA的逆转录物)与用荧光染料和吸收荧光的淬灭剂标记的探针杂交。当PCR进行并且Taq聚合酶以其5'-3'外切核酸酶活性降解探针时,荧光染料与淬灭剂彼此分离,从而检测到荧光。实时检测荧光。通过同时测量其中靶的拷贝数是已知的标准样品,可能通过其中PCR扩增是线性的循环数测定受试者样品中的靶的拷贝数。并且,本领域技术人员会认识到可使用任何适当的方法进行PCR扩增监控法。还可通过检测由标志物基因编码的蛋白质来进行癌症相关疾病的检测的方法。在下文中,由标志物基因编码的蛋白质被描述为\标志物蛋白\。对于这样的检测方法,例如可使用结合每一种标志物蛋白的抗体来应用Western印迹法、免疫沉淀法和ELISA法。用于检测的结合标志物蛋白的抗体可通过任何适当的技术来产生。并且,为了检测标志物蛋白,可适当地标记这样的抗体。或者,可标记特异性结合抗体的物质例如蛋白A或蛋白G而非标记抗体来间接检测标志物蛋白。更具体地,这样的检测法可包括ELISA法。可以例如通过将标志物基因或其部分插入表达载体,将所述构建体引入适当的宿主细胞以产生转化体,培养所述转化体以表达重组蛋白,从培养物或培养上清液纯化表达的重组蛋白来获得用作抗原的蛋白质或其部分肽。或者,由基因编码的氨基酸序列或包含由全长cDNA编码的氨基酸序列的部分的寡肽被化学地合成来用作免疫原。此外,可不仅使用标志物基因在生物样品中的表达水平作为指标,而且还可使用标志物蛋白在生物样品中的活性作为指标来进行癌症相关疾病的检验。标志物蛋白的活性意指蛋白质所固有的生物活性。可用各种方法测量每一种蛋白质的活性。即使患者在常规测试中未被诊断为患有癌症相关疾病(尽管症状暗示着这些疾病),这样的患者是否患有癌症相关疾病可通过按照本文中描述的方法进行测试来容易地确定。更具体地,在某些实施方案中,当标志物基因是本文中描述的基因之一时,其症状暗示着至少对癌症相关疾病的易感性的患者的标志物基因的表达水平的升高或降低表明症状主要因癌症相关疾病引起。此外,测试用于确定癌症相关疾病在患者中是否正在改善。换句话说,本文中描述的方法可用于判断癌症相关疾病的治疗的治疗性作用。此外,当标志物基因是本文中描述的基因之一,已被诊断为患有癌症相关疾病的患者的标志物基因的表达水平的升高或降低意味着疾病已进展较多。癌症相关疾病的严重度和/或对其的易感性还可基于表达水平的差异来测定。例如,当标志物基因是本文中描述的基因之一时,标志物基因的表达水平的升高程度与癌症相关疾病的存在和/或严重度相关。标志物表达的控制此外,标志物基因本身的表达可通过将突变引入基因的转录调控区来进行控制。本领域技术人员理解这样的氨基酸置换。并且,被突变的氨基酸的数目不受特别限制,只要活性得以维持。通常地,其在50个氨基酸以内,在某些非限定性实施方案中,在30个氨基酸以内,在10个氨基酸以内,或在3个氨基酸以内。突变的位点可以是任何位点,只要活性得以维持。筛选方法在另一个方面,本文中提供了用于治疗癌症相关疾病的治疗剂的候选化合物的筛选方法。从本文中描述的基因中选择一个或多个标志物基因。癌症相关疾病的治疗剂可通过选择能够升高或降低标志物基因的表达水平的化合物来获得。应当理解,表述\升高基因的表达水平的化合物\是指促进基因转录、基因翻译或蛋白质活性的表达的步骤的任一步骤的化合物。在另一方面,表述\降低基因的表达水平的化合物\,如本文中所用,是指抑制这些步骤的任一步骤的化合物。在具体的方面,可在体内或体外进行筛选癌症相关疾病的治疗剂的方法。可以例如通过如下步骤进行该筛选方法:(1)给动物受试者施用候选化合物;(2)测量动物受试者的生物样品的标志物基因的表达水平;或(3)选择相较于未与候选化合物接触的对照中的标志物基因的表达水平升高或降低标志物基因的表达水平的化合物。在另一个方面,本文中提供了评估治疗剂的候选化合物对标志物基因的表达水平的效力的方法,所述方法通过将动物受试者与候选化合物接触,监控化合物对来源于动物受试者的生物样品的标志物基因的表达水平的作用来进行。可使用与上述检测方法中使用的技术相同的技术监控来源于动物受试者的生物样品的标志物基因的表达水平的变化。此外,基于评估,可通过筛选来选择药物试剂的候选化合物。试剂盒可将本文中描述的任何组合物包含在试剂盒中。在非限定性实例中,将用于分离miRNA,标记miRNA和/或使用阵列评价miRNA群体的试剂包含在试剂盒中。试剂盒还可包括用于产生或合成miRNA探针的试剂。试剂盒从而在适当的容器装置中包含用于标记miRNA(通过掺入标记核苷酸或随后被标记的未标记的核苷酸)的酶。其还可包括一种或多种缓冲液(例如反应缓冲液、标记缓冲液、洗涤缓冲液或杂交缓冲液)、用于制备miRNA探针的化合物和用于分miRNA的组分。其它试剂盒可包括用于制备包含与miRNA互补的寡核苷酸的核酸阵列的组分,从而可包括例如固体支持物。对于任何试剂盒实施方案,包括阵列,可存在这样的核酸分子,所述核酸分子包含与本文中描述的序列的任何序列的全部或部分同一或互补的序列。试剂盒的组分可被包装在含水介质中或以冻干的形式进行包装。试剂盒的容器装置通常包括至少一个小瓶、试管、烧瓶、瓶子、注射器或其它容器装置,可将组分置于,优选地,适当地等分至所述容器装置中。当试剂盒中存在超过一种组分(可将标记试剂和标记包装在一起)时,试剂盒通常还可包含可将其它组分单独地置于其中的第二、第三或其它另外的容器。然而,可将组分的不同组合包含在小瓶中。本发明的试剂盒通常还可包括用于包含核酸的装置,以及密封包装的任何其它试剂容器,以便商业销售。这样的容器可包括注射或吹塑塑料容器,期望的小瓶被保留在所述容器中。当以一种或多种液体溶液提供试剂盒的组分时,液体溶液是含水溶液,无菌含水溶液是一种优选溶液。可包含在试剂盒中的其它溶液是参与从混合样品分离和/或富集miRNA的那些溶液。然而,可以以干粉形式提供试剂盒的组分。当以干粉形式提供试剂和/或组分时,可通过添加适当的溶剂来重建粉剂。可预见的是还可在另一种容器装置中提供溶剂。试剂盒还可包括有利于标记miRNA分离的组分。其还可包括保存或维持miRNA或保护其免受降解的组分。组分可以不含RNA酶或经保护免受RNA酶降解。同样地,试剂盒通常可在适当的装置中针对每一种单独的试剂或溶液包括不同的容器。试剂盒还可包括使用试剂盒组分以及使用未包含在试剂盒中的任何其它试剂的说明书。说明书可包括可被执行的变更。可以预见的是这样的试剂是本发明的试剂盒的实施方案。此外,试剂盒不限于上文中鉴定的特定项,其可包括用于miRNA的操作或表征的任何试剂。还可预见的是在miRNA阵列的背景中论述的任何实施方案可更广泛地用于本发明的筛选或表征方法或试剂盒。换句话说,可在miRNA图谱表征的背景中更广泛地实践描述特定阵列的内含物的任何实施方案,而不必牵涉阵列本身。还可预见的是任何试剂盒、阵列或其它检测技术或工具,或任何方法可牵涉这些miRNA的任何miRNA的图谱表征。同样地,还可预见的是可利用或不利用本发明的方法中的阵列形式实现在miRNA阵列的背景中论述的任何实施方案;换句话说,可按照本领域技术人员已知的任何技术,在本发明的任何方法中筛选或评价miRNA阵列中的任何miRNA。阵列形式不是待进行的筛选和诊断方法所必需的。使用miRNA阵列进行治疗性、预后性或诊断性应用的试剂盒和这样的用途被论及。试剂盒可包括miRNA阵列,以及关于在阵列上的miRNA的标准或标准化miRNA特征谱的信息。并且,在某些实施方案中,可将对照RNA或DNA包含在试剂盒中。对照RNA可以是可用作用于标记和/或阵列分析的阳性对照的miRNA。在另一个方面,提供了各种诊断和测试试剂盒。在一个实施方案中,试剂盒用于评估患者是否患有癌症相关疾病。试剂盒包含用于评估标志物的表达的试剂。在另一个实施方案中,试剂盒用于评估化学或生物制剂用于抑制患者的癌症相关疾病的适合性。这样的试剂盒包含用于评估标志物的表达的试剂,并且还可包含一种或多种这样的试剂。在其它实施方案中,试剂盒用于评估癌症相关疾病细胞的存在或治疗癌症相关疾病。这样的试剂盒包含可特异性结合标志物蛋白或所述蛋白的片段的抗体、抗体衍生物或抗体片段。这样的试剂盒还可包含多种抗体、抗体衍生物或抗体片段,其中多种这样的抗体试剂特异性结合标志物蛋白或所述蛋白的片段。在另外的实施方案中,试剂盒用于评估癌症相关疾病细胞的存在,其中试剂盒包括与标志物核酸或所述核酸的片段特异性结合的核酸探针。试剂盒还可包括多种探针,其中每一种探针与标志物核酸或所述核酸的片段特异性结合。本文中描述的组合物、试剂盒和方法可除其它以外具有下列用途:1)评估患者是否患有癌症相关疾病;2)评估人患者的癌症相关疾病的分期;3)评估患者的癌症相关疾病的分级;4)评估患者的癌症相关疾病的性质;5)评估患者发生症相关疾病的潜能;6)评估患者的与癌症相关疾病相关的细胞的组织学类型;7)制备抗体、抗体片段或抗体衍生物,所述抗体、抗体片段或抗体衍生物用于治疗癌症相关疾病和/或评估患者是否患有癌症相关疾病;8)评估癌症相关疾病细胞的存在;9)评估一种或多种测试化合物抑制患者的癌症相关疾病的效力;10)评估用于抑制患者的癌症相关疾病的疗法的效力;11)监控患者的癌症相关疾病的进展;12)选择用于抑制患者的癌症相关疾病的组合物或疗法;13)治疗患有癌症相关疾病的患者;14)抑制患者的癌症相关疾病;15)评估测试化合物的有害潜能;和16)预防处于发生癌症相关疾病的风险中的患者的癌症相关疾病的发作。试剂盒用于评估癌症相关疾病细胞的存在(例如在样品例如患者样品中)。试剂盒包含多种试剂,其每一种能够与标志物核酸或蛋白特异性结合。用于与标志物蛋白结合的适当试剂包括抗体、抗体衍生物、抗体片段等。用于与标志物核酸(例如基因组DNA、MRNA、剪接的MRNA、cDNA等)结合的适当试剂包括互补核酸。例如,核酸试剂可包括固定于基底的寡核苷酸(标记的或非标记的)、未与基底结合的标记寡核苷酸、成对的PCR引物、分子信标探针等。试剂盒可任选地包含用于进行本文中描述的方法的其它组分。例如,试剂盒可包含适合用于使互补核酸退火或适合用于抗体与其特异性结合的蛋白质结合的液体(例如SSC缓冲液)、一个或多个样品室、描述方法的进行的说明材料、正常细胞的样品、癌症相关疾病细胞的样品等。本教导的方法和试剂盒已在本文中进行了广泛和属类上的描述。每一个落在一般性公开内容中的更窄的种类和亚属归类也形成本教导的部分。这包括本教导的一般描述,以及从属类除去任何主题的条件或否定限制是,无论删除的材料是否在本文中明确地引用。动物模型非人动物模型可被产生来用于评估至少一种癌症相关疾病。方法包括将动物暴露于至少一种据信引发目标癌症的化学药品的重复剂量。在某些方面,方法还包括收集一个或多个选择的动物样品;和将收集的样品与一个或多个潜在的癌症引发或发生的标志相比较。产生动物模型的方法包括:在无特定化学药品的环境中培养动物和用至少一种据信引发癌症的化学药品使动物致敏。在某些实施方案中,通过多次相继的暴露使动物的至少一部分致敏。用于筛选试剂的抗至少一种癌症相关疾病的功效的方法通常包括:给测试动物施用至少一种试剂,确定试剂减轻还是加重癌症相关疾病的一个或多个症状;使一个或多个症状的减轻与试剂抗癌症相关疾病的功效相互关联;或使一个或多个症状的减轻的不存在与试剂的无效相互关联。动物模型用于评估一个或多个代谢途径,所述代谢途径促成至少一种癌症相关疾病的引发、进展、严重度、病理学、侵袭性、等级、活性、失能、死亡率、发病率、疾病子分类或其它基础致病或病理学特性的至少一项的。分析可以是层次聚类、标签网络构建(signaturenetworkconstruction)、质谱蛋白质组学分析、表面等离子体共振、线性统计建模、偏最小二乘判别分析和多元线性回归分析的一个或多个。可通过检查一个或多个标志物或其功能等同物的表达水平来评估动物模型的至少一种癌症相关疾病。动物模型可用于筛选用于治疗或预防癌症相关疾病的治疗剂。因此,方法用于鉴定用于治疗或预防癌症相关疾病的治疗剂。方法包括给通过本文中描述的方法产生的动物模型施用候选试剂,评估动物模型相较于未曾对其施用候选试剂的对照动物模型的至少一个癌症相关疾病反应。如果至少一个癌症相关疾病反应在症状上得到减轻或作发上延迟,则候选试剂是用于治疗或预防癌症相关疾病的试剂。用于癌症相关疾病的动物模型可包括其中一个或多个标志物基因或功能上等同于标志物基因的基因的表达水平在动物模型中已升高的动物。如本文中所用,\功能上等同的基因\通常是编码具有与由标志物基因编码的蛋白质的已知活性相似的活性的蛋白质的基因。功能上等同的基因的代表性实例包括受试动物的标志物基因的对应物,其对于动物是内源的。癌症相关疾病的动物模型用于检测因癌症相关疾病而引起的生理变化。在某些实施方案中,动物模型用于显示标志物基因的其它功能和评价其靶为标志物基因的药物。在一个实施方案中,癌症相关疾病的动物模型可通过控制对应基因的表达水平或施用对应基因来产生。方法可包括通过控制选自本文中描述的基因的基因的表达水平来产生癌症相关疾病的动物模型。在另一个实施方案中,方法可包括通过施用由本文中描述的基因编码的蛋白质,或施用抗所述蛋白质的抗体来产生癌症相关疾病的动物模型。还应理解,在某些其它实施方案中,可过表达标志物,以便随后可使用适当的方法测量标志物。在另一个实施方案中,可通过引入选自这样的组的基因的基因,或通过施用由这样的基因编码的蛋白质来产生癌症相关疾病的动物模型。在另一个实施方案中,癌症相关疾病可通过抑制选自这样的组的基因的基因的表达或由这样的基因编码的蛋白质的活性来诱导。反义核酸、核酶或RNAi可用于抑制表达。蛋白质的活性可通过施用抑制所述活性的物质例如抗体来有效地控制。动物模型用于阐明癌症相关疾病背后的机制,以及还用于测试通过筛选获得的化合物的安全性。例如,当动物模型发生癌症相关疾病的症状时,或当牵涉特定癌症相关疾病的测量的值在动物中改变时,筛选系统可被构建来探查具有减轻疾病的活性的化合物。如本文中所用,表述\表达水平的升高\是指下列方面的任一方面:其中作为外来基因引入的标志物基因被人工表达;其中对于受试动物是内源的标志物基因的转录和其至蛋白质的翻译增加;或其中作为翻译产物的蛋白质的水解被抑制。如本文中所用,表述\表达水平的降低\是指其中受试动物的标志物基因的转录及其至蛋白质的翻译被抑制的状态,或其中作为翻译产物的蛋白质的水解被增强的状态。基因的表达水平可以例如通过DNA芯片上的信号强度的差异来测定。此外,翻译产物-蛋白质的活性可通过与正常状态中的蛋白质的活性相比较来测定。也在预期的范围内的是动物模型可包括转基因动物,包括例如其中已人工地引入并表达标志物基因的动物;标志物基因敲除动物;和其中已引入另一个基因来替代标志物基因的基因敲入小鼠。已向其中引入了标志物基因的反义核酸、核酶、具有RNAi效应的多核苷酸或用作诱饵核酸的DNA等的转基因动物可用作转基因动物。这样的转基因动物还包括例如其中标志物蛋白的活性已通过将突变引入基因的编码区而得以增强或被抑制,或氨基酸序列经修饰变得抗水解或对水解易感的动物。氨基酸序列中的突变包括置换、缺失、插入和添加。鉴于本发明人的发明的原理可应用于其的许多可能的实施方案,应当认识到举例说明的实施方案仅是本发明的优选实施例,并且不应被认为是对本发明的范围的限制。相反地,本发明的范围由下列权利要求来界定。本发明人从而要求在这些权利要求的范围和精神内的所有事物作为本发明人的发明。本文中用于举例说明本发明或提供关于本发明的实践的其它细节的出版物和其它材料通过引用并入本文,并且为方便起见提供于下列参考书目中。本文中引用的任何文献的引用无意作为上述任何内容是相关的现有技术的承认。关于日期的所有声明或关于这些文献的内容的代表性基于本申请人可获得的信息,并且不构成关于日期或这些文献的内容的正确性的任何承认。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1