检测肝细胞癌的制作方法

文档序号:17720759发布日期:2019-05-22 02:08阅读:216来源:国知局
检测肝细胞癌的制作方法
本申请要求2016年9月2日提交的美国临时专利申请62/383,165的优先权益,该临时专利申请以全文引用的方式并入本文中。发明领域本文提供了用于肝细胞癌筛查的技术并且特别地(但不排他地)涉及用于检测肝细胞癌的存在的方法、组合物以及相关用途。
背景技术
:肝细胞癌(hcc)为一种原发性肝脏恶性肿瘤且主要发生在患有潜在慢性肝病和肝硬化的患者中。起源细胞被认为是肝干细胞(参见alisonmr.stemcellrev.2005.1(3):253-60)。肿瘤随局部扩张、肝内扩散以及远端转移而进展。hcc目前为全世界癌症死亡的第三大主要原因,超过500,000人受到影响。在亚洲和非洲hcc发病率最高,在这些地方b型肝炎和c型肝炎的地方性高盛行率使得发生慢性肝病和后续发生hcc极其容易。在过去几十年间,hcc的表现已发生显著变化。虽然在过去,hcc通常在晚期表现为具有右上腹疼痛、体重减轻以及失代偿性肝病迹象,但目前由于使用横截面成像研究和血清甲胎蛋白(afp)测量对患有已知肝硬化的患者的常规筛查已越来越多地在早得多的阶段被识别。预期在未来几年里hcc的威胁将持续增长(参见llovetjm等,livertranspl.2004年2月10日(2增刊1):s115-20)。因此,极期需要对hcc的早期检测以改善这些患者的存活。技术实现要素:肝细胞癌(hcc)为全世界第2大致命癌症。在早期检测的情况下存活率提高,并且需要准确非侵入性筛查工具。急迫需要将递送准确、可承受并且安全的筛查工具以对最早阶段的hcc进行症状前检测的新方法。本发明解决了此需要。实际上,本发明提供新颖的甲基化dna标记物,所述新颖的甲基化dna标记物可辨别hcc与正常对照(具有和不具有肝硬化的对照)。已研究了在大多数肿瘤类型的组织中作为潜在类别的生物标记物的甲基化dna。在许多情况情况下,dna甲基转移酶在胞嘧啶-磷酸-鸟嘌呤(cpg)岛位点处向dna添加甲基作为基因表达的表观遗传控制。在生物学上有吸引力的机制中,在肿瘤抑制基因的启动子区中获得的甲基化事件被认为使表达沉默,因此促进肿瘤形成。dna甲基化可为比rna或蛋白质表达更具化学和生物学稳定性的诊断工具(laird(2010)natrevgenet11:191-203)。此外,在如散发性结肠癌等其他癌症中,甲基化标记物提供优良特异性且比个别dna突变更广泛地提供信息并且更敏感(参见zou等(2007)cancerepidemiolbiomarkersprev16:2686-96)。cpg岛的分析当应用于动物模型和人细胞系时产生重大发现。举例来说,zhang和同事发现来自相同cpg岛的不同部分的扩增子可具有不同水平的甲基化(zhang等(2009)plosgenet5:e1000438)。另外,在高度甲基化与未甲基化序列之间甲基化水平呈双峰分布,这进一步支持dna甲基转移酶活性的二元开关样模式(zhang等(2009)plosgenet5:e1000438)。体内鼠组织和体外细胞系的分析证实仅约0.3%的高cpg密度启动子(hcp,定义为在300碱基对区域内具有>7%的cpg序列)为甲基化的,而低cpg密度(定义为在300碱基对区域内具有<5%的cpg序列)的区域倾向于以动态组织特异性模式频繁甲基化(meissner等(2008)nature454:766-70)。hcp包括普遍存在的看家基因和高度调控的发育基因的启动子。在hcp位点之中,以>50%甲基化的为若干确定的标记物,诸如wnt2、ndrg2、sfrp2以及bmp3(meissner等(2008)nature454:766-70)。在本发明的研发实施方案过程中进行的实验将来自患有hcc的受试者的血浆的dna标记物的甲基化状态与来自对照受试者(例如患有肝硬化的受试者或正常受试者)的相同dna标记物的甲基化状态进行了比较。此类实验确定并验证了辨别hcc与此类对照组的甲基化dna标记物候选物。因此,本文提供了用于hcc筛查的技术(例如监视)并且特别地(但不排他地)涉及用于检测hcc的存在的方法、组合物以及相关用途。鉴定了能够检测hcc的标记物和/或标记物组(参见实施例i、ii以及iii)(acp1、bdh1、chr12.133、clec11a、dab2ip、dbnl、emx1、efnb2、hoxa1、lrrc4、spint2、tspyl5、ccnj_3707、ccnj_3124、pfkp、scrn1以及ece1)。如本文所描述,所述技术提供了许多以高辨别力检测受试者中hcc的存在的甲基化dna标记物以及其子集(例如2、3、4、5、6、7、8、9、10、11、12种标记物的集合)。实验对候选标记物应用选择过滤器,以鉴定提供高信噪比和低背景水平的标记物,以例如当出于筛查或诊断(例如hcc筛查或诊断)的目的分析介质(例如血浆)时以提供高特异性。在一些实施方案中,所述技术涉及评估生物样品(例如血浆样品)中本文中所鉴定的标记物中的一者或多者的存在和甲基化状态。这些标记物包含如本文所论述的例如如表1和表4中所提供的一个或多个差异甲基化区(dmr)。在所述技术的实施方案中评估了甲基化状态。因此,本文提供的技术在测量基因的甲基化状态的方法方面不受限制。举例来说,在一些实施方案中,通过基因组扫描法来测量甲基化状态。举例来说,一种方法涉及限制性标志基因组扫描(参见kawai等(1994)mol.cell.biol.14:7421-7427),并且另一实例涉及甲基化敏感性任意引物pcr(参见gonzalgo等(1997)cancerres.57:594-599)。在一些实施方案中,通过用甲基化敏感性限制酶消化基因组dna随后对所关注的区域进行南方分析(southernanalysis)(消化-南方法)监测特定cpg位点处的甲基化模式的变化。在一些实施方案中,分析甲基化模式的变化涉及基于pcr的方法,所述基于pcr的方法涉及用甲基化敏感性限制酶消化基因组dna然后进行pcr扩增(参见singer-sam等(1990)nucl.acidsres.18:687)。此外,已报导利用对dna的重亚硫酸盐处理作为甲基化分析的起始点的其他技术。这些技术包括甲基化特异性pcr(msp)(参见herman等(1992)proc.natl.acad.sci.usa93:9821-9826)以及从重亚硫酸盐转化的dna扩增的pcr产物的限制酶消化(参见sadri和hornsby(1996)nucl.acidsres.24:5058-5059;以及xiong和laird(1997)nucl.acidsres.25:2532-2534)。已研发用于检测基因突变(参见kuppuswamy等(1991)proc.natl.acad.sci.usa88:1143-1147)以及定量等位基因特异性表达(szabo和mann(1995)genesdev.9:3097-3108;以及singer-sam等(1992)pcrmethods增刊1:160-163)的pcr技术。此类技术使用内部引物,所述内部引物退火至pcr产生的模板并且在所要分析的单一核苷酸的5'立即终止。在一些实施方案中使用如美国专利号7,037,650中所描述的使用“定量ms-snupe分析”的方法。在评估甲基化状态后,常常以在特定位点处(例如在单一核苷酸处、在特定区域或基因座处、在所关注的较长序列(例如dna的长达约100-bp、200-bp、500-bp、1000-bp的子序列或更长序列)处甲基化的个别dna链相对于样品中包含所述特定位点的总dna群体的分数或百分比来表示甲基化状态。传统上,通过使用校正物的pcr测定未甲基化核酸的量。然后,将已知量的dna用重亚硫酸盐处理并且使用实时pcr或其他指数扩增(例如quarts分析,例如如美国专利号8,361,720、8,715,937以及8,916,344所提供)测定所得甲基化特异性序列。举例来说,在一些实施方案中方法包括通过使用外部标准物产生未甲基化靶标的标准曲线。由至少两个点构建标准曲线并且使未甲基化dna的实时ct值与已知定量标准物相关联。然后,由至少两个点和外部标准物构建甲基化靶标的第二标准曲线。此第二标准曲线使甲基化dna的ct与已知定量标准物相关联。接着,针对甲基化和未甲基化群体测定测试样品ct值并且由通过头两个步骤制备的标准曲线计算dna的基因组当量。由相对于群体中的总dna量甲基化dna的量(例如(甲基化dna的数目)/(甲基化dna的数目+未甲基化dna的数目)×100)计算所关注位点处的甲基化百分比。本文还提供用于实践所述方法的组合物和试剂盒。举例来说,在一些实施方案中,单独或以集合形式(例如用于扩增多种标记物的引物对集合)提供对一种或多种标记物具特异性的试剂(例如引物、探针)。还可提供用于进行检测分析的额外的试剂(例如用于进行quarts、pcr、测序、重亚硫酸盐或其他分析的酶、缓冲液、阳性和阴性对照)。在一些实施方案中,提供含有必需、足够或适用于执行方法的一种或多种试剂的试剂盒。还提供含有所述试剂的反应混合物。还提供含有可彼此添加和/或添加至测试样品中以完成反应混合物的多种试剂的主混合试剂集合。在一些实施方案中,本文所描述的技术与被设计成进行如由本文所描述的方法所提供的一系列算术或逻辑操作的可编程机器相关。举例来说,所述技术的一些实施方案与计算机软件和/或计算机硬件相关(例如在其中实现)。在一个方面中,所述技术涉及包括以下各项的计算机:存储器形式、用于进行算术和逻辑操作的元件以及用于执行一系列指令(例如如本文所提供的方法)的处理元件(例如微处理器),以读取、操纵以及存储数据。在一些实施方案中,微处理器为用于测定(例如一个或多个dmr,例如如表1和表4中所提供的dmr1-400的)甲基化状态;比较(例如一个或多个dmr,例如如表1和表4中所提供的dmr1-400的)甲基化状态;产生标准曲线;测定ct值;计算(例如一个或多个dmr,例如如表1和表4中所提供dmr1-400的)甲基化的分数、频率或百分比;鉴定cpg岛;测定分析或标记物的特异性和/或灵敏度;计算roc曲线和相关auc;序列分析;如本文所描述或如本领域已知的所有用途的系统的一部分。在一些实施方案中,微处理器或计算机在算法中使用甲基化状态数据来预测癌症部位。在一些实施方案中,软件或硬件组件接收多个分析(例如测定例如如表1和表4中所提供的多个dmr的甲基化状态)的结果并且基于多个分析的结果确定要向使用者报告的指示癌症危险的单一值结果。相关实施方案基于多个分析(例如测定多种标记物(诸如多个dmr,例如如表1和表4中所提供的多个dmr)的甲基化状态)的结果的数学组合(例如加权组合、线性组合)计算危险因子。在一些实施方案中,dmr的甲基化状态定义维度并且可在多维空间中具有值,并且由多个dmr的甲基化状态定义的坐标为例如要向使用者报导的结果。一些实施方案包括存储介质和存储器组件。存储器组件(例如易失性和/或非易失性存储器)可用于存储指令(例如如本文所提供的方法的实施方案)和/或数据(例如被加工的数据,诸如甲基化测量、序列以及与此相关的统计描述)。一些实施方案涉及还包括cpu、图形卡以及用户界面(例如包括输出装置,诸如显示器;以及输入装置,诸如键盘)中的一者或多者的系统。与所述技术相关的可编程机器包括常规现存技术以及开发中或尚有待开发的技术(例如量子计算机、化学计算机、dna计算机、光学计算机、基于自旋电子学的计算机等)。在一些实施方案中,所述技术包括用于传输数据的有线(例如金属电缆、光纤)或无线传输介质。举例来说,一些实施方案涉及经网络(例如局域网(lan)、广域网(wan)、自组网(ad-hocnetwork)、互联网等)进行数据传输。在一些实施方案中,可编程机器作为节点(peer)存在于此类网络上,而在一些实施方案中,可编程机器具有客户端/服务器关系。在一些实施方案中,数据存储在诸如硬盘、闪速存储器、光学介质、软盘等计算机可读存储介质上。在一些实施方案中,本文提供的技术与多个可编程装置相关,所述多个可编程装置一起操作以进行如本文所描述的方法。举例来说,在一些实施方案中,多个计算机(例如由网络连接)可并行工作以收集和处理数据,例如在集群计算或网格计算的实现中或依赖于通过常规网络接口(诸如以太网、光纤)或通过无线网络技术连接到网络(私人、公共或互联网)的完整计算机(具有板载cpu、存储器、电源、网络接口等)的一些其他分布式计算机体系结构。举例来说,一些实施方案提供包括计算机可读介质的计算机。所述实施方案包括与处理器连接的随机存取存储器(ram)。处理器执行存储器中存储的计算机可执行程序指令。此类处理器可包括微处理器、asic、状态机或其他处理器,并且可为许多计算机处理器中的任一种,诸如来自intelcorporation,santaclara,california和motorolacorporation,schaumburg,illinois的处理器。此类处理器包括存储指令的介质(例如计算机可读介质)或可与其连通,所述指令在由处理器执行时使得处理器进行本文所描述的步骤。计算机可读介质的实施方案包括但不限于能够为处理器提供计算机可读指令的电子、光学、磁性或其他存储或传输装置。适合的介质的其他实例包括但不限于软盘、cd-rom、dvd、磁盘、存储器芯片、rom、ram、asic、已配置的处理器、所有光学介质、所有磁带或其他磁性介质或计算机处理器可从其读取指令的任何其他介质。另外,各种其他形式的计算机可读介质均可向计算机传输或运输指令,包括路由器、私人或公共网络或者其他有线与无线的传输装置或信道。指令可包括来自包括例如c、c++、c#、visualbasic、java、python、perl以及javascript的任何适合的计算机编程语言的代码。在一些实施方案中,计算机连接至网络。计算机还可包括许多外部或内部装置,诸如鼠标、cd-rom、dvd、键盘、显示器或其他输入或输出装置。计算机的实例为个人计算机、数字助理、个人数字助理、蜂窝电话、移动电话、智能电话、传呼机、数字平板、膝上型计算机、互联网设备以及其他基于处理器的装置。一般来说,与本文所提供的技术的诸多方面有关的计算机可为在能够支持包括本文所提供的技术的一个或多个程序的任何操作系统(诸如microsoftwindows、linux、unix、macosx等)上操作的任何类型的基于处理器的平台。一些实施方案包括执行其他应用程序(applicationprogram)(例如应用程序(application))的个人计算机。所述应用程序可含于存储器中并且可包括例如文字处理应用程序、电子表格应用程序、电子邮件应用程序、即时消息应用程序、演示文稿应用程序、互联网浏览器应用程序、日历/管理器应用程序以及能够由客户端装置执行的任何其他应用程序。本文所描述的与所述技术相关的所有此类组件、计算机以及系统可为逻辑的或虚拟的。本文提供了与在从受试者获得的样品中筛查hcc的方法有关的技术,所述方法包括分析从受试者获得的样品中的标记物的甲基化状态;以及当标记物的甲基化状态不同于在未患hcc的受试者(例如未患hcc的受试者)(例如未患hcc但患有肝硬化的受试者)中所分析的标记物的甲基化状态时,将受试者鉴定为患有hcc,其中标记物包含选自以下的如表1和表4中所提供的差异甲基化区(dmr)中的一个或多个碱基:acp1、bdh1、chr12.133、clec11a、dab2ip、dbnl、emx1、efnb2、hoxa1、lrrc4、spint2、tspyl5、ccnj_3707、ccnj_3124、pfkp、scrn1以及ece1。所述技术在所评估的甲基化状态方面不受限制。在一些实施方案中,评估样品中标记物的甲基化状态包括测定一个碱基的甲基化状态。在一些实施方案中,分析样品中标记物的甲基化状态包括确定多个碱基处的甲基化程度。此外,在一些实施方案中,标记物的甲基化状态包括标记物的甲基化相对于标记物的正常甲基化状态有所增加。在一些实施方案中,标记物的甲基化状态包括标记物的甲基化相对于标记物的正常甲基化状态有所降低。在一些实施方案中,标记物的甲基化状态包括标记物的甲基化模式相对于标记物的正常甲基化状态有所不同。此外,在一些实施方案中,标记物为具有100或更少个碱基的区域,标记物为具有500或更少个碱基的区域,标记物为具有1000或更少个碱基的区域,标记物为具有5000或更少个碱基的区域,或者在一些实施方案中,标记物为一个碱基。在一些实施方案中,标记物位于高cpg密度启动子中。所述技术不受样品类型限制。举例来说,在一些实施方案中,样品为血液样品(例如血浆、血清、全血)、粪便样品、组织样品(例如胃组织、胰腺组织、胆管/肝组织、胰液以及结肠直肠组织)、排泄物或尿液样品。此外,所述技术在用于测定甲基化状态的方法方面不受限制。在一些实施方案中,所述分析包括使用甲基化特异性聚合酶链反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。在一些实施方案中,所述分析包括使用甲基化特异性寡核苷酸。在一些实施方案中,所述技术使用大规模平行测序(例如下一代测序)来测定甲基化状态,例如边合成边测序、实时(例如单分子)测序、珠粒乳液测序、纳米孔测序等。所述技术提供用于检测dmr的试剂,例如在一些实施方案中,提供包含由seqidno:1-94提供的序列的寡核苷酸(表2和表5)的集合。在一些实施方案中,提供一种包含与具有dmr中的碱基的染色体区互补的序列的寡核苷酸,例如对dmr的甲基化状态敏感的寡核苷酸。所述技术提供各种标记物组,例如在一些实施方案中,标记物包含具有表1或表3中所提供的注释的染色体区,并且其包含标记物。此外,实施方案提供一种分析来自表1和/或表4的dmr编号1-400中的一者或多者的dmr的方法。提供试剂盒实施方案,例如如下试剂盒,所述试剂盒包含:重亚硫酸盐试剂;以及对照核酸,所述对照核酸包含来自选自由dmr1-400(来自表1和表4)组成的组的dmr的序列并且具有与未患hcc的受试者(例如未患hcc并且未患肝硬化的受试者)(例如未患hcc但患有肝硬化的受试者)相关的甲基化状态。提供试剂盒实施方案,例如如下试剂盒,所述试剂盒包含:重亚硫酸盐试剂;以及对照核酸,所述对照核酸包含来自选自由dmr1-400(来自表1和表4)组成的组的dmr的序列并且具有与未患hcc的受试者相关的甲基化状态。一些试剂盒实施方案包括用于从受试者获得样品(例如粪便样品)的样品收集器;用于从样品分离核酸的试剂;重亚硫酸盐试剂;以及如本文所描述的寡核苷酸。所述技术与组合物(例如反应混合物)的实施方案有关。在一些实施方案中,提供一种包含含有dmr的核酸和重亚硫酸盐试剂的组合物。一些实施方案提供一种包含含有dmr的核酸和如本文所描述的寡核苷酸的组合物。一些实施方案提供一种包含含有dmr的核酸和甲基化敏感性限制酶的组合物。一些实施方案提供一种包含含有dmr的核酸和聚合酶的组合物。提供用于在从受试者获得的样品(例如血浆样品)中筛查hcc的额外的相关方法实施方案,例如如下方法,所述方法包括测定样品中包含作为dmr1-400(来自表1和表4)中的一者或多者的dmr中的碱基的标记物的甲基化状态;将来自受试者样品的标记物的甲基化状态与来自未患hcc的受试者的正常对照样品的标记物的甲基化状态进行比较;以及确定受试者样品和正常对照样品的甲基化状态的差异的置信区间和/或p值。在一些实施方案中,置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或99.99%,并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。一些方法实施方案提供以下步骤:使包含dmr的核酸与重亚硫酸盐试剂反应以制备与重亚硫酸盐反应过的核酸;对与重亚硫酸盐反应过的核酸测序以提供与重亚硫酸盐反应过的核酸的核苷酸序列;将与重亚硫酸盐反应过的核酸的核苷酸序列与来自未患癌症的受试者的包含dmr的核酸的核苷酸序列进行比较,以确定两个序列的差异;以及当存在差异时将受试者鉴定为患有赘瘤。所述技术提供用于在从受试者获得的样品中筛查hcc的系统。系统的示例性实施方案包括例如用于在从受试者获得的样品中筛查hcc的系统,所述系统包括:分析组件,所述分析组件被配置成测定样品的甲基化状态;软件组件,所述软件组件被配置成将样品的甲基化状态与对照样品或数据库中所记录的参考样品甲基化状态进行比较;以及警报组件,所述警报组件被配置成警告使用者hcc相关甲基化状态(例如没有hcc的甲基化状态;有hcc的甲基化状态)。在一些实施方案中,通过软件组件来确定警报,所述软件组件接收多个分析(例如测定多种标记物(例如dmr,例如如表1和表4中所提供的dmr)的甲基化状态)的结果并且基于多个结果计算要报导的值或结果。一些实施方案提供一种与本文所提供的每个dmr相关的加权参数的数据库,用于计算要报告给使用者(例如医师、护士、临床医师等)的值或结果和/或警报。在一些实施方案中,报导多个分析的所有结果,而在一些实施方案中,使用一个或多个结果来提供基于多个分析的一个或多个结果的复合结果的指示受试者中的hcc危险的得分、值或结果。在系统的一些实施方案中,样品包含含有dmr的核酸。在一些实施方案中,系统还包括用于分离核酸的组件、用于收集样品的组件,诸如用于收集血浆样品的组件。在一些实施方案中,系统包括包含dmr的核酸序列。在一些实施方案中,数据库包含来自未患hcc的受试者的核酸序列。还提供核酸,例如核酸集合,每种核酸具有包含dmr的序列。在一些实施方案中,为核酸集合,其中每种核酸具有来自未患hcc的受试者的序列。相关系统实施方案包括如所描述的核酸集合以及与核酸集合相关的核酸序列的数据库。一些实施方案还包括重亚硫酸盐试剂。并且,一些实施方案还包括核酸测序仪。在某些实施方案中,提供在从受试者获得的样品(例如血浆样品)中检测hcc的方法,所述方法包括a)从受试者获得包含dna的样品;b)用选择性修饰所获得的dna中的未甲基化胞嘧啶残基以产生修饰的残基但不修饰甲基化胞嘧啶残基的试剂处理所获得的dna;c)测定已经历步骤b)的处理的dna中一种或多种dna甲基化标记物的甲基化水平,其中一种或多种dna甲基化标记物包含如由dmr1-400(来自表1和表4)提供的差异甲基化区(dmr)中的碱基,d)将所测定的一种或多种dna甲基化标记物的甲基化水平与未患hcc的受试者的一种或多种dna甲基化标记物的甲基化水平参考值进行比较;以及e)当存在差异时将受试者鉴定为患有hcc。在一些实施方案中,确定dna甲基化标记物中的一者或多者中的甲基化升高包括确定选自由cpg岛和cpg岛岸组成的组的区域内的甲基化改变。在一些实施方案中,确定cpg岛或cpg岸内的甲基化升高包括dna甲基化标记物的编码区或调控区内的甲基化升高。在一些实施方案中,测定已经历步骤b)的处理的dna中的一种或多种dna甲基化标记物的甲基化水平包括测定一种或多种dna甲基化标记物的甲基化得分和/或甲基化频率。在一些实施方案中,通过对所获得的dna的重亚硫酸盐修饰实现步骤b)的处理。在一些实施方案中,测定已经历步骤b)的处理的dna中的一种或多种dna甲基化标记物的甲基化水平是通过选自由以下组成的组的技术来实现的:甲基化特异性pcr、定量甲基化特异性pcr、甲基化敏感性dna限制酶分析、定量重亚硫酸盐焦磷酸测序以及重亚硫酸盐基因组测序pcr。基于本文中所含的教示,对于擅长相关技术的人来说额外的实施方案将为显而易见的。附图说明图1:用于辨别hccdna样品与衍生自正常对照(例如患有或未患肝硬化的非hcc个体)的dna的311个差异甲基化区(dmr)的鉴定中所涉及的四个阶段的描述。图2:互补3-标记物组合(emx1、lrrc4以及bdh1)在血浆中鉴定出21个hcc中的20个以及33个对照中32个;1个hcc具有低水平的bdh1,并且1个对照具有升高的lrrc4。对于hcc在97%特异性(95%ci,82%-100%)下此组为95%敏感的(95%ci,74%-100%)并且实现0.98的auc(参见图2)。图3a至图3i:acp1、chr12.133、clec11a、dab2ip、dbnl、emx1、hoxa1、lrrc4、spint2以及tspyl5的接受者操作特征曲线下面积信息。图4a至图4cc:来自生物组织验证数据的27种胃癌标记物(在增加的拟合点分析情况下为29种)的箱线图(对数刻度)。将正常肝脏情况下的样品安排在最左侧,随后为不具有肝硬化的hcc、具有肝硬化的hcc以及肝硬化对照(炎性)。竖直轴为分数甲基化(针对β-肌动蛋白链归一化)。图5:在95%正常特异性下呈基质形式的于75个hcc组织样品和29个对照(16个肝硬化、13个正常肝脏)中的27种hcc癌症标记物的性能。标记物竖直列出,而样品水平列出。将正常肝脏(ni)情况下的样品安排在最左侧,随后为不具有肝硬化的hcc(hn)、具有肝硬化的hcc(hc)以及肝硬化对照(in)。阳性命中呈浅灰色,而丢失呈深灰色。此曲线允许以互补方式评估标记物。注意:对qmsp数据使用拟合点法第二次分析2种标记物tbx15和egr2并且包括在本文中。图6提供通过quarts(定量等位基因特异性实时靶标和信号放大)分析检测甲基化dna印迹时所用的fret盒的寡核苷酸序列。每个fret序列包括荧光团和淬灭剂,它们可一起复用至3个单独的分析中。图7a至图7d:a)具有针对最优3标记物组合(emx1、bdh1、lrrc4)的截止值的rpart二叉树。通过以下方法构建该树:首先发现最佳地将数据分成两组的单变量(标记物)。将数据分离,然后分开地对每个子组应用此方法,递归地以此类推,直到子组达到最小尺寸或直到不再引起改善为止。满足或不满足截止值的对照样品数目呈现于分子位置并且病例样品呈现于分母位置。在此,所述组合在血浆中鉴定出20/21个hcc和32/33个对照。b)具有针对最优3标记物组合(emx1、dab2ip、tspyl5)的截止值的rpart二叉树。c)具有针对最优3标记物组合(emx1、hoxa1、acp1)的截止值的rpart二叉树。d)具有针对最优3标记物组合(emx1、efnb2、spint2)的截止值的rpart二叉树。图8:展示阶段a-c在血浆中在100%特异性下使用甲基化标记物emx1的hcc灵敏度的柱状图。归类为u的样品为阶段不确定的。图9:展示此分析中考虑的甲基化标记物中的每一者(acp1、bdh1、chr12.133、clec11a、dab2ip、dbnl、emx1、efnb2、hoxa1、lrrc4、spint2、tspyl5、ccnj_3707、ccnj_3124、pfkp、scrn1以及ece1)的相对重要性的图。整个标记物组的灵敏度和特异性的交叉验证估计值分别为75%和96%。具体实施方式本文提供了用于肝细胞癌筛查的技术并且特别地(但不排他地)涉及用于检测肝细胞癌的存在的方法、组合物以及相关用途。在本文描述所述技术时,所用的部分标题仅用于组织目的,并且不应以任何方式解释为限制主题。在各个实施方案的此具体实施方式中,出于解释的目的,阐述了许多具体细节,以提供对所公开的实施方案的透彻理解。然而,本领域技术人员将了解可在存在或不存在这些具体细节的情况下实践所述各个实施方案。在其他情况下,结构和装置以框图形式显示。此外,本领域技术人员可容易理解呈现和进行方法的特定顺序为说明性的,并且预期顺序可改变并且仍然在本文所公开的各个实施方案的精神和范围内。本申请中所引用的包括但不限于专利、专利申请、文章、书、专著以及互联网网页的所有文献和类似材料出于任何目的以全文引用的方式明确地并入本文中。除非另外定义,否则本文所用的所有技术和科学术语具有与本文所描述的各个实施方案所属领域的技术人员通常所理解相同的含义。当所并入的参考文献中的术语定义似乎不同于本发明教示中所提供的定义时,应以本发明教示中所提供的定义为准。定义为促进对本发明技术的理解,许多术语和短语定义如下。具体实施方式中阐述了额外的定义。除非上下文另外明确指示,否则在本说明书和权利要求书通篇中,以下术语采用本文中明确相关的含义。如本文所用的短语“在一个实施方案中”不一定指同一实施方案(虽然有可能)。此外,如本文所用的短语“在另一实施方案中”不一定指不同的实施方案(虽然有可能)。因此,如下文所描述,在不背离本发明的范围或精神的情况下,可轻易组合本发明的各个实施方案。此外,除非上下文另外明确指示,否则如本文所用,术语“或”为包括性的“或”运算符并且等效于术语“和/或”。除非上下文另外明确指示,否则术语“基于”不为排他性的,并且允许基于未描述的额外因素。此外,在本说明书通篇中,“一种/一个(a/an)”和“所述”的含义包括复数参考物。“在……中”的含义包括“在……中”和“在……上”。如本文所用,“核酸”或“核酸分子”通常指任何核糖核酸或脱氧核糖核酸,其可为未修饰或修饰的dna或rna。“核酸”包括但不限于单链和双链核酸。如本文所用,术语“核酸”还包括含有一个或多个修饰的碱基的如上文所描述的dna。因此,具有出于稳定性或出于其他原因进行修饰的主链的dna为“核酸”。术语“核酸”在本文中使用时涵盖核酸的此类化学修饰、酶修饰或代谢修饰形式,以及病毒和细胞(包括例如简单和复杂的细胞)的dna特征的化学形式。术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个、优选超过三个并且通常超过十个脱氧核糖核苷酸或核糖核苷酸的分子。确切大小将取决于许多因素,这些因素又取决于寡核苷酸的最终功能或用途。可以任何方式产生寡核苷酸,包括化学合成、dna复制、逆转录或其组合。对于dna,典型脱氧核糖核苷酸为胸腺嘧啶、腺嘌呤、胞嘧啶以及鸟嘌呤。对于rna,典型核糖核苷酸为尿嘧啶、腺嘌呤、胞嘧啶以及鸟嘌呤。如本文所用,术语核酸的“基因座”或“区域”是指核酸子区域,例如染色体上的基因、单一核苷酸、cpg岛等。术语“互补”和“互补性”是指根据碱基配对规则相关的核苷酸(例如1个核苷酸)或多核苷酸(例如核苷酸的序列)。举例来说,序列5'-a-g-t-3'与序列3'-t-c-a-5'互补。互补性可为“部分的”,其中仅一些核酸碱基根据碱基配对规则相匹配。或者,核酸之间可存在“完全”或“总体”互补。核酸链之间的互补程度影响核酸链之间杂交的效率和强度。这在扩增反应中和在依赖核酸之间的结合的检测方法中尤其重要。术语“基因”是指包含制备rna或多肽或其前体所必需的编码序列的核酸(例如dna或rna)序列。功能性多肽可由全长编码序列或由编码序列的任何部分编码,只要保留多肽的所需活性或功能性质(例如酶活性、配体结合、信号转导等)即可。术语“部分”当用于提及基因时是指所述基因的片段。片段的大小可在几个核苷酸至整个基因序列减去一个核苷酸范围内。因此,“包含基因的至少一部分的核苷酸”可包含基因的片段或整个基因。术语“基因”还涵盖结构基因的编码区,并且包括在5'和3'末端例如在任一端约1kb的距离处与编码区相邻定位的序列,使得基因对应于全长mrna的长度(例如包括编码序列、调控序列、结构序列以及其他序列)。定位于编码区的5'并且存在于mrna上的序列被称为5'非翻译或未翻译序列。定位于编码区的3'或下游并且存在于mrna上的序列被称为3'非翻译或3'未翻译序列。术语“基因”涵盖基因的cdna与基因组形式两者。在一些有机体(例如真核生物)中,基因的基因组形式或克隆含有被称为“内含子”或“插入区”或“插入序列”的非编码序列中断的编码区。内含子为转录成核rna(hnrna)的基因区段;内含子可含有调控元件,诸如增强子。内含子从核或初级转录物中移除或“剪出”,因此内含子不存在于信使rna(mrna)转录物中。mrna在翻译过程中起作用,以指定新生多肽中氨基酸的序列或顺序。除含有内含子之外,基因的基因组形式还可包括定位于存在于rna转录物上的序列的5'与3'末端的序列。这些序列被称为“侧接”序列或区域(这些侧接序列定位于存在于mrna转录物上的非翻译序列的5'或3'。5'侧接区域可含有控制或影响基因转录的调控序列,诸如启动子和增强子。3'侧接区域可含有指导转录终止、转录后裂解以及聚腺苷酸化的序列。术语“等位基因”是指基因的变异型式;所述变异型式包括但不限于变体和突变体、多态性基因座和单核苷酸多态性基因座、移码以及剪接突变。等位基因可天然存在于群体中,或者它可在群体的任何特定个体的寿命期间出现。因此,当用于提及核苷酸序列时,术语“变体”和“突变体”是指与另一通常相关的核苷酸序列相差一个或多个核苷酸的核酸序列。“变异”为两个不同核苷酸序列之间的差异;典型地,一个序列为参考序列。“扩增”为涉及模板特异性的核酸复制的特例。它与非特异性模板复制(例如依赖于模板但不依赖于特异性模板的复制)形成对比。模板特异性在这里区别于复制的保真度(例如适当的多核苷酸序列的合成)和核苷酸(核糖或脱氧核糖核苷酸)特异性。经常用“靶标”特异性来描述模板特异性。靶序列在尝试将其从其他核酸中挑选出来的意义上为“靶标”。扩增技术主要被设计用于此挑选。核酸的扩增通常是指典型地从少量多核苷酸(例如单一多核苷酸分子、多核苷酸分子的10至100个拷贝,可能完全相同或不完全相同)开始,产生多核苷酸或多核苷酸的一部分的多个拷贝,其中扩增产物或扩增子通常为可检测的。多核苷酸的扩增涵盖多种化学处理和酶处理。在聚合酶链反应(pcr)或连接酶链反应(lcr;参见例如美国专利号5,494,810)期间从靶标或模板dna分子的一个或几个拷贝产生多个dna拷贝为扩增的形式。额外类型的扩增包括但不限于等位基因特异性pcr(参见例如美国专利号5,639,611)、组装pcr(参见例如美国专利号5,965,408)、解旋酶依赖性扩增(参见例如美国专利号7,662,594)、热启动pcr(参见例如美国专利号5,773,258和5,338,671)、序列间特异性pcr、反向pcr(参见例如triglia等(1988)nucleicacidsres.,16:8186)、连结介导的pcr(参见例如guilfoyle,r.等,nucleicacidsresearch,25:1854-1858(1997);美国专利号5,508,169)、甲基化特异性pcr(参见例如herman等,(1996)pnas93(13)9821-9826)、微引物pcr、多重连结依赖性探针扩增(参见例如schouten等,(2002)nucleicacidsresearch30(12):e57)、多重pcr(参见例如chamberlain等,(1988)nucleicacidsresearch16(23)11141-11156;ballabio等,(1990)humangenetics84(6)571-573;hayden等,(2008)bmcgenetics9:80)、嵌套式pcr、重叠延伸pcr(参见例如higuchi等,(1988)nucleicacidsresearch16(15)7351-7367)、实时pcr(参见例如higuchi等,(1992)biotechnology10:413-417;higuchi等,(1993)biotechnology11:1026-1030)、逆转录pcr(参见例如bustin,s.a.(2000)j.molecularendocrinology25:169-193)、固相pcr、热不对称交错pcr以及降落pcr(参见例如don等,nucleicacidsresearch(1991)19(14)4008;roux,k.(1994)biotechniques16(5)812-814;hecker等,(1996)biotechniques20(3)478-485)。多核苷酸扩增还可使用数字pcr来完成(参见例如kalinina等,nucleicacidsresearch.25;1999-2004,(1997);vogelstein和kinzler,procnatlacadsciusa.96;9236-41,(1999);国际专利公布号wo05023091a2;美国专利申请公布号20070202525)。术语“聚合酶链反应”(“pcr”)是指k.b.mullis美国专利号4,683,195、4,683,202以及4,965,188的方法,这些专利描述了一种在不进行克隆或纯化的情况下增加基因组dna混合物中靶序列区段的浓度的方法。此用于扩增靶序列的方法由以下步骤组成:将大量过量的两种寡核苷酸引物引入含有所需靶序列的dna混合物中,随后在存在dna聚合酶的情况下进行一系列精确的热循环。这两种引物与双链靶序列的相应链互补。为实现扩增,使混合物变性,然后使引物与其在靶分子内的互补序列退火。退火后,用聚合酶延伸引物,以便形成一对新的互补链。可将变性、引物退火以及聚合酶延伸的步骤多次重复(即,变性、退火以及延伸构成一个“循环”;可存在许多“循环”),以获得高浓度的所需靶序列的扩增区段。所需靶序列的扩增区段的长度由引物相对于彼此的相对位置决定,并且因此此长度为可控参数。由于所述方法的重复方面,所述方法被称为“聚合酶链反应”(“pcr”)。因为靶序列的所需扩增区段成为混合物中的主导序列(就浓度来说),所以称其被“pcr扩增”,并且为“pcr产物”或“扩增子”。在大多数扩增技术中通过酶的选择来实现模板特异性。扩增酶为在其使用条件下仅处理核酸的非均匀混合物中的特定核酸序列的酶。举例来说,在q-β复制酶的情况下,mdv-1rna为复制酶的特异性模板(kacian等,proc.natl.acad.sci.usa,69:3038[1972])。其他核酸不会被此扩增酶复制。类似地,在t7rna聚合酶的情况下,此扩增酶对于其本身的启动子具有严格特异性(chamberlin等,nature,228:227[1970])。在t4dna连接酶的情况下,酶不会连结两个寡核苷酸或多核苷酸,其中在连结接点处寡核苷酸或多核苷酸底物与模板之间存在错配(wu和wallace(1989)genomics4:560)。最后,发现热稳定性模板依赖性dna聚合酶(例如taq和pfudna聚合酶)由于其在高温下起作用的能力而对引物结合并因此限定的序列显示高特异性;高温产生有利于引物与靶序列杂交而不与非靶序列杂交的热力学条件(h.a.erlich(编),pcrtechnology,stocktonpress[1989])。如本文所用,术语“核酸检测分析”是指测定所关注的核酸的核苷酸组成的任何方法。核酸检测分析包括但不限于dna测序法、探针杂交法、结构特异性裂解分析(例如invader分析,hologic,inc.),并且描述于例如美国专利号5,846,717、5,985,557、5,994,069、6,001,567、6,090,543以及6,872,816;lyamichev等,nat.biotech.,17:292(1999);hall等,pnas,usa,97:8272(2000)以及us2009/0253142中);酶错配裂解法(例如variagenics,美国专利号6,110,684、5,958,692、5,851,770);聚合酶链反应;支化杂交法(例如chiron,美国专利号5,849,481、5,710,264、5,124,246以及5,624,802);滚环复制(例如美国专利号6,210,884、6,183,960以及6,235,502);nasba(例如美国专利号5,409,818);分子信标技术(例如美国专利号6,150,097);电子传感器技术(motorola,美国专利号6,248,229、6,221,583、6,013,170以及6,063,573);循环探针技术(例如美国专利号5,403,711、5,011,769以及5,660,988);dadebehring信号放大法(例如美国专利号6,121,001、6,110,677、5,914,230、5,882,867以及5,792,614);连接酶链反应(例如barnayproc.natl.acad.sciusa88,189-93(1991));以及夹心杂交法(例如美国专利号5,288,609)。术语“可扩增核酸”是指可通过任何扩增方法扩增的核酸。预期“可扩增核酸”通常将包括“样品模板”。术语“样品模板”是指来源于针对“靶标”(下文定义)的存在进行分析的样品的核酸。相比之下,“背景模板”用于提及可能存在于或可能不存在于样品中的不是样品模板的核酸。背景模板大多数常常为偶然的。它可能是携带的结果,或者它可能是归因于设法从样品中纯化掉的核酸污染物的存在。举例来说,来自有机体的不是要检测的核酸的核酸可作为背景存在于测试样品中。术语“引物”是指在纯化的限制性消化物中天然存在的或合成产生的寡核苷酸,当放置在其中诱导与核酸链互补的引物延伸产物合成的条件下(例如在存在核苷酸和诸如dna聚合酶等诱导剂的情况下以及在适合的温度和ph下)时,所述寡核苷酸能够充当合成的起点。引物优选为单链的,以获得最大扩增效率,但或者也可为双链的。如果是双链,则在用于制备延伸产物之前首先处理引物以将其链分离。优选地,引物为寡脱氧核苷酸。引物必须足够长以在存在诱导剂的情况下引发扩增产物的合成。引物的精确长度将取决于许多因素,包括温度、引物来源以及方法的使用。术语“探针”是指在纯化的限制性消化物中天然存在的或者合成、重组或通过pcr扩增产生的寡核苷酸(例如核苷酸序列),所述寡核苷酸能够与另一所关注的寡核苷酸杂交。探针可为单链或双链的。探针适用于检测、鉴定以及分离特定基因序列(例如“捕获探针”)。预期在一些实施方案中,本发明中所用的任何探针均可用任何“报告分子”进行标记,使得在包括但不限于以下的任何检测系统中可检测:酶(例如elisa,以及基于酶的组织化学分析)、荧光、放射性以及发光系统。本发明不意图限制于任何特定检测系统或标记。如本文所用,“甲基化”是指在胞嘧啶的位置c5或n4处的胞嘧啶甲基化、腺嘌呤的n6位置或其他类型的核酸甲基化。体外扩增的dna通常是未甲基化的,因为典型体外dna扩增法不能保留扩增模板的甲基化模式。然而,“未甲基化dna”或“甲基化dna”还可分别指原始模板未发生甲基化或发生甲基化的扩增的dna。因此,如本文所用,“甲基化核苷酸”或“甲基化核苷酸碱基”是指在核苷酸碱基上存在甲基部分,其中甲基部分不存在于认可的典型核苷酸碱基中。举例来说,胞嘧啶在其嘧啶环上不含甲基部分,但5-甲基胞嘧啶在其嘧啶环的位置5处含有甲基部分。因此,胞嘧啶不为甲基化核苷酸,而5-甲基胞嘧啶为甲基化核苷酸。在另一实例中,胸腺嘧啶在其嘧啶环的位置5处含有甲基部分;然而,出于本文的目的,当存在于dna中时不将胸腺嘧啶视为甲基化核苷酸,因为胸腺嘧啶为dna的典型核苷酸碱基。如本文所用,“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。如本文所用,核酸分子的“甲基化状态”、“甲基化型态”以及“甲基化状况”是指核酸分子中存在或不存在一个或多个甲基化核苷酸碱基。举例来说,将含有甲基化胞嘧啶的核酸分子视为甲基化的(例如核酸分子的甲基化状态为甲基化的)。将不含任何甲基化核苷酸的核酸分子视为未甲基化的。特定核酸序列(例如如本文所描述的基因标记物或dna区域)的甲基化状态可指示序列中每个碱基的甲基化状态或可指示序列内碱基子集(例如一个或多个胞嘧啶)的甲基化状态,或者可指示关于序列内区域甲基化密度的信息,同时提供或不提供序列内甲基化发生的位置的精确信息。核酸分子中的核苷酸基因座的甲基化状态是指核酸分子中的特定基因座处存在或不存在甲基化核苷酸。举例来说,当核酸分子中第7个核苷酸处存在的核苷酸为5-甲基胞嘧啶时,核酸分子中第7个核苷酸处的胞嘧啶的甲基化状态为甲基化的。类似地,当核酸分子中第7个核苷酸处存在的核苷酸为胞嘧啶(而不是5-甲基胞嘧啶)时,核酸分子中第7个核苷酸处的胞嘧啶的甲基化状态为未甲基化的。甲基化状况可任选地由“甲基化值”表示或指示(例如表示甲基化频率、分数、比率、百分比等)。可例如通过在用甲基化依赖性限制酶限制性消化之后定量存在的完整核酸的量,或者通过比较重亚硫酸盐反应后的扩增型态,或者通过比较重亚硫酸盐处理过和未处理的核酸的序列来产生甲基化值。因此,值(例如甲基化值)代表甲基化状况,并且因此可用作基因座的多个拷贝中的甲基化状况的定量指示物。当需要将样品中的序列的甲基化状况与阈值或参考值进行比较时,这是特别有用的。如本文所用,“甲基化频率”或“甲基化百分比(%)”是指相对于分子或基因座未甲基化的情况的数目,分子或基因座甲基化的情况的数目。因此,甲基化状态描述核酸(例如基因组序列)的甲基化状态。此外,甲基化状态是指特定基因组基因座处的核酸区段的与甲基化相关的特征。此类特征包括但不限于dna序列中的任何胞嘧啶(c)残基是否为甲基化的、甲基化c残基的位置、核酸的任何特定区域中甲基化c的频率或百分比以及甲基化中归因于例如等位基因来源差异的等位基因差异。术语“甲基化状态”、“甲基化型态”以及“甲基化状况”还指生物样品中核酸的任何特定区域中甲基化c或未甲基化c的相对浓度、绝对浓度或模式。举例来说,如果核酸序列内的胞嘧啶(c)残基为甲基化的,则可将其称为“高甲基化的”或具有“增加的甲基化”,而如果dna序列内的胞嘧啶(c)残基序列不为甲基化的,则可将其称为“低甲基化的”或具有“降低的甲基化”。同样地,如果核酸序列内的胞嘧啶(c)残基与另一核酸序列(例如来自不同区域或不同个体等)相比为甲基化的,则认为所述序列与另一核酸序列相比为高甲基化的或具有增加的甲基化。或者,如果dna序列内的胞嘧啶(c)残基与另一核酸序列(例如来自不同区域或不同个体等)相比不为甲基化的,则认为所述序列与另一核酸序列相比为低甲基化的或具有降低的甲基化。另外,如本文所用的术语“甲基化模式”是指核酸区域上的甲基化和未甲基化核苷酸的集合位点。当整个区域中甲基化和未甲基化核苷酸的数量相同或相似,但甲基化和未甲基化核苷酸的位置不同时,两个核酸可具有相同或相似的甲基化频率或甲基化百分数,但具有不同的甲基化模式。当序列的甲基化的程度(例如一个相对于另一个具有增加的或降低的甲基化)、频率或模式不同时,称序列为“差异甲基化的”或具有“甲基化差异”或具有“不同的甲基化状态”。术语“差异甲基化”是指癌症阳性样品中的核酸甲基化水平或模式与癌症阴性样品中的核酸甲基化水平或模式相比的差异。它还可指手术后癌症复发的患者与未复发的患者之间的水平或模式的差异。差异甲基化和dna甲基化的特定水平或模式例如在确定了正确的截止或预示特征后为预后和预示性生物标记物。可使用甲基化状态频率来描述个体的群体或来自单一个体的样品。举例来说,具有50%的甲基化状态频率的核苷酸基因座在50%的情况下为甲基化的,并且在50%的情况下为未甲基化的。可使用此类频率例如描述个体群体或核酸集合中核苷酸基因座或核酸区域的甲基化所达到的程度。因此,当第一群体或核酸分子汇集物中的甲基化与第二群体或核酸分子汇集物中的甲基化不同时,第一群体或汇集物的甲基化状态频率不同于第二群体或汇集物的甲基化状态频率。还可使用此类频率例如描述单一个体中核苷酸基因座或核酸区域的甲基化所达到的程度。举例来说,可使用此类频率来描述来自组织样品的细胞组在核苷酸基因座或核酸区域的甲基化或未甲基化所达到的程度。如本文所用,“核苷酸基因座”是指核酸分子中核苷酸的位置。甲基化核苷酸的核苷酸基因座是指核酸分子中甲基化核苷酸的位置。典型地,人dna的甲基化发生在包括相邻鸟嘌呤和胞嘧啶的二核苷酸序列上,其中胞嘧啶定位于鸟嘌呤的5'(也称为cpg二核苷酸序列)。在人基因组中cpg二核苷酸中的大多数胞嘧啶为甲基化的,然而在特定的cpg二核苷酸富集的基因组区域(被称为cpg岛)中一些保持未甲基化(参见例如antequera等(1990)cell62:503-514)。如本文所用,“cpg岛”是指基因组dna中相对于总基因组dna含有增加数目的cpg二核苷酸的富含g:c的区域。cpg岛的长度可为至少100、200或更多个碱基对,其中所述区域的g:c含量为至少50%,并且所观测到的cpg频率与预期频率的比率为0.6;在一些情况下,cpg岛的长度可为至少500个碱基对,其中所述区域的g:c含量为至少55%),并且观测到的cpg频率与预期频率的比率为0.65。可根据gardiner-garden等(1987)j.mol.biol.196:261-281中所提供的方法来计算相对于预期频率所观测到的cpg频率。举例来说,可根据公式r=(a×b)/(c×d)来计算相对于预期频率所观测到的cpg频率,其中r为所观测到的cpg频率与预期频率的比率,a为所分析序列中的cpg二核苷酸的数目,b为所分析序列中的核苷酸的总数目,c为所分析序列中的c核苷酸的总数目,并且d为所分析序列中的g核苷酸的总数目。典型地在cpg岛中,例如在启动子区确定甲基化状态。不过应理解,人基因组中的其他序列也倾向于dna甲基化,诸如cpa和cpt(参见例如ramsahoye(2000)proc.natl.acad.sci.usa97:5237-5242;salmon和kaye(1970)biochim.biophys.acta.204:340-351;grafstrom(1985)nucleicacidsres.13:2827-2842;nyce(1986)nucleicacidsres.14:4353-4367;woodcock(1987)biochem.biophys.res.commun.145:888-894)。如本文所用,根据核酸分子的甲基化状态修饰核酸分子的核苷酸的试剂或者甲基化特异性试剂是指可以反映核酸分子的甲基化状态的方式改变核酸分子的核苷酸序列的化合物或组合物或其他剂。用此类试剂处理核酸分子的方法可包括结合额外步骤(如果需要)使核酸分子与试剂接触以实现所需核苷酸序列变化。核酸分子的核苷酸序列的此类变化可产生其中每个甲基化核苷酸被修饰成不同核苷酸的核酸分子。核酸核苷酸序列的此类变化可产生其中每个未甲基化核苷酸被修饰成不同核苷酸的核酸分子。核酸核苷酸序列的此类变化可产生其中每个未甲基化的所选核苷酸(例如每个未甲基化的胞嘧啶)被修饰成不同的核苷酸的核酸分子。使用此类试剂改变核酸核苷酸序列可产生其中为甲基化核苷酸的每个核苷酸(例如每个甲基化胞嘧啶)被修饰成不同核苷酸的核酸分子。如本文所用,使用修饰所选核苷酸的试剂是指修饰核酸分子中四种典型存在的核苷酸(dna的c、g、t以及a,以及rna的c、g、u以及a)中的一种核苷酸的试剂,使得试剂修饰这一种核苷酸而不修饰另外三种核苷酸。在一个示例性实施方案中,此类试剂修饰未甲基化的所选核苷酸以产生不同的核苷酸。在另一示例性实施方案中,此类试剂可使未甲基化胞嘧啶核苷酸脱去氨基。示例性试剂为重亚硫酸盐。如本文所用,术语“重亚硫酸盐试剂”是指在一些实施方案中包括重亚硫酸盐(bisulfite)、二亚硫酸盐(disulfite)、亚硫酸氢盐(hydrogensulfite)或其组合的试剂,以区分例如cpg二核苷酸序列中的甲基化和未甲基化胞苷。术语“甲基化分析”是指用于测定核酸序列内的一个或多个cpg二核苷酸序列的甲基化状态的任何分析。术语“msap-pcr”(甲基化敏感性任意引物聚合酶链反应)是指本领域公认的技术,所述技术允许使用富含cg的引物对基因组进行全局扫描,以集中于最可能含有cpg二核苷酸的区域,并且由gonzalgo等(1997)cancerresearch57:594-599描述。术语“methylighttm”是指由eads等(1999)cancerres.59:2302-2306描述的本领域公认的基于荧光的实时pcr技术。术语“heavymethyltm”是指如下分析,其中覆盖位于扩增引物之间或由扩增引物覆盖的cpg位置的甲基化特异性阻断探针(本文中也称为阻断剂)能够对核酸样品进行甲基化特异性选择性扩增。术语“heavymethyltmmethylighttm”分析是指heavymethyltmmethylighttm分析,所述分析为methylighttm分析的变化型式,其中将methylighttm分析与覆盖扩增引物之间的cpg位置的甲基化特异性阻断探针组合。术语“ms-snupe”(甲基化敏感性单核苷酸引物延伸)是指由gonzalgo和jones(1997)nucleicacidsres.25:2529-2531描述的本领域公认的分析。术语“msp”(甲基化特异性pcr)是指由herman等(1996)proc.natl.acad.sci.usa93:9821-9826和由美国专利号5,786,146描述的本领域公认的甲基化分析。术语“cobra”(组合重亚硫酸盐限制分析)是指由xiong和laird(1997)nucleicacidsres.25:2532-2534描述的本领域公认的甲基化分析。术语“mca”(甲基化cpg岛扩增)是指由toyota等(1999)cancerres.59:2307-12描述以及wo00/26401a1中的甲基化分析。如本文所用,“所选核苷酸”是指核酸分子中四种典型存在的核苷酸(dna的c、g、t以及a,以及rna的c、g、u以及a)中的一种核苷酸,并且可包括典型存在的核苷酸的甲基化衍生物(例如当c为所选核苷酸时,甲基化与未甲基化的c均包括在所选核苷酸的含义内),而甲基化的所选核苷酸尤其指甲基化的典型存在的核苷酸,未甲基化的所选核苷酸尤其指未甲基化的典型存在的核苷酸。术语“甲基化特异性限制酶”或“甲基化敏感性限制酶”是指根据识别位点的甲基化状态选择性消化核酸的酶。在如果识别位点不为甲基化或为半甲基化的则进行特异性切割的限制酶的情况下,如果识别位点为甲基化的,则切割将不发生或者将以显著降低的效率发生。在如果识别位点为甲基化的则进行特异性切割的限制酶的情况下,如果识别位点不为甲基化的,则切割将不发生或者将以显著降低的效率发生。优选为如下甲基化特异性限制酶,其识别序列含有cg二核苷酸(例如诸如cgcg或cccggg等识别序列)。对于一些实施方案,进一步优选的为如果此二核苷酸中的胞嘧啶在碳原子c5处为甲基化的则不进行切割的限制酶。如本文所用,“不同核苷酸”是指如下核苷酸,所述核苷酸在化学上不同于所选核苷酸,典型地使得不同核苷酸具有与所选核苷酸不同的沃森-克里克碱基配对(watson-crickbase-pairing)性质,借此与所选核苷酸互补的典型存在的核苷酸和与不同核苷酸互补的典型存在的核苷酸不相同。举例来说,当c为所选核苷酸时,u或t可为不同核苷酸,此通过c与g的互补性以及u或t与a性的互补性来例示。如本文所用,与所选核苷酸互补或与不同核苷酸互补的核苷酸是指在高严格条件下与所选核苷酸或不同核苷酸碱基配对的核苷酸,其亲和力高于互补核苷酸与四种典型存在的核苷酸中的三种核苷酸的碱基配对。互补性的实例为在dna(例如a-t和c-g)和rna(例如a-u和c-g)中的沃森-克里克碱基配对。因此,例如在高严格条件下,和g与g、a或t碱基配对相比,g以更高亲和力与c碱基配对,因此,当c为所选核苷酸时,g为与所选核苷酸互补的核苷酸。如本文所用,给定标记物的“灵敏度”是指报告高于区分赘生和非赘生样品的阈值的dna甲基化值的样品的百分比。在一些实施方案中,阳性定义为报告高于阈值(例如与疾病相关的范围)的dna甲基化值的组织学确认的赘瘤,并且假阴性定义为报告低于阈值(例如与无疾病相关的范围)的dna甲基化值的组织学确认的赘瘤。因此,灵敏度的值反映了从已知患病样品获得的给定标记物的dna甲基化测量将在疾病相关测量范围内的可能性。如在此所定义,计算的灵敏度值的临床相关性表示当应用于患有临床疾患的受试者时给定标记物将检测到所述疾患的存在的可能性的估计。如本文所用,给定标记物的“特异性”是指报告低于区分赘生和非赘生样品的阈值的dna甲基化值的非赘生样品的百分比。在一些实施方案中,阴性定义为报告低于阈值(例如与无疾病相关的范围)的dna甲基化值的组织学确认的非赘生样品,并且假阳性定义为报告高于阈值(例如与疾病相关的范围)的dna甲基化值的组织学确认的非赘生样品。因此,特异性的值反映了从已知非赘生样品获得的给定标记物的dna甲基化测量将在非疾病相关测量范围内的可能性。如在此所定义,所计算的特异性值的临床相关性表示当应用于未患临床疾患的患者时给定标记物将检测到所述疾患不存在的可能性的估计。如本文所用的术语“auc”为“曲线下的面积”的缩写。特别地,它指接受者操作特征(roc)曲线下的面积。roc曲线为诊断测试的不同可能切割点的真阳性率对假阳性率的曲线。它示出了取决于所选择的切割点的灵敏度与特异性之间的折中(灵敏度的任何增加都将伴随着特异性的降低)。roc曲线下面积(auc)为诊断测试准确性的度量(面积越大越好;最优值为1;随机测试将具有位于对角线上的面积为0.5的roc曲线;参考:j.p.egan.(1975)signaldetectiontheoryandrocanalysis,academicpress,newyork)。如本文所用,术语“赘瘤”是指“生长超过了正常组织并且与正常组织不协调的异常组织团块”。参见例如willisra,“thespreadoftumorsinthehumanbody”,london,butterworth&co,1952。如本文所用,术语“腺瘤”是指源于腺体的良性肿瘤。虽然这些生长为良性的,但随时间推移它们可发生进展从而变为恶性的。术语“癌前”或“赘生前”以及其等效物是指正在经历恶性转化的任何细胞增殖性病症。赘瘤、腺瘤、癌症等的“部位”或“区域”为赘瘤、腺瘤、癌症等定位的受试者体内的组织、器官、细胞类型、解剖区域、身体部位等。如本文所用,“诊断”测试应用包括检测或鉴定受试者的疾病状态或状况,确定受试者将感染给定疾病或疾患的可能性,确定患有疾病或疾患的受试者将对疗法作出反应的可能性,确定具有疾病或疾患的受试者的预后(或其可能的进展或消退),以及确定治疗对患有疾病或疾患的受试者的影响。举例来说,诊断法可用于检测受试者感染赘瘤的存在或可能性或此类受试者将有利地对化合物(例如医药,例如药物)或其他治疗作出反应的可能性。如本文所用,术语“标记物”是指能够通过例如基于甲基化状态区分疾病相关细胞(例如与疾病相关的非癌细胞)(与疾病相关的癌细胞)与正常细胞来诊断病症(例如非癌性疾病)(例如癌性疾病)的物质(例如核酸或核酸区域)。当用于指核酸时,如在“分离的寡核苷酸”中的术语“分离的”是指从在天然来源中通常与相关联的至少一种污染物核酸鉴定和分离的核酸序列。分离的核酸以与自然界中所发现的形式或设置不同的形式或设置存在。相比之下,非分离核酸(诸如dna和rna)以其在自然界中存在的状态被发现。非分离核酸的实例包括:在相邻基因附近的存在于宿主细胞染色体上的给定dna序列(例如基因);以与编码大量蛋白质的许多其他mrna的混合物的形式存在于细胞中的rna序列,诸如编码特定蛋白质的特定mrna序列。然而,编码特定蛋白质的分离的核酸包括例如通常表达所述蛋白质的细胞中的此类核酸,其中所述核酸处于与天然细胞不同的染色体位置,或者侧接与在自然界中发现的不同的核酸序列。分离的核酸或寡核苷酸可以单链或双链形式存在。当利用分离的核酸或寡核苷酸来表达蛋白质时,寡核苷酸将至少含有正义链或编码链(即寡核苷酸可为单链的),但也可含有正义链与反义链两者(即,寡核苷酸可为双链的)。分离的核酸在从其天然或典型环境分离之后可与其他核酸或分子组合。举例来说,分离的核酸可存在于它被放置于其中的宿主细胞中,例如用于异源表达。术语“纯化的”是指从天然环境中移出、分离或分开的核酸或氨基酸序列的分子。因此,“分离的核酸序列”可为纯化的核酸序列。“基本上纯化的”分子至少60%不含、优选地至少75%不含或更优选地至少90%不含与其天然缔合的其他组分。如本文所用,术语“纯化的”或“以纯化”还指从样品中除去污染物。除去污染蛋白质使得样品中所关注的多肽或核酸的百分比增加。在另一实例中,重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达,并且通过除去宿主细胞蛋白来纯化所述多肽;样品中重组多肽的百分比由此增加。术语“包含给定多核苷酸序列或多肽的组合物”广义上是指含有给定多核苷酸序列或多肽的任何组合物。组合物可包含含有盐(例如nacl)、洗涤剂(例如sds)以及其他组分(例如邓哈特溶液(denhardt'ssolution)、干乳、鲑鱼精子dna等)的水溶液。术语“样品”以其最广泛的意义使用。在一个意义上,它可指动物细胞或组织。在另一意义上,它意在包括从任何来源获得的试样或培养物,以及生物和环境样品。生物样品可从植物或动物(包括人)获得并且涵盖流体、固体、组织以及气体。环境样品包括环境材料,诸如表面物质、土壤、水以及工业样品。这些实例不应被解释为限制适用于本发明的样品类型。如本文所用,如一些背景下所用的“远程样品”涉及从不是样品的细胞、组织或器官来源的部位间接收集的样品。举例来说,当在粪便样品(例如不是从胰腺直接取得的样品)中评估源自胰腺的样品材料时,样品为远程样品。如本文所用,术语“患者”或“受试者”是指要进行由所述技术提供的各种测试的有机体。术语“受试者”包括动物,优选为哺乳动物,包括人。在一个优选实施方案中,受试者为灵长类动物。在一个甚至更优选的实施方案中,受试者为人。如本文所用,术语“试剂盒”是指用于递送材料的任何递送系统。在反应分析的背景下,此类递送系统包括允许将反应试剂(例如适当容器中的寡核苷酸、酶等)和/或支持材料(例如缓冲液、用于进行分析的书面说明等)从一个位置储存、运输或递送到另一个位置的系统。举例来说,试剂盒包括一个或多个含有相关反应试剂和/或支持材料的外壳(例如盒子)。如本文所用,术语“分区试剂盒(fragmentedkit)”是指包括两个或更多个分开的容器的递送系统,所述容器各自含有全部体试剂盒组分的子部分。容器可一起或分开地递送给预期接受者。举例来说,第一容器可含有用于分析的酶,而第二容器含有寡核苷酸。术语“分区试剂盒”意图涵盖含有根据联邦食品、药品及化妆品法案(federalfood,drug,andcosmeticact)的章节520(e)规定的分析物特异性试剂(asr)的试剂盒,但不限于此。实际上,包括两个或更多个分开的容器并且每个容器含有全部试剂盒组分的子部分的任何递送系统均包括在术语“分区试剂盒”内。相比之下,“组合试剂盒”是指在单一容器中(例如在容纳每种所需组分的单一盒外壳中)含有反应分析的所有组分的递送系统。术语“试剂盒”包括分区与组合试剂盒两者。所述技术的实施方案本文提供了用于hcc筛查的技术(例如监视)并且特别地(但不排他地)涉及用于检测受试者中hcc的存在的方法、组合物以及相关用途。鉴定了能够检测hcc的标记物和/或标记物组(例如具有表1和表4中所提供的注释的染色体区)(参见实施例i、ii以及iii)(例如acp1、bdh1、chr12.133、clec11a、dab2ip、dbnl、emx1、efnb2、hoxa1、lrrc4、spint2、tspyl5、ccnj_3707、ccnj_3124、pfkp、scrn1以及ece1)。虽然本文的公开内容提到某些所说明的实施方案,但应了解,这些实施方案是以举例的方式而不是以限制的方式呈现的。所述方法包括测定从受试者分离的生物样品中的至少一种甲基化标记物的甲基化状况,其中标记物的甲基化状态的变化指示hcc的存在或类别。特定实施方案涉及用于诊断(例如筛查)hcc的包含差异甲基化区(dmr,例如dmr1-400(来自表1和表4))的标记物。除分析了包含本文提供并且列于表1和表3中的dmr(例如dmr1-400)的至少一种标记物、标记物区域或标记物碱基的甲基化分析的实施方案之外,所述技术还提供包含可用于检测受试者中的hcc的包含dmr的至少一种标记物、标记物区域或标记物碱基的标记物组。所述技术的一些实施方案是基于对包含dmr的至少一种标记物、标记物区域或标记物碱基的cpg甲基化状况的分析。在一些实施方案中,本发明技术提供重亚硫酸盐技术与一种或多种甲基化分析组合用于测定包含dmr(例如如表1和表4中所提供的dmr(例如dmr1-400))的至少一种标记物内的cpg二核苷酸序列的甲基化状况的用途。基因组cpg二核苷酸可为甲基化或未甲基化的(或者分别称为上甲基化和下甲基化)。然而,本发明的方法适合于分析非均质性质的生物样品,例如远程样品(例如血液、器官流出物或粪便)的背景内的低浓度肿瘤细胞,或者由其产生的生物材料。因此,当分析此类样品内的cpg位置的甲基化状况时,可使用定量分析来测定特定cpg位置的甲基化水平(例如百分比、分数、比率、比例或程度)。根据本发明技术,测定包含dmr的标记物中的cpg二核苷酸序列的甲基化状况可用于诊断与表征受试者中的hcc。标记物的组合在一些实施方案中,所述技术涉及评估包含两个或更多个来自表1和/或表4的dmr(例如两个或更多个来自dmr编号1-400的dmr)的标记物的组合的甲基化状态。在一些实施方案中,评估超过一种标记物的甲基化状态使用于鉴定受试者中hcc的存在的筛查或诊断的特异性和/或灵敏度增加。例如如通过与预测的特异性和灵敏度有关的统计技术所鉴定,通过标记物的各种组合来预测各种癌症。所述技术提供鉴定一些癌症的预测组合和验证的预测组合的方法。举例来说,鉴定了能够检测hcc的标记物和/或标记物组(例如具有表1和表4中所提供的注释的染色体区)(参见实施例i、ii以及iii)(例如acp1、bdh1、chr12.133、clec11a、dab2ip、dbnl、emx1、efnb2、hoxa1、lrrc4、spint2、tspyl5、ccnj_3707、ccnj_3124、pfkp、scrn1以及ece1)。分析甲基化状态的方法最常使用的分析核酸中5-甲基胞嘧啶的存在的方法是基于由frommer等描述的用于检测dna中的5-甲基胞嘧啶的重亚硫酸盐法(frommer等(1992)proc.natl.acad.sci.usa89:1827-31)或其变化型式。定位5-甲基胞嘧啶的重亚硫酸盐法是基于以下观测结果,胞嘧啶与亚硫酸氢根离子(亦称为重亚硫酸根)反应,而5-甲基胞嘧啶不与亚硫酸氢根离子反应。所述反应通常根据以下步骤进行:首先,胞嘧啶与亚硫酸氢盐反应以形成磺化胞嘧啶。接着,磺化的反应中间物自发脱氨基产生磺化尿嘧啶。最后,磺化尿嘧啶在碱性条件下脱磺酸以形成尿嘧啶。检测是可能的,因为尿嘧啶与腺嘌呤形成碱基对(因此表现得像胸腺嘧啶),而5-甲基胞嘧啶与鸟嘌呤碱基配对(因此表现得像胞嘧啶)。这使得可通过例如重亚硫酸盐基因组测序(griggg和clarks,bioessays(1994)16:431-36;griggg,dnaseq.(1996)6:189-98)或如例如美国专利号5,786,146中所公开的甲基化特异性pcr(msp)来辨别甲基化胞嘧啶与非甲基化胞嘧啶。一些常规技术涉及包括将要分析的dna封闭于琼脂糖基质中从而防止dna扩散和复性(重亚硫酸盐仅与单链dna反应)以及用快速渗析替代沉淀和纯化步骤的方法(oleka,等(1996)“amodifiedandimprovedmethodforbisulfitebasedcytosinemethylationanalysis”nucleicacidsres.24:5064-6)。因此可分析个别细胞的甲基化状况,从而说明方法的效用和灵敏度。rein,t.等(1998)nucleicacidsres.26:2255提供了检测5-甲基胞嘧啶的常规方法的综述。重亚硫酸盐技术典型地涉及在重亚硫酸盐处理后扩增已知核酸的短特异性片段,然后通过测序(olek和walter(1997)nat.genet.17:275-6)或引物延伸反应(gonzalgo和jones(1997)nucleicacidsres.25:2529-31;wo95/00669;美国专利号6,251,594)分析产物,以分析个别胞嘧啶位置。一些方法使用酶消化(xiong和laird(1997)nucleicacidsres.25:2532-4)。本领域中还描述了通过杂交检测(olek等,wo99/28498)。另外,已描述重亚硫酸盐技术用于个别基因的甲基化检测的用途(grigg和clark(1994)bioessays16:431-6;zeschnigk等(1997)hummolgenet.6:387-95;feil等(1994)nucleicacidsres.22:695;martin等(1995)gene157:261-4;wo9746705;wo9515373)。各种甲基化分析程序为本领域已知的并且可与根据本发明技术的重亚硫酸盐处理结合使用。这些分析允许测定核酸序列内的一个或多个cpg二核苷酸(例如cpg岛)的甲基化状态。此类分析涉及重亚硫酸盐处理过的核酸的测序、pcr(用于序列特异性扩增)、南方墨点分析(southernblotanalysis)以及甲基化敏感性限制酶的使用以及其他技术。举例来说,已通过使用重亚硫酸盐处理简化了基因组测序,以分析甲基化模式和5-甲基胞嘧啶分布(frommer等(1992)proc.natl.acad.sci.usa89:1827-1831)。另外,例如如由sadri和hornsby(1997)nucl.acidsres.24:5058-5059所描述,或者如在称为cobra(组合重亚硫酸盐限制性分析)的方法所体现(xiong和laird(1997)nucleicacidsres.25:2532-2534),从重亚硫酸盐转化的dna扩增的pcr产物的限制酶消化可用于评估甲基化状态。cobratm分析为适用于确定少量基因组dna中特定基因座处的dna甲基化水平的定量甲基化分析(xiong和laird,nucleicacidsres.25:2532-2534,1997)。简言之,使用限制酶消化来揭露重亚硫酸钠处理的dna的pcr产物中的甲基化依赖性序列差异。首先,根据frommer等(proc.natl.acad.sci.usa89:1827-1831,1992)描述的程序通过标准重亚硫酸盐处理将甲基化依赖性序列差异引入基因组dna。然后使用对所关注的cpg岛具特异性的引物进行重亚硫酸盐转化的dna的pcr扩增,随后进行限制性核酸内切酶消化、凝胶电泳以及使用特异性标记的杂交探针的检测。原始dna样品中的甲基化水平在广泛范围的dna甲基化水平内以线性定量方式由消化的和未消化的pcr产物的相对量表示。此外,此技术可以可靠地适用于从显微解剖的石蜡包埋的组织样品获得的dna。用于cobratm分析的典型试剂(例如如可在典型的基于cobratm的试剂盒中发现)可包括但不限于:用于特定基因座(例如特定基因、标记物、dmr、基因区域、标记物区域、重亚硫酸盐处理过的dna序列、cpg岛等)的pcr引物;限制酶和适当的缓冲液;基因杂交寡核苷酸;对照杂交寡核苷酸;寡核苷酸探针的激酶标记试剂盒;以及标记的核苷酸。另外,重亚硫酸盐转化试剂可包括:dna变性缓冲液;磺化缓冲液;dna回收试剂或试剂盒(例如沉淀、超滤、亲和柱);脱磺酸缓冲液;以及dna回收组分。优选地,单独使用诸如“methylighttm”(基于荧光的实时pcr技术)(eads等,cancerres.59:2302-2306,1999)、ms-snupetm(甲基化敏感性单核苷酸引物延伸)反应(gonzalgo和jones,nucleicacidsres.25:2529-2531,1997)、甲基化特异性pcr(“msp”;herman等,proc.natl.acad.sci.usa93:9821-9826,1996;美国专利号5,786,146)以及甲基化cpg岛扩增(“mca”;toyota等,cancerres.59:2307-12,1999)等分析或与这些方法中的一者或多者组合使用。“heavymethyltm”分析技术为基于重亚硫酸盐处理过的dna的甲基化特异性扩增来评估甲基化差异的定量方法。覆盖位于扩增引物之间或由扩增引物覆盖的cpg位置的甲基化特异性阻断探针(“阻断剂”)使得能够对核酸样品进行甲基化特异性选择性扩增。术语“heavymethyltmmethylighttm”分析是指heavymethyltmmethylighttm分析,所述分析为methylighttm分析的变化型式,其中将methylighttm分析与覆盖扩增引物之间的cpg位置的甲基化特异性阻断探针组合。还可将heavymethyltm分析与甲基化特异性扩增引物组合使用。用于heavymethyltm分析的典型试剂(例如如可在典型的基于methylighttm的试剂盒中发现)可包括但不限于:用于特定基因座(例如特定基因、标记物、dmr、基因区域、标记物区域、重亚硫酸盐处理过的dna序列、cpg岛或重亚硫酸盐处理过的dna序列或cpg岛等)的pcr引物;阻断性寡核苷酸;优化的pcr缓冲液和脱氧核苷酸;以及taq聚合酶。msp(甲基化特异性pcr)允许评估cpg岛内几乎任何cpg位点组的甲基化状况,此与甲基化敏感性限制酶的使用无关(herman等proc.natl.acad.sci.usa93:9821-9826,1996;美国专利号5,786,146)。简言之,dna由重亚硫酸钠修饰,重亚硫酸钠将未甲基化胞嘧啶转化为尿嘧啶,但不将甲基化胞嘧啶转化为尿嘧啶,并且随后用相较于未甲基化dna对甲基化dna具特异性的引物对产物进行扩增。msp仅需要少量的dna,对给定cpg岛基因座的0.1%甲基化等位基因敏感,并且可对从石蜡包埋的样品提取的dna进行。用于msp分析的典型试剂(例如可在典型的基于msp的试剂盒中发现)可包括但不限于:用于特定基因座(例如特定基因、标记物、dmr、基因区域、标记物区域、重亚硫酸盐处理过的dna序列、cpg岛等)的甲基化和未甲基化pcr引物;优化的pcr缓冲液和脱氧核苷酸;以及特异性探针。methylighttm分析为利用基于荧光的实时pcr(例如)且在pcr步骤后不需要进一步操纵的高通量定量甲基化分析(eads等,cancerres.59:2302-2306,1999)。简言之,methylighttm方法从基因组dna的混合样品开始,将其根据标准程序(重亚硫酸盐方法将未甲基化的胞嘧啶残基转化为尿嘧啶)在重亚硫酸钠反应中转化为具有甲基化依赖性序列差异的混合汇集物。然后例如使用与已知cpg二核苷酸重叠的pcr引物在“偏差”的反应中进行基于荧光的pcr。在扩增过程的层面上与荧光检测过程的层面上均发生序列辨别。使用methylighttm分析作为核酸(例如基因组dna样品)中的甲基化模式的定量测试,其中在探针杂交的层面上发生序列辨别。在定量型式中,pcr反应在存在与特定推定甲基化位点重叠的荧光探针的情况下提供甲基化特异性扩增。通过其中引物与探针均不覆盖任何cpg二核苷酸的反应来提供输入dna的量的无偏对照。或者,通过用不覆盖已知甲基化位点的对照寡核苷酸(例如heavymethyltm和msp技术的基于荧光的型式)或用覆盖潜在甲基化位点的寡核苷酸探测偏差pcr汇集物来实现基因组甲基化的定性测试。将methylighttm方法与任何合适的探针(例如探针、探针等)一起使用。举例来说,在一些应用中,将双链基因组dna用重亚硫酸钠处理,并且进行使用探针例如加上msp引物和/或heavymethyl阻断剂寡核苷酸和探针的两组pcr反应中的一组。将探针用荧光“报告”和“淬灭”分子双重标记,并且设计成对相对高gc含量的区域具特异性,使得它在pcr循环中在比正向引物或反向引物高约10℃的温度下熔解。这允许探针在pcr退火/延伸步骤期间保持完全杂交。随着taq聚合酶在pcr期间酶合成新的链,它最终将到达退火的探针。然后,taq聚合酶5′至3′核酸内切酶活性将通过消化探针释放荧光报告分子来替换探针,以使用实时荧光检测系统定量检测其现在未淬灭的信号。用于methylighttm分析的典型试剂(例如如可在典型的基于methylighttm的试剂盒中发现)可包括但不限于:用于特定基因座(例如特定基因、标记物、dmr、基因区域、标记物区域、重亚硫酸盐处理过的dna序列、cpg岛等)的pcr引物;或探针;优化的pcr缓冲液和脱氧核苷酸;以及taq聚合酶。qmtm(定量甲基化)分析为基因组dna样品中的甲基化模式的替代定量测试,其中在探针杂交的层面上发生序列辨别。在此定量型式中,pcr反应在存在与特定推定甲基化位点重叠的荧光探针的情况下提供无偏扩增。通过其中引物与探针均不与覆盖任何cpg二核苷酸的反应来提供输入dna的量的无偏对照。或者,通过用不覆盖已知甲基化位点的对照寡核苷酸(heavymethyltm和msp技术的基于荧光的型式)或用覆盖潜在甲基化位点的寡核苷酸探测偏差pcr汇集物来实现基因组甲基化的定性测试。在扩增过程中,可将qmtm方法与任何适合的探针(例如探针、探针)一起使用。举例来说,将双链基因组dna用重亚硫酸钠处理,并且经受无偏引物和探针。将探针用荧光“报告”和“淬灭”分子双重标记,并且设计成对相对高gc含量的区域具特异性,使得它在pcr循环中在比正向引物或反向引物高约10℃的温度下熔解。这允许探针在pcr退火/延伸步骤期间保持完全杂交。随着taq聚合酶在pcr期间酶合成新的链,它最终将到达退火的探针。然后,taq聚合酶5′至3′核酸内切酶活性将通过消化探针释放荧光报告分子来替换探针,以使用实时荧光检测系统定量检测其现在未淬灭的信号。用于qmtm分析的典型试剂(例如如可在典型的基于qmtm的试剂盒中发现)可包括但不限于:用于特定基因座(例如特定基因、标记物、dmr、基因区域、标记物区域、重亚硫酸盐处理过的dna序列、cpg岛等)的pcr引物;或探针;优化的pcr缓冲液和脱氧核苷酸;以及taq聚合酶。ms-snupetm技术为基于对dna的重亚硫酸盐处理随后单核苷酸引物延伸来评估特定cpg位点的甲基化差异的定量方法(gonzalgo和jones,nucleicacidsres.25:2529-2531,1997)。简言之,基因组dna与重亚硫酸钠反应,将未甲基化的胞嘧啶转化为尿嘧啶,同时保持5-甲基胞嘧啶不变。然后使用对重亚硫酸盐转化的dna具特异性的pcr引物进行所需靶序列的扩增,并且分离所得产物并用作所关注的cpg位点处的甲基化分析的模板。可分析少量的dna(例如显微解剖的病理切片),并且这避免利用限制酶来测定cpg位点处的甲基化状况。用于ms-snupetm分析的典型试剂(例如如可在典型的基于ms-snupetm的试剂盒中发现)可包括但不限于:用于特定基因座(例如特定基因、标记物、dmr、基因区域、标记物区域、重亚硫酸盐处理过的dna序列、cpg岛等)的pcr引物;优化的pcr缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于特定基因座的ms-snupetm引物;反应缓冲液(用于ms-snupe反应);以及标记的核苷酸。另外,重亚硫酸盐转化试剂可包括:dna变性缓冲液;磺化缓冲液;dna回收试剂或试剂盒(例如沉淀、超滤、亲和柱);脱磺酸缓冲液;以及dna回收组分。简化表示重亚硫酸盐测序(reducedrepresentationbisulfitesequencing,rrbs)从重亚硫酸盐处理核酸以将所有未甲基化的胞嘧啶转化为尿嘧啶开始,随后为限制酶消化(例如通过识别包括cg序列的位点的酶,诸如mspi)以及在连接至衔接子配体之后片段的完整测序。限制酶的选择富集了cpg致密区域的片段,从而使在分析期间可能定位到多个基因位置的冗余序列的数目减少。因此,rrbs通过选择用于测序的限制性片段的子集(例如通过使用制备型凝胶电泳的大小选择)降低核酸样品的复杂性。与全基因组重亚硫酸盐测序相反,通过限制酶消化产生的每个片段均含有至少一个cpg二核苷酸的dna甲基化信息。因此,rrbs富集了样品的启动子、cpg岛以及在这些区域中具有高频率的限制酶切割位点的其他基因组特征,并且因此提供用于评估一个或多个基因组基因座的甲基化状态的分析。rrbs的典型方案包括以下步骤:用诸如mspi等限制酶消化核酸样品,填充突出端和a尾,连结衔接子,重亚硫酸盐转化以及pcr。参见例如等(2005)“genome-scalednamethylationmappingofclinicalsamplesatsingle-nucleotideresolution”natmethods7:133-6;meissner等(2005)“reducedrepresentationbisulfitesequencingforcomparativehigh-resolutiondnamethylationanalysis”nucleicacidsres.33:5868-77。在一些实施方案中,使用定量等位基因特异性实时靶标和信号放大(quarts)分析来评估甲基化状态。在每次quarts分析中依次发生三个反应,包括在初级反应中的扩增(反应1)和靶探针裂解(反应2);以及在次级反应中的fret裂解和荧光信号产生(反应3)。当用特异性引物扩增靶核酸时,具有侧翼序列(flapsequence)的特异性检测探针与扩增子松散结合。靶结合位点处特异性侵入性寡核苷酸的存在通过在检测探针与侧翼序列之间切割使得裂解酶释放侧翼序列。侧翼序列与相应fret盒的非发夹部分互补。因此,侧翼序列在fret盒上充当侵入性寡核苷酸,并且实现fret盒荧光团与淬灭剂之间的裂解,这产生荧光信号。裂解反应可每个靶标切割多个探针,并且因此每个侧翼释放多个荧光团,从而提供指数信号放大。quarts可通过使用具有不同染料的fret盒在单一反应孔中检测多个靶标。参见例如zou等(2010)“sensitivequantificationofmethylatedmarkerswithanovelmethylationspecifictechnology”clinchem56:a199;美国专利申请序列号12/946,737、12/946,745、12/946,752以及61/548,639。术语“重亚硫酸盐试剂”是指包括重亚硫酸盐、二亚硫酸盐、亚硫酸氢盐或其组合的试剂,所述试剂如本文所公开适用于区分甲基化和未甲基化的cpg二核苷酸序列。所述处理的方法为本领域已知的(例如pct/ep2004/011715)。优选的是,在存在诸如但不限于正烷基二醇或乙二醇二甲醚(dme)等变性溶剂的情况下或在存在二噁烷或二噁烷衍生物的情况下进行重亚硫酸盐处理。在一些实施方案中,以1%与35%(v/v)之间的浓度使用变性溶剂。在一些实施方案中,在存在诸如但不限于色满衍生物(例如6-羟基-2,5,7,8,-四甲基色满2-甲酸或三羟基苯甲酸以及其衍生物,例如没食子酸)等清除剂的情况下进行重亚硫酸盐反应(参见pct/ep2004/011715)。优选在30℃与70℃之间的反应温度下进行重亚硫酸盐转化,据此在反应期间温度被短时间升高至超过85℃(参见pct/ep2004/011715)。优选在定量之前将重亚硫酸盐处理过的dna纯化。这可通过本领域已知的任何手段进行,诸如但不限于例如借助于microcontm柱(由milliporetm制造)进行超滤。根据改良的制造商方案进行纯化(参见例如pct/ep2004/011715)。在一些实施方案中,使用根据本发明的引物寡核苷酸组(例如参见表2)和扩增酶来扩增经处理的dna的片段。若干dna区段的扩增可在同一个反应容器中同时进行。典型地,使用聚合酶链反应(pcr)进行扩增。扩增子的长度典型地为100至2000个碱基对。在所述方法的另一实施方案中,可通过使用甲基化特异性引物寡核苷酸来检测包含dmr(例如dmr1-400;表1和表4)的标记物内或附近的cpg位置的甲基化状况。在herman的美国专利号6,265,171中已描述了此技术(msp)。使用甲基化状况特异性引物扩增重亚硫酸盐处理过的dna允许区分甲基化和未甲基化核酸。msp引物对含有至少一种与重亚硫酸盐处理过的cpg二核苷酸杂交的引物。因此,所述引物的序列包含至少一个cpg二核苷酸。对非甲基化dna具特异性的msp引物在cpg中的c位置的位置处含有“t”。借助于扩增获得的片段可携带直接或间接可检测的标记。在一些实施方案中,标记为荧光标记、放射性核素或具有可在质谱仪中检测的典型质量的可分离分子片段。当所述标记为质量标记时,一些实施方案提供具有单一正净电荷或负净电荷的标记的扩增子,从而允许在质谱仪中具有更好的可检测性。可借助于例如基质辅助激光解吸/电离质谱法(maldi)或使用电喷雾质谱法(esi)来进行检测和可视化。用于分离适合于这些分析技术的dna的方法为本领域已知的。特定而言,一些实施方案包括如美国专利申请序列号13/470,251(“isolationofnucleicacids”)中所描述分离核酸。方法在所述技术的一些实施方案中,提供了包括以下步骤的方法:1)使从受试者获得的核酸(例如基因组dna,所述基因组dna例如分离自体液,诸如血液样品(例如血浆样品)、粪便样品或组织样品)与区分包含dmr(例如dmr1-400(来自表1和表4))的至少一种标记物内的甲基化和非甲基化cpg二核苷酸的至少一种试剂或一系列试剂接触,以及2)检测hcc的缺乏(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。在所述技术的一些实施方案中,提供了包括以下步骤的方法:1)使从受试者获得的核酸(例如基因组dna,所述基因组dna例如分离自体液,诸如血液样品(例如血浆样品)、粪便样品或组织样品)与区分包含dmr(例如dmr1-400(来自表1和表4))的至少一种标记物内的甲基化和非甲基化cpg二核苷酸的至少一种试剂或一系列试剂接触,以及2)将hcc归类(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。优选地,灵敏度为约70%至约100%,或约80%至约90%,或约80%至约85%。优选地,特异性为约70%至约100%,或约80%至约90%,或约80%至约85%。可通过任何手段来分离基因组dna,包括使用可商购获得的试剂盒。简言之,在所关注的dna由细胞膜封装的情况下,必须通过酶、化学或机械手段破碎和溶解生物样品。然后可例如通过用蛋白酶k消化来从dna溶液中清除蛋白质和其他污染物。然后从溶液中回收基因组dna。这可借助于多种方法来进行,包括盐析、有机萃取或使dna与固相载体结合。方法的选择将受若干因素影响,包括时间、费用以及所需dna数量。包含赘生物质或赘生前物质的所有临床样品类型均适用于本发明方法,例如细胞系、组织学切片、活体组织切片、石蜡包埋的组织、体液、粪便、结肠流出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞以及其组合。所述技术在用于制备样品并提供用于测试的核酸的方法方面不受限制。举例来说,在一些实施方案中,使用例如如美国专利申请序列号61/485386中详述的直接基因捕获或通过相关方法从粪便样品或从血液或从血浆样品中分离dna。然后用区分含有dmr(例如dmr1-400,例如如由表1和表4所提供)的至少一种标记物中的甲基化和非甲基化cpg二核苷酸的至少一种试剂或一系列试剂处理基因组dna样品。在一些实施方案中,试剂将在5′-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或就杂交行为来说与胞嘧啶不相似的另一碱基。然而,在一些实施方案中,试剂可为甲基化敏感性限制酶。在一些实施方案中,以如下方式处理基因组dna样品,所述方式使得在5′位置处未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或就杂交行为来说与胞嘧啶不相似的另一碱基。在一些实施方案中,用硫酸氢盐(亚硫酸氢盐、二亚硫酸盐)进行此处理,随后进行碱水解。然后,分析所处理的核酸以测定靶基因序列(来自包含dmr(例如选自例如如表1和表4中所提供的dmr1-400的至少一个dmr)的标记物的至少一个基因、基因组序列或核苷酸)的甲基化状态。分析方法可选自本领域已知的那些分析方法,包括本文列举的那些分析方法,例如如本文所描述的quarts和msp。所述技术涉及分析与hcc相关的任何样品。举例来说,在一些实施方案中,样品包括来自患者的血浆样品。在一些实施方案中,样品包括从患者获得的组织和/或生物流体。在一些实施方案中,样品包括肝组织。在一些实施方案中,样品包括分泌物。在一些实施方案中,样品包括血液、血浆和/或血清。在一些实施方案中,受试者为人。这些样品可来源于上部胃肠道、下部胃肠道或包括来自上部胃肠道与下部胃肠道两者的细胞、组织和/或分泌物。样品可包括来自肝脏、胆管、胰腺、胃、结肠、直肠、食管、小肠、阑尾、十二指肠、息肉、胆囊、肛门和/或腹膜的细胞、分泌物或组织。在一些实施方案中,样品包括细胞液、腹水、尿液、粪便、胰液、内窥镜检查期间获得的流体、血液、粘液或唾液。在一些实施方案中,样品为粪便样品。可通过本领域已知的诸如将对熟练人员来说显而易见的许多手段来获得此类样品。举例来说,尿液和粪便样品为可容易得到的,而血液、腹水、血清或胰液样品可通过使用例如针头和注射器经肠胃外获得。无细胞或基本上无细胞的样品可通过使样品经受本领域技术人员已知的包括但不限于离心和过滤的各种技术来获得。虽然通常优选的是不使用侵入性技术来获得样品,但获得诸如组织匀浆、组织切片以及活体组织切片试样等样品仍可能为优选的。在所述技术的一些实施方案中,提供一种诊断受试者中的hcc的方法。如本文所用的术语“诊断(diagnosing/diagnosis)”是指使得熟练技工可估计并且甚至确定受试者是否罹患给定疾病或疾患或将来可能发展给定疾病或疾患的方法。熟练技工常常基于一种或多种诊断指示物作出诊断,诸如生物标记物(例如如本文所公开的dmr),其甲基化状态指示疾患的存在、严重程度或不存在。与诊断一起,临床癌症预后(例如对于hcc)涉及确定癌症的侵入性和肿瘤复发的可能性以计划出最有效的疗法。如果可作出更准确的预后或甚至可评估发展癌症的潜在危险,则可选择对于患者适当的疗法以及在一些情况下较不苛刻的疗法。评估癌症生物标记物(例如测定其甲基化状态)适用于将具有良好预后和/或低癌症发展危险的将不需要治疗或需要有限治疗的受试者与较可能发展癌症或经历癌症复发的可受益于更深入的治疗的受试者分开。因此,如本文所用,“作出诊断”或“诊断”还包括确定发展癌症的危险或确定预后,这些可基于对本文所公开的诊断性生物标记物(例如dmr)的测量提供以下各项:预测临床结果(在存在或不存在医学治疗的情况下)、选择适当治疗(或是否治疗将有效)或监测当前的治疗并潜在地改变所述治疗。另外,在目前所公开的主题的一些实施方案中,可随时间推移进行生物标记物的多次测定以有助于诊断和/或预后。生物标记物的时间变化可用于预测临床结果、监测hcc的进展和/或监测针对癌症的适当疗法的效力。在此类实施方案中,举例来说,在有效治疗的过程中,预期可观察到生物样品中本文所公开的一种或多种生物标记物(例如dmr)(以及潜在的一种或多种额外生物标记物(如果监测的话))的甲基化状态随时间的变化。在一些实施方案中,目前所公开的主题还提供一种确定是否开始或继续对受试者中的hcc的预防或治疗的方法。在一些实施方案中,所述方法包括在一段时间内从受试者提供一系列生物样品;分析这一系列生物样品以测定各个生物样品中的本文所公开的至少一种生物标记物的甲基化状态;以及比较各个生物样品中一种或多种生物标记物的甲基化状态的任何可测量的变化。生物标记物在这段时间内的甲基化状态的任何变化均可用于预测发展hcc的危险,预测临床结果,确定是否开始或继续对癌症的预防或治疗以及当前治疗是否有效治疗hcc。举例来说,可将第一时间点选择为在开始治疗之前,并且可将第二时间点选择为在开始治疗之后的一些时间。可在从不同时间点取得的各个样品中测量甲基化状态,并且记录定性和/或定量差异。可将来自不同样品的生物标记物水平的甲基化状态的变化与受试者中的病症的危险(例如hcc的危险)、预后、确定治疗效力和/或进展相关联。在优选实施方案中,本发明的方法和组合物是用于在早期阶段(例如在疾病症状出现之前)治疗或诊断疾病。在一些实施方案中,本发明的方法和组合物是用于在临床阶段治疗或诊断疾病。如所提到,在一些实施方案中,可进行一种或多种诊断或预后性生物标记物的多次测定,并且可使用标记物的时间变化来确定诊断或预后。举例来说,可在起始时间测定诊断性标记物,并且在第二时间再次测定。在此类实施方案中,从起始时间到第二时间标记物增加可诊断病症的特定类型或严重程度,或给定预后。同样地,从初始时间到第二时间标记物减少可指示病症的特定类型或严重程度,或给定预后。此外,一种或多种标记物的变化程度可与病症的严重程度和将来的有害事件有关。熟练技工将了解,虽然在某些实施方案中,比较测量可由多个时间点的同一生物标记物构成,但也可在一个时间点测量给定生物标记物,并且在第二时间点测量第二生物标记物,并且这些标记物的比较可提供诊断信息。如本文所用,短语“确定预后”是指使得熟练技工可预测受试者中的疾患的过程或结果的方法。术语“预后”不是指以100%准确性预测疾患的过程或结果的能力,或者甚至基于生物标记物(例如dmr)的甲基化状态可预测给定过程或结果或多或少可能发生。事实上,熟练技工将了解,术语“预后”是指某过程或结果将发生的可能性增加;换句话说,当与未展现给定疾患的个体相比时,在展现所述疾患的受试者中过程或结果更可能发生。举例来说,在未展现疾患(例如具有一种或多种dmr的正常甲基化状态)的个体中,给定结果的可能性可能非常低。在一些实施方案中,统计分析将预后指示物与有害结果的倾向相关联。举例来说,在一些实施方案中,与从未患病症的患者获得的正常对照样品中的甲基化状态不同的甲基化状态可表明,如通过统计显著性水平所确定,受试者同具有与对照样品中的甲基化状态更类似的水平的受试者相比更可能罹患病症。另外,甲基化状态相较于基线(例如“正常”)水平的变化可反映受试者的预后,并且甲基化状态的变化程度可与有害事件的严重程度相关。常常通过比较两个或更多个群体并且确定置信区间和/或p值来确定统计显著性(参见例如dowdy和wearden,statisticsforresearch,johnwiley&sons,newyork,1983)。本发明主题的示例性置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%以及99.99%,而示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001以及0.0001。在其他实施方案中,可建立本文所公开的预后或诊断性生物标记物(例如dmr)的甲基化状态的阈值变化程度,并且将生物样品中生物标记物的甲基化状态的变化程度与甲基化状态的阈值变化程度进行简单比较。本文提供的生物标记物的甲基化状态的优选阈值变化为约5%、约10%、约15%、约20%、约25%、约30%、约50%、约75%、约100%以及约150%。在其他实施方案中,可建立“列线图(nomogram)”,根据“列线图”,预后或诊断性指示物(生物标记物或生物标记物的组合)的甲基化状态与给定结果的相关倾向直接相关。熟练技工熟悉使用此类列线图来使两个数值相关联,并且了解此测量的不确定性与标记物浓度的不确定性相同,因为提到了个别样品测量,而不是群体平均值。在一些实施方案中,同时分析了对照样品与生物样品,使得可将从生物样品获得的结果与从对照样品获得的结果相比较。另外,预期可提供标准曲线,使用所述标准曲线可将生物样品的分析结果进行比较。如果使用荧光标记,则此类标准曲线呈现作为分析单位(例如荧光信号强度)的函数的生物标记物的甲基化状态。使用从多个供体获取的样品,可提供针对正常组织中一种或多种生物标记物的对照甲基化状态以及针对从具有化生的供体或从具有病症(例如hcc)的供体取得的组织中一种或多种生物标记物的“处于危险中”的水平的标准曲线。在所述方法的某些实施方案中,在确定从受试者获得的生物样品中的本文所提供的一种或多种dmr的异常甲基化状态后将受试者鉴定为患有hcc。在所述方法的其他实施方案中,从受试者获得的生物样品中此类生物标记物中的一者或多者的异常甲基化状态的检测使得受试者被鉴定为患有hcc。可在一个测试样品内与额外标记物分开或同时进行标记物分析。举例来说,可将若干标记物组合在一个测试中用于有效处理多个样品并且潜在地提供更大的诊断和/或预后准确性。此外,本领域技术人员将认可测试来自相同受试者的多个样品(例如在连续时间点)的价值。系列样品的此类测试可允许鉴定标记物甲基化状态随时间的变化。甲基化状态的变化以及不存在甲基化状态的变化可提供关于疾病状况的有用信息,包括但不限于确定距离事件开始的大致时间、可救治组织的存在和量、药物疗法的适当性、各种疗法的有效性以及鉴定受试者的结果,包括将来事件的危险。可以多种物理形式进行生物标记物的分析。举例来说,可使用微量滴定板或自动化来促进大量测试样品的处理。或者,可研发单一样品形式,以便于及时地进行立即治疗和诊断,例如在非卧床运输或急诊室环境中。在一些实施方案中,如果当与对照甲基化状态相比时,样品中至少一种生物标记物的甲基化状态存在可测量的差异,则将受试者诊断为患有hcc。相反地,当在生物样品中确定甲基化状态没有变化时,可将受试者鉴定为未患hcc,不处于hcc危险之中,或具有低hcc危险。在此方面,可将患有hcc或具有hcc危险的受试者与具有低hcc或hcc危险至基本上没有hcc或hcc危险的受试者区分开。可将具有发展hcc的危险的那些受试者放置于更深入和/或定期的筛查时间表中。如上文所提到,根据本发明技术的方法的实施方案,检测一种或多种生物标记物的甲基化状态的变化可为定性测定,或可为定量测定。因此,将受试者诊断为患有hcc或处于发展hcc的危险中的步骤指示进行某些阈值测量,例如生物样品中一种或多种生物标记物的甲基化状态与预定对照甲基化状态不同。在所述方法的一些实施方案中,对照甲基化状态为生物标记物的任何可检测的甲基化状态。在将对照样品与生物样品同时测试的方法的其他实施方案中,预定甲基化状态为对照样品中的甲基化状态。在所述方法的其他实施方案中,预定甲基化状态是基于标准曲线和/或通过标准曲线来确定。在所述方法的其他实施方案中,预定甲基化状态为特定状态或状态范围。因此,可部分基于所实践方法的实施方案和所需特异性等,在本领域技术人员将显而易见的可接受限值内选择预定甲基化状态。此外,关于诊断方法,优选受试者为脊椎动物受试者。优选脊椎动物为温血脊椎动物;优选温血脊椎动物为哺乳动物。优选哺乳动物最优选为人。如本文所用,术语“受试者”包括人与动物受试者两者。因此,本文提供了兽医学治疗用途。因此,本发明技术提供了对诸如人以及以下动物等哺乳动物的诊断:因濒危而具有重大意义的那些哺乳动物,诸如西伯利亚虎(siberiantiger);具有经济意义的动物,诸如农场上饲养以供人消耗的动物;和/或对人具有社会意义的动物,诸如作为宠物或在动物园中饲养的动物。此类动物的实例包括但不限于:食肉动物,诸如猫和狗;猪类,包括猪、阉猪以及野猪;反刍动物和/或有蹄动物,诸如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛以及骆驼;以及马。因此,还提供了对牲畜,包括但不限于驯养的猪、反刍动物、有蹄动物、马(包括赛马)等的诊断和治疗。目前公开的主题还包括用于诊断受试者中的hcc的系统。所述系统可例如作为商业试剂盒提供,所述商业试剂盒可用于筛查已收集生物样品的受试者中的此类病症的危险。根据本发明技术提供的示例性系统包括评估如表1和/或表4中所提供的dmr的甲基化状态。实施例实施例i.此实施例描述用于辩别hccdna样品与衍生自正常对照(例如患有或未患肝硬化的非hcc个体)的dna的311个差异甲基化区(dmr)的鉴定。以四个阶段进行实验。第一,使用rrbs对从冷冻肿瘤hcc组织(具有和不具有肝硬化)以及从冷冻正常肝组织(具有和不具有肝硬化)以及来自健康志愿者的血沉棕黄层样品提取的dna进行dna甲基化标记物发现。通过严格过滤准则鉴定辨别性差异甲基化区(dmr)并且使用实时甲基化特异性定量pcr分析(qmsp)再次对相同或扩展的试样进行分析以确保结果的再现性(技术验证)。第二,通过用于生物验证的进一步排列准则通过对从独立档案病例和对照组织提取的dna进行设盲qmsp分析来选择候选标记物。第三,在pan-girrbs测序集合中比较候选标记物的测序结果以确定甲基化特异性的水平。第四,应用单独的决策模型来选择将在大部分dna来自非肝脏来源的基于血液的环境中表现最佳的小的hcc标记物集合。然后,在设盲独立血浆样品中测试所选标记物以评估临床介质中的hcc检测。图1汇总了这四个阶段。结果对从18个hcc和35个对照(9个肝硬化、26个正常肝脏)组织提取的dna进行无偏差全甲基化组测序。通过组织验证,使用甲基化特异性pcr在从来自75个hcc和29个对照(16个肝硬化、13个正常肝脏)的独立组织提取的dna中确认了的最佳dmr。然后,对来自独立患者集合的血浆dna进行靶向最优dmr的设盲定量等位基因特异性实时靶标和信号放大分析,所述独立患者集合包含21个hcc病例(9个bclc[巴塞罗那诊所肝癌分期(barcelonacliniclivercancerstaging)]阶段a、6个阶段b、6个阶段c)以及33个肝硬化对照。使用递归分割决策分析来鉴定最佳dmr组合。初始测序鉴定出311个auc大于0.75的dmr。在生物验证之后,选择最优的12个dmr(acp1、bdh1、chr12.133、clec11a、dab2ip、dbnl、emx1、efnb2、hoxa1、lrrc4、spint2、tspyl5、ccnj_3707、ccnj_3124、pfkp、scrn1以及ece1)来进行血浆测试。单独的在血浆中最具辨别力的标记物emx1具有0.89的auc。互补3-标记物组合(emx1、lrrc4以及bdh1)在血浆中鉴定出20/21个hcc和32/33个对照;1个hcc具有低水平的bdh1,并且1个对照具有升高的lrrc4。对于hcc在97%特异性(95%ci,82%-100%)下该组为95%敏感的(95%ci,74%-100%)并且实现0.98的auc(参见图2)。图3a至图3i提供了生物组织验证阶段的acp1、chr12.133、clec11a、dab2ip、dbnl、emx1、hoxa1、lrrc4、spint2以及tspyl5的接受者操作特征曲线下面积信息。图4a至图4cc提供了来自生物组织验证数据的27种胃癌标记物(在增加的拟合点分析情况下为29种)的箱线图(对数刻度)。将正常肝脏情况下的样品安排在最左侧,随后为不具有肝硬化的hcc、具有肝硬化的hcc以及肝硬化对照(炎性)。竖直轴为分数甲基化(针对β-肌动蛋白链归一化)。图5示出了在95%正常特异性下呈基质形式的于75个hcc组织样品和29个对照(16个肝硬化、13个正常肝脏)中的27种hcc癌症标记物的性能。标记物竖直列出,而样品水平列出。将正常肝脏(ni)情况下的样品安排在最左侧,随后为不具有肝硬化的hcc(hn)、具有肝硬化的hcc(hc)以及肝硬化对照(in)。阳性命中呈浅灰色,而丢失呈深灰色。此曲线允许以互补方式评估标记物。注意:基于qmsp数据使用拟合点法第二次分析2种标记物tbx15和egr2并且包括在本文中。表1提供区别hcc与正常对照的dmr的信息。表2提供用于来自表1的所选dmr的引物信息。表3提供在hcc与正常肝脏之间进行比较时特定dmr的auc和倍数变化信息,其中倍数变化为病例的分数甲基化相较于对照的分数甲基化的比率。表1.表2.表3.此类实验另外鉴定出89个肝脏上皮dmr,这89个肝脏上皮dmr在肝脏(癌症和正常)中为甲基化的,但在正常白细胞dna样品中不为甲基化的。表4提供在肝脏(癌症和正常)中为甲基化的但在正常白细胞dna样品中不为甲基化的肝脏上皮dmr的信息。表4.研究受试者和样品研究由梅奥诊所学会的审查委员会(mayoclinicinstitutionalreviewboard,rochester,mn)批准。新鲜冷冻(ff)组织、血浆以及血沉棕黄层样品由irb-批准的患者生物库提供。由专家gi病理学家再次审查肿瘤组织切片以确认诊断和估计赘生细胞性。然后,宏观解剖(macro-dissect)切片。将基因组dna使用qiaamp微型试剂盒(qiagen,valenciaca)纯化并且随后用ampurexp试剂盒(beckmancoulter,breaca)再纯化。简化表示重亚硫酸盐测序文库的制备使用先前公布的方法的改良型式制备测序文库。用10u的mspi将基因组dna(300ng)消化过夜。除非另外指明,否则用于此步骤和后续步骤的所有酶由newenglandbiolabs(neb)提供。对片段进行末端修复并且用5u的克列诺片段(klenowfragment)(3'-5'exo-)加a-尾,并且连结至含有条形码序列的truseq衔接子(illumina)过夜并且将胞嘧啶普遍甲基化。使用sybrgreenqpcr(lightcycler480-roche)来计量连结效率和片段质量。将样品用重亚硫酸盐处理并使用改良的epitect方案(qiagen)纯化(两次),然后进行最终ampurexp清除。使用qpcr来测定文库富集的最佳pcr循环。使用以下条件来进行富集pcr:每50ul反应物含有5ul的10x缓冲液、1.25ul的10mm每种脱氧核苷三磷酸(dntp)、5ul引物混合物(约5um)、15ul样品、1ulpfuturbocx热启动酶(hotstart)以及22.75μl水;温度和时间分别为95c-5分种;98c-30秒;12至16个循环的98c-10秒,65c-30秒,72c-30秒,72c-5分种以及4c保持。通过picogreen分析(molecularprobes)定量样品,组合至随机化4-丛(plex)文库中,并且用生物分析仪2100(agilent)测试以进行大小验证。在根据经验确定的缓冲液浓度下再进行多轮ampurexp纯化/大小选择以使衔接子二聚体污染最小化并且除去大于350bp的插入物。使用phix对照标准物(illumina)和衔接子特异性引物通过qpcr实现最终文库评估。大规模平行测序和生物信息学根据随机化泳道分配将样品加载至流动池上,保留额外的通道用于内部分析对照。由下一代测序中心(nextgenerationsequencingcore)在梅奥诊所医学基因组研究中心(mayoclinicmedicalgenomefacility)在illuminahiseq2000上进行测序。101次循环的读段是单向的。每个流动池泳道产生1亿-1.2亿个读段,这对于所比对序列的30-50倍测序深度的中值覆盖度为足够的。标准illumina流水线软件访问碱基并以fastq格式产生读段。使用saap-rrbs(简化表示重亚硫酸盐测序的简单化分析和注释流水线)进行序列读段评估和清除、与参考基因组的比对、甲基化状况提取以及cpg报告和注释。排除覆盖度低(≤10)的cpg。三级分析由以下步骤组成:除去不提供信息的或样品覆盖度低的cpg,以及鉴定具有低背景的甲基化cpg区域以及滑动的100bp窗内的致密簇。读段深度准则是基于检测病例与对照之间的甲基化%的10%差异所需的统计功效。基于读段计数,通过每个dmr的甲基化百分比的罗吉斯回归(logisticregression)来确定统计显著性。为解释个别受试者间变化的读段深度,使用过度离散的罗吉斯回归模型,其中离散参数是使用拟合模型的残差的皮尔森卡方统计(pearsonchi-squarestatistic)来估计。如果对照组中的甲基化%≤1%并且癌症中的甲基化%≥10%,则进一步考虑根据显著性水平排序的dmr。在大多数器官位点,这产生数百个潜在候选物。所利用的额外的过滤器为接受者操作特征曲线下面积、信号与背景甲基化%比率(倍数变化)以及样品间dmr中的cpg的共甲基化呈阳性(以及其在对照中的缺乏)。技术和生物组织验证对来自肝脏发现数据集的如通过上文所列的准则所确定最有前途的dmr中的30个展开甲基化特异性pcr(msp)标记物分析。通过软件(methprimer-universityofcalifornia,sanfranciscoca;mspprimer-johnshopkinsuniversity,baltimore,md)或人工设计引物。对分析进行严格测试并且通过对重亚硫酸盐转化(甲基化和未甲基化基因组dna)、未转化以及非模板对照进行sybrgreenqpcr加以优化。将与阴性对照交叉反应的分析重新设计或弃去。此外,进行熔解曲线分析以确保发生特异性扩增。对于技术验证阶段,通过qmsp对用于rrbs发现的相同样品再次进行测试。将设计成甲基化设盲的β-肌动蛋白分析用作表示总dna拷贝的分母。通过罗吉斯回归对数据进行分析并且将auc和信号与背景结果与发现值相比较。略少于一半的标记物表现不佳并且将其去除。通过对扩展的104个独立组织样品的集合进行qmsp来测试其余标记物(n=16)。此外,实验包括11种如下甲基化癌症标记物,这些甲基化癌症标记物是在对其他gi癌症(结肠、食管、胰腺、胆管)的早期测序研究中鉴定并验证的并且为强的多器官癌症标记物。结果度量为auc和倍数变化比率(表3)。图4和图5中分别描绘了所分析的标记物的箱线图和互补矩阵。跨器官验证为评估最佳甲基化标记物在肝脏外部表现如何,实验使用在hcc样品以及早期测序的其他主要gi癌症(结肠、胰腺、食管以及胃)中验证dmr的测序读段构建了比较cpg甲基化%矩阵。选择最后一组标记物基于以下各项在血浆中进行测试:1)生物组织验证阶段中的总体表现,以及2)在其他癌症中标记物的位点特异性特征。为最好地检测血液中的hcc,鉴于非hccdna过量,选择将展现普遍与肝脏特异性癌症信号两者的稳健的12标记物组。所述标记物中有10种来自组织验证;在不经后续组织验证的情况下由rrbs数据直接设计展现非凡肝脏位点特异性的2种额外标记物efnb2和bdh1并加以利用。血浆验证通过在exactsciences开发的自动二氧化硅珠粒法从2ml级分提取血浆dna。然后,使用下文概述的专有方法将dna用重亚硫酸盐转化并纯化。15ul0.36%bsa270ul的样品35ul1.6nnaoh4在42℃下孵育(变性)20分钟5冷却8分钟6添加120ul的重亚硫酸铵7在65℃下孵育(转化)75分钟(振荡3分钟)8添加750ul的7mguhcl9添加50ul结合珠粒10在30℃下在振荡的同时孵育30分钟11结合珠粒12将上清液吸至废弃物中13添加1000ul80%etoh14在30℃下在振荡的同时孵育3分钟15结合珠粒16将上清液吸至废弃物中17分配200ul脱磺酸溶液18在30℃下在振荡的同时孵育7分钟19结合珠粒20将上清液吸至废弃物中21添加250ul80%etoh22在30℃下在振荡的同时孵育3分钟23结合珠粒24将上清液吸至废弃物中25在70℃下在振荡的同时将珠粒干燥15分钟26添加80ul的te缓冲液(1mmtris0.1mmedta)27在振荡的同时65℃孵育25分钟28结合珠粒并将含有dna的上清液转移至清洁的管子中29储存在-20℃下直至使用。在实时pcr仪器(rochelc480)上以quarts格式运行样品(参见美国专利号8,361,720),使用由dmr序列产生的引物和探针(参见表2)、gotaqdna聚合酶(promega)、裂解酶ii(hologic)以及含有fam、hex以及quasar670染料的荧光共振能量转移报告盒(fret)(biosearchtechnologies)。图6提供通过quarts(定量等位基因特异性实时靶标和信号放大)分析检测甲基化dna印迹时所用的fret盒的寡核苷酸序列。每个fret序列包括荧光团和淬灭剂,它们可一起复用至3个单独的分析中。从genscript获得含有所关注的标记物序列的质粒并且在1xquarts试剂中稀释至每15ul反应物1个拷贝的标称浓度。将反应混合物分配至384个孔的每个孔中,在lightcycler上循环进行45个循环,并且收集数据。给予各孔含有或不含样品的称号。将泊松随机变量(poissonrandomvariable)设定为1并且通过尝试错误法输入平均成功率值并且用于计算所述值的累积概率。当累积概率等于具有信号的孔的百分比时,就找到了正确平均成功率,在此情况下为拷贝数。将这些质粒稀释并用作分析标准物。通过首先形成用引物对多达12个靶标进行经历11个扩增循环的预扩增的样品板来进行quarts-x(参见美国临时专利号62/249,097)。然后将此产物1:9稀释并用作在三重反应中仅含有三个靶标的后续quarts反应的模板。用于计算链计数的标准物不进行预扩增。通过对样品进行预扩增但不对标准物进行预扩增,分析的灵敏度增加。通过回归分割(rpart)对结果进行分析。使用罗吉斯回归将多个甲基化标记物组合至单一危险得分中为标准技术。然而,难以发现罗吉斯模型内标记物之间的高阶相互作用和/或将其模型化。当存在此类效应时,这限制了我们的标记物组的预测能力。回归分割树(rpart)为能够以使得标记物组的预测准确性最大化的方式发现标记物之间的高阶相互作用的决策树方法。使用rpart,最优的3标记物组合(emx1、bdh1、lrrc4)的hcc血液样品的灵敏度和特异性分别为97%和95%(图7a)将三种替代标记物组合模型化:替代#1(emx1、dab2ip、tspyl5):特异性=100%,灵敏度=90%(图7b)替代#2(emx1、hoxa1、acp1):特异性=88%,灵敏度=100%(图7c)替代#3(emx1、efnb2、spint2):特异性=100%,灵敏度=90%(图7d)在血浆中表现最佳的单一标记物emx1在100%特异性下具有0.89的auc以及77%的灵敏度。emx1的信号随着阶段增加显示更高的β肌动蛋白归一化信号(图8)。实施例ii.在实时pcr仪器(rochelc480)上以quarts格式运行组织样品(75个hcc、20个肝硬化以及30个正常)(参见美国专利号8,361,720),使用由dmr序列产生的引物和探针(参见表5)、gotaqdna聚合酶(promega)、裂解酶2.0(hologic)以及含有fam、hex以及quasar670染料的荧光共振能量转移报告盒(fret)(biosearchtechnologies)。表6示出了每种标记物以100%灵敏度辩别hcc与肝硬化和正常样品的能力。表5.表6.实施例iii.此实施例的主要目的是确定预测肝细胞癌(hcc)的标记物组。将来自244个受试者(95个肝细胞癌和149个对照)的血浆调节至2ml并提取。149个对照由51个肝硬化患者和98个正常患者组成。图9展示了此分析中所考虑的甲基化标记物中的每一者的相对重要性。整个标记物组的灵敏度和特异性的交叉验证估计值分别为75%和96%。在对照相较于正常患者的88.6%的特异性下,以下标记物组(chr12.133、clec11a、emx1、hoxa1、ccnj_3707)对于hcc产生85.3%的灵敏度(表7)。表7.相同组(chr12.133、clec11a、emx1、hoxa1、ccnj_3707)对于正常和肝硬化(对照组)患者(表8)产生以下特异性减低。表8.用于从4ml血浆样品分离dna的示例性程序将如下进行:·向2ml血浆样品中添加300μl的蛋白酶k(20mg/ml)并混合。当样品为小于2ml的血浆时,通过添加10mmtris-hcl、0.1mmedta溶液调节至2ml·将6ml的血浆溶解缓冲液1添加至血浆中并在室温下混合血浆溶解缓冲液为:-4.3m硫氰酸胍-10%igepalca-630(辛基苯氧基聚(亚乙基氧基)乙醇,分枝)(5.3gigepalca-630与45ml4.8m硫氰酸胍的组合)·添加200μl磁性二氧化硅结合珠粒[16μg珠粒/μl]并且再次混合。·将7ml的溶解缓冲液2添加至管中。通过混合60%溶解缓冲液1与40%异丙醇来制备血浆溶解缓冲液2。·将样品与溶解缓冲液2混合60分钟·将管放在磁体上并且让珠粒收集10分钟。吸出并弃去上清液。·将1000μl洗涤缓冲液(10mmtrishcl,80%etoh)添加至珠粒中,并且在振荡的同时在30℃下孵育3分钟。·将管放在磁体上并且让珠粒进行收集。吸出并弃去上清液。·将500μl洗涤缓冲液添加至珠粒中并且在振荡的同时在30℃下孵育3分钟。·将管放在磁体上并且让珠粒进行收集。吸出并弃去上清液。·添加250μl洗涤缓冲液并且在振荡的同时在30℃下孵育3分钟。·将管放在磁体上并且让珠粒进行收集。吸出并弃去剩余的缓冲液。·添加250μl洗涤缓冲液并且在振荡的同时在30℃下孵育3分钟。·将管放在磁体上并且让珠粒进行收集。吸出并弃去剩余的缓冲液。·在振荡的同时,将珠粒在70℃下干燥15分钟。·将125μl洗脱缓冲液(10mmtrishcl,ph8.0,0.1mmedta)添加至珠粒中并且在振荡的同时在65℃下孵育25分钟。·将管放在磁体上并且让珠粒收集10分钟。·吸出含有dna的上清液并转移至新的容器或管中。重亚硫酸盐转化i.使用亚硫酸氢铵使dna磺化1.在每个管中,将64μldna、7μl1nnaoh以及含有0.2mg/mlbsa和0.25mg/ml鱼dna的9μl载体溶液组合。2.在42℃下孵育20分钟。3.添加120μl的45%亚硫酸氢铵并且在66°下孵育75分钟。4.在4℃下孵育10分钟。ii.使用磁性珠粒进行脱磺酸材料磁性珠粒(promegamagnesil顺磁性粒子,promega目录编号as1050,16μg/μl)。结合缓冲液:6.5-7m盐酸胍。转化后洗涤缓冲液:80%乙醇加上10mmtrishcl(ph8.0)。脱磺酸缓冲液:对于脱磺酸缓冲液,选择70%异丙醇、0.1nnaoh。使用任何适当的装置或技术混合样品以在大体上如下文所描述的温度和混合速度下混合或孵育样品。举例来说,可使用恒温混匀仪(thermomixer)(eppendorf)来混合或孵育样品。示例性脱磺酸作用如下:1.将珠粒储备物通过涡流瓶充分混合1分钟。2.将50μl的珠粒等分至2.0ml管(例如来自usascientific)中。3.将750μl的结合缓冲液添加至珠粒中。4.添加150μl来自步骤1的磺化dna。5.混合(例如1000rpm,在30℃下30分钟)。6.将管放在磁体架上并且留在原地5分钟。使管在架子上,移出并弃去上清液。7.添加1,000μl的洗涤缓冲液。混合(例如1000rpm,在30℃下3分钟)。8.将管放在磁体架上并且留在原地5分钟。使管在架子上,移出并弃去上清液。9.添加250μl的洗涤缓冲液。混合(例如1000rpm,在30℃下3分钟)。10.将管放在磁性支架上;在1分钟后移出并弃去上清液。11.添加200μl的脱磺酸缓冲液。混合(例如1000rpm,在30℃下5分钟)。12.将管放在磁性支架上;在1分钟后移出并弃去上清液。13.添加250μl的洗涤缓冲液。混合(例如1000rpm,在30℃下3分钟)。14.将管放在磁性支架上;在1分钟后移出并弃去上清液。15.将250μl的洗涤缓冲液添加至管中。混合(例如1000rpm,在30℃下3分钟)。16.将管放在磁性支架上;在1分钟后移出并弃去上清液。17.打开盖子,将所有管在30℃下孵育15分钟。18.将管从磁性支架移去并且将70μl的洗脱缓冲液直接添加至珠粒中。19.在存在洗脱缓冲液的情况下孵育珠粒(例如1000rpm,在40℃下45分钟)。20.将管放在磁性支架上约一分钟;移去并保存上清液。然后将转化的dna用于预扩增和/或侧翼核酸内切酶分析。以上说明书中提到的所有出版物和专利出于所有目的以全文引用的方式并入本文中。在不背离如所描述的技术的范围和精神的情况下,对所描述的所述技术的组合物、方法以及用途的各种修改和变化对于本领域技术人员来说将为显而易见的。虽然已结合特定示例性实施方案描述了所述技术,但应了解如所要求的发明不应过度受限于此类特定实施方案。实际上,对所描述的用于执行本发明的模式的对药理学、生物化学、医学科学或相关领域的技术人员来说显而易见的各种修改意图在以下权利要求书的范围内。序列表<110>精密科学发展有限责任公司(exactsciencescorporation)梅约医学教育与研究基金会(mayofoundationformedicaleducationandresearch)<120>检测肝细胞癌<130>pn19005040p<150>us62/383,165<151>2016-09-02<160>104<170>patentin3.5版<210>1<211>17<212>dna<213>人工序列<220><223>合成的<400>1gcgcgggaggattttcg17<210>2<211>18<212>dna<213>人工序列<220><223>合成的<400>2ccgccaccataaacgacc18<210>3<211>21<212>dna<213>人工序列<220><223>合成的<400>3ccacggacgcgaaatcgaaat21<210>4<211>21<212>dna<213>人工序列<220><223>合成的<400>4cgttcgttacgtcgttttcgt21<210>5<211>17<212>dna<213>人工序列<220><223>合成的<400>5gatcgacgcgactcgac17<210>6<211>21<212>dna<213>人工序列<220><223>合成的<400>6ccacggacgctcgacgtcgcc21<210>7<211>17<212>dna<213>人工序列<220><223>合成的<400>7gcgggagtttggcgtag17<210>8<211>21<212>dna<213>人工序列<220><223>合成的<400>8cgcgcaaataccgaataaacg21<210>9<211>21<212>dna<213>人工序列<220><223>合成的<400>9ccacggacggtcggtagatcg21<210>10<211>18<212>dna<213>人工序列<220><223>合成的<400>10gcgcgttgtttcgtttcg18<210>11<211>20<212>dna<213>人工序列<220><223>合成的<400>11cgtcacctaccgcaaatacg20<210>12<211>21<212>dna<213>人工序列<220><223>合成的<400>12ccacggacggcggataaggag21<210>13<211>19<212>dna<213>人工序列<220><223>合成的<400>13agtacgtaagtagagcgcg19<210>14<211>22<212>dna<213>人工序列<220><223>合成的<400>14ctaaaattaactacgccgccgt22<210>15<211>21<212>dna<213>人工序列<220><223>合成的<400>15ccacggacggagaacgttcga21<210>16<211>21<212>dna<213>人工序列<220><223>合成的<400>16ggcgtcgcgttttttagagaa21<210>17<211>28<212>dna<213>人工序列<220><223>合成的<400>17ttccttttcgttcgtataaaatttcgtt28<210>18<211>21<212>dna<213>人工序列<220><223>合成的<400>18ccacggacgatcgggttttag21<210>19<211>17<212>dna<213>人工序列<220><223>合成的<400>19tgcgtatggtgggcgag17<210>20<211>26<212>dna<213>人工序列<220><223>合成的<400>20cctaatttacacgtcaaccaatcgaa26<210>21<211>21<212>dna<213>人工序列<220><223>合成的<400>21ccacggacggcgcgtgcgttt21<210>22<211>27<212>dna<213>人工序列<220><223>合成的<400>22tttgtttttttgattaggtgtttaaga27<210>23<211>21<212>dna<213>人工序列<220><223>合成的<400>23caccaacctcataaccttatc21<210>24<211>21<212>dna<213>人工序列<220><223>合成的<400>24gacgcggagatagtgttgtgg21<210>25<211>22<212>dna<213>人工序列<220><223>合成的<400>25gcgttttagttagatagggcgg22<210>26<211>20<212>dna<213>人工序列<220><223>合成的<400>26gaaaaccccttccccgaaac20<210>27<211>20<212>dna<213>人工序列<220><223>合成的<400>27cgccgaggcgcacgcctaaa20<210>28<211>26<212>dna<213>人工序列<220><223>合成的<400>28agtcgtttttttaggtagtttaggcg26<210>29<211>19<212>dna<213>人工序列<220><223>合成的<400>29cgacctttacaatcgccgc19<210>30<211>20<212>dna<213>人工序列<220><223>合成的<400>30cgccgaggggcggtagttgt20<210>31<211>16<212>dna<213>人工序列<220><223>合成的<400>31gggagcggtcgcgtag16<210>32<211>28<212>dna<213>人工序列<220><223>合成的<400>32gcacctaactaaacaaaacgaactaaac28<210>33<211>20<212>dna<213>人工序列<220><223>合成的<400>33cgccgaggcgcaaacgcaaa20<210>34<211>17<212>dna<213>人工序列<220><223>合成的<400>34aggtggcgcgtattacg17<210>35<211>20<212>dna<213>人工序列<220><223>合成的<400>35cctactaaacgcgctcaacc20<210>36<211>20<212>dna<213>人工序列<220><223>合成的<400>36cgccgaggcgctcgattccc20<210>37<211>19<212>dna<213>人工序列<220><223>合成的<400>37ttcgatattgggtgtcgcg19<210>38<211>21<212>dna<213>人工序列<220><223>合成的<400>38cgcgaaaaccaaaaacgaaac21<210>39<211>20<212>dna<213>人工序列<220><223>合成的<400>39cgccgagggaggcggggttc20<210>40<211>19<212>dna<213>人工序列<220><223>合成的<400>40gcgttaatttcgcgaggta19<210>41<211>28<212>dna<213>人工序列<220><223>合成的<400>41acaatactcttatatattaacgccgctc28<210>42<211>20<212>dna<213>人工序列<220><223>合成的<400>42cgccgaggaggcgacggagg20<210>43<211>19<212>dna<213>人工序列<220><223>合成的<400>43tttgtttcggtttttggcg19<210>44<211>21<212>dna<213>人工序列<220><223>合成的<400>44accataaacgaccgaaatcga21<210>45<211>21<212>dna<213>人工序列<220><223>合成的<400>45ccacggacggcgggaggattt21<210>46<211>21<212>dna<213>人工序列<220><223>合成的<400>46cgttcgttacgtcgttttcgt21<210>47<211>17<212>dna<213>人工序列<220><223>合成的<400>47gatcgacgcgactcgac17<210>48<211>21<212>dna<213>人工序列<220><223>合成的<400>48ccacggacgctcgacgtcgcc21<210>49<211>22<212>dna<213>人工序列<220><223>合成的<400>49gcgttttagttagatagggcgg22<210>50<211>20<212>dna<213>人工序列<220><223>合成的<400>50gaaaaccccttccccgaaac20<210>51<211>20<212>dna<213>人工序列<220><223>合成的<400>51cgccgaggcgcacgcctaaa20<210>52<211>17<212>dna<213>人工序列<220><223>合成的<400>52gcgggagtttggcgtag17<210>53<211>21<212>dna<213>人工序列<220><223>合成的<400>53cgcgcaaataccgaataaacg21<210>54<211>21<212>dna<213>人工序列<220><223>合成的<400>54ccacggacggtcggtagatcg21<210>55<211>16<212>dna<213>人工序列<220><223>合成的<400>55gggagcggtcgcgtag16<210>56<211>28<212>dna<213>人工序列<220><223>合成的<400>56gcacctaactaaacaaaacgaactaaac28<210>57<211>20<212>dna<213>人工序列<220><223>合成的<400>57cgccgaggcgcaaacgcaaa20<210>58<211>18<212>dna<213>人工序列<220><223>合成的<400>58gcgcgttgtttcgtttcg18<210>59<211>20<212>dna<213>人工序列<220><223>合成的<400>59cgtcacctaccgcaaatacg20<210>60<211>21<212>dna<213>人工序列<220><223>合成的<400>60ccacggacggcggataaggag21<210>61<211>19<212>dna<213>人工序列<220><223>合成的<400>61agtacgtaagtagagcgcg19<210>62<211>22<212>dna<213>人工序列<220><223>合成的<400>62ctaaaattaactacgccgccgt22<210>63<211>21<212>dna<213>人工序列<220><223>合成的<400>63ccacggacggagaacgttcga21<210>64<211>24<212>dna<213>人工序列<220><223>合成的<400>64cgttcgttcgttattttttttcga24<210>65<211>19<212>dna<213>人工序列<220><223>合成的<400>65gcccgcgaaaaccaaaaac19<210>66<211>20<212>dna<213>人工序列<220><223>合成的<400>66cgccgaggcgaaactcacct20<210>67<211>22<212>dna<213>人工序列<220><223>合成的<400>67gcgtttttttttagcggggtta22<210>68<211>21<212>dna<213>人工序列<220><223>合成的<400>68ccgaaactaaaattctcccgc21<210>69<211>20<212>dna<213>人工序列<220><223>合成的<400>69cgccgaggatgagcgtgtta20<210>70<211>19<212>dna<213>人工序列<220><223>合成的<400>70cggttttcgtttgggtacg19<210>71<211>17<212>dna<213>人工序列<220><223>合成的<400>71ccaacccaaaccacgcc17<210>72<211>21<212>dna<213>人工序列<220><223>合成的<400>72ccacggacgcgcgccgtacga21<210>73<211>16<212>dna<213>人工序列<220><223>合成的<400>73ggaggttggcggggag16<210>74<211>23<212>dna<213>人工序列<220><223>合成的<400>74catatactatcgccttccgactc23<210>75<211>20<212>dna<213>人工序列<220><223>合成的<400>75cgccgaggcgtaacaaaaac20<210>76<211>19<212>dna<213>人工序列<220><223>合成的<400>76tcgttttaggtgagtcgcg19<210>77<211>24<212>dna<213>人工序列<220><223>合成的<400>77aaataaaaccgccgaaaaaacaac24<210>78<211>21<212>dna<213>人工序列<220><223>合成的<400>78ccacggacgcgctacaaacgc21<210>79<211>17<212>dna<213>人工序列<220><223>合成的<400>79ggaggggtttcgttcgt17<210>80<211>29<212>dna<213>人工序列<220><223>合成的<400>80ctactatcgacgctaaaaataaaacgaac29<210>81<211>20<212>dna<213>人工序列<220><223>合成的<400>81cgccgaggcgcgacctaaaa20<210>82<211>17<212>dna<213>人工序列<220><223>合成的<400>82aggtggcgcgtattacg17<210>83<211>20<212>dna<213>人工序列<220><223>合成的<400>83cctactaaacgcgctcaacc20<210>84<211>20<212>dna<213>人工序列<220><223>合成的<400>84cgccgaggcgctcgattccc20<210>85<211>19<212>dna<213>人工序列<220><223>合成的<400>85gcgttaatttcgcgaggta19<210>86<211>28<212>dna<213>人工序列<220><223>合成的<400>86acaatactcttatatattaacgccgctc28<210>87<211>20<212>dna<213>人工序列<220><223>合成的<400>87cgccgaggaggcgacggagg20<210>88<211>26<212>dna<213>人工序列<220><223>合成的<400>88agtcgtttttttaggtagtttaggcg26<210>89<211>19<212>dna<213>人工序列<220><223>合成的<400>89cgacctttacaatcgccgc19<210>90<211>20<212>dna<213>人工序列<220><223>合成的<400>90cgccgaggggcggtagttgt20<210>91<211>21<212>dna<213>人工序列<220><223>合成的<400>91ggcgtcgcgttttttagagaa21<210>92<211>27<212>dna<213>人工序列<220><223>合成的<400>92ttccttttcgttcgtataaaatttcgt27<210>93<211>21<212>dna<213>人工序列<220><223>合成的<400>93ccacggacgatcgggttttag21<210>94<211>20<212>dna<213>人工序列<220><223>合成的<400>94cgccgaggatcgggttttag20<210>95<211>29<212>dna<213>人工序列<220><223>合成的<400>95agccggttttccggctgagactccgcgtc29<210>96<211>32<212>dna<213>人工序列<220><223>合成的<220><221>混杂特征<222>(3)..(3)<223>用淬灭剂修饰的<400>96tctagccggttttccggctgagactccgcgtc32<210>97<211>29<212>dna<213>人工序列<220><223>合成的<400>97agccggttttccggctgagacgtccgtgg29<210>98<211>31<212>dna<213>人工序列<220><223>合成的<220><221>混杂特征<222>(3)..(3)<223>用淬灭剂修饰的<400>98tctagccgttttccggctgagacgtccgtgg31<210>99<211>28<212>dna<213>人工序列<220><223>合成的<400>99agccggttttccggctgagacctcggcg28<210>100<211>31<212>dna<213>人工序列<220><223>合成的<220><221>混杂特征<222>(3)..(3)<223>用淬灭剂修饰的<400>100tctagccggttttccggctgagacctcggcg31<210>101<211>8<212>dna<213>人工序列<220><223>合成的<400>101cgccgagg8<210>102<211>9<212>dna<213>人工序列<220><223>合成的<400>102gacgcggag9<210>103<211>9<212>dna<213>人工序列<220><223>合成的<400>103ccacggacg9<210>104<211>8<212>dna<213>人工序列<220><223>合成的<400>104gcgcgtcc8当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1