检测胰腺高度异型增生的制作方法

文档序号:16514684发布日期:2019-01-05 09:33阅读:495来源:国知局
检测胰腺高度异型增生的制作方法
本文提供了用于筛查胰腺高度异型增生的技术,并特别地但不仅限于用于检测胰腺高度异型增生(胰腺导管内乳头状黏液性肿瘤高度异型增生(ipmn-hgd)、胰腺上皮内瘤变3(panin-3)或胰腺导管腺癌(pdac))的存在的方法、组合物和相关用途。
背景技术
:尽管医学不断进步,但胰腺癌仍然是最致命的疾病之一。据估计,2011年在美国有44,030人被诊断出患有胰腺癌,其中大约37,660人死亡。胰腺癌是美国男性(仅次于肺癌、前列腺癌和结直肠癌)和女性(仅次于肺癌、乳腺癌和结直肠癌)中第四最常见的癌症相关的死亡原因。发病高峰出现在生命的第7个和第8个十年,男性和女性二者的发病率几乎相同。自2003年以来,在美国肺癌、结直肠癌、乳腺癌和前列腺癌的死亡率已经有所下降,但胰腺癌的死亡率却在同期上升了。2011年全球发达国家中的胰腺癌新病例估计为84,200例(男性)和80,900例(女性),而死亡估计为82,700例(男性)和79,100例(女性)。不幸的是,大多数有症状的患者是无法治愈的。胰腺癌患者的预后非常差,对于所有期的总和有6%的5年相对存活率。这是由于该疾病在诊断时已经为晚期。非常需要早期检测胰腺癌以提高这些患者的存活率。技术实现要素:胰腺癌是目前美国第4最常见的癌症死亡原因(参见,siegel,r.,等人,cacancerjclin,2014.64(1):p.9-29),是所有癌症中最致命的,总体5年存活率在5%以下(参见,wolfgang,c.l.,等人,ca:acancerjournalforclinicians,2013.63(5):p.318-48)。每年,诊断出胰腺癌的人数几乎等于该疾病的死亡人数。尽管努力改善疗法,但这一令人沮丧的结果在过去的30年里并没有改变(参见,wolfgang,c.l.,等人,ca:acancerjournalforclinicians,2013.63(5):p.318-48)。令人严重担忧的是,胰腺癌正在增多。预计到2030年,胰腺癌将成为美国第2最常见的癌症死亡原因(参见,rahib,l.,等人,cancerresearch,2014.74(14):p.4006)。在世界其他地区,胰腺癌是仅有的前景日趋严峻的癌症之一,而其他常见癌症(例如,乳腺癌、结肠癌和前列腺癌)的发病率和死亡率呈下降趋势(参见,malvezzi,m.,等人,annalsofoncology:officialjournaloftheeuropeansocietyformedicaloncology/esmo,2014)。因为没有有效的或广泛使用的筛查工具,所以胰腺癌通常是在症状出现后且在晚期才被诊断出来。目前,85%的病例呈现具有转移性疾病,且通常在确诊后存活<6个月(参见,wolfgang,c.l.,等人,ca:acancerjournalforclinicians,2013.63(5):p.318-48)。对于少数症状上没有呈现出明显的局部晚期疾病或远处转移并继续切除的患者,总体5年存活率低于20%(参见,wolfgang,c.l.,等人,ca:acancerjournalforclinicians,2013.63(5):p.318-48)。令人鼓舞的是,一小部分发现为最早期肿瘤的病例有最好的预后,对于病灶<2cm的5年存活率为30-60%,以及对于病灶<1cm的5年存活率超过75%(参见,sohn,t.,等人,journalofgastrointestinalsurgery:officialjournalofthesocietyforsurgeryofthealimentarytract,2000.4(6):p.567-579;furukawa,h.,等人,cancer,1996.78(5):p.986-990;shimizu,y.,等人,journalofgastroenterologyandhepatology,2005.20(10):p.1591-1594;ishikawa,o.,等人,hepato-gastroenterology,1999.46(25):p.8-15;tsuchiya,r.,等人,annalsofsurgery,1986.203(1):p.77-81)。此外,基于少量病例记录,无症状的人中偶然发现的早期胰腺癌似乎有高存活率并可以根治性切除(参见,yeo,c.j.和j.l.cameron,langenbeck'sarchivesofsurgery/deutschegesellschaftfurchirurgie,1998.383(2):p.129-33;okano,k.和y.suzuki,worldjournalofgastroenterology:wjg,2014.20(32):p.11230-11240)。因此,有确凿的证据表明最早期胰腺癌的症状前检测可以导致高治愈率,这显著强调了对有效筛查工具的需要。散发性形式的胰腺癌占所有病例的>90%,且<10%的病例具有潜在的遗传性或后天的诱发条件。这种高风险的后天条件包括某些罕见的遗传病、慢性胰腺炎、偶然发现的囊性胰腺癌前期(尤其是胰腺导管内乳头状黏液性肿瘤(ipmns))、肥胖症和最近发生的糖尿病(参见,chakraborty,s.,等人,biochimicaetbiophysicaacta,2011.1815(1):p.44-64)。使用各种内窥镜和成像学方法的筛查和监测项目不一致地应用于具有这些已知的遗传或后天风险因素的患者。由于绝大多数胰腺癌发生在没有明显风险因素的人群中,因此在高风险部分人群中进行选择性筛查对总体癌症发病率或死亡率影响很小。为了对胰腺癌死亡率产生最大的影响,需要有效的全民筛查工具。为了减轻这种可怕疾病的沉重代价,迫切需要有效的筛查方法。创新势在必行,以为最早期癌症和晚期癌前体的症状前检测提供准确、可负担并安全的筛查工具。本发明解决了这一需求。实际上,本发明提供了将有高度癌前病变和癌症的病例与有正常胰腺或低度癌前体的对照区分开的新颖的甲基化dna标记物。甲基化dna已经作为大多数肿瘤类型的组织中潜在的一类生物标记物被研究。在许多情况下,dna甲基转移酶在胞嘧啶-磷酸酯-鸟嘌呤(cpg)岛位点处向dna添加甲基基团,作为基因表达的表观遗传学调控。在生物学上有吸引力的机制中,认为肿瘤抑制基因的启动子区域中的后天甲基化事件会沉默表达,从而促进肿瘤发生。dna甲基化可能是比rna或蛋白质表达更加化学稳定且生物学稳定的诊断工具(laird(2010)natrevgenet11:191–203)。此外,在其他癌症如散发性结肠癌中,甲基化标记物提供了极好的特异性,并且提供了比单个dna突变更广泛的信息和敏感性(zou等人(2007)cancerepidemiolbiomarkersprev16:2686–96)。当应用于动物模型和人类细胞系时,对cpg岛的分析已经得到了重要的发现。例如,zhang和他的同事发现来自同一cpg岛的不同部位的扩增子可能具有不同水平的甲基化(zhang等人(2009)plosgenet5:e1000438)。此外,甲基化水平在高度甲基化的和未甲基化的序列之间呈双峰分布,进一步支持了dna甲基转移酶活性的二元开关样模式(zhang等人(2009)plosgenet5:e1000438)。小鼠组织体内分析和细胞系体外分析表明只有约0.3%的高cpg密度启动子(hcp,定义为在300个碱基对区域内有>7%的cpg序列)是被甲基化的,而低cpg密度的区域(lcp,定义为在300个碱基对区域内有<5%的cpg序列)往往以动态的组织特异性模式被频繁地甲基化(meissner等人(2008)nature454:766–70)。hcps包括对于无处不在的管家基因和高度调控的发育基因的启动子。在甲基化>50%的hcp位点中已经建立了诸如wnt2、ndrg2、sfrp2和bmp3的标记物(meissner等人(2008)nature454:766–70)。在开发本发明的实施方式的过程期间,所进行的实验比较了来自患有胰腺导管内乳头状黏液性肿瘤高度异型增生(ipmn-hgd)、胰腺上皮内瘤变3(panin-3)或胰腺导管腺癌(pdac)的受试者的胰腺组织的dna标记物的甲基化状态与来自对照受试者(例如,对于相应的组织类型患有ipmn-低度异型增生(ipmn-lgd)、panin-1和panin-2的受试者)的同一dna标记物的甲基化状态。这类实验鉴定并验证了将有高度癌前体(ipmn-hgd、panin-3)或浸润性癌(pdac)的病例组与有正常胰腺或低度癌前病变(ipmn-低度异型增生(ipmn-lgd)、panin-1和panin-2)的对照组区分开来的候选甲基化dna标记物(参见,实施例i、ii、iv和v)。因此,本文提供了用于筛查(例如,监测)胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的技术,并特别地但不仅限于用于检测胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的存在的方法、组合物和相关用途。鉴定了能够检测受试者中的胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的标记物和/或标记物组(例如,具有表2提供的注释的染色体区域)(参见,实施例i、ii、iv、和v)(bmp3、ndrg4、abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、lrrc4、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781)。如本文所述,本技术提供了许多甲基化dna标记物及其亚组(例如,2、3、4、5、6、7、10、15、19、20、21、50、75、94标记物的组),具有高识别率,用于检测受试者中胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的存在。实验中将选择过滤器应用于候选标记物以鉴定提供高信噪比和低背景水平从而提供高特异性的标记物,例如,当为了筛查或诊断(例如,癌症筛查或诊断)的目的而测定介质(例如,结直肠组织、粪便样品)时。在一些实施方式中,本技术涉及评估生物样品中一种或多种本文所鉴定的标记物的存在以及其甲基化状态。这些标记物包括一种或多种本文所讨论的差异甲基化区域(dmr),例如,如表2所提供。在本技术的实施方式中评估了甲基化状态。因此,本文提供的技术不受测量基因的甲基化状态的方法的限制。例如,在一些实施方式中,甲基化状态是通过基因组扫描方法来测量的。例如,一种方法涉及限制性标记基因组扫描(kawai等人(1994)mol.cell.biol.14:7421–7427),另一个实例涉及甲基化敏感性随机引物pcr(gonzalgo等人(1997)cancerres.57:594–599)。在一些实施方式中,通过用甲基化敏感性限制性酶切割基因组dna,然后对感兴趣的区域进行southern分析(酶切-southern法),来监视特定cpg位点处甲基化模式的变化。在一些实施方式中,分析甲基化模式的变化涉及基于pcr的工艺,该工艺涉及用甲基化敏感性限制性酶切割基因组dna,然后进行pcr扩增(singer-sam等人(1990)nucl.acidsres.18:687)。此外,还报道了利用亚硫酸氢盐处理dna作为甲基化分析的起点的其他技术。这些包括甲基化特异性pcr(msp)(herman等人(1992)proc.natl.acad.sci.usa93:9821–9826)和限制性酶切割由亚硫酸氢盐变换的dna扩增的pcr产品(sadri和hornsby(1996)nucl.acidsres.24:5058–5059;以及xiongandlaird(1997)nucl.acidsres.25:2532–2534)。pcr技术已被发展用于基因突变的检测(kuppuswamy等人(1991)proc.natl.acad.sci.usa88:1143–1147)和等位基因特异性表达的定量(szabo和mann(1995)genesdev.9:3097–3108;以及singer-sam等人(1992)pcrmethodsappl.1:160–163)。这类技术使用内引物,其退火到pcr生成模板上,并立即终止待测定的5'-单核苷酸。在一些实施方式中使用了采用美国专利no.7,037,650中所述的“定量ms-snupe测定”的方法。在评估甲基化状态时,甲基化状态通常表示为在特定位点处(例如,在单核苷酸处,在特定的区域或基因座处,在感兴趣的较长的序列处,例如长达~100-bp、200-bp、500-bp、1000-bp或更长的dna序列)被甲基化的dna的各个链相对于包括该特定位点的样品中总dna群的分率或百分比。传统上,未甲基化的核酸的量通过pcr使用校准仪确定。然后,对已知量的dna进行亚硫酸氢盐处理,并使用实时pcr或其他指数型扩增例如quarts测定(例如,如美国专利no.8,361,720;美国专利no.8,916,344;以及美国专利申请公开no.2012/0122088和no.2012/0122106所提供的)来确定所得的甲基化特异性序列。例如,在一些实施方式中,方法包括通过使用外标法生成用于未甲基化的靶标的标准曲线。标准曲线由至少两个点构建,并将未甲基化dna的实时ct值与已知的定量化标准联系起来。然后,由外标法和至少两个点构建用于甲基化的靶标的第二标准曲线。第二标准曲线将甲基化dna的ct与已知的定量化标准联系起来。接下来,确定对于甲基化和非甲基化群的测试样品ct值,并通过前两步产生的标准曲线计算dna的基因组等价物。在感兴趣的位点处的甲基化的百分比由甲基化dnas的量相对于群中dnas的总量来计算,例如,(甲基化dnas的数量)/(甲基化dnas的数量+未甲基化dnas的数量)×100。本文还提供了用于实践该方法的组合物和试剂盒。例如,在一些实施方式中,对一种或多种标记物特异性的试剂(例如,引物、探针)被单独提供或以集合(例如,用于扩增多种标记物的引物对的集合)提供。还可以提供用于进行检测测定的其他试剂(例如,用于进行quarts、pcr、测序、亚硫酸氢盐处理或其他测定的酶、缓冲液、阳性对照和阴性对照)。在一些实施方式中,提供了含有对于进行方法而言是必要的、充分的或有用的一种或多种试剂的试剂盒。还提供了含有试剂的反应混合物。进一步提供了含有多种试剂的主混合试剂集合,这些试剂可以相互添加和/或添加到测试样品中以完成反应混合物。在一些实施方式中,本文所述的技术与可编程的机器相关联,该机器被设计成执行由本文所述的方法提供的一系列算术或逻辑操作。例如,本技术的一些实施方式与计算机软件和/或计算机硬件相关联(例如,在计算机软件和/或计算机硬件中实现)。在一方面,本技术涉及计算机,包括存储器形式、用于执行算术和逻辑操作的元件和用于执行一系列指令(例如本文所提供的方法)的处理元件(例如,微处理器),以读取、操作和储存数据。在一些实施方式中,微处理器是系统的一部分,该系统用于确定甲基化状态(例如,一种或多种dmr的,例如,如表2和表6所提供的dmr1-96);比较甲基化状态(例如,一种或多种dmr的,例如,如表2和表6所提供的dmr1-96);产生标准曲线;确定ct值;计算甲基化(例如,一种或多种dmr的,例如,如表2和表6所提供的dmr1-96)的分率、频率或百分比;鉴定cpg岛;确定测定或标记物的特异性和/或敏感性;计算roc曲线和相关的auc;序列分析;所有本文所描述的或本领域已知的。在一些实施方式中,微处理器或计算机使用算法中的甲基化状态数据来预测癌症部位。在一些实施方式中,软件或硬件组件接收多种测定的结果,并基于多种测定的结果确定表明癌症风险的单值结果以向用户报告(例如,确定例如在表2和表6中提供的多种dmr的甲基化状态)。相关的实施方式基于由多种测定得到的结果的数学组合(例如,加权组合、线性组合)计算风险因素,例如,确定多种标记物(诸如多种dmr,例如如表2和表6所提供的)的甲基化状态。在一些实施方式中,dmr的甲基化状态定义了维度,并可能在多维空间中具有多个值,结果为由多种dmr的甲基化状态限定的坐标,例如,以报告给用户。一些实施方式包括储存介质和存储器组件。存储器组件(例如,易失性和/或非易失性存储器)发现用于储存指令(例如,本文所提供的工艺的实施方式)和/或数据(例如,工件诸如甲基化测量、测序和与之相关的统计描述)。一些实施方式涉及的系统还包括一个或多个cpu、显卡和用户接口(例如,包括输出设备诸如显示器和输入设备诸如键盘)。与本技术相关的可编程机器包括常规的现存技术和正在开发或尚未开发的技术(例如,量子计算机、化学计算机、dna计算机、光学计算机、基于自旋电子学的计算机等)。在一些实施方式中,本技术包括用于传输数据的有线(例如金属电缆、光纤)或无线传输介质。例如,一些实施方式涉及通过网络(例如,局域网(lan)、广域网(wan)、自组网、因特网等)的数据传输。在一些实施方式中,可编程机器以对等体存在于这类网络上,而在一些实施方式中,可编程机器具有客户端/服务器关系。在一些实施方式中,数据储存在计算机可读的储存介质上,诸如硬盘、闪速存储器、光学介质、软盘等。在一些实施方式中,本文所提供的技术与多个可编程设备相关联,这些设备协同工作以执行本文所述的方法。例如,在一些实施方式中,多台计算机(例如,通过网络连接)可以并行工作以收集和处理数据,例如,在实施集群计算或网格计算或其他一些依靠将完整的计算机(具有板载cpus、储存、电源、网络接口等)通过常规的网络接口诸如以太、光纤或通过无线网络技术连接到网络(私人、公共或因特网)的分布式计算机系统结构。例如,一些实施方式提供了包括计算机可读介质的计算机。该实施方式包括耦合到处理器的随机存取存储器(ram)。处理器执行储存在存储器中的计算机可执行的程序指令。这种处理器可以包括微处理器、asic、状态机或其他处理器,且可以是任何数量的计算机处理器,诸如来自intelcorporationofsantaclara,california和motorolacorporationofschaumburg,illinois的处理器。这类处理器包括介质或可能与介质通信,例如计算机可读介质,其储存了指令,而当处理器执行指令时会导致处理器执行本文所述的步骤。计算机可读介质的实施方式包括但不限于能够向处理器提供计算机可读指令的电子、光学、磁性或其他储存或传输设备。其他合适的介质的实例包括但不限于软盘、cd-rom、dvd、磁盘、存储器片、rom、ram、asic、已配置的处理器、所有光学介质、所有磁带或其他磁性介质,或计算机处理器可以从中读取指令的任何其他介质。此外,各种其他形式的计算机可读介质可以向计算机传输或携带指令,包括有线和无线的路由器、专用或公用网络或其他传输设备或信道。指令可以包括来自任何合适的计算机编程语言的代码,包括例如c、c++、c#、visualbasic、java、python、perl和javascript。在一些实施方式中,计算机与网络相连接。计算机还可以包括许多外部或内部设备,诸如鼠标、cd-rom、dvd、键盘、显示器或其他输入或输出设备。计算机的实例有个人计算机、数字助理、个人数字助理、便携式电话、移动电话、智能手机、寻呼机、数字平板电脑、笔记本电脑、因特网装置和其他基于处理器的设备。通常,与本文所提供的技术方面相关的计算机可以是任何类型的基于处理器的平台,其可以在任何操作系统上运行,诸如microsoftwindows、linux、unix、macosx等,能够支持包括本文所提供的技术的一种或多种程序。一些实施方式包括执行其他应用程序(例如应用)的个人计算机。应用可以包含在存储器中,并且可以包括,例如,文字处理应用、电子表格应用、电子邮件应用、即时消息应用、演示应用、因特网浏览器应用、日历/组织者应用以及任何其他能够由客户端设备执行的应用。本文所述的与技术相关联的所有这类组件、计算机和系统可以是逻辑的或虚拟的。本文提供的技术涉及在从受试者获得的样品中筛查胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的方法,该方法包括测定从受试者获得的样品中的标记物的甲基化状态;并且当标记物的甲基化状态不同于在不具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者中测定的标记物的甲基化状态时,鉴定受试者为具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac),其中标记物包括选自如表2和表6所提供的bmp3、ndrg4、abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、lrrc4、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781的差异甲基化区域(dmr)中的一个或多个碱基。本技术不限于所评估的甲基化状态。在一些实施方式中,评估样品中的标记物的甲基化状态包括确定一个碱基的甲基化状态。在一些实施方式中,测定样品中的标记物的甲基化状态包括确定多个碱基处的甲基化的程度。此外,在一些实施方式中,标记物的甲基化状态包括相对于标记物的正常甲基化状态增加的标记物的甲基化。在一些实施方式中,标记物的甲基化状态包括相对于标记物的正常甲基化状态降低的标记物的甲基化。在一些实施方式中,标记物的甲基化状态包括相对于标记物的正常甲基化状态不同模式的标记物的甲基化。此外,在一些实施方式中,标记物是100个或更少个碱基的区域,标记物是500个或更少个碱基的区域,标记物是1000个或更少个碱基的区域,标记物是5000个或更少个碱基的区域,或者在一些实施方式中,标记物是一个碱基。在一些实施方式中,标记物位于高cpg密度启动子中。本技术不受样品类型的限制。例如,在一些实施方式中,样品是粪便样品、组织样品(例如,胃组织、胰腺组织、胆管/肝组织、胰液、胰腺囊肿液和结直肠组织)、血液样品(例如,血浆、血清、全血)、排泄物或尿液样品。此外,本技术不限于用于测定甲基化状态的方法。在一些实施方式中,测定包括使用甲基化特异性聚合酶链反应、核酸测序、质谱、甲基化特异性核酸酶、基于质量分离或靶标捕获。在一些实施方式中,测定包括使用甲基化特异性寡核苷酸。在一些实施方式中,本技术使用大规模并行测序(例如,下一代测序)以确定甲基化状态,例如,通过合成测序(sequencing-by-synthesis)、实时(例如单分子)测序、珠乳剂测序(beademulsionsequencing)、纳米孔测序等。本技术提供了检测dmr的试剂,例如,在一些实施方式中提供了一组包括由seqidno:1–44(表3)以及seqidno:45、46、47和48(表7)提供的序列的寡核苷酸。在一些实施方式中,提供了所包括的序列与具有dmr中的碱基的染色体区域互补的寡核苷酸,例如对dmr的甲基化状态敏感的寡核苷酸。本技术提供了各种标记物组,例如,在一些实施方式中,标记物包括具有表2和表6所提供的注释的染色体区域,且其包括标记物(参见,表2和表6)。此外,实施方式提供了分析表2和表6中dmrnos.1-96中的一种或多种的dmr的方法。提供了试剂盒实施方式,例如,试剂盒包括亚硫酸氢盐试剂;以及包括来自dmr的序列的对照核酸,dmr选自由dmr1-96(表2和表6中)组成的组,且具有与没有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者相关的甲基化状态。提供了试剂盒实施方式,例如,试剂盒包括亚硫酸氢盐试剂;以及包括来自dmr的序列的对照核酸,dmr选自由dmr1-96或由dmr1、21、24、25、26、55、70、77、81、84、92、95和96(表2和表6中)组成的组,且具有与没有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者相关的甲基化状态。一些试剂盒实施方式包括用于从受试者获得样品(例如,粪便样品)的样品收集器;用于从样品中分离核酸的试剂;亚硫酸氢盐试剂;以及本文所述的寡核苷酸。本技术涉及组合物(例如,反应混合物)的实施方式。在一些实施方式中,提供了包括亚硫酸氢盐试剂和包含dmr的核酸的组合物。一些实施方式提供了包括包含dmr的核酸和本文所述的寡核苷酸的组合物。一些实施方式提供了包括甲基化敏感性限制酶和包含dmr的核酸的组合物。一些实施方式提供了包括聚合酶和包含dmr的核酸的组合物。提供了额外的相关方法实施方式,用于在从受试者获得的样品中筛查胰腺高度异型增生(ipmn-hgd、panin-3或pdac),例如方法包括在包含dmr中的碱基的样品中测定标记物的甲基化状态,dmr是dmr1-96或dmr1、21、24、25、26、55、70、77、81、84、92、95和96(表2和表6中)中的一种或多种;将受试者样品中的标记物的甲基化状态与来自没有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者的正常对照样品中的标记物的甲基化状态进行比较;并确定受试者样品和正常对照样品的甲基化状态之间差异的置信区间和/或p值。在一些实施方式中,置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或99.99%,以及p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。方法的一些实施方式提供了以下步骤:将包含dmr的核酸与亚硫酸氢盐试剂反应,以产生亚硫酸氢盐反应后的核酸;对亚硫酸氢盐反应后的核酸进行测序,以提供亚硫酸氢盐反应后的核酸的核苷酸序列;将亚硫酸氢盐反应后的核酸的核苷酸序列与来自没有癌症的受试者的包含dmr的核酸的核苷酸序列进行比较,以鉴定两种序列的差异;以及当存在差异时,鉴定受试者为患有肿瘤。本技术提供了在从受试者获得的样品中筛查胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的系统。系统的示例性实施方式包括,例如,用于在从受试者获得的样品中筛查胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的系统,该系统包括:分析组件,配置为测定样品的甲基化状态;软件组件,配置为将样品的甲基化状态与数据库中记录的对照样品或参考样品的甲基化状态进行比较;以及警报组件,配置为向用户警报胰腺高度异型增生相关的甲基化状态(例如,没有胰腺高度异型增生的甲基化状态;胰腺高度异型增生的甲基化状态)。在一些实施方式中,警报由接收来自多种测定(例如,确定多种标记物的甲基化状态,例如dmr,例如如表2和表6中所提供的)的结果的软件组件而确定,并基于多种结果计算待报告的值或结果。一些实施方式提供了与本文所提供的每个dmr相关的加权参数的数据库,用于计算待向用户(例如,诸如医师、护士、临床医生等)报告的值或结果和/或警报。在一些实施方式中,报告了来自多种测定的所有结果,以及在一些实施方式中,基于来自多种测定的一个或多个结果的复合,将一个或多个结果用于提供分数、值或者结果,其表明了受试者中胰腺高度异型增生的风险。在系统的一些实施方式中,样品包括包含dmr的核酸。在一些实施方式中,系统还包括用于分离核酸的组件,用于收集样品的组件,诸如用于收集粪便样品的组件。在一些实施方式中,系统包括包含dmr的核酸序列。在一些实施方式中,数据库包括来自没有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者的核酸序列。还提供了核酸,例如,核酸组,每个核酸都具有包括dmr的序列。在一些实施方式中,核酸组中的每个核酸都具有来自没有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者的序列。相关的系统实施方式包括如所述的核酸组和与该核酸组相关的核酸序列的数据库。一些实施方式还包括亚硫酸氢盐试剂。以及,一些实施方式还包括核酸测序仪。在某些实施方式中,提供了用于在从受试者获得的样品中检测胰腺高度异型增生的方法,包括a)从受试者获得包含dna的样品;b)用试剂处理所获得的dna,试剂选择性地修饰所获得的dna中未甲基化的胞嘧啶残基以产生修饰后的残基,但其不修饰甲基化的胞嘧啶残基;c)测定在已进行步骤b)处理后的dna中的一种或多种dna甲基化标记物的甲基化水平,其中一种或多种dna甲基化标记物包括在如由dmr1-96或dmr1、21、24、25、26、55、70、77、81、84、92、95和96(表2和表6中)所提供的差异甲基化区域(dmr)中的碱基;d)将所测定的一种或多种dna甲基化标记物的甲基化水平与没有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的受试者的一种或多种dna甲基化标记物的甲基化水平参考进行比较;以及e)当存在差异时,鉴定受试者为具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。在一些实施方式中,测定一种或多种dna甲基化标记物中升高的甲基化包括测定选自由cpg岛和cpg岛岸组成的组的区域内改变的甲基化。在一些实施方式中,测定cpg岛或cpg岸内升高的甲基化包括dna甲基化标记物的编码区域或调控区域内升高的甲基化。在一些实施方式中,测定在已进行步骤b)处理后的dna中的一种或多种dna甲基化标记物的甲基化水平包括确定一种或多种dna甲基化标记物的甲基化评分和/或甲基化频率。在一些实施方式中,步骤b)的处理是通过对所获得的dna进行亚硫酸氢盐修饰来完成的。在一些实施方式中,测定在已进行步骤b)处理后的dna中的一种或多种dna甲基化标记物的甲基化水平是通过选自由甲基化特异性pcr、定量甲基化特异性pcr、甲基化敏感性dna限制性酶分析、定量亚硫酸氢盐焦磷酸测序和亚硫酸氢盐基因组测序pcr组成的组的技术而实现的。在一些实施方式中,样品包括胰腺组织和/或胰液、结直肠组织。在一些实施方式中,样品包括胰腺囊肿液。在一些实施方式中,样品包括粪便样品。在一些实施方式中,样品包括血液样品。在某些实施方式中,本发明提供了用于通过测量人类的生物样品中的选自由bmp3、ndrg4、abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、lrrc4、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781组成的组的两种或更多种的基因在cpg位点的甲基化水平来表征生物样品的方法。这类方法不限于用于测量cpg位点的甲基化水平的特定方法。在一些实施方式中,这类方法通过用亚硫酸氢盐处理生物样品中的基因组dna来测量cpg位点的甲基化水平;使用用于所选择的两种或更多种的基因的引物组来扩增亚硫酸氢盐处理后的基因组dna;以及通过甲基化特异性pcr、定量甲基化特异性pcr、甲基化敏感性dna限制性酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序pcr来测定cpg位点的甲基化水平。在一些实施方式中,测量两种或更多种基因的cpg位点的甲基化水平包括选自由确定所述cpg位点的甲基化评分和确定所述cpg位点的甲基化频率组成的组的测定。在一些实施方式中,这类方法还包括将甲基化水平与无胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的对照样品中相应的基因的组的甲基化水平进行比较;以及当在两种或更多种基因中测量到的甲基化水平高于在各自对照样品中测量到的甲基化水平时,确定个体具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。这类方法不限于特定类型的生物样品。在一些实施方式中,生物样品包括胰腺组织和/或胰腺囊肿液。在一些实施方式中,生物样品包括粪便样品、血液样品和/或血液级分样品。在一些实施方式中,cpg位点存在于编码区域或调控区域。在一些实施方式中,下列引物组用于所选择的两种或更多种基因:由seqidnos:45和46组成的引物组用于bmp3,由seqidnos:47和48组成的引物组用于ndrg4,由seqidnos:1和2组成的引物组用于abcb1,由seqidnos:3和4组成的引物组用于ak055957,由seqidnos:7和8组成的引物组用于c13orf18,由seqidnos:43和44组成的引物组用于cd1d,由seqidnos:9和10组成的引物组用于clec11a,由seqidnos:11和12组成的引物组用于dlx4,由seqidnos:13和14组成的引物组用于elmo1,由seqidnos:15和16组成的引物组用于emx1,由seqidnos:17和18组成的引物组用于fer1l4,由seqidnos:19和20组成的引物组用于frmd4a,由seqidnos:21和22组成的引物组用于grin2d,由seqidnos:23和24组成的引物组用于hoxa1,由seqidnos:25和26组成的引物组用于lrrc4,由seqidnos:29和30组成的引物组用于prkcb,由seqidnos:31和32组成的引物组用于sp9,由seqidnos:33和34组成的引物组用于st6gal2,由seqidnos:35和36组成的引物组用于st8sia1,由seqidnos:37和38组成的引物组用于tbx15,由seqidnos:39和40组成的引物组用于vwc2,以及由seqidnos:41和42组成的引物组用于znf781。根据本文所包含的教导,其他实施方式对相关领域的技术人员将是显而易见的。附图说明图1a-1y提供了从如实施例i中所述的胰腺组织中测定的不同标记物的分布图。图2示出了胰腺囊肿液中的前三种甲基化dna标记物(由β-肌动蛋白标准化的)在病例(hgd/癌)和对照(lgd/无异型增生)中的分布(参见,实施例v)。图3示出了前两种候选甲基化dna标记物(由β-肌动蛋白标准化的)在每个囊肿类别中的胰腺囊肿液水平(参见,实施例vi)。具体实施方式本文提供了用于筛查胰腺高度异型增生的技术,并特别地及但不仅限于用于检测胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的存在的方法、组合物和相关用途。如本文所述的技术,所使用的章节标题仅出于组织的目的,且不应理解为以任何方式限制主题内容。在对各个实施方式的详细描述中,为了解释的目的,阐述了许多具体的细节以提供对所公开的实施方式的全面理解。但是,本领域技术人员将会理解,这些各种实施方式可以在有或没有这些具体细节的情况下实践。在其他实例中,结构和设备以方框图的形式显示。此外,本领域技术人员可以很容易地理解,在其中呈现并执行方法的特定序列是说明性的,且可以预期,这些序列可以是各种各样的而仍然处于本文公开的各种实施方式的精神和范围之内。本申请所引用的所有文献和类似材料,包括但不限于专利、专利申请、文章、书籍、专著和因特网网页,为任何目的其全部内容通过引用明确地并入本文。除非另有定义,否则本文使用的所有技术和科学术语当与本文所述的各种实施方式所属的领域中普通技术人员所通常理解的含义相同。当所合并的参考资料中术语的定义与本教导中提供的定义不同时,应以本教导中提供的定义为准。定义为了便于理解本技术,下面定义了一些术语和短语。其他定义在整个详细描述中阐述。除非上下文另有清楚指示,否则在整个说明书和权利要求书中,以下术语均采用本文明确关联的含义。本文使用的短语“在一种实施方式中”不一定是指同一种实施方式,但也可能是同一种。此外,本文使用的短语“在另一种实施方式中”不一定是指不同的实施方式,但也可能是不同的。因此,如下所述,本发明的各种实施方式可以很容易地组合在一起,而不偏离本发明的范围或精神。此外,除非上下文另有清楚指示,否则如本文所述,术语“或”是包容性的“或”操作符,且与术语“和/或”等价。除非上下文另有清楚指示,否则术语“基于”不是排他性的,且允许基于未描述的其他因素。此外,在整个说明书中,“一个”、“一种”和“该”的含义包括复数引用。“之中(in)”的含义包括“之中(in)”和“之上(on)”。如本文所述,“核酸”或“核酸分子”通常是指任何核糖核酸或脱氧核糖核酸,其可以是未经修饰的或经修饰的dna或rna。“核酸”包括但不限于单链核酸和双链核酸。如本文所述,术语“核酸”还包括如上所述含有一个或多个经修饰的碱基的dna。因此,为了稳定性或为了其他原因而具有经修饰的骨架的dna是“核酸”。本文使用的术语“核酸”包括这类核酸的化学修饰、酶修饰或代谢修饰的形式,以及病毒和细胞(包括例如简单细胞和复杂细胞)的dna特征的化学形式。术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个脱氧核糖核苷酸或核糖核苷酸的分子,优选地多于三个,且通常多于十个。确切的尺寸将取决于许多因素,反过来这些因素又取决于寡核苷酸的最终功能或用途。寡核苷酸可以以任何方式生成,包括化学合成、dna复制、逆转录或其组合。典型的dna脱氧核糖核苷酸是胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。典型的rna核糖核苷酸是尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。如本文所述,术语核酸的“基因座”或“区域”是指核酸的子区域,例如染色体上的基因、单独的核苷酸、cpg岛等。术语“互补的”和“互补性”是指由碱基配对规则所关联的核苷酸(例如1个核苷酸)或多核苷酸(例如一系列的核苷酸)。例如,序列5'-a-g-t-3'与序列3'-t-c-a-5'是互补的。互补性可以是“部分的”,其中根据碱基配对规则只有一些核酸的碱基是匹配的。或者,核酸之间的互补性可以是“完整的”或“完全的”。核酸链之间互补性的程度影响核酸链之间杂交的效率和强度。这在扩增反应和依赖于核酸之间的结合的检测方法中是尤其重要的。术语“基因”是指包括产生rna、或多肽或其前体所必需的编码序列的核酸(例如,dna或rna)序列。功能性多肽可以通过全长编码序列或通过编码序列的任何部分进行编码,只要多肽的所需活性或功能特性(例如,酶活性、配体结合、信号传导等)被保留。术语“部分”在提及基因而使用时是指该基因的片段。片段的尺寸范围可以为从几个核苷酸至整个基因序列减去一个核苷酸。因此,“包括至少一部分基因的核苷酸”可以包括基因的片段或整个基因。术语“基因”还涵盖结构基因的编码区域,并包括位于邻近5'端和3'端两端上的编码区域的序列,例如,在每端上的距离约为1kb,使得基因对应于全长mrna的长度(例如,包括编码、调控、结构和其他序列)。位于5'编码区的序列和其呈现在mrna上的序列被称为5'非翻译序列或未翻译序列。位于3'编码区或编码区下游的序列和其呈现在mrna上的序列被称为3'非翻译序列或3'未翻译序列。术语“基因”涵盖cdna和基因的基因组形式。在某些生物体(例如,真核生物)中,基因的基因组形式或克隆含有被非编码序列阻断的编码区域,非编码序列的术语为“内含子”或“间插区域”或“间插序列”。内含子是被转录成核rna(hnrna)的基因的区段;内含子可能含有调控元素诸如增强子。内含子被从核转录或初级转录中移除或“剪除”;因此,信使rna(mrna)转录中不存在内含子。mrna在翻译期间发挥作用,以指定新生多肽中氨基酸的序列或顺序。除了含有内含子之外,基因的基因组形式还可以包括位于rna转录上存在的序列的5'端和3'端两端的序列。这些序列被称为“侧翼”序列或区域(这些侧翼序列位于mrna转录上存在的5'或3'至非翻译序列)。5'侧翼区域可能含有调控序列,诸如启动子和增强子,其控制或影响基因的转录。3'侧翼区域可能含有指导转录的终止、转录后裂解和多腺苷酸化的序列。术语“等位基因”是指基因的变异;变异包括但不限于变异体和突变体、多态基因座和单核苷酸多态基因座、移码和剪接突变。等位基因可能在种群中自然发生,或者它可能在种群的任何特定个体的一生期间出现。因此,术语“变异体”和“突变体”当在提及核苷酸序列而使用时,是指通过一个或多个核苷酸而与另一个(通常是相关的)核苷酸序列不同的核苷酸序列。“变异”是两个不同的核苷酸序列之间的差异;典型地,一个序列是参考序列。“扩增”是涉及模板特异性的核酸复制的特例。它将与非特异性的模板复制进行对比(例如,依赖模板但不依赖于特定模板的复制)。这里的模板特异性不同于复制的保真性(例如,合成正确的多核苷酸序列)和(核糖-或脱氧核糖-)核苷酸特异性。模板特异性常常被描述为“靶标”特异性。从某种意义上说,靶标序列是试图从其他核酸中挑选出来的“靶标”。扩增技术主要是为这种挑选而设计的。核酸的扩增通常是指典型地从少量的多核苷酸产生多核苷酸或多核苷酸的一部分的多个拷贝(例如,单一多核苷酸分子,10至100个多核苷酸分子的拷贝,其可以是也可以不是完全相同的),其中扩增产物或扩增子通常是可检测的。多核苷酸的扩增涵盖各种化学和酶工艺。扩增的形式为在聚合酶链反应(pcr)或连接酶链反应(lcr;参见,例如美国专利no.5,494,810)期间,从靶标或模板dna分子的一个或一些拷贝生成多个dna拷贝。扩散的其他类型包括但不限于等位基因特异性pcr(参见,例如美国专利no.5,639,611)、装配pcr(参见,例如美国专利no.5,965,408)、解旋酶依赖性扩增(参见,例如美国专利no.7,662,594)、热启动pcr(参见,例如美国专利nos.5,773,258和5,338,671)、内部序列特异性pcr、反向pcr(参见,例如triglia,等人(1988)nucleicacidsres.,16:8186)、连接介导的pcr(参见,例如guilfoyle,r.等人,nucleicacidsresearch,25:1854-1858(1997);美国专利no.5,508,169)、甲基化特异性pcr(参见,例如herman,等人,(1996)pnas93(13)9821-9826)、微型引物pcr、多重连接依赖性探针扩增(参见,例如schouten,等人,(2002)nucleicacidsresearch30(12):e57)、多重pcr(参见,例如chamberlain,等人,(1988)nucleicacidsresearch16(23)11141-11156;ballabio,等人,(1990)humangenetics84(6)571-573;hayden,等人,(2008)bmcgenetics9:80)、巢式(nested)pcr、重叠延伸pcr(参见,例如higuchi,等人,(1988)nucleicacidsresearch16(15)7351-7367)、实时pcr(参见,例如higuchi,etal等人,(1992)biotechnology10:413-417;higuchi,等人,(1993)biotechnology11:1026-1030)、逆转录pcr(参见,例如bustin,s.a.(2000)j.molecularendocrinology25:169-193)、固相pcr、热不对称交错pcr以及降落(touchdown)pcr(参见,例如don,等人,nucleicacidsresearch(1991)19(14)4008;roux,k.(1994)biotechniques16(5)812-814;hecker,等人,(1996)biotechniques20(3)478-485)。多核苷酸扩增也可以使用数字pcr实现(参见,例如kalinina,等人,nucleicacidsresearch.25;1999-2004,(1997);vogelsteinandkinzler,procnatlacadsciusa.96;9236-41,(1999);国际专利公开no.wo05023091a2;美国专利申请公开no.20070202525)。术语“聚合酶链反应”(“pcr”)是指k.b.的方法。mullis美国专利nos.4,683,195、4,683,202和4,965,188,描述了用于在无克隆或纯化的情况下在基因组dna的混合物中增加靶标序列的区段的浓度的方法。扩增靶标序列的此工艺由将大量过量的两个寡核苷酸引物引入含有所需靶标序列的dna混合物中,然后在dna聚合酶的存在下进行精确的序列的热循环而组成。这两个引物与双链靶标序列的各自的链互补。为了达到扩增效果,使混合物变性并然后将引物退火至它们在靶标分子内的互补序列。退火后,用聚合酶延伸引物以形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复许多次(即,变性、退火和延伸构成一个“循环”;可以有许多“循环”)以获得高浓度的所需靶标序列的扩增后的区段。所需靶标序列的扩增后区段的长度由引物关于彼此的相对位置决定,并因此该长度是可控的参数。由于该工艺是重复性的,该方法被称为“聚合酶链反应”(“pcr”)。由于所需靶标序列的扩增后区段成为混合物中占主导地位的序列(就浓度而言),因此它们被称为是“pcr扩增的”且是“pcr产物”或“扩增子”。在大多数扩增技术中通过酶的选择来实现模板特异性。扩增酶是指在其被使用的条件下将仅处理核酸的非均匀混合物中的特定的核酸序列的酶。例如,在q-β复制酶的情况下,mdv-1rna是该复制酶的特异性模板(kacian等人,proc.natl.acad.sci.usa,69:3038[1972])。其他核酸将不会被这种扩增酶复制。类似地,在t7rna聚合酶的情况下,这种扩增酶对其自身的启动子具有严格的特异性(chamberlin等人,nature,228:227[1970])。在t4dna连接酶的情况下,当寡核苷酸或多核苷酸底物与连接结点处的模板之间不匹配时,该酶将不会连接这两个寡核苷酸或多核苷酸(wu和wallace(1989)genomics4:560)。最后,热稳定的模板依赖性dna聚合酶(例如,taq和pfudna聚合酶),由于其在高温下起作用的能力而被发现对由引物所界定并因此所限定的序列显示高特异性;高温导致的热力学条件有利于引物与靶标序列杂交,而不与非靶标序列杂交(h.a.erlich(编辑),pcrtechnology,stocktonpress[1989])。如本文所用,术语“核酸检测测定”是指确定感兴趣的核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于dna测序方法、探针杂交方法、结构特异性裂解测定(例如,invader测定,hologic,inc.)并在例如美国专利nos.5,846,717、5,985,557、5,994,069、6,001,567、6,090,543和6,872,816;lyamichev等人,nat.biotech.,17:292(1999),hall等人,pnas,usa,97:8272(2000)和us2009/0253142)中描述;酶错配裂解方法(例如,variagenics,美国专利nos.6,110,684、5,958,692、5,851,770);聚合酶链反应;分支杂交方法(例如,chiron,美国专利nos.5,849,481、5,710,264、5,124,246和5,624,802);滚环复制(例如,美国专利nos.6,210,884、6,183,960和6,235,502);nasba(例如,美国专利no.5,409,818);分子信标技术(例如,美国专利no.6,150,097);电子传感器技术(motorola,美国专利nos.6,248,229、6,221,583、6,013,170和6,063,573);循环探针技术(例如,美国专利nos.5,403,711、5,011,769和5,660,988);dadebehring信号扩增方法(例如,美国专利nos.6,121,001、6,110,677、5,914,230、5,882,867和5,792,614);连接酶链反应(例如,barnayproc.natl.acad.sciusa88,189-93(1991));以及夹心杂交方法(例如,美国专利no.5,288,609)。术语“可扩增的核酸”是指可以通过任意扩增方法扩增的核酸。可以预期,“可扩增的核酸”将通常包括“样品模板”。术语“样品模板”是指源自用于分析“靶标”(定义如下)的存在的样品的核酸。相比之下,“背景模板”用于指样品模板之外的核酸,其在样品中可能存在也可能不存在。背景模板很多时候是无意的。它可能是夹带的结果,也可能是由于存在试图从样品中纯化出去的核酸污染物。例如,来自生物体的除了要检测的核酸之外的核酸可能作为测试样品中的背景存在。术语“引物”是指如在纯化的限制性消化中自然发生或通过合成产生的一种寡核苷酸,当将其置于诱导合成与核酸链互补的引物延伸产物的条件下(例如,在核苷酸和诱导剂诸如dna聚合酶的存在下,并在合适的温度和ph值下)时能够作为合成的起始点。引物优选地是单链的,以最大化扩增的效率,但可以替代地是双链的。如果是双链的,则首先处理引物以将它的链分离,然后再用于制备延伸产物。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长,以在诱导剂的存在下引导延伸产物的合成。引物的确切长度取决于许多因素,包括温度、引物来源和使用的方法。术语“探针”是指能够与另一种感兴趣的寡核苷酸杂交的寡核苷酸(例如,核苷酸序列),其在纯化的限制性消化中自然发生或通过合成、重组或pcr扩增产生。探针可以是单链的或双链的。探针可用于检测、鉴定和分离特定的基因序列(例如,“捕获探针”)。可以预期在一些实施方式中,本发明中所使用的任何探针可以用任何“报道分子”进行标记使得其在任何检测系统中都可被检测到,包括但不限于酶(例如,elisa,以及基于酶的组织化学测定)、荧光、放射性和发光系统。本发明不意图限于任何特定的检测系统或标记。如本文所用,“甲基化”是指在胞嘧啶的c5或n4位处的胞嘧啶甲基化、腺嘌呤的n6位或其他类型的核酸甲基化。体外扩增的dna通常是未甲基化的,因为典型的体外dna扩增方法不保留扩增模板的甲基化模式。然而,“未甲基化dna”或“甲基化dna”也可以分别指未甲基化的原模板或甲基化的原模板的扩增后的dna。因此,本文所用的“甲基化核苷酸”或“甲基化核苷酸碱基”是指在核苷酸碱基上存在甲基部分,其中甲基部分不存在于公认的典型的核苷酸碱基中。例如,胞嘧啶在其嘧啶环上不含有甲基部分,但5-甲基胞嘧啶在其嘧啶环的5位处含有甲基部分。因此,胞嘧啶不是甲基化核苷酸,而5-甲基胞嘧啶是甲基化核苷酸。在另一实例中,胸腺嘧啶在其嘧啶环的5位处含有甲基部分;然而,出于本文的目的,由于胸腺嘧啶是dna的典型的核苷酸碱基,因此存在于dna中的胸腺嘧啶不被认为是甲基化核苷酸。如本文所用,“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。如本文所用,核酸分子的“甲基化状态”、“甲基化状况”和“甲基化情况”是指核酸分子中存在不存在一个或多个甲基化核苷酸碱基。例如,含有甲基化胞嘧啶的核酸分子被认为是甲基化的(例如,核酸分子的甲基化状态是甲基化的)。不含有任何甲基化核苷酸的核酸分子被认为是未甲基化的。特定核酸序列(例如,如本文所述的基因标记物或dna区域)的甲基化状态可以表明序列中每个碱基的甲基化状态或可以表明序列内碱基的子集的(例如,一个或多个胞嘧啶的)甲基化状态,或可以表明关于序列内区域性甲基化密度的信息,提供或不提供序列内甲基化发生的位置的精确信息。核酸分子中核苷酸基因座的甲基化状态是指在核酸分子中特定基因座处存在或不存在甲基化核苷酸。例如,当存在于核酸分子中第7核苷酸处的核苷酸是5-甲基胞嘧啶时,核酸分子中第7核苷酸处的胞嘧啶的甲基化状态为甲基化的。类似地,当存在于核酸分子中第7核苷酸处的核苷酸是胞嘧啶(而非5-甲基胞嘧啶)时,核酸分子中第7核苷酸处的胞嘧啶的甲基化状态为未甲基化的。甲基化状态可以任选地通过“甲基化值”(例如,代表甲基化频率、分率、比值、百分比等)来代表或表明。可以例如,通过量化用甲基化依赖性限制性酶进行限制性消化后存在的完整核酸的量,或通过比较亚硫酸氢盐反应之后的扩增状况,或通过比较亚硫酸氢盐处理后的和未经处理的核酸的序列,来生成甲基化值。因此,值(例如,甲基化值)代表了甲基化状态,并因此可以用作基因座的多个拷贝中甲基化状态的定量指标。当需要将样品中序列的甲基化状态与阈值或参考值进行比较时,这尤其有用。如本文所用,“甲基化频率”或“甲基化百分比(%)”是指其中分子或基因座被甲基化的实例数量比上该分子或基因座未被甲基化的实例数量。因此,甲基化状态描述了核酸(例如,基因组序列)的甲基化的状态。此外,甲基化状态是指与甲基化相关的特定基因组的基因座上的核酸区段的特征。这类特征包括但不限于,该dna序列内是否有任何胞嘧啶(c)残基被甲基化,甲基化的一个或多个c残基的位置,在整个核酸的任何特定区域中甲基化c的频率或百分比,以及由于例如等位基因的来源差异导致的甲基化中的等位基因差异。术语“甲基化状态”、“甲基化状况”和“甲基化情况”也指生物样品中整个核酸的任何特定区域的甲基化c或未甲基化c的相对浓度、绝对浓度或模式。例如,如果核酸序列内的一个或多个胞嘧啶(c)残基被甲基化了,则它可被称为“高甲基化的”或有“增加的甲基化”,而如果dna序列内的一个或多个胞嘧啶(c)残基没有被甲基化,则它可以被称为“低甲基化的”或有“降低的甲基化”。同样地,如果核酸序列内的一个或多个胞嘧啶(c)残基与另一核酸序列(例如,来自不同区域或来自不同个体等)相比被甲基化了,则该序列被认为与另一核酸序列相比是高甲基化的或有增加的甲基化。可替代地,如果dna序列内的一个或多个胞嘧啶(c)残基与另一核酸序列(例如,来自不同区域或来自不同个体等)相比没有被甲基化,则该序列被认为与另一核酸序列相比是低甲基化的或有降低的甲基化。此外,本文使用的术语“甲基化模式”是指在核酸的区域上甲基化的和未甲基化的核苷酸的集体的位点。当甲基化的和未甲基化的核苷酸的数量在整个区域内相同或相似但甲基化的和未甲基化的核苷酸的位置不同时,两个核酸可能具有相同或相似的甲基化频率或甲基化百分比但具有不同的甲基化模式。当若干序列在程度(例如,一个相对于另一个有增加的或降低的甲基化)、频率或甲基化模式上存在差异时,它们被称为是“差异甲基化的”或有“甲基化上的差异”或有“不同的甲基化状态”。术语“差异甲基化”是指癌症阳性样品中核酸甲基化的水平或模式相比于癌症阴性样品中核酸甲基化的水平或模式的差异。它也可以指手术后癌症复发的患者对比未复发的患者之间在水平或模式上的差异。差异甲基化和dna甲基化的特定水平或模式是预后和预测生物标记物,例如,一旦确定了正确的截止或预测性特征。甲基化状态频率可用于描述个体群或来自单个体的样品。例如,具有甲基化状态频率为50%的核苷酸基因座,是50%的实例被甲基化且50%的实例未被甲基化的。这种频率可用于例如描述在个体群或核酸集合中核苷酸基因座或核酸区域被甲基化的程度。因此,当第一核酸分子群或池中的甲基化不同于第二核酸分子群或池中的甲基化时,第一群或池的甲基化状态频率将不同于第二群或池的甲基化状态频率。这种频率也可用于例如描述在单个体中核苷酸基因座或核酸区域被甲基化的程度。例如,这种频率可用于描述一组来自组织样品的细胞在核苷酸基因座或核酸区域被甲基化或未被甲基化的程度。本文使用的“核苷酸基因座”是指核苷酸在核酸分子中的位置。甲基化的核苷酸的核苷酸基因座是指甲基化的核苷酸在核酸分子中的位置。典型地,人类dna的甲基化发生在包括相邻的鸟嘌呤和胞嘧啶的双核苷酸序列上,其中胞嘧啶位于鸟嘌呤的5'位(也被称为cpg双核苷酸序列)。人类基因组中cpg双核苷酸内的大部分胞嘧啶是甲基化的,然而在特定的cpg双核苷酸丰富的基因组区域中仍有一些是未甲基化的,被称为cpg岛(参见,例如antequera等人(1990)cell62:503–514)。如本文所用,“cpg岛”是指基因组dna的g:c-丰富的区域,相对于总基因组dna含有数量增加的cpg双核苷酸。cpg岛的长度可以为至少100个、200个或更多个碱基对,其中该区域的g:c含量为至少50%,且观测到的cpg频率与期望频率的比值为0.6;在一些情况下,cpg岛的长度可以为至少500个碱基对,其中该区域的g:c含量为至少55%),且观测到的cpg频率与期望频率的比值为0.65。观测到的cpg频率与期望频率的比可以根据gardiner-garden等人(1987)j.mol.biol.196:261–281中提供的方法计算。例如,观测到的cpg频率与期望频率的比可以根据公式r=(a×b)/(c×d)计算,其中r是观测到的cpg频率与期望频率的比值,a是所分析序列中cpg双核苷酸的数量,b是所分析序列中核苷酸的总数量,c是所分析序列中c核苷酸的总数量,以及d是所分析序列中g核苷酸的总数量。典型地,在cpg岛(例如在启动子区域)中确定甲基化状态。应认识到,尽管人类基因组中的其他序列倾向于dna甲基化,诸如cpa和cpt(参见,例如ramsahoye(2000)proc.natl.acad.sci.usa97:5237–5242;salmon和kaye(1970)biochim.biophys.acta.204:340–351;grafstrom(1985)nucleicacidsres.13:2827–2842;nyce(1986)nucleicacidsres.14:4353–4367;woodcock(1987)biochem.biophys.res.commun.145:888-894)。如本文所用,根据核酸分子的甲基化状态修饰核酸分子的核苷酸的试剂或甲基化特异性试剂,是指可以以反映核酸分子的甲基化状态的方式改变核酸分子的核苷酸序列的化合物或组合物或其他剂。用这种试剂处理核酸分子的方法可以包括将核酸分子与试剂接触,如果需要再加上额外的步骤,以完成所需的对核苷酸序列的改变。这种核酸分子的核苷酸序列中的改变可以导致核酸分子中每个甲基化核苷酸都被修改成了不同的核苷酸。这种核酸核苷酸序列中的改变可以导致核酸分子中每个未甲基化核苷酸都被修改成了不同的核苷酸。这种核酸核苷酸序列中的改变可以导致核酸分子中每个所选择的未甲基化核苷酸(例如,每个未甲基化胞嘧啶)都被修改成了不同的核苷酸。使用这种试剂改变核酸核苷酸序列可以导致核酸分子中每个核苷酸是甲基化核苷酸(例如,每个甲基化胞嘧啶)都被修改成了不同的核苷酸。如本文所用,使用的修饰所选择的核苷酸的试剂是指修改核酸分子中典型存在的四种核苷酸(dna为c、g、t和a以及rna为c、g、u和a)中的一种核苷酸的试剂,使得试剂修改一种核苷酸而不修改其他三种核苷酸。在一种示例性实施方式中,这种试剂修饰未甲基化的所选择的核苷酸以产生不同的核苷酸。在另一种示例性实施方式中,这种试剂可以使未甲基化胞嘧啶核苷酸脱去氨基。一种示例性试剂是亚硫酸氢盐。如本文所用,术语“亚硫酸氢盐试剂”是指在一些实施方式中包括亚硫酸氢盐(bisulfite)、重亚硫酸盐(disulfite)、亚硫酸氢(hydrogensulfite)或其组合的试剂,用于例如在cpg双核苷酸序列中区分甲基化的和未甲基化的胞嘧啶。术语“甲基化测定”是指用于确定核酸的序列内一个或多个cpg双核苷酸序列的甲基化状态的任何测定。术语“msap-pcr”(甲基化敏感性随机引物聚合酶链反应)是指允许使用cg-丰富的引物以集中于最可能含有cpg双核苷酸的区域对基因组进行全局扫描的本领域认可的技术,并由gonzalgo等人(1997)cancerresearch57:594–599中所述的。术语“methylighttm”是指本领域认可的基于荧光的实时pcr技术,由eads等人(1999)cancerres.59:2302–2306中所述的。术语“heavymethyltm”是指其中覆盖扩增引物之间的或被扩增引物覆盖的cpg位置的甲基化特异性阻断探针(本文中也称为阻断剂),能够使核酸样品的甲基化特异性选择性扩增进行的测定。术语“heavymethyltmmethylighttm”测定是指heavymethyltmmethylighttm测定,其是methylighttm测定的变体,其中methylighttm测定与覆盖扩增引物之间的cpg位置的甲基化特异性阻断探针相结合。术语“ms-snupe”(甲基化敏感性单核苷酸引物延伸)是指由gonzalgo&jones(1997)nucleicacidsres.25:2529–2531所描述的本领域认可的测定。术语“msp”(甲基化特异性pcr)是指由herman等人(1996)proc.natl.acad.sci.usa93:9821–9826和由美国专利no.5,786,146所描述的本领域认可的甲基化测定。术语“cobra”(结合亚硫酸氢盐限制性分析)是指由xiong&laird(1997)nucleicacidsres.25:2532–2534所描述的本领域认可的甲基化测定。术语“mca”(甲基化cpg岛扩增)是指由toyota等人(1999)cancerres.59:2307–12和在wo00/26401a1中所描述的甲基化测定。如本文所用,“所选择的核苷酸”是指核酸分子中典型存在的四种核苷酸(dna为c、g、t和a以及rna为c、g、u和a)中的一种核苷酸,并且可以包括典型存在的核苷酸的甲基化衍生物(例如,当c是所选择的核苷酸时,甲基化的和未甲基化的c都包括在所选择的核苷酸的意义之内),而甲基化的所选择的核苷酸特定地是指甲基化的典型存在的核苷酸,且未甲基化的所选择的核苷酸特定地是指未甲基化的典型存在的核苷酸。术语“甲基化特异性限制性酶”或“甲基化敏感性限制性酶”是指根据其识别位点的甲基化状态选择性地消化核酸的酶。在当识别位点没有被甲基化或者是半甲基化时限制性酶会特定地进行切割的情况下,如果识别位点被甲基化,该切割将不会发生或者将以显著降低的效率发生。在当识别位点被甲基化时限制性酶会特定地进行切割的情况下,如果识别位点没有被甲基化,该切割将不会发生或者将以显著降低的效率发生。优选的是甲基化特异性限制性酶,其识别序列含有cg双核苷酸(例如诸如cgcg或cccggg的识别序列)。对于一些实施方式,进一步优选的是如果该双核苷酸中的胞嘧啶在碳原子c5处被甲基化则不会进行切割的限制性酶。如本文所用,“不同的核苷酸”是指化学上不同于所选择的核苷酸的核苷酸,典型地使得不同的核苷酸具有不同于所选择的核苷酸的watson-crick碱基配对性质,其中与所选择的核苷酸互补的典型存在的核苷酸和与不同的核苷酸互补的典型存在的核苷酸是不一样的。例如,当c是所选择的核苷酸时,u或t可以是不同的核苷酸,其通过c对g的互补性和u或t对a的互补性示例。如本文所用,与所选择的核苷酸互补的核苷酸或与不同的核苷酸互补的核苷酸是指,在高严格性条件下,该核苷酸与所选择的核苷酸或不同的核苷酸的碱基对相比于与典型存在的四种核苷酸中的三种互补的核苷酸的碱基对具有更高的亲和力。互补性的实例为在dna(例如a-t和c-g)和rna(例如a-u和c-g)中的watson-crick碱基配对。因此,例如,在高严格性条件下,g对c的碱基对相比于g对g、a或t的碱基对具有更高的亲和力,因此,当c是所选择的核苷酸时,g是与所选择的核苷酸互补的核苷酸。如本文所用,给定标记物的“敏感性”是指报告dna甲基化值高于区分肿瘤样品和非肿瘤样品之间的阈值的样品的百分比。在一些实施方式中,阳性定义为报告dna甲基化值高于阈值(例如,与疾病相关的范围)的组织学证实的肿瘤,且假阴性定义为报告dna甲基化值低于阈值(例如,与无疾病相关的范围)的组织学证实的肿瘤。因此,敏感性的值反映了从已知的患病样品中获得的给定标记物的dna甲基化测量将在疾病相关测量的范围内的可能性。如这里所定义,所计算的敏感性值的临床意义代表了对当将给定标记物应用于具有该病症的受试者时,给定标记物检测到存在临床病症的可能性的估计。如本文所用,给定标记物的“特异性”是指报告dna甲基化值低于区分肿瘤样品和非肿瘤样品之间的阈值的非肿瘤样品的百分比。在一些实施方式中,阴性定义为报告dna甲基化值低于阈值(例如,与无疾病相关的范围)的组织学证实的非肿瘤样品,且假阳性定义为报告dna甲基化值高于阈值(例如,与疾病相关的范围)的组织学证实的非肿瘤样品。因此,特异性的值反映了从已知的非肿瘤样品中获得的给定标记物的dna甲基化测量将在无疾病相关测量的范围内的可能性。如这里所定义,所计算的特异性值的临床意义代表了对当将给定标记物应用于没有该病症的患者时,给定标记物检测到不存在临床病症的可能性的估计。本文使用的术语“auc”是“曲线下面积”的缩写。尤其地,它是指受试者工作特征(roc)曲线下的面积。roc曲线是对于诊断测试的不同的可能切点,真阳性率相对假阳性率的图。它示出了敏感性和特异性之间的权衡,取决于所选择的切点(敏感性的任何增加都会伴随特异性的降低)。roc曲线下面积(auc)是对诊断测试的准确性的测量(面积越大越好;最优值为1;随机测试的roc曲线位于对角线上,面积为0.5;参考:j.p.egan.(1975)signaldetectiontheoryandrocanalysis,academicpress,newyork)。如本文所用,术语“肿瘤”是指“异常的组织块,其生长超过了正常组织的生长且与正常组织的生长不协调”,参考,例如willisra,“thespreadoftumorsinthehumanbody”,london,butterworth&co,1952。如本文所用,术语“腺瘤”是指腺起源的良性肿瘤。虽然这些增生是良性的,但随时间推移可能发展成恶性的。术语“癌前”或“肿瘤前”及其等同语是指正在发生恶性转变的任何细胞增殖疾患。肿瘤、腺瘤、癌等的“部位”或“区域”是指肿瘤、腺瘤、癌等所位于的受试者体内的组织、器官、细胞类型、解剖区、身体部位等。如本文所用,“诊断”测试应用包括检测或鉴定受试者的疾病状态或病症,确定受试者将感染给定疾病或病症的可能性,确定患有疾病或病症的受试者将响应疗法的可能性,确定患有疾病或病症的受试者的预后(或其可能的发展或消退),以及确定对患有疾病或病症的受试者的治疗效果。例如,诊断可用于检测受试者是否存在肿瘤或感染肿瘤的可能性,或该受试者将对化合物(例如,药学,例如药物)或其他治疗响应良好的可能性。如本文所用,术语“标记物”是指能够通过区分疾患相关的细胞(例如,与疾患相关的非癌细胞)(例如,与疾患相关的癌细胞)与正常细胞来诊断疾患(例如,非癌疾患)(例如,癌性疾患)的物质(例如,核酸或核酸的区域),例如,基于其甲基化状态。术语“分离的”当关于核酸使用时,如“分离的寡核苷酸”是指从至少一种污染核酸中被鉴定并分离出来的核酸序列,它通常在它的自然来源中与这类污染核酸相关联。分离的核酸以不同于它在自然中存在的形式或环境存在。相比之下,非分离的核酸,诸如dna和rna,被发现处于它们存在于自然中的状态。非分离的核酸的实例包括:在宿主细胞染色体上靠近邻近基因发现的给定dna序列(例如,基因);rna序列,诸如编码特定蛋白质的特定mrna序列,与编码多种蛋白质的许多其他mrna以混合物存在于细胞中。然而,编码特定蛋白质的分离的核酸包括,以举例的方式,在通常表达该蛋白质的细胞中的这类核酸,其中该核酸位于的染色体位置不同于其在自然细胞中的染色体位置,或者该核酸两侧有与自然中存在的不同的核酸序列。分离的核酸或寡核苷酸可以以单链或双链的形式存在。当利用分离的核酸或寡核苷酸来表达蛋白质时,寡核苷酸将至少含有链有义或编码链(即,寡核苷酸可以是单链的),也可以含有有义链和反义链两者(即,寡核苷酸可以是双链的)。分离的核酸在从其自然环境或典型环境中分离之后,可以通过与其他核酸或分子结合。例如,分离的核酸可以存在于宿主细胞中,其中将分离的核酸放置于宿主细胞中例如用于异源表达。术语“纯化的”是指从其自然环境中移除的、分离的或分开的分子,或核酸或氨基酸序列。因此,“分离的核酸序列”可以是纯化的核酸序列。“完全纯化的”分子是至少60%不含,优选地是至少75%不含,且更优选地是至少90%不含与它们自然相关的其他组分。如本文所用,术语“纯化的”或“纯化”也指从样品中去除污染物。去除污染的蛋白质会导致样品中感兴趣的多肽或核酸的百分比增加。在另一实例中,重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达,且通过去除宿主细胞蛋白质纯化多肽;重组多肽的百分比因此在样品中增加。术语“组合物包括”给定的多核苷酸序列或多肽泛指含有给定多核苷酸序列或多肽的任何组合物。组合物可以包括含有盐(例如,nacl)、洗涤剂(例如,sds)和其他组分(例如,denhardt’s溶液、乳粉、鲑鱼精dna等)的水溶液。术语“样品”以其最广泛的意义使用。在一种意义上,它可以指动物细胞或组织。在另一种意义上,它意指包括从任何来源获得的标本或培养物,以及生物样品和环境样品。生物样品可以从植物或动物(包括人类)中获得,并涵盖液体、固体、组织和气体。环境样品包括环境材料,诸如表面物质、土壤、水和工业样品。这些实例不应被解释对适用于本发明的样品类型的限制。如本文所用,如在一些情况下使用的“远端样品”涉及间接地从样品的非细胞、非组织或非器官来源的部位收集的样品。例如,当源自胰腺的样品材料是在粪便样品(例如,不是来自直接取自胰腺的样品)中评估时,该样品是远端样品。如本文所用,术语“患者”或“受试者”是指接受本技术提供的各种测试的生物体。术语“受试者”包括动物,优选地为哺乳动物,包括人类。在优选的实施方式中,受试者是灵长类。在更优选的实施方式中,受试者是人类。如本文所用,术语“试剂盒”是指用于递送材料的任何递送系统。在反应测定的情况下,这类递送系统包括允许从一个位置向另一个位置储存、运输或递送反应试剂(例如,寡核苷酸、酶等在适当的容器中)和/或支持材料(例如,缓冲液、用于执行测定的书面说明等)的系统。例如,试剂盒包括一个或多个含有相关反应试剂和/或支持材料的包围件(例如,盒子)。如本文所用,术语“分散试剂盒(fragmentedkit)”是指包括两个或更多个单独的容器的递送系统,每个容器含有总试剂盒组分的子部分。多个容器可以一起或单独地递送给目标接受者。例如,第一容器可以含有在测定中使用的酶,而第二容器则含有寡核苷酸。术语“分散试剂盒”旨在涵盖含有联邦食品、药品及化妆品法案的520(e)部分中规定的分析物专用试剂(asr's)的试剂盒,但不限于此。实际上,包括两个或更多个单独的容器且每个容器含有总试剂盒组分的子部分的任何递送系统都被包括在术语“分散试剂盒”中。相比之下,“组合试剂盒”是指在单容器中含有反应测定的全部组分的递送系统(例如,在单盒子中装有每一个所需组分)。术语“试剂盒”包括分散试剂盒和组合试剂盒两者。技术的实施方式与传统观点认为胰腺癌是具有不可避免的高死亡率的固有快速增长的恶性肿瘤不同,最近的计算模型表明,其从分子起始到癌前发展、癌症进化和转移的进程平均需要20年的时间(参见,yachida,s.,等人,nature,2010.467(7319):p.1114-1117),很像结直肠肿瘤的生长速率和自然病史(参见,stryker,s.j.,等人,gastroenterology,1987.93(5):p.1009-13;bozic,i.,等人,proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica,2010.107(43):p.18545-50)。癌前期和早期t1癌症阶段两者处的长的症状前滞留时间实际上可以为筛查检测提供相对长的窗口。胰腺中的癌症前体病变在组织学上被详细描述(参见,zamboni,g.,等人,clinicalgastroenterology,2013.27(2):p.299-322)。这些病变非常常见,发生在13-25%的普通人群中,并提供了可潜在地转化为胰腺癌预防的筛查靶标。然而,目前它们的检测是随意的且其管理存在问题。它们很少引起症状,且目前主要以偶然发现而被检测到。最常见的类型是胰腺上皮内瘤变(panin),其很难通过成像学检测并主要为组织学发现。通过成像学可检测的癌前期典型地为囊性的,并包括通常无害的浆液性囊腺瘤、具有中等进展风险的导管内乳头状黏液性肿瘤(ipmns),以及具有高恶性潜能的粘液性囊性肿瘤(参见,morris-stiff,g.,等人,hpb:theofficialjournaloftheinternationalhepatopancreatobiliaryassociation,2013.15(3):p.175-81)。大多数癌前期不会进展,且现有的预测风险的方法不完善。目前使用的基于放射照像的结构特征、细胞学取样或分子测试的评分系统未能准确地预测组织学(参见,correa-gallego,c.,等人,pancreatology:officialjournaloftheinternationalassociationofpancreatology,2010.10(2-3):p.144-50)。因此,许多起动了胰腺切除的病变被证明是非肿瘤性的或不含有高度异型增生(参见,correa-gallego,c.,等人,pancreatology:officialjournaloftheinternationalassociationofpancreatology,2010.10(2-3):p.144-50)。胰腺癌进展的缓慢的自然病史为检测可治愈的胰腺肿瘤提供了充足的机会。创新挑战是开发无创或微创的工具,使其具有高临床敏感性并具有准确辨别最适合切除的有高度异型增生的癌前期的能力。在开发本发明的实施方式的过程期间,所进行的实验比较了来自患有ipmn-hgd、panin-3或pdac的受试者的胰腺组织的dna标记物的甲基化状态与来自对照受试者(例如,相应的组织类型患有ipmn-低度异型增生(ipmn-lgd)、panin-1和panin-2的受试者)的同一dna标记物的甲基化状态。这类实验鉴定并验证了将有高度癌前体(ipmn-hgd、panin-3)或浸润性癌(pdac)的病例组与有正常胰腺或低度癌前病变(ipmn-低度异型增生(ipmn-lgd)、panin-1和panin-2)的对照组区分开来的候选甲基化dna标记物(参见实施例i、ii、iv和v)。因此,本文提供了用于筛查(例如,监测)胰腺高度异型增生的技术,并特别地但不仅限于用于在受试者中检测胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的存在的方法、组合物和相关用途。鉴定了能够检测胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的标记物和/或标记物组(例如,具有表2和表6提供的注释的染色体区域)(参见实施例i、ii、iv、和v)(bmp3、ndrg4、abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、lrrc4、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781)。尽管本文的公开涉及某些说明性实施方式,但应该理解,这些实施方式是以举例的方式而非限制的方式呈现的。方法包括确定从受试者分离的生物样品中至少一种甲基化标记物的甲基化状态,其中标记物的甲基化状态的变化表明了胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的存在或类别。具体的实施方式涉及包括差异甲基化区域(dmr,例如dmr1-96或dmr1、21、24、25、26、55、70、77、81、84、92、95和96(表2和表6中))的标记物,用于诊断(例如,筛查)胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。除了其中分析包括本文提供的以及表2和表6中列出的dmr(例如,dmr1-96或dmr1、21、24、25、26、55、70、77、81、84、92、95和96)的至少一种标记物、标记物的区域或标记物的碱基的甲基化分析的实施方式之外,本技术还提供了包括包含dmr的至少一种标记物、标记物的区域或标记物的碱基的标记物组,具有用于检测受试者中的胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的实用性。本技术的一些实施方式基于对包括dmr的至少一种标记物、标记物的区域或标记物的碱基的cpg甲基化状态的分析。在一些实施方式中,本技术提供了使用亚硫酸氢盐技术结合一种或多种甲基化测定以确定包括dmr(例如,表2和表6中提供的(例如,dmr1-96))的至少一种标记物内的cpg双核苷酸序列的甲基化状态。基因组cpg双核苷酸可以是甲基化的或未甲基化的(可替代地分别称为高-甲基化的和低-甲基化的)。然而,本发明的方法适用于分析异质性的生物样品,例如,在远端样品(例如血液、器官流出物或粪便)的背景下,低浓度的肿瘤细胞或来自其的生物材料。因此,当分析这种样品内cpg位置的甲基化状态时,可以使用定量化测定来确定特定cpg位置处的甲基化水平(例如,百分比、分率、比值、比例或程度)。根据本技术,测定包括dmr的标记物中cpg双核苷酸序列的甲基化状态在诊断和表征受试者中胰腺高度异型增生(ipmn-hgd、panin-3或pdac)两方面均具有实用性。标记物的组合在一些实施方式中,本技术涉及评估包括表2和表6中的两种或更多种dmr(例如,dmrnos.1-96中的两种或更多种dmr)的标记物的组合的甲基化状态。在一些实施方式中,评估多于一种标记物的甲基化状态增加了用于鉴定受试者中胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的存在的筛查或诊断的特异性和/或敏感性。通过各种标记物的组合预测各种癌症,例如通过与预测的特异性和敏感性相关的统计技术进行鉴定。本技术提供了用于鉴定一些癌症的预测性组合和经验证的预测性组合的方法。在一些实施方式中,标记物(例如,包括dmr)的组合预测了肿瘤的部位。例如,鉴定了能够检测胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的标记物和/或标记物组(例如,具有表2和表6提供的注释的染色体区域)(参见,实施例i、ii、iv、和v)(bmp3、ndrg4、abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、lrrc4、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781)。测定甲基化状态的方法分析核酸是否存在5-甲基胞嘧啶的最常用的方法是基于由frommer等人所描述的用于检测dna中的5-甲基胞嘧啶(frommer等人(1992)proc.natl.acad.sci.usa89:1827–31)或其变体的亚硫酸氢盐方法。映射5-甲基胞嘧啶的亚硫酸氢盐方法是基于观察到胞嘧啶与亚硫酸氢离子(又称为亚硫酸氢盐)发生反应,而5-甲基胞嘧啶不发生反应。反应通常按照以下步骤进行:首先,胞嘧啶与亚硫酸氢反应形成磺化胞嘧啶。接下来,磺化反应中间体自发脱氨基导致生成磺化尿嘧啶。最后,磺化尿嘧啶在碱性条件下脱磺形成尿嘧啶。因为尿嘧啶与腺嘌呤形成碱基对(因而表现为胸腺嘧啶),而5-甲基胞嘧啶与鸟嘌呤形成碱基对(因而表现为胞嘧啶),所以检测是可能的。这使得通过例如亚硫酸氢盐基因组测序(griggg,&clarks,bioessays(1994)16:431–36;griggg,dnaseq.(1996)6:189–98)或如美国专利no.5,786,146中所公开的甲基化特异性pcr(msp)来辨别甲基化胞嘧啶与非甲基化胞嘧啶成为可能。一些常规技术涉及的方法包括将待分析的dna封装在琼脂糖基质中,从而防止dna的扩散和复性(亚硫酸氢盐只与单链dna反应),以及用快速透析代替沉淀和纯化步骤(oleka,等人(1996)“amodifiedandimprovedmethodforbisulfitebasedcytosinemethylationanalysis”nucleicacidsres.24:5064-6)。因此,分析个体的细胞的甲基化状态是可能的,说明了该方法的实用性和敏感性。用于检测5-甲基胞嘧啶的常规方法的综述由rein,t.,等人(1998)nucleicacidsres.26:2255提供。亚硫酸氢盐技术典型地涉及在进行亚硫酸氢盐处理之后扩增已知核酸的短特定片段,然后通过测序(olek&walter(1997)nat.genet.17:275–6)或引物延伸反应(gonzalgo&jones(1997)nucleicacidsres.25:2529–31;wo95/00669;美国专利no.6,251,594)测定产物以分析个体胞嘧啶的位置。一些方法使用酶消化(xiong&laird(1997)nucleicacidsres.25:2532–4)。通过杂交进行检测也已在本领域中描述(olek等人,wo99/28498)。此外,已经描述了使用亚硫酸氢盐技术进行关于个体基因的甲基化检测(grigg&clark(1994)bioessays16:431–6,;zeschnigk等人(1997)hummolgenet.6:387–95;feil等人(1994)nucleicacidsres.22:695;martin等人(1995)gene157:261–4;wo9746705;wo9515373)。根据本技术,各种甲基化测定程序都是本领域已知的且可以与亚硫酸氢盐处理结合使用。这些测定允许确定核酸序列内一个或多个cpg二核苷酸(例如,cpg岛)的甲基化状态。这类测定除了其他技术外还涉及亚硫酸氢盐处理的核酸的测序、pcr(用于序列特异性扩增)、southernblot分析和甲基化敏感性限制性酶的使用。例如,通过使用亚硫酸氢盐处理(frommer等人(1992)proc.natl.acad.sci.usa89:1827–1831)已经将基因组测序简化为了分析甲基化模式和5-甲基胞嘧啶分布。此外,发现对从亚硫酸氢盐转化的dna扩增出的pcr产物进行限制性酶消化可用于评估甲基化状态,例如由sadri&hornsby(1997)nucl.acidsres.24:5058–5059所述的,或如被称为cobra(结合重亚硫酸盐的限制性酶分析)(xiong&laird(1997)nucleicacidsres.25:2532–2534)的方法中所体现。cobratm分析是定量化的甲基化测定,可用于确定少量基因组dna中特定基因座处的dna甲基化水平(xiong&laird,nucleicacidsres.25:2532-2534,1997)。简而言之,限制性酶消化用于揭示在亚硫酸氢钠处理过的dna的pcr产物中甲基化依赖性序列的差异。首先,根据frommer等人(proc.natl.acad.sci.usa89:1827-1831,1992)描述的程序通过标准亚硫酸氢盐处理将甲基化依赖性序列差异引入基因组dna。然后,使用对感兴趣的cpg岛有特异性的引物对亚硫酸氢盐转化后的dna进行pcr扩增,之后通过限制性内切酶消化、凝胶电泳并使用特异性标记杂交探针检测。原始dna样品中的甲基化水平由以线性定量化方式在宽广的dna甲基化水平范围内的已消化的和未消化的pcr产物的相对数量表示。此外,本技术可以可靠地应用于从显微切割的石蜡包埋组织样品中获得的dna。用于cobratm分析的典型的试剂(例如,如典型的基于cobratm的试剂盒中可能发现的)可以包括但不限于:用于特定基因座(例如,特异性基因、标记物、dmr、基因区域、标记物区域、亚硫酸氢盐处理后的dna序列、cpg岛等)的pcr引物;限制性酶和适当的缓冲液;基因-杂交寡核苷酸;对照杂交寡核苷酸;用于寡核苷酸探针的激酶标记试剂盒;以及标记核苷酸。此外,亚硫酸氢盐转化试剂可以包括:dna变性缓冲液;磺化缓冲液;dna回收试剂或试剂盒(例如,沉淀、超滤、亲和层析柱);脱磺缓冲液;以及dna回收组件。优选地,诸如“methylighttm”(基于荧光的实时pcr技术)(eads等人,cancerres.59:2302-2306,1999)、ms-snupetm(甲基化敏感性单核苷酸引物延伸)反应(gonzalgo&jones,nucleicacidsres.25:2529-2531,1997)、甲基化特异性pcr(“msp”;herman等人,proc.natl.acad.sci.usa93:9821-9826,1996;美国专利no.5,786,146)和甲基化cpg岛扩增(“mca”;toyota等人,cancerres.59:2307-12,1999)的测定被单独使用或与这些方法中的一种或多种结合使用。“heavymethyltm”测定、技术是用于评估甲基化差异的定量化方法,基于亚硫酸氢盐处理后的dna的甲基化特异性扩增。覆盖扩增引物之间的或被扩增引物覆盖的cpg位置的甲基化特异性阻断探针(“阻断剂”)能够使核酸样品进行甲基化特异性选择性扩增。术语“heavymethyltmmethylighttm”测定是指heavymethyltmmethylighttm测定,其是methylighttm测定的变体,其中methylighttm测定与覆盖扩增引物之间的cpg位置的甲基化特异性阻断探针相结合。heavymethyltm测定也可以与甲基化特异性扩增引物结合使用。用于heavymethyltm分析的典型的试剂(例如,如典型的基于methylighttm的试剂盒中可能发现的)可以包括但不限于:用于特定基因座(例如,特异性基因、标记物、dmr、基因区域、标记物区域、亚硫酸氢盐处理后的dna序列、cpg岛或亚硫酸氢盐处理后的dna序列或cpg岛等)的pcr引物;阻断性寡核苷酸;优化的pcr缓冲液和脱氧核苷酸;以及taq聚合酶。msp(甲基化特异性pcr)允许对cpg岛内几乎任何一组cpg位点的甲基化状态进行评估,不依赖于甲基化敏感性限制性酶的使用(herman等人proc.natl.acad.sci.usa93:9821-9826,1996;美国专利no.5,786,146)。简而言之,用亚硫酸氢钠修饰dna,其将未甲基化的胞嘧啶转化为尿嘧啶,但不改变甲基化的胞嘧啶,并随后使用对甲基化dna有特异性的引物相对于对非甲基化dna有特异性的引物对产物进行扩增。msp只需要少量的dna,对给定cpg岛基因座的0.1%甲基化的等位基因是敏感的,并可以在从石蜡包埋样品中提取的dna上进行。用于msp分析的典型的试剂(例如,如典型的基于msp的试剂盒中可能发现的)可以包括但不限于:用于特定基因座(例如,特异性基因、标记物、dmr、基因区域、标记物区域、亚硫酸氢盐处理后的dna序列、cpg岛等)的甲基化的和未甲基化的pcr引物;优化的pcr缓冲液和脱氧核苷酸,以及特异性探针。methylighttm测定是高通量的定量甲基化测定,利用基于荧光的实时pcr(例如,),在pcr步骤之后不需要进一步操作(eads等人,cancerres.59:2302-2306,1999)。简而言之,methylighttm工艺始于基因组dna的混合样品,其在亚硫酸氢钠反应中根据标准程序(亚硫酸氢盐工艺将未甲基化的胞嘧啶残基转化为尿嘧啶)被转化为甲基化依赖性序列差异的混合池。然后,在“偏向性”反应中进行基于荧光的pcr,例如,用与已知的cpg双核苷酸重叠的pcr引物。序列辨别发生在扩增工艺的水平和荧光检测工艺的水平两者上。methylighttm测定被用作对核酸(例如,基因组dna样品)中的甲基化模式的定量测试,其中序列辨别发生在探针杂交的水平。在定量化方案中,pcr反应提供了在与特定的假定甲基化位点重叠的荧光探针的存在下进行甲基化特异性扩增。对输入dna的量的无偏对照是由其中引物和探针均不覆盖任何cpg双核苷酸的反应而提供的。可替代地,基因组甲基化的定性测试通过用不覆盖已知的甲基化位点的对照寡核苷酸(例如,heavymethyltm和msp技术的基于荧光的方式)或用覆盖潜在的甲基化位点的寡核苷酸探测偏向性pcr池来实现。methylighttm工艺可与任何合适的探针(例如,探针、探针等)一起使用。例如,在一些应用中,用亚硫酸氢钠处理双链基因组dna,并使其进行使用探针例如与msp引物和/或heavymethyl阻断性寡核苷酸和探针的两组pcr反应之一。探针是用荧光“报告”和“淬灭”分子双重标记的,并被设计成对相对高gc含量的区域有特异性,使得它在pcr循环中于比正向或反向引物高出约10℃的温度处解链。这使得探针在pcr退火/延伸步骤期间保持完全杂化。随着在pcr期间taq聚合酶酶促地合成新的链,它将最终达到退火的探针。然后,taq聚合酶5'至3'内切酶活性将通过消化探针以释放荧光报告分子而置换探针,用于使用实时荧光检测系统定量检测其当前未淬灭的信号。用于methylighttm分析的典型的试剂(例如,如典型的基于methylighttm的试剂盒中可能发现的)可以包括但不限于:用于特定基因座(例如,特异性基因、标记物、dmr、基因区域、标记物区域、亚硫酸氢盐处理后的dna序列、cpg岛等)的pcr引物;或探针;优化的pcr缓冲液和脱氧核苷酸;以及taq聚合酶。qmtm(定量甲基化)测定是对基因组dna样品中的甲基化模式的可替代的定量测试,其中序列辨别发生在探针杂交的水平。在这种定量化方案中,pcr反应提供了在与特定的假定甲基化位点重叠的荧光探针的存在下进行无偏扩增。对输入dna的量的无偏对照是由其中引物和探针均不覆盖任何cpg双核苷酸的反应提供的。可替代地,基因组甲基化的定性测试通过用不覆盖已知的甲基化位点的对照寡核苷酸(heavymethyltm和msp技术的基于荧光的方式)或用覆盖潜在的甲基化位点的寡核苷酸探测偏向性pcr池来实现。qmtm过程可与任何合适的探针(例如,探针、探针)一起在扩增工艺中使用。例如,用亚硫酸氢钠处理双链基因组dna,然后施加无偏引物和探针。探针是用荧光“报告”和“淬灭”分子双重标记的,并被设计成对相对高gc含量的区域有特异性,使得它在pcr循环中于比正向或反向引物高出约10℃的温度处解链。这使得探针在pcr退火/延伸步骤期间保持完全杂化。随着在pcr期间taq聚合酶酶促地合成新的链,它将最终达到退火的探针。然后,taq聚合酶5'至3'内切酶活性将通过消化探针以释放荧光报告分子而置换探针,用于使用实时荧光检测系统定量检测其当前未淬灭的信号。用于qmtm分析的典型的试剂(例如,如典型的基于qmtm的试剂盒中可能存在的)可以包括但不限于:用于特定基因座(例如,特异性基因、标记物、dmr、基因区域、标记物区域、亚硫酸氢盐处理后的dna序列、cpg岛等)的pcr引物;或探针;优化的pcr缓冲液和脱氧核苷酸;以及taq聚合酶。ms-snupetm技术是用于评估在特定cpg位点处的甲基化差异的定量方法,基于用亚硫酸氢盐处理dna,之后进行单核苷酸引物延伸(gonzalgo&jones,nucleicacidsres.25:2529-2531,1997)。简而言之,基因组dna与亚硫酸氢钠反应,以将未甲基化的胞嘧啶转化为尿嘧啶,同时保持5-甲基胞嘧啶不变。然后,使用对亚硫酸氢盐转化后的dna有特异性的pcr引物对所需的靶标序列进行扩增,并分离所得到的产物,且将该产物作为用于感兴趣的cpg位点处的甲基化分析的模板。可以分析少量的dna(例如,显微切割的病理切片),且它避免了利用限制性酶来确定cpg位点处的甲基化状态。用于ms-snupetm分析的典型的试剂(例如,如典型的基于ms-snupetm的试剂盒中可能发现的)可以包括但不限于:用于特定基因座(例如,特异性基因、标记物、dmr、基因区域、标记物区域、亚硫酸氢盐处理后的dna序列、cpg岛等)的pcr引物;优化的pcr缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于特定基因座的ms-snupetm引物;反应缓冲液(用于ms-snupe反应);以及标记核苷酸。此外,亚硫酸氢盐转化试剂可以包括:dna变性缓冲液;磺化缓冲液;dna回收试剂或试剂盒(例如,沉淀、超滤、亲和层析柱);脱磺缓冲液;以及dna回收组件。简并代表性亚硫酸氢盐测序(rrbs)开始用亚硫酸氢盐处理核酸,以将所有未甲基化的胞嘧啶转化为尿嘧啶,然后进行限制性酶消化(例如,通过识别包括cg序列的位点的酶,诸如mspi),并在与接头配体耦合后进行片段的完整测序。限制性酶的选择富集了cpg密集区域的片段,减少了分析期间可能映射到多种基因位置的冗余序列的数量。因此,rrbs通过选择用于测序的限制性片段的子集(例如,通过使用制备性凝胶电泳选择尺寸)降低了核酸样品的复杂性。与全基因组亚硫酸氢盐测序不同的是,通过限制性酶消化产生的每个片段都含有至少一个cpg双核苷酸的dna甲基化信息。因此,rrbs富集了启动子、cpg岛和其他基因组特征的样品,在这些区域中有高频率的限制性酶切位点,并因此提供了评估一种或多种基因组基因座的甲基化状态的测定。rrbs的典型方案包括以下步骤:用限制性酶(诸如mspi)消化核酸样品,末端修复(fillinginoverhangs)和加a(a-tailing),连接接头,亚硫酸氢盐转化和pcr。参见,例如等人(2005)“genome-scalednamethylationmappingofclinicalsamplesatsingle-nucleotideresolution”natmethods7:133–6;meissner等人(2005)“reducedrepresentationbisulfitesequencingforcomparativehigh-resolutiondnamethylationanalysis”nucleicacidsres.33:5868–77。在一些实施方式中,使用定量的等位基因特异性实时靶标和信号扩增(quarts)测定来评估甲基化状态。在每个quarts测定中依次发生三个反应,包括一级反应中的扩增(反应1)和靶标探针裂解(反应2);和二级反应中的fret裂解和荧光信号生成(反应3)。当用特异性引物扩增靶标核酸时,具有活瓣序列的特异性检测探针与扩增子松散结合。在靶标结合位点存在特异性侵入寡核苷酸,通过在检测探针和活瓣序列之间切割而导致裂解以释放活瓣序列。活瓣序列与相应的fret盒的非发夹部分互补。因此,活瓣序列在fret盒上起侵入寡核苷酸的作用,并在fret盒荧光团和淬灭物之间引起裂解,其产生荧光信号。裂解反应可以每个靶标切割多个探针,并因此每个活瓣释放多个荧光团,提供指数型信号扩增。通过使用有不同染料的fret盒,quarts可以很好地检测到单反应中的多种靶标。参见,例如,zou等人(2010)“sensitivequantificationofmethylatedmarkerswithanovelmethylationspecifictechnology”clinchem56:a199;美国专利申请系列nos.12/946,737、12/946,745、12/946,752和61/548,639。术语“亚硫酸氢盐试剂”是指包括亚硫酸氢盐(bisulfite)、重亚硫酸盐(disulfite)、亚硫酸氢(hydrogensulfite)或其组合的试剂,如本文所公开可用于区分甲基化的和未甲基化的cpg双核苷酸序列。所述处理方法在本领域中是已知的(例如,pct/ep2004/011715)。优选地,亚硫酸氢盐处理在变性溶剂(诸如但不限于n-烯基甘醇(n-alkylenglycol)或二甘醇二甲醚(dme))的存在下进行,或在二氧六环或二氧六环衍生物的存在下进行。在一些实施方式中,所使用的变性溶剂的浓度在1%和35%(v/v)之间。在一些实施方式中,亚硫酸氢盐反应是在清除剂的存在下进行的,诸如但不限于色原烷衍生物,例如6-羟基-2,5,7,8-四甲基色原烷-2-羧酸或三羟基苯酸及其衍生物,例如没食子酸(参见:pct/ep2004/011715)。优选地,亚硫酸氢盐转化在30℃和70℃之间的反应温度下进行,其中在反应期间将温度短时间增加到超过85℃(参见:pct/ep2004/011715)。优选地,在定量之前对亚硫酸氢盐处理后的dna进行纯化。这可以通过本领域已知的任何方法进行,诸如但不限于超滤,例如通过microcontm柱(由milliporetm制造)。纯化根据修改后的制造商方案(参见,例如pct/ep2004/011715)进行。在一些实施方式中,使用根据本发明的引物寡核苷酸的组(例如,参见表3和表7)和扩增酶对处理后的dna片段进行扩增。数个dna区段的扩增可以在同一相同的反应容器中同时进行。典型地,使用聚合酶链反应(pcr)进行扩增。扩增子的长度典型地为100至2000个碱基对。在该方法的另一种实施方式中,可以使用甲基化特异性引物寡核苷酸检测在包含dmr(例如,dmr1-96;表2和表6)的标记物内的或附近的cpg位置的甲基化状态。这种技术(msp)已经在herman的美国专利no.6,265,171中描述。使用甲基化状态特异性引物来扩增亚硫酸氢盐处理后的dna允许将甲基化的和非甲基化的核酸进行区分。msp引物对含有至少一个与亚硫酸氢盐处理后的cpg双核苷酸杂交的引物。因此,所述引物的序列包括至少一个cpg双核苷酸。对非甲基化dna有特异性的msp引物在cpg中c位置的位置处含有“t”。通过扩增的方式获得的片段可以携带直接或间接可检测的标记。在一些实施方式中,标记是荧光标记、放射性核素或具有可在质谱仪中检测到的典型质量的可分开的分子片段。在所述标记为质量标记的情况下,一些实施方式提供的标记扩增子具有单个正的或负的净电荷,允许在质谱仪中更好的可检测性。检测可以借助例如基质辅助激光解吸/电离质谱(maldi)或使用电子喷雾质谱(esi)实施并可视化。适合这些测定技术的分离dna的方法是本领域已知的。尤其地,一些实施方式包括美国专利申请系列no.13/470,251(“isolationofnucleicacids(核酸的分离)”)中描述的核酸的分离。方法在一些实施方式中,提供了包括以下步骤的技术、方法:1)将从受试者获得的核酸(例如,从体液诸如粪便样品、血液样品或组织样品(例如,胰腺组织)中分离的,例如,基因组dna)与至少一种试剂或一系列试剂接触,试剂可以区分至少一种包括dmr(例如,dmr1-96或dmr1、21、24、25、26、55、70、77、81、84和92、95和96(表2和表6中))的标记物内的甲基化的和非甲基化的cpg双核苷酸;以及2)检测缺乏胰腺高度异型增生(ipmn-hgd、panin-3或pdac)(例如,提供大于或等于80%的敏感性和大于或等于80%的特异性)。在一些实施方式中,提供了包括以下步骤的技术、方法:1)将从受试者获得的核酸(例如,从体液诸如粪便样品、血液样品或组织样品(例如,胰腺组织)中分离的,例如,基因组dna)与至少一种试剂或一系列试剂接触,试剂可以区分至少一种包括dmr(例如,dmr1-96或dmr1、21、24、25、26、55、70、77、81、84和92、95和96(表2和表6中))的标记物内的甲基化的和非甲基化的cpg双核苷酸以及2)将胰腺高度异型增生(ipmn-hgd、panin-3或pdac)分类(例如,提供大于或等于80%的敏感性和大于或等于80%的特异性)。优选地,敏感性为从约70%至约100%,或从约80%至约90%,或从约80%至约85%。优选地,特异性为从约70%至约100%,或从约80%至约90%,或从约80%至约85%。基因组dna可以通过任何方式分离,包括使用可商购的试剂盒。简而言之,其中感兴趣的dna被细胞膜包裹在内,必须通过酶、化学或机械手段破裂和溶解生物样品。然后例如通过用蛋白酶k消化可以将蛋白质和其他污染物从dna溶液中清除。然后将基因组dna从溶液中回收。这可以借助各种方法进行,包括盐析、有机提取或将dna结合到固相载体上。方法的选择将受数个因素影响,包括时间、费用和所需的dna量。包括肿瘤物质或肿瘤前物质的所有临床样品类型均适合在本方法中使用,例如细胞系、组织学切片、活组织检查、石蜡包埋的组织、体液、粪便、结肠流出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞及其组合。在一些实施方式中,其中样品包括胰腺组织和/或胰液。本技术在用于制备样品和提供测试用核酸的方法上没有限制。例如,在一些实施方式中,使用直接基因捕获(例如,如美国专利申请系列no.61/485386中所详述的)或通过相关方法从粪便样品或从血液或从血浆样品中分离dna。然后,用至少一种试剂或一系列试剂处理基因组dna样品,试剂可以区分至少一种包括dmr(例如,dmr1-96,例如表2和表6中所提供的)的标记物内的甲基化的和非甲基化的cpg双核苷酸。在一些实施方式中,试剂将在5'-位置处未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或就杂交行为而言不同于胞嘧啶的另一种碱基。然而在一些实施方式中,试剂可以是甲基化敏感性限制性酶。在一些实施方式中,以某种方式处理基因组dna样品使得在5'位置处未甲基化的胞嘧啶碱基被转化为尿嘧啶、胸腺嘧啶或就杂交行为而言不同于胞嘧啶的另一种碱基。在一些实施方式中,这种处理使用亚硫酸氢盐(亚硫酸氢、重亚硫酸盐)进行,然后碱性水解。然后分析处理后的核酸以确定靶标基因序列(来自包括dmr(例如,选自dmr1-96中的至少一种dmr,例如如表2和表6中所提供的)的标记物的至少一个基因、基因组序列或核苷酸)的甲基化状态。分析方法可从本技术已知的方法中选择,包括本文所列的方法,例如,本文所述的quarts和msp。本技术涉及与胰腺高度异型增生(ipmn-hgd、panin-3或pdac)相关的任何样品的分析。例如,在一些实施方式中,样品包括从患者获得的组织和/或生物液体。在一些实施方式中,样品包括结直肠组织。在一些实施方式中,样品包括分泌物。在一些实施方式中,样品包括血液、血清、血浆、胃分泌物、胰液、胃肠活检样品、食管活检微解剖细胞、脱落到胃肠腔内的食管细胞和/或从粪便中收集的食管细胞。在一些实施方式中,受试者是人类。这些样品可以源自上消化道、下消化道,或包括来自上消化道和下消化道两者的细胞、组织和/或分泌物。样品可以包括来自肝脏、胆管、胰腺、胃、结肠、直肠、食管、小肠、阑尾、十二指肠、息肉、胆囊、肛门和/或腹膜的细胞、分泌物或组织。在一些实施方式中,样品包括细胞液、腹水、尿液、排泄物、胰腺液体、内镜检查期间获得的液体、血液、黏液或唾液。在一些实施方式中,样品是粪便样品。这种样品可以通过本领域已知的许多手段获得,诸如对技术人员将是显而易见的。例如,尿液和粪便样品很容易获得,而血液、腹水、血清或胰腺液体样品则可以通过例如使用针和注射器不经肠道获得。无细胞样品或基本无细胞的样品可以通过用本领域技术人员已知的各种技术处理样品来获得,这些技术包括但不限于离心和过滤。尽管通常优选不使用侵入性技术来获取样品,但获取诸如组织匀浆、组织切片和活检标本等样品仍然可能是更优选的。在本技术的一些实施方式中,提供了诊断受试者中胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的方法。本文所使用的术语“诊断(diagnosing)”和“诊断(diagnosis)”是指方法,通过该方法熟练的技术人员可以估计甚至确定受试者是否患有给定疾病或病症,或者是否可能在未来发展出给定疾病或病症。熟练的技术人员经常基于一个或多个诊断指标作出诊断,诸如例如生物标记物(例如,本文所公开的dmr),其甲基化状态指示病症的存在、严重性或不存在。涉及确定癌症的侵袭性和肿瘤复发的可能性的临床癌症预后(例如,针对胰腺高度异型增生(ipmn-hgd、panin-3或pdac))与诊断一起,以计划最有效的疗法。如果可以作出更准确的预后,或甚至可以评估患癌的潜在风险,那么就可以选择适当的疗法,且在一些情况下可以选择对患者不太严重的疗法。癌症生物标记物的评估(例如确定其甲基化状态)有助于将预后良好和/或患癌风险低而不需要治疗或需要限制性治疗的受试者与那些患癌或癌症复发的可能性高而可能受益于强度更大的治疗的受试者分开。因此,本文使用的“作出诊断”或“诊断”还包括作出确定患癌风险或确定预后,其可以基于本文所公开的诊断生物标记物(例如,dmr)的测量提供预测临床结果(有或没有医疗)、选择适当的治疗(或治疗是否会有效)或监测目前的治疗以及可能地改变治疗。此外,在目前公开的主题的一些实施方式中,可以作出生物标记物随时间的多种确定,以方便诊断和/或预后。生物标记物中的时间变化可以用于预测临床结果、监测胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的进展和/或监测针对癌症的适当治疗的有效性。例如在这种实施方式中,在有效治疗的过程期间,人们可以预期看到生物样品中本文所公开的一种或多种生物标记物(例如,dmr)(和如果被监测到,则可能地一种或多种额外的生物标记物)的甲基化状态随时间变化。在一些实施方式中,目前公开的主题还提供了用于确定是否开始或继续预防或治疗受试者中的胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的方法。在一些实施方式中,方法包括提供来自受试者的在一段时间内的一系列生物样品;分析一系列生物样品以确定每个生物样品中本文所公开的至少一种生物标记物的甲基化状态;以及比较每个生物样品中一种或多种生物标记物的甲基化状态的任何可测量的变化。时间段内生物标记物的甲基化状态的任何变化可以用于预测患胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的风险、预测临床结果、确定是否开始或继续预防或治疗癌症,以及目前的疗法是否有效地治疗胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。例如,第一时间点可以选在治疗开始之前,且第二时间点可以选在治疗开始之后的某个时间。可以在从不同时间点采集的每个样品中测量甲基化状态,并定性和/或定量所提到的差异。来自不同样品的生物标记物的甲基化状态的变化可能与受试者中疾患的风险(例如,患胰腺高级异型增生的风险(ipmn-hgd、panin-3或pdac))、预后、确定治疗效果和/或进展相关。在优选的实施方式中,本发明的方法和组合物是用于在早期阶段(例如,在疾病症状出现之前)治疗或诊断疾病的。在一些实施方式中,本发明的方法和组合物是用于在临床阶段治疗或诊断疾病的。如所述,在一些实施方式中,可以对一种或多种诊断或预后生物标记物进行多种确定,且标记物中的时间变化可以用于确定诊断或预后。例如,可以在起始时间确定诊断标记物,并在第二时间再次确定。在这种实施方式中,从起始时间到第二时间的标记物中的增加可以诊断疾患的特定类型或严重性,或者给定预后。同样地,从起始时间到第二时间的标记物中的降低可以表明疾患的特定类型或严重性,或者给定预后。此外,一种或多种标记物的变化的程度可能与疾患和未来不良事件的严重性有关。熟练的技术人员将理解,虽然在某些实施方式中是在多个时间点对相同的生物标记物进行比较测量,但是也可以在一个时间点测量给定生物标记物,并在第二个时间点测量第二生物标记物,且这些标记物的对比可以提供诊断信息。如本文所用,短语“确定预后”是指方法,通过该方法熟练的技术人员可以预测受试者中病症的病程或结果。术语“预后”不是指能够100%准确地预测病症的病程或结果,或甚至不是指根据生物标记物(例如,dmr)的甲基化状态预测给定病程或结果或多或少可能发生。相反,熟练的技术人员将理解术语“预后”是指某种病程或结果将发生的可能性增加;也就是说,与那些没有表现出该病症的个体相比,在表现出给定病症的受试者中病程或结果更有可能发生。例如,在没有表现出病症(例如,具有正常的一种或多种dmr的甲基化状态)的个体中,给定结果的几率可能非常低。在一些实施方式中,统计分析将预后指标与不良结果的倾向联系起来。例如,在一些实施方式中,如统计学显著性水平所确定的,甲基化状态不同于从没有疾患的患者获得的正常对照样品中的甲基化状态可以表示受试者比具有更类似于对照样品中的甲基化状态的水平的受试者更容易罹患疾患。此外,甲基化状态自基线(例如,“正常的”)水平的变化可以反映受试者预后,且甲基化状态的变化程度可能与不良事件的严重性有关。统计学显著性通常通过比较两个或更多个群体并确定置信区间和/或p值来确定(参见,例如dowdy和wearden,statisticsforresearch,johnwiley&sons,newyork,1983)。本主题的示例性置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或99.99%,而示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。在其他实施方式中,可以建立本文所公开的预后或诊断生物标记物(例如,dmr)的甲基化状态的变化的阈值程度,并将生物样品中生物标记物的甲基化状态的变化程度与甲基化状态的变化的阈值程度简单地进行比较。本文所提供的生物标记物的甲基化状态的优选的阈值变化为约5%、约10%、约15%、约20%、约25%、约30%、约50%、约75%、约100%和约150%。在其他实施方式中,可以建立“诺模图”,通过“诺模图”预后或诊断指标(生物标记物或生物标记物的组合)的甲基化状态与对于给定结果的相关倾向直接相关联。熟练的技术人员熟知使用这种诺模图来将两个数值联系在一起,并理解这种测量中的不确定性和标记物浓度中的不确定性是一样的,因为个体样品测量是参考的,而不是群体平均值。在一些实施方式中,同时对对照样品和生物样品进行分析,使得可以将从生物样品获得的结果与从对照样品获得的结果进行比较。此外,预期可以提供标准曲线,生物样品的测定结果可以与其进行比较。这类标准曲线将生物标记物的甲基化状态呈现为测定单位的函数,例如,如果使用荧光标记则为荧光信号强度。使用从多种捐赠者采集的样品,可以为正常组织中的一种或多种生物标记物的对照甲基化状态提供标准曲线,以及为从有化生的捐赠者或从有疾患(例如,胰腺高度异型增生(ipmn-hgd、panin-3或pdac))的捐赠者采集的组织中的一种或多种生物标记物的“危险”水平提供标准曲线。在本方法的某些实施方式中,当在从受试者获得的生物样品中鉴定出本文所提供的一种或多种dmr的异常甲基化状态时,受试者被鉴定为具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。在本方法的其他实施方式中,从受试者获得的生物样品中检测出一种或多种这种生物标记物的异常甲基化状态导致受试者被鉴定为具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。标记物的分析可以单独进行,也可以与一种测试样品内的其他标记物一起同时进行。例如,数个标记物可以组合在一个测试中,以有效处理多个样品并可能地提供更高的诊断和/或预后准确性。此外,本领域技术人员会识别到对来自同一受试者的多个样品(例如,在连续的时间点)进行测试的值。这种系列样品的测试可以允许鉴定标记物甲基化状态随时间的变化。甲基化状态的变化以及缺乏甲基化状态的变化,可以提供关于疾病状态的有用信息,其包括但不限于鉴定从事件发生的近似时间、可挽救组织的存在和数量、药物治疗的适当性、各种疗法的有效性和受试者的结果的鉴定,包括未来事件的风险。生物标记物的分析可以以各种物理格式进行。例如,使用微量滴定板或自动化可以便利地处理大量的测试样品。可替代地,可以开发单样品格式,以方便以及时的方式进行立即治疗和诊断,例如,在动态运输或急诊室设置中。在一些实施方式中,如果当与对照甲基化状态相比,样品中至少一种生物标记物的甲基化状态存在可测量的差异时,则受试者被诊断为具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)。相反,当鉴定生物样品中甲基化状态没有变化时,受试者可以被鉴定为不具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)、没有患胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的风险或者有患胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的低风险。在这方面,可以将具有胰腺高度异型增生(ipmn-hgd、panin-3或pdac)或其风险的受试者与具有低至基本上无胰腺高度异型增生(ipmn-hgd、panin-3或pdac)或其风险的受试者进行区分。可以对那些具有患胰腺高度异型增生(ipmn-hgd、panin-3或pdac)风险的受试者进行更精密的和/或正规的筛查计划。如上所述,根据本技术的方法的实施方式,检测一种或多种生物标记物的甲基化状态的变化可以是定性测定,或者其也可以是定量测定。因此,诊断受试者是否患有或是否有风险患上胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的步骤表明进行了某些阈值测量,例如,生物样品中一种或多种生物标记物的甲基化状态与预先确定的对照甲基化状态不同。在本方法的一些实施方式中,对照甲基化状态是生物标记物的任何可检测的甲基化状态。在本方法的其他实施方式中,当同时对对照样品与生物样品进行测试时,预先确定的甲基化状态是对照样品中的甲基化状态。在本方法的其他实施方式中,预先确定的甲基化状态基于标准曲线和/或由标准曲线鉴定。在本方法的其他实施方式中,预先确定的甲基化状态是特定的状态或状态范围。因此,在对本领域技术人员来说将是显而易见的可接受的限制内,预先确定的甲基化状态可以部分基于正在实践的方法的实施方式和所需的特异性等进行选择。此外,在诊断方法方面,优选的受试者是脊椎动物受试者。优选的脊椎动物是温血动物;优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选地是人类。如本文所用,术语“受试者”既包括人类受试者也包括动物受试者。因此,本文提供了兽医治疗的用途。因此,本技术提供了诊断哺乳动物,诸如人类,以及那些由于濒临灭绝而重要的哺乳动物,诸如西伯利亚虎;具有经济重要性的动物,诸如在农场饲养供人类消费的动物;和/或对人类具有社会重要性的动物,诸如被当作宠物或在动物园中的动物。这类动物的实例包括但不限于:食肉动物,诸如猫和狗;猪科动物,包括猪、生猪和野猪;反刍动物和/或有蹄类动物,诸如牛、公牛、羊、长颈鹿、鹿、山羊、野牛和骆驼;以及马。因此,也提供了家畜的诊断和治疗,包括但不限于驯养的猪科动物、反刍动物、有蹄类动物、马(包括竞赛马)等等。目前公开的主题还包括用于诊断受试者中胰腺高度异型增生(ipmn-hgd、panin-3或pdac)的系统。例如,系统可以作为商业试剂盒提供,可用于在受试者(生物样品收集自该受试者)中筛查这种疾患的风险。根据本技术提供的示例性系统包括评估表2和表6中所提供的dmr的甲基化状态。实施例实施例i.胰腺导管内乳头状黏液性肿瘤(ipmn)和胰腺上皮内瘤变(panin)是胰腺导管腺癌(pdac)的关键的导管癌前体。虽然有共识认为,具有高度异型增生(hgd)的癌前病变和早期pdac应该进行手术治疗,但目前的成像工具和风险预测模型并不完善,且常常无法检测到此类病变。需要应用于诸如胰液、胰腺囊肿液或粪便等介质的辨别分子标记物,以更准确地检测高风险病变。进行了实验以鉴定并验证将有高度癌前体(ipmn-hgd、panin-3)或浸润性癌(pdac)的病例组与有正常胰腺或低度癌前病变(ipmn-低度异型增生(ipmn-lgd)、panin-1和panin-2)的对照组区分开来的候选甲基化dna标记物。候选标记物的鉴定基于在来自冷冻胰腺正常组织和肿瘤组织的dna上使用简并代表性亚硫酸氢盐测序(rrbs)的无偏全甲基化组发现方法;候选标记物的选择基于roc曲线下面积(auc)、倍数变化和p值。验证基于来自病例组和对照组的独立的显微切割组织和使用甲基化特异性pcr对所选择的标记物进行的盲法测定;将标记物水平标准化为甲基化lrrc4(用于胰腺上皮的标记物)。病例组(n=53)包括ipmn-hgd(19)、panin-3(4)和pdac(30)。对照组(n=111)包括组织学正常的胰腺组织(31)、ipmn-lgd(36)、panin-1(34)和panin-2(10)。通过logistic回归计算每个标记物的auc,并探讨了通过标记物结合的辨别。从rrbs数据中,选择了28个候选标记物用于msp验证。这些中的三个是z-标记物,该术语用于鉴定在所有组织样品(无论是正常的、异型增生的还是癌性的)中均表现出cpg高甲基化——但是在造血源dna(诸如循环白细胞)中几乎没有或没有甲基化(参见,例如14/966,938)。z-标记物服务于2个重要功能——当将生物样品(通常含有一定程度的免疫渗透)中肿瘤标记物标准化至总上皮信号时,它们是有效的分母,且就在肿瘤细胞脱落、凋亡或坏死导致正常细胞/dna也被释放的情况下,它们可以是其自身中的肿瘤特异性标记物。在发现样品中,二十三个标记物具有mspauc值≥0.8且p-值≤0.01,将其连同3个z-标记物一起考虑到如方法(实施例iii)中所述的扩大的独立的验证集。测定中使用通用的甲基化标准,以及适当的阴性对照。结果表达为%甲基化(标准化至lrrc4,用于胰腺组织的标记物)。排除了4个标记物(低auc(<0.79),病例中的%甲基化低,或背景高),余下19个有希望的候选(abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781)。在验证集中建立了病例组和对照组之间的辨别,且经验证auc值≥0.79的标记物列于表1a中(提供了19个有希望的候选——abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781的auc值)。表1b示出了auc值≥0.85的一组标记物。表1b所示出的组分别以85%、90%、95%和100%的特异性检测到了89%、87%、77%和74%的病例。图1提供了从胰腺组织中测定的不同标记物的分布图。一种顶部标记物(tbx15)在各个组织类别中的分布图清楚地说明了病例(ipmn-hgd、panin-3和pdac)中的水平远远高于对照中的水平(图1)。一组顶部标记物得出的auc为0.91(95%ci:85-96%)。该组分别以85%、90%、95%和100%的特异性检测到了89%、87%、77%和74%的病例。表2提供了被鉴定为高度癌前体(ipmn-hgd、panin-3)或浸润性癌症(pdac)的高度辨别标记物的这类标记物(包括abcb1、ak055957、c13orf18、cd1d、clec11a、dlx4、elmo1、emx1、fer1l4、frmd4a、grin2d、hoxa1、prkcb、sp9、st6gal2、st8sia1、tbx15、vwc2和znf781)的dmr信息,其包括染色体数目、基因注释和dmr启动/停止位置。表3提供了用于表2中所提供的dmr的引物。表1a.表1b:在病例(ipmn-hgd、panin-3、pdac)和对照(正常的、ipmn-lgd、panin-1,2)之间具有高辨别(auc>0.85)的所选择的甲基化dna标记物标记物auc95%置信区间ptbx150.890.83-0.95<0.001vwc20.890.83-0.95<0.001prkcb0.890.83-0.95<0.001clec11a0.890.83-0.94<0.001emx10.880.82-0.94<0.001elmo10.880.81-0.94<0.001dlx40.870.81-0.92<0.001abcb10.870.80-0.93<0.001st8sia10.870.80-0.93<0.001sp90.860.79-0.92<0.001表2.dmr的信息表3.用于表2中所提供的dmr的引物实施例ii.对来自有不同程度异常胰腺组织学的8例患者的囊肿液进行标记物盲测试。使用7种我们的标记物对亚硫酸氢盐转化的囊肿液dna进行msp。以lrrc4为分母,将拷贝标准化至%甲基化。表4示出了4种标记物的结果。对于这些标记物中的每一个,在组织学严重性程度和甲基化阳性之间存在相关性。腺癌患者样品(p-1)对所有标记物均表现出最高的%甲基化。患者p-2、p-3和p-6为零,全面地与这三种组织学的低度恶性潜能一致。多个mcn和多个ipmn差异地点亮,prkcb对轻微至中等异型增生(无高度ipmn可用于测试)最不敏感,而cd1d是最敏感的。表4.实施例iii.该实施例为实施例i和实施例ii提供了材料、方法和结果。从位于mayoclinicrochester的制度性癌症登记处选择发现组织样品(新鲜冷冻的和ffpe),并由专家病理学家审查以确认正确的分类。这些包括胰腺癌、ipmn、panin(p1、p2和p3)、正常胰腺和正常结肠。每个临床组和亚组n=10至26。由mayobiospecimenslinkinginvestigators和clinicianstogihcellsignallingresearchclinicalcore提供了18个正常的白细胞对照。使用qiagendna迷你试剂盒和微型试剂盒制备基因组dna。rrbs(简并代表性亚硫酸氢盐测序):rrbs是允许无偏地观察启动子和cpg岛中表观遗传或甲基化特征的程序,已知区域在癌细胞中是高甲基化的而在正常细胞中是低甲基化的。我们所做的许多研究在癌症类型和过滤方法两者上都是首创的。我们用于鉴别和排名标记物区域的标准是围绕设计临床甲基化特异性扩增测定的最终目标而定制的,这使得该工艺独一无二。4个主要的过滤器是1)使用限定的cpg密度标准和β回归模型的dmr调用(calling),2)roc曲线分析,3)倍数变化(相对于正常组织或正常白细胞),以及4)显示的区域上的cpg共甲基化(病例中)和缺乏共甲基化(对照中)。文库制备:通过用10单位的mspi(识别含有cpg的基序的甲基化特异性限制性酶)消化而分裂基因组dna(300ng),以富集样品cpg含量并消除基因组的冗余区。在5单位的klenow片段(3'-5'外切(exo-))下对消化后的片段进行末端修复以及加a(a-tailed),然后过夜连接至含有条码序列(以将每个片段连接至其样品id)的甲基化truseq接头(illumina,sandiegoca)。使用agencourtampurexpspri珠/缓冲液(beckmancoulter,breaca)进行160-340bp片段(40-220bp插入片段)的尺寸选择。缓冲液截留为0.7x-1.1x珠/缓冲液的样品体积。最终洗脱体积为22ul(eb缓冲液—qiagen,germantownmd);使用qpcr计量小样品等分样上的连接效率和片段质量。然后使用改进的epitect方案(qiagen)对样品进行亚硫酸氢盐转化(两次)。qpcr和常规的pcr(pfuturbocx热启动—agilent,santaclaraca)之后,对转化后的样品等分样进行bioanalyzer2100(agilent)评估,在最终的文库扩增之前确定最佳的pcr周期数。最终pcr使用的条件如下:1.)每50ul反应含有5ul的10x缓冲液、1.25ul的10mm每脱氧核糖核苷酸三磷酸酯(dntp)、5ul的引物混合剂(cocktail)(~5um)、15ul模板(样品)、1ulpfuturbocx热启动和22.75水;温度和时间分别为95c-5min;98c-30sec;12-16周期的98c-10sec、65c-30sec、72c-30sec、72c-5min和4c倍。基于随机化方案将样品(等摩尔)组合进4-重(4-plex)文库,并用生物分析仪测试用于最终的尺寸验证,并使用phix标准和接头特异性引物进行qpcr。测序和生物信息学:根据随机的泳道分配,预留用于内部测定对照的额外泳道,将样品加载到流动池中。通过位于mayoclinicmedicalgenomefacility的nextgenerationsequencingcore(下一代测序核心)在illuminahiseq2000上进行测序。101个周期的读取是单向的。每个流动池泳道生成1亿-1.2亿次读取,足以对于比对序列达到30-50倍测序深度(每cpg读取次数)的中位覆盖。标准illumina管道软件(pipelinesoftware)调用碱基并测序读取生成fastq格式。saap-rrbs是用于简并代表性亚硫酸氢盐测序的流线型分析和注释管道,用于序列比对和甲基化提取。对于rrbs发现阶段,感兴趣的主要比较是甲基化差异——胰腺肿瘤病例、胰腺对照、白细胞对照和某些应用结肠对照之间的——在每个映射cpg处。cpg岛通过观察到的与预期的cpg比值>0.6而被生物化学限定。然而,对于此模型,基于每条染色体的cpg位点位置之间的距离建立cpg分析“差异甲基化区域(dmr)”的平铺单元。排除只有单cpgs的岛。个体cpg位点只有在每个疾病组覆盖的总深度≥200次读取(平均10次读取/受试者)且%-甲基化的方差>0(排除多个非信息cpg)时才考虑进行差异分析。读取深度标准是基于所需的统计功效,以在任意两组之间的%-甲基化中检测出10%差异,其中每组的样品量为18个个体。基于读取计数,通过每dmr甲基化百分比的logistic回归确定统计学显著性。为了考虑个体受试者中不同的读取深度,使用过度离散logistic回归模型,其中使用来自拟合模型的残差的皮尔森卡方(pearsonchi-square)统计估计离散参数。如果在组织和白细胞对照中组合起来的%-甲基化≤1%但在病例中≥10%,则进一步考虑多种dmr根据它们的显著性水平排名。结果得到94个标记物(表2)。所有的auc均大于0.85,信号倍数变化大于25(病例对比正常胰腺组织)和5(病例对比包括低度和中度异型增生样品的所有对照),且p-值均小于0.001。甲基化特异性pcr(msp)验证:通过甲基化特异性pcr在组织中——首先在发现样品上并然后在较大的独立样品集上对候选标记物(通常每位点20-30个排名靠前的rrbsdmr)进行验证。msp引物设计:设计并序化了对28种顶部标记物有特异性的引物(idt,coralvilleia)。使用methprimer软件(加利福尼亚大学(universityofcalifornia),sanfranciscoca)或mspprimer(约翰斯·霍普金斯大学(johnshopkinsuniversity),baltimore,md)进行设计。通过在普遍甲基化的和非甲基化的基因组dna对照的稀释中有sybrgreen的qpcr对测定进行试验和优化。甲基化特异性pcr:对发现样品进行定量msp反应以验证性能。由于全基因组下一代测序研究可能存在高错误发现率,因此在有高分析敏感性和特异性的平台上测试候选dmr至关重要。验证基于来自病例组和对照组的独立的显微切割组织和使用甲基化特异性pcr对所选择的标记物进行的盲法测定;将标记物水平标准化为甲基化lrrc4(用于胰腺上皮的标记物)。病例组(n=53)包括ipmn-hgd(19)、panin-3(4)和pdac(30)。对照组(n=111)包括组织学正常的胰腺组织(31)、ipmn-lgd(36)、panin-1(34)和panin-2(10)。通过logistic回归计算每个标记物的auc,并探讨通过标记物结合的辨别。在由位于波士顿麻省总医院(massachusettsgeneralhospital)的合作者提供的囊肿液样品中进行额外的验证。八个200ul样品(1例囊肿型的胰腺癌,1例有邻近潴留囊肿的壶腹腺瘤,1例浆液性囊腺瘤,1例有轻微至中度异型增生的mcn,1例有低等至中等异型增生的mcn,1例假乳头状肿瘤,1例中等异型增生bd-ipmn,以及1例有灶性中等异型增生的低度异型增生bd-ipmn)。对dna进行提取、亚硫酸氢盐转化并使用10种顶部标记物候选通过msp运行(盲法)。同时交换lrrc4标准化结果和非盲临床信息。实施例iv.该实施例展示了用新型dna甲基化标记物精确检测胰腺囊肿中的晚期肿瘤。目前通过有或没有囊肿液(cf)分析的成像学检测胰腺囊肿中的晚期瘤变(高度异型增生(hgd)或癌症)的临床算法缺乏诊断准确性,常常导致不必要的手术。通过对组织中的dna进行全甲基化组测序,实验确定了准确地将隐含hgd或癌症的囊肿与有低度异型增生(lgd)或无异型增生的囊肿分离开来的新型甲基化dna标记物。在对cf的研究中,发现这些标记物组表现出可以高度辨别有晚期肿瘤的囊肿和无晚期肿瘤的囊肿。在扩大的多中心病例-对照研究中,进行实验以(1)基于在囊肿病例(hgd或腺癌)和囊肿对照(lgd或无异型增生)中的盲法cf分析,通过测定新型甲基化dna标记物评估检测胰腺囊肿中的晚期肿瘤的准确性,以及(2)比较cf中的甲基化dna标记物分布与cea和kras突变型的甲基化dna标记物分布。对来自手术切除的囊肿的存档cf标品进行了研究。通过超声内镜或手术中囊肿穿刺来获得cf。对从0.2mlcf(qiaamp迷你试剂盒,qiagen,valenciaca)提取的dna进行亚硫酸氢盐转化(ez-96dna甲基化试剂盒,zymoresearch,irvineca),并然后通过甲基化特异性pcr或定量等位基因特异性实时靶标和信号扩增(quarts)对所选择的甲基化dna标记物(bmp3、ndrg4、sp9、dlx4、abcb1、cd1d、clec11a、emx1、prkcb、st8sia1、vwc2、tbx15、lrrc4、elmo1)进行测定。通过quarts和cea通过商业方法(map试剂盒)测定kras(7个突变)(参见,例如美国专利no.9,127,318)。来自134例胰腺囊肿(41例胰腺导管内乳头状黏液性肿瘤(ipmn)、35例粘液性囊性肿瘤(mcn)、23例浆液性囊腺瘤、13例囊性浸润性腺癌(3例ipmn、1例mcn、9例不确定的癌前体)和22例炎症性或其他囊肿,实验分类将21例作为病例(8例hgd、13例腺癌)和113例作为对照(45例无异型增生、68例lgd)。病例中的中位年龄(iqr)为71岁(56-77岁),对照中的为61岁(46-69岁)(p<0.01);61%的病例和31%的对照为男性(p=0.034)。3种顶部甲基化标记物(tbx15、bmp3、clec11a)的cf分布说明了病例和对照之间的高分辨现象(参见,图2)。顶部4种甲基化标记物各自达到的roc曲线下面积(aucs)>0.90(参见,表5)。基于设定特异性下的敏感性或aucs,通过这些甲基化标记物中的每个进行的病例检测基本上且显著地比通过kras突变型或cea的病例检测更好(参见,表5)。在匹配的特异性下,顶部个体甲基化标记物所检测到的病例是kras突变型或cea所检测到的两倍。表6提供了bmp3和ndrg4的dmr信息。表7提供了bmp3和ndrg4的引物信息。表5:胰腺囊肿液分析中辨别病例(hgd/癌症)和对照(lgd,无异型增生)的诊断准确性:甲基化dna标记物与kras突变型和cea的比较。表6.表7.表6中提供的dmr的引物实施例v.该实施例展示了通过在囊肿液中测定新型dna甲基化标记物来检测胰腺囊肿中的晚期肿瘤。胰脏囊肿的重要子集隐含晚期肿瘤(高度异型增生(hgd)或癌症)。然而,目前用于检测这类高危群体的诊断方法基于成像标准或囊肿液分析,其缺乏准确性。可以通过提示晚期肿瘤信息的分子标记物进一步优化对有胰腺囊肿的患者的管理。最近,实验已经鉴定并验证了在胰腺组织中将hgd或腺癌从低度异型增生(lgd)和无异型增生组织中辨别出来的新型甲基化dna标记物(mdms)组(参见,例如majumders,等人,gastroenterology2016;s120–s121)。当应用于囊肿液时,是否在组织中存在这种辨别还有待确定。因此,进行了目的为评估和比较候选mdms在来自囊肿含有晚期肿瘤的病例的囊肿液中的分布和在来自囊肿含有低度异型增生(lgd)或无异型增生的对照的囊肿液中的分布的实验。在这项盲法多中心研究中,从83例手术切除的囊肿中鉴定出了存档的胰腺囊肿液。对0.2ml囊肿液中的dna使用qiaamp迷你试剂盒(qiagen,valenciaca)进行提取并使用ez-96dna甲基化试剂盒(zymoresearch,irvineca)进行亚硫酸氢盐过夜转化。通过甲基化特异性pcr或定量等位基因特异性实时靶标和信号扩增(quarts)对14个所选择的mdms(bmp3、ndrg4、sp9、dlx4、abcb1、cd1d、clec11a、emx1、prkcb、st8sia1、vwc2、tbx15、lrrc4、elmo1)进行测定;将水平标准化至β肌动蛋白(总dna)和年龄。病例(n=14)为有腺癌或hgd的囊肿,以及对照(n=61)为有lgd或无异型增生的囊肿。对有中等异型增生的囊肿(n=8)单独进行分析。顶部5种mdms(bmp3、emx1、clec11a、st8ia1、vwc2)各自达到roc曲线下面积≥0.90以区分病例和对照。2种顶部mdms(bmp3、emx1)的囊肿液水平分布说明了高辨别(参见,图3)。在90%的特异性(95%ci80-96%)下,这2种mdm组检测出93%(66-100%)的病例。有中等异型增生的囊肿中的mdm水平一般介于hgd和lgd之间(参见,图3);这2种mdm组在95%的特异性下会将38%的这些病变称为阳性。因此,这类实验表明,对胰腺囊肿液中新型mdms的测定准确地区分了有癌症或hgd的病例与有lgd或无异常增生的对照。为所有目的,以上说明书中所述的所有出版物和专利,其全部内容通过引用并入本文。所述本技术的组合物、方法和用途的各种修改和变体对于本领域技术人员将是显而易见的,且不偏离所述本技术的精神和范围。虽然已结合特定的示例性实施方式对本技术进行了描述,但应该理解的是,所要求保护的发明不应当不恰当地被限制于此类特定的实施方式。实际上,用于实施本发明的所述模式的各种修改对于药理学、生物化学、医学科学或旨在所附权利要求的范围内的相关领域的技术人员来说是显而易见的。序列表<110>梅奥医学教育与研究基金会(mayofoundationformedicaleducationandresearch)<120>检测胰腺高度异型增生<130>pn18057204p<150>us62/322,610<151>2016-04-14<160>50<170>patentinversion3.5<210>1<211>21<212>dna<213>人工序列<220><223>合成物<400>1gattttgttcgtcgttagtgc21<210>2<211>19<212>dna<213>人工序列<220><223>合成物<400>2tctctaaacccgcgaacga19<210>3<211>22<212>dna<213>人工序列<220><223>合成物<400>3tcggcgtatttttcgtagacgc22<210>4<211>24<212>dna<213>人工序列<220><223>合成物<400>4cgcaatcttaaacgtacgcttcga24<210>5<211>30<212>dna<213>人工序列<220><223>合成物<400>5tgttttcgcggtcgttatatattacgtcgt30<210>6<211>25<212>dna<213>人工序列<220><223>合成物<400>6gaactatccccgaactccgactcga25<210>7<211>25<212>dna<213>人工序列<220><223>合成物<400>7tttagggaagtaaagcgtcgttttc25<210>8<211>22<212>dna<213>人工序列<220><223>合成物<400>8aacgacgtctcgatacctacga22<210>9<211>22<212>dna<213>人工序列<220><223>合成物<400>9agtttggcgtagtcggtagatc22<210>10<211>22<212>dna<213>人工序列<220><223>合成物<400>10gcgcgcaaataccgaataaacg22<210>11<211>25<212>dna<213>人工序列<220><223>合成物<400>11gtatttttaatatttggtgagtgcg25<210>12<211>25<212>dna<213>人工序列<220><223>合成物<400>12tactaaaacgtacgataaacatcgt25<210>13<211>34<212>dna<213>人工序列<220><223>合成物<400>13ttatatttttcgtttttagtaatttcgcgttagc34<210>14<211>23<212>dna<213>人工序列<220><223>合成物<400>14gaaaacccgccgaaacatttcga23<210>15<211>31<212>dna<213>人工序列<220><223>合成物<400>15cgggttttagcgatgtttattttagtttcgt31<210>16<211>26<212>dna<213>人工序列<220><223>合成物<400>16ccttttcgttcgtataaaatttcgtt26<210>17<211>24<212>dna<213>人工序列<220><223>合成物<400>17tggagtttttttcgtcgttgacgc24<210>18<211>22<212>dna<213>人工序列<220><223>合成物<400>18aataccgcgtcgaccaaaaacg22<210>19<211>25<212>dna<213>人工序列<220><223>合成物<400>19tgtaagcggttggtatttcggaacg25<210>20<211>22<212>dna<213>人工序列<220><223>合成物<400>20caaaaaccttcgcccgaacgaa22<210>21<211>34<212>dna<213>人工序列<220><223>合成物<400>21ttatatttttcgtttttagtaatttcgcgttagc34<210>22<211>23<212>dna<213>人工序列<220><223>合成物<400>22gaaaacccgccgaaacatttcga23<210>23<211>25<212>dna<213>人工序列<220><223>合成物<400>23tgggttatcggttttttaagttcgg25<210>24<211>26<212>dna<213>人工序列<220><223>合成物<400>24gaattcctcccaaccaaccctctacg26<210>25<211>24<212>dna<213>人工序列<220><223>合成物<400>25cgtggttgtcgtttgtaatatcgc24<210>26<211>23<212>dna<213>人工序列<220><223>合成物<400>26ataatccccgctaactaacgacg23<210>27<211>25<212>dna<213>人工序列<220><223>合成物<400>27tgcgtaggtgatagggaggggttac25<210>28<211>25<212>dna<213>人工序列<220><223>合成物<400>28acaaaacacatcctattaacgcgaa25<210>29<211>24<212>dna<213>人工序列<220><223>合成物<400>29gtcgtttttgggcgttttagaggc24<210>30<211>20<212>dna<213>人工序列<220><223>合成物<400>30taatcccaaacgaaccgccg20<210>31<211>30<212>dna<213>人工序列<220><223>合成物<400>31cgggggtaaaaagggtagcgatagtgatac30<210>32<211>23<212>dna<213>人工序列<220><223>合成物<400>32cgaaaaattcgaaacgaaacgtc23<210>33<211>24<212>dna<213>人工序列<220><223>合成物<400>33gttagttttcggtcgggatcgagc24<210>34<211>26<212>dna<213>人工序列<220><223>合成物<400>34cgttcgtaacgtcgacgattaccgta26<210>35<211>23<212>dna<213>人工序列<220><223>合成物<400>35gacgtttgtcgtcgggttcgttc23<210>36<211>24<212>dna<213>人工序列<220><223>合成物<400>36aaaaaccctccgctaccacttcgc24<210>37<211>25<212>dna<213>人工序列<220><223>合成物<400>37cgcgtaggtcggattgatttttcgt25<210>38<211>23<212>dna<213>人工序列<220><223>合成物<400>38ttaattaacgcccgaacacccgc23<210>39<211>26<212>dna<213>人工序列<220><223>合成物<400>39ttggagagtttttcgaattttttcgc26<210>40<211>19<212>dna<213>人工序列<220><223>合成物<400>40gaaaaccaccctaacgccg19<210>41<211>30<212>dna<213>人工序列<220><223>合成物<400>41tcgttaggaattagtggttggatttatcgc30<210>42<211>27<212>dna<213>人工序列<220><223>合成物<400>42cgttctcttattttccgaatacgcgaa27<210>43<211>17<212>dna<213>人工序列<220><223>合成物<400>43gcgcgtagcggcgtttc17<210>44<211>19<212>dna<213>人工序列<220><223>合成物<400>44cccatatcgcccgacgtaa19<210>45<211>23<212>dna<213>人工序列<220><223>合成物<400>45gtttaattttcggtttcgtcgtc23<210>46<211>18<212>dna<213>人工序列<220><223>合成物<400>46cgctacgaaacactccga18<210>47<211>21<212>dna<213>人工序列<220><223>合成物<400>47cggttttcgttcgttttttcg21<210>48<211>18<212>dna<213>人工序列<220><223>合成物<400>48ccgccttctacgcgacta18<210>49<211>21<212>dna<213>人工序列<220><223>合成物<400>49cgccgaggcggttttttgcgc21<210>50<211>22<212>dna<213>人工序列<220><223>合成物<400>50ccacggacggttcgtttatcgc22当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1