用于检测结直肠癌的方法与流程

文档序号:31807734发布日期:2022-10-14 20:37阅读:160来源:国知局
用于检测结直肠癌的方法与流程

1.本发明涉及药物基因组学领域,并且特别地涉及在生物样品(例如含有来自癌细胞的循环dna的体液)中检测源自结直肠癌细胞的甲基化基因组dna的存在或不存在。这种检测可用于结直肠癌的早期且可靠的诊断,并且本发明提供了适合于该目的的方法和寡核苷酸。


背景技术:

2.结直肠癌(colorectal cancer,crc)涵盖起源于结肠和直肠的肿瘤。结直肠癌是全球第三大常见癌症,但是是第二大常见癌症杀手。当结直肠癌在早期阶段发现时,5年相对存活率为约90%。然而,在晚期阶段时,结直肠癌是无法治愈的。常规的crc筛查涉及可视检查或基于粪便的测试。可视检查使用放入直肠的观测仪器(例如结肠镜检查或乙状结肠镜检查)或者非侵入性成像技术(例如x射线或cr结肠造影(虚拟结肠镜检查))来检查结肠和直肠结构的异常区域。粪便测试例如fit(粪便免疫化学测试)或gfobt(基于愈创木脂的粪便隐血测试)通常在粪便样品中检测血液或息肉。粪便测试具有相对低的灵敏度和特异性,并且就参与者的依从性、满意度和重新筛查意愿而言也是有问题的。侵入性可视检查是不舒服的,并且引发出血、流泪和感染的风险。因此,处于风险中的对象经常避免侵入性可视检查。非侵入性成像技术将对象暴露在辐射下,并且经常漏掉小的息肉。
3.dna甲基化模式在癌细胞中被极大地改变,并且因此可用于区分癌细胞与正常组织。因此,dna甲基化模式被用于诊断所有类型的癌症。挑战之一是鉴定这样的基因或基因组区域,该基因或基因组区域(i)在crc中是异常甲基化的和(ii)提供适合于检测crc的诊断能力,即其提供足够的灵敏度和特异性。
4.本发明人的目标是提供更多的基因或基因组区域,该基因或基因组区域在crc中是异常甲基化的并且还具有良好且理想地改善的灵敏度和/或特异性。本发明人的目的还在于提供特别适合于检测crc的这样的基因或基因组区域的组合。因此,特别强调了使用体液样品进行检测,因为体液样品的使用允许对广泛(例如处于风险中)的群体进行微创筛查。
5.crc越早期,治疗选择和治愈患者的机会就越好。因此,非常希望用对象会毫不犹豫地接受的测试尽可能早且可靠地诊断crc。
6.发明概述
7.在第一方面中,本发明涉及检测dna甲基化的方法,其包括在对象的包含基因组dna的生物样品中检测至少一种基因组dna多核苷酸中的dna甲基化的步骤,所述基因组dna多核苷酸选自由具有包含在以下中的序列的多核苷酸组成的组:
8.seq id no:16(madcyap1),seq id no:56和/或seq id no:61(mankrd13b),seq id no:41和/或seq id no:46(mclec14a),seq id no:71(mcrmp1),seq id no:81和/或seq id no:86(meya4),seq id no:31(mkhdrbs2),seq id no:96和/或seq id no:101(mmsc),seq id no:111和/或seq id no:116(mngfr),seq id no:126(mnkx2),seq id no:141和/
或seq id no:146(mrassf2),seq id no:1(msept9),seq id no:161(msnd1),seq id no:171(mtbx18),seq id no:186和/或seq id no:191(mtfap2e),seq id no:201和/或seq id no:206(mtmeff2),或seq id no:216(mvax1),
9.其中基因组dna可包含源自结直肠癌(crc)细胞的dna。
10.在第二方面中,本发明涉及用于检测对象中crc的存在或不存在的方法,其包括根据第一方面的方法检测dna甲基化,其中存在检测到的甲基化基因组dna表示存在crc,不存在检测到的甲基化基因组dna表示不存在crc。
11.在第三方面中,本发明涉及选自引物和探针的寡核苷酸,其包含与以下中的一者的一段连续核苷酸基本上相同的序列:
12.seq id no 17-20(madcyap1),57-60和/或62-65(mankrd13b),42-45和/或47-50(mclec14a),72-75(mcrmp1),82-85和/或87-90(meya4),32-35(mkhdrbs2),97-100和/或102-105(mmsc),112-115和/或117-120(mngfr),127-130(mnkx2),142-145和/或147-150(mrassf2),2-5(msept9),162-165(msnd1),172-175(mtbx18),187-190和/或192-195(mtfap2e),202-205和/或207-210(mtmeff2),或217-220(mvax1)。
13.在第四方面中,本发明涉及至少包含第一和第二根据第三方面的寡核苷酸的试剂盒。
14.在第五方面中,本发明涉及第一方面的方法、第三方面的寡核苷酸或第四方面的试剂盒用于检测crc或者用于监测具有提高的发生crc的风险、被怀疑患有crc或曾患有crc的对象的用途。
15.在第六方面中,本发明涉及第一方面或第二方面的方法,或者第五方面的用途,其包括治疗在其生物样品中检测到dna甲基化的对象的crc的步骤。
附图说明
16.图1:靶区域的图谱。关于对seq id no的说明,参见表3。
17.图2:单一标志物性能和甲基化差异。灰色方块示出了标志物b至p的共甲基化(comethylation)(如通过与测定匹配的读序所检测的与测定中所有扩增的dna相关的完全甲基化片段的com数),其通过灰度颜色以线性标度或者通过大小以对数标度归一化为0至1的范围,如在底部图例中所示。在一式三份的实时pcr中测量的标志物a的阳性(如通过epi procolon诊断测试测量的x/3 pos septin 9)显示为0至3的数字。105名结直肠癌患者(crc)和69名无疾病证据(no evidence of disease,ned)个体的血浆样品垂直分组成两个诊断组。在底部处的数字是来自响应者操作特征曲线的曲线下面积。右侧的灰色条和数字是如在pcr中扩增的并通过对样品测量的扩增dna总量进行归一化的所有完全甲基化分子的总和(四舍五入至1000)。标志物为:
18.a:msept9,b:madcyap1,c:mkhdrbs2,d:mclec14a,e:mankrd13b,f:mcrmp1,g:meya4,h:mmsc,i:mngfr,j:mnkx2,k:mrassf2,l:msnd1,m:mtbx18,n:mtfap2e,o:mtmeff2;p:mvax1。
19.图3:通过逻辑回归分析对十六个标志物和两个示例性标志物组合的响应者操作曲线(responder operator curve,roc)。该曲线示出了灵敏度(y轴)与特异性(x轴)的关系。曲线下面积(area under the curve,auc)写在绘图区域的右下方。标志物为:
20.a:msept9,b:madcyap1,c:mkhdrbs2,d:mclec14a,e:mankrd13b,f:mcrmp1,g:meya4,h:mmsc,i:mngfr,j:mnkx2,k:mrassf2,l:msnd1,m:mtbx18,n:mtfap2e,o:mtmeff2;p:mvax1。
21.发明详述
22.在下面详细描述本发明之前,应当理解,本发明不限于本文所描述的具体方法、方案和试剂,因为这些可以变化。还应当理解,本文使用的术语仅用于描述特定实施方案之目的,并不意图限制本发明的范围,本发明的范围仅由所附权利要求书限制。除非另有定义,否则本文使用的所有技术和科学术语均具有与本领域普通技术人员通常理解的相同的含义。
23.优选地,本文使用的术语如“a multilingual glossary of biotechnological terms:(iupac recommendations)”,leuenberger,h.g.w,nagel,b.andh.eds.(1995),helvetica chimica acta,ch-4010basel,switzerland中所述进行定义。
24.在本说明书的文本通篇引用了数篇文献。无论是在上文还是在下文,本文引用的每篇文献(包括所有专利、专利申请、科学出版物、制造商的说明书、说明等)均在此通过引用以其整体并入。
25.在下文,将对本发明的要素进行描述。这些要素随着一些具体实施方案列出,然而,应当理解,其可以以任何方式和以任意数量组合以产生另外的实施方案。多种描述的实例和优选实施方案不应被解释为将本发明仅限于所明确描述的实施方案。该描述应被理解为支持并包括将明确描述的实施方案与任意数量的公开和/或优选要素进行组合的实施方案。此外,除非上下文另外说明,否则本技术中所有所述要素的任意排列和组合应均被视为通过本技术的描述而公开。
26.在本说明书和所附权利要求书通篇,除非上下文另外要求,否则词语“包括/包含”及其变化形式例如“包括/包含(comprises)”和“包括/包含(comprising)”应理解为暗示包括所述整体或步骤或者整体或步骤的组,但不排除任何其他整体或步骤或者整体或步骤的组。在一些优选实施方案中,“包括/包含”可以意指“由......组成”。如本说明书和所附权利要求书中所使用的,除非内容明确另外指出,否则未用数量词修饰的名词包括一个/种和/或更多个/种。
27.本发明的一些方面及其具体实施方案
28.在第一方面中,本发明涉及检测dna甲基化的方法,其包括在对象的包含基因组dna的生物样品中检测至少一种基因组dna多核苷酸中的dna甲基化的步骤,所述基因组dna多核苷酸选自由具有包含在以下中的序列的多核苷酸组成的组:
29.seq id no:16(madcyap1),seq id no:56and/or seq id no:61(mankrd13b),seq id no:41和/或seq id no:46(mclec14a),seq id no:71(mcrmp1),seq id no:81和/或seq id no:86(meya4),seq id no:31(mkhdrbs2),seq id no:96和/或seq id no:101(mmsc),seq id no:111和/或seq id no:116(mngfr),seq id no:126(mnkx2),seq id no:141和/或seq id no:146(mrassf2),seq id no:1(msept9),seq id no:161(msnd1),seq id no:171(mtbx18),seq id no:186和/或seq id no:191(mtfap2e),seq id no:201和/或seq id no:206(mtmeff2),或seq id no:216(mvax1)。
30.具体地,基因组dna可包含源自结直肠癌(crc)细胞的dna。优选地,基因组dna,特
别是源自crc细胞的基因组dna是无细胞dna。在一个优选的实施方案中,短语“基因组dna可包含源自结直肠癌(crc)细胞的dna”确实意味着对象具有提高的crc风险、被怀疑患有crc或曾患有crc(即已进行治疗以消除任何可检出的crc迹象,但怀疑会复发)。
31.优选地,该方法是体外方法。
32.在一个优选实施方案中,
[0033]-具有包含在seq id no:16中的序列的多核苷酸具有包含在seq id no:21中、优选包含在seq id no:26中的序列,
[0034]-具有包含在seq id no:56和/或seq id no:61中的序列的多核苷酸具有包含在seq id no:66中的序列,
[0035]-具有包含在seq id no:41和/或seq id no:46中的序列的多核苷酸具有包含在seq id no:51中的序列,
[0036]-具有包含在seq id no:71中的序列的多核苷酸具有包含在seq id no:76中的序列,
[0037]-具有包含在seq id no:81和/或seq id no:86中的序列的多核苷酸具有包含在seq id no:91中的序列,
[0038]-具有包含在seq id no:31中的序列的多核苷酸具有包含在seq id no:36中的序列,
[0039]-具有包含在seq id no:96和/或seq id no:101中的序列的多核苷酸具有包含在seq id no:106中的序列,
[0040]-具有包含在seq id no:111和/或seq id no:116中的序列的多核苷酸具有包含在seq id no:121中的序列,
[0041]-具有包含在seq id no:126中的序列的多核苷酸具有包含在seq id no:131中、优选包含在seq id no:136中的序列,
[0042]-具有包含在seq id no:141和/或seq id no:146中的序列的多核苷酸具有包含在seq id no:151中的序列,
[0043]-具有包含在seq id no:1中的序列的多核苷酸具有包含在seq id no:6中、优选包含在seq id no:11中的序列,
[0044]-具有包含在seq id no:161中的序列的多核苷酸具有包含在seq id no:156中、优选包含在seq id no:166中的序列,
[0045]-具有包含在seq id no:171中的序列的多核苷酸具有包含在seq id no:176中、优选包含在seq id no:181中的序列,
[0046]-具有包含在seq id no:186和/或seq id no:191中的序列的多核苷酸具有包含在seq id no:196中的序列,
[0047]-具有包含在seq id no:201和/或seq id no:206中的序列的多核苷酸具有包含在seq id no:211中的序列,和/或
[0048]-具有包含在seq id no:216中的序列的多核苷酸具有包含在seq id no:221中的序列。
[0049]
优选地,在选自所述组的至少两种、更优选至少三种(或至少4、5、6、7、8、9、10、11、12、13、14、15种或全部,其中较大的数字优于较小的数字)基因组dna多核苷酸中检测dna甲
基化(每种多核苷酸对应于不同的甲基化标志物)。在一些具体的优选实施方案中,针对以下来检测甲基化:根据表1的两种标志物的组合或根据表2(显示有利的auc值的表格)的三种标志物的组合,以及任选地以下中一种或更多种其他标志物:
[0050]
madcyap1,mankrd13b,mclec14a,mcrmp1,meya4,mkhdrbs2,mmsc,mngfr,mnkx2,mrassf2,msept9,msnd1,mtbx18,mtfap2e,mtmeff2和mvax1
[0051]
(如上所列举的序列,其包括优选的序列)。在表1中所列举的组合中,表1中所示的auc为至少0.80、优选至少0.84、0.86、0.88、0.90或0.92、更优选至少0.93的那些是特别优选的。在表2中所列举的组合中,表2中所示的auc为至少0.85、优选至少0.87、0.89、0.9、0.91或0.92、更优选至少0.93或0.94的那些是特别优选的。
[0052]
多核苷酸所具有的序列在本文中也称为靶区域或靶dna,并且可以是整个seq id no的序列,或者可以是具有如下文“本发明的定义和另一些实施方案”部分中指定的长度的序列。
[0053]
在本说明书中,靶dna也使用以下名称来指代:
[0054]
msept9,madcyap1,mkhdrbs2,mclec14a,mankrd13b,mcrmp1,meya4,mmsc,mngfr,mnkx2,mrassf2,msnd1,mtbx18,mtfap2e,mtmeff2和mvax1,
[0055]
其是本发明的不同的甲基化标志物。在这些中,第一个字母“m”意指“甲基化标志物”,并且大写字母是指靶dna所在的基因(表3中提供了相应的基因组区域)。当仅使用这些名称而不指明具体的seq id no时,其是指对应于根据图1和表3的名称的seq id no,其优选顺序是在本发明的第一方面和第二方面中指出的。
[0056]
在一个优选的实施方案中,基因组靶dna(在其中检测甲基化的dna区域)包含至少一个cpg二核苷酸,优选至少2、3、4或5个,最优选至少6个(例如至少10、15或30个)cpg二核苷酸。通常,检测包含在基因组dna中的至少一个cpg二核苷酸的甲基化,优选至少2、3、4或5个,最优选至少6个(例如至少10、15或30个)cpg二核苷酸的甲基化。此外,通常检测基因组靶dna中包含的所有cpg二核苷酸的甲基化。然而,可能会省略一部分cpg二核苷酸的甲基化检测(一部分意指最多3个、2个或优选1个,但绝不是全部),例如,如果对象所属的物种(优选人)具有cpg二核苷酸的一个或两个位置处的单多核苷酸多态性(single polynucleotide polymorphism,snp)的话。
[0057]
在一个实施方案中,第一方面的方法包括以下步骤:
[0058]
(a)将在生物样品的基因组dna中在5位未甲基化的胞嘧啶转化为尿嘧啶或不与鸟嘌呤杂交的另一碱基;以及
[0059]
(b)通过检测步骤(a)的经转化dna中的未转化胞嘧啶来检测基因组dna中的dna甲基化。
[0060]
实施该方法的一种优选方式包括以下步骤:
[0061]
(a)将基因组dna中在5位未甲基化的胞嘧啶转化为尿嘧啶或不与鸟嘌呤杂交的另一碱基;
[0062]
(b)甲基化特异性地扩增经转化的dna的区域;
[0063]
(c)检测步骤(b)中扩增的dna的存在或不存在;
[0064]
其中存在或不存在扩增的dna分别表示存在或不存在甲基化基因组dna。
[0065]
在一个优选实施方案中,扩增的步骤b)包括使用根据第四方面的至少一个寡核苷
酸,优选作为引物。更优选地,其包括使用包含在第五方面的试剂盒中的寡核苷酸。
[0066]
在第一方面的方法的一个优选实施方案中,检测dna甲基化包括确定甲基化基因组dna的量。本领域中已知的任何手段都可用于检测dna甲基化或确定其量(也参见下文中的本领域已知的和优选的手段)。优选地,通过测序、特别是下一代测序(next-generation-sequencing,ngs),通过实时pcr或通过数字pcr来检测甲基化或确定甲基化基因组dna的量。
[0067]
以下标志物显示出一致的共甲基化:
[0068]
madcyap1,mankrd13b,mclec14a,mcrmp1,meya4,mkhdrbs2,mmsc,mngfr,mnkx2,mrassf2,msept9,msnd1,mtbx18,mtfap2e,mtmeff2和mvax1,
[0069]
因此,当通过测序确定甲基化的量时,甲基化的量可以简单地通过对甲基化的序列(读序)的数量进行计数来确定。
[0070]
在一个优选的实施方案中,生物样品是结肠或直肠组织样品或液体活检物,优选血液样品、包含来自血液的无细胞dna的样品(例如尿样品)、血液来源的样品或唾液样品。
[0071]
在另一个优选实施方案中,对象具有提高的发生crc的风险、被怀疑患有crc、曾患有crc或患有crc。
[0072]
术语“结直肠癌(crc)”,也称为肠癌和结肠癌,在本文中也称为“本说明书中的癌症”,以最广泛的含义使用,并且是指起始于结肠或起始于直肠的所有癌症。其包括以下亚型:腺癌(起始于制造黏液以使结肠和直肠的内部润滑的细胞的癌症)、类癌瘤(起源于结肠壁中cajal的间质细胞的癌症)、起始于结肠或直肠的淋巴瘤以及起始于结肠和直肠壁中的血管、肌肉层或其他结缔组织的肉瘤。就本发明而言,最常见和优选的crc是腺癌。
[0073]“结肠或直肠组织样品”是来自可发生crc的任何组织的组织样品。在一个实施方案中,如果对象患有癌症,则结肠或直肠组织样品是crc组织样品。
[0074]
根据第一方面的方法的目的,术语“对象”可具有不同的限制。例如,如果该方法将用于检测crc或筛查crc对象,则该对象是否患有crc是未知的,即该对象可能患有也可能未患有crc。在这个实例中,对象优选地具有提高的发生crc的风险,或被怀疑患有crc,或曾患有crc(即,可检出的crc已经治愈)。“提高的风险”意指一般性地癌症或crc的一个或更多个风险因子可归因于对象,优选地如美国癌症协会(american cancer society)对一般性地癌症或对crc所定义的。crc风险因子的一些实例为:重度酒精使用(男性每天超过3或4个酒精单位,或者女性每天超过2或3个酒精单位;一个酒精单位被定义为10ml(8g)纯酒精),烟草消耗(尤其是吸烟,但也包括无烟烟草),超重(体重指数(body mass index,bmi)为25至29.9)或肥胖(bmi为30或更高),尤其是腰围较大、身体活动不足(在平时(非运动)日常活动之外,每周锻炼(运动)少于150分钟,优选75分钟),饮食富含红肉(例如牛肉、猪肉、羊肉或肝脏)和加工肉类,50岁或更年长,个人结直肠息肉、结直肠癌和/或炎性肠病(例如溃疡性结肠炎或克罗恩病(crohn’s disease))病史,结直肠癌或腺瘤性息肉家族史(优选一级亲属(父母、兄弟姐妹或孩子),更优选在45岁或以下诊断的和/或多于一个一级亲属受影响的),患有提高的crc风险的遗传性综合征例如优选林奇综合征(lynch syndrome)(遗传性非息肉病性结直肠癌或hnpcc)或家族性腺瘤性息肉病(familial adenomatous polyposis,fap),还有波伊茨-耶格综合征(peutz-jeghers syndrome,pjs)或myh相关的息肉病(myh-associated polyposis,map)),具有提高的风险的种族和民族背景(例如非裔美
国人或德系犹太人),以及患有2型糖尿病。
[0075]
在下文,特别是在标题“本发明的定义和另一些实施方案”下描述的定义和实施方案适用于第一方面的方法。
[0076]
在第二方面中,本发明涉及用于检测对象中crc的存在或不存在的方法,其包括根据第一方面的方法检测dna甲基化,其中存在检测到的甲基化基因组dna表示存在crc,不存在检测到的甲基化基因组dna表示不存在crc。因此,第二方面的方法可用作诊断crc的方法。该方法也可用作用于筛查crc对象群体的方法。
[0077]
优选地,该方法是体外方法。
[0078]
癌症可以是如下所限定的任何亚型和阶段,即可以检测任何亚型和/或阶段的存在或不存在。
[0079]
在一个优选实施方案中,存在显著量的甲基化基因组dna、或者存在大于对照中的量的甲基化基因组dna表明存在crc,不存在显著量的甲基化基因组dna、或者量等于或小于对照中表明不存在crc。
[0080]
在一个具体实施方案中,第二方面的方法还包括通过使用用于检测crc的一种或更多种其他手段来确认crc的检测。所述其他手段可以是癌症标志物(或“生物标志物”)或常规(非标志物)检测手段。癌症标志物可以是例如dna甲基化标志物、突变标志物(例如snp)、抗原标志物、蛋白质标志物、mirna标志物、癌症特异性代谢物或表达标志物(例如rna或蛋白质表达)。常规手段可以是例如活检(例如,具有或没有针对例如蛋白质或表达标志物的染色方法的可视活检检查)、成像技术(例如x射线成像、ct扫描、cr结肠造影、核成像例如pet和spect、超声、磁共振成像(magnetic resonance imaging,mri)、热成像术(thermography)、或内窥镜检查、结肠镜检查或乙状结肠镜检查)或身体检查例如触诊(tactile examination)。优选地,其是结肠镜检查,优选地涉及活检或其他从指示crc的组织移出对象的实体组织样品(即,不是例如血液的液体组织)并进行检查的手段。
[0081]
在一个优选实施方案中,第二方面的方法是用于监测具有提高的发生crc的风险、被怀疑患有或发生crc、或曾患有crc的对象,其包括重复检测dna甲基化,其中存在检测到的甲基化基因组dna表示存在crc,不存在检测到的甲基化基因组dna表示不存在crc。优选地,dna甲基化的检测包括确定甲基化基因组dna的量,其中在dna甲基化的一次或更多次重复检测中甲基化基因组dna的量提高表示存在crc,并且在dna甲基化的重复检测中量恒定或降低表示不存在crc。
[0082]
关于第一方面给出的定义和描述的实施方案也适用于第二方面,只要其是适用的即可。此外,在下文,特别是在标题“本发明的定义和另一些实施方案”下描述的定义和实施方案适用于第二方面的方法。
[0083]
在第三方面中,本发明涉及选自引物和探针的寡核苷酸,其包含与以下之一段连续核苷酸基本上相同的序列:seq id no 17至20中的一者(madcyap1)、57至60中的一者和/或62至65中的一者(rnankrd13b)、42至45中的一者和/或47至50中的一者(mclec14a)、72至75中的一者(mcrmp1)、82至85中的一者和/或87至90中的一者(meya4)、32至35中的一者(mkhdrbs2)、97至100中的一者和/或102至105中的一者(mmsc)、112至115中的一者和/或117至120中的一者(mngfr)、127至130中的一者(mnkx2)、142至145中的一者和/或147至150中的一者(mrassf2)、2至5中的一者(msept9)、162至165中的一者(msnd1)、172至175中的一
者(mtbx18)、187至190中的一者和/或192至195中的一者(mtfap2e)、202至205中的一者和/或207至210中的一者(mtmeff2)、或217至220中的一者(mvax1)。
[0084]
在一个优选实施方案中,
[0085]-与seq id no 17至20中的一者的一段连续核苷酸基本上相同的序列与seq id no 22至25中的一者、优选seq id no 27至30中的一者的一段连续核苷酸基本上相同,
[0086]-与seq id no 57至60中的一者和/或seq id no 62至65中的一者的一段连续核苷酸基本上相同的序列与seq id no 67至70中的一者的一段连续核苷酸基本上相同,
[0087]-与seq id no 42至45中的一者和/或seq id no 47至50中的一者的一段连续核苷酸基本上相同的序列与seq id no 52至55中的一者的一段连续核苷酸基本上相同,
[0088]-与seq id no 72至75中的一者的一段连续核苷酸基本上相同的序列与seq id no 77至80中的一者的一段连续核苷酸基本上相同,
[0089]-与seq id no 82至85中的一者和/或seq id no 87至90中的一者的一段连续核苷酸基本上相同的序列与seq id no 92至95中的一者的一段连续核苷酸基本上相同,
[0090]-与seq id no 32至35中的一者的一段连续核苷酸基本上相同的序列与seq id no 37至40中的一者的一段连续核苷酸基本上相同,
[0091]-与seq id no 97至100中的一者和/或seq id no 102至105中的一者的一段连续核苷酸基本上相同的序列与seq id no 107至110中的一者的一段连续核苷酸基本上相同,
[0092]-与seq id no 112至115中的一者和/或seq id no 117至120中的一者的一段连续核苷酸基本上相同的序列与seq id no 122至125中的一者的一段连续核苷酸基本上相同,
[0093]-与seq id no 127至130中的一者的一段连续核苷酸基本上相同的序列与seq id no 132至135中的一者、优选seq id no 137至140中的一者的一段连续核苷酸基本上相同,
[0094]-与seq id no 142至145中的一者和/或seq id no 147至150中的一者的一段连续核苷酸基本上相同的序列与seq id no 152至155中的一者的一段连续核苷酸基本上相同,
[0095]-与seq id no 2至5中的一者的一段连续核苷酸基本上相同的序列与seq id no 7至10中的一者、优选seq id no 12至15中的一者的一段连续核苷酸基本上相同,
[0096]-与seq id no 162至165中的一者的一段连续核苷酸基本上相同的序列与seq id no 157至160中的一者、优选seq id no 167至170中的一者的一段连续核苷酸基本上相同,
[0097]-与seq id no 172至175中的一者的一段连续核苷酸基本上相同的序列与seq id no 177至180中的一者、优选seq id no 182至185中的一者的一段连续核苷酸基本上相同,
[0098]-与seq id no 187至190中的一者和/或seq id no 192至195中的一者的一段连续核苷酸基本上相同的序列与seq id no 197至200中的一者的一段连续核苷酸基本上相同,
[0099]-与seq id no 202至205中的一者和/或seq id no 207至210中的一者的一段连续核苷酸基本上相同的序列与seq id no 212至215中的一者的一段连续核苷酸基本上相同,和/或
[0100]-与seq id no 217至220中的一者的一段连续核苷酸基本上相同的序列与seq id no 222至225中的一者的一段连续核苷酸基本上相同。
[0101]
在本文中,与两个(或更多个)seq id no(例如seq id no 17至20中的一者和seq id no 22至25中的一者,或者例如seq id no 57至60中的一者和/或seq id no 62至65中的一者)的一段连续核苷酸基本上相同的序列与两个(或更多个)相应的seq id no相同。“相应的”意指根据表3同一甲基化标志物(例如madcyap1)的同一类型(该类型为基因组参照,c至t(bis1),rc c至t(bis1),g至a(bis2 rc)以及g至a(bis2 rc)rc)。
[0102]
通常,寡核苷酸是亚硫酸氢盐(bisulfite)特异性的。优选地,寡核苷酸是甲基化特异性的,更优选阳性甲基化特异性的。
[0103]
寡核苷酸可以是引物或探针寡核苷酸,优选地其是引物寡核苷酸。探针优选具有一种或更多种选自可检测标签和猝灭剂的修饰,和/或5至40个核苷酸的长度。引物优选具有长度为10至40个核苷酸的引发区域。
[0104]
关于第一方面和第二方面给出的定义和描述的实施方案也适用于第三方面,只要其是适用的即可。此外,在下文,特别是在标题“本发明的定义和另一些实施方案”下描述的定义和实施方案适用于第三方面的寡核苷酸。
[0105]
在第四方面中,本发明涉及至少包含第三方面的第一寡核苷酸和第二寡核苷酸的试剂盒。
[0106]
在一个优选实施方案中,第一寡核苷酸和第二寡核苷酸是形成引物对的引物,所述引物对适用于扩增具有包含在以下中的序列的dna:seq id no 17至20中的一者(madcyap1)、seq id no 57至60中的一者和/或seq id no 62至65中的一者(mankrd13b)、seq id no 42至45中的一者和/或seq id no 47至50中的一者(mclec14a)、seq id no72至75中的一者(mcrmp1)、seq id no 82至85中的一者和/或seq id no 87至90中的一者(meya4)、seq id no 32至35中的一者(mkhdrbs2)、seq id no 97至100中的一者和/或seq id no 102至105中的一者(mmsc)、seq id no 112至115中的一者和/或seq id no 117至120中的一者(mngfr)、seq id no 127至130中的一者(mnkx2)、seq id no 142至145中的一者和/或seq id no 147至150中的一者(mrassf2)、seq id no 2至5中的一者(msept9)、seq id no 162至165中的一者(msnd1)、seq id no 172至175中的一者(mtbx18)、seq id no 187至190中的一者和/或seq id no 192至195中的一者(mtfap2e)、seq id no 202至205中的一者和/或seq id no 207至210中的一者(mtmeff2)或seq id no 217至220中的一者(mvax1)。
[0107]
优选地,
[0108]-包含在seq id no 17至20中的一者中的序列包含在seq id no 22至25中的一者中,优选地包含在seq id no 27至30中的一者中,
[0109]-包含在seq id no 57至60中的一者和/或seq id no 62至65中的一者中的序列包含在seq id no 67至70中的一者中,
[0110]-包含在seq id no 42至45中的一者和/或seq id no 47至50中的一者中的序列包含在seq id no 52至55中的一者中,
[0111]-包含在seq id no 72至75中的一者中的序列包含在seq id no 77至80中的一者中,
[0112]-包含在seq id no 82至85中的一者和/或seq id no 87至90中的一者中的序列包含在seq id no 92至95中的一者中,
[0113]-包含在seq id no 32至35中的一者中的序列包含在seq id no 37至40中的一者中,
[0114]-包含在seq id no 97至100中的一者和/或seq id no 102至105中的一者中的序列包含在seq id no 107至110中的一者中,
[0115]-包含在seq id no 112至115中的一者和/或seq id no 117至120中的一者中的序列包含在seq id no 122至125中的一者中,
[0116]-包含在seq id no 127至130中的一者中的序列包含在seq id no 132至135中的一者中,优选地包含在seq id no 137至140中的一者中,
[0117]-包含在seq id no 142至145中的一者和/或seq id no 147至150中的一者中的序列包含在seq id no 152至155中的一者中,
[0118]-包含在seq id no 2至5中的一者中的序列包含在seq id no 7至10中的一者中,优选地包含在seq id no 12至15中的一者中,
[0119]-包含在seq id no 162至165中的一者中的序列包含在seq id no 157至160中的一者中,优选地包含在seq id no 167至170中的一者中,
[0120]-包含在seq id no 172至175中的一者中的序列包含在seq id no 177至180中的一者中,优选地包含在seq id no 182至185中的一者中,
[0121]-包含在seq id no 187至190中的一者和/或seq id no 192至195中的一者中的序列包含在seq id no 197至200中的一者中,
[0122]-包含在seq id no 202至205中的一者和/或seq id no 207至210中的一者中的序列包含在seq id no 212至215中的一者中,和/或
[0123]-包含在seq id no 217至220中的一者中的序列包含在seq id no 222至225中的一者中。
[0124]
在本文中,包含在两个(或更多个)seq id no(例如seq id no 17至20中的一者和seq id no 22至25中的一者,或者例如seq id no 57至60中的一者和/或seq id no 62至65中的一者)中的序列包含在两个(或更多个)相应的seq id no中。“相应的”意指根据表3同一甲基化标志物的同一类型。
[0125]
在另一个优选实施方案中,该试剂盒包含形成至少两个、优选至少三个(或至少4、5、6、7、8、9、10、11、12、13、14、15或至少16个,其中较大数量优于较小数量)这样的引物对的多核苷酸,其中每个引物对适用于扩增具有选自以下的不同标志物的序列的dna:
[0126]
madcyap1,mankrd13b,mclec14a,mcrmp1,meya4,mkhdrbs2,mmsc,mngfr,mnkx2,mrassf2,msept9,msnd1,mtbx18,mtfap2e,mtmeff2和mvax1。
[0127]
在一些具体的优选实施方案中,该试剂盒包含形成引物对的多核苷酸,其用于以下的标志物:根据表1的两种标志物的组合或根据表2(显示有利的auc值)的三种标志物的组合,以及任选地由以下组成的组中的一种或更多种其他标志物:
[0128]
madcyap1,mankrd13b,mclec14a,
[0129]
mcrmp1,meya4,mkhdrbs2,mmsc,mngfr,mnkx2,mrassf2,msept9,msnd1,mtbx18,mtfap2e,mtmeff2和mvax1。
[0130]
在表1中所列举的组合中,表1中所示的auc为至少0.80、优选至少0.84、0.86、0.88、0.90或0.92、更优选至少0.93的那些是特别优选的。在表2中所列举的组合中,表2中
所示的auc为至少0.85、优选至少0.87、0.89、0.9、0.91或0.92、更优选至少0.93或0.94的那些是特别优选的。
[0131]
关于第一方面、第二方面和第三方面给出的定义和描述的实施方案也适用于第四方面,只要其是适用的即可。此外,在下文,特别是在标题“本发明的定义和另一些实施方案”下描述的定义和实施方案适用于第四方面的试剂盒。
[0132]
在第五方面中,本发明涉及第一方面的方法、第三方面的寡核苷酸或第四方面的试剂盒用于检测crc或者用于监测具有提高的发生crc的风险、被怀疑患有或发生crc或曾患有crc的对象的用途。优选地,该用途是体外用途。
[0133]
关于第一方面、第二方面、第三方面和第四方面给出的定义和描述的实施方案也适用于第五方面,只要其是适用的即可。此外,在下文,特别是在标题“本发明的定义和另一些实施方案”下描述的定义和实施方案适用于第五方面的用途。
[0134]
在第六方面中,本发明涉及第一方面或第二方面的方法,或者第五方面的用途,其包括治疗在其生物样品中检测到dna甲基化的对象的crc的步骤。换言之,第六方面的方法可以描述为治疗方法,其包括第一方面或第二方面的方法,或者第五方面的用途,以及治疗在其生物样品中检测到dna甲基化的对象的crc的步骤。第六方面的方法也可以描述为治疗方法,其包括治疗在根据第一方面或第二方面的方法或者第五方面的用途检测到dna甲基化的对象中的crc。
[0135]
关于第一方面、第二方面、第三方面、第四方面和第五方面给出的定义和描述的实施方案也适用于第六方面,只要其是适用的即可。此外,在下文,特别是在标题“本发明的定义和另一些实施方案”下描述的定义和实施方案适用于第六方面的方法。
[0136]
表1:包含标志物1和2的至少两种标志物的组合
[0137]
[0138][0139]
表2:包含标志物1、2和3的至少三种标志物的组合
[0140]
[0141]
[0142]
[0143]
[0144]
[0145]
[0146][0147]
本发明的定义和另一些实施方案
[0148]
本说明书使用多个术语和短语,其具有如下定义的某些含义。优选的含义应解释为本文所述的本发明各方面的优选实施方案。因此,其以及下文所述的另一些实施方案可以与本发明各方面的任何实施方案,特别是上文所述的本发明各方面的任何优选实施方案组合。
[0149]
本文使用的术语“甲基化”是指涉及向胞嘧啶dna核苷酸添加甲基的生化过程。在胞嘧啶(尤其是启动子区中的胞嘧啶)5位的dna甲基化可以具有降低基因表达的效应,并且已经在检测的每种脊椎动物中发现。在成体非配子细胞中,dna甲基化通常发生在cpg位点中。本文使用的术语“cpg位点”或“cpg二核苷酸”是指这样的dna区域,其中在沿其长度的线性碱基序列中胞嘧啶核苷酸紧接鸟嘌呤核苷酸出现。“cpg”是“c-磷酸-g”的简写,即胞嘧啶和鸟嘌呤通过仅一个磷酸隔开;在dna中磷酸将任意两个核苷连接在一起。使用“cpg”符号来将这种线性序列与胞嘧啶和鸟嘌呤的cg碱基配对区分开。cpg二核苷酸中的胞嘧啶可以被甲基化以形成5-甲基胞嘧啶。术语“cpg位点”或“基因组dna的cpg位点”还用于dna中前(未甲基化的)cpg位点的其中该cpg位点的未甲基化c被转化成如本文所述的另一种(例如,通过亚硫酸氢盐转化成尿嘧啶)的位点。本技术提供了每个相关dna区域的基因组序列以及每个经转化链的亚硫酸氢盐转化序列。提及的cpg位点始终是基因组序列的cpg位点的位置,即使经转化的序列由于转化而不再包含这些cpg位点。特别地,在本发明背景下的甲基化意指高甲基化。术语“高甲基化”是指异常的甲基化模式或状态(即,一个或更多个核苷酸的甲基化的存在或不存在),其中与对照(即来自对象之非癌细胞或者来自未患或未曾患过对该对象治疗之癌症(优选任何癌症)的对象(健康对照))的相同基因组dna相比,一个或更多个核苷酸(优选cpg位点的c)被甲基化。术语“对照”还可以指甲基化状态、模式或量,其是至少5个、优选至少10个对象的组的已知平均值或中值,或者从至少5个、优选至少10个对象的组确定的平均值或中值。特别地,其是指相对于见于(健康)对照dna样品中相应cpg二核苷酸的5-mcyt的量,受试dna样品的dna序列中一个或复数个cpg二核苷酸处5-mcyt的存在提高,两种样品优选是相同类型的,例如,均为血浆、均为血清、均为唾液或均为尿。作为一种甲基化状态/模式的高甲基化可以在一个或更多个cpg位点处确定。如果使用多于一个cpg位点,可以单独地在每个位点处或作为一起考虑的cpg位点的平均值来确定高甲基化。或者,所有评估的cpg位点都必须被甲基化(共甲基化),以使得满足高甲基化要求。
[0150]
本文使用的术语“检测dna甲基化”是指至少定性地分析甲基化靶dna的存在或不存在。“靶dna”是指基因组dna多核苷酸(区域)中的序列,其长度通常受到限制,但优选地是适合于pcr扩增的长度,例如为至少30至1000,更优选50至300,甚至更优选75至200或75至
150个核苷酸长。如果使用引物扩增靶区域,则靶dna包括引物结合位点。甲基化优选地在靶dna的1个或更多个、2个或更多个、3个或更多个、4个或更多个、或者5个或更多个、最优选6个或更多个(例如,10个或更多个、15个或更多个、或者30个或更多个)cpg位点处确定。通常来说,所分析的cpg位点在癌症中是共甲基化的,使得相邻dna的cpg位点也被甲基化,并且可另外地或替代地进行分析。“至少定性地”意指也可以进行甲基化靶dna(如果存在的话)的定量测定。事实上,dna甲基化的检测优选包括确定甲基化基因组dna的量。
[0151]
dna甲基化可以通过本领域中已知的多种方式来检测或确定其量,所述方式例如放射自显影术、银染色或溴化乙锭染色、甲基化灵敏单核苷酸延伸(methylation sensitive single nucleotide extension,ms-snupe)、甲基结合蛋白、甲基化dna的抗体、甲基化灵敏限制酶等,优选通过测序,例如下一代测序(ngs),或通过实时pcr例如多重实时pcr,或通过数字pcr(digital pcr,dpcr)。特别地,如果平行检查3种或更多种(例如4种或更多种或者5种或更多种)不同的靶dna(即标志物),则优选通过测序(优选通过ngs)检测甲基化dna的存在或不存在。
[0152]
在实时pcr中,这是通过在使用甲基化特异性引物或者使用甲基化特异性阻断剂连同甲基化特异性引物或优选甲基化非特异性引物来甲基化特异性地扩增经转化(例如经亚硫酸氢盐转化)的靶dna期间检测甲基化特异性寡核苷酸探针来完成的。
[0153]
数字pcr(dpcr)是定量pcr,其中pcr反应混合物被分至单独的隔室(例如孔或油包水乳滴)中,这导致每个隔室中存在1种或0种靶标。在pcr扩增之后,确定阳性与阴性反应的数量,并且从该结果统计学地进行量化,优选使用泊松(poisson)统计。优选的dpcr是beaming(珠、乳液、扩增、磁性),其中dna模板(其可以是预扩增的)使用与在油包水乳滴中分隔存在的磁珠结合的引物进行扩增。扩增导致珠被扩增的dna覆盖。然后将珠合并并分析扩增,例如使用可通过流式细胞术分析的甲基化特异性荧光探针进行。例如,参见yokoi等(int j sci.2017 apr;18(4):735)。当应用于甲基化分析,该方法也称为甲基beaming。
[0154]
通过测序的检测优选地是通过ngs的检测。其中,经转化的甲基化靶dna被扩增,优选地被甲基化特异性地扩增(如果靶dna被甲基化,换言之,如果cpg位点的胞嘧啶未被转化,则靶dna被扩增)。这可以通过甲基化特异性的亚硫酸氢盐特异性引物来实现。然后,对扩增的序列进行测序并随后计数。计算来自经转化甲基化dna的序列(通过cpg位点在序列中鉴定)与来自经转化未甲基化dna的序列的比,得到甲基化靶dna的(相对)量。
[0155]
术语“下一代测序”(ngs,也称为第二代或第三代测序)是指以下测序:由随着从dna模板链重新合成每个片段发出的信号顺序地鉴定小dna片段的碱基。ngs以大规模并行的方式将这一过程延伸到数百万个反应中,而不是局限于单个或几个dna片段。这一进步使得能够用最新的仪器对扩增的dna进行快速测序,该最新的仪器能够在单次测序运行中产生数百个千兆碱基(gigabase)的数据。参见,例如,shendure and ji,nature biotechnology 26,1135-1145(2008),或mardis,annu rev genomics hum genet.2008;9:387-402。合适的ngs平台可商购获得,例如roche 454平台、roche 454 junior平台、illumina hiseq或miseq平台,或life technologies solid 5500或ion torrent平台。
[0156]
通常,定量(例如确定甲基化靶dna的量)可以是绝对的,例如以pg/ml或ng/ml样品、拷贝数/ml样品、pcr循环数等计,或者定量可以是相对的,例如,是对照样品中的10倍高或作为参照对照(优选完全甲基化的dna)的甲基化的百分比。确定样品中甲基化靶dna的量
可以包括对样品中总dna的量进行归一化。受试样品中总dna的量的归一化优选地包括计算甲基化靶dna的量与以下量之比:(i)参照位点的dna的量或(ii)总靶dna的量(例如,甲基化靶dna的量加上未甲基化靶dna的量,后者优选地对反向链测量)。参照位点可以是任何基因组位点而不必是基因。优选地参照位点的序列的出现次数在大群体中是稳定的或预期是稳定的(即恒定的)(例如,不是在重复片段中,即重复dna中)。参照位点可以是例如管家基因,例如β-肌动蛋白。
[0157]
如上所提及的,样品中甲基化靶dna的量可以表示为甲基化靶dna的量相对于包含基本上完全甲基化的基因组dna的参照样品中甲基化靶dna的量(参照对照)的比例。优选地,确定甲基化靶dna的比例包括确定参照样品中相同靶标的甲基化dna的量,优选通过使用参照位点的甲基化非特异性测量对总甲基化dna进行样品间归一化,并用由受试样品获得的比除以由参照样品获得的相应比。该比例可以通过将除法的结果乘以100来表示为百分比或pmr(甲基化参照的百分比(percentage of methylated reference))。pmr的测定在ogino等(jmd 2006年5月,第8卷,第2期)中详细描述。
[0158]
本文使用的术语“扩增”或“产生扩增子”是指靶核酸及其互补序列或者特别是它们的区域的拷贝数的提高。靶标可以是双链或单链dna模板。扩增可以通过使用本领域已知的任何方法来进行,通常使用聚合酶链式反应(pcr)来进行。“扩增子”是根据所述限定区域的双链dna片段。优选地使用(i)甲基化特异性引物或(ii)甲基化非特异性但对经亚硫酸氢盐转化的dna具有特异性(即,通过覆盖非cpg背景下的至少一个经转化的c而仅与经转化的dna杂交)的引物通过甲基化特异性pcr(即,根据一个或更多个cpg位点是否被转化来产生扩增子)来进行扩增。在(ii)的情况下的甲基化特异性通过使用甲基化特异性阻断剂寡核苷酸来实现,其与经转化或未经转化的cpg位点特异性杂交,并且由此终止pcr聚合。例如,扩增步骤包括实时pcr,特别是heavymethyl
tm
或heavymethyl
tm-methylight
tm

[0159]
本文使用的术语“基因组dna”是指染色体dna,并且用于与编码dna区分开。因此,其包括属于基因的外显子、内含子以及调控序列,特别是启动子。
[0160]
本文使用的短语“将dna中在5位未甲基化的胞嘧啶转化成尿嘧啶或不与鸟嘌呤杂交的另一碱基”是指以这样的方式化学处理dna的过程:将全部或基本上全部的未甲基化胞嘧啶碱基转化成尿嘧啶碱基或在碱基配对表现方面与胞嘧啶不相似的另一碱基,而使5-甲基胞嘧啶碱基保持不变。dna样品中未甲基化而不是甲基化的胞嘧啶碱基的转化用转化剂来进行。本文使用的术语“转化剂”涉及能够将未甲基化胞嘧啶转化成尿嘧啶或在杂交性质方面与胞嘧啶可检测地不相似的另一碱基的试剂。转化剂优选为亚硫酸氢盐,例如焦亚硫酸盐(disulfite)或亚硫酸氢盐(hydrogen sulfite)。根据标准程序(frommer et al.,1992,proc natl acad sci usa 89:1827-31;olek,1996,nucleicacids res 24:5064-6;ep 1394172)进行反应。也可酶促地、例如通过使用甲基化特异性胞苷脱氨酶来进行转化。最优选地,转化剂为亚硫酸氢钠、亚硫酸氢铵或亚硫酸氢盐。
[0161]
术语“亚硫酸氢盐特异性的”意指对经亚硫酸氢盐转化的dna具有特异性。经亚硫酸氢盐转化的dna是这样的dna:其中至少一个在非cpg背景下的c(例如cpc、cpa或cpt二核苷酸的c),优选所有,已被转化成t或u(化学地转化成u,其通过dna扩增变为t)。就寡核苷酸而言,其意味着寡核苷酸覆盖源自非cpg背景下的c(例如cpc、cpa或cpt二核苷酸的c)或其补体向t的转化的至少一个核苷酸,或与之杂交。
[0162]
本文使用的术语“甲基化特异性的”通常是指依赖于cpg甲基化的存在或不存在。
[0163]
本文关于寡核苷酸使用的术语“甲基化特异性的”意指根据至少一个cpg位点的c在转化之前是未甲基化的还是甲基化的,即基于c是否已被转化,寡核苷酸与或不与dna单链(其中在5位未甲基化的胞嘧啶已被转化成尿嘧啶或不与鸟嘌呤杂交的另一碱基,并且其中其在转化之前包含至少一个cpg位点)退火,且没有与该至少一个cpg位点中c的位置相关的错配。甲基化特异性可以是阳性的(如果c未被转化,则寡核苷酸退火而没有所述错配)或者是阴性的(如果c被转化,则寡核苷酸退火而没有所述错配)。为了防止寡核苷酸与其特异性相反的退火,其优选地在转化之前覆盖至少2、3、4、5或6,并且优选3至6个cpg位点。
[0164]
本文使用的术语“甲基化非特异性的”通常是指不依赖于cpg甲基化的存在或不存在。
[0165]
本文关于寡核苷酸使用的术语“甲基化非特异性的”意指不管至少一个cpg位点的c在转化之前是未甲基化的还是甲基化的,即不管c是否已经被转化,寡核苷酸均与dna单链(其中在5位未甲基化的胞嘧啶已被转化成尿嘧啶或不与鸟嘌呤杂交的另一碱基,并且其中其在转化之前可包含或可不包含至少一个cpg位点)退火。在一种情况下,与寡核苷酸退火的dna单链的区域不包含任何cpg位点(在转化之前和之后),并且仅仅为此,该寡核苷酸是甲基化非特异性的。当甲基化非特异性寡核苷酸可以覆盖一个或更多个cpg二核苷酸时,其用错配和/或间隔物这样做。本文使用的术语“错配”是指dna中的碱基对错配,更具体地,不能形成正常碱基配对相互作用的碱基对(即,除“a”与“t”或“u”,或“g”与“c”之外)。
[0166]
在至少一种基因组dna多核苷酸中检测甲基化,即在根据所提及seq id no的dna(“靶dna”)的特定区域中检测甲基化。本文使用的术语“靶dna”是指在特定染色体位置处的基因组核苷酸序列。在本发明的上下文中,其通常是已知在疾病状态下(例如在癌细胞中vs.在非癌细胞中)甲基化的遗传标志物。遗传标志物可以是基因组dna的编码区或非编码区。
[0167]
本文使用的术语“靶dna的区域”或“经转化的dna中的区域”是指待分析的靶dna的一部分。优选地,该区域的长度为至少40、50、60、70、80、90、100、150或200或300个碱基对(bp)和/或不长于500、600、700、800、900或1000bp(例如25至500、50至250或75至150bp)。特别地,其是基因组dna的包含至少3、4、5、6、7、8、9、10、11、12、13、14、15或16个cpg位点的区域。本发明的靶dna在图1和表3中给出。
[0168]
对于用至少一种甲基化特异性引物扩增靶区域,优选的是所述至少一种甲基化特异性引物覆盖靶区域的至少1个、至少2个或优选至少3个cpg位点(例如2至8个或优选3至6个cpg位点)。优选地,这些cpg位点中的至少1个、至少2个或优选地至少3个cpg位点被引物的3

端的三个核苷酸覆盖(和/或这些cpg位点中的一者被引物的3

末端(引物的最后三个核苷酸)覆盖)。
[0169]
本文关于寡核苷酸使用的术语“覆盖cpg位点”是指该寡核苷酸与包含该cpg位点的dna区域退火,在cpg位点的c转化之前或之后(即,当提及经亚硫酸氢盐转化的序列时,则为对应基因组dna的cpg位点)。对于cpg位点(或如果c被转化,则为前cpg位点),退火可以是本文所述的甲基化特异性的或甲基化非特异性的。
[0170]
当用于寡核苷酸时,术语“退火”应理解为在中等或严格杂交条件下,样品dna中寡核苷酸沿watson-crick碱基配对的线路与至少基本上互补的序列键合,从而形成双链体结
构。当用于单个核苷酸或碱基时,其是指根据watson-crick碱基配对的结合,例如c-g、a-t和a-u。严格杂交条件包括在68℃下在5
×
ssc/5
×
denhardt溶液/1.0%sds中杂交,并在室温下在0.2
×
ssc/0.1%sds中洗涤,或者包括其本领域公认的等同条件(例如这样的条件:其中在60℃下在2.5
×
ssc缓冲液中进行杂交,随后在37。c下在低缓冲液浓度下进行数个洗涤步骤,并保持稳定)。中等条件包括在42℃下在3
×
ssc中洗涤,或其本领域公认的等同条件。可改变盐浓度和温度的参数以获得探针与靶核酸之间的识别的最佳水平。在本领域可获得关于这样条件的指南,例如,sambrook et al.,1989,molecular cloning,a laboratory manual,cold spring harbor press,n.y.;以及ausubel et al.(eds.),1995,current protocols in molecular biology,(john wiley&sons,n.y.)at unit 2.10。
[0171]
本说明书的癌症包括癌症及其每种亚型的以下阶段(如由括号中相应的tnm分类所限定):0期(tis,n0,m0)、i期(t1,n0,m0)、ii期(t2,n0,m0)、iii期(t3,n0,m0;或t1至t3,n1,m0)、iva期(t4a,n0或n1,m0;或t1至t4a,n2,m0)、ivb期(t4b,任意n,m0,或任意t,n3,m0)和ivc期(任意t,任意n,m1)。tnm分类是恶性癌症的分期系统。本文使用的术语“tnm分类”是指如sobin等(国际抗癌联盟(international union against cancer,uicc),tnm classification of malignant tumors,第6版.new york;springer,2002,pp.191-203)所定义的tnm分期的第6版。
[0172]
本文使用的术语“对象”是指人个体。
[0173]
本文使用的术语“生物样品”是指从对象获得的材料并且包含来自所有染色体的基因组dna,优选覆盖整个基因组的基因组dna。优选地,样品包含无细胞基因组dna(包括靶dna),优选循环基因组dna。如果对象患有癌症,则无细胞(优选循环)基因组dna包含来自癌细胞的无细胞(优选循环)基因组dna,即优选ctdna。
[0174]
本文使用的术语“液体活检物”是指包含无细胞(优选循环)基因组dna的体液样品。设想,其是这样的体液:如果对象患有癌症,则可以在该体液中发现来自本说明书癌症的细胞的无细胞(优选循环)基因组dna。“血液来源的样品”是通过体外处理从血液中获得的任何样品,例如血浆或血清。“包含来自血液的无细胞dna的样品”可以是任何这样的样品。例如,尿液包含来自血液的无细胞dna。
[0175]
本文使用的术语“无细胞dna”或其同义词“cfdna”以及“胞外dna”、“循环dna”和“游离循环dna”是指未包含在作为样品或从中得到样品的相应体液中的完整细胞中而是在体液样品中游离的dna。无细胞dna通常是片段化的基因组dna,如下所述。
[0176]
本文使用的术语“循环dna”或“游离循环dna”是指在体内循环的体液(特别是血液)中的无细胞dna。
[0177]
本文使用的术语“循环肿瘤dna”或“ctdna”是指源自肿瘤的循环dna(即源自肿瘤细胞的无细胞dna)。
[0178]
通常来说,在包含来自癌细胞的靶dna,尤其是胞外靶dna的样品中,还存在来自非癌细胞的与来自癌细胞的靶dna相反未甲基化的靶dna。通常来说,来自非癌细胞的所述靶dna超过来自患病细胞的量至少10倍、至少100倍、至少1,000倍或至少10,000倍。一般来说,样品中所包含的基因组dna是至少部分片段化的。“至少部分片段化的”意指来自癌细胞的至少胞外dna,特别是至少胞外靶dna是片段化的。术语“片段化的基因组dna”是指细胞(特
别是癌细胞)的基因组dna的碎片,其是长dna的部分物理、化学和/或生物破碎形成较短长度的离散片段的结果。特别地,“片段化的”意指基因组dna(优选靶dna)的至少一些被片段化为短于1,500bp、1,300bp、1,100bp、1,000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp或100bp的片段。在该方面,“至少一些”意指至少5%、10%、20%、30%、40%、50%或75%。
[0179]
本文使用的术语“癌细胞”是指在其发育期间获得一组特征性功能能力,特别是以下一项或更多项的细胞:逃避凋亡的能力、生长信号的自给自足、对于抗生长信号不敏感、组织侵入/转移、显著的生长潜力和/或持续的血管生成。该术语意在涵盖恶性前和恶性癌细胞二者。
[0180]
本文使用的术语“显著量的甲基化基因组dna”是指每ml所使用样品,优选每ml血液、血清或血浆至少x个甲基化靶dna分子的量。x可以为低至1并且通常为1至50(包括1和50)的值,特别是至少2、3、4、5、10、15、20、25、30或40。为了确定是否存在这样的显著量,可以但不一定必须对甲基化靶dna进行定量。如果不进行定量的话,也可以通过与标准品进行比较来进行测定,所述标准品例如包含基因组dna和其中一定量的完全甲基化dna(例如x个基因组的等同物)的标准品,其中x如上所述。该术语还可以是指样品中至少y%的甲基化靶dna的量(其中甲基化和未甲基化靶dna的总和为100%),其中y可以为低至0.05并且通常为0.05至5(包括0.05和5),优选0.05至1(包括0.05和1),并且更优选0.05至0.5(包括0.05和0.5)的值。例如,y可以是至少0.05、0.1、0.2、0.3、0.5、1.0、1.5、2.0、2.5、3.0、4.0或5.0。
[0181]
本文使用的术语“肿瘤dna”或“癌细胞的肿瘤dna”简单地是指癌细胞的dna。其仅用于将癌细胞的dna与本文提及的其他dna更清楚地区分开。因此,除非引入歧义,否则可作为替代使用术语“癌细胞的dna”。
[0182]
本文使用的术语“是......的表示”或“表示”是指识别或指定待要表示的事物的行为。如本领域技术人员理解的,这样的评估通常可能不是对100%的对象都是准确的,但其优选地是准确的。然而,该术语要求,可对对象中的统计学显著部分作出准确表示。某一部分是否是统计学显著的可以容易地由本领域技术人员使用几种公知的统计学评价工具来确定,所述工具例如置信区间的确定、p值的确定、student t检验、mann-whitney检验等。详细信息在dowdy and wearden,statistics for research,john wiley&sons,newyork 1983中提供。优选的置信区间为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%。p值优选为0.05、0.01或0.005。
[0183]
本文使用的关于本说明书癌症的短语“用于检测存在或不存在的方法”是指确定对象是否患有癌症。如本领域技术人员理解的,这样的评估通常可能不是对100%的对象都是准确的,但其优选地是准确的。然而,该术语要求,可对对象中的统计学显著部分作出准确表示。有关统计学显著性和合适的置信区间以及p值的描述,参见上文。
[0184]
本文使用的术语“诊断”是指确定对象是否患有癌症。通过本文所述的靶dna的甲基化分析的诊断可以用本文所述的另外手段补充以确认用甲基化分析检测出的癌症。如本领域技术人员理解的,诊断通常可能不是对100%的对象都是准确的,但其优选地是准确的。然而,该术语要求,可对对象中的统计学显著部分作出准确诊断。有关统计学显著性和合适的置信区间以及p值的描述,参见上文。
[0185]
本文使用的关于本说明书癌症的短语“筛查对象群体”是指对对象群体的样品使
用第一方面的方法。优选地,对象具有提高的癌症风险、被怀疑患有癌症或曾患有癌症。特别地,本文列举的风险因子中的一个或更多个可归于群体的对象。在一个具体实施方案中,相同的一个或更多个风险因子可归于群体的所有对象。例如,群体可由以重度酒精使用和/或烟草消耗为特征的对象组成。应当理解,术语“筛查”是指如上所述针对群体对象进行的诊断,并且优选地使用本文所述的另外手段来确认。如本领域技术人员理解的,筛查结果通常可能不是对100%的对象都是准确的,但其优选地是准确的。然而,该术语要求,可对对象中的统计学显著部分实现准确的筛查结果。有关统计学显著性和合适的置信区间以及p值的描述,参见上文。
[0186]
本文使用的术语“监测”是指在治疗过程期间或在一定时间段期间,通常在至少1周、2周、3周、4周、1个月、2个月、3个月、4个月、5个月、6个月、1年、2年、3年、5年、10年或任何其他时间段期间诊断的癌症的伴随。术语“伴随”意指癌症状态并且特别是这些癌症状态的变化可以基于甲基化靶dna的量,特别是基于在任何类型的周期性时间段内的量变化来检测,其在治疗过程内确定,例如每天确定或每月确定1、2、3、4、5、6、7、8、9、10、11、12、13、14或15次(不超过每日一次确定),所述治疗过程可达1、2、3、4、5、6、7、8、9、10、11、12、15或24个月。也可以在治疗特定事件时,例如在每个治疗周期或药物/治疗施用之前和/或之后确定量或量的变化。一个周期是一个治疗循环直到下一个循环开始之间的时间。癌症治疗通常不是单次治疗,而是一个治疗过程。一个过程通常花费3至6个月,但可以比此更长或更短。在治疗过程期间,通常有4至8个治疗周期。通常,治疗周期包括治疗中断以使身体恢复。如本领域技术人员理解的,监测的结果通常可能不是对100%的对象都是准确的,但其优选地是准确的。然而,该术语要求,可对对象中的统计学显著部分实现准确的监测结果。有关统计学显著性和合适的置信区间以及p值的描述,参见上文。
[0187]“基本上相同的”意指寡核苷酸不需要与参照序列100%相同,而可以包含如本文所限定的错配和/或间隔物。优选地,基本上相同的寡核苷酸(如果不是100%相同的话)包含1至3个,即1、2或3个错配和/或间隔物,优选每个寡核苷酸一个错配或间隔物,使得预期的退火不会由于错配和/或间隔物而失败。为了尽管存在错配和/或间隔物仍能够进行退火,优选地寡核苷酸包含不多于1个错配/该寡核苷酸的10个核苷酸(如果第一个小数是5或更高,则进位,否则舍去)。
[0188]
错配或间隔物优选是与对象基因组dna中的snp的错配或覆盖对象基因组dna中的snp的间隔物。与snp的错配优选不与对象物种中该位置处的任何核苷酸互补。本文使用的术语“snp”是指snp的位点,即在个体的群体中变化的(优选人)基因组中特定位置处的单核苷酸多态性。本技术涉及的基因组dna的snp是本领域已知的,并且可见于在线数据库,例如ncbi的dbsnp(http://www.ncbi.nlm.nih.gov/snp)。
[0189]
本文使用的术语“间隔物”是指非核苷酸间隔物分子,其在连接两个核苷酸时将两个核苷酸之间的距离提高至约一个核苷酸的距离(即,这两个核苷酸相隔的距离,如果其通过第三个核苷酸连接的话)。间隔物的一些非限制性实例是肌苷、d-尿嘧啶、卤代碱基、氨基-dt、c3、c12、spacer 9、spacer 18和dspacer。
[0190]
本文使用的术语“寡核苷酸”是指5至50个核糖核苷酸或优选脱氧核糖核苷酸的线性寡聚物。优选地,其具有单链dna片段的结构。本文所指的“一段连续核苷酸”优选与寡核苷酸一样长。
[0191]
本文使用的术语“引物寡核苷酸”是指在其3’端包含引发区域的单链寡核苷酸序列,其与试图拷贝的核酸序列(模板)基本上互补,并且用作合成引物延伸产物的起始点。优选地,引发区域的长度为10至40个核苷酸,更优选15至30个核苷酸,并且最优选19至25个核苷酸。本文所指的“一段连续核苷酸”优选对应于引发区域。引物寡核苷酸还可在引物寡核苷酸的5

端包含突出端区域。突出端区域由与原始模板不互补但在随后的扩增循环中通过相反链的延伸并入到模板中的序列组成。突出端区域的长度不会通过引发区域阻碍引发(例如,引物通过引发区域与模板退火)。例如,突出端区域可以是1至200个核苷酸、优选4至100或4至50个、更优选4至25个或最优选4至15个核苷酸长。突出端区域通常包含一个或更多个功能结构域,即其具有编码(不是在翻译成多肽的意义上)用于或可用于第一方面的方法的功能的序列。功能结构域的一些实例是限制性位点、连接位点、通用引发位点(例如,用于ngs)、退火位点(不是用于与待通过引发区域的延伸而扩增的模板退火,而是用于与其他寡核苷酸的退火)和索引(条形码)位点。突出端区域不包含如本文关于本发明的甲基化标志物所指的“一段连续核苷酸”。如上所述,本领域技术人员应理解,突出端区域的序列并入到由扩增产生的新的双链中。因此,突出端区域可以被视为引发区域的一部分以用于另外扩增新的双链。然而,术语“引发区域”在本文中用于将作为初始模板的引发区域的区域(即其具有基本上对应于表3的甲基化标志物序列的序列)与关于同一甲基化标志物序列的突出端区域区分开。
[0192]
技术人员还应理解,在经亚硫酸氢盐转化的dna的扩增的背景下,术语“模板”不仅包括双链dna,还包括作为基因组dna的亚硫酸氢盐转化的结果的单链(使其不与其先前的相反链互补)。在第一轮扩增中,引物对中只有一个引物与该单链结合并被延伸,从而产生新的互补相反链,引物对中的另一个引物可以与之结合。表3提供了作为本发明甲基化标志物的基因组dna的亚硫酸氢盐转化(bis1和bis2)的结果的链的序列,以及在5

至3

方向(rc)的相应新互补相反链。
[0193]
本文使用的术语“引物对”是指这样的两个寡核苷酸,即正向和反向引物,其相对于双链核酸分子(包括作为亚硫酸氢盐转化的结果的单链加上如上所述待产生的新互补相反链)各自具有与一条链(至少基本上)相同的序列,使得其各自与与其(至少基本上)相同的链的互补链退火。术语“正向引物”是指与双链核酸分子的正向链(由基因组参照序列的方向所限定)(至少基本上)相同的引物,并且术语“反向引物”是指与双链核酸分子中正向链的反向互补链(至少基本上)相同的引物。正向引物和反向引物与其模板退火的位点之间的距离取决于期望引物产生的扩增子的长度。通常来说,对于本发明,其为40至1000bp。本文规定了优选的扩增子大小。在使用引物对扩增单链dna模板的情况下,在第一扩增循环中只有一种引物与单链退火。随后,另一种引物与新产生的互补链结合,使得扩增的结果是双链dna片段。
[0194]
本文使用的术语“阻断剂”是指这样的分子,其以甲基化特异性方式与dna的单链结合(即,其对经转化的甲基化dna或优选经转化的未甲基化dna或者由其获得的扩增dna具有特异性)并且通过与该单链结合,例如通过在其结合处阻止引物结合或阻止引物延伸来阻止dna的扩增。阻断剂的一些非限制性实例是序列和/或甲基化特异性抗体(阻断例如引物结合或聚合酶),特别是阻断剂寡核苷酸。
[0195]“阻断剂寡核苷酸”可以是阻止位于阻断剂寡核苷酸上游的引物延伸的阻断剂。其
包含具有对聚合酶的5’核酸酶活性有抗性的骨架的核苷/核苷酸。这可以通过例如包含以下来实现:肽核酸(peptide nucleic acid,pna)、锁核酸(locked nucleic acid,lna)、吗啉代、二醇核酸(glycol nucleic acid,gna)、苏糖核酸(threose nucleic acid,tna)、桥连核酸(bridged nucleic acid,bna)、n3
’‑
p5’氨基磷酸酯(n3
’‑
p5’phosphoramidate,np)寡聚物、小沟结合剂连接的寡核苷酸(mgb-连接的寡核苷酸)、硫代磷酸酯(ps)寡聚物、crc4烷基膦酸酯寡聚物、氨基磷酸酯、β-磷酸二酯寡核苷酸、a-磷酸二酯寡核苷酸、或其组合。或者,其可以是在dna单链上具有与引物寡核苷酸的结合位点重叠的结合位点的不可延伸的寡核苷酸。当阻断剂结合时,引物无法结合,并且因此不产生扩增子。当阻断剂不结合时,引物结合位点是可及的并且产生扩增子。对于这样的重叠阻断剂,优选地,阻断剂对dna的亲和力高于引物对dna的亲和力。阻断剂寡核苷酸的长度通常为15至50、优选20至40并且更优选25至35个核苷酸。“至少一种阻断剂”特别地是指1、2、3、4或5种阻断剂,更特别地是指1至2或1至3种阻断剂的数量。此外,由于不可延伸的3’端,阻断剂寡核苷酸本身不能作为引物(即,不能通过聚合酶延伸)。
[0196]
本文使用的术语“探针寡核苷酸”或“探针”是指用于通过与扩增子的一条链退火来检测扩增子的寡核苷酸,其通常不在任何引物寡核苷酸结合处(即,不与该条链中与引物寡核苷酸所退火的序列区段重叠的序列区段结合)。优选地,其在没有错配或间隔物的情况下退火,换言之,其优选地与扩增子的一条链互补。探针寡核苷酸的长度优选为5至40个核苷酸,更优选10至25个并且最优选15至20个核苷酸。本文所指的“一段连续核苷酸”优选与探针寡核苷酸一样长。通常来说,探针与允许检测扩增子的至少一个可检测标签和/或允许猝灭(优选)可检测标签的信号的至少一个猝灭剂连接,优选共价连接。本文使用的术语“可检测标签”不表现出任何特别的限制。可检测标签可选自放射性标签、发光标签、荧光染料、具有酶活性的化合物、磁性标签、抗原、以及对可检测标签具有高结合亲和力的化合物。例如,与探针连接的荧光染料可以用作检测标签,例如在实时pcr中。合适的放射性标记是p-32、s-35、i-125和h-3;合适的发光标记是化学发光化合物,优选鲁米诺(luminol);以及合适的荧光标记优选为丹酰氯、5-异硫氰酸荧光素和4-氟-7-硝基苯-2-氮杂-1,3-二唑,特别是6-羧基荧光素(fam)、6-六氯荧光素(hex)、5(6)-羧基四甲基罗丹明(tamra)、5(6)-羧基-x-罗丹明(rox)、花青-5-荧光团(cy5)、及其衍生物;合适的酶标记是辣根过氧化物酶、碱性磷酸酶、α-半乳糖苷酶、乙酰胆碱酯酶或生物素。探针也可以与猝灭剂连接。本文使用的术语“猝灭剂”是指这样的分子:使对应的可检测标签的信号失效或调节该信号,例如通过能量转移、电子转移或通过化学机制进行,如由iupac限定的(参见化学术语纲要(compendium of chemical terminology)第2版,1997)。特别地,猝灭剂调节作为荧光染料的可检测标签的光发射。在一些情况下,猝灭剂本身可以是在与其猝灭荧光的标签不同的特征性波长下发出荧光的荧光分子。在另一些情况下,猝灭剂本身不发荧光(即猝灭剂是“暗受体(dark acceptor)”)。这样的猝灭剂包括例如dabcyl、甲基红、qsy二芳基罗丹明染料等。
[0197]
本文关于癌症使用的术语“治疗”是指其中目的是减缓癌症的进展的治疗性处理。有益或期望的临床结局包括但不限于症状的缓解、疾病时长的缩短、稳定化的病理状态(特别是不恶化)、减慢疾病进展、改善病理状态和/或减轻(部分减轻和全部减轻两种情况),其优选是可检测的。成功的治疗并不一定意味着治愈,但是与如果不施加治疗的预期存活相比,其仍可意味着延长的存活。在一个优选实施方案中,治疗是一线治疗,即,癌症先前未被
治疗。癌症治疗涉及治疗方案。
[0198]
本文使用的术语“治疗方案”是指如何根据疾病以及可利用的方法和用药来治疗对象。癌症治疗方案的一些非限制性实例是化学治疗、手术和/或辐照、或其组合。本发明的早期癌症检测特别地允许手术治疗,尤其是允许治愈性切除。特别地,术语“治疗方案”是指施用如下限定的一种或更多种抗癌剂或治疗。本文使用的术语“抗癌剂或治疗”是指具有抗增殖、抗致癌和/或制癌特性的化学、物理或生物药剂或治疗、或者手术,包括其组合。
[0199]
化学抗癌剂或治疗可以选自烷化剂、抗代谢物、植物生物碱和萜类化合物以及拓扑异构酶抑制剂。优选地,烷化剂是基于铂的化合物。在一个实施方案中,基于铂的化合物选自顺铂、奥沙利铂(oxaliplatin)、依铂(eptaplatin)、洛铂(lobaplatin)、奈达铂(nedaplatin)、卡铂、异丙铂、四铂(tetraplatin)、洛铂、dcp、pld-147、jml 18、jm216、jm335和赛特铂(satraplatin)。
[0200]
物理抗癌剂或治疗可以选自放射治疗(例如治愈性放射治疗、辅助性放射治疗、姑息性放射治疗、远距离放射治疗、近距离放射治疗或代谢性放射治疗)、光疗(使用例如血卟啉(hematoporphoryn)或光敏素ii(photofrin ii))和热疗。
[0201]
手术可以是治愈性切除术、姑息性手术、预防性手术或细胞减灭术(cytoreductive surgery)。通常来说,手术涉及切除,例如囊内切除、边缘性切除、广泛性切除或根治性切除,如baron and valin(rec.med.vet,special canc.1990;11(166):999-1007)中所描述的。
[0202]
生物抗癌剂或治疗可以选自抗体(例如,刺激破坏癌细胞的免疫应答的抗体,例如利妥昔单抗(retuximab)或阿仑单抗(alemtuzubab);通过与免疫细胞的受体结合并抑制阻止免疫细胞攻击“本身”细胞的信号来刺激免疫应答的抗体,例如伊匹单抗;干扰肿瘤生长所必需的蛋白质作用的抗体,例如贝伐单抗、西妥昔单抗或帕尼单抗;或者与药物(优选细胞杀伤物质例如毒素、化学治疗性或放射性分子)缀合的抗体,例如y-替伊莫单抗、i-托西莫单抗或阿多曲妥珠单抗依酯(ado-trastuzumab emtansine));细胞因子(例如,干扰素或白介素例如inf-α和il-2);疫苗(例如包含癌症相关抗原的疫苗,例如sipuleucel-t);溶瘤病毒(例如,天然溶瘤病毒例如呼肠孤病毒、新城疫病毒或腮腺炎病毒;或基因工程化病毒例如麻疹病毒、腺病毒、痘苗病毒或疱疹病毒,其优先靶向携带癌症相关抗原的细胞);基因治疗剂(例如,这样的dna或rna,其替代改变的肿瘤抑制因子,阻断致癌基因的表达,改善对象的免疫系统,使癌细胞对化学治疗、放射治疗或其他治疗更敏感,诱导细胞自杀或赋予抗血管生成作用);以及过继性t细胞(例如,针对抗肿瘤活性选择的对象收获的肿瘤侵入性t细胞,或经遗传修饰以识别癌症相关抗原的对象收获的t细胞)。
[0203]
在一个实施方案中,一种或更多种抗癌药物选自:乙酸阿比特龙、abvd、abve、abve-pc、ac、ac-t、ade、阿多曲妥珠单抗依酯、双马来酸阿法替尼、阿地白介素(aldesleukin)、阿仑单抗、氨基乙酰丙酸、阿那曲唑、阿瑞匹、三氧化二砷、菊欧文菌天冬酰胺酶(asparaginase erwinia chrysanthemi)、阿西替尼、阿扎胞苷、beacopp、贝利司他(belinostat)、盐酸苯达莫司汀、bep、贝伐单抗、贝沙罗汀(bexarotene)、比卡鲁胺、博来霉素、硼替佐米、博舒替尼(bosutinib)、brentuximab vedotin、白消安、卡巴他赛(cabazitaxel)、卡博替尼-s-苹果酸盐(cabozantinib-s-malate)、caf卡培他滨、capox、卡铂、卡铂-紫杉酚(carboplatin-taxol)、卡非佐米(carfilzomib)、卡莫司汀、卡莫司汀植入
物、色瑞替尼(ceritinib)、西妥昔单抗、苯丁酸氮芥、苯丁酸氮芥-泼尼松(chlorambucil-prednisone)、chop、顺铂、氯法拉滨(clofarabine)、cmf、copp、copp-abv、克唑替尼(crizotinib)、cvp、环磷酰胺、阿糖胞苷、阿糖胞苷、脂质体、达拉非尼、达卡巴嗪、放线菌素d、达沙替尼、盐酸柔红霉素、地西他滨、地加瑞克、地尼白介素(denileukin diftitox)、地诺单抗(denosumab)、盐酸右雷佐生(dexrazoxane hydrochloride)、多西他赛、盐酸多柔比星、盐酸多柔比星脂质体、艾曲波帕(eltrombopag olamine)、恩杂鲁胺(enzalutamide)、盐酸表柔比星、epoch、甲磺酸艾日布林、盐酸埃罗替尼、磷酸依托泊苷、依维莫司、依西美坦、fec、非格司亭、磷酸氟达拉滨、氟尿嘧啶、fu-lv、氟维司群、吉非替尼、盐酸吉西他滨、吉西他滨-顺铂、吉西他滨-奥沙利铂、吉妥单抗奥佐米星(gemtuzumab ozogamicin)、谷卡匹酶(glucarpidase)、乙酸戈舍瑞林(goserelin acetate)、hpv二价疫苗、重组hpv四价疫苗、hyper-cvad、替伊莫单抗(ibritumomab tiuxetan)、依鲁替尼(ibrutinib)、ice、艾代拉利司(idelalisib)、异环磷酰胺(ifosfamide)、伊马替尼(imatinib)、甲磺酸盐、咪喹莫特(imiquimod)、碘131托西莫单抗和托美单抗、伊匹单抗、盐酸伊立替康、伊沙匹隆、二甲苯磺酸拉帕替尼、来那度胺、来曲唑、亚叶酸钙、乙酸亮丙瑞林、脂质体阿糖胞苷、洛莫司汀、盐酸氮芥(mechlorethamine hydrochloride)、乙酸甲地孕酮、巯嘌呤、美司钠(mesna)、甲氨蝶呤、丝裂霉素c、盐酸米托蒽醌、mopp、奈拉滨、尼洛替尼、奥比妥珠单抗、奥法木单抗(ofatumumab)、高三尖杉酯碱(omacetaxine mepesuccinate)、oepa、off、oppa、奥沙利铂、紫杉醇、紫杉醇白蛋白稳定的纳米颗粒制剂、pad、帕利夫明(palifermin)、盐酸帕洛诺司琼、帕米膦酸二钠、帕尼单抗(panitumumab)、盐酸帕唑帕尼、培门冬酶(pegaspargase)、聚乙二醇干扰素α-2b、帕母单抗(pembrolizumab)、培美曲塞二钠、帕妥珠单抗(pertuzumab)、普乐沙福(plerixafor)、泊马度胺(pomalidomide)、盐酸帕纳替尼(ponatinib hydrochloride)、普拉曲沙、泼尼松、盐酸丙卡巴肼、镭223二氯化物、盐酸雷洛昔芬、雷莫芦单抗(ramucirumab)、拉布立酶(rasburicase)、r-chop、r-cvp、重组hpv二价疫苗、重组hpv四价疫苗、重组干扰素α-2b、瑞戈非尼(regorafenib)、利妥昔单抗、罗米地辛(romidepsin)、罗米司亭(romiplostim)、磷酸鲁索利替尼(ruxolitinib phosphate)、siltuximab、sipuleucel-t、甲苯磺酸索拉非尼、stanford v、苹果酸舒尼替尼、tac、滑石、柠檬酸他莫昔芬、替莫唑胺、西司他莫司、沙利度胺、盐酸托泊替康、托瑞米芬、托西莫单抗和i 131碘托西莫单抗、tpf、曲美替尼(trametinib)、曲妥珠单抗、凡德他尼、vamp、veip、维罗非尼(vemurafenib)、硫酸长春碱、硫酸长春新碱、硫酸长春新碱脂质体、酒石酸长春瑞滨(vinorelbine tartrate)、维莫德吉(vismodegib)、伏立诺他(vorinostat)、xelox、ziv-阿柏西普(ziv-aflibercept)和唑来膦酸。
[0204]
本技术中涉及的seq id
[0205]
本技术涉及seq id no:1至255。对这些sed id的概述和解释提供在下表3中。
[0206]
表3:本说明书的seq id no。m作为基因名称的第一个字母意指甲基化的,rc意指反向互补物,c至t或g至a意指通过cpg背景以外的胞嘧啶的亚硫酸氢盐转化被转化成尿嘧啶,并且在后续扩增中被胸苷替代。bis1是指经亚硫酸氢盐转化的正向链(如各基因组dna的seq id中所记载的)并且bis2是指正向链的经亚硫酸氢盐转化的反向互补链(各基因组dna的seq id的反向互补序列),在此该链的方向由如例如从基因组构建体(grch38)获得的基因组参照序列的方向限定。对于序列的图谱,参见图1。
[0207]
[0208]
[0209]
[0210][0211]
***
[0212]
通过以下实施例描述本发明,这些实施例将被解释为仅是说明性的而非限制本发明的范围。
[0213]
实施例1
[0214]
材料和方法
[0215]
如epi procolon 2.0试剂盒(epigenomics ag)的使用说明书(ifu)中所限定的,收集来自结直肠癌(crc)患者和健康个体(无疾病证据,ned)的血浆样品。简言之,通过两个离心步骤制备edta血浆。在处理之前,将血浆样品储存在-70℃下。
[0216]
使用plasma quick试剂盒,根据epi procolon 2.0试剂盒(epigenomics ag)的使用说明书(ifu)中所限定的预分析工作流程,从血浆样品中提取dna并进行dna的亚硫酸氢盐转化。
[0217]
在即用型多重pcr试剂盒(multiplex pcr)中,根据制造商的方案,以相当于约1ml血浆的亚硫酸氢盐dna产量建立pcr。pcr寡聚物(序列如表3中所示)用5

磷酸修饰以用于ngs文库制备。多重pcr谱使用如下方案:在94℃下变性30秒,在56℃下退火90秒,在72℃下进行延伸步骤30秒;45个周期。
[0218]
用illumina miseq使用150bp的读序长度对pcr产物进行配对末端测序。
[0219]
fastq文件被修剪至测序衔接子之间的插入序列,配对的序列被合并,并且从序列中过滤出在两侧侧接有引物的那些序列(其反映了由pcr扩增的分子),称为插入物。在cpg背景之外显示出比鸟嘌呤更多的胞嘧啶的插入物被转变为其反向补体,以使得能够通过仅考虑cpg的胞嘧啶位置来评估甲基化。将这样的插入物与测定的参考序列比对以评估dna甲基化:对于每个测定/样品组合,通过对在cpg位置处胞嘧啶和胸苷的出现进行计数来评估cpg位点处的任何甲基化模式。共甲基化计算为在所有cpg位置中具有胞嘧啶的插入物序列的数量除以针对样品发现的所有插入物的总数,其通过插入物的长度归一化。
[0220]
使用epi procolon 2.0试剂盒(epigenomics ag)与试剂盒的寡聚物来测定septin-9甲基化。
[0221]
结果
[0222]
存在于crc患者和健康个体(ned)血浆中的针对一组预选癌症标志物的dna甲基化水平的单变量比较显示,来自游离循环肿瘤细胞dna(ctdna)的癌症特异性甲基化模式可用于区分两个组(总结在图2和表4中)。对于大多数标志物,如由响应者操作特征(roc)的曲线下面积(auc)确定的性能甚至高于0.8,在90%的特异性下具有良好的灵敏度(图3)。所有标志物(madcyap1、mkhdrbs2、mclec14a、mfoxl2、mhoxa9、mnkx2-2、msnd1、mtfap2e、msox2和mvax1)都具有高度共甲基化的甲基化模式(所评估区域中所有cpg的甲基化状态在同一分子中是相同的),其使得能够使用来自所有cpg均甲基化的分子的读序的量来反映模板中ctdna分子的量。在数据集中,使用逻辑回归的两种或三种标志物的组合能够将性能提高至高于0.90的auc(参见图3以及表1和表2)。
[0223]
表4:来自不同类型数据的关于105个crc vs.69个ned样品(按类型和编号命名的样品id)的单一标志物性能的数据。“n.c.c.”表示“n个共甲基化拷贝”,并意指发现的含有从完全甲基化分子预期的精确序列的读序的数量。“n.p.e.t.”表示“阳性epi procolon一式三份的n”,并意指根据可商购获得的epi procolon 2.0试剂盒的使用说明书,从msept9实时pcr的三次重复中得到的在扩增曲线情况下的实时pcr的数量。
[0224]
[0225]
[0226]
[0227]
[0228]
[0229]
[0230]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1