用于诊断早期结直肠癌的生物标志物及其应用的制作方法

文档序号:25348675发布日期:2021-06-08 12:51阅读:234来源:国知局
用于诊断早期结直肠癌的生物标志物及其应用的制作方法

1.本发明属于生物医药领域,涉及用于诊断早期结直肠癌的生物标志物及其应用。


背景技术:

2.人类结直肠癌(colorectal cancer,crc)是世界上最常见的消化系统恶性肿瘤之一。从世界癌症趋势分析中的统计数据显示,结直肠癌是男性中第三位最常见的恶性肿瘤,女性第二常见恶性肿瘤,严重威胁人类健康和生命(siegel r l,miller k d,fedewa s a,et a1.colorectal cancer statistics[j].cacancer j c1in,2017,67(3):177

193.)。其特点是复发率和死亡率高,全球每年有超过60万人死于结直肠癌(brenner h,kloor m,pox c p.colorectal cancer[j].lancent,2014,383(9927):1490

1502.)。约有20%的患者初诊时已发生转移(riihimaki m,hemminki a,sundquist j,et a1.patterns of metastasis in colon and rectal cancer[j].sci rep,2016,6:29765.),转移性结直肠癌患者的5年生存率仅为10

15%(ling h,pickard k,ivan c,et al.the clinical and biological significance of mir

224expression in colorectal cancer metastasis[j].gut,2016,65(6):977

989)。目前研究证实结直肠癌细胞通过逃避机体免疫监视使肿瘤发生转移,这一特点严重影响了结直肠癌患者的治疗及预后。因此阐明直肠癌的发生发展机制,找到合适的早期诊断及治疗、预后评估靶点对改善结直肠癌患者的生存是十分重要的。
[0003]
随着高通量技术的发展,越来越多的生物标志物被发现,以进行癌症的诊断和预测。研究表明应用不同生物标志物对结直肠癌发生发展提供了早期诊断和预后方向,研究与早期结直肠癌相关的基因标志物,为实现早期结直肠癌的诊断,预测受试者发展成为结直肠癌的风险,进而实现早干预早治疗提供了新的手段和方向。


技术实现要素:

[0004]
为了弥补现有技术的不足,本发明提供了用作指示结直肠癌的生物标志物其可用于对受试者中的早期结直肠癌进行准确诊断或预测。
[0005]
为了实现上述目的,本发明采用如下技术方案:
[0006]
本发明的第一方面提供了生物标志物在制备诊断或预测早期结直肠癌的产品中的应用,所述生物标志物包括ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4或ac009237.11的一种或多种。
[0007]
进一步,所述生物标志物包括ezh2,与任选地slc25a25

as1和/或prr26。
[0008]
进一步,生物标志物ezh2在早期结直肠癌中表达上调,slc25a25

as1、prr26、slc5a8、rp11

440d17.4、ac009237.11在早期结直肠癌中表达下调。
[0009]
进一步,所述产品包括检测样本中至少一种生物标志物或其功能片段的存在、不存在和/或量的试剂。
[0010]
进一步,所述试剂包括通过数字成像技术、蛋白免疫技术、染料技术、核酸测序技
术、核酸杂交技术、色谱技术、质谱技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂。
[0011]
进一步,采用蛋白免疫技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括抗体,所述抗体对生物标志物或其功能片段的表位具有特异性。
[0012]
进一步,所述抗体为标记抗体。
[0013]
进一步,采用染料技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括染料,所述染料对生物标志物或其功能片段具有特异性。
[0014]
进一步,采用核酸测序技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括引物,所述引物与生物标志物或其功能片段的序列结合。
[0015]
进一步,采用核酸杂交技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括探针,所述探针与生物标志物或其功能片段的序列互补。
[0016]
进一步,所述探针为标记探针。
[0017]
进一步,所述样本包括组织、体液。
[0018]
本发明的第二方面提供了一种诊断或预测早期结直肠癌的产品,所述生物标志物包括检测生物标志物的试剂,所述生物标志物包括ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4或ac009237.11的一种或多种。
[0019]
进一步,所述生物标志物包括ezh2,与任选地slc25a25

as1和/或prr26。
[0020]
进一步,生物标志物ezh2在早期结直肠癌中表达上调,slc25a25

as1、prr26、slc5a8、rp11

440d17.4、ac009237.11在早期结直肠癌中表达下调。
[0021]
进一步,所述产品包括芯片、试剂盒。
[0022]
进一步,所述试剂盒包括qpcr试剂盒、免疫印迹检测试剂盒、免疫层析检测试剂盒、流式细胞分析试剂盒、免疫组化检测试剂盒、elisa试剂盒和电化学发光检测试剂盒。
[0023]
进一步,所述试剂盒还包括用于诊断或预测早期结直肠癌的说明书。
[0024]
本发明的第三方面提供了一种体系,包含:
[0025]
样品;
[0026]
一种或多种探针和/或染色剂,所述探针和/或染色剂与至少一种生物标志物和/或其同源序列结合;以及
[0027]
一种或多种设备,所述设备能够定量至少一种探针或染色剂的存在、不存在和/或量,所述探针或染色剂与所述生物标志物和/或其同源序列结合。
[0028]
本发明的第四方面提供了一种诊断对象是否患有早期结直肠癌或存在患结直肠癌风险的系统/装置,包括:
[0029]
分析单元,所述单元适于测量对象样本中生物标志物的量;和
[0030]
评估单元,其包含存储的参考和数据处理器,所述数据处理器已经实现了用于比较分析单元测量的生物标志物的量与存储的参考的算法,由此诊断早期结直肠癌或存在患结直肠癌的风险。
[0031]
本发明的第五方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明第四方面所述的系统/装置。
[0032]
本发明的第六方面提供了生物标志物在制备治疗结直肠癌的药物组合物中的应用,所述生物标志物包括ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4或
ac009237.11的一种或多种。
[0033]
进一步,所述药物组合物包括促进或抑制所述生物标志物表达水平的促进剂或抑制剂。
[0034]
进一步,所述促进剂促进在结直肠癌中表达下调的生物标志物的表达水平,所述抑制剂抑制在结直肠癌中表达上调的生物标志物的表达水平。
[0035]
进一步,表达下调的生物标志物选自slc25a25

as1、prr26、slc5a8、rp11

440d17.4或ac009237.11。
[0036]
进一步,表达上调的生物标志物选自ezh2。
[0037]
本发明的第七方面提供了一种药物组合物,所述药物组合物包括促进或抑制生物标志物表达水平的促进剂或抑制剂,所述生物标志物包括ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4或ac009237.11。
[0038]
进一步,所述促进剂促进在结直肠癌中表达下调的生物标志物的表达水平,所述抑制剂抑制在结直肠癌中表达上调的生物标志物的表达水平。
[0039]
进一步,表达下调的生物标志物选自slc25a25

as1、prr26、slc5a8、rp11

440d17.4或ac009237.11。
[0040]
进一步,表达上调的生物标志物选自ezh2。
[0041]
进一步,所述药物组合物还包括药学上可接受的载体。
[0042]
本发明的优点和有益效果:
[0043]
本发明选择包括ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4和/或ac009237.11作为生物标志物,可以有效区分早期结直肠癌和正常对照,实现早期结直肠癌的诊断,进而实现早干预早治疗。
附图说明
[0044]
图1是不同分组差异表达基因统计图;
[0045]
图2是差异基因的表达情况图,其中,图a:ezh2;图b:slc25a25

as1;图c:prr26;图d:slc5a8;图e:rp11

440d17.4;图f:ac009237.11;
[0046]
图3是差异基因的roc曲线图,其中,图a:slc25a25

as1;图b:ezh2+slc25a25

as1+prr26;图c:ezh2+slc25a25

as1+prr26+slc5a8;图d:ezh2+slc25a25

as1+prr26+ac009237.11。
具体实施方式
[0047]
本发明通过广泛而深入的研究,通过收集结直肠癌患者和肠道息肉患者以及正常的样本,综合分析样本的基因表达谱,筛选在不同样本中呈现显著性差异的基因,并进一步分析基因的诊断效能,从而发现适于区分早期结直肠癌的生物标志物。
[0048]
如本文中在诸如“a和/或b”的短语中使用的术语“和/或”旨在包括a和b两者;a或b;a(单独);以及b(单独)。同样地,在诸如“a、b和/或c”的短语中使用的术语“和/或”旨在涵盖以下实施方案的每一个:a、b和c;a、b或c;a或c;a或b;b或c;a和c;a和b;b和c;a(单独);b(单独);以及c(单独)。
[0049]
术语“生物标志物”是指以可用于预测个体的癌症状态的不同浓度存在于个体中
的生物分子。生物标志物可包括,但不限于,核酸、蛋白质及其变体和片段。生物标志物可以是包含编码该生物标志物的全部或部分核酸序列或这类序列的互补体的dna。可用于本发明的生物标志物核酸被认为包括包含任何目的核酸序列的全部或部分序列的dna和rna。
[0050]
在本发明的具体实施方式中,所述生物标志物包括ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4和/或ac009237.11。
[0051]
在本发明中,生物标志物例如ezh2(gene id:2146)、slc25a25

as1(gene id:100289019)、prr26(gene id:414235)、slc5a8(gene id:160728)、rp11

440d17.4(ensembl id:ensg00000273305)、ac009237.11(ensembl id:ensg00000238162),包括基因及其编码的蛋白及其同源物,突变,和同等型。该术语涵盖全长,未加工的生物标志物,以及源自细胞中加工的任何形式的生物标志物。该术语涵盖生物标志物的天然发生变体(例如剪接变体或等位变体)。
[0052]
如本文所用,术语“样本”是指从如本文所述的目的来源获得或衍生的生物样本。在一些实施方案中,目的来源包含生物体,诸如动物或人。在一些实施方案中,生物样本包含生物组织或液体。在一些实施方案中,生物样本可以是或包含骨髓;血液;血细胞;腹水;组织或细针活检样本;含有细胞的体液;游离漂浮核酸;痰液;唾液;尿液;脑脊液腹膜液;胸膜液;粪便;淋巴;皮肤拭子;口服拭子;鼻拭子;洗涤物(washings)或灌洗物,诸如导管灌洗物或支气管肺泡灌洗物;吸出物;刮屑;骨髓标本;组织活检标本;手术标本;粪便,其他体液,分泌物和/或排泄物;和/或其中的细胞等。在一些实施方案中,生物样本是或包含从个体获得的细胞。在一些实施方案中,样本是通过任何合适的手段直接从目的来源获得的“初级样本”。例如,在一些实施方案中,通过选自以下的方法获得初级生物样本:活组织检查(例如,细针抽吸或组织活组织检查)、手术组织、体液(例如,血液、淋巴、粪便等)的收集等。在一些实施方案中,如从上下文将显而易见的,术语“样本”是指通过加工(例如,通过去除初级样本的一种或多种组分和/或通过向初级样本添加一种或多种试剂)获得的制剂。例如,使用半透膜过滤。这类“经处理的样本”可以包含例如从样本中提取的或通过对初级样本进行诸如mrna的扩增或逆转录、某些组分的分离和/或纯化等技术而获得的核酸或蛋白质。
[0053]
可以通过将来自测试受试者的样本中的生物标志物的水平与合适的对照进行对比来确定来源于测试受试者的生物样本中的生物标志物的水平是否与存在于正常受试者中的生物标志物的水平不同。技术人员可以为所讨论的测定选择适当的对照。例如,合适的对照可以是来源于已知受试者(例如,已知是没有癌症的正常受试者的受试者)的生物样本。如果从正常受试者获得合适的对照,则测试受试者中的生物标志物的水平相对于合适的对照的统计学显著差异指示受试者患有结直肠癌。在一个实施方案中,生物标志物的水平的差异是增加。合适的对照也可以是参比标准。参比标准用作对比的参比水平,使得可以将测试样本与参比标准进行对比,以推断受试者的结直肠癌状态。参比标准可以代表已知受试者(例如,已知为正常受试者的受试者或已知患有结直肠癌癌的受试者)中一种或多种生物标志物的水平。同样地,参比标准可以代表已知受试者群体(例如,已知为正常受试者的受试者群体或已知患有结直肠癌的受试者群体)中的一种或多种生物标志物的水平。例如,可以通过合并来自多个个体的样本并确定所合并的样本中的生物标志物的水平来获得参比标准,从而在平均群体中产生标准。这类参比标准代表个体群体中的生物标志物的平
均水平。例如,也可以通过将确定存在于从多个个体获得的个体样本中的生物标志物的水平平均来获得参比标准。这类标准还代表个体群体中的生物标志物的平均水平。参比标准也可以是值的集合,每个值代表个体群体中已知受试者中的生物标志物的水平。在某些实施方案中,可以将测试样本与这类值的集合进行对比,以推断受试者的结直肠癌状态。在某些实施方案中,参比标准是绝对值。在这类实施方案中,可以将测试样本与绝对值进行对比,以推断受试者的结直肠癌状态。在一个实施方案中,通过执行软件分类算法进行样本中的一种或多种生物标志物相对于合适对照的水平之间的对比。在一些实施方案中,生物标志物的一种或组合的表达增加,其中该增加的表达比正常样本中相同生物标志物的表达高约10%,20%,30%,40%,50%,60%,70%,80%,90%,95%或约100%或更多。在一些实施方案中,生物标志物的一种或组合的表达增加,其中该增加的表达是与正常样本中相同的生物标志物的一种或组合的表达相比约2x,3x,4x,5x,6x,7x,8x,9x或约10x或更多的表达。
[0054]
术语“参比”是指其水平可用于对比测试样本中生物标志物水平的生物标志物。在本发明的一个实施方案中,参比包括管家基因,诸如β

球蛋白、醇脱氢酶或任何其他管家基因,其水平或表达不根据含有标志物的细胞的疾病状态而变化。在另一个实施方案中,所有测定的生物标志物或其子集可用作参比。
[0055]
术语“多核苷酸”和“核酸”和“核酸分子”在本文中可互换使用,并且是指任何长度的核苷酸的聚合物,并且包括dna和rna。多核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、修饰的核苷酸或碱基,和/或其类似物,或可以通过dna或rna聚合酶掺入聚合物中的任何底物。
[0056]
术语“多肽”和“肽”和“蛋白质”在本文中可互换使用,并且是指任何长度的氨基酸的聚合物。该聚合物可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。该术语还涵盖已经天然修饰或通过干预修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作或修饰,诸如与标记组分缀合。该定义内还包括例如含有一个或多个氨基酸类似物(包括,例如,非天然氨基酸)以及本领域已知的其他修饰的多肽。应理解,因为本发明的多肽可基于抗体或融合蛋白,所以在某些实施方案中,多肽可作为单链或相关链(例如,二聚体)出现。
[0057]
术语“受试者”是指任何动物(例如,哺乳动物),包括,但不限于,人类、非人灵长类、犬、猫、啮齿动物等。进一步,受试者是人类受试者。术语“受试者”、“个体”和“患者”在本文中可互换使用。因此,术语“受试者”、“个体”和“患者”涵盖患有癌症(例如,结直肠癌)的个体,包括已经经历或进行切除(手术)以去除癌组织的候选者的那些个体。
[0058]
确定生物标志物的水平
[0059]
生物样本中一种或多种生物标志物的水平可以通过任何合适的方法确定。可以使用任何可靠的方法来测量样本中的水平或数量。通常,可通过各种已知用于mrna的方法从样本(包括其级分)(诸如分离的rna的样本)中检测以及定量,各种已知方法包括,例如,基于扩增的方法(例如,聚合酶链反应(pcr)、实时聚合酶链反应(rt

pcr)、定量聚合酶链反应(qpcr)、滚环扩增等)、基于杂交的方法(例如,杂交阵列(例如,微阵列)、nanostring分析、northern blot分析、分支dna(bdna)信号扩增、原位杂交等),以及基于测序的方法(例如,下一代测序方法,例如,使用illumina或iontorrent平台)。其他示例性技术包括核糖核酸酶保护测定法(rpa)和质谱法。
[0060]
基于扩增的方法
[0061]
存在许多基于扩增的方法用于检测生物标志物核酸序列的水平,包括,但不限于,pcr、rt

pcr、qpcr和滚环扩增。其他基于扩增的技术包括,例如,连接酶链反应、多重可连接探针扩增、体外转录(ivt)、链置换扩增、转录介导的扩增、rna(eberwine)扩增,以及本领域技术人员已知的其他方法。
[0062]
基于杂交的方法
[0063]
可以使用基于杂交的方法检测生物标志物,该基于杂交的方法包括但不限于杂交阵列(例如,微阵列)、nanostring分析、northern blot分析、分支dna(bdna)信号扩增和原位杂交。
[0064]
微阵列可用于同时测量大量生物标志物的表达水平。可以使用各种技术制造微阵列,包括用细尖针在载玻片上进行印刷、使用预制掩模进行光刻、使用动态微镜器件进行光刻、喷墨印刷或在微电极阵列上进行电化学。还可使用基于微流体qrt

pcr反应阵列的微流体taqman低密度阵列,以及相关的基于微流体qrt

pcr的方法。
[0065]
可以使用axon b

4000扫描仪和gene

pix pro 4.0软件或其他合适的软件来扫描图像。除去在背景扣除后的非阳性斑点以及通过esd程序检测的异常值。将得到的信号强度值归一化为每个芯片的中值,然后用于获得每个生物标志物的几何平均值和标准误差。可将每个信号转化为log基数2,并进行单样本t检验。每个样品的独立杂交可以在芯片上进行,每个生物标志物点样多次以增加数据的稳健性。
[0066]
可以采用几种类型的微阵列,包括,但不限于,点状寡核苷酸微阵列,预制寡核苷酸微阵列或点状长寡核苷酸阵列。
[0067]
在一些实施方案中,通过本领域技术人员已知的测定法确定生物标志物表达,该测定法包括,但不限于,多分析物谱测试、酶联免疫吸附测定法(elisa)、放射免疫测定法、蛋白质印迹测定法、免疫荧光测定法、酶免疫测定法、免疫沉淀测定法、化学发光测定法、免疫组织化学测定法、斑点印迹测定法或狭线印迹测定法。在一些实施方案中,其中在测定中使用抗体,该抗体被可检测地标记。抗体标记可以包括,但不限于,免疫荧光标记、化学发光标记、磷光标记、酶标记、放射性标记、抗生物素蛋白/生物素、胶体金颗粒、有色颗粒和磁性颗粒。在一些实施方案中,通过ihc测定法确定生物标志物的表达。
[0068]
在一些实施方案中,使用特异性结合生物标志物的试剂确定生物标志物的表达。显示与生物标志物特异性结合的任何分子实体均可用于确定样品中该生物标志物蛋白的水平。特异性结合剂包括,但不限于,抗体、抗体片段、抗体模拟物和多核苷酸(例如,适体等)。技术人员理解,所需特异性的程度由用于检测生物标志物蛋白的特定测定法确定,在一些实施方案中,本公开涉及包含固体支持物(诸如elisa板、凝胶、珠或柱,其包含抗体、抗体片段、抗体模拟物和/或能够结合t3p或其盐的多核苷酸)的体系。
[0069]
如本文所用,术语“抗体”是指免疫球蛋白分子,其通过至少一个抗原结合位点识别并特异性结合靶标,诸如蛋白质、多肽、肽、碳水化合物、多核苷酸、脂质或前述的组合。如本文所用,该术语涵盖完整的多克隆抗体、完整的单克隆抗体、单链抗体、抗体片段(诸如fab、fab

、f(ab')2和fv片段)、单链fv(scfv)抗体、多特异性抗体(诸如双特异性抗体)、单特异性抗体、单价抗体、嵌合抗体、人源化抗体、人抗体、包含抗体的抗原结合位点的融合蛋白,以及包含抗原结合位点的任何其他修饰的免疫球蛋白分子,只要该抗体表现出所需的
生物结合活性。抗体可以是五种主要类别的免疫球蛋白中的任一种:iga、igd、ige、igg和igm,或其亚类(同种型)(例如igg1、igg2、igg3、igg4、iga1和iga2)。不同类别的免疫球蛋白具有不同的和熟知的亚单位结构和三维构型。抗体可以是裸露的或与其他分子缀合,包括但不限于毒素和放射性同位素。
[0070]
术语“抗体片段”是指完整抗体的一部分并且是指完整抗体的抗原决定可变区。抗体片段的示例包括,但不限于,fab、fab

、f(ab')2和fv片段、线性抗体、单链抗体和由抗体片段形成的多特异性抗体。如本文所用,“抗体片段”包含至少一个抗原结合位点或表位结合位点。术语抗体的“可变区”是指单独或组合的抗体轻链的可变区或抗体重链的可变区。重链或轻链的可变区通常由四个框架区(fr)组成,其由三个互补决定区(cdr)连接,也称为“高变区”。每条链中的cdr通过框架区紧密邻近地结合在一起,并且有助于抗体的抗原结合位点的形成。
[0071]
术语“单克隆抗体”是指参与单一抗原决定簇或表位的高特异性识别和结合的均质抗体群。这与通常包括针对多种不同抗原决定簇的不同抗体的混合物的多克隆抗体形成对比。术语“单克隆抗体”涵盖完整的和全长的单克隆抗体以及抗体片段(例如,fab、fab

、f(ab')2、fv)、单链(scfv)抗体、包含抗体部分的融合蛋白和包含抗原结合位点的任何其他修饰的免疫球蛋白分子。此外,“单克隆抗体”是指通过许多技术制备的这类抗体,该技术包括但不限于杂交瘤生产、噬菌体选择、重组表达和转基因动物。
[0072]
基于测序的方法
[0073]
如果可用,也可以使用高级测序方法。例如,可以使用illumina检测生物标志物。下一代测序(例如,sequencing

by

synthesis或truseq方法,其使用例如hiseq、hiscan、genomeanalyzer或miseq系统(加利福尼亚州圣地亚哥illumina,inc.))。生物标志物也可以使用离子流测序(ion torrent systems,inc.,gulliford,康涅狄格州)或其他合适的半导体测序方法来进行检测。
[0074]
其他检测工具
[0075]
可以使用质谱法使用rnase图谱(mapping)对生物标志物进行定量。在通过ms或串联ms(ms/ms)方法对分离的rna进行分析之前,可以用具有高特异性的rna内切核酸酶(rnase)(例如,rnase t1,其在所有未修饰的鸟苷残基的3'侧切割)对分离的rna进行酶促消化。开发的第一种方法使用直接与esi

ms偶联的反相hplc对核酸内切酶消化物进行在线色谱分离。转录后修饰的存在可以通过与基于rna序列预期的那些的质量偏移来揭示。然后可以分离质量/电荷值异常的离子用于串联ms测序,从而定位转录后修饰的核苷的序列位置。
[0076]
基质辅助激光解吸/电离质谱法(maldi

ms)也已被用作获得关于转录后修饰的核苷的信息的分析方法。基于maldi的方法可以通过分离步骤与基于esi的方法区分。在maldi

ms中,质谱仪用于分离生物标志物。
[0077]
用于生物标志物检测和测量的其他方法包括,例如,链侵入测定(third wave technologies,inc.)、表面等离子共振(spr)、cdna、mtdna(金属dna;萨斯喀彻温省萨斯卡通市advance technologies)以及单分子方法,诸如由us genomics开发的方法。可以使用结合了表面酶反应和纳米颗粒扩增spr成像(spri)的新方法以微阵列形式检测多个生物标志物。poly(a)聚合酶的表面反应在杂交到锁核酸(lna)微阵列上的生物标志物上产生poly
(a)尾。然后将dna修饰的纳米颗粒吸附到poly(a)尾并用spri检测。这种超灵敏的纳米颗粒扩增的spri方法可用于以阿摩尔(attamole)水平进行生物标志物分析。
[0078]
检测扩增或非扩增的生物标志物
[0079]
在某些实施方案中,标记、染料或标记的探针和/或引物用于检测扩增的或未扩增的生物标志物。基于检测方法的灵敏度和靶标的丰度,技术人员将认识到哪些检测方法是合适的。根据检测方法的灵敏度和靶标的丰度,在检测之前可能需要或可能不需要扩增。本领域技术人员将认识到优选生物标志物扩增的检测方法。
[0080]
探针或引物可以包括标准(a,t或u,g和c)碱基,或修饰的碱基。修饰的碱基包括,但不限于,aegis碱基。在某些方面,碱基通过天然磷酸二酯键或不同的化学键连接。不同的化学键包括,但不限于,肽键或锁核酸(lna)键。
[0081]
在某些实施方案中,扩增反应中的一种或多种引物可以包括标记。在更进一步的实施方案中,不同的探针或引物包含可彼此区分的可检测标记。在一些实施方案中,核酸,诸如探针或引物,可以用两种或更多种可区分的标记来标记。
[0082]
在一些方面,标记附着于一种或多种探针并具有以下性质中的一种或多种:(i)提供可检测信号;(ii)与第二标记相互作用以修饰由第二标记提供的可检测信号,例如,fret(荧光共振能量转移);(iii)稳定杂交,例如,形成双链体;以及(iv)提供结合复合物或亲和组的成员,例如亲和力、抗体

抗原、离子复合物、半抗原

配体(例如,生物素

亲和素)。在另外其他方面,标记的使用可以使用大量已知技术中的任何一种(该已知技术采用已知标记、键、连接基团、试剂、反应条件以及分析和纯化方法)来实现。
[0083]
生物标志物可通过直接或间接方法检测。在直接检测方法中,通过与核酸分子连接的可检测标记来检测一种或多种生物标志物。在这类方法中,生物标志物可以在与探针结合之前被标记。因此,通过筛选与探针结合的标记的生物标志物来检测结合。该探针任选地与反应体积中的珠子(bead)连接。
[0084]
在某些实施方案中,通过与标记的探针直接结合来检测核酸,并随后检测探针。在本发明的一个实施方案中,使用与探针缀合的fiexmap微球(luminex)检测核酸(诸如扩增的生物标志物),以捕获期望的核酸。一些方法可涉及例如用荧光标记修饰的多核苷酸探针检测或分支dna(bdna)检测。
[0085]
在一些实施方案中,使用基于pcr的测定法来确定生物标志物的表达,该测定法包含每种生物标志物的特异性引物和/或探针。如本文所用,术语“探针”是指能够选择性结合特定预期目标生物分子的任何分子。在一些实施方案中,本文中,术语“探针”是指可间接地或直接地、共价地或非共价地结合至本文公开的任何底物和/或反应产物和/或蛋白酶的任何分子或与其相关,并且其相关或结合可使用本文公开的方法检测。在一些实施方案中,探针是荧光探针、抗体或基于吸光度的探针。如果是基于吸光度的探针,发色团pna(对硝基苯胺)可用作检测和/或定量本文公开的靶核酸序列的探针。在一些实施方案中,探针可以是包含荧光分子或底物的核酸序列,该荧光分子或底物在暴露于酶时变为发荧光的,并且该核酸序列与一种核酸序列的片段互补。
[0086]
术语“引物”或“探针”涵盖具有特定序列的寡核苷酸或具有特定序列的寡核苷酸。在其他实施方案中,通过间接检测方法检测核酸。例如,生物素化的探针可以与链霉亲和素缀合的染料组合以检测结合的核酸。链霉亲和素分子结合扩增的生物标志物上的生物素标
记,并且结合的生物标志物通过检测附着在链霉亲和素分子上的染料分子来检测。在一个实施方案中,缀合链霉亲和素的染料分子包含phycolink。链霉亲和素r

藻红蛋白(prozyme)。其他缀合染料分子是本领域技术人员已知的。
[0087]
标记包括,但不限于:发光、光散射和吸光化合物,其产生或淬灭可检测的荧光、化学发光或生物发光信号。在一些实施方案中使用包括报告荧光团和淬灭剂荧光团的双重标记的荧光探针。应当理解,选择具有不同发射光谱的成对荧光团,使得它们可以容易地区分。在某些实施方案中,标记是杂交稳定部分,其用于增强、稳定或影响双链体的杂交,例如,嵌入剂和嵌入染料。
[0088]
诊断
[0089]
本文所述的生物标志物可单独或组合用于诊断测试中以评估受试者的结直肠癌状态。结直肠癌状态包括结直肠癌存在或不存在。结直肠癌状态还可以包括监测结直肠癌的病程,例如,监测疾病进展。基于受试者的结直肠癌状态,可以指示另外的程序,包括例如另外的诊断测试或治疗程序。
[0090]
通常根据测定的准确度、测定的灵敏度、测定的特异性或“曲线下面积”(auc,例如,接受者操作特征(roc)曲线下面积)来测量诊断测试正确预测疾病状态的能力。如本文所用,准确度是错误分类的样品的分数的量度。可以将准确度度计算为例如在测试群体中正确分类的样本的总数除以样本的总数。灵敏度是通过测试预测为阳性的“真阳性”的量度,并且可以计算为正确鉴定的结直肠癌样品的数目除以结直肠癌样品的总数。特异性是通过测试预测为阴性的“真阴性”的量度,并且可以计算为正确鉴定的正常样品的数目除以正常样品的总数。auc是接受者操作特征曲线下面积的量度,其为灵敏度对假阳性率(1

特异性)的曲线。auc越大,测试的预测值越强大。测试效用的其他有用量度包括“阳性预测值”和“阴性预测值”两者,“阳性预测值”是测试为阳性的实际阳性的百分比,“阴性预测值”是测试为阴性的实际阴性的百分比。在一个优选的实施方案中,相对于正常受试者,来源于具有不同结直肠癌状态的受试者的样品中一种或多种生物标志物的水平显示出至少p=0.05,例如p=0.05,p=0.01,p=0.005,p=0.001等的统计学显著差异,如相对于合适的对照所确定的。在其他优选的实施方案中,单独或组合使用本文所述的生物标志物的诊断测试显示至少约75%的准确度,例如,至少约75%,约80%,约85%,约90%,约95%,约97%,约99%或约100%的准确度。在其他实施方案中,单独或组合使用本文所述的生物标志物的诊断测试显示出至少约75%的特异性,例如至少约75%,约80%,约85%,约90%,约95%,约97%,约99%或约100%的特异性。在其他实施方案中,单独或组合使用本文所述的生物标志物的诊断测试显示出至少约75%的灵敏度,例如至少约75%,约80%,约85%,约90%,约95%,约97%,约99%或约100%的灵敏度。在其他实施方案中,单独或组合地使用本文所述的生物标志物的诊断测试显示出各自至少约75%的特异性和灵敏度,例如,至少约75%,约80%,约85%,约90%,约95%,约97%,约99%或约100%的特异性和灵敏度(例如,至少约80%的特异性和至少约80%的灵敏度,或例如,至少约80%的特异性和至少约95%的灵敏度)。
[0091]
每种生物标志物与正常受试者相比不同地存在于来源于患有结直肠癌的受试者的生物样品中,因此每种生物标志物可单独用于促进测试受试者中结直肠癌的确定。这类方法涉及确定来源于受试者的样品中的生物标志物的水平。确定样品中生物标志物的水平
可以包括使用任何合适的方法(例如本文所述的方法)测量、检测或测定样品中生物标志物的水平。确定样品中生物标志物的水平还可以包括检查所测量、检测或测定样品中生物标志物的水平的测定的结果。该方法还可以涉及将样品中的生物标志物的水平与合适的对照进行对比。使用合适的对照评估的生物标志物相对于正常受试者中的生物标志物水平的变化指示受试者的结直肠癌状态。可以使用诊断量的生物标志物,其表示高于或低于该诊断量时,受试者被归类为具有特定结直肠癌状态。例如,如果与正常个体相比,生物标志物在来源于患有结直肠癌的个体的样品中上调,则高于诊断截止值的测量量提供了对结直肠癌的诊断。如本领域所熟知的,调节测定中使用的具体诊断截止值允许人们根据需要调节诊断测定的灵敏度和/或特异性。具体的诊断截止值可以例如通过测量来自具有不同结直肠癌状态的受试者的统计上显著数量的样品中的生物标志物的量,并以期望的准确度、灵敏度和/或特异性水平绘制截止值来确定。在某些实施方案中,诊断截止值可在分类算法的帮助下确定。
[0092]
虽然单独的生物标志物可用于结直肠癌的诊断应用,如本文所示,但生物标志物的组合可比单独使用时的生物标志物提供更高的结直肠癌状态的预测值。具体地,检测多个生物标志物可以增加诊断测试的准确度、灵敏度和/或特异性。本发明包括这些表中列出的个体生物标志物和生物标志物组合,以及它们在本文所述的方法和试剂盒中的用途。
[0093]
在一些实施方案中,使用诸如“已知样本”的样本生成的数据然后可用于“训练”分类模型。“已知样品”是已经被预先分类的样品,例如,被分类为来自正常受试者或来自患有结直肠癌的受试者的样品。由光谱导出并用于形成分类模型的数据可称为“训练数据集”。一旦被训练,分类模型可以识别从使用未知样品产生的光谱导出的数据中的模式。然后可以使用该分类模型来将这些未知样品分类成类。例如,这在预测特定生物样品是否与特定生物状况(例如,患病和未患病)相关中是有用的。
[0094]
可以使用任何合适的统计分类(或“学习”)方法来形成分类模型,该方法试图基于数据中存在的客观参数将数据体分成类。在监督分类中,将包含已知类别的示例的训练数据呈现给学习机制,该学习机制学习定义每个已知类别的一组或多组关系。然后可以将新数据应用于学习机制,该学习机制然后使用所学习的关系对新数据进行分类。监督分类过程的示例包括线性回归过程(例如,多重线性回归(mlr)、偏最小二乘(pls)回归和主成分回归(pcr))、二元决策树(例如,诸如cart分类和回归树的递归分区过程)、诸如反向传播网络的人工神经网络、判别分析(例如,贝叶斯分类器(bayesian classifier)或费舍尔分析(fischer analysis))、逻辑分类器,以及支持向量分类器(支持向量机)。
[0095]
在其他实施方案中,可以使用无监督学习方法来形成所创建的分类模型。无监督分类尝试基于训练数据集中的相似性来学习分类,而不对从中得出训练数据集的光谱进行预分类。无监督学习方法包括聚类分析。聚类分析试图将数据分成“聚类”或组,在理想情况下,这些“聚类”或组应该具有彼此非常相似且与其他聚类的成员非常不相似的成员。然后使用某种距离度量来测量相似性,该距离度量测量数据项之间的距离,并将彼此接近的数据项聚类在一起。
[0096]
分类模型可以在任何合适的数字计算机上形成和使用。合适的数字计算机包括使用任何标准或专用操作系统(诸如基于unix、windows或linux的操作系统)的微型(micro)、迷你(mini)或大型计算机。
[0097]
训练数据集和分类模型可以通过由数字计算机执行或使用的计算机代码来体现。计算机代码可以存储在任何合适的计算机可读介质上,包括光盘或磁盘、磁棒、磁带等,并且可以用任何合适的计算机编程语言编写,包括c、c++、visual basic等。
[0098]
上述学习算法可用于开发针对结直肠癌的生物标志物的分类算法。分类算法又可通过为单独或组合使用的生物标志物提供诊断值(例如,截止点)而用于诊断测试中。
[0099]
试剂盒
[0100]
本发明提供了用于诊断受试者中的结直肠癌的试剂盒,该试剂盒用于确定生物标志物的水平(其中序列任选地包含尿嘧啶以代替所公开的胸腺嘧啶中的一种、多于一种或全部)及其组合。试剂盒可以包括适于选择性检测来源于受试者的样品中用于诊断结直肠癌的生物标志物或生物标志物组的存在的材料和试剂。例如,在一个实施方案中,该试剂盒可以包括与生物标志物特异性杂交的试剂。这类试剂可以是适于检测生物标志物的形式的核酸分子,例如,探针或引物。该试剂盒可以包括用于进行测定以检测一种或多种生物标志物的试剂,例如,可以用于在qpcr反应中检测一种或多种生物标志物的试剂。该试剂盒同样可以包括用于检测一种或多种生物标志物的微阵列。
[0101]
在进一步的实施方案中,试剂盒可以含有标记或产品插页形式的合适操作参数的说明书。例如,说明书可以包括关于如何收集样品,如何确定样品中一种或多种生物标志物的水平,或如何将样品中一种或多种生物标志物的水平与受试者的结直肠癌状态相关联的信息或指导。
[0102]
在另一个实施方案中,试剂盒可以含有一个或多个容器,其具有生物标志物样品,以用作参比标准,合适的对照,或用于测定的校准以检测测试样品中的生物标志物。
[0103]
系统/装置
[0104]
本发明涉及一种诊断对象是否患有早期结直肠癌或存在患结直肠癌风险的系统/装置,包括:
[0105]
分析单元,所述单元适于测量对象样本中生物标志物的量;和
[0106]
评估单元,其包含存储的参考和数据处理器,所述数据处理器已经实现了用于比较分析单元测量的生物标志物的量与存储的参考的算法,由此诊断早期结直肠癌或存在患结直肠癌的风险。
[0107]
如本文应用的装置应至少包括上述单元。装置的单元可操作地彼此连接。如何以操作方式链接单元将取决于装置中包含的单元的类型。例如,在分析单元中应用用于自动定量测量生物标志物的工具的情况下,由所述自动操作单元获得的数据可以由评估单元处理,例如,由在作为数据处理器的计算机上运行的计算机程序处理,以便促进诊断。在一个实施方式中,数据处理器实行生物标志物的量与参考的比较。
[0108]
进一步,在这种情况下,单元由单个装置构成。然而,分析单元和评估单元也可为物理上分离的。在这种情况下,可以经由允许数据传输的单元之间的有线和无线连接来实现操作连接(operative linkage)。无线连接可使用无线lan(wlan)或互联网。有线连接可通过单元之间的光学和非光学电缆连接实现。用于有线连接的电缆进一步适于高通量数据传输。
[0109]
药物组合物
[0110]
本发明的药物组合物可另外包含药学上可接受的载体。术语载体包括适用于制备
所需特定剂型的任何和所有溶剂、稀释剂或其他液体媒介物、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂、固体粘合剂、润滑剂等。可用作药学上可接受的载体的材料的一些示例包括,但不限于,糖,诸如乳糖、葡萄糖和蔗糖;淀粉,诸如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,诸如羧甲基纤维素钠、乙基纤维素和乙酸纤维素;粉末黄蓍胶;麦芽;明胶;滑石;赋形剂,诸如可可脂和栓剂蜡;油,诸如花生油、棉籽油、红花油、麻油、橄榄油、玉米油和大豆油;二醇,诸如丙二醇;酯,诸如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,诸如氢氧化镁和氢氧化铝;海藻酸;无热原水;等渗盐水;林格氏液;乙醇和磷酸盐缓冲液,以及根据配制人员的判断,组合物中还可以存在其他无毒相容的润滑剂诸如十二烷基硫酸钠和硬脂酸镁,以及着色剂、释放剂、包衣剂、甜味剂、调味剂和芳香剂、防腐剂和抗氧化剂。
[0111]
下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。
[0112]
实施例1筛选与结直肠癌相关的差异表达基因
[0113]
1、样本来源
[0114]
从sra下载prjeb27536数据集的测序数据以及tcga下载结直肠癌基因表达量数据,样本量为正常组织:息肉组织:结直肠癌tnm1:tnm2:tnm3:tnm4=50:21:52:123:89:44。
[0115]
2、数据处理
[0116]
来自sra数据库的raw data使用fastq软件进行接头处理和质控,得到的cleandata使用icgc软件比对至人类参考基因组,版本为(grch38.d1.vd1),bam文件使用htseq软件进行定量。
[0117]
定量模式:intersection

nonempty;
[0118]
定量标准类型:gene_id;
[0119]
链特异性:非特异性。
[0120]
表达量文件按照基因id进行合并,构建m*n的基因表达量矩阵,基因表达量矩阵中的第i行第j列的数值表示第j个样本对应第i个基因的表达量count值,其中1≤i≤m,1≤j≤n;m表示检测基因的数量,n表示分析样本的数量。将表达量矩阵保存为.rdata对象文件。
[0121]
处理的到的count表达量矩阵和tcga的表达量矩阵进行合并,合并标准:gene id。
[0122]
3、差异表达分析
[0123]
将实验分为以下几组:组1:癌症vs正常(cancer vs normal);组2:癌症vs息肉(cancer vs polyps);组3:癌症早期vs正常(tnm1+tnm2 vs normal);组4:癌症晚期vs正常(tnm4 vs normal)。
[0124]
按照实验分组设计,构建差异表达的分组矩阵,使用r软件中的“deseq2”包进行差异表达分析,差异基因的筛选标准为adj.p value<0.05,|log2fc|>1。
[0125]
筛选仅在组3中呈现显著性差异的基因。
[0126]
4、结果
[0127]
分析结果显示,组1中呈现显著性差异表达的基因有12070个,显著上调的差异表达基因有4820个,显著下调的差异表达基因有7250个;组2中呈现显著性差异表达的基因有11348个,显著上调的差异表达基因有4030个,显著下调的差异表达基因有7318个;组3中呈
现显著性差异表达的基因有12147个,显著上调的差异表达基因有4546个,显著下调的差异表达基因有7601个;组4中呈现显著性差异表达的基因有11996个,显著上调的差异表达基因有4799个,显著下调的差异表达基因有7197个。
[0128]
筛选仅在组3中呈现显著性差异的基因如图1所示,共442个,其中,相比正常对照,ezh2在早期结直肠癌中表达上调,slc25a25

as1、prr26、slc5a8、rp11

440d17.4、ac009237.11在早期结直肠癌中表达下调,其表达情况分别如表1和图2所示,其中,fc(fold change)表示的是早期结直肠癌vs正常的差异倍数,使用(log2表达量)代表基因的表达量。
[0129]
表1基因的表达情况
[0130]
基因log2fclfcsestatp.valueadj.p.valezh21.0177555370.07619963713.356435451.08643e

402.97562e

39slc25a25

as1

1.0197039550.12369841

8.2434685921.67289e

161.13093e

15prr26

1.0881893710.122999423

8.8471095848.98152e

197.0117e

18slc5a8

1.4483058780.499781639

2.8978773210.0037569750.007424346rp11

440d17.4

1.0941358480.272582006

4.0139694625.97061e

050.000150727ac009237.11

1.1370315740.302724945

3.7559890340.0001726580.000410888
[0131]
实施例2诊断效能验证
[0132]
使用r包“proc”绘制受试者工作曲线(roc),分析auc值、敏感性和特异性,判断指标的诊断效能。使用基因的表达量(log2表达量)进行分析,选择最大的youden指数对应的点水平作为其cutoff值。
[0133]
基因单独roc:
[0134]
直接使用基因的表达量(log2表达量)进行分析,选择约登指数最大的一点对应的水平作为其cutoff值,即最佳划分阈值通过约登指数最大的一点确定。
[0135]
基因联合roc:
[0136]
首先是对基因进行logistics回归,其中,自变量为对应的指标,因变量为患病情况,通过拟合出的回归曲线可以计算出每个个体患癌与否的logit(p)值,确定不同的logit(p)值划分阈值即可得到预测结果。最佳概率划分阈值通过约登指数最大的一点确定。
[0137]
ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4或ac009237.11的部分或全部诊断效能以及联合诊断效能分别如表2和图3所示。说明ezh2、slc25a25

as1、prr26、slc5a8、rp11

440d17.4和/或ac009237.11应用于诊断早期结直肠癌或是否存在发展成结直肠癌的风险具有重要的效能。
[0138]
表2生物标志物的诊断效能
[0139]
[0140][0141]
实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1