用于头颈部鳞状细胞癌诊断的循环长链非编码RNA生物标志物和试剂盒及用途的制作方法

文档序号:15686310发布日期:2018-10-16 21:05阅读:188来源:国知局
本发明属于生物检测领域,更具体地,涉及一种用于头颈部鳞状细胞癌诊断的循环长链非编码rna生物标志物和试剂盒及用途。
背景技术
:头颈部癌每年有超过630,000例新发病例和超过130,000例死亡病例。头颈部鳞状细胞癌(hnscc)是头颈部最常见的恶性肿瘤,起源于口腔、口咽、下咽和喉。尽管综合疗法取得了重大进展,但近几十年来头颈部鳞癌的5年总生存率仍保持在50%左右,其主要原因是局部复发、区域淋巴结和远处转移。头颈部的解剖复杂性以及缺乏足够特异性和敏感性的生物标志物往往使得hnscc诊断时已处于晚期,导致预后不良和生存期短。因此,鉴定用于早期诊断原发性头颈部鳞癌的新型生物标志物对改善结局起着重要作用。长链非编码rna(lncrnas)是一种新的rna类型,长度超过200个核苷酸,无蛋白质编码功能。目前,高通量芯片和rna测序技术已经鉴定出各种癌症中大量异常表达的lncrnas。它们的表达通常是组织特异性的。像蛋白质和microrna一样,lncrnas已有报道为癌症诊断和预后的新型生物标志物,它不仅可以来自于肿瘤组织,而且可以来自于血液。在hnscc中,hotair,uca-1和gas5表达失调并与不良预后相关。最近,关于血浆检测的研究表明,循环lncrnasrp11-160h22.5,xloc_014172和loc149086可能是肝癌的潜在生物标志物,xloc_014172和loc149086可能用于肝癌转移的预测。同样,循环gas5水平可作为预测同步放化疗的hnscc患者治疗反应的潜在生物标志物。随着高通量测序技术的发展和生物医学大数据时代的来临,头颈部鳞癌发生、发展的相关研究也飞速发展,其中lncrna逐渐成为研究的热点之一,lncrnas正在成为肿瘤诊断中新的生物标志物。尽管对hnscc的生物标志物进行了广泛的研究,但重点关注该疾病的循环lncrnas的诊断效果的研究很少。早期hnscc仍然缺乏有效的肿瘤特异性生物标志物用于诊断和预后评估。技术实现要素:本发明的目的是提供一组用于头颈部鳞状细胞癌诊断的循环长链非编码rna生物标志物和试剂盒及用途。发明人调查了血浆中循环lncrnas作为hnscc生物标志物的潜在用途。首先,通过分析来自hnscc患者和无癌对照(循环样品和组织样品)的rna测序数据,整合两组lncrna异常表达的数据。然后采用实时定量pcr(rt-qpcr)技术在更多的hnscc患者和健康人群的血浆中验证。最后,在血浆中筛选并验证了一组差异表达的lncrnas,其可以作为诊断hnscc的新型生物标志物。具体地,本发明第一方面提供一组用于头颈部鳞状细胞癌诊断的循环长链非编码rna生物标志物,所述循环长链非编码rna生物标志物由如下循环lncrna组成:hoxa11-as,linc00964和malat1,所述hoxa11-as具有如seqidno:1所示的核苷酸序列,所述linc00964具有如seqidno:2所示的核苷酸序列,所述malat1具有如seqidno:3所示的核苷酸序列。本发明中,所述循环长链非编码rna生物标志物为人血浆循环长链非编码rna生物标志物。本发明的第二方面提供hoxa11-as,linc00964和malat1联合作为头颈部鳞状细胞癌生物标志物在制备或筛选头颈部鳞状细胞癌检测试剂中的用途。根据本发明,所述头颈部鳞状细胞癌检测试剂以hoxa11-as,linc00964和malat1联合作为检测对象;所述检测试剂可以为试剂盒和/或高通量芯片。可选地,所述头颈部鳞状细胞癌检测试剂中,含有hoxa11-as,linc00964和malat1的标准品或阳性对照。优选地,所述头颈部鳞状细胞癌检测试剂中,含有特异性识别hoxa11-as的试剂,特异性识别linc00964的试剂和特异性识别malat1的试剂。特异性识别试剂可以为本领域各种形式的可实现特异性识别的物质。优选地,所述特异性识别hoxa11-as的试剂为hoxa11-as的反转录引物,所述特异性识别linc00964的试剂为linc00964的反转录引物,所述特异性识别malat1的试剂为malat1的反转录引物。根据一种优选实施方式,hoxa11-as的反转录引物如下所示:forwardprimer(正向引物):5’-ctgttctcctggagtctcgc-3’(seqidno:4)reverseprimer(反向引物):5’-caccgtgcaaatcggacaag-3’(seqidno:5)。根据一种优选实施方式,linc00964的反转录引物如下所示:forwardprimer(正向引物):5’-cctctgactgccaccatttg-3’(seqidno:6)reverseprimer(反向引物):5’-atcattcacagggcctcatgg-3’(seqidno:7)。根据一种优选实施方式,malat1的反转录引物如下所示:forwardprimer(正向引物):5’-atgtggggattgggaaccac-3’(seqidno:8)reverseprimer(反向引物):5’-gctgcaggctattacctgtt-3’(seqidno:9)。根据本发明,所述头颈部鳞状细胞癌检测试剂用于头颈部鳞状细胞癌判断、治疗方案选择、预后判断中的至少一种。本发明的第三方面提供特异性识别hoxa11-as的试剂,特异性识别linc00964的试剂和特异性识别malat1的试剂在制备头颈部鳞状细胞癌检测试剂盒中的用途。本发明的第四方面提供一种头颈部鳞状细胞癌检测试剂盒,所述试剂盒含有特异性识别hoxa11-as的试剂,特异性识别linc00964的试剂和特异性识别malat1的试剂。本发明中,发明人调查了血浆中循环lncrnas作为hnscc生物标志物的潜在用途。血浆中循环生物标志物的检测属于液体活检的方法,可频繁多次检测,可以用于指导肿瘤患者的长期筛查和治疗反应的评估。该方法属于微创范畴,无侵入性,为患者省去了手术活检和穿刺活检,可降低医疗成本,减少医疗资源浪费。本发明提供新的、高敏感性和特异性的生物标记物用于hnscc的诊断以改善患者结局符合当前的迫切需求。本发明的其它特征和优点将在随后具体实施方式部分予以详细说明。附图说明通过结合附图对本发明示例性实施方式进行更详细的描述。图1a-1e示出了循环样本(circulating)和组织样本(tissues)中的lncrna表达谱。图1a-1b:差异表达的lncrnas(来自3例hnscc患者和3例无癌对照(control)的血浆样本)的聚类分析和散点图。图1c-1d:差异表达的lncrnas(3对hnscc肿瘤组织(tumor)和癌旁正常组织样本(para-tumor))的聚类分析和散点图。图1e:venny分析循环样本和组织样本中的表达增高的lncrnas。图2示出了候选lncrna在试验组中的验证结果。rt-qpcr验证20名hnscc患者和20名无癌对照(control)的血浆中候选lncrna的表达水平,数据以平均值±sem表示。数据分析采用student'st检验。n.s.表示无显著性差异,*表示p<0.05,**表示p<0.01。图3示出了候选lncrna在循环样本和组织样本中的验证结果。在20个组织样本(成对的肿瘤组织(tumor)和癌旁正常组织(para-tumor))和20个循环样本(hnscc患者和无癌对照(control))中利用rt-qpcr验证候选lncrna。数据分析采用student'st检验。n.s.表示无显著性差异,*表示p<0.05,**表示p<0.01。图4示出了候选lncrna在验证组中的验证结果。rt-qpcr验证100名hnscc患者和100名无癌对照(control)的血浆中候选lncrna的表达水平,数据以平均值±sem表示。数据分析采用student'st检验。n.s.表示无显著性差异,*表示p<0.05,**表示p<0.01。图5a-5b示出了通过风险评分分析对三种hnscc潜在的生物标志进行roc分析的结果。图5a:roc曲线分析是通过三种lncrna表达对hnscc病例和对照进行区分。在试验组中三种lncrna表达的roc曲线分析区分20对hnscc病例与对照,auc如图5a图上所示。var00021,var00022,var00023和var00024分别代表hoxa11-as,linc00964,malat1和三种lncrna的联合。图5b:三种lncrna表达的roc曲线分析区分100对hnscc病例与对照,auc如图5b图上所示。auc呈现在上部。var00002,var00003,var00004和var00005分别代表hoxa11-as,linc00964,malat1和三种lncrna的联合。具体实施方式下面将更详细地描述本发明的优选实施方式。材料和方法1.实验设计本发明共纳入2012年至2015年南京医科大学附属肿瘤医院头颈部外科100例头颈部肿瘤患者和100例无明显疾病匹配的健康人群。该研究按照世界医学会赫尔辛基宣言(第五次修订,2000年10月)进行,并经南京医科大学附属肿瘤医院伦理委员会批准。书面知情同意书由所有研究参与者提供。这些患者在手术前没有接受任何治疗,如放疗或化疗。最初的治疗是手术。术后病理证实为头颈部鳞状细胞癌。将每个组织标本储存在液氮中,并将血液样品储存在-80℃冰箱。将每个血液样品置于edta-抗凝管中,室温800g离心10分钟分离血浆,接着在室温下10000g高速离心15分钟完全除去细胞碎片,回收上清液并储存于-80℃冰箱。根据第十版ajcc头颈部癌tnm分期系统进行疾病分期。表1显示患者和健康对照人群的详细信息。表1hnscc患者和健康对照人群的临床病理特征特征hnscc患者对照p值n100100平均年龄(标准误)岁54.33(8.12)56.11(7.58)0.22a性别(男/女)61/3959/410.77b肿瘤部位口腔/口咽55喉/下咽45病理分级g141g237g322tnm分期(ⅰ:ⅱ:ⅲ)43:31:26淋巴结转移是67否33astudentt-检验b卡方检验2.筛选过程筛选过程分为试验组和验证组。试验组包括20例hnscc患者以及20例健康对照人群。验证组纳入了100例hnscc患者和100例健康对照人群。3.试验组分别在20例患者和20例健康对照人群的血浆以及20例患者的组织样本中检测所有候选基因的表达水平。组织样本包括肿瘤组织和癌旁正常组织。所有患者均经病理学诊断为hnscc。在所有样本中分析这些候选基因的表达水平,并使用2-δδct方法分析患者与健康对照之间的差异。4.验证组设计病例对照研究验证100名患者和100名健康对照者中潜在生物标记候选基因的相对表达水平的差异。5.rna提取用trizol试剂从50mg组织和300μl血浆中提取总rna。每个样品的总rna通过nanodropnd-1000(thermo,ca,usa)定量。6.illuminahiseq2000(rna-seq)将三个hnscc患者和三个健康对照的血浆样品提取的rna视为循环样本,而将三例hnscc患者配对的肿瘤组织和癌旁正常组织提取的rna标记为组织样本。所有这两种样品都应用于rna测序分析。根据制造商使用说明,用1.0μg的总rna和truseqtotalrnasamplepreparationkitversion1.0(illumina,sandiego,ca)制备用于rna-seq分析的文库。7.lncrnas的rna-seq数据分析对r中的port量化结果进行了大部分量化和差异表达分析。确定了显著差异表达的基因,即benjamini-hochbergq值<0.05的那些基因。使用limma(v3.28.17)软件包进行平行差异表达分析。数据的进一步分析和可视化均使用自定义r脚本进行。8.实时聚合酶链式反应(rt-pcr)如制造商(invitrogenlifetechnologiesco,carlsbad,ca,usa)所述,用trizol试剂从血浆样品获得总rna。使用逆转录试剂盒(takara,tokyo,japan)逆转录总rna(500ng)。样品的260/280nm吸光度比率限于1.8-2.0之间。通过使用abiprism7900ht(appliedbiosystems,ca,usa)进行qrt-pcr。9.风险评分分析进行风险评分分析以评估血浆lncrna表达水平之间的关联。将对照组中每个lncrna值的上限95%参考区间设定为阈值以将每个样品的相应lncrna的表达水平编码为试验组中的0和1。根据每个lncrna表达水平的线性组合定义用于预测hnscc的风险评分函数(rsf)。例如,使用来自三个lncrnas信息的样本i的rsf为:rsfi=σ3j-1wj.sij。在上述的方程中,sij是样本i中lncrnaj的风险评分,wj是lncrnaj的风险评分的权重。三个lncrnas的风险评分根据回归系数的权重计算得出,该回归系数来源于每个lncrnas的单因素logistic回归分析。样品根据rsf分为高风险组(代表hnscc患者)和低风险组(代表预测的对照个体或非转移患者)。然后使用频率表和roc曲线评估诊断效能,并找到适当的分界点,并验证下一个验证样本集中的程序和临界值。10.统计分析数据以平均值(sem)表示。使用student'st检验和mann-whitney不成对的方差分析来评估患者和对照之间的统计学差异。使用roc曲线下面积(auc)分析评估lncrnas的预测效能。统计分析使用stata9.2和graphpadprism软件进行。所有病例p<0.05为差异有统计学意义。结果1.循环和组织lncrnas的高通量rna测序应用hiseq2000平台检测来自循环和组织样本的lncrna。随机选择来自三名男性hnscc患者术前和三名健康对照者的血浆样本。组织样本含有三个配对的原发性hnscc组织和癌旁正常组织。如图1a-1d所示,在循环和组织样本中都获得了lncrna异常表达谱。为了筛选预测hnscc的候选生物标志物,过滤具有以下参数的差异表达的lncrna:⑴lncrna表达>80%;⑵lncrna差异倍数>4;⑶lncrna在循环和组织样本中表达均增加。如图1e所示,在hnscc的循环样本中有420个lncrna表达异常增高,而在组织样本(肿瘤组织)中有321个。只有12个lncrna与以上所有参数一致,并在后续筛选阶段进一步验证。2.rt-qpcr验证血浆中显著差异的lncrnas为了验证血浆中的rna测序数据,通过rt-qpcr在20名hnscc患者和20名无癌对照的血浆中验证了它们的表达水平。在hnscc患者和无癌对照之间,年龄和性别的分布没有显著差异。结果显示,在12个候选lncrna中,有6个在循环样本和组织样本中证实为显著差异(图2)。接下来,在20个组织样本(成对的肿瘤组织和癌旁正常组织)和20个循环样本(hnscc患者和无癌对照)中确认这6个候选lncrna。在hnscc患者的血浆样本和肿瘤组织中仅有3个lncrna证实表达增加(图3)。最后,对于异常表达的3个lncrnas,在另外的100名hnscc患者和100名无癌对照的血浆中验证它们的表达水平。如图4所示,这3个lncrnas确认为显著差异,包括hoxa11-as,linc00964和malat1。3.风险评分分析进一步研究以探索这3种lncrna作为hnscc潜在特征的准确性和特异性。在整个多相测试和分析过程中,三种lncrnas可能被认为是hnscc诊断的潜在特征。应用风险评分公式评估三种lncrna的诊断价值。首先,根据对照组95%可信区间(95%ci)将试验组中的对照组和病例组划分为95%可信区间。基于logistic回归分析计算风险评分。然后将所有血浆样本分成hnscc高风险组和低风险组。将截止值定义为灵敏度和特异性的最大值。试验组中的阳性预测值(ppv)和阴性预测值(npv)分别为70%和80%。进一步应用相同的值计算验证组样本的风险评分,ppv和npv分别为88%,81%(表2)。roc曲线分析用于评估lncrnas对hnscc的预测诊断价值。经验证的三个lncrna的roc曲线下面积分别为0.773、0.387和0.918,而三者的组合在hnscc患者和对照之间具有较好的鉴别能力,roc曲线下面积为0.925(图5a)。roc曲线分析用于评估验证组中lncrnas对hnscc的预测诊断价值。经验证的3个lncrnas的roc曲线下面积分别为0.659、0.687和0.718,而这三个因素的组合在hnscc患者与对照之间具有较好的鉴别能力,roc曲线下面积为0.839(图5b)。表2hnscc患者和健康对照血浆样本的风险评分分析ppva,阳性预测值npvb,阴性预测值以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本
技术领域
的普通技术人员来说许多修改和变更都是显而易见的。序列表<110>南京医科大学<120>用于头颈部鳞状细胞癌诊断的循环长链非编码rna生物标志物和试剂盒及用途<160>9<170>siposequencelisting1.0<210>1<211>1549<212>dna<213>homosapiens<400>1gccacctcaggggaagcaacagatcgtcactcggtgttctcaccgaaagcacgtaatcgc60cggtgtaactcatgttggctggggggcctcccggcgcgcgcggagaggctggggtgcgcc120cccatgcagcatgcttgtgctcaattgcagggtcctcgttctcgagtgtgcagagggcgg180tgagagctcaactctcgtccccacctcccacccgcagctccccgggtgggtgagggatgc240cctggactggggatagccaggtgggagtccgtcgctgtgtggcctgtggtctcggagtct300gttctcctggagtctcgcatttgcacccccttcttcgcagtccccctcccatagacttgc360tctgggaagcgcctctgcctccgaccctagccggaaccccttcggggccagagtttgaag420ccgtggatgtgcctgcctggtggcttgtccgatttgcacggtgacttgattacactctct480cattcatggtcacttccgaagcgctttagtgccttccgtccctaaaccgccaacagccag540aacggcttctccccgcggtttgtcactgatccgcagggcccggaagggccttcgtcttac600ccgggatccacctctcccctcatcttccctgcctacctcttcatcccaccttctgtcctt660ggagaaactccctcctcctcgctgcctgccgggcttcggagtgactcggcagagacagag720gcacaggggctgccctgctgctcaccggtccacccatctgcctggtcttctggagctgag780gactcgggaaaccatgcaattgaggcaagccttgggctgctttagaggcgctgacatccg840aggagacttctcctgggaggtccaacagccgagcttagcccaccgggctctgggaaagac900ccgactgaggctaaagccgccccggaaggccaagtccgagttccatttcttgaagaggcc960ggcgcgcgtaaggctgtgacattggccctggcgactggcttcccaggagctgttctttct1020caggagctccacagcgcgggccatctccagaaaactgtcttcagagtgtatttcctttta1080tcgtcaacccagagccccaccgcggctaatgcaagaggccaaaaaatgtttggaggaaga1140aaaacaaaggcaggaagtggcggcggcctgacggtgcgtgtgtgtctgcagagaagggag1200ggagccggctcagtctcttcttgtttttccaaacttcaaggtccaggcagccctctgcag1260ggccgggccccattgctccccgcgcggcattggaggtggccgcccggagaggagaaggcc1320aacgcctgcgccaggcttgtcaggcggaaacggctaacaaggagatttggtcagcaaaac1380agacccagcctttccgaggcttcgtctgacttggcccgaaaggttggggagggggggctt1440gcgcagagcctcagggaccctcctctctggggactaccatccctgagccttacgcttctt1500tccacagcctttgcaggcggaatatcggaataaagtgggtccaggcgcc1549<210>2<211>474<212>dna<213>homosapiens<400>2cagagcactgcgtgttttgaaatatacaaatagtgggaaacgaaatctttgttctggatg60cagttataatttggaaagcgaggaaataaattataacaaggggaaaaaacagaatactac120taaagtcatgccgtgtgacttctgaagctagctcctaagaagtccttgcagcttctgcct180gcgactcttagaacacttgctttgaaggatgccagatgctgtcttaaaagtctgagcact240ctgaaaccatcatgctgtgaggaagcccaagctaaccacatgggcaaaaaagatgccctc300tgactgccaccatttgagacactctaattaagaactgcctcattgagcccatgaggccct360gtgaatgataataataaattgtttttaaccactatgtttttggatttgttataagtttat420agataacaagaaaaagttatattagcatggtaataaaattatggatatgtgtaa474<210>3<211>584<212>dna<213>homosapiens<400>3tgttgaggaaatttctgcagttttaagcagtcgtatttgtgattgaagctgagtacattt60tgctggtgtatttttaggtaaaatgctttttgttcatttctggtggtgggaggggactga120agcctttagtcttttccagatgcaaccttaaaatcagtgacaagaaacattccaaacaag180caacagtcttcaagaaattaaactggcaagtggaaatgtttaaacagttcagtgatcttt240agtgcattgtttatgtgtgggtttctctctcccctcccttggtcttaattcttacatgca300ggaacactcagcagacacacgtatgcgaagggccagagaagccagacccagtaagaaaaa360atagcctatttactttaaataaaccaaacattccattttaaatgtggggattgggaacca420ctagttctttcagatggtattcttcagactatagaaggagcttccagttgaattcaccag480tggacaaaatgaggaaaacaggtaatagcctgcagctggtgttttgagaagccctactgc540tgaaaacttaacaattttgtgtaataaaaatggagaagctctaa584<210>4<211>20<212>dna<213>人工序列(artificialsequence)<400>4ctgttctcctggagtctcgc20<210>5<211>20<212>dna<213>人工序列(artificialsequence)<400>5caccgtgcaaatcggacaag20<210>6<211>20<212>dna<213>人工序列(artificialsequence)<400>6cctctgactgccaccatttg20<210>7<211>21<212>dna<213>人工序列(artificialsequence)<400>7atcattcacagggcctcatgg21<210>8<211>20<212>dna<213>人工序列(artificialsequence)<400>8atgtggggattgggaaccac20<210>9<211>20<212>dna<213>人工序列(artificialsequence)<400>9gctgcaggctattacctgtt20当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1