本发明涉及生物技术领域,具体涉及一种宫颈癌及其癌前病变检测试剂盒及其应用。
背景技术:
宫颈癌是女性最常见的恶性肿瘤之一,占全国女性恶性肿瘤的第二位,仅次于乳腺癌。据统计,世界每年约有50万左右的宫颈癌新发病例,占所有癌症新发病例的5%,其中的80%以上的病例发生在发展中国家。我国每年约有新发病例13万,占世界宫颈癌新发病例总数的28%。《2017中国肿瘤登记年报》数据显示,我国宫颈癌发病率为15.17/10万,死亡率为3.98/10万。宫颈癌已成为威胁我国女性生命和健康的重要疾病,是亟待解决的重大公共卫生问题。宫颈癌总体5年生存率约为55%,但不同宫颈癌分期生存率在相差很大。例如,i期宫颈癌生存率是85%,ii期迅速下降到60%,而iii期患者的比例仅为30%,iv期则仅有10%。因此早期诊断对病人及时接受治疗至关重要。但宫颈癌早期多无明显症状,大多数宫颈癌确诊时,往往已处于中晚期,疗效及预后较差。此外,宫颈癌的发生和发展有一个渐进的演变过程,时间可以从数年到数十年,一般认为这个演变过程经过这样几个阶段:轻度、中度和重度上皮内瘤样病变(cervicalintraepithelialneoplasia,cin)、早期浸润癌、浸润癌。cin可分为3期,即轻度上皮内瘤样病变(cini),中度上皮内瘤样病变(cinii),和重度上皮内瘤样病变(ciniii),原位癌归类于ciniii期。cini可逆转为正常,而cinii和ciniii进展为癌的可能性却很大,虽然进展为宫颈癌的时间长短不同,但一般是不可逆的过程。2006年asccp循证医学共识指南认为cinii,ciniii为宫颈癌前病变,应治疗。如果能在癌前病变阶段做出早期诊断,进行早期治疗,就有可能预防宫颈癌的发生,提高宫颈癌的治愈率和生存率。因此,需要有效准确的宫颈癌诊断方法。
目前,宫颈癌的常规诊断方式主要有宫颈细胞学检查、阴道镜检查和宫颈病理学检查等。虽然这些方法在诊断早期和中晚期宫颈癌患者上有一定的价值,但是其灵敏度和特异性都不高,且创伤性较大,而且对早期患者的诊断能力有限。因此,我们亟需发现更加明确而有效的标志物,对宫颈癌或其癌前病变做出早期诊断,有助于早期治疗,提高治愈率和生存率。
microrna(简写为mirna)是一类在转录后水平调节基因表达的长度约为22个核苷酸的真核生物内源性小分子单链rna。已有报道证明mirna的异常表达与肿瘤的发生、发展密切相关,mirna起到类似癌基因或抑癌基因一样的功能。许多研究表明,游离mirna的表达异常与多种肿瘤、炎症、感染性疾病有关,显示了其可作为潜在的疾病包括肿瘤的诊断标志物。研究证实循环mirna在肿瘤发生早期即发生明显的异常表达,可用于肿瘤早期诊断,循环mirna作为肿瘤诊断标志物,具有非侵入、可动态监测的优点,是对早期肿瘤患病诊断技术的良好补充。
技术实现要素:
本发明的目的是提供一种宫颈癌及其癌前病变检测试剂盒及其应用。
第一方面,本发明要求保护一种用于检测如下各mirna的物质在制备用于诊断或辅助诊断宫颈癌和/或其癌前病变的产品中的应用:hsa-mir-20a、hsa-mir-625-3p、hsa-mir-1274a、hsa-mir-26b、hsa-mir-484、hsa-mir-574-3p、hsa-mir-191、hsa-mir-1274b和hsa-mir-146b;
所述检测具体为定量或相对定量检测。
所述用于诊断或辅助诊断宫颈癌和/或其癌前病变的产品可为宫颈癌或其癌前病变检测试剂盒。
进一步地,所述“用于检测如下各mirna的物质”可为如下(a1)或(a2):
(a1)引物对组甲,由如下组成:用于检测hsa-mir-20a的引物对1;用于检测hsa-mir-625-3p的引物对2;用于检测hsa-mir-1274a的引物对3;用于检测hsa-mir-26b的引物对4;用于检测hsa-mir-484的引物对5;用于检测hsa-mir-574-3p的引物对6;用于检测hsa-mir-191的引物对7;用于检测hsa-mir-1274b的引物对8和用于检测hsa-mir-146b的引物对9。
所述引物对1由seqidno.1和seqidno.2所示的两条单链dna组成;
所述引物对2由seqidno.3和seqidno.4所示的两条单链dna组成;
所述引物对3由seqidno.5和seqidno.6所示的两条单链dna组成;
所述引物对4由seqidno.7和seqidno.8所示的两条单链dna组成;
所述引物对5由seqidno.9和seqidno.10所示的两条单链dna组成;
所述引物对6由seqidno.11和seqidno.12所示的两条单链dna组成;
所述引物对7由seqidno.13和seqidno.14所示的两条单链dna组成;
所述引物对8由seqidno.15和seqidno.16所示的两条单链dna组成;
所述引物对9由seqidno.17和seqidno.18所示的两条单链dna组成。
(a2)成套单链dna甲,由如下组成:用于检测hsa-mir-20a的所述引物对1和单链探针1;用于检测hsa-mir-625-3p的所述引物对2和单链探针2;用于检测hsa-mir-1274a的所述引物对3和单链探针3;用于检测hsa-mir-26b的所述引物对4和单链探针4;用于检测hsa-mir-484的所述引物对5和单链探针5;用于检测hsa-mir-574-3p的所述引物对6和单链探针6;用于检测hsa-mir-191的所述引物对7和单链探针7;用于检测hsa-mir-1274b的所述引物对8和单链探针8;以及用于检测hsa-mir-146b的所述引物对9和单链探针9。
所述单链探针1的核苷酸序列如seqidno.19所示;
所述单链探针2的核苷酸序列如seqidno.20所示;
所述单链探针3的核苷酸序列如seqidno.21所示;
所述单链探针4的核苷酸序列如seqidno.22所示;
所述单链探针5的核苷酸序列如seqidno.23所示;
所述单链探针6的核苷酸序列如seqidno.24所示;
所述单链探针7的核苷酸序列如seqidno.25所示;
所述单链探针8的核苷酸序列如seqidno.26所示;
所述单链探针9的核苷酸序列如seqidno.27所示。
第二方面,本发明要求保护如下任一产品:
(a1)前文所述的引物对组甲或所述的成套单链dna甲
(a2)一种宫颈癌和/或其癌前病变检测试剂盒,含有所述引物对组甲或所述成套单链dna甲。
进一步地,所述试剂盒中还可含有引物对组乙或成套单链dna乙。
所述引物对组乙,由如下组成:用于检测ath-mir159a的引物对10;用于检测hsa-mir-1228的引物对11;用于检测hsa-mir-16的引物对12。
所述引物对10由seqidno.28和seqidno.29所示的两条单链dna组成;
所述引物对11由seqidno.31和seqidno.32示的两条单链dna组成;
所述引物对12由seqidno.34和seqidno.35所示的两条单链dna组成。
所述成套单链dna乙,由如下组成:用于检测ath-mir159a的所述引物对10和单链探针10;用于检测hsa-mir-1228的所述引物对11和单链探针11;用于检测hsa-mir-16的所述引物对12和单链探针12。
所述单链探针10的核苷酸序列如seqidno.30所示;
所述单链探针11的核苷酸序列如seqidno.33所示;
所述单链探针12的核苷酸序列如seqidno.36所示。
进一步地,所述试剂盒中还可含有反转录酶、taq酶、缓冲液和dntp。
进一步地,所述试剂盒中还含有反转录引物;用于检测hsa-mir-20a的反转录引物的序列如seqidno.37所示;用于检测hsa-mir-625-3p的反转录引物的序列如seqidno.38所示;用于检测hsa-mir-1274a的反转录引物的序列如seqidno.39所示;用于检测hsa-mir-26b的反转录引物的序列如seqidno.40所示;用于检测hsa-mir-484的反转录引物的序列如seqidno.41所示;用于检测hsa-mir-574-3p的反转录引物的序列如seqidno.42所示;用于检测hsa-mir-191的反转录引物的序列如seqidno.43所示;用于检测hsa-mir-1274b的反转录引物的序列如seqidno.44所示;用于检测hsa-mir-146b的反转录引物的序列如seqidno.45所示。用于检测ath-mir159a的反转录引物的序列如seqidno.46所示;用于检测hsa-mir-1228的反转录引物的序列如seqidno.47所示;用于检测hsa-mir-16的反转录引物的序列如seqidno.48所示。
进一步地,所述试剂盒中还可含有记载有下文所述建立宫颈癌和/或其癌前病变诊断模型的可读性载体。所述可读性载体可为纸版说明书或者u盘或cd、dvd、硬盘等存储设备。
第三方面,本发明要求保护一种建立宫颈癌和/或其癌前病变诊断模型的方法。
本发明所提供的建立宫颈癌和/或其癌前病变诊断模型的方法,是以前文第一方面中所述的各mirna为检测指标,基于k近邻方法建立宫颈癌和/或其癌前病变诊断模型。
进一步地,所述方法可包括如下步骤:
(a1)以前文第一方面中所述的各mirna为检测指标,对由宫颈癌和/或其癌前病变患者和对照(如健康对照、宫颈良性病变患者和/或其他组织器官良恶性病变患者)组成的供试群体中的每个个体分别进行检测。
(a2)将所述供试群体所得的检测数据进行若干次(如20次)随机抽样,每次随机抽样均将所述供试群体所得的检测数据分为训练集和测试集,因此得到若干组(如20组)的所述训练集和所述测试集。
(a3)针对每组所述训练集,均采用k近邻方法进行两分类(宫颈癌和/或其癌前病变组与对照组)建模,因此构建若干个(如20个)模型,然后利用所述测试集评估模型效果;其中,对照可为健康对照、宫颈良性病变患者和/或其他组织器官良恶性病变患者。
(a4)针对每组所述测试集的敏感性与特异性结果,分别绘制受试者工作特征曲线(receiveroperatingcharacteristiccurve,roc曲线),选择roc曲线下面积(areaundercurve,auc)最大的模型,即为所述宫颈癌和/或其癌前病变诊断模型。
进一步地,步骤(a1)中,对所述供试群体中的每个个体进行检测,检测的是第一方面所述的各mirna的相对表达量。检测所述各mirna的相对表达量时采用参照基因可为ath-mir159a、hsa-mir-1228和/或hsa-mir-16(具体如三者表达量的均值)。
更进一步地,检测所述各mirna的相对表达量时采用的是前文第二方面中所述的产品。
进一步地,步骤(a1)中,进行所述检测时采用的样本可为血浆样本。血浆样本mirna的表达量比值可用方程2-δct表示,其中δct=ct样本-ct参照,以非人源的外掺入的ath-mir159a和血浆中稳定表达的hsa-mir-1228、hsa-mir-16三者的表达量均值作为参照基因,计算相对表达量。
进一步地,步骤(a2)中,所述随机抽样可为分层无放回随机抽样。进行所述随机抽样时,具体可从所述供试群体所得的检测数据中选取70%作为所述训练集,剩余30%作为所述测试集。
进一步地,步骤(a3)中,采用所述k近邻方法进行建模时,k值选择为5,距离度量为欧氏距离,分类决策规则为简单多数规则。
进一步地,步骤(a3)中,所述“利用所述测试集评估模型效果”具体为利用模型对所述若干组(如20组)的所述测试集中的样本分别进行预测分析(即构建若干个(如20个)模型),结果敏感性与特异性越高,则所述模型越好。
进一步地,步骤(a4)中,可根据所述若干组(如20组)的所述测试集的敏感性与特异性分别绘制所述roc曲线。
第四方面,本发明要求保护一种宫颈癌和/或其癌前病变辅助诊断系统。
本发明所提供的宫颈癌和/或其癌前病变辅助诊断系统,可包括前文第二方面中所述的产品、定量pcr检测仪以及数据处理装置。
其中,所述定量pcr检测仪可为abi7900ht、abiviiatm7、abiquantstudiotm6flex和/或abiquantstudiotmdx实时荧光定量pcr仪等。
其中,所述数据处理装置中内设模块1、模块2、模块3和模块4。
所述模块1能够对所述定量pcr仪输出的由宫颈癌和/或其癌前病变患者和对照(如健康对照、宫颈良性病变患者和/或其他组织器官良恶性病变患者)组成的供试群体中每个个体的前文中的所述的各mirna的相对表达量检测数据进行若干次(如20次)随机抽样,每次随机抽样均将检测数据分为训练集和测试集,因此得到若干组(如20组)的所述训练集和所述测试集。
所述模块2能够针对每组所述训练集,均采用k近邻方法进行两分类(宫颈癌和/或其癌前病变组与对照组)建模,然后利用所述测试集评估模型效果。其中,对照可为健康对照、宫颈良性病变患者和/或其他组织器官良恶性病变患者。
所述模块3能够针对每组所述测试集的敏感性与特异性结果,分别绘制roc曲线,选择auc最高的模型,即为所述宫颈癌和/或其癌前病变诊断模型。
所述模块4能够利用所述宫颈癌和/或其癌前病变辅助诊断模型对待测者是否为宫颈癌和/或其癌前病变患者做出结果判断。
在上述各方面中,所涉及的所述宫颈癌和/或其癌前病变患者均可为宫颈癌前病变患者、宫颈癌早期患者和/或宫颈癌中晚期患者。所述对照为健康者、宫颈良性病变者和/或其他组织器官良恶性病变患者。
第五方面,本发明要求保护利用前文第三方面所述方法建立所得的宫颈癌和/或其癌前病变诊断模型或前文第四方面所述的系统在如下任一中的应用:
(b1)宫颈癌和/或其癌前病变诊断或辅助诊断;
(b2)宫颈癌和/或其癌前病变患病风险评估和/或早期预警。
在以上各方面中,所述hsa-mir-20a的的序列如seqidno.49所示;所述hsa-mir-625-3p的序列如seqidno.50所示;所述hsa-mir-1274a的序列如seqidno.51所示;所述hsa-mir-26b的序列如seqidno.52所示;所述hsa-mir-484的序列如seqidno.53所示;所述hsa-mir-574-3p的序列如seqidno.54所示;所述hsa-mir-191的序列如seqidno.55所示;所述hsa-mir-1274b的序列如seqidno.56所示;所述hsa-mir-146b的序列如seqidno.57所示。所述ath-mir159a的序列如seqidno.58所示;所述hsa-mir-1228的序列如seqidno.59所示;所述hsa-mir-16的序列如seqidno.60所示。
本发明的优点:
首先,血浆相对其它组织较易获得,与宫颈癌组织活检相比,属于无创性检查,极大地方便了医疗人员的使用,更减轻了患者的痛苦;其次,本发明所筛选出的组合既是通过较大样本的宫颈癌病例和对照筛选出的,同时还对目前已报道的部分宫颈癌mirna标志物进行了验证;第三,本发明所筛选出的宫颈癌mirnas组合对于宫颈癌及其癌前病变与宫颈良性疾病和健康对照能很好的进行区分,同时还能较为显著的区分宫颈癌及其癌前病变和其他组织良恶性疾病样本;第四,采用k-近邻的预测模型进行综合分析,提高了检测的灵敏度和特异性。
综上所述,本发明提供的特异的mirnas组合作为筛查宫颈癌及其癌前病变的结果,可对人群的宫颈癌及其癌前病变风险进行早期预警,提高早诊的比例。基于此制备的用于检测血浆mirnas的试剂盒投入实践使用,仅仅需要病人的血浆而不需要任何其它组织,通过定量pcr技术检测血浆mirnas水平提高检测的灵敏度,丰富检测宫颈癌及其癌前病变的手段,提高宫颈癌及其癌前病变的早期发现比例。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
本发明为了发展非侵入式的标志物用于早期检测宫颈癌及其癌前病变,评估早期宫颈癌病人和健康对照人群中的血浆mirnas的表达水平找到差异mirnas,扩大样本验证差异mirnas,通过生物信息学方法构建分类器判断受试者的宫颈癌及其癌前病变风险。
具体地说,本发明解决问题的技术方案包括:(1)以标准操作程序采集符合标准的血液样本,系统收集完整的人口学信息和临床信息资料。(2)筛选宫颈癌血浆mirna标志物:选择宫颈癌病例、与病例年龄匹配的健康对照,tlda(taqmanlowdensityarray)芯片检测其血浆mirnas表达量,筛选差异表达mirnas。(3)对已筛选出的宫颈癌候选mirna标志物在大样本人群中进行定量pcr验证,确定宫颈癌血浆mirna标志物。(4)血浆mirna诊断试剂盒的研制:根据宫颈癌血浆mirna标志物在大样本量的宫颈癌及其癌前病变病例、宫颈良性疾病、健康对照和其他组织器官良恶性疾病干扰样本中的定量pcr验证结果,通过生物信息学方法构建分类器对宫颈癌及其癌前病变进行诊断,开发mirna辅助诊断试剂盒,实现宫颈癌及其癌前病变早期诊断的目的。
以下是本发明的进一步说明:
实施例1、宫颈癌及其癌前病变血浆mirna检测试剂盒的研制
一、样品的收集和样品资料的整理
本申请的发明人以标准操作程序采集符合标准的血浆样本,系统收集完整的人口学资料、临床资料等,通过对样品资料的整理,发明人从中选择了707人的血浆样本作为mirna芯片检测和后续一系列qrt-pcr验证的实验样品,这707人包括112例宫颈癌患者、101例宫颈癌前病变患者、185例宫颈良性疾病患者、242例健康对照以及67例其他组织器官良恶性疾病患者。
宫颈癌及其癌前病变组的入选标准为:经病理学明确诊断的初诊、未经治疗的宫颈癌及其癌前病变患者,并且采血前未经过手术和放化疗且无手术前放化疗。
健康对照组的入选标准为:无肿瘤疾病史的健康对照人群。
宫颈良性疾病组的入选标准为:患有宫颈炎、子宫肌瘤、子宫内膜息肉、子宫腺肌病等良性病变中的至少一种的宫颈良性疾病的患者。
其他组织器官良恶性组的入选标准为:患有结直肠炎、息肉等结直肠良性病变,胃息肉和胃炎等胃良性疾病,肺炎、肺结核、肺错构瘤等肺良性疾病;经病理学明确诊断的初诊、未经治疗的肺癌、结直肠癌、食管癌、胃癌患者,并且采血前未经过手术和放化疗且无手术前放化疗。
本研究共采用707例符合标准的样本进行研究。
二、发现阶段
选取12例宫颈癌病例和8例年龄匹配的健康对照血浆样本进行taqmanlowdensityarray(tlda)芯片(thermofisher公司)检测进行检测,具体步骤为:
(1)使用mirneasymini试剂盒(qiagen,217184)提取12例宫颈癌患者和8例健康人血浆总rna,提取前在血浆中加入一定浓度的合成的ath-mir159a;
(2)利用microrna反转录试剂盒(thermofisher,4366596),加入反转录引物(thermofisher,4444750)进行反转录得到cdna。
(3)加入mastermix(thermofisher,4440049)及预扩增引物(thermofisher,4444750)对芯片特异性的mirna进行预扩增以增加表达所需的cdna的量。
(4)在taqmanhumanmicrornaarrayv3.0(thermofisher,4444913)上加入mastermix(thermofisher,4440049)进行定量pcr反应。利用abi7900ht荧光定量pcr仪,选择384-welltaqmanlowdensityarray特定的程序进行反应。
(5)数据分析与处理:根据芯片的结果,通过ct值在35及其以下在宫颈癌和对照中检出率80%以上对758种mirnas进行质控从而获得111种mirnas。mirnas的不同表达水平以2^(-δct)表示,其中δct=c样本-ct参照,以血浆中稳定表达的hsa-mir-16作为参照进行标准化来计算相对表达量。根据上述tlda结果选择满足在两组的倍数差异达2倍且统计学差异小于0.05的mirnas(表1),包括hsa-mir-625-3p、hsa-mir-1274a、hsa-mir-26b、hsa-mir-484、hsa-mir-574-3p、hsa-mir-191、hsa-mir-1274b和hsa-mir-146b。
表18个候选宫颈癌mirna标志物在tlda芯片中的表达差异
注:“倍数变化”是指mirna在宫颈癌组中的表达水平与其在健康对照组中的表达水平的比值。
(6)结合文献调研确定宫颈癌候选mirna标志物。同时通过对文献调研,hsa-mir-20a在多篇研究中报道与宫颈癌诊断、转移相关,同时在上述tlda芯片检测中也具有一定的差异(倍数变化为1.76,p值为0.319),因此也将其纳入作为候选标志物进行验证。
三、初步验证阶段
在初步验证阶段,采用实时荧光定量pcr方法在170例健康对照、48例宫颈癌前病变和22例宫颈癌早期样本中利用实时荧光定量pcr方法对9个候选mirnas和外参ath-mir-159a、内参hsa-mir-16,同时在验证阶段加入了另一常用来作为血浆mirna的内参hsa-mir-1228验证,具体步骤如下:
(1)提取血浆总rna:分别提取170例健康对照、48例癌前病变和22例宫颈癌早期样本样本血浆总rna,提取前在血浆中加入一定浓度的合成的ath-mir159a。
(2)反转录得到cdna:利用反转录试剂盒(thermofisher,4366596),加入反转录引物(表2)的混合物进行反转录得到cdna。
表2mirna序列及反转录引物序列
(3)定量pcr反应:取稀释后的cdna,加入基因表达mastermix(thermofisher,4440046),加入扩增上下游引物及探针(表3)进行定量pcr反应。仪器使用的是abi7900ht荧光定量pcr仪。
表3qpcr引物及探针序列
(4)数据分析和处理:
根据qrt-pcr的结果,首先通过mirnas在总体样本中的表达水平进行质控,需满足在80%以上的样本中的ct值小于35,发现验证的9个mirna在总体样本中ct值小于35的检出率都大于80%,符合质控标准。
样本血浆mirna的表达量比值可用方程2-δct表示,其中δct=ct样本-ct参照,以非人源的外掺入的ath-mir159a和血浆中稳定表达的hsa-mir-1228、hsa-mir-16三者的表达量均值作为参照基因,计算相对表达量。
结果如表4所示,在荧光定量pcr验证阶段,tlda芯片筛选出的9个mirnas在早期宫颈癌及其癌前病变组和健康对照组间差异都较为显著,因此确定这9个mirnas作为宫颈癌及其癌前病变mirna标志物。
表4qrt-pcr验证中差异表达的mirnas的表达情况
注:“倍数变化”是指mirnas在宫颈癌及其癌前病变组中的表达水平与其在健康对照组中的表达水平的比值。
对上述荧光定量pcr验证样本(170例健康对照、48例癌前病变和22例宫颈癌早期样本)中,采用k近邻(k-nearestneighbors,knn)方法建立模型,评价这12个mirnas的组合对于数据集样本进行宫颈癌及其癌前病变诊断的诊断价值。
k近邻分类算法的原理如下:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。在建模过程中,分类决策规则往往是多数表决,即由输入实例的k个最临近的训练实例中的多数类决定输入实例的类别。
构建模型前,首先把数据集分为两组(170例健康对照样本作为对照组,48例癌前病变和22例宫颈癌早期样本作为宫颈癌及其癌前病变组),进行分层无放回随机抽样,每组抽取70%的样本作为训练集进行建模,剩余30%的样本作为测试集评估模型效果。通过20次随机抽样的方式构建训练集和测试集,以确保k近邻模型的稳定性。
针对上述训练集,采用k近邻方法进行两分类建模(宫颈癌及其癌前病变组与对照组)。k近邻方法首先选取目标样本,然后获取距离目标样本最近的5个样本的类别,距离度量为欧氏距离,最后根据简单多数规则,决定目标样本的类别。该算法遍历训练集中每个样本作为目标样本。模型构建完成后,利用k近邻方法对每组(共20组)测试集中的样本进行预测分析。分别计算每组(共20组)测试集的敏感性与特异性指标,并根据以上两个指标绘制roc曲线。选出受试者roc曲线下面积(auc)最大的模型作为宫颈癌及其癌前病变诊断模型。
应用该模型对整体训练测试集进行预测,统计宫颈癌及其癌前病变组与健康对照组分别的敏感性与特异性。如表5所示,宫颈癌前病变的敏感性为47.9%,说明宫颈癌前病变中47.9%的样本被准确预测为宫颈癌及其癌前病变;宫颈癌早期的敏感性为45.5%,说明宫颈癌早期样本中45.5%的样本被准确预测为宫颈癌及其癌前病变;健康对照组的特异性为95.9%,说明95.9%的健康对照组样本被准确预测为非宫颈癌及其癌前病变。
表5mirna组合对测试集人群中的性能指标分析
四、验证阶段
对独立的467例验证集样本(72例健康对照、185例宫颈良性疾病患者、53例癌前病变、90例宫颈癌患者和67例其他组织良恶性疾病患者)进行12个mirnas的实时荧光定量pcr检测,然后采用上述训练测试集建立的k-近邻模型(即步骤三筛选获得的宫颈癌及其癌前病变诊断模型)进行预测,评价这12个mirnas的组合对于独立验证集中样本的宫颈癌及其癌前病变组早期诊断的诊断价值。验证集中的样本与训练测试集中的样本相互独立。
利用上述训练测试集建立的k近邻模型对独立验证集中的样本进行预测分析,结果如表6所示,该模型对宫颈癌及其癌前病变组敏感性为49.0%,说明宫颈癌及其癌前病变组中49.0%样本被准确预测为宫颈癌及其癌前病变。进一步的,本发明对宫颈癌前病变及不同分期的宫颈癌的敏感性进行了分析,对宫颈癌前病变样本的敏感性为49.1%,对宫颈癌早期样本的敏感性为52.9%,对宫颈癌中晚期样本的敏感性为47.9%。从以上数据可以看出该模型对癌前病变、早期、中晚期宫颈癌的敏感性都较高。同时该模型对健康对照、宫颈良性疾病和其他组织器官良恶性疾病患者的特异性进行了分析,对健康对照组的特异性为84.7%,说明健康对照组中84.7%的实际健康对照样本被准确预测为非宫颈癌及其癌前病变。宫颈良性疾病组特异性为73.0%,说明宫颈良性疾病组中73.0%的样本被准确预测为非宫颈癌及其癌前病变。对其他组织良恶性疾病的特异性为88.1%,说明其他组织器官良恶性疾病组中88.1%的样本被准确预测为非宫颈癌及其癌前病变。从以上数据可以看出,选出的这12个mirnas组合对于宫颈癌及其癌前病变诊断的准确率高;此外,这12个mirnas组合对于宫颈癌及其癌前病变与健康对照、宫颈良性疾病和其他组织良恶性疾病的鉴别诊断也具有极为重要的意义。
表6mirna组合对验证集人群中的性能指标分析
根据上述实验结果,本发明人制备了一种能用于宫颈癌及其癌前病变检测的试剂盒,通过qrt-pcr技术筛选在宫颈癌病例和健康对照中表达量差异程度大一组血浆mirna,作为宫颈癌辅助早期诊断的指标。最后筛选出的与宫颈癌有关的血浆mirna组成辅助诊断试剂盒(hsa-mir-20a、hsa-mir-625-3p、hsa-mir-1274a、hsa-mir-26b、hsa-mir-484、hsa-mir-574-3p、hsa-mir-191、hsa-mir-1274b和hsa-mir-146b)。诊断试剂盒包括hsa-mir-20a、hsa-mir-625-3p、hsa-mir-1274a、hsa-mir-26b、hsa-mir-484、hsa-mir-574-3p、hsa-mir-191、hsa-mir-1274b和hsa-mir-146b的组合引物,探针、以及反转录酶、taq酶、缓冲液、dntp等试剂,以及记载有k-近邻为基础的宫颈癌及其癌前病变辅助诊断模型及其建立方法的可读性载体。
诊断试剂盒可以包括这些血浆微小核糖核酸组合的引物,探针,以及反转录酶、taq酶、缓冲液、dntp等试剂。所述的试剂盒还包含一个记载有k-近邻生物信息学方法建立的预测模型及其建立方法的可读性载体。其中,hsa-mir-20a、hsa-mir-625-3p、hsa-mir-1274a、hsa-mir-26b、hsa-mir-484、hsa-mir-574-3p、hsa-mir-191、hsa-mir-1274b和hsa-mir-146b的表达水平是以非人源外掺入的ath-mir159a和血浆中稳定表达的hsa-mir1228、hsa-mir-16三者的均值作为参照基因检测得到,模型中的检测值在至少一种靶血浆中的表达与在至少一种对照血浆中的表达相比被上调。
<110>博奥生物集团有限公司
<120>一种宫颈癌及其癌前病变检测试剂盒及其应用
<130>gncln181556
<160>48
<170>patentinversion3.5
<210>1
<211>23
<212>dna
<213>artificialsequence
<400>1
gcgtaaagtgcttatagtgcagg23
<210>2
<211>16
<212>dna
<213>artificialsequence
<400>2
gtgcagggtccgaggt16
<210>3
<211>20
<212>dna
<213>artificialsequence
<400>3
cgtgcggccgactatagaac20
<210>4
<211>16
<212>dna
<213>artificialsequence
<400>4
gtgcagggtccgaggt16
<210>5
<211>18
<212>dna
<213>artificialsequence
<400>5
ggcctggtccctgttcag18
<210>6
<211>16
<212>dna
<213>artificialsequence
<400>6
gtgcagggtccgaggt16
<210>7
<211>21
<212>dna
<213>artificialsequence
<400>7
cgcagcttcaagtaattcagg21
<210>8
<211>16
<212>dna
<213>artificialsequence
<400>8
gtgcagggtccgaggt16
<210>9
<211>18
<212>dna
<213>artificialsequence
<400>9
gggctctcaggctcagtc18
<210>10
<211>16
<212>dna
<213>artificialsequence
<400>10
gtgcagggtccgaggt16
<210>11
<211>18
<212>dna
<213>artificialsequence
<400>11
gttcgaccacgctcatgc18
<210>12
<211>16
<212>dna
<213>artificialsequence
<400>12
gtgcagggtccgaggt16
<210>13
<211>19
<212>dna
<213>artificialsequence
<400>13
gctgacaacggaatcccaa19
<210>14
<211>16
<212>dna
<213>artificialsequence
<400>14
gtgcagggtccgaggt16
<210>15
<211>17
<212>dna
<213>artificialsequence
<400>15
gcgggactccctgttcg17
<210>16
<211>16
<212>dna
<213>artificialsequence
<400>16
gtgcagggtccgaggt16
<210>17
<211>22
<212>dna
<213>artificialsequence
<400>17
gcgctgactgagaactgaattc22
<210>18
<211>16
<212>dna
<213>artificialsequence
<400>18
gtgcagggtccgaggt16
<210>19
<211>16
<212>dna
<213>artificialsequence
<400>19
tggatacgacctacct16
<210>20
<211>19
<212>dna
<213>artificialsequence
<400>20
tcgcactggatacgactga19
<210>21
<211>17
<212>dna
<213>artificialsequence
<400>21
ctggatacgactggcgc17
<210>22
<211>18
<212>dna
<213>artificialsequence
<400>22
ctggatacgacacctatc18
<210>23
<211>17
<212>dna
<213>artificialsequence
<400>23
cactggatacgacatcg17
<210>24
<211>20
<212>dna
<213>artificialsequence
<400>24
ctggatacgactgtgggtgt20
<210>25
<211>17
<212>dna
<213>artificialsequence
<400>25
cactggatacgaccagc17
<210>26
<211>17
<212>dna
<213>artificialsequence
<400>26
cactggatacgactggc17
<210>27
<211>18
<212>dna
<213>artificialsequence
<400>27
ctggatacgacagcctat18
<210>28
<211>22
<212>dna
<213>artificialsequence
<400>28
ggacgacagtttggattgaagg22
<210>29
<211>16
<212>dna
<213>artificialsequence
<400>29
gtgcagggtccgaggt16
<210>30
<211>17
<212>dna
<213>artificialsequence
<400>30
ctggatacgactagagc17
<210>31
<211>22
<212>dna
<213>artificialsequence
<400>31
tgactgatctcacacctgcctc22
<210>32
<211>16
<212>dna
<213>artificialsequence
<400>32
gtgcagggtccgaggt16
<210>33
<211>13
<212>dna
<213>artificialsequence
<400>33
gatacgacggggg13
<210>34
<211>20
<212>dna
<213>artificialsequence
<400>34
cgcgctagcagcacgtaaat20
<210>35
<211>16
<212>dna
<213>artificialsequence
<400>35
gtgcagggtccgaggt16
<210>36
<211>16
<212>dna
<213>artificialsequence
<400>36
atacgaccgccaatat16
<210>37
<211>50
<212>dna
<213>artificialsequence
<400>37
gtcgtatccagtgcagggtccgaggtattcgcactggatacgacctacct50
<210>38
<211>50
<212>dna
<213>artificialsequence
<400>38
gtcgtatccagtgcagggtccgaggtattcgcactggatacgactgaggg50
<210>39
<211>50
<212>dna
<213>artificialsequence
<400>39
gtcgtatccagtgcagggtccgaggtattcgcactggatacgactggcgc50
<210>40
<211>50
<212>dna
<213>artificialsequence
<400>40
gtcgtatccagtgcagggtccgaggtattcgcactggatacgacacctat50
<210>41
<211>50
<212>dna
<213>artificialsequence
<400>41
gtcgtatccagtgcagggtccgaggtattcgcactggatacgacatcggg50
<210>42
<211>50
<212>dna
<213>artificialsequence
<400>42
gtcgtatccagtgcagggtccgaggtattcgcactggatacgactgtggg50
<210>43
<211>50
<212>dna
<213>artificialsequence
<400>43
gtcgtatccagtgcagggtccgaggtattcgcactggatacgaccagctg50
<210>44
<211>50
<212>dna
<213>artificialsequence
<400>44
gtcgtatccagtgcagggtccgaggtattcgcactggatacgactggcgc50
<210>45
<211>50
<212>dna
<213>artificialsequence
<400>45
gtcgtatccagtgcagggtccgaggtattcgcactggatacgacagccta50
<210>46
<211>50
<212>dna
<213>artificialsequence
<400>46
gtcgtatccagtgcagggtccgaggtattcgcactggatacgactagagc50
<210>47
<211>50
<212>dna
<213>artificialsequence
<400>47
gtcgtatccagtgcagggtccgaggtattcgcactggatacgacgggggg50
<210>48
<211>50
<212>dna
<213>artificialsequence
<400>48
gtcgtatccagtgcagggtccgaggtattcgcactggatacgaccgccaa50