一种鉴别结直肠癌的试剂盒及其应用的制作方法

文档序号:21278585发布日期:2020-06-26 23:26阅读:456来源:国知局
一种鉴别结直肠癌的试剂盒及其应用的制作方法
本发明属于基因检测领域,具体涉及一种鉴别结直肠癌的试剂盒及其应用。
背景技术
:在人类常见的各种类型癌症中,据《cancerincidenceandmortalityinchina,2014》发表数据统计,结直肠癌发病率为17.2/105,位列肿瘤发病率第五位(前四分别为肺癌、乳腺癌、胃癌、肝癌)。同时,结直肠癌是也最常见的死亡原因之一,据统计,每年死于结直肠癌人数达六十多万。结直肠癌的发生涉及进行性的肠道菌群结构改变、分子遗传学改变、相关的组织形态学改变,是一个机体内因与环境等外部因素交互作用的多因素过程。其又是一个多步骤、多途径的过程。其癌前病变包括炎症性肠炎,异常隐窝病灶,腺瘤,幼年性息肉病,锯齿状病变等,其疾病发展期可长达10年,早期患者无任何明显症状,常不会主动就医,而出现明显临床症状再去就医时,往往已经错过最佳检测时机。不仅如此,传统的检测方法(如便潜血、指检、肿瘤标志物等)灵敏度欠佳,很难检测早期肠癌的变异信号,而肠镜检测前期准备繁琐,侵入性强,无症状人群肠镜检测率低于1%。鉴于此,结直肠癌的辅助诊断至关重要,而方便、无创、居家型结直肠癌辅助诊断检测产品,更易被无症状人群所接受。已有研究发现,结直肠癌患者肠道菌群与健康者肠道菌群结构存在明显的差异,人体肠道内微生物与结直肠癌的发生密切相关。肠道菌群参与结直肠肿瘤发生发展,其机制可能有以下几个方面:某些肠道内微生物的产物可直接损伤肠道黏膜并使其发生不完全修复;某些肠道细菌产生的过氧化物也可促发结直肠癌的发生;某些肠道微生物通过直接或间接方式引起肠道上皮细胞发生基因突变,从而诱导结直肠癌的发生。因此,筛选适合的指示菌作为标志物,采用试剂盒的形式来进行结直肠癌的辅助诊断是一条新的路线。且在现有技术当中,常常使用大便隐血检测结果来对是否患有结直肠癌进行判断,然而,其判断结果并不完全准确,经常需要结合肠镜来进一步检查,而肠镜对于检测者自身身体素质要求较高,且比较痛苦。技术实现要素:为了克服现有技术所存在的上述缺陷,本发明的目的之一在于提供一种鉴别结直肠癌的试剂盒。为了实现本发明的目的之一,所采用的技术方案是:一种鉴别结直肠癌的试剂盒,所述试剂盒中包括如下组分:快速鉴别指示菌的特异性引物组合;所述引物组合如seqidno.1-12所示;其中,所述的指示菌为对具核梭杆菌(f.nucleatum)、厌氧消化链球菌(p.anaerobius)、共生梭菌(c.symbiosum)、粪肠球菌(e.faecalis)、不解糖卟啉单胞菌(p.asaccharolytica)、唾液链球菌(s.salivarius)的组合。在本发明的一个优选实施例中,所述试剂盒当中还包括:样品收集和、或采集装置(如收集盒,采集管,口罩和手套等);pcr反应预混液;水。注:引物名称以基因对应的外显子编号命名;f代表上游引物,r代表下游引物。本发明的目的之二在于一种利用所述种试剂盒的应用,所述应用为后期开发用于辅助诊断结直肠癌的装置。本发明的有益效果在于:开发了一款居家、无创、灵敏度高的结直肠癌辅助诊断产品。只需采集粪便样本就可进行结直肠癌的风险预测。其原理是通过检测粪便中的结直肠癌致病菌,其风险评估灵敏度可达92%,特异性为95%。附图说明图1为现有技术的逻辑参考图。图2为本发明的逻辑参考图(1)。图3为本发明的逻辑参考图(2)。图4为本发明的逻辑参考图(3)。图5为本发明的逻辑参考图(4)。具体实施方式本发明的方法包含如下步骤:1.粪便样本采集:粪便样本采样盒中包括:使用说明书、健康问卷/知情同意书、一次性粪便收集盒、粪便采集a管、粪便采集b管、一次性塑料袋、一次性口罩、一次性手套、自封管、封口贴等。采集步骤:1)正确填写健康问卷/知情同意书;2)取出粪便收集盒,撕下背胶,套入塑料袋;3)将盒子粘贴到马桶上;将粪便排泄到粪便收集盒中;4)粪便采集a管取样:(取样前戴好手套和口罩)使用管盖上的勺子取样(约5勺粪便)至保存液中,后用力拧紧管盖;5)粪便采集b管取样:使用管盖上的勺子采集一勺粪便至采样b管,后拧紧管盖;6)将a和b两只取样管分别装入自封口带,封号袋口,与健康问卷/知情同意书一起装入盒中;7)将塑料袋系紧,丢弃污物箱,将手套和粪便收集盒丢弃至垃圾箱。8)用封口贴将采样盒封好待检测。2.粪便样本细菌基因组dna提取dna提取试剂盒组成见天根生化科技(北京)有限公司的《细菌基因组dna提取试剂盒说明书》2.1取粪便样本1~2g,向样本中加入200μl缓冲液ga,振荡或者吹吸至样本彻底悬浮;2.2向管中加入20μlproteinasek溶液,混匀;2.3加入220μl缓冲液gb,振荡15sec,70℃放置30min,溶液应变清亮,简短离心以去除管盖内壁的水珠;2.4加220μl无水乙醇,充分振荡混匀15sec,此时可能会出现絮状沉淀,简短离心以去除管盖内壁的水珠;2.5将上一步所得溶液和絮状沉淀都加入一个吸附柱cb3中(吸附柱放入收集管中),12,000rpm(~13,400×g)离心30sec,倒掉废液,将吸附柱cb3放入收集管中;若无法全部离心下去,将cb3柱中的液体全部移出去,并加入220μl无水乙醇吹吸2~3次后,至于离心机中离心,再将所得溶液和絮状沉淀都加入一个吸附柱cb3中,重新过柱吸附;2.6向吸附柱cb3中加入500μl缓冲液gd(使用前请先检查是否已加入无水乙醇),12,000rpm(~13,400×g)离心30sec,倒掉废液,将吸附柱cb3放入收集管中;2.7向吸附柱cb3中加入600μl漂洗液pw(使用前请先检查是否已加入无水乙醇),12,000rpm(~13,400×g)离心30sec,倒掉废液,吸附柱cb3放入收集管中;2.8重复操作步骤8;2.9将吸附柱cb3放回收集管中,12,000rpm(~13,400×g)离心2min,倒掉废液。将吸附柱cb3置于室温放置数分钟,以彻底晾干吸附材料中残余的漂洗液;2.10将吸附柱cb3转入一个干净的离心管中,向吸附膜的中间部位悬空滴加50~200μl洗脱缓冲液te,65℃放置2~5min,12,000rpm(~13,400×g)离心2min,将溶液收集到离心管中;2.11实验废弃物按《上海市医疗卫生机构医疗废物管理规定》与《实验室医疗废弃物处理操作规程》3.结直肠癌相关指示菌检测3.1本申请当中优选的引物组合序列见表1(seqidno.1-12);表13.2指示菌检测3.2.1将质检合格的粪便样本细菌基因组dna样本稀释至30ng/ul3.2.2qpcr反应体系见表2;表23.2.3qpcr反应程序见表3;表34.数据分析目标肠道菌相对丰度计算通过16srrna进行标准化,即δct=cttaget-ct16srrna。5.大便隐血检测(胶体金法)5.1将大便隐血检测试剂盒(胶体金法)检测试剂条及b管样本提前平衡至室温;5.2每个样本准备一个样本处理管,并在处理管中加入600ul蒸馏水;5.3用取样棒随机从粪便样本的不同部位取样,取样量以沾满取样棒前端的小圆环为准,将样本在处理管中搅拌均匀,使样本与蒸馏水完全混合;5.4将检测试剂条加样的一端竖直进入样本混合液中,注意不能浸没试剂条max线以上,浸入15秒后取出试剂条水平放于桌面上;5.5在3~5分钟内观察结果、记录并拍照。6.结直肠癌风险评估根据粪便中6种肠道菌检出丰度及大便隐血检测结果,使用支持向量机算法评估结直肠癌风险,具体的检测步骤如下:步骤一:规范输入参考集数据文件格式为csv格式;步骤二:读取数据,筛选需要使用的指标,选择δct值作为基础数值,选择指示菌与fit(拟合)指标的组合作为指示指标;步骤三:在所有参考样本中,取70%的样本作为训练集,剩下的作为验证集;步骤四:选择支持向量机方法,初始化分类器;步骤五:使用训练集进行支持向量机算法的参数选优和训练;所述参数包括:核函数、惩罚系数、gamma值;步骤六:使用上一步选优得到的包括核函数、惩罚系数、gamma值的参数和相应的模型,利用验证集里的特征数据进行预测,得到验证集的预测结果;步骤七:根据验证集的预测结果和真实结果对比,计算出本方法的敏感度和特异性,再根据使用场景进行敏感度和特异性的调整;步骤八:按照规范输入待检测样本的数据文件,用上述通过指示菌和核函数、惩罚系数、gamma值优选后的方法进行分析,输出结直肠癌风险结果文件和检测报告。实施例1:svm算法(支持向量机)判断准确性高于人工判读方法检测粪便中9种肠道菌丰度和大便隐血检测结果,对结直肠癌风险评估和诊断中的应用。1材料与方法1.1样本来源通过合作关系收集2017年1月1日到2018年6月30日辽宁省肿瘤医院肛肠科结直肠癌患者粪便样本两例,分别标记为样本一和样本二。1.2标本提取使用粪便收集盒,撕下背胶,套入塑料袋;将盒子粘贴到马桶上,将粪便排泄到粪便收集盒中;采样勺子取样(约5勺粪便)至粪便保存管中,后用力拧紧管盖;将粪便保存管装入自封口带,-80℃保存备用。用天根细菌基因组dna提取试剂盒(dp302)提取样本中的细菌基因组dna,-20℃保存备用。1.3合成pcr扩增引物利用生物信息学知识和dnastar等相关生物信息学软件,对genbank数据库中所能检索到的粪便中9种肠道菌基因核酸序列进行基因序列比对分析,选定目标区域的特异性序列,设计出针对粪便中9种肠道菌及内参16srrna的相应特异性基因片段的pcr引物(见表4)。表4引物序列注:引物名称以基因对应的外显子编号命名;f代表上游引物,r代表下游引物。1.4准备混合pcr引物工作液(1)合成的每个pcr引物分别用双蒸水配制成100μmol/l的储存液;(2)将引物配对并分为10组,每组1对引物,第一组为引物组合i:分别取f.nucleatum-f,f.nucleatum-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液i;第二组为引物组合ii:分别取p.anaerobius-f,p.anaerobius-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ii;第三组为引物组合iii:分别取c.symbiosum-f,c.symbiosum-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液iii;第四组为引物组合ⅳ:分别取e.faecalis-f,e.faecalis-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅳ;第五组为引物组合ⅴ:分别取p.asaccharolytica-f,p.asaccharolytica-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅴ;第六组为引物组合ⅵ:分别取s.salivarius-f,s.salivarius-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅵ;第七组为引物组合ⅶ:分别取e.faecalis-f,e.faecaliss-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅶ;第八组为引物组合ⅷ:分别取e.rectale-f,e.rectale-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅷ。第九组为引物组合ⅸ:分别取f.prausnitzi-f,f.prausnitzi-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅸ。第十组为引物组合ⅹ:分别取16srrna-f,16srrna-r对应的pcr引物储存液各10μl加入到同一1.5mleppendorf管中,再加入80μl的双蒸水即为混合pcr引物工作液ⅹ。1.5pcr扩增反应:(1)pcr反应体系:pcr扩增反应体系为20μl,其中包括2×qpcrsybrgreenmastermix10μl,混合pcr引物工作液i(或混合pcr引物工作液ii或混合pcr引物工作液iii或混合pcr引物工作液ⅳ或混合pcr引物工作液ⅴ或混合pcr引物工作液ⅵ或混合pcr引物工作液ⅶ或混合pcr引物工作液ⅷ或混合pcr引物工作液ⅸ或混合pcr引物工作液ⅹ)1μl,样本(dna)30ng,补ddh2o至终体积为20μl;(2)pcr反应程序:95℃30sec→95℃5sec、60℃34sec、(40个循环)→95℃15sec、60℃60sec(熔解曲线)→4℃保温。1.6数据分析目标肠道菌丰度计算采用扩增曲线阈值线(ct)计算法,通过16srrna进行标准化,即δct=ct16srrna-cttaget1.7大便隐血检测(胶体金法)将大便隐血检测试剂盒(胶体金法)检测试剂条及b管样本提前平衡至室温;每个样本准备一个样本处理管,并在处理管中加入600ul蒸馏水;用取样棒随机从粪便样本的不同部位取样,取样量以沾满取样棒前端的小圆环为准,将样本在处理管中搅拌均匀,使样本与蒸馏水完全混合;将检测试剂条加样的一端竖直进入样本混合液中,注意不能浸没试剂条max线以上,浸入15秒后取出试剂条水平放于桌面上;在3~5分钟内观察结果、记录并拍照。2.结直肠癌风险评估2.1使用人工判读评估结直肠癌风险:根据粪便中9种肠道菌检出丰度及大便隐血检测结果,使用人工判读评估结直肠癌风险,判读标准及等级划分为:(1)低级风险:便潜血结果和9个指示菌结果全阴性(2)中低级风险:便潜血结果阴性,1-3个指示菌结果阳性(3)中级风险:便潜血结果阳性且≤3个指示菌结果阳性或者便潜血阴性,且≥4个指示菌结果阳性(4)高级风险:便潜血结果阳性,并且≥4个指示菌结果阳性2.2使用支持向量机算法评估结直肠癌风险:3结果3.1样本一检测结果3.1.1粪便中9种肠道菌相对丰度见表5;表5注:s.salivarius、f.prausnitzii和e.rectale为益生菌,其余7种菌均为致病菌3.1.2大便隐血检测结果:阴性3.1.3结直肠癌风险评估根据人工判读评估结直肠癌风险:中低级风险。根据粪便中肠道菌检出丰度及大便隐血检测结果,使用支持向量机算法评估结直肠癌风险为:高风险,建议进一步做全面检查。表5为样本一粪便中9种肠道菌相对丰度的信息,大便隐血检测结果为阴性,病理信息表示该样本为结直肠癌病人粪便样本。人工判读评估结直肠癌风险为中低级风险。实施例2:采用粪便样本支持向量机方法确定指示菌优选组合1.对粪便进行处理本实施例中具体实验步骤与实施例1中的实验步骤相同。收集健康人和结直肠癌患者的粪便,提取细菌基因组,用16srrna引物进行pcr,扩增曲线阈值线(ct)计算法记录数值。另外进行便隐血检测。2.规范粪便处理结果规范输入参考集数据文件格式,第一列为样本编号,第二列到第十列为指示菌1、指示菌2、指示菌3、指示菌4、指示菌5、指示菌6、指示菌7、指示菌8、指示菌9的δct数值,第十一列至第十九列为指示菌1、指示菌2、指示菌3、指示菌4、指示菌5、指示菌6、指示菌7、指示菌8、指示菌9的人工阴阳性判断结果,第二十列为便隐血结果,第二十一列为样本信息。文件格式为csv格式。3.读取csv文件,筛选指示指标原有的丰度判断方法见逻辑图1。原方法为了方便判断,先对指示菌1、指示菌2、指示菌3、指示菌4、指示菌5、指示菌6、指示菌7、指示菌8、指示菌9分别进行阴阳性判断。但此过程丢失了部分信息,可能会降低检测结果的准确性。而本申请当中最大的不同是:分别基于δct值和阴阳性判断值两种数据类型对各样本进行分析,根据结果的准确性选择,确定选择δct值作为指示菌的数据类型。在确定δct值作为指示菌数据类型的基础上,9个指示菌中有部分指示菌指示的效力不好,需要对指示菌组合进行筛选。指示菌1、指示菌2、指示菌3、指示菌4、指示菌5指示效力较高作为核心指示菌,分别与指示菌6、指示菌7、指示菌8、指示菌9进行组合进行分析。如指示菌1、指示菌2、指示菌3、指示菌4、指示菌5、指示菌6为一个组合a;指示菌3、指示菌4、指示菌5、指示菌7、指示菌8、指示菌9为另一个组合b。根据结果准确性,参见表2的结果,综合相对丰度和相对阈值,确定指示菌优选组合为组合a,指示菌1、指示菌2、指示菌3、指示菌4、指示菌5和指示菌6,判断逻辑如逻辑图2。4.划分训练集与验证集取258个已知样本参考集,再随机取其中181个用来训练参数等,77个样本用来验证训练的效果。5.模型优选以及参数调优比较了默认参数的线性回归、支持向量机、以及极致梯度提升的方法,最终选择了准确度较高的支持向量机方法。初始化支持向量机分类器。支持向量机有线性核参数、多项式核函数、高斯径向基函数核(rbf核)参数等,我们选取效力较好的线性核参数、高斯核参数进行网格法进行重要参数优选。第一个重要参数c是惩罚系数,c越大,越不能接受误差,越接近训练集,容易过拟合;反之,c过小,容易欠拟合。将c的设为7个等级。另一个重要参数是g参数(rbf核中的gamma值),g越大,会使高斯分布集中,过于拟合至支持向量,即过拟合,容易出现训练集准确率高但验证集准确率不高的情况;g越小,高斯分布会更分散,模型会更平滑,但是训练集的准确性不容易提高。我们将g设为8个等级。参数c是惩罚系数,c越大,越不能接受误差,越接近训练集,容易过拟合;反之,c过小,容易欠拟合。将惩罚系数c设为7个等级:0.001,0.01,0.1,1,10,100,1000。高斯核的一个重要参数是gamma值,将其设为8个等级:0.00001,0.0001,0.001,0.1,1,10,100,1000。对线性核和高斯核、7个惩罚系数等级和8个gamma值,在他们适用范围内进行网格组合测试,得到最优参数为:c:100,gamma:0.001,kernel:高斯核,判断逻辑如逻辑图3所示。为了进行对比,设置对比参数组合1为c:1000,gamma:1000,kernel:高斯核。设置对比参数组合2为c:1,gamma:0.1,kernel:高斯核。6.使用验证集进行验证使用上一步得到的最优参数,包括最优核(高斯核)、最优惩罚系数(100)和最优gamma值(0.001)和对应的模型,利用验证集里77个样本的指示数据进行预测,得到验证集的预测结果。根据验证集的预测结果和真实结果对比,计算出本方法的敏感度和特异性,再根据使用场景进行敏感度和特异性的调整。本方法准确性统计如下表6。表6方法敏感度特异性支持向量机90%99%7.检测待检测样本按照规范输入待检测样本的数据文件,用上述优选指示菌等指标以及优选核函数优选惩罚系数优选gamma值后的方法进行分析,输出结直肠癌风险结果文件和检测报告。如逻辑图4。将本申请的6个菌的组合作为优选组合a,指示菌3、指示菌4、指示菌5、指示菌7、指示菌8、指示菌9为另一个组合b,通过菌种所涉及的引物组合实施例对比,得到表4的对比数据:表7样本编号优选组合a对比组合b样本实际信息c209阳性阴性肿瘤患者粪便c217阳性阴性肿瘤患者粪便c278阳性阴性肿瘤患者粪便由表7可知,本申请的6种菌的优选组合能够很好的避免假阳性的检查结果。菌种或者引物组合方法准确率对比:将本申请中优选的参数组合和对比参数组合进行对比,数据见表8:表8由表8可知,本申请的优选参数组合能够很好的避免假阳性的检查结果。表9由表9可知,本申请的优选组合敏感度更高,这说明对于比较难以检测的样本,其更容易检测出结果。模型参数组合准确率对比见表10,可见本申请的参数组合的特异性和敏感度均高,这说明本申请的检出率更高,且检出效果更好。表10方法敏感度特异性对比参数组合168%94%对比参数组合281%98%优选参数组合90%99%现有的传统的人工方法经常存在误判问题,本发明的方法与传统人工方法的对比数据见表11。表11由表11可知,本发明的方法能够克服传统人工判断方法当中的误判,从而避免因误判导致的后期需要物理介入的检测方式,且本发明对于患者的影响更小。由表12可知,与人工方法相比,本发明的svm算法更准确,敏感度和特异性更高。表12综上,本发明的主要创新点在于:1.与传统方法相比,基于非侵入性方法-肠道菌检测进行结直肠癌风险筛查;2.基于结直肠癌的数据,优选肠道菌群组合,有效提高判断准确率;节省检测成本;3.svm算法更充分地利用了检测结果信息。以前的风险判断方法是将每一个指示菌按照文献调研等确定的阈值,先行判断阴性阳性,然后计算阳性个数,最后进行风险判断。本算法直接使用δct值,信息分辨率更高。4.基于结直肠癌的数据,优选了数据模型以及核函数、惩罚系数、gamma值。5.svm算法结论更明确,避免了多个指示菌和便潜血的判断对客户的困扰。序列表<110>南京派森诺基因科技有限公司<120>一种鉴别结直肠癌的试剂盒及其应用<130>20200217<160>20<170>siposequencelisting1.0<210>1<211>29<212>dna<213>homosapiens<400>1caaccattactttaactctaccatgttca29<210>2<211>33<212>dna<213>homosapiens<400>2gttgactttacagaaggagattatgtaaaaatc33<210>3<211>25<212>dna<213>homosapiens<400>3agacgaattcaagtcagtaaataca25<210>4<211>22<212>dna<213>homosapiens<400>4ctcctatccaccaggatatcaa22<210>5<211>19<212>dna<213>homosapiens<400>5gtgagatgatgtgccaggc19<210>6<211>20<212>dna<213>homosapiens<400>6taccggttgcttcgtcgatt20<210>7<211>24<212>dna<213>homosapiens<400>7cccttattgttagttgccatcatt24<210>8<211>21<212>dna<213>homosapiens<400>8actcgttgtacttcccattgt21<210>9<211>22<212>dna<213>homosapiens<400>9tcgaccacatagagctaagcac22<210>10<211>21<212>dna<213>homosapiens<400>10tcctcgactttcataccgtct21<210>11<211>20<212>dna<213>homosapiens<400>11ttcgcttcccagagtcaagt20<210>12<211>20<212>dna<213>homosapiens<400>12aaacgaccagccagcaattc20<210>13<211>17<212>dna<213>homosapiens<400>13ggtgaatacgttcccgg17<210>14<211>22<212>dna<213>homospaiens<400>14tacggctaccttgttacgactt22<210>15<211>24<212>dna<213>homosapiens<400>15cccttattgttagttgccatcatt24<210>16<211>21<212>dna<213>homosapiens<400>16actcgttgtacttcccattgt21<210>17<211>20<212>dna<213>homosapiens<400>17aagggaagcaacgctgtgaa20<210>18<211>19<212>dna<213>homosapiens<400>18cggttaggtcactggcttc19<210>19<211>20<212>dna<213>homosapiens<400>19ggaggattgaccccttcagt20<210>20<211>20<212>dna<213>homosapiens<400>20ctggtcccgaagaaacacat20当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1