一种土壤微生物定性与定量的检测方法_4

文档序号:9838657阅读:来源:国知局
或目标微生物存在,而 特征区域的测序片段的数量也代表了目标微生物类群和目标微生物的数量。与其它微生物 定性与定量检测不同,本发明实施例计算了微生物定性与定量的可靠性,同时,增强了结论 的实用性。本发明实施例需要先理清参数间复杂的关系,才能实现任意微生物的定性、定量 检测,并获得可靠的结论,本发明的具体参数及其推算原理见表2。表2中单元格、符号与公 式的定义与Excel 2010相同,其中,单元格"基本参数"为Al,其它单元格参照Al按Excel 2010的规则进行定义。
[0072] 定性分析方法如下:将高通量测序片段与每种目标微生物类群的特征区域进行比 对,当差异碱基数含nl时,则比对成功,相应的高通量测序片段为目标微生物类群的特征区 域,其中,nl为目标微生物类群的特征测序片段的最大容错碱基数;若比对成功的目标微生 物类群的特征区域含1种时,则判断高通量测序片段为目标微生物类群的特征测序片段。
[0073] 将目标微生物的特征区域与每种同源的目标微生物类群的特征区域进行比对,在 目标微生物的特征区域中提取差异碱基组成目标微生物的标准基因型,运里的差异碱基是 指目标微生物的特征区域与任何一个目标微生物类群内的微生物比较,存在差异的碱基的 总和。在目标微生物类群的特征测序片段上,提取目标微生物的标准基因型所对应的碱基, 组成目标微生物的测试基因型;若目标微生物的测试基因型与目标微生物的标准基因型的 差异碱基数含n2,其中,n2为目标微生物的特征测序片段的最大容错碱基数,则目标微生物 的测试基因型所在的高通量测序片段为目标微生物的特征测序片段。特别地,当目标微生 物类群中仅包含了一个目标微生物时,此时的标准基因型和测试基因型的碱基数均为0个, 因此,它们之间的差异碱基数也为0个,则不论n2为多大,均将目标微生物的测试基因型所 在的高通量测序片段判定为目标微生物的特征测序片段。按W上方法,分别获得了目标微 生物类群和目标微生物的特征区域的特征片段数,其结果列于表1。在本实施例中,nl和n2 的值见表2,其推算过程见后。
[0074] nl使得Pl含al且P3含03,其中,Pl为一条不是目标微生物类群的特征测序片段的 高通量测序片段被误判为目标微生物类群的特征测序片段而产生的假阳性的概率;P3为一 条目标微生物类群的特征测序片段被误判为不是目标微生物类群的特征测序片段而产生 的假阴性的概率;Ql和03为判断阔值。
[0075] n2使得P2如2且P4如4,其中,P2为一条不是目标微生物的特征测序片段被误判 为目标微生物的特征测序片段而产生的假阳性的概率;P4为一条目标微生物的特征测序片 段被误判为不是目标微生物的特征测序片段而产生的假阴性的概率;02和a4为判断阔值; 本发明实施例中的各种阔值的大小由现实需要确定,例如,某些病菌危害性极大,漏检(假 阴性)将引起严重的后果,那么,就要控制假阴性,02和a4值要低。若无特殊要求,则采用较 低假阳性与假阴性为原则,本实施例子属于后者,Ql和村取值为0.01%,即大约1万条特征 序列出现1条假阳性或假阴性,其准确性是很高的,之所W可W控制如此高的准确性,是因 为特征序列中的ml值较大,很容易与其它非目标生物区分开,从而将假阳性率与假阴性率 都控制在一个很低的水平。02和a4的取值为0.5%,即大约1千条特征序列出现5条假阳性或 假阴性,可见其准确性很高。Pl=BIN0M.DIST(nl,ml,l-E,TOUE),P2 = BIN0M.DIST(n2,m2, 1-E,T抓E),P3 = 1-BIN0M.DI ST(nl,Ll,E,T抓6),口4=1-81側1.0151'(112,1^2,£,1'抓6),其 中,ml为区分度,具体指用于计算SI的目标微生物类群的特征区域对应的区分度,本实施例 中,ml的值见表1和表2 ;m2为目标微生物的特征区域与目标微生物类群的其它微生物间差 异碱基的最小值,具体指用于计算S3的目标微生物对应的特征区域的m2的值,本实施例中, m2的值见表1和表2;L1为目标微生物类群的特征区域的长度,本实施例子中,Ll的值见表2; L2为目标微生物的标准基因型的长度,本实施例子中,L2的值见表2;E为碱基错误率,其由 测序错误率El和自然突变率E2组成,本实施例中,PROTON高通量测序仪的测序错误率El < 1%,根据我们的调查,微生物小种(如P1-P6白叶枯小种)的参考基因组之间的变异率一般 小于0.5%,而自然突变率是低于小种间的变异率的,因此,自然突变率E2 < 0.5 %,为了本 发明的方法适应性更广,取E2含1%,则本实施例中,E含2%,为了使得本实施例中微生物的 定性与定量的结论正确率的概率更可靠,取E值的最大值2%进行计算。将W上参数值代入 P1和P3的公式中后,将n 1的值从0开始逐渐增加,计算得P1和P3的值,当n 1 = 13时,计算得Pl <口1且口3含〇3,因此,本实施例中,111 = 13(见表2),111 = 13对应的口1和口3的值为本实施例中 Pl和P3的值。按类似的方法,将W上参数值代入P2和P4的公式中后,将n2的值从0开始逐渐 增力日,计算得P2和P4的值,当n2 = 2时,P2如2,P4如4,因此,本实施例中,n2 = 2(见表2),n2 =2对应的P2和P4的值为本实施例中P2和P4的值。
[0076] 将参考微生物作为仅包含一个目标微生物的目标微生物类群,计算获得的目标微 生物的特征测序片段,即为参考微生物的特征测序片段。参考微生物的特征区域的特征片 段数见表1和表2。
[0077] 若目标微生物类群的特征测序片段存在的概率P5含巧,则判断待测样品中存在目 标微生物类群;若目标微生物类群的特征测序片段存在的概率P5<a5,则判断待测样品中不 存在目标微生物类群,其中,a5为概率保障,本实施例中,a5取值为99.99%。口5 = 1-BIN0M.DIST(S1,S1,P1 ,FALSE),S1为所有的目标微生物类群的特征区域的目标微生物类群 的特征测序片段的数量的中位数,在本实施例中,目标微生物类群的第2个特征测序片段的 数量为所有目标微生物类群的特征测序片段的数量的中位数,所W本实施例Sl的值见表1 和表2,将本实施例中Sl的值和Pl的值代入P5的计算公式计算获得P5含巧,因此,判断本实 施例中,待测样品中存在目标微生物类群,FALSE为参数值,BIN0M.DIST函数返回一元二项 式分布的概率。
[0078] 若目标微生物的特征测序片段存在的概率P6含a6,则判断待测样品中存在目标微 生物;若目标微生物的特征测序片段存在的概率P6<a6,则判断待测样品中不存在目标微生 物;日6为概率保障。本实施例中,日6取值为99.99%。P6 = I-BINOM.DIST(S3,S3,P2,FALSE), BIN0M.DIST函数返回一元二项式分布的概率,S3为所有的目标微生物的特征区域的目标微 生物的特征测序片段的数量的中位数,在本实施例中,目标微生物的第2个特征测序片段的 数量为所有目标微生物的特征测序片段的数量的中位数,其对应的S3的值见表1和表2,将 本实施例中S3的值和P2的值代入P6的计算公式计算获得P6含06,因此,判断本实施例中,待 测样品中存在目标微生物。
[0079] 此外,a5和a6均是人们根据实际需要定的,a5和a6均可W相同也可W不同,其区别 取决于实际需要,当要严格控制某种微生物时,巧和a6的取值均较大,反之,a5和a6的取值 均较小。此外,本发明实施例中所有的a值的取值均遵循该原理。
[0080] 定量分析方法如下:目标微生物类群的量Ml=化X S1/S2,其中,化为加入待测样 品中的参考微生物的量,本实施例中,化的值见表2;S2为所有的参考微生物的特征区域的 参考微生物的特征测序片段的数量的中位数,在本实施例中,参考微生物的第2个特征测序 片段的数量为所有参考微生物的特征测序片段的数量的中位数,其对应的S2的值见表1和 表2;将W上参数和通过定性分析获得的Sl的值代入Ml的计算公式中,计算获得Ml值,即待 测样品中,目标微生物类群中的微生物的量为Ml = 14354个。
[0081] 目标微生物类群的量的置信区间为和M12分别为Ml值的置信区间 的下限与上限。Mll=Mlxa-S4/Sl),M12 = MlX(l+S5/Sl),其中,?为假阳性的目标微生 物类群的特征测序片段的数量且S4 = CRITBIN0M(nS,Pl,a9),S5为假阴性的目标微生物类 群的特征测序片段的数量且S5 = CR口BIN0M(S1,P3,a9),其中,a9为概率保障,本实施例中, 曰9取值为99.50%,〇?口81^1函数返回使累积二项式分布大于等于临界值的最小值,115为 计算Sl的目标微生物类群的特征区域的多重扩增引物所扩增的非特征区域的高通量测序 片段的数量,即是指多重引物所扩增的除目标微生物的特征测序片段之外的其它高通量测 序片段。在本实施例中,nS为目标微生物类群中第2个特征区域的多重扩增引物扩增所产生 的非特征区域的高通量测序片段的数量,本实施例中,nS的值见表2。将nS的值和Pl的值代 入S4的公式计算获得S4的值,将本实施例Sl的值和P3的值代入S5的公式计算获得S5的值。 获得Mll和M12公式中所有参数的值后,计算获得本实施例中Mll和M12的值,进而获得Ml的 置信区间,即目标微生物类群的量的置信区间为[14354,14361]。
[0082] 目标微生物的量M2 = MlX S3/S1,将Ml、S3和Sl的值代入上述公式,获得目标微生 物的量M2 = 3136个。
[0083] 目标微生物的量的置信区间为[M21,M22],M21和M22分别为M2值的置信区间的下 限与上限;M21=M2 X (1-S6/S3),M22=M2 X (1+S7/S3);其中,S6为假阳性的目标微生物的 特征测序片段的数量且S6 = CRITBIN0M(S1,P2,al〇),S7为假阴性的目标微生物的特征测序 片段的数量且S7 = CR 口 8抑01(53,口4,〇10),其中,〇10为概率保障;〇?口8抑01函数返回使累 积二项式分布大于等于临界值的最小值。本实施例中,QlO取值为99.50%,将本实施例Sl和 S3的值,W及P2和P4的值代入S6和S7的计算公式,计算得到S6和S7的值。进一步将S6、S7、M
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1