病原微生物的检测方法及装置的制造方法_2

文档序号:9865967阅读:来源:国知局
位置等。
[0034]在S103中,根据所述运算结果获取每种病原微生物的平均匹配值。
[0035]在此,可以通过(ΧΛ+Χ2Υ2+Χ3Υ3+Χ4Υ4+Χ5Υ5+Χ6Υ6+Χ7Υ7+……+XnYn)/n计算得到每种病原微生物的平均匹配度,其中,X1为病原微生物与其在所述测试宏基因组中所匹配到的第i个微生物的相似度,Y1为病原微生物与其在所述测试宏基因组中所匹配到的第i个微生物的相似的长度,i = l,2,……n,所述η为病原微生物在所述测试宏基因组中所匹配到的微生物的个数。
[0036]在S104中,将所述平均匹配值和所述匹配到的微生物的个数最高的病原微生物确定为所述测试宏基因组的检测结果。
[0037]对于感染病原微生物的测试宏基因组来说,由于病原微生物是该宏基因组的优势种群,因此,平均匹配值和所匹配到的微生物的个数越高,则测试宏基因组所感染的越可能是这种病原微生物。
[0038]需要说明的是,在S104的检测结果确定过程中,若不存在平均匹配值和匹配到的微生物的个数均最高的病原微生物,那么认为该结果为假阳性的,不应当选择该结果。
[0039]以华大基因提供的已确定感染病原微生物的测试宏基因组样本为例,样本类型有DNA和RNA,其中,DNA数据的产生平台是Hiseq2000,RNA数据的产生平台是1n Proton:
[0040]在样本I的检测结果中,取平均匹配值较高且匹配到的微生物的个数较高的组进行分析,发现平均匹配值最高的前两株菌都是支原体(Mycoplasma),且每株菌匹配到的微生物的个数也较高,这与华大基因给出的经过医学生物学验证的检测结果一致。其中,第一株菌为咽支原体(Mycoplasma faucium),其平均匹配值为71.246,平均匹配值之和是156598.3,匹配到的微生物的个数是2198;第二株菌也为支原体(Mycoplasmasalivarium),其平均匹配值为67.972,平均匹配值之和是172443.7,匹配到的微生物的个数是2537;第三株菌是新鞘氨醇杆菌(Novosphingobium Novel FX94ZIM01DR72C),其平均匹配值为65.500,平均匹配值之和是10741.95,匹配到的微生物的个数是164。第一株菌的平均匹配值、平均匹配值之和、匹配到的微生物的个数分别比第三株菌显著高出8.8%、13.578倍、12.402倍,这说明本发明实施例提供的检测方法与生物医学验证的病原微生物实际结果是吻合的,是可行的。
[0041]在样本2的检测结果中,取平均匹配值较高且匹配到的微生物的个数较高的组进行分析,发现平均匹配值且匹配到的微生物的个数较高的前四株病原微生物都是登革热病毒(Dengue virus),这与华大基因给出的经过医学生物学验证的检测结果一致。其中,第一株菌(Dengue virus I)的平均匹配值为122.186,平均匹配值之和是533753373,匹配到的微生物的个数是4368385;第二株菌(Dengue virus 3)的平均匹配值为101.105,平均匹配值之和是307034957,匹配到的微生物的个数是3036801;第三株菌(Dengue virus 4)的平均匹配值为100.675,平均匹配值之和是274624812,匹配到的微生物的个数是2727828 ;第四株菌(Dengue virus 2)的平均匹配值为92.690,平均匹配值之和是297822560,匹配到的微生物的个数是3213107。第一株菌的平均匹配值、平均匹配值之和、匹配的个数分别比第五株菌Aedes fIavivirus的对应值要显著高出35.4%、50.488倍、37.017倍,这说明本发明实施例提供的检测方法与生物医学验证的病原微生物实际结果是吻合的,是可行的。
[0042]在本发明实施例中,通过BLAST运算,得到预设的病原微生物数据库中每种病原微生物与其在测试宏基因组中所匹配到的微生物的平均匹配值及个数,由于病原微生物在测试宏基因组中为优势种群,因此,将平均匹配值及匹配个数最高的病原微生物确定为测试宏基因组的检测结果,检测过程无需序列拼接,简单、高效。
[0043]应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0044]对应于上文实施例所述的病原微生物的检测方法,图4示出了本发明实施例提供的病原微生物的检测装置的结构框图,所述病原微生物的检测装置可以是内置于计算设备或计算设备的应用系统内的软件单元、硬件单元或者是软硬结合的单元。为了便于说明,仅不出了与本实施例相关的部分。
[0045]参照图4,该装置包括:
[0046]输入单元41,将测试宏基因组作为查询序列输入到预设的病原微生物数据库中;
[0047]运算单元42,在所述预设的病原微生物数据库中对所述测试宏基因组进行BLAST运算,得到所述预设的病原微生物数据库中每种病原微生物的运算结果,所述运算结果包括所述病原微生物与其在所述测试宏基因组中所匹配到的微生物的相似性和相似的长度,以及包括所述病原微生物在所述测试宏基因组中所匹配到的微生物的个数;
[0048]获取单元43,根据所述运算结果获取每种病原微生物的平均匹配值;
[0049]确定单元44,将所述平均匹配值和所述匹配到的微生物的个数最高的病原微生物确定为所述测试宏基因组的检测结果。
[0050]可选地,所述装置还包括:
[0051]转化单元,通过FASTX工具箱,将所述测试宏基因组的数据由fastq格式转化为fasta格式。
[0052]可选地,所述装置还包括:
[0053]创建单元,创建所述预设的病原微生物数据库,所述预设的病原微生物数据库中收集的病原微生物包括真菌18S rDNA序列、细菌16S rDNA序列和病毒基因组。
[0054]可选地,所述获取单元43具体用于:
[0055]Mlt (X1Y1+X2Y2+X3Y3+X4Y4+X5Y5+X6Y6+X7Y7+……+XnYn)/n 计算得到每种病原微生物的平均匹配度,其中,X1为病原微生物与其在所述测试宏基因组中所匹配到的第i个微生物的相似度,Y1为病原微生物与其在所述测试宏基因组中所匹配到的第i个微生物的相似的长度,i = l,2,……n,所述η为病原微生物在所述测试宏基因组中所匹配到的微生物的个数。
[0056]所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0057]本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1