通过质谱术和分数规整识别微生物的方法

文档序号:6497446阅读:224来源:国知局
通过质谱术和分数规整识别微生物的方法
【专利摘要】本发明涉及通过微生物的质谱从由一组参考数据表示的参考微生物中识别微生物,所述识别包括:根据质谱确定微生物的一组数据;对于每种参考微生物,计算所确定的一组数据和参考的一组数据之间的距离,根据关系式计算概率f(m):其中:m为针对参考微生物计算的距离;N(m|μ,σ)是针对m,当微生物是参考微生物时,模拟待识别的微生物和参考微生物之间的距离的随机变量的值;是针对m,当微生物不是参考微生物时,模拟待识别的微生物和参考微生物之间的距离的随机变量的值;及p是在0到1的范围内的标量。
【专利说明】通过质谱术和分数规整识别微生物的方法
【技术领域】
[0001]本发明涉及通过质谱术识别微生物,尤其是细菌。
现有技术
[0002]已知使用质谱术来识别微生物,尤其是细菌。制备微生物的样本,在此之后获取和预处理样本的质谱,特别是消除基线和消除噪声。然后,检测预处理的频谱的峰值,且这样获得的峰值的列表利用从峰值列表构建的知识库的数据,通过分类工具被“分析”和“比较”,所述每一个峰值列表与已识别的微生物或微生物群(血统、类、族等)相关。
[0003]在分类工具中,“一对多”类型的SVM( “Support Vector Machine”)分类是已知的(以下简称“SVM-UTC”)。“一对多” SVM分类包括对于类的集合的每一类对象,确定将该类与集合中的其他类分开的定向边界。如此获得与集合中的类一样多的“一对多”分类符。未知对象的识别则包括通过计算未知对象和与所述分类符相关联的边界之间的代数距离来查询每个分类符。通常,未知对象被确定为属于与最大计算出的距离相关联的类。
[0004]这个原理被示意性地示于图1和图2,其中示出了能够仅由质谱中的两个峰值识别的3种微生物的非常简单的情况,例如3种微生物的质谱的最高强度的两个峰值。第一微生物的特征在于位于值mn的第一峰值和位于值m12的第二峰值(图1A),第二微生物的特征在于位于值Hl21的第一峰值和位于值Hl22的第二峰值(图1B),而第三微生物的特征在于位于值Hl31的第一峰值和位于值Hl32的第二峰值(图1C)。
[0005]SVM-UTC分类包括,首先,获得每种微生物的一组训练质谱和确定每个质谱中的两个有关的峰值的位置,以形成一组训练矢量
【权利要求】
1.一种识别微生物的方法,用于通过质谱术从一组预定的参考微生物中识别微生物,每一种参考微生物由一组参考数据表不,所述方法包括: 根据待识别的微生物的质谱测量结果,确定表示所述微生物的一组数据;及对于每种参考微生物,计算所确定的一组数据和所述参考微生物的所述一组参考数据之间的距离, 所述方法特征在于该方法包括:根据以下关系式计算所述待识别的微生物为所述参考微生物的概率:
2.根据权利要求1所述的识别方法,其特征在于随机变量N(m|μ,σ )和是高斯随机变量,且具有分别等于μ和只的平均值,及分别等于σ和‘斤的标准差。
3.根据权利要求2所述的识别方法,其特征在于,所述概率根据以下关系式计算:
4.根据权利要求2或3所述的识别方法,其特征在于,如果逻辑关系式
5.根据权利要求2或3所述的识别方法,其特征在于,如果逻辑关系式
6.根据前述任一项权利要求所述的识别方法,其特征在于,标量P对于所有参考微生物是相同的。
7.根据权利要求6所述的识别方法,其特征在于,标量P等于1/N,其中N是所述一组参考微生物的数目。
8.根据权利要求1至6中的任一项所述的识别方法,其特征在于,标量P等于0.5。
9.根据前述任一项权利要求所述的识别方法,其特征在于,对质谱的确定和对所获取的质谱和每种参考微生物之间的距离的计算实施矢量分类算法。
10.根据权利要求9所述的识别方法,其特征在于: 确定所述微生物的质谱包括: 获取所述微生物的至少一个质谱; 检测至少一个所获取的质谱中的峰值并将所检测到的峰值转换为预定的矢量空间中的矢量, 以及,所述方法特征在于对所述微生物和每种参考微生物之间的距离的计算包括计算所确定的矢量和边界之间的代数距离,所述边界将所述矢量空间划分为表征所述参考微生物的第一子空间和表征其他参考微生物的第二子空间。
11.根据权利要求9或10所述的识别方法,其特征在于参考微生物的所述边界是通过“支持矢量机”型的算法和对应于所述参考微生物的一组矢量来计算的。
12.根据权利要求9、10或11中的任一项所述的识别方法,其特征在于,所述矢量是通过识别在所述质谱的质量-电荷比的范围中的预定的细分的每个区间内的至多一个峰值来计算的。
13.根据前述任一项权利要求所述的识别方法,其特征在于,对所述质谱的确定和对所获取的质谱和每种参考微生物之间的距离的计算实施容差距离算法。
14.根据前述任一项权利要求所述的识别方法,其特征在于所述方法包括: 将每个概率f(m)与预定的阈值进行比较;及 如果所有概率f (m)比所述阈值小,则确定所述待识别的微生物不对应于所述参考微生物中的任何一种。
15.根据权利要求14所述的识别方法,其特征在于,所述阈值等于60%。
16.一种用于通过质谱术识别微生物的装置,包括: 质谱仪,其能够产生待识别的微生物的质谱; 计算单元,其能够通过实施根据前述任一项权利要求所述的方法来识别与由所述质谱仪产生的所述质谱相关的微生物。
【文档编号】G06K9/00GK104040561SQ201280058681
【公开日】2014年9月10日 申请日期:2012年11月30日 优先权日:2011年12月2日
【发明者】格里高利·施特鲁贝尔, 莫德·阿尔萨克, 丹尼斯·戴瑟利, 皮埃尔-吉恩·科特-帕塔特, 皮埃尔·马希 申请人:生物梅里埃有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1