一种鉴别酵母或细菌的方法与流程

文档序号:21730228发布日期:2020-08-05 01:24阅读:372来源:国知局
一种鉴别酵母或细菌的方法与流程

本发明涉及微生物学分析领域,尤其涉及微生物的表征,特别是酵母和细菌的鉴别,并且在后者的情况下,鉴别其革兰氏类型以及其发酵或非发酵特性。

有利地,本发明适用于在非生色、非发荧光及无染料的培养基中生长的细菌菌落或酵母的高光谱或多光谱图像的分析。



背景技术:

在致病性微生物领域,微生物的表征优选地包括鉴别其种类和其对抗微生物剂的敏感性(或抗生图(antibiogramme))以确定被该微生物所感染的患者的治疗。为此,在实验室中通常实施复杂的微生物学过程,所述过程通常需要提前知道该微生物的其他特性,尤其是该微生物的界(例如酵母或者细菌),以及在细菌的情况下,知道其革兰氏类型或其发酵特性或非发酵特性。实际上,这些信息使得选择一种适合该微生物的培养基或抗微生物剂以最终确定该微生物的种属或抗生图成为可能。例如,对由申请人所销售的微生物鉴别库的选择是基于该微生物的界(如酵母或细菌)或要鉴别的细菌菌株的革兰氏类型的知识。类似地,用申请人所销售的2系统来确定一种细菌菌株的抗生图是基于根据该菌株的革兰氏类型和发酵或非发酵特性所选的卡。可以根据待鉴别微生物属于酵母还是细菌,使用不同的基质通过maldi-tof质谱法进行鉴别。因此,尽可能早地了解这些信息能够优化所述微生物学过程,尤其能加快后者或者减少所使用消耗品的数量。

这些性质的知识还有助于减少细菌菌株鉴别中的假阳性。例如,在申请人所销售的elitemedium的情况中,对被检测细菌菌株的发酵特性的了解加强了沙门氏菌的鉴别。特别地,发酵性细菌沙门氏菌和非发酵性细菌假单胞菌(pseudomonas)都能使显色底物削弱。如果知道所述细菌是非发酵性的,无需额外的微生物学测试就可以简单地排除沙门氏菌。

这种信息除了表征微生物以指导实验室的微生物学过程外,其还在临床上有用。具体地,细菌菌株的革兰氏分类可用于表征细菌的细胞壁,如肽聚糖百分比,以及可用于细菌分类或作为第一近似值评估细菌对抗生素的敏感性。因此,差异性存在于两类细菌之间:即革兰氏“阳性”细菌和革兰氏“阴性”细菌。同样,人们观察到,非发酵性细菌,即不能分解葡萄糖的细菌,在致病性细菌中占据了特殊位置。确实,其具有对抗生素高水平的天然抗性且涉及许多医院内感染。例如,我们可能会提到铜绿假单胞菌(pseudomonasaeruginosa)和不动杆菌属(acinetobacter)。因此,细菌的发酵或者非发酵特性的快速确定可以更有效地指导一线抗生素治疗,减缓多药抗药菌株的传播。

历史上,通过复杂的技术已经获知上述提及的每种属性(界,革兰氏和发酵性)。例如,一种细菌菌株的革兰氏类型通过称之为“革兰氏染色”的手工技术确定,这种技术包括了大量的手工步骤(固定、染色、媒染、清洗、过染色),继而需要很长时间。因此,现在已经发展出各种各样的技术来自动化检测细菌的革兰氏类型,特别是用于处理大量样品。然而,这些技术本质上依然通过改变细菌或其环境的电磁响应以使其革兰氏类型易于观察。特别地,第一类技术包括使显微镜载玻片上的细菌膜的染色自动化,但是对革兰氏类型的最终决定步骤总还是需要技术人员在显微镜下观察载玻片。因而,这类技术不是全自动的,而且难以自动化。实际上,革兰氏阳性细菌和革兰氏阴性细菌之间的颜色差异可以很微弱,这也解释了为什么依然需要实验室技术人员的干预。第二类技术包括把细菌和一种底物接触,该底物能够被细菌膜上的肽聚糖所引发的酶反应降解。该反应能产生生色团或者荧光团,其浓度可指示革兰氏类型。这通常被称为细菌的显色或荧光“标记”。尽管这类现有技术能够自动化,例如使用恰当设备(如光谱仪或荧光仪)测量生色团或者荧光团的发光强度,然后利用计算机把所测的强度与预先定义的阈值进行比较,但是,它们需要设计特殊的、通常昂贵的生色团或荧光底物。而且,不论使用何种技术,细菌都会改变它们的天然状态(例如它们含有染料,被显色或荧光标记物所标记等等),因而不能再被用于后续表征测试(例如确定抗生图)。

为了确定细菌的发酵或非发酵特征,通常会使用显色培养基,其根据测试细菌菌株的发酵或非发酵特性而改变颜色。例如,“kligler-hajna”测试包括在包含比色指示剂的培养基上培养菌株,所述比色指示剂能够根据ph、乳糖、葡萄糖、硫代硫酸盐和铁离子改变颜色。该培养基可以检测由ph指示剂的比色变化所反映的分解葡糖糖的细菌的发酵特性。我们还可能会提到细菌菌株的三丁酸甘油酯酯酶活性的分析培养基,其可以表征非发酵性革兰氏阴性细菌。



技术实现要素:

本发明的目的是提出一种用于表征微生物的方法,该方法是自动的并且不需要对微生物或其培养基进行标记或染色以确定这些特征。

为此,本发明涉及表征微生物的方法,其包括:

-在390nm-900nm波长范围内,照射所述微生物,该微生物在所述范围内具有天然电磁响应;

-在所述范围内,获取从被照射的细菌反射的或透射通过被照射的细菌的光强度;和

-根据在所述范围内所获取的光强度,确定微生物为酵母或细菌菌株。

本发明中的“天然电磁响应”是指:所述微生物,酵母或细菌菌株,没有被至少在目标波长范围内改变其对照射的电磁响应的元素(染料、色原、荧光原等)所改变。例如,微生物的菌落在非生色非荧光营养培养基中生长,并且照射/获取直接在仍存在于其培养基中的菌落上进行。

换句话说,本发明人发现,在390nm-900nm波长范围内,酵母和细菌“天然地”具有电磁特征,使其能被区分。因此,不需要使用生色或荧光底物或染料。此外,本发明方法是快速的,因为它包括照射、测量光谱以及处理特别是计算机处理光谱。例如,在酵母或细菌水平上对微生物的这种表征能够优化如上所述的实验室微生物学过程。

注意,将微生物表征为酵母或细菌根据获取的光强度直接进行,无需事先确定微生物的种类。尤其是,不必在物种水平鉴别提供了大大简化预测模型的优势,因为预测模型可以被限定在两个类别。

有利地,所述方法适用于包含已生长了微生物菌落的营养琼脂培养基的培养皿。例如,使用含有或怀疑含有酵母或细菌的生物学样品如尿液接种所述营养培养基,然后培养以生长菌落。一旦在所述培养基上检测到菌落,就可以通过本发明的方法对其表征。因此,所述方法无需在培养基接种后进行任何材料转移或添加试剂。例如,通过以规则间隔拍摄培养皿的图像以及采用菌落检测算法来自动检测菌落。

有利地,本发明的方法不基于微生物自发荧光的分析,而基于其反射率或吸收率的分析。特别地,对于高光谱或多光谱图像,照射通常太强以至于不能观察到自发荧光。

在一个实施方案中,所述方法进一步包括检测细菌菌株的革兰氏类型和发酵特性,包括:

-在390nm-900nm波长范围内照射所述菌株的至少一个细菌,所述菌株在所述范围内具有天然电磁响应;

-在所述范围内,获取从被照射的细菌反射的或透射通过被照射的细菌的光强度;和

-根据在所述范围内所获取的光强度来确定所述细菌菌株的革兰氏类型和发酵特性。

换句话说,细菌“天然地”具有其革兰氏类型及其发酵或非发酵特性的电磁特征性特征。因此,本发明的方法包括测量该特征,然后从中提取细菌的发革兰氏类型和发酵特性。特别地,基于390-900nm范围,本发明可以确定细菌菌株是革兰氏阳性、或是革兰氏阴性发酵性、或革兰氏阴性非发酵性的,了解该信息可以例如用于优化上述实验室微生物学过程。

本发明还涉及一种校准用于实施本发明方法的系统的方法,该系统包括:

-照射装置,被配置为用于在390nm-900nm波长范围内照射微生物;

-传感器,被配置用于在390nm-900nm范围内获取从被照射的细菌反射的或透射通过被照射的细菌的光强度;和

-包含计算机存储器和微处理器的计算机单元,所述计算机存储器能够含有用于分析由所述传感器获取的强度的指令,所述微处理器能够执行包含在所述计算机存储器中的分析指令,

所述校准方法包括以下步骤:

-构建学习数据库,其包括在390nm-900nm范围内被照射的细菌和酵母在所述范围的光强度;

-根据所述数据库,利用计算机自动学习酵母或细菌的预测模型;和

-在所述系统的计算机存储器中,存储用于实施所述已学习的预测模型的分析指令。

本发明还涉及一种治疗方法,包括:

-从怀疑感染了酵母或者细菌的患者取得样品;

-检测所述样品存在中的一种或多种微生物,有利地,在琼脂培养基上接种所述样品,培养所接种的培养基以生长微生物菌落以及检测已生长的一种或多种菌落;

-根据在所述范围内获取的光强度,确定所述微生物为酵母或细菌菌株;

-根据所述确定的结果,选择一种或多种抗微生物剂;和

-给患者施用所选的一种或多种抗微生物剂。

附图简述

阅读如下仅作为举例的描述并参照附图(其中相同参考标记指示相同或相似的元件)后将更好地理解本发明,其中

图1是本发明的高光谱系统的示意图;

图2是本发明的多光谱系统的示意图;

图3是图2中的系统中使用的带通滤波器的透射光谱的示例;

图4是使用图1或图2中的系统预测y、gp、gnf、gnn类别的方法流程图;

图5是通过“逐步”法选择区分性光谱通道的方法流程图;

图6是用于学习预测y、gp、gnf、gnn类别的模型的方法流程图;

图7a是说明y、gp、nf、gnn类别的平面预测模型的图;

图7b是说明y、gp、gnf、gnn类别的系统树的分层预测模型的图;

图7c是说明y、gp、gnf、gnn类别的最优树的分层预测模型的图;

图8是描述用于y、gp、gnf、gnn类别的预测模型学习的细菌种类和酵母种类的表;

图9和图10是分别用于cos培养基和tsa培养基的表,描述了用于预测模型的校准和交叉验证的像素数以及光谱;

图11是说明计算加权预测率或“平衡分类率”的图;

图12是说明cos培养基的最优树的主要区分性光谱通道的空间分布的图;

图13是说明cos培养基的最优树的各模型的5个主要区分性光谱通道的空间分布的图;

图14是分别说明cos培养基的最优树的各模型的5个主要区分性通道的图;

图15是说明tsa培养基的最优树的主要区分性光谱通道的空间分布的图;

图16是说明cos培养基的最优树的主要区分性光谱通道的空间分布的图;

图17是分别说明分别与tsa培养基的最优树的第一,第二和第三预测模型相关的12、8和11个主要区分性光谱通道的图;

图18至图20是分别描述系统树的第一,第二和第三预测模型的图,其中每个图的顶部图对应于tsa培养基,每个图的底部图对应于cos培养基。

发明详述

在下文中,符号ai,j表示矩阵a的第i行和第j列的元素。

参照图1,用于表征生长在培养皿琼脂上的酵母或细菌菌落的高光谱系统10包括:

-用于高光谱图像获取的装置12;和

-计算机数据处理单元14,其(例如通过有线或无线连接)连接至所述装置12,以对其进行控制以及接收和处理由所述装置12获取的图像。

所述装置12,例如美国蒙大拿州resonon公司的称为“pikaii”的高光谱成像系统,包括:

-所谓的“高光谱”相机18,其由数字传感器以及光色散元件或光谱仪组成,所述数字传感器包括一个在波长范围为[λmin;λmax]=[390;900]纳米敏感的基本传感器阵列,例如ccd或cmos类型的数字传感器;所述光色散元件或光谱仪用于选择所述传感器要获取的波长;

-物镜20,其用于把要获取其高光谱图像的培养皿22的光学图像聚焦在相机18的数字传感器上;

-前照射装置24,例如由一个或多个卤素灯组成,如2或4个灯,其能够发射[λmin;λmax]范围的光,用于提供对培养皿22的均一前照射。例如,所述照射装置包括发白光的灯;

-后照射装置26,例如由白光led矩阵组成,用以提供在[λmin;λmax]范围的对培养皿22的均一后照射;和

-支架28,其上放置培养i22并允许后者在物镜20前面经过以通过扫描获得培养皿22的完整图像。

因此,可以提供在[λmin;λmax]整个范围的照射。

所述装置12例如被配置为以160微米(空间分辨率估计为300微米)的采样步长以及在[λmin;λmax]范围内1.7纳米的光谱分辨率,获取90毫米×90毫米区域的图像。

因此装置12产生培养皿反射光的数字图像hsi,该图像具有n行和m列,优选地,培养皿22是敞开的(即无盖):

像素的辐射亮度,通常称为“光强度”,在此对应于在曝光时间内入射在相机18传感器的相应基本敏感部位表面上的光量,例如正如数码摄影领域已知的那样。

每个像素radi,j(λ)由培养皿22的辐射亮度的数字光谱组成,该数字光谱对应于不同波长[λmin;λmax]的像素,该数字光谱表示为以下关系式:

其中,δλ是光谱分辨率并且p是属于的正整数。获取波长λmin+p×δλ通常称为术语“通道”。

所述数据处理单元14例如是个人计算机,平板电脑,智能电话,服务器,超级计算机,或更一般地,是基于微处理器、特别是dsp(数字信号处理器)、基于fpga类型的电路、基于组合了这些类型技术的电路等等(被配置用于处理由获取装置12产生的图像hsi)的任何系统。特别地,单元14配备有一组存储器(ram、rom、高速缓存、大容量存储器等等),用于存储由装置12产生的图像、用于执行根据本发明的方法的计算机指令、用于所述执行的参数以及存储中间和最终计算结果。任选地,单元14包括显示屏,用于显示菌落表征、特别是确定所研究菌落的革兰氏类型和/或发酵特性、和/或细菌或酵母特性的最终结果。尽管仅描述了一个处理单元,但是本发明显然适用于由多个处理单元(例如,用于进行图像hsi预处理的相机18内部安置的单元以及用于执行其余处理的在设备12外部的单元)执行的处理。另外,该系统可以补充有接口,该接口允许将与样品有关的数据输入到单元14,特别地,所述数据是当预测依赖于培养基时所使用的培养基的类型,例如通过操作员可用的键盘/鼠标和下拉菜单、条形码/qr码阅读器,读取培养皿上存在的条形码/qr码及包括关于培养基的信息等。

图1中的高光谱系统具有在获取波长方面灵活的优势,因为它可以适用于不同的预测菌落类别的模型,并可以使用大量光谱通道来提高预测准确性。除了价格高之外,这种系统比常规cmos或ccd相机通常具有较低的空间解析度,后者的唯一目的是获取入射在其传感器上的光强度图像。

参照图2,多光谱系统32与高光谱系统10的区别在于相机32,有利地,具有高空间分辨率的cmos或ccd相机,其联结了一组光谱滤波器36,例如,其设置在物镜20的前面且在物镜20和相机传感器32之间。滤波器组36由多个nf单独的带通滤波器组成,每个滤波器被配置为仅透射[λmin;λmax]范围内的范围[λ1;λ2]的光,光谱的半高宽(fwhm)小于或等于50nm,优选小于或等于20nm。以420nm为中心的edmundoptics公司的滤光器为例,图3展示了这类滤波器的透射光谱。例如,组36可以是能容纳达24个不同滤波器的滤光轮,其由单元14控制,单元14通过驱动滤光轮以使滤波器经过相机前面并控制每个滤波器的图像获取。

因此,可以获取多光谱图像hsi(λ),该图像的每个像素radi,j(λ)由培养皿22的辐射亮度的数字光谱组成,对应于由组36过滤的不同光谱带中的像素,所述数字光谱通过以下关系式表示:

其中分别是组36的光谱滤波器的中心波长。

现参照图4中的流程图详述使用所描述的系统用于表征生物学样品(例如尿液、血液、支气管肺泡样品等)中含有的微生物的方法40。具体地,该方法有利地应用在更通用方法内,这种更通用方法使用maldi-tof质谱法(例如由申请人出售的ms)鉴别所述样品中含有的微生物和鉴别所述微生物(例如通过申请人销售的2平台)的抗生图。如已知的,这些技术的每一种都需要根据微生物的类型来选择培养基和/或试剂和/或特定的消耗品。举例来说,通过maldi-tof质谱法对酵母的鉴别有利地涉及在此类技术中使用的基质中使用甲酸。同样,对2平台卡(所述卡含有生长培养基和在抗生图中所测试的一种或多种抗微生物剂)的选择取决于所测试微生物的细菌特性。尤其是,发酵性革兰氏阴性细菌需要一张特殊的卡用于产生其抗生图。

有利地,以下描述的表征方法40从在培养皿上第一次生长起,可以为后续的微生物学过程获取有关微生物的必要信息,特别是知道已经生长的菌落是否是酵母(“y”)或细菌,对于细菌而言,该细菌是革兰氏阳性类型(“gp”)还是革兰氏阴性类型(“gn”),对于革兰氏阴性细菌而言,该细菌是否是发酵性(“gnf”)或非发酵性的(“gnn”)。因此,该方法使得可以预测微生物的类别,即y、gp、gnf或gnn类别。

在该方法的第一步骤42中,将培养皿接种生物学样品,例如取自患者,以在沉积在培养皿中的营养培养基或“培养”基的表面上生长酵母或细菌的菌落。培养基的主要目的是生长所述菌落,并任选地通过限制光扰动来提高表征的准确性。优选地,关于根据反射光强度的革兰氏类型的检测,培养基是不透明的,这增加了检测的精确度水平。特别地,不透明培养基的反射系数ρ小于或等于10%,优选地小于或等于5%,甚至更优选地小于或等于1%。例如,所谓的“cpso”琼脂培养基(“cps”琼脂包含使培养基不透明的sio2),“columbia”琼脂(或“cna”琼脂),含5%绵羊血的columbia琼脂(或“cos”琼脂),man,rogosa,sharpe琼脂(“mrsm”琼脂),巧克力琼脂(“pvx”琼脂),tryptone-soy琼脂(“tsa”琼脂)等。

这种类型的菌落生长是常规的,下面将不再作更详细描述。有利地,它可以由操作员手动实施或者以已知方式使用自动接种机自动实施。有利地,以如下方式进行制备:根据对微生物的表征将菌落隔开,并且使得菌落的区域对应于装置12所获取的图像中的多个像素。这样可以尤其有助于其在所获取图像中的后续识别,因而有助于利用图像处理算法对它们的分割或者有助于由用户从图像中对它们的提取。

一旦菌落生长完成,例如在24、36或48小时之后,优选地打开培养皿,将其放置在支架28上,照射装置24和26被打开并且使用获取装置12(或分别为32),在44中获取培养皿的至少一个高光谱(或分别为多光谱)图像hsi并存储在处理单元14中,其使用计算机处理从获取的图像确定构成菌落的微生物的类型。

在46,单元14任选地开始一个噪声预处理,该噪声预处理由以下的处理操作之一或这些处理操作的任意组合组成:

a.以已知方式,校正相机传感器的噪声,特别是其偏移、空间噪声等;

b.处理寄生反射,尤其是在图像hsi中形成“高光”的镜面反射。例如,阈值处理用于消除那些值大于预定阈值的像素,如大于或等于像素可以取的最大值的三分之二(即,如果像素以0到255之间的8位编码,则大于或等于170);

c.通过将图像hsi除以在所使用细菌类型和琼脂类型不变的波长反射的光强度,来进行比例处理,可以衰减由外部波动(例如照射变化)引起的图像中的变化;

d.如果已获取多个图像hsi,则搜索并消除异常像素值和/或获取的图像平均值。

有利地,在48继续处理,将存储了不同波长的辐射亮度值的预处理图像hsi转换成高光谱或多光谱反射率图像以提取单独由培养皿产生的信号。这使得可以,尤其是,过滤照射源24、26的发射光谱的波动。例如,使用“平场校正”(ffc)类型校正以获得反射率,其还具有校正传感器从像素到像素的响应色散(暗电流色散,增益色散等)的优点。

在高光谱图像的情况下,此转换例如是根据以下关系式的校正:

其中γ(λ)是反射率图像,w是存储在单元14中的高反射率中性物体例如均一反射率大于90%的片(例如所谓的“白色”片或小于10%的灰卡)由照射装置24、26照射的高光谱图像,b是存储在单元14中的低反射率中性物体的高光谱图像,例如遮住物镜20的黑帽的图像,和m(λmin+p×δλ)=1或等于矩阵w(λmin+p×δλ)-b(λmin+p×δλ)的平均值。

类似地,在多光谱图像的情况下,此转换例如是根据以下关系式的校正:

其中w是存储在单元14的高反射率中性物体例如均一反射率大于90%的片(例如所谓的“白色”片或小于10%的灰卡)由照射装置24、26照射的多光谱图像;b是存储在单元14中的低反射率中性物体的多光谱图像,例如遮住物镜20的黑帽的图像,和m(λn)=1或等于矩阵w(λn)-b(λn)的平均值。

在步骤38之后或平行于之前的步骤,在50,单元14执行用于识别细菌菌落例如来自图像hsi(λ)或γ(λ)的算法。可以使用任何常规形状和对象识别算法来提取对应于菌落的图像的区域,称为“col(λ)”。可替代地,该选择可以由操作员手动进行,其在显示屏和指示装置(如鼠标)的辅助下对该区域进行选择。例如,区域col(λ)由属于所述菌落的像素坐标列表组成。所选像素区域存储在单元14。

在52继续所述方法,通过应用预定的决策规则,根据至少一个所述区域col(λ)的光谱来预测菌落微生物的y,gp,gnf或gnn类别,所述决策规则的变体描述如下。具体地,该预测根据所述区域col(λ)的每个像素(i,j)的光谱γi,j(λ)进行。为此,对所述区域col(λ)的每个像素(i,j)进行类别的第一预测,然后对类别的最终预测实施多数结果决定(votemaioritaire)。在第一变体中,使用简单多数结果决定,即最终保留的类别是基于所述区域col(λ)的像素的最大数量像素所预测的类别。在第二种变体中,为了增加类别预测的确定性,使用了合格结果决定(votequalifié),即最终保留的类别是在基于构成区域col(λ)的像素的x%以上的数量所预测的类别,x严格大于50%,优选地大于或等于70%。如果没有任何一个类别满足此条件,则该方法会返回:类别预测缺失。当然,可以使用单个值,例如所述区域col(λ)的光谱集合{γi,j(λ)}(i,j)∈col(λ)的平均光谱γcol(λ),来提供菌落的类别。

利用单元14使用预定的预测规则来发现每个菌落的y、gp、gnf或gnn类别,预测规则的变体描述如下。预测的类别存储在单元14中和/或在屏幕上显示供用户注意。该预测还有利地传递给另一个微生物分析设备用于随后的鉴别步骤和/或形成菌落的微生物的抗生图。

现在将描述不同模型,其基于菌落像素的光谱γi,j(λ)预测y、gp、gnf或gnn类别,尤其是基于监督自动学习(sml:监督机器学习)的预测模型。首先结合图5描述所使用的sml工具,然后预测模型将在下文通过图6和7中所示的学习过程描述。

a.监督机器学习的工具

无论考虑的学习为何,它都始于构建学习数据库。对于每个y、gp、gnf和gnn类别,选择细菌和酵母并将它们均接种在培养皿的琼脂上,培养预定时间,并用如图1所述的系统获取该培养皿的高光谱图像,随后使其处在相同的照射条件下以及波长范围390nm-900nm范围内。像在方法40的步骤46-50中所述的那样,提取在琼脂上生长的菌落的像素,并将其相关光谱存储在学习数据库中。因此,训练数据库包括分别与y、gp、gnf和gnn类别相关的四个光谱集合这些集合每一个为两部分:第一部分称为“校准”,用于适当学习;第二部分称为“交叉验证”,用于对所计算的预测模型的性能进行评估,如现有技术已知的那样。

根据第一优选实施方案,计算机实施的学习(称为“逐步(stepforward)”)用于训练预测模型。这类学习基于最具区分性光谱通道(canauxspectrauxlesplusdiscriminants)的逐步(pasàpas)选择,因而其本质上是简约的并且适合由图2中系统所实施的多光谱应用。

参照图5,学习60从初始化步骤62开始,在初始化步骤62中,选取最大数量r的区分性通道,该数量在1与用于光谱获取的高光谱相机的光谱通道的数量p之间。清空所选的区分性通道的列表l并将候选通道的列表l对超光谱相机通道的集合{λ1,λ2,...,λp}初始化。

在随后的迭代步骤64,通过迭代步骤66,从列表l中r个最具区分性通道逐步填充列表l。更特别地,对于步骤64的给定迭代r,步骤66:

-提取列表l的每个通道λk;

-在68中,针对提取出的通道λk和l列表的通道{λ1,λ2,...,λr-1}确定预测模型

-在70中,计算预测模型的性能标准如交叉验证中光谱的良好分类水平。

然后,在72继续步骤64,鉴别给出了最佳性能标准的预测模型并随后鉴别和列表l中的通道相结合的列表l的最具区分性通道λr。在74,列表l然后用通道λr完成并将后者从列表l中移出用于步骤64的下一迭代r+1。一旦鉴别出r个最具区分性通道,则在74完成学习过程,存储列表l和预测超平面所述预测超平面和后者相关联,即步骤72中鉴别的最后模型。

有利地,在步骤68中计算的预测模型是svm类型(支持向量机)、“一对所有”的,具有线性核和软边缘。此类学习包括,根据校准光谱计算超平面该超平面将类别cl(cl=y,gp,gnf或gnn)与其他类别中一个、两个或三个形成的集合分开,如下所述。例如,通过求解最优化问题来训练所述模型,所述最优化问题是基于针对步骤66中的迭代k和步骤64中的迭代k的下述关系:

约束条件为:

上述表达式中:

-对于属于类别cl或集合的校准光谱γm(λ),等于在迭代k期间与列表l={λ1,λ2,...,λr-1}的光谱通道和从列表l中提取的通道λk相对应的γm(λ)的分量的向量,优选地,是其分量是作为通道值函数的坐标的向量;

和β是维度等于光谱维度的向量,因此维度等于r;

-m是属于类别cl或集合的校准光谱γm(λ)的数量,取值为1到m;

是向量与向量β的标量积,

-ξm和是标量;

-qm∈{-1,1},如果第m个学习光谱与类别cl相关联,qm=1,以及如果第m个光谱与其他类别的集合相关联,qm=-1;和

-c是预定义的标量。

因此,根据以下步骤产生用于预测像素光谱γi,j(λ)为cl类别中成员的模型:

-把光谱γi,j(λ)转换为向量

-计算光谱和超平面之间的距离

-根据距离scl,应用预测类别cl的规则,例如,如果scl的符号为正,则光谱属于类别cl,如果符号为负,则光谱属于集合

根据第二实施方案,学习不是简约的,而是包括同时使用所有通道,因而所得到的预测模型特别适合于使用图1所示系统的高光谱应用。例如,该学习是svm类型、“一对所有”的,具有线性核和软边缘,包括根据校准光谱计算超平面该超平面将类别cl(cl=y、gp、gnf或gnn)与由其他类别的一个、两个或三个组成的集合分开,通过根据以下关系解决最优化问题:

约束条件为:

在这些表达式中:

-γm(λ)是属于类别cl或集合的校准光谱γm(λ);

和β是维度等于校准光谱的维度的向量,因此维度等于p;

-m是属于类别cl或集合的校准光谱γm(λ)的数量,取值为1到m;

-γm(λ).β是向量γm(λ)与向量β的标量积;

-ξm和是标量;

-qm∈{-1,1},如果第m个学习光谱与类别cl相关联,qm=1,以及如果第m个光谱与其他类别的集合相关联,qm=-1;和

-c是预定义的标量。

因此,根据以下步骤产生用于预测像素光谱γi,j(λ)为cl类别中成员的模型:

-计算光谱γi,j(λ)与超平面之间的距离

-根据距离scl,应用预测类别cl的规则,例如,如果scl的符号为正,则光谱属于类别cl,以及如果符号为负,则光谱属于集合

b.训练预测模型的方法

参考图6,如上所述,用于训练预测模型的方法80,在82,开始于构建用于类别y、gp、gnf和gnn的学习数据库。在84,方法80继续,确定预测模型的结构。特别地,两种类型的模型是可能的,分别如图7a以及图6b和6c所示。

第一种类型的预测模型,如图7a所示,包括训练四个“一对所有”类型的预测模型90、72、74、76,即类别y对类别gp、gnf、gnn的预测,类别gp对类别y、gnf、gnn的预测,类别gnf对类别y、gp、gnn的预测,以及类别gnn对类别y、gp、gnf的预测。为此目的:

-通过使用上述关系(6)或(7)所述的学习工具之一,根据所述学习数据库,对每个预测模型进行训练,类别cl等于y、gp、gnf、gnn以及集合由其他三个类组成;

-通过计算(步骤90-96)所述像素的光谱γi,j(λ)分别到超平面或到超平面的距离sy、sgp、sgnf、sgnn,获得像素的革兰氏类型和发酵特性的预测(图3中的步骤52),然后在88,根据所计算的距离确定像素的类别。特别地,保留的类别是与最大距离相对应的类别。

根据图7a中所示的第一种结构类型,称为“平面”,类别y、gp、gnf和gnn被认为具有同等重要性,因此鉴别误差也同样。例如,鉴别酵母y而不是细菌gnn与鉴别细菌gnf而不是细菌gnn一样重要。根据图7b中所示的结构,根据系统发育分类树来组织预测模型,因而,不同类别不再需要以同等重要性考虑以及可以引入先验信息,即可能影响光谱的形状的进化信息。更具体地,此预测模型树包括:

-第一模型100,其区分酵母y与细菌gp、gnf、gnf;

-第二模型102,其区分细菌gp与细菌gnf和gnn;和

-第三模型104,其区分细菌gnf与细菌gnn。

以上述关于关系式(6)或(7)的方式获得模型100-104的每个模型,因此,对像素光谱γi,j(λ)为类别y、g、gnf和gnn中一个的成员的预测包括计算其到第一模型100的超平面的距离sy,如果该距离的符号为正,则预测为类别y。否则,计算到第二模型102的超平面的距离sgp,如果该距离的符号为正,则预测为类别gp。否则,计算到第三模型104的超平面的距离sgnf,然后预测为类别gnf。否则,将预测为类别gnn。

尽管与图7a所示的平面预测结构相比,表型模型可以提高预测准确性,但发明人注意到,表型树不一定是给出更好结果的树。特别地,基于在其上生长将要表征的微生物的培养基(所述培养基影响光谱的形状),可以优选一个树。优选地,如图7c所示,根据校准光谱确定最优预测结构。更具体地,在第一步中,如上所述方式计算四个预测模型:a)y对gp、gnf和gnn,b)gp对y、gnf和gnn,c)gnf对y、gp和gnn,以及d)gnn对y、gp和gnf并将具有最佳预测性能的模型保留为最优树的第一模型110。在第二步中,移出第一模型的类别,并计算与其余类别相对应的三个预测模型。例如,如果第一模型对应于类别gnn,则如上所述,第二步的三个模型是:a)y对gp和gnf,b)gp对y和gnf,以及c)gnf对y和gp。然后,将三个模型中的最佳模型保留为最优树的第二模型112。在第三步中,移出第一模型110和第二模型112的类别,并且如上所述的方法计算两个剩余类别之间的预测模型并将其保留为最优树的第三模型114。然后,通过以类似于参照图7b所描述的方式,通过遍历树来获得像素光谱γi,j(λ)为类别y、gp、gnf和gnn之一的成员的预测。

返回到图6,一旦确定了预测模型的结构,任选地在84继续学习过程80,减少用于预测的光谱通道的数量,这种减少通过通道选择和/或通道重新分组来实现。特别地,当基于图5的“逐步”方法计算之前参照图7a、7b和7c描述的预测模型时,通过参数r可直接确定通道的数量。作为变体或额外地,可以去除没有显著增加模型性能的额外通道。作为变体或额外地,可以通过将390nm-900nm范围划分为多个间隔来实现通道重新分组,所述间隔的宽度对应于参照图2和3所述的滤波器的宽度。然后,每个间隔仅保留一个光谱通道。因此,选择通道的最终数量为和限定图2中多光谱系统的组36的光谱滤波器的中心波长。如下将要描述的,通过仅使用24个通道并因而只需24个光谱滤波器就可以获得高准确性的类别预测。

任选地,已经选择了用于多光谱应用的最终通道并相应地构建了多光谱系统后,基于用图2中的系统获取光谱,实施新训练以完善预测模型,该训练类似于图6和7所述的训练。

而且,已经描述了预定数量r个区分性通道的选择。作为变体,该数量不是预先确定的并且用于搜寻间隙(recherchedescréneaux)的停止标准是作为通道数量函数的性能增益的停滞。例如,如果添加至少一个通道不会使性能(例如下面详述的bcr)提高x%以上,则停止通道搜索,x例如小于或等于2%。

c.实施例

我们现在将描述已经描述过的类别y、gp、gnf和gnn预测的应用。为此,使用了21个细菌菌株和酵母菌株,这些微生物物种描述在图8中。将这些物种在cos琼脂和tsa琼脂上培养24小时,用以获得这些培养基每一种的学习数据库。图9(cos)和图10(tsa)分别描述了每种物种和培养基的菌落和像素的数量,其中方块1对应校准数据,方块2对应交叉验证数据。

类别预测的性能有利地被计算为等于类别预测的灵敏度的平均值(分类良好的光谱比率)。这种加权标准,也称为“平衡分类比率”或“bcr”,能够考虑到不平衡的像素集合,这种不平衡的情况是由随着物种变化而改变的菌落的大小而导致的。bcr的计算如图11所示。

c.1cos结果

c.1.1.平面模型

下表1给出了图7a中所示的平面预测模型和使用关系式(7)获得的预测模型的bcr。

表1

从表1显而易见,可以准确预测不同的细菌菌株。特别地,如果知道要表征的微生物是细菌,可以通过使用gp对gnn和gnf的第一预测和gnn对gp和gnf的第二预测来预测其革兰氏类型及其发酵或非发酵特性。这种类型的预测对于选择在申请人所销售的2平台上用于产生抗生图的消耗品特别有用。

c.1.2.最优树

表2总结了图7c所示和使用关系式(7)获得的模型110、112、114的bcr。

表2

可见最优树与系统发育树显著不同,cos培养基的影响很可能大于系统发育差异的影响。

表3总结了图7c所示以及使用图4中的逐步方法和关系(6)所获得的模型110、112、114的bcr,每个模型r=24。

表3

阅读表3可以知道,对于第一模型,性能增益从第8个通道开始受到限制,对于第三模型,性能增益从第4个通道开始受到限制。为了使用与商业滤波器系统相对应的24个光谱滤波器来获得多光谱应用,有利地是分别为第一、第二和第三模型110、112、114选择8个通道、14个通道和4个通道。表4总结了该实施方案的性能。

表4

当然,可以根据图2中系统可用的光谱滤波器的数量选择其他数量的通道。

还应注意,“逐步”方法可以确定包含用于预测类别所需信息的光谱范围。通过限制在每个模型的前五个通道,分别获得接近或大于90%的bcr。这些通道的光谱分布如图12至14所示。因此,相距50nm以上的不同光谱带可以被区分。特别地:

a:仅使用415-500nm第一范围和535-675nm第二范围内的光谱数据就可以有效地预测y、gp、gnf和gnn四个类别。仅使用这些范围,bcr大于或等于90%。通过将第一范围限制为575-675nm,每个模型仅使用4个通道可获得接近或大于90%的bcr。任选地,使用对应于第二模型的排序5的通道的第三范围850-875nm。更特别地,第一范围415-500nm的预测可以仅基于415-440nm和470-495nm范围。因此,本发明涵盖了用于预测类别y、gp、gnf和gnn的任何方法,包括:在所述范围内获取光谱并且仅根据所述范围内的所述光谱来预测类别。还应注意,如果本发明能够区分y、gp、gnf和gnn类别,则可以基于上述范围内所含的光谱数据来区分酵母和细菌。因此,本发明还涵盖了预测待表征微生物的酵母或细菌特征的方法。

b.仅根据470-500nm第一范围和575-645nm第二范围可以有效地预测类别gnf对y+gp+gnn。因此,本发明涵盖了用于预测gnf类别的任何方法,包括:在所述范围内获取光谱以及根据仅在所述范围内的所述光谱来预测类别gnf。应该注意的是,当已知待表征微生物的细菌特性时,则预测包括预测类别gnf对gp和gnn。因此,本发明还涵盖了仅基于470-500nm和575-645nm范围的这种类型的预测。

c.仅根据535-675nm第一范围、更特别地585-675nm范围以及850-875nm第二范围可以有效预测类别gp对y+gnn。因此,本发明涵盖了用于预测类别gp的任何方法,包括:在所述范围内获取光谱以及仅根据所述范围的所述光谱来预测类别gp。应该注意的是,当已知待表征微生物的细菌特性时,则预测包括类别类别gp对类别gnf和gnn,进而,随后对于类别gp,预测革兰氏阴性细菌(gn)的类别。因此,本发明还涵盖了仅基于535-675nm范围、更特别地基于585-675nm范围以及850-875nm范围的这种类型的预测。

d.通过结合下面b点和c点中所述的预测,可知在三个范围内的信息和知道要表征微生物的细菌特征,可以确定一个细菌菌落是gp、gnf或gnn。这种类型的预测对于选择用于用申请人所销售的2平台产生抗生图的消耗品特别有用。

c.1.3.系统发育树

表5总结了图7b所示以及使用关系式(7)获得的模型100、102和104的bcr。

表5

c.2.tsa结果

c.2.1.平面模型

下表1给出了图7a所示的平面预测模型和使用关系式(7)获得的预测模型的bcr。

表6

c.2.2.最优树

表7总结了图7c所示以及使用关系式(7)获得的模型110、112、114的bcr。

表7

可以看到,最优树与系统发育树明显不同,cos培养基的影响很可能大于系统发育差异的影响。

表8总结了图7c所示和使用图5中的逐步法和关系式(6)获得的模型110、112、114的bcr,每个模型r=24。

表8

通过针对第一、第二和第三模型110、112和114(图16)以及模型(图17)的用12、8和11个通道的简约方法,图15至图17图示了同一图表(图15)中的主要分支通道的光谱分布。

c.2.3.系统发育树

表9总结了图7b所示以及使用关系式(7)获得的模型100、102、104的bcr。

表9

表10总结了图7b所示以及使用图4中的逐步方法和关系式(6)获得的模型100、102、104的bcr,每个模型r=24。

表10

图18至20按模型逐个地显示了主要光谱通道的光谱分布,其中,每张图顶部是tsa培养基,每张图底部是cos培养基。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1