本发明涉及微生物学分析领域,尤其涉及微生物的表征,尤其进一步涉及对酵母和细菌的鉴别,以及涉及,在后者的框架下,其革兰氏类型的鉴别和其发酵特性或非发酵特性的鉴别。
有利地,本发明适用于在非生色、非发荧光及无染料的营养培养基中生长的细菌或酵母菌落的高光谱或多光谱图像的分析。
现有技术
在致病性微生物领域,微生物的表征优选地包括鉴别其种类和其对抗微生物剂(或抗生图(antibiogramme))的易感性,以确定被该微生物所感染的病人的治疗方法。为此,在实验室中通常实施复杂的微生物学过程,所述过程通常需要提前知道该微生物的其他特性,包括该微生物的界(例如酵母或者细菌),以及在细菌的情况下其革兰氏类型或发酵特性或非发酵特性。确实,这些信息使得可以选择一种适合该微生物的培养基或抗微生物剂类型以最终确定该微生物的种属或者其抗生图。例如,对由申请人所销售的
知道这些属性还有助于减少对细菌菌株的假阳性鉴别。例如,在申请人所销售的
这种信息除了表征微生物用以指导实验室的微生物学过程外,其还具有临床上实用性。具体地,细菌菌株的革兰氏分类可用于表征细菌的细胞壁,如细胞壁的肽聚糖百分比,以及可用于细菌的分类或作为第一近似值评估细菌对抗生素的敏感性。有两种类型细菌,即革兰氏阳性和革兰氏阴性细菌。类似地,观察到非发酵性细菌,即不能分解葡萄糖的细菌,在致病性细菌中占据了特殊位置。确实,其具有对抗生素高水平的天然抗性且涉及许多医院内感染。例子包括铜绿假单胞菌(pseudomonasaeruginosa)和不动杆菌(acinetobacter)。因此,快速地了解细菌的发酵或者非发酵特性可用于更有效地指导一线抗生素治疗以及减缓多药抗药菌株的传播。
历史上,上述每种属性(界,革兰氏和发酵性)都是通过精细复杂的技术来获知的。例如,一种细菌菌株的革兰氏类型的确定利用了一种称之为“革兰氏染色”的手工技术,这种技术包括了大量的手工步骤(固定、染色、媒染、清洗、过染色),继而这些技术的实施需要很长时间。因此,现在已经发展出各种各样的技术来自动化检测细菌的革兰氏类型,特别是处理大量样品。然而,这些技术本质上依然通过调整细菌或其环境的电磁响应,以使其革兰氏类型易于观察。特别地,第一类技术在于使显微镜载玻片上的细菌膜的染色自动化,但是对革兰氏类型的最终决定总还是需要技术人员在显微镜下观察载玻片。因而,这类技术不是全自动的,而且难以实现自动化。确实,革兰氏阳性细菌和革兰氏阴性细菌之间的颜色差异可以很细微,这也解释了为什么依然需要实验室技术人员的干预。第二类技术在于把细菌置于一种底物的环境中,该底物能够通过被细菌膜上的肽聚糖所引发的酶反应降解。该反应能产生生色团或者荧光团,其浓度可指示革兰氏类型。这通常被称为细菌的显色或荧光标记。尽管这类现有技术能够自动化,例如使用恰当设备(如光谱仪或荧光仪)测量生色团或者荧光团的光强度,然后利用计算机把所测的光强度与预先定义的阈值进行比较,但是,该技术需要设计特殊的、通常昂贵的生色团或荧光团底物。而且,不论使用何种技术,细菌都会经过对其天然状态的改变(例如,他们都含有染料,都已近固定了显色或荧光标记物等等),因而不能再被用于后续的表征测试(例如确定抗生图)。
为了确定细菌的发酵或非发酵特征,通常会使用显色培养基,其能够根据测试细菌菌株的发酵或非发酵特性改变颜色。例如,“kligler-hajna”测试在于在包含比色指示剂的培养基上培养菌株,所述比色指示剂能够根据ph、乳糖、葡萄糖、硫代硫酸盐和盐铁离子改变颜色。通过分解葡萄糖所引起的ph指示剂的比色变化,该培养基可以检测细菌的发酵特性。还有用于测试细菌菌株的三丁酰甘油酯酶活性的培养基,其可以表征革兰氏阴性和非发酵细菌。
技术实现要素:
本发明的目的是提供一种确定细菌菌株的革兰氏类型和发酵特性的方法,该方法是自动的、不需要对细菌或其培养基进行标记或染色即可确定这些特性。
为此,本发明涉及一种检测细菌菌株的革兰氏类型和发酵特性的方法,包括:
-在390nm-900nm的波长范围内照射所述菌株的至少一个细菌,所述菌株在所述范围内具有天然电磁响应;
-在所述范围内,获取从被照射的细菌反射的或透射通过被照射的细菌的光强度;和
-根据在所述范围内获取的光强度,确定所述细菌菌株的革兰氏类型和发酵特性。
“天然电磁”响应是指细菌没有被能改变其对至少在目标波长范围内的照射的电磁响应的元素(染料,色原,荧光原等)所修饰。例如,菌株的菌落在非生色、非荧光营养培养基中生长并且照射/采集直接在仍存在于其培养基中的菌落上进行。
换句话说,发明人发现,在390nm-900nm波长范围内,细菌“天然地”具有其革兰氏类型及其发酵或非发酵特性的电磁特征性特征。进而,本发明的方法在于测量该特征,然后从中提取出细菌的革兰氏类型和发酵特性。因此,没有必要使用生色或发荧光底物或染料。此外,本发明的方法是快速的,因为它包括照射、测量光谱和对该光谱实施一个处理,包括计算机处理。特别地,由于本发明,可以使用390-900nm范围确定细菌菌株是革兰氏阳性发酵性或革兰氏阴性发酵性或是革兰氏阴性非发酵性,这些信息的了解使得诸如优化如上所述的实验室微生物的过程成为可能。
应该注意的是,革兰氏类型和发酵特性的确定是直接从获得的光强度来进行的,不需要事先确定细菌菌株的种、属或科。特别地,本发明的方法不同于根据先鉴别出细菌菌株的种、然后从该种的知识推导出革兰氏类型和发酵特性的方法。不必在种水平上鉴别细菌菌株的优点是大大简化了用于预测革兰氏类型和发酵特性的模型。实际上,在种水平进行鉴别需要有非常大量类别的预测模型。例如,在尿路感染的情况下,据估计99%的该类感染是由归属于大约50个细菌种的细菌菌株引起的。因此,在种水平进行鉴别需要对大约五十个类别进行预测。根据本发明,预测模型可以限于四个类别。
有利地,该方法适用于含有其上生长了微生物菌落的琼脂营养培养基的培养皿。例如,把含有或怀疑含有酵母或细菌的生物样品如尿液接种到所述营养培养基,然后培养以生长菌落。一旦在营养培养基上检测到菌落,根据本发明的方法进行表征。因此,在接种营养培养基之后,该过程不需要任何材料转移或试剂添加。菌落的检测,例如,通过在规则间隔获取培养皿的图像以及实施菌落检测算法自动进行。
有利地,根据本发明的方法不是基于细菌菌株的自发荧光的分析,而是基于所述菌株的反射率或吸光度的分析。特别地,照射通常对于自发荧光来说太强,以至于在高光谱或多光谱图像上不能观察到自发荧光。
本发明还涉及一种产生一种抗生素的细菌菌株的抗生图的方法,该方法包括:
-确定所述细菌菌株的革兰氏类型和发酵特性;
-提供至少一个样品,所述样品包含所述细菌菌株、根据所述革兰氏类型和所选择发酵特性的培养基和一定浓度的抗生素;以及
-根据样品中所述菌株的生长确定所述细菌菌株对所述抗生素的敏感性,
其中,根据上述类型的方法进行确定所述细菌菌株的革兰氏类型和发酵特性的方法。
本发明还涉及一种鉴别针对抗生素的细菌菌株的方法,该方法包括:
-确定所述细菌菌株的革兰氏类型和发酵特性;
-根据革兰氏类型和所选择的发酵特性,选择至少一种比色培养基;以及
-在所述培养基中培养所述细菌菌株,
其中,根据上述类型的方法进行确定所述细菌菌株的革兰氏类型和发酵特性的方法。
本发明还涉及用于实施上述方法的系统。特别地,本发明涉及一种用于检测细菌菌株的革兰氏类型和发酵特性的检测系统,包括:
-照射装置,其配置成在波长范围390nm-900nm照射所述菌株的至少一个细菌;
-传感器,其配置为在所述390nm-900nm范围内,获取从被照射的细菌反射的或透射通过被照射的细菌的光强度;以及
-计算机单元,其配置为根据在390nm-900nm范围内获取的光强度确定所述细菌菌株的革兰氏类型和发酵特性。
根据一个实施方案,该系统被配置为照射一个样品并获取该样品的图像,所述样品包括所述菌株的细菌菌落和所述菌落已在其上生长的营养培养基,特别是培养皿。
本发明还涉及一种用于校准用于执行根据本发明的方法的系统的方法,该系统包括:
-照射装置,其配置为在390nm-900nm波长范围内,照射所述菌株的至少一个细菌;
-传感器,其配置为在390nm-900nm范围内,获取从被照射的细菌反射的或透射通过被照射的细菌的光强度;以及
-计算机单元,其包括计算机存储器和微处理器,所述计算机存储器能够包含对由所述传感器获取的光强度的分析指令,所述微处理器能够执行所述计算机存储器中所包含的分析指令,
所述校准过程包括以下步骤:
-建立一个训练数据库,所述数据库包括在390nm-900nm范围内被照射的细菌菌株在所述范围内的光强度,所述菌株与不同革兰氏类型和不同发酵特性相关联;
-通过计算机对一个模型进行机器学习,所述模型基于所述数据库对细菌菌株的革兰氏类型和发酵特性进行预测;和
-在所述系统的计算机内存中存储分析指令,以实施所述学习后的预测模型。
本发明还涉及一种治疗方法,包括:
-从怀疑患有细菌感染的患者获取样品;
-检测所述样品中存在的一种或多种细菌菌株,有利地,通过把所述样品接种到琼脂培养基,培养所述接种的培养基以生长细菌菌落并检测一种或多种生长的细菌菌落;
-检测通过上述类型的方法检测到的细菌菌株的革兰氏类型或发酵特性;
-基于所述检测到的革兰氏类型和发酵特性选择一种或多种抗生素;以及
-向患者施用所选的抗生素。
附图简述
通过阅读下面的描述,将更好地理解本发明,下面的描述仅作为例子给出,并且是参照附图而做出的,所述附图中相同的参考标记表示相同或相似的元件,以及在所述附图中:
-图1是根据本发明的高光谱系统的示意图;
-图2是根据本发明的多光谱系统的示意图;
-图3是在图2的系统中使用的带通滤波器的透射光谱的示例;
-图4是使用图1或图2的系统进行的对y,gp,gnf,gnn类的预测方法的流程图;
-图5是使用逐步方法选择区分性光谱通道的方法的流程图;
-图6是用于学习对于类别y、gp、gnf、gnn的预测模型的方法的流程图;
-图7a是描述类别y、gp、gnf、gnn的平面预测模型的图;
-图7b是描述基于类别y、gp、gnf、gnn的系统树的分层预测模型的图;
-图7c是描述基于类别y、gp、gnf、gnn的最优树的分层预测模型的图;
-图8是描述用于学习对于类别y、gp、gnf、gnn的预测模型的细菌和酵母种的表;
-图9和图10是,分别对于cos和tsa培养基,描述了用于预测模型的校准和交叉验证的像素数以及光谱的表;
-图11是描述加权预测率或平衡分类率的计算的图。
-图12是描述用于cos培养基的最优树的主要区分性光谱通道的空间分布的图;
-图13是描述对于cos培养基的最优树的每个模型的5个主要区分性光谱通道的空间分布的图;
-图14是各自显示cos环境的最优树的每个模型的5个主要区分性光谱通道的图;
-图15是描述对于tsa培养基的最优树的主要区分性光谱通道的空间分布的图;
-图16是描述用于cos培养基的最优树的主要区分性光谱通道的空间分布的图。
-图17是描述分别与tsa培养基的最优树的第一、第二和第三预测模型相关的12、8和11个主要区分性通道的图;
-图18至20是,分别展示系统树的第一、第二和第三预测模型的图,其中每个图顶部的图对应于tsa培养基,而每个图底部的图对应于cos培养基。
发明详述
在下文中,符号ai,j表示矩阵a的第i行第j列中的元素。
参照图1,用于表征生长在培养皿中琼脂上的酵母或细菌菌落的高光谱系统10包括:
-高光谱图像获取装置12;和
-数据处理单元14,所述数据处理单元14(例如通过有线或无线连接)连接至装置12以对其进行控制并接收和处理由装置12获取的图像。
所述装置12,例如美国蒙大拿州resonon的参考高光谱成像系统“pikaii”,包括:
-所谓的“高光谱”相机18,其由数字传感器和光色散元件或光谱摄制仪组成,所述数字传感器包括一个在波长范围为[λmin;λmax]=[390;900]纳米之间敏感的基本传感器例如ccd或cmos数字传感器的阵列;所述光色散元件或光谱摄制仪用于选择所述传感器要获取的波长;
-透镜20,其用于把培养皿22的光学图像(要获取其高光谱图像)聚焦在相机18的数字传感器上;
-前照射装置24,例如由一个或多个同种异体(allogènes)灯组成,如2个或4个灯,其能够发射[λmin;λmax]范围内的光并实现培养皿22的均一前照射。例如,所述光为白光灯;
-后照射装置26,例如由白光led阵列组成,用以提供在在[λmin;λmax]范围内的培养皿22的均一后照射;和
-支架28,其上放置培养皿22并允许后者在透镜20之前滚动,以便通过扫描获得培养皿22的整个图像。
因此在[λmin;λmax]整个范围内提供照射。
所述装置12,例如被配置为以160微米(空间分辨率估计为300微米)的采样步长以及在[λmin;λmax]范围内以1.7纳米的光谱分辨率,来获取90毫米×90毫米区域的图像。
因此装置12产生由培养皿反射的光的数字图像hsi,该图像具有n行和m列,优选地,培养皿22最好是敞开的(即无盖):
像素的辐射亮度,通常称为“光强度”,在此对应于在曝光时间内入射在相机18的传感器的相应基本敏感部位的表面上的光量,例如如数码摄影领域已知的。
每个像素radi,j(λ)由与培养皿22的辐射亮度的数字光谱组成,该数字光谱对应在不同波长[λmin;λmax]下的像素,该数字光谱表示为以下关系式:
其中,δλ是光谱分辨率并且p是属于
数据处理单元14是例如配置为对由获取装置12产生的图像hsi进行处理的个人计算机,平板电脑,智能电话,服务器,超级计算机,或更一般地,基于微处理器、特别是基于数字信号处理器(dsp)、基于fpga类型电路或基于组合了这些类型技术的电路等等的任何系统。特别地,单元14配备有用于存储由装置12产生的图像的所有存储器(ram、rom、高速缓存、大容量存储器……),用于实施根据本发明的方法的计算机指令,对所述实施以及存储中间和最终计算结果有用的参数。任选地,单元14包括显示屏,用于可视化菌落表征的最终结果,特别地,可用于确定所研究菌落的革兰氏类型和/或发酵特性,和/或细菌或酵母特性。尽管仅描述了一个处理单元,但是本发明显然适用于由多个处理单元(例如,用于实施图像hsi预处理的装载于相机18的单元以及用于实施其余处理的在装置12外部的单元)执行的处理。另外,该系统可以通过一个接口来完成,该接口允许将与样品有关的数据输入到单元14中,特别地,所述数据是当预测依赖于培养基时所使用的培养基的类型,例如通过操作员可用的键盘/鼠标和下拉菜单,一个条形码/qr码阅读器读取培养皿上存在的条形码/qr码及包括关于培养基的信息等。
图1中的高光谱系统具有在获取波长方面灵活的优势,因为它可以适应不同的菌落类别预测模型并使用大量光谱通道来提高预测的准确性。但是,除了价格高昂之外,这种系统在空间上的解析度通常不如常规cmos或ccd相机,后者的唯一目的是获取入射在其传感器上的光强度的图像。
参照图2,多光谱系统32与高光谱系统10的区别在于相机32,有利地,所述相机32是具有高空间分辨率的cmos或ccd相机,其配备了一组光谱滤波器36,例如设置在透镜20之前且在透镜20和相机32的传感器之间。这组滤波器36由多个nf单独的带通滤波器组成,每个配置为仅透射[λmin;λmax]范围内[λ1;λ2]范围的光,半高宽(fwhm)小于或等于50nm,优选小于或等于20nm。图3显示了以420nm为中心的edmundoptics滤光器为例的这种滤波器的透射光谱。组件36,例如可以是能容纳多达24个不同滤波器的滤光轮,由单元14驱动,单元14通过操作滤光轮以使滤波器在相机前面滚动并控制对于每个滤波器的图像捕获。
因此,可以获取多光谱图像hsi(λ),其每个像素radi,j(λ)由与组件36过滤的不同光谱带中的像素相对应的培养皿22的辐射亮度的数字光谱组成,所述数字光谱根据以下关系表示:
其中,
现参照图4中的流程图详述,使用刚刚所描述的系统,用于表征生物样品(例如尿液,血液,支气管肺泡采样等)中含有的微生物的方法40。具体地,该方法有利地应用在更全局方法的框架内,该方法通过maldi-tof质谱法(例如由申请人出售的
以有利的方式,以下描述的表征方法40从在培养皿上的第一次生长起,可以获得有关微生物的必要信息以继续进行微生物学过程,特别是已经生长的菌落是酵母(“y”)或细菌,对于细菌而言,该细菌是革兰氏阳性(“gp”)或革兰氏阴性(“gn”),对于革兰氏阴性细菌而言,该细菌是发酵的(“gnf”)或非发酵的(“gnn”)。因此,该方法使得可以预测微生物的类别,以使其具有y、gp、gnf或gnn类别。
在该方法的第一步骤42中,将培养皿接种生物样品,例如取自患者,以在沉积在培养皿中的营养培养基或“培养物”的表面上生长酵母或细菌菌落。营养培养基的主要目的是生长所述菌落,并任选地通过限制光干扰来提高表征的准确性。优选地,关于根据反射光强度的革兰氏类型检测,营养培养基是不透明的,这增加了检测的精确度。特别地,不透明培养基的反射系数ρ小于或等于10%,优选地小于或等于5%,甚至更优选地小于或等于1%。例如,培养基可以是所谓的“cpso”琼脂(该“cps”琼脂包含使培养基不透明的sio2),所谓的“columbia”琼脂(“cna”琼脂),含5%羊血的columbia琼脂(“cos”琼脂),man,rogosa,sharpe(“mrsm”)琼脂,巧克力(“pvx”)琼脂,tryptone-soy琼脂(“tsa”)等。
这种类型的菌落生长是经典的,下面将不再作更详细的描述。有利地,它可以由操作员手动进行,或者以公知的方式使用自动接种机自动进行。有利地,以如下方式进行制备:根据对微生物实施表征,将菌落彼此隔开,并且使得菌落的表面积对应于装置12所获取的图像中的多个像素。这样可以尤其是有助于对所获取图像中的后续鉴别,因而有助于利用图像处理算法对它们的分割或者有助于由用户在图像中对它们的提取。
一旦菌落生长完成,例如在24小时、36小时或48小时之后,优选地打开培养皿,将其放置在支架28上,照射24和26被打开并且在获取装置12的参与下,在44中获取培养皿的至少一个高光谱(分别为多光谱)图像hsi(分别为32)并将其存储在处理单元14中,该处理单元14执行计算机处理以从获取的图像中确定构成菌落的微生物的类型。
在46,单元14任选地开始一个噪声预处理,该噪声预处理由以下类型的处理之一或其任意组合组成:
a.以已知方式,校正相机传感器噪声,特别是其偏移、空间噪声等;
b.处理寄生反射,尤其是形成图像hsi中“高光”的镜面反射。例如,实施阈值处理以消除大于预定阈值如大于或等于像素可以取的最大值的三分之二(即如果像素以0到255之间的8位编码,则大于或等于170)的像素;
c.通过将图像hsi除以在所使用细菌类型和琼脂类型不变的波长下的反射光强度,来进行比例处理,以衰减由外部波动(例如照明度变化)引起的图像中的变化;
d.如果已获取多个图像hsi,则搜索并消除异常值和/或所获取图像的平均值。
有利地,在48中通过将存储了不同波长的辐射亮度值的预处理图像hsi转换成高光谱或多光谱反射率图像而继续处理以便提取单独由培养皿产生的信号。这使得可以,尤其是,过滤照射源24、26的发射光谱的波动。例如,实施平场校正(ffc)以获得反射率,这还具有校正传感器的从像素到像素的响应色散(暗电流色散,增益色散等)的优点。
在高光谱图像的情况下,此转换例如是根据以下关系的校正:
其中υ(λ)是反射率图像,w是存储在单元14中的高反射率的并由照射装置24、26所照射的中性物体例如均一反射率大于90%的片(例如所谓的“白色”片或灰度图小于10%的片)的高光谱图像,b是存储在单元14中的低反射率的中性物体的高光谱图像,例如遮住透镜20的黑帽的图像,以及m(λmin+p×δλ)=1或等于矩阵w(λmin+p×δλ)-b(λmin+p×δλ)的平均值。
类似地,在多光谱图像的情况下,此转换例如是根据以下关系的校正:
其中w是存储在单元14中的高反射率的并由照射装置24、26所照射的中性物体例如均一反射率大于90%的片(例如所谓的“白色”片或灰阶小于10%的片)的多光谱图像,b是存储在单元14中的低反射率的中性物体的多光谱图像,例如遮住透镜20的黑帽的图像,以及m(λn)=1或等于矩阵w(λn)-b(λn)的平均值。
在步骤38之后或与之前步骤平行,在50中,单元14执行用于鉴别,例如来自图像hsi(λ)或υ(λ)的,细菌菌落的算法。可以使用任何标准图案和对象识别算法来提取对应于菌落的图像的区域,该区域称为“col(λ)”。替代地,该选择可以由通过使用显示屏和指示系统(如鼠标)来选择该区域的操作员手动进行。例如,区域col(λ)由属于菌落的像素坐标列表组成。所选像素区域存储在单元14。
通过应用预定的决策规则,根据至少一个所述区域col(λ)的光谱,来预测菌落中微生物的y,gp,gnf或gnn类别而在52中继续所述方法,所述决策规则的变体描述如下。具体地,该预测是基于所述区域col(λ)的每个像素(i,j)的光谱υi,j(λ)所进行的。为此,对所述区域col(λ)的每个像素(i,j)进行类别的初步预测,然后对类别的最终预测实施多数结果决定(votemajoritaire)。在第一变体中,实施简单多数结果决定,即最终选择的类别是基于最大数目的col(λ)的像素所预测的类别。在第二种变体中,为了增加类别预测的确定性,实施了合格结果决定(votequalifié),即最终保留的类别是在基于构成col(λ)的像素的x%以上的数量所做出的预测,其x严格大于50%,优选地大于或等于70%。如果没有任何一个类别满足此条件,则该方法会返回:类别预测缺失。当然,可以使用单个值,如所述区域col(λ)的光谱集合{υi,j(λ)}(i,j)∈col(λ)的平均光谱υcol(λ),来实现菌落的类别分类。
利用单元14使用预定的预测规则来实现每个菌落的y、gp、gnf或gnn类别分类,所述预定的预测规则变型描述如下。预测的类别存储在单元14中和/或在屏幕上显示给用户。该预测还有利地传送至另一个微生物分析设备用于形成菌落的微生物的鉴别和/或抗生素敏感性测试的随后步骤。
现将描述根据菌落像素光谱υi,j(λ)的y、gp、gnf或gnn类别的不同预测模型,包括基于监督机器学习(sml)的预测模型。首先结合图5描述所使用的sml工具,然后通过图6和7中所示的学习过程在下文描述预测模型。
a.监督机器学习工具
无论考虑的学习类型如何,它都始于创建学习数据库。对于每个y、gp、gnf和gnn类别,选择细菌和酵母并将它们每一个接种在培养皿中的琼脂上,培养预定时间并用如图1所述的系统并且在相同的照射条件下以及390nm-900nm波长范围内获取培养皿的高光谱图像。例如在方法40的步骤46-50中所述,提取在琼脂上生长的菌落的像素,并将其相关光谱存储在训练数据库中。因此,该训练数据库包括分别与y、gp、gnf和gnn类别相关联的四个光谱集合
根据第一特定实施方案,计算机实施学习(被称为“逐步(stepforward)”)被用于学习预测模型。这类学习基于最具区分性光谱通道(canauxspectrauxlesplusdiscriminants)的逐步(pasàpas)选择,因而其本质上是简约的而且也适合图2中系统所实施的多光谱应用。
参照图5,学习60从初始化步骤62开始,其中选择最大数量r的区分性通道,该数在1与用于光谱获取的高光谱相机的光谱通道的数量p之间。清空所选的区分性通道的列表l并将候选通道的列表l初始化为高光谱相机通道的集合{λ1,λ2,…,λp}。
在随后的迭代步骤64中,通过执行迭代步骤66,用列表l中最具区别性的r个通道逐步填充列表l。具体地说,对于步骤64一个给定的迭代r,执行步骤66:
-提取列表l的每个通道λk;
-在68中,针对提取出的通道λk和来自l列表的通道{λ1,λ2,…,λr-1},确定预测模型
-在70中,计算预测模型
然后,在72中,继续步骤64,鉴别给出最佳性能标准的预测模型并随后鉴别和列表l中的通道相组合的最具区别性列表l的通道λr。在74中,列表l然后用通道λr完成,并将其从列表l中移出以进行步骤64的下一个迭代r+1。一旦鉴别出最具区别性的r个通道,则在74中通过存储列表l和与预测超平面
有利地,在步骤68中计算的预测模型是支持向量机(svm)类型、“一对所有”、线性核和软边缘的。此类训练包括根据校准光谱计算一个超平面
约束条件是:
表达式中:
-对于属于类别cl或集合
-
-m是属于类别cl或集合
-
-ξm和
-qm∈{-1,1},如果第m个学习光谱与类别cl相关联,qm=1,以及如果第m个光谱与其他类别的集合
-c是预定义的标量。
因此,根据以下步骤执行了所述模型,预测一像素光谱υi,j(λ)的cl类别成员归属:
-在向量
-计算光谱
-根据距离scl应用类别cl的预测规则,例如,如果scl的符号为正,则光谱属于类别cl,如果符号为负,则光谱主体属于
根据第二实施方案,学习不是简约的而是包括同时使用所有通道,因为所得到的预测模型特别适合于使用图1所示系统的高光谱应用。例如,该训练是svm类型、“一对所有”、线性核和柔性边缘的,并且包括通过根据以下关系解决最优化问题,根据校准光谱计算一个超平面
约束条件是:
表达式中:
-υm(λ)是属于类别cl或集合
-
-m是属于类别cl或集合
-υm(λ).β是向量υm(λ)与向量β之间的标量积;
-ξm和
-qm∈{-1,1},如果第m个学习光谱与类别cl相关联,qm=1,以及如果第m个光谱与其他类别的集合
-c是预定义的标量。
因此,根据以下步骤执行了所述模型,预测一像素υi,j(λ)光谱的cl类别成员归属:
-计算光谱υi,j(λ)与超平面
-根据距离scl应用类别cl的预测规则,例如,如果scl的符号为正,则光谱属于类别cl,如果符号为负,则光谱属于集合
参考图6,如上所述,用于预测模型的学习过程80以在82中建立关于类别y,gp,gnf和gnn的学习数据库开始。接着,在84中继续过程80,确定预测模型结构。具体地,两种类型的模型是可能的,分别如图7a以及图6b和6c所示。
第一种类型的预测模型,如图7a所示,包括学习四个“一对所有”预测模型90、72、74、76,即类别y针对类别gp、gnf、gnn的预测,类别gp针对类别y、gnf、gnn的预测,类别gnf针对类别y、gp、gnn的预测以及类别gnn针对类别y、gp、gnf的预测。为此目的:
-通过实施上述关系(6)或(7)所述的学习工具之一,从学习数据库学习每个预测模型。类别cl等于y、gp、gnf、gnn以及集合
-通过计算(步骤90-96)像素的光谱υi,j(λ)分别到超平面
根据图7a中所示的第一种类型结构,称为“平面”,类别y、gp、gnf和gnn被认为具有同等重要性,因此鉴别误差也同样。例如,鉴别酵母y而不是细菌gnn与鉴别细菌gnf而不是细菌gnn一样重要。根据图7b中所示的结构,根据系统发育分类树来组织预测模型,这使得不再有可能以同等重要性考虑不同类别并引入先验信息,即可能影响光谱形状的进化信息。更具体地,此预测模型树包括:
-第一模型100,包括把酵母y与细菌gp、gnf、gnf区分;
-第二模型102,用于把细菌gp与细菌gnf和gnn区分;和
-第三模型104,包括把细菌gnf与细菌gnn区分。
以上述关于关系式(6)或(7)的方式获得模型100-104中的每个模型,并且因此,像素光谱υi,j(λ)对类别y、gp、gnf和gnn其中一个的成员归属的预测包括计算其到第一模型100的超平面的距离sy,如果该距离的符号为正,则预测为类别y。否则,计算到第二模型102的超平面的距离sgp,如果该距离的符号为正,则预测为类别gp。否则,计算到第三模型104的超平面的距离sgnf,然后预测为类别gnf。否则,将预测为类别gnn。
尽管与图7a所示的平面预测结构相比,表型模型提高了预测的准确性,但发明人注意到,表型树不一定是给出更好结果的树。特别地,基于将要表征的微生物在其上生长的培养基,所述树可以是优选的,这会影响光谱的形状。优选地,如图7c所示,最优预测结构根据校准光谱确定。具体地,在第一步中,如上所述计算四个预测模型:a)y对gp、gnf和gnn,b)gp对y、gnf和gnn,c)gnf对y、gp和gnn,以及d)gnn对y、gp和gnf,并将具有最佳预测性能的模型保留为最佳树的第一模型110。在第二步中,丢弃第一模型的类别,并计算与其余类别相对应的三个预测模型。例如,如果第一模型对应于类别gnn,则如上所述,第二步的三个模型是:a)y对gp和gnf,b)gp对y和gnf,以及c)gnf对y和gp。然后,将三个模型中的最佳模型保留为最佳树的第二个模型112。在第三步中,丢弃第一模型110和第二模型112的类别,并且如上所述计算两个剩余类别之间的预测模型并将其保留为最优树的第三模型114。然后,以类似于关于图7b所描述的方式,通过遍历树来获得的像素光谱υi,j(λ)对于类别y、gp、gnf和gnn之一的成员归属的预测。
返回到图6,一旦确定了预测模型的结构,继续学习过程80,任选地在84中,减少用于预测的光谱通道的数量,这种减少是通过通道选择和/或分组来实现的。特别地,当使用图5的“逐步”方法计算之前在图7a、7b和7c中描述的预测模型时,通过参数r可直接确定通道的数量。替代地或额外地,可以丢弃没有显着改善模型性能的其他通道。替代地或额外地,可以通过将390nm-900nm的范围划分为多个间隔来实现通道分组,所述间隔的宽度对应于图2和3的上述描述的滤波器的宽度。然后,每个间隔仅保留一个光谱通道。因此,选择通道的最终数量为
任选地,已经选择了用于多光谱应用的最终通道并相应地构建了多光谱系统后,基于用图2的系统对光谱的获取实施新训练以完善预测模型,该训练类似于图6和7所描述的。
类似地,已经描述了r个预定数量的区分通道的选择。替代地,该数量不是预先固定的,并且用于插槽搜索(recherchedescréneaux)的停止标准是作为通道数量函数的性能增益的停滞。例如,如果添加至少一个通道不会使性能(例如下面详述的bcr)提高x%以上,则停止通道搜索,x例如小于或等于2%。
c.实施例
现在将描述预测类别y、gp、gnf和gnn的应用。为此,使用了21个细菌和酵母菌株,这些微生物物种描述在图8中。将这些物种在cos琼脂和tsa琼脂上培养24小时,从而获得每种培养基的学习数据库。图9(cos)和图10(tsa)分别显示了每种物种和培养基的菌落和像素计数,其中方框1对应校准数据,方框2对应交叉验证数据。
类别预测的性能有利地被计算为类别预测的灵敏度的平均值(良好排序光谱比率)。这种加权标准,也称为“平衡分类比率”或“bcr”,可考虑到不平衡的像素计数,这是由于菌落的大小而引起的,菌落的大小随物种的不同而变化。bcr的计算如图11所示。
c.1cos结果
c.1.1.平面模型
下表1给出了图7a中所示的平面预测模型和使用关系式(7)获得的预测模型的bcr。
表1
从表1显而易见,可以准确预测不同的细菌菌株。特别地,如果知道要表征的微生物是细菌,可以通过执行gp对gnn和gnf的第一预测和gnn对gp和gnf的第二预测,来预测其革兰氏类型及其发酵或非发酵特性。这种类型的预测对于选择用于使用申请人所销售的
c.1.2.最优树
表2总结了图7c中所示的和使用关系式(7)所获得的模型110、112、114的bcr。
表2
应注意,最优树与系统发育树显著不同,cos培养基的影响很可能大于系统发育差异的影响。
表3总结了在图7c中所示的以及使用图4中的逐步方法和关系(6)所获得的模型110、112、114的bcr,每个模型r=24。
表3
从表3中注意到,对于第一个模型,性能增益从第8个通道受限,对于第三个模型,性能增益从第4个通道受限。为了使用与市场上的滤波器系统相对应的24个光谱滤波器来获得多光谱应用,因此有利的是分别为第一、第二和第三模型110、112、114选择8个通道、14个通道和4个通道。表4总结了该实施方案的性能。
表4
当然,可以根据图2中系统可用的光谱滤波器的数量选择其他数量的通道。
还应注意,“逐步”方法可以确定包含类别预测所必须信息的光谱范围。通过将自身限制在每个模型的前五个通道,分别可获得接近或大于90%的bcr。这些通道的光谱分布如图12至14所示。这清楚地区分了相距50nm以上的不同光谱带。特别是:
a:仅使用415-500nm第一范围和535-675nm第二范围内的光谱信息就可以有效地预测y、gp、gnf和gnn四个类别。仅使用这些范围,bcr大于或等于90%。通过将第一范围限制为575-675nm,bcr接近或大于90%的每个模型仅使用4个通道。任选地,使用对应于第二模型的通道排序5的第三范围850-875nm。特别地,第一范围415-500nm的预测仅能在415-440nm和470-495nm范围内执行。因此,本发明涵盖了用于类别y、gp、gnf和gnn的任何预测方法,包括:在所述范围内获取光谱并且仅根据所述范围内的所述光谱来预测类别。还应注意,如果本发明能够区分y、gp、gnf和gnn类别,则可以利用上述范围内所包含的光谱信息来区分酵母和细菌。因此,本发明还涵盖了对待表征微生物的酵母或细菌特征进行预测的方法。
b.仅可以在470-500nm第一范围和575-645nm第二范围内有效地预测gnf类别对y+gp+gnn。因此,本发明涵盖了用于预测gnf类别的任何方法,包括:在所述范围内获取光谱以及仅在所述范围内根据所述光谱来预测类别gnf。应该注意的是,当已知待表征微生物的细菌特征时,则预测包括预测gnf类别对gp和gnn。因此,本发明还涵盖了仅基于470-500nm和575-645nm范围的这种类型的预测。
c.针对y+gnn的gp类别预测只能在535-675nm第一范围内,更具体地说,在585-675nm范围内,以及850-875nm第二范围内有效进行。因此,本发明涵盖了用于预测gp类别的任何方法,包括:在所述范围内获取光谱以及仅根据所述范围内的所述光谱来预测gp类别。应该注意的是,当已知待表征微生物的细菌特征时,则预测包括针对gnf和gnn类别预测gp类别,随后针对革兰氏阴性(gn)细菌类别预测gp类别。因此,本发明还涵盖了仅基于535-675nm范围,更具体地585-675nm范围和850-875nm范围的这种类型的预测。
d.通过结合下面b点和c点中所述的预测、在三个范围内的信息、和知道要表征微生物的细菌特征,就可以确定一个细菌菌落是gp,gnf还是gnn。这种类型的预测对于用于实施用申请人所销售的
c.1.3.系统发育树
表5总结了图7b中所示以及使用关系式(7)获得的模型100、102和104的bcr。
表5
c.2.tsa结果
c.2.1.平面模型
下表1给出了图7a中所示的平面预测模型和使用关系式(7)获得的预测模型的bcr。
表6
c.2.2.最优树
表7总结了图7c中所示的以及使用关系式(7)获得的模型110、112、114的bcr。
表7
请注意,最优树与系统发育树明显不同,因为cos培养基的影响很可能大于系统发育差异的影响。
表8总结了图7c中所示的使用如图5中的逐步法和关系式(6)所获得的模型110、112、114的bcr,每个模型r=24。
表8
通过针对第一、第二和第三模型110、112和114(图16)以及模型(图17)的用12、8和11个通道的简约方法,图15至图17图示了同一图表(图15)中的主要分支通道的光谱分布。
c.2.3.系统发育树
表9总结了图7b中所示的使用关系式(7)获得的模型100、102、104的bcr。
表9
表10总结了图7b中所示的使用图4中的逐步方法和关系(6)获得的模型100、102、104的bcr,每个模型r=24。
表10
图18至20按模型逐个地显示了主要光谱通道的光谱分布,其中,每张图顶部是tsa培养基,每张图底部是cos培养基。