本发明涉及细菌电子显微图像处理领域,涉及图像模式识别方法,涉及细菌电子显微图像的识别筛选,特别涉及一种基于adaboost方法进行肉毒梭菌细菌电子显微图像的细菌筛选。
背景技术:
目前,肉毒梭菌的鉴别仍旧依赖于传统的细菌检测方法,即从病人的排泄物或者接触的食物在厌氧环境下进行为期至少5天的细菌培养,在成型的细菌菌落中人工选取菌群,进行多次的纯化、培养。再通过pcr扩增,通过基因测序,对细菌种类进行鉴定。电子显微图像具有快速统计分类的特点,可以再医学、公共卫生、农业、食品安全等各个领域适用。就目前细菌检测领域的实际应用而言,显微图像技术仍需要通过染色图像,而后通过人工识别的方式对细菌的种类进行鉴别,存在主观性强、标准不统一等不足。同时,该方法需要消耗大量人力物力,并且可能造成病人身体的不可逆转的损害,需要进行改进。
基于细菌电子显微图像进行肉毒梭菌的细菌识别,用于临床预检、作为判别患者的细菌感染与否的重要标准之一,可以节约时间成本,具有十分重要的现实意义。但目前为止,尚无关于基于电子显微图像的肉毒梭菌快速检测的报道。适用于肉毒梭菌识别的形态特征、分类方法都有待提出和验证。
adaboost方法是boosting算法中的改进方法。在boosting加法和前向思想的基础上,将boosting算法变成现实。首先建立多个弱分类器,根据分类的错误率调整分类器以及样本的权值,使不同的分类器发生作用的范围不同,最终将所有的弱分类器整合形成强分类器,从而达到提升分类准确率的效果。
技术实现要素:
由于电子显微图像在肉毒梭菌识别应用上的空白,本发明的目的在于提出一种基于电子显微图像的肉毒梭菌识别的系统,其中包括肉毒梭菌等细菌的培养、肉毒梭菌电子显微图像的获取、数据传递、图像预处理、特征选择、特征提取、识别方法选择,结果判断等多个过程。
本发明解决其技术问题所采取的技术方案是:基于电子显微图像的肉毒梭菌识别方法,旨在建立一种基于肉毒梭菌细菌电子显微图像的在线识别分类系统及方法。
该系统使用的方法的主要内容包括如下:
步骤1:将细菌的制样铜网放置在样本架上,调整后进行成像。根据成像特点拍摄尽量多的单个包含单个细菌完整信息图像。
步骤2:对得到的细菌完整信息图像进行图像预处理、对标等工作。
步骤3:对预处理结束的图像进行特征提取。
步骤4:使用adaboost方法,训练弱分类器,最终形成一个强分类器,得到最终分类结果并最终将结果传输到指定用户的计算机中。
进一步的,本发明步骤1所述的获取细菌电子显微图像的方法,其步骤具体包括:
步骤1-1:将制样成功的铜网放置在样本杆上。
步骤1-2:将样本杆安置在电镜上,并启动电镜。
步骤1-3:通过调节放大倍数使电镜成像,调整放大倍数尽量使得每一类细菌图像的图像标尺一致,减少后期预处理的工作量。
进一步的,本发明步骤2所述的细菌图像传输过程,其步骤具体包括:
步骤2-1:通过将获取的原始细菌电子显微图像从.gif格式转变为.jpg格式,在保证图像特征的前提下,压缩图像大小,降低传递速度。
步骤2-2:由于获得的图像标尺定义可能不一致,使用hough变换将标尺线段进行检测,通过图像的比例关系将图像的标尺调整为一致。
hough变换:
已知直线未:y=mx+b,在极坐标系下也可以表示为:ρ=xcosθ+ysinθ。在hough空间中,在同一条直线上的点相交于一个点。
每个细菌图像都有一个标尺,将其输入到计算机后,通过hough变换检测到标尺线段的两端像素点,计算机计算的标尺像素点的距离d1,标尺标注距离为d2,将所有标尺距离调整为5μm。计算得到需要的像素点距离为:
进一步的,本发明步骤3所述的图像预处理方法、对标方法以及特征提取方法,其步骤具体包括:
步骤3-1:提取的特征包括:hu不变距、傅里叶算子、最小外接矩形的长轴短轴,长宽比,面积周长、密集度和形态比9类特征。
进一步的步骤3-2hu不变距:
对于某一灰度图像f(x,y)的(p+q)阶中心距为:
其中心距的计算公式为:
根据上述公式,
i1=y02+y20
i2=(y02+y20)2+4y112
i3=(y30+3y12)2+(3y21-y03)2
i4=(y30+y12)2+(y21+y03)2
i5=(y30-3y12)(y30+y12)[(y30+y12)2-(3y21+y03)2]
+(3y21-y03)(y21+y03)[(y21+3y03)2-(y21-y03)2]
i6=(y20-y02)[(y30+y12)2-(y21+y03)2]+4y11(y30+y12)(y21+y03)
i7=(3y21-y03)(y30+y12)[(y30+y12)2-(3y21-y03)2]
+(3y21-y03)(y21+y03)[(3y30+y12)2-(y21+y03)2]
对于每一张细菌电子显微图像都可以计算得到7个hu不变矩的值。
进一步的步骤3-3傅里叶描述子:
傅里叶描述子:假定细菌图像的细菌边界为u(n)=[x(n),y(n)],n=0,1,…,n-1。用复数表示:u(n)=x(n)+jy(n),n=0,1,…,n-1。
u(n)的傅里叶变换为:
傅里叶描述子:
傅里叶描述子就是,对轮廓进行傅里叶变换后,对式子进行展开,获取的式子的系数,它们也是没有量纲的变量,本文中选取7个傅里叶描述子个数作为特征。对于每一张细菌电子显微图像,都可以计算得到7个傅里叶描述子的值。
步骤3-4:计算单个细菌图像轮廓的周长为p;
步骤3-5:单个细菌图像轮廓的面积为a;
步骤3-6:按照最小面积计算,细菌轮廓的最小外接矩形的长轴为l,短轴为w;
步骤3-7:细菌轮廓形态比为
步骤3-8:细菌轮廓的密集度为
步骤3-9:将每一张图像计算的特征按照数组的方式进行排列:nk=[i1,i2,…i7,a(1),a(2),…,a(7),p,a,l,w,m,c],其中k表示当前图像的排位顺序,1≤k≤m。将所有特征放在同一个矩阵中,组成细菌图像特征矩阵x=[m,n]。其中,m为样本数量,n为每一个样本的特征数据。
步骤4:训练多个弱分类器,最终形成一个强分类器,通过使用adaboost方法对不同种类的细菌图像进行分类。
进一步的步骤4的adaboost算法过程:
通过单层决策树方法建立弱分类器:
设置步长为50,取每一列特征的最大值max,最小值min。
则阈值每次增加
所以每次的阈值大小为
每一次分类时,大于阈值的分类为+1,小于阈值的分类为-1。在进行二分类之后,将样本的分类结果与实现标记的样本实际标记进行比较。弱分类器的错误率为:
其中a为分类错误的样本数,m为所有样本数。
选择50次阈值中分类错误率最小的阈值作为本次弱分类器的阈值
由于目标细菌样本有四类,分别为大肠杆菌、艰难梭菌、福氏志贺菌以及肉毒梭菌。弱分类器只适用于二分类的情况,在进行多分类时,可以通过每一类样本对其他几类样本进行二分类的方法解决这个问题。
每个弱分类器的权值可以表示为:
在第一次弱分类器计算中,先分配样本的初始权值为:
如果样本被正确分类则:
如果样本被错误分类则:
计算出10个弱分类器之后,最终的强分类器为:
最终形成的强分类器即可用于4类细菌图像的分类,可以从4类细菌图像中找出肉毒梭菌图像。以此作为临床预检的重要判断标准之一。
一种基于adaboost对肉毒梭菌细菌电子显微图像的在线细菌筛选系统的主要模块包括如下:
连接电子显微镜的计算机端:将细菌的制样铜网放置在样本架上,调整后进行成像。根据成像特点拍摄尽量多的单个包含单个细菌完整信息图像。
图像预处理模块:通过数字图像传递技术将拍摄的细菌完整信息图像传输到进行算法处理的计算机上。用于对计算机端获取的细菌电子显微图像进行预处理,主要包括图像格式转换及图像标尺的对标工作,保证后续特征提取有意义。
特征提取模块:对预处理模块获取的处理后的图像提取图像中的细菌轮廓特征,其特征包括hu不变距、傅里叶算子、最小外接矩形的长轴短轴,长宽比,面积周长、密集度和形态比等9类特征。
结果预测模块:结果预测模块为训练好的adaboost模型,将获取的图像特征矩阵输入到训练好的模型中,判断获取图像的类别,从而判断该图像显示的细菌的类别。
客户终端:最终的数据结果将分别输出于临床使用的计算机以及细菌分类使用的实验室等有需求的计算机终端。
本发明能够应用于临床肉毒梭菌的快速预检。
有益效果:
1.本发明可以在缩减传统方法培养菌落,进行基因测序所带来的大量时间成本,可以结合医生对于患者的诊断,做到及时快速预检,及时治疗,减少因为检测肉毒梭菌花费时间对病人带来的损伤。
2.本发明得到的用做测试集的样本,随着算法的不断使用而不断增加。有利于建立有一定数据基础的数据库。可以作为肉毒梭菌检测的专用数据库,不断提高肉毒梭菌图像检测的准确率,有利于建立肉毒梭菌图像的标准库。
附图说明
图1为本发明一种基于adaboost方法的细菌电子显微图像的细菌筛选系统的系统图。
图2为步骤2图像的预处理过程。
图3为步骤3的特征提取过程。
图4为特征参数矩阵建立过程。
图5为步骤4的adaboost算法流程图。
图6为电子显微镜获取的肉毒梭菌电子显微图像。
表1为获取的各类细菌其中一张电子显微图像的图像特征数据。
图7-9分别为svm、bp神经网络、adaboost算法的分类结果。
表2为adaboost算法与其他分类结果的对比情况。
具体实施方式
结合附图的内容和实施例对本发明进行详细说明。
如图1-9所示,本发明提供一种基于adaboost方法的细菌电子显微图像的细菌筛选系统,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1。图1为本发明一种基于adaboost方法进行肉毒梭菌细菌电子显微图像的细菌筛选系统的系统图,如图所示,其实处理步骤,包括如下:
步骤1:在电子显微镜获取清晰的单个细菌清晰图像之后,将其进行保存,通过数字图像传输技术将图像传输到图像预处理模块。两个模块之间设有防火墙,防止仪器损坏造成的损失。
步骤2:在系统中包含的图像预处理模块,将获取的原始图像从.gif格式转换为.jpg格式,并通过霍夫变换缩放图像大小,统一图像的标尺。图2-图3描述了格式转换以及霍夫变换的过程。
步骤3:在特征提取模块获取每一张图像hu不变矩、傅里叶算子、周长、面积,最小外接矩形的长,宽,形态比以及密集度形成每一张图像的特征向量,再将其组成所有图像的特征矩阵。图4描述了特征数据矩阵形成的过程。
步骤4:在结果预测模块中,通过adaboost算法对获取的特征矩阵进行计算,通过建立多个弱分类器组合成强分类器,最终得到预测的结果,确认细菌类别。
步骤5:从结果预测模块得到的最终分类结果可以根据需求传送到所需的客户终端,提供具体的临床帮助。
表1选取了肉毒梭菌、艰难梭菌、大肠杆菌、福氏志贺菌各一张图像,进行特征提取,计算各类特征的数值。
表2为本文中选取肉毒梭菌、艰难梭菌、大肠杆菌、福氏志贺菌的图像数量,其中选择80%为测试集,20%为验证集。通过将肉毒梭菌的电子显微图像与其他几类常见致病菌进行分类,以此作为应用实例说明算法的作用。
从图7-图9可以看出:svm识别四类细菌的准确率为82.2%。bp神经网络的分类结果为80.6%。adaboost算法的分类结果为100%。由此可见,在细菌电子显微图像的识别分类上,adaboost算法存在其优越性,可以做到完全正确识别肉毒梭菌的电子显微图像,为临床诊断提供帮助。
应当理解的是,本发明的应用不限于上述的肉毒梭菌的鉴别,对疾控领域来说,可以根据上述说明变换研究对象,对于其他的致病菌的鉴别都是成立的,该系统的设计思想和思路应属于本发明所附权利要求的保护范围。
表1-1细菌图像特征
表1-2傅里叶描述子
表1-3hu不变距
表2细菌图像样本分布