一种机器视觉检测方法与流程

文档序号:18167713发布日期:2019-07-13 09:43阅读:649来源:国知局
一种机器视觉检测方法与流程
本发明涉及机器视觉检测
技术领域
,具体涉及一种机器视觉检测方法。
背景技术
:近年来,人工智能取得了飞速的发展,机器视觉便是其中之一。行人检测是机器视觉中的重要问题,在安防监控、智能驾驶、智能机器人等领域得到广泛的应用。目前,基于机器学习的方法是行人检测算法的主流,该方法主要通过结合人工特征和分类器的方式来实现。在行人检测的常用特征中,有一类是lbp(localbinarypattern,局部二进制模式),它的做法是逐行扫描图像,对于图像中的每一个像素点,以该点的灰度作为阈值,对周围邻域进行二值化,按照一定的顺序将二值化的结果组成一个二进制数,以此二进制数的值作为该点的响应。但是,在上述lbp特征的计算过程中,周围邻域尤其是中心点的像素值,容易受到噪声的影响,发生突变,都会对特征提取的稳定性产生干扰;同时,针对传统lbp算子直接采用灰度图像,造成信息丢失,这些都会对后续的分类结果产生不利的影响。技术实现要素:本发明的目的在于克服现有技术的缺点与不足,提供一种机器视觉检测方法,该方法稳定性更强、更能充分表征行人信息,能够有效地提高行人检测的精度。本发明的目的通过下述技术方案实现:一种机器视觉检测方法,包括下述步骤:步骤一,获取图像;步骤二,图像预处理;对图像进行预处理,从原rgb图像提取三个通道,将得到的三个通道分成三幅灰度图像,分别进行后续的特征提取;步骤三,tlbp特征提取;对步骤二中获取的三个通道的灰度图像,分别进行如下处理:(1)对灰度图像进行分区;(2)求取每个分区的tlbp特征直方图;使用下述公式进行阈值计算:上式中,p表示中心点邻域像素点的个数,li表示邻域像素值,lc表示中心点像素值,max、min分别表示上述像素值中的最大值和最小值;遍历分区图像中的每一个点,选取其周围3x3的8邻域,以上述阈值进行二值化,得到一个8位的二进制数,如下所示:tlbp=v(t(l1-ln)…t(li-ln)…t(lp-ln)),其中,tlbp模式的十进制值为8位的二进制数总共有256种编码方式,采用统一化模式编码,去掉部分带有噪声的模式,构成59维的直方图,计算每一点对应的响应二进制数,对直方图进行投票,即可得到该分区的tlbp特征直方图;(3)对得到的tlbp特征直方图进行归一化直方图处理;(4)得到归一化处理后的直方图提取tlbp特征;步骤四,特征级联,得到ctlbp特征;步骤五,使用svm分类器,将步骤四得到的ctlbp特征向量输入svm分类,得到检测结果。本发明与现有技术相比具有以下的有益效果:本发明考虑到噪声的影响,包括中间和邻域像素的突变,在传统方法基础上,改用邻域均值为lbp特征提取的阈值,得到tlbp特征,可以提升lbp特征的计算方式,改善特征提取的稳定性;其次,tlbp特征从灰度图像中提取,从彩色图像转换为灰度图像会丢失大量的信息,通过采用rgb的三通道图像的级联特征,得到ctlbp特征,能够获取更加充分的信息,提高行人检测的精度。附图说明图1为本发明的整体流程图;图2为本发明的tlbp特征提取示意图。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。如图1~2所示,一种机器视觉检测方法,包括下述步骤:步骤一,获取图像;本发明中采用的图像数据集是从网络上下载的inria数据集,获取到的图像是64x128的分辨率,所有的正样本图像均是直立、居中的行人。步骤二,图像预处理;对图像进行预处理,从原rgb图像提取三个通道,将得到的三个通道分成三幅灰度图像,分别进行后续的特征提取。步骤三,tlbp特征提取;通过使用3x3邻域的均值作为阈值,提取tlbp(thresholdbasedlocalbinarypattern,基于阈值的局部二进制模式)特征,对步骤二中获取的三个通道的灰度图像,分别进行如下处理:(1)对灰度图像进行分区;图像的尺度为64x128,这里取每个分区大小为16x16的块,对灰度图像进行遍历,得到每一个分区,取步长为8,在水平和竖直方向移动,最后得到105个块,接着,求取每一个分区的tlbp特征直方图;(2)求取每个分区的tlbp特征直方图。现有技术中,lbp特征计算时,阈值采用的是中心点的像素值,本发明使用一种稳定性更强的阈值计算方式:上式中,p表示中心点邻域像素点的个数,li表示邻域像素值,lc表示中心点像素值,max、min分别表示上述像素值中的最大值和最小值;遍历分区图像中的每一个点,选取其周围3x3的8邻域,以上述阈值进行二值化,得到一个8位的二进制数,如下所示:tlbp=v(t(l1-ln)…t(li-ln)…t(lp-ln)),其中,tlbp模式的十进制值为8位的二进制数总共有256种编码方式,采用统一化模式编码,去掉部分带有噪声的模式,构成59维的直方图,计算每一点对应的响应二进制数,对直方图进行投票,即可得到该分区的tlbp特征直方图。(3)对得到的tlbp特征直方图进行归一化直方图处理;对分区特征向量进行归一化操作,考虑到不同的归一化因子,对向量特征的抗干扰性会有较大的影响,本实施例中采用l2-norm归一化因子,取得的效果好。(4)得到归一化处理后的直方图提取tlbp特征;作为对lbp特征的第一个改进,将得到的特征称为tlbp(thresholdbasedlocalbinarypattern,基于阈值的局部二进制模式),选择邻域的像素均值,可以有效减小像素值突变对lbp模式中二值化提取造成的干扰,有利于整个检测精度。步骤四,特征级联,得到ctlbp特征;将步骤三得到的三个通道的tlbp特征直方图级联在一起,形成177维的特征向量,得到最终的ctlbp(colorandthresholdbasedlocalbinarypattern,基于颜色和阈值的局部二进制模式)特征;将原rgb图像的三个分量图像通过上述方法提取特征,然后进行级联,得到最终的特征。作为对现有特征提取方式的又一改进,将得到的特征称为ctlbp(colorandthresholdbasedlocalbinarypattern,基于颜色和阈值的局部二进制模式),直接通过rgb图像提取三通道的特征,可以充分利用图像信息,进一步提高后面的分类精度。步骤五,使用svm分类器,将步骤四得到的ctlbp(colorandthresholdbasedlocalbinarypattern,基于颜色和阈值的局部二进制模式)特征向量输入svm分类,得到检测结果;对于svm分类器,考虑inria数据集样本线性可分,样本特征向量为x,类标签y∈{-1,+1},只有行人和非行人两类。要对这两类样本进行分类。目标就是寻找最优分割超平面,即根据训练样本确定最大分类间隔的分割超平面,设最优超平面为wtx+b=0,根据点到平面的距离公式,样本x与最佳超平面之间的距离为通过等比例地缩放权矢量w和偏差项b,则最佳超平面存在着许多解,对超平面进行规范化,选择使得距超平面最近的样本xk满足|wtxk+b|=1的w和b,即得到规范化超平面。此时从最近样本到边缘的距离为:且分类间隔变为:通过事先采用训练样本,训练得到使得分类间隔最大的w和b,将检测样本的特征向量代入超平面方程,判断属于哪一类。采用svm分类器,将inria训练集中的图像通过上述处理后,得到的特征向量,输入svm分类,得到检测结果。实验采用lbp特征、tlbp特征以及本发明提出的ctlbp特征的方法来进行验证检测效果,结果如下表所示:特征维度精度lbp2688083.3%tlbp619585.4%ctlbp1858587.3%实验数据表明,在精度方面,ctlbp相比lbp提高了4%,而tlbp相对lbp也有2.1%提升,两种改进方式均对精度提升有作用,故本发明方法有效。本发明考虑到噪声的影响,包括中间和邻域像素的突变,在传统方法基础上,改用邻域均值为lbp特征提取的阈值,得到tlbp特征,可以提升lbp特征的计算方式,改善特征提取的稳定性;其次,tlbp特征从灰度图像中提取,从彩色图像转换为灰度图像会丢失大量的信息,通过采用rgb的三通道图像的级联特征,得到ctlbp特征,能够获取更加充分的信息,提高行人检测的精度。上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1