一种机器视觉检测方法与流程

文档序号：18167713发布日期：2019-07-13 09:43阅读：649来源：国知局

本发明涉及机器视觉检测
技术领域：
，具体涉及一种机器视觉检测方法。
背景技术：
：近年来，人工智能取得了飞速的发展，机器视觉便是其中之一。行人检测是机器视觉中的重要问题，在安防监控、智能驾驶、智能机器人等领域得到广泛的应用。目前，基于机器学习的方法是行人检测算法的主流，该方法主要通过结合人工特征和分类器的方式来实现。在行人检测的常用特征中，有一类是lbp(localbinarypattern,局部二进制模式)，它的做法是逐行扫描图像，对于图像中的每一个像素点，以该点的灰度作为阈值，对周围邻域进行二值化，按照一定的顺序将二值化的结果组成一个二进制数，以此二进制数的值作为该点的响应。但是，在上述lbp特征的计算过程中，周围邻域尤其是中心点的像素值，容易受到噪声的影响，发生突变，都会对特征提取的稳定性产生干扰；同时，针对传统lbp算子直接采用灰度图像，造成信息丢失，这些都会对后续的分类结果产生不利的影响。技术实现要素：本发明的目的在于克服现有技术的缺点与不足，提供一种机器视觉检测方法，该方法稳定性更强、更能充分表征行人信息，能够有效地提高行人检测的精度。本发明的目的通过下述技术方案实现：一种机器视觉检测方法，包括下述步骤：步骤一，获取图像；步骤二，图像预处理；对图像进行预处理，从原rgb图像提取三个通道，将得到的三个通道分成三幅灰度图像，分别进行后续的特征提取；步骤三，tlbp特征提取；对步骤二中获取的三个通道的灰度图像，分别进行如下处理：(1)对灰度图像进行分区；(2)求取每个分区的tlbp特征直方图；使用下述公式进行阈值计算：上式中，p表示中心点邻域像素点的个数，li表示邻域像素值，lc表示中心点像素值，max、min分别表示上述像素值中的最大值和最小值；遍历分区图像中的每一个点，选取其周围3x3的8邻域，以上述阈值进行二值化，得到一个8位的二进制数，如下所示：tlbp＝v(t(l1-ln)…t(li-ln)…t(lp-ln))，其中，tlbp模式的十进制值为8位的二进制数总共有256种编码方式，采用统一化模式编码，去掉部分带有噪声的模式，构成59维的直方图，计算每一点对应的响应二进制数，对直方图进行投票，即可得到该分区的tlbp特征直方图；(3)对得到的tlbp特征直方图进行归一化直方图处理；(4)得到归一化处理后的直方图提取tlbp特征；步骤四，特征级联，得到ctlbp特征；步骤五，使用svm分类器，将步骤四得到的ctlbp特征向量输入svm分类，得到检测结果。本发明与现有技术相比具有以下的有益效果：本发明考虑到噪声的影响，包括中间和邻域像素的突变，在传统方法基础上，改用邻域均值为lbp特征提取的阈值，得到tlbp特征，可以提升lbp特征的计算方式，改善特征提取的稳定性；其次，tlbp特征从灰度图像中提取，从彩色图像转换为灰度图像会丢失大量的信息，通过采用rgb的三通道图像的级联特征，得到ctlbp特征，能够获取更加充分的信息，提高行人检测的精度。附图说明图1为本发明的整体流程图；图2为本发明的tlbp特征提取示意图。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。如图1～2所示，一种机器视觉检测方法，包括下述步骤：步骤一，获取图像；本发明中采用的图像数据集是从网络上下载的inria数据集，获取到的图像是64x128的分辨率，所有的正样本图像均是直立、居中的行人。步骤二，图像预处理；对图像进行预处理，从原rgb图像提取三个通道，将得到的三个通道分成三幅灰度图像，分别进行后续的特征提取。步骤三，tlbp特征提取；通过使用3x3邻域的均值作为阈值，提取tlbp(thresholdbasedlocalbinarypattern，基于阈值的局部二进制模式)特征，对步骤二中获取的三个通道的灰度图像，分别进行如下处理：(1)对灰度图像进行分区；图像的尺度为64x128，这里取每个分区大小为16x16的块，对灰度图像进行遍历，得到每一个分区，取步长为8，在水平和竖直方向移动，最后得到105个块，接着，求取每一个分区的tlbp特征直方图；(2)求取每个分区的tlbp特征直方图。现有技术中，lbp特征计算时，阈值采用的是中心点的像素值，本发明使用一种稳定性更强的阈值计算方式：上式中，p表示中心点邻域像素点的个数，li表示邻域像素值，lc表示中心点像素值，max、min分别表示上述像素值中的最大值和最小值；遍历分区图像中的每一个点，选取其周围3x3的8邻域，以上述阈值进行二值化，得到一个8位的二进制数，如下所示：tlbp＝v(t(l1-ln)…t(li-ln)…t(lp-ln))，其中，tlbp模式的十进制值为8位的二进制数总共有256种编码方式，采用统一化模式编码，去掉部分带有噪声的模式，构成59维的直方图，计算每一点对应的响应二进制数，对直方图进行投票，即可得到该分区的tlbp特征直方图。(3)对得到的tlbp特征直方图进行归一化直方图处理；对分区特征向量进行归一化操作，考虑到不同的归一化因子，对向量特征的抗干扰性会有较大的影响，本实施例中采用l2-norm归一化因子，取得的效果好。(4)得到归一化处理后的直方图提取tlbp特征；作为对lbp特征的第一个改进，将得到的特征称为tlbp(thresholdbasedlocalbinarypattern，基于阈值的局部二进制模式)，选择邻域的像素均值，可以有效减小像素值突变对lbp模式中二值化提取造成的干扰，有利于整个检测精度。步骤四，特征级联，得到ctlbp特征；将步骤三得到的三个通道的tlbp特征直方图级联在一起，形成177维的特征向量，得到最终的ctlbp(colorandthresholdbasedlocalbinarypattern，基于颜色和阈值的局部二进制模式)特征；将原rgb图像的三个分量图像通过上述方法提取特征，然后进行级联，得到最终的特征。作为对现有特征提取方式的又一改进，将得到的特征称为ctlbp(colorandthresholdbasedlocalbinarypattern，基于颜色和阈值的局部二进制模式)，直接通过rgb图像提取三通道的特征，可以充分利用图像信息，进一步提高后面的分类精度。步骤五，使用svm分类器，将步骤四得到的ctlbp(colorandthresholdbasedlocalbinarypattern，基于颜色和阈值的局部二进制模式)特征向量输入svm分类，得到检测结果；对于svm分类器，考虑inria数据集样本线性可分，样本特征向量为x，类标签y∈{-1，+1}，只有行人和非行人两类。要对这两类样本进行分类。目标就是寻找最优分割超平面，即根据训练样本确定最大分类间隔的分割超平面，设最优超平面为wtx+b＝0，根据点到平面的距离公式，样本x与最佳超平面之间的距离为通过等比例地缩放权矢量w和偏差项b，则最佳超平面存在着许多解，对超平面进行规范化，选择使得距超平面最近的样本xk满足|wtxk+b|＝1的w和b，即得到规范化超平面。此时从最近样本到边缘的距离为：且分类间隔变为：通过事先采用训练样本，训练得到使得分类间隔最大的w和b，将检测样本的特征向量代入超平面方程，判断属于哪一类。采用svm分类器，将inria训练集中的图像通过上述处理后，得到的特征向量，输入svm分类，得到检测结果。实验采用lbp特征、tlbp特征以及本发明提出的ctlbp特征的方法来进行验证检测效果，结果如下表所示：特征维度精度lbp2688083.3％tlbp619585.4％ctlbp1858587.3％实验数据表明，在精度方面，ctlbp相比lbp提高了4％，而tlbp相对lbp也有2.1％提升，两种改进方式均对精度提升有作用，故本发明方法有效。本发明考虑到噪声的影响，包括中间和邻域像素的突变，在传统方法基础上，改用邻域均值为lbp特征提取的阈值，得到tlbp特征，可以提升lbp特征的计算方式，改善特征提取的稳定性；其次，tlbp特征从灰度图像中提取，从彩色图像转换为灰度图像会丢失大量的信息，通过采用rgb的三通道图像的级联特征，得到ctlbp特征，能够获取更加充分的信息，提高行人检测的精度。上述为本发明较佳的实施方式，但本发明的实施方式并不受上述内容的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘治;汤高扬;章云
技术所有人：广东工业大学
我是此专利的发明人

上一篇：异源图像的角点特征提取与描述方法与流程
上一篇：铁铜合金材料及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。