一种基于正则表达式语义的目标模型快速构建方法与流程

文档序号：12721412阅读：303来源：国知局

本发明涉及机器视觉技术与模式识别技术，具体涉及一种基于正则表达式的图像目标识别方法

背景技术：

对图像目标的识别就是对图像中表征物各种形式的可获取信息进行处理和分析。对目标物进行描述、辨认、分类和解释的过程。目标识别可分为有监督的分类和无监督的分类两种，两者的主要差别在于，各实验样本所属的类别是否预先已知。监督分类又称训练分类法，其原理是用被确认类别的样本像元去识别其他未知类别像元的过程。在分类之前通过目视判断等手段，对图像上的目标属性有了先验知识。一般来说有监督的分类往往需要提供大量已知类别的样本，根据已知训练区提供的样本，通过选择特征参数，求出特征参数作为决策规则，建立判别函数以对各待分类影像进行的图像分类，是模式识别的一种方法。要求训练区域具有典型性和代表性。经过多年的总结，人们设计出来多个监督训练特征提取的方法，总结起来可以分为四类：底层全局特征、底层局部特征、中层特征和属性特征。早期提出的Tamura纹理、颜色直方图、Harris算子、密集采样SIFT、Texton等特征提取主要为底层全局特征和底层局部特征。全局特征提取的是图像的全局颜色、纹理、形状等信息，对促进早期的图像理解任务特别是基于内容的图像检索系统的发展起了很大的推动作用。随着研究的深入，人们发现全局视觉特征已不能完全满足图像分类任务对提升分类精度的要求，而以SIFT特征为代表的局部特征具有更强的描述能力，从而能够满征。近年来由于局部特征对视觉描述能力日益完善，局部视觉特征的研究开始转向如何在保证描述能力的前提下提高局部特征的提取效率。与此同时，建立在局部特征基础上描述视觉内容机构信息的中层特征也开始得到学术界的重视，而结合图本身监督信息的属性特征也成为另一个研究热点。

技术实现要素：

本发明的目的是对图像中的被识别物进行识别，建立目标匹配时的匹配模板。为此提出一种基于正则表达式语义的目标模型快速构建方法。

本发明采用的技术方案是：

一种基于正则表达式语义的目标模型快速构建方法，包括以下步骤：

步骤1：获取目标识别物所在位置图像，然后进行图像预处理：选取图像采集点，获取被识别物的极大不变物理特征；步骤2：目标特征提取，包括颜色特征，空间位置特征，以及角点特征的提取和选取；步骤3：建立图像的像元素库，并对正则表达式进行引申定义：首先，根据一般物体的物理特性建立能够描述物体特征的像元素库，主要包括线条库、形状库、颜色库、空间位置信息库；接着利用正则语义对这些像元素进行组织，赋予他们描述物体特征的能力；步骤4：利用引申定义的正则语法描述出目标匹配模型。

进一步，所述步骤1是在特定场景下，选择从正侧面获取目标图像，这样能保证获取到的同一类目标物体具有最大的物理特征相似性；图像过滤和边缘强化：首先对图像进行灰度化处理，然后利用中值滤波对背景噪声进行过滤，最后通过canny算子对图像进行边缘强化。

进一步，所述步骤1还包括：

1)把图像序列中一点的值用该点的一个邻域中各点值的中值代替，让周围的像素值接近的真实值：用正方矩结构的二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升(或下降)的为二维数据序列；二维中值滤波输出为g(x,y)＝med{f(x-k,y-l),(k,l∈W)}，其中，f(x,y)，g(x,y)分别为原始图像和处理后图像，W为二维模板，选定为为3*3区域；

2)较高的亮度梯度比较有可能是边缘，但是没有一个确切的值来限定多大的亮度梯度是边缘多大，通过Canny算子中使用了滞后阈值，动态调节获取目标的有效梯度范围；假设图像中的重要边缘都是连续的曲线，这样就可以跟踪给定曲线中模糊的部分，并且避免将没有组成曲线的噪声像素当成边缘；从一个较大的阈值开始，这将标识出比较确信的真实边缘，从这些真正的边缘开始在图像中跟踪整个的边缘；在跟踪的时候，使用一个较小的阈值，这样就可以跟踪曲线的模糊部分直到回到起点。

进一步，所述步骤2具体包括：

颜色特征提取：对每种颜色通道提取一阶、二阶和三阶矩进行统计，设h_ij表示第i个颜色通道分量中灰度为j的像素出现的概率，n为总像素数目，则颜色矩的三个低阶矩数学表达式为：

这3个低阶矩分别称为均值、方差和偏斜度；

空间特征提取：为了提高对位置信息的描述相率，在计算特征向量位置信息时，采用D4模型进行计算：

D₄(P,Q)＝|x_p-x_q|+|y_p-y_q|

D4距离也就是街区距离，它只选择横竖两个方向计算相对距离；

基于Harris算子的角点特征提取：Harris角度检测是通过数学计算在图像上发现角度特征的一种算法，而且其具有旋转不变性的特质；在建立图像匹配的特征正则表达式之前，先通过Harris角度检测出图像特征的”字元素”，数学原理如下：

其中W(x,y)表示移动窗口，I(x,y)表示像素灰度值强度，范围为0～255；根据泰勒级数计算一阶到N阶的偏导数，最终得到一个Harris矩阵公式：

根据Harris的矩阵计算矩阵特征值λ₁,λ₂,然后计算Harris角度响应值：

R＝detM-K(traceM)²

detM＝λ₁λ₂

traceM＝λ₁+λ₂

其中K为系数值，通常取值范围为0.04～0.06之间。

进一步，所述步骤3中，

所述线条库按线形划分包括：水平直线、斜线、直角线，弧线，S形弧线，以及其他自定义线形；所述形状库包括正方形，长方形，圆形，半圆形，菱形，心形，以及其他自定义的非常规图形；所述颜色库通过字母加数字变量Wk的方式标示，其中第一位字母W代表色系，后面数字变量k代表亮度，取值范围为0-255之间；

所述位置信息库由完全自定义的符号来描述图像中的相对位置信息，“|(x1)->(x2)|”代表从像元x1位置开始一直水平向右到像元X2结束；“|(x1)-^(k)(x2)||”表示从像元x1开始到其垂直下方像元x2的k处，其中K为可变系数，可以取0-1之间数值。

进一步，所述步骤3中给出的水平和垂直位置信息的基础定义，位置信息的定义符号和定义规则可视实际情况自行定义和添加；本处所描述的像元素库是一个开放式的元素库，用于描述物理特性的技术指标均可以作为像元素库的一个基础指标，如角度信息，温度信息，音色信息、振动信息均可以作为描述目标的一个元素库指标项进行扩展。

进一步，所述步骤4中，首先对目标外围特征点进行连通性连接，然后在连通图块内部按照最大相似度原则进行像元素的切割。即切割后的局部特征能够在像元素库中找到最相似的“像元素”。

本发明的有益效果是：

目标匹配模板获取的传统方法是通过大量的监督训练来完成。一般来说有监督的分类往往需要提供大量已知类别的样本，根据已知训练区提供的样本，通过选择特征参数，求出特征参数作为决策规则，建立判别函数以对各待分类影像进行的图像分类，这个过程需要消耗大量的计算资源，灵活性不高，训练出来的样本也不一定理想。本发明中通过引申定义的“正则算法”，结合预先定义好的像元素素材库，能够快速定义出被识别物的匹配模型，同时通过目视判断方法能够及时调整模型，具有很强的灵活性，在高速出口，产品生产线传送带等被识别物物理特性变化不大的应用场景下能够很快的构建出被识别物的匹配模型，能够极大提高目标识别的效率。

附图说明

下面结合附图和具体实施方式对本发明做进一步详细说明：

图1为目标识别流程图。

图2为某图像预处理后的效果图。

图3为某图像特征角点选取图标例。

图4为按照像元素库中的定义提取的像元素。

图5为利用引申定义的正则语法描述出目标匹配模型。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

图1为目标识别流程图，其中图像预处理目的是过滤环境干扰点，强化被提取物轮廓特征；特征提取包含基于颜色矩的颜色特征提取，基于不变几何的空间位置特征提取，形状特征提取；形状特征提取采用的是Harris角点特征提取算法，在选取的特征角点集合中选取最能代表被识别物几何特征的角点，最后通过正则表达语义规则，利用像元素的基础素材库描述出与目标特征最接近的目标匹配模型。

步骤1：获取目标识别物所在位置图像，然后进行图像预处理

(1)选取图像采集点，获取被识别物的极大不变物理特征。

具体方法是在特定场景下，比如高速出口，选择从正侧面获取目标图像，这样能保证获取到的同一类目标物体具有最大的物理特征相似性，从而提高匹配模型的匹配成功率。

(2)图像过滤和边缘强化

首先对图像进行灰度化处理，然后利用中值滤波对背景噪声进行过滤，最后通过canny算子对图像进行边缘强化，从而提高边缘特征提取的质量。

进一步采用数学形态学处理，具体包括：

1)把图像序列中一点的值用该点的一个邻域中各点值的中值代替，让周围的像素值接近的真实值，从而消除孤立的噪声点。方法是用正方矩结构的二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升(或下降)的为二维数据序列。二维中值滤波输出为g(x,y)＝med{f(x-k,y-l),(k,l∈W)}，其中，f(x,y)，g(x,y)分别为原始图像和处理后图像。W为二维模板，选定为为3*3区域。

2)较高的亮度梯度比较有可能是边缘，但是没有一个确切的值来限定多大的亮度梯度是边缘多大，通过Canny算子中使用了滞后阈值——高阈值与低阈值，可以动态调节获取目标的有效梯度范围。假设图像中的重要边缘都是连续的曲线，这样就可以跟踪给定曲线中模糊的部分，并且避免将没有组成曲线的噪声像素当成边缘。所以从一个较大的阈值开始，这将标识出比较确信的真实边缘，可以从这些真正的边缘开始在图像中跟踪整个的边缘。在跟踪的时候，使用一个较小的阈值，这样就可以跟踪曲线的模糊部分直到回到起点。图2是经过边缘检测和滤波后得到轮廓边缘，从而对这些轮廓边缘进行强化。

步骤2：目标特征提取，包括颜色特征，空间位置特征，以及角点特征的提取和选取。(1)颜色特征提取

由于颜色信息主要集中在低阶矩中，故只需对每种颜色通道提取一阶、二阶和三阶矩进行统计。设h_ij表示第i个颜色通道分量中灰度为j的像素出现的概率，n为总像素数目，则颜色矩的三个低阶矩数学表达式为：

这3个低阶矩分别称为均值、方差和偏斜度。

(2)空间特征提取

为了提高对位置信息的描述相率，在计算特征向量位置信息时，采用D4模型进行计算：

D₄(P,Q)＝|x_p-x_q|+|y_p-y_q| (4)

D4距离也就是街区距离，它只选择横竖两个方向计算相对距离，在定位描述上更加简便。

(3)基于Harris算子的角点特征提取

Harris角度检测是通过数学计算在图像上发现角度特征的一种算法，而且其具有旋转不变性的特质。在建立图像匹配的特征正则表达式之前，先通过Harris角度检测出图像特征的”字元素”，数学原理如下：

其中W(x,y)表示移动窗口，I(x,y)表示像素灰度值强度，范围为0～255。根据泰勒级数计算一阶到N阶的偏导数，最终得到一个Harris矩阵公式：

根据Harris的矩阵计算矩阵特征值λ₁,λ₂,然后计算Harris角度响应值：

其中K为系数值，通常取值范围为0.04～0.06之间。图3为提取出的特征点。

步骤3：建立图像的像元素库并对正则表达式进行引申定义

首先，根据一般物体的物理特性建立能够描述物体特征的像元素库，主要包括线条库、形状库、颜色库、空间位置信息库：接着可以利用正则语义对这些像元素进行组织，赋予他们描述物体特征的能力。

其中线条库按线形可以分为：水平直线、斜线、直角线，弧线，S形弧线等常规线条以及其他自定义线形等，形状库包含，正方形，长方形，圆形，半圆形，菱形，心形等常规形状，以及其他自定义的非常规图形。颜色库通过字母加数字的方式标示，如:Wk,其中第一位字母W代表色系，后面数字k代表亮度，取值范围为0-255之间。位置信息库由完全自定义的符号来描述图像中的相对位置信息，如“|(x1)->(x2)|”代表从像元x1位置开始一直水平向右到像元X2结束，而“|(x1)-^(k)(x2)||”则表示从像元x1开始到其垂直下方像元x2的k处，其中K为可变系数，可以取0-1之间数值，如取0.25表示x1到x2之间距离的四分之一处，此处只是给出了水平和垂直位置信息的基础定义，位置信息的定义符号和定义规则可视实际情况自行定义和添加。本处所描述的像元素库是一个开放式的元素库，用于描述物理特性的技术指标均可以作为像元素库的一个基础指标，如角度信息，温度信息，音色信息、振动信息等均可以作为描述目标的一个元素库指标项进行扩展。

表1像元素库

接着可以利用正则语义对这些像元素进行组织，赋予他们描述物体特征的能力。正则表达式，又称规则表达式，计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组、合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式的核心思想是对被描述物进行抽象化和归类。给定一个正则表达式和另一个字符串，我们可以达到如下的目的：

1.给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”)；

2.可以通过正则表达式，从字符串中获取我们想要的特定部分；

表2传统正则语法

表1中是用于描述图像特征的部分“像元素”，把这些像元素按照正则表达式的语法进行组织，能够快速的定义出图像的局部特征。比如：|●->●||该表达式可以表示图像中匹配水平方向上两个黑色圆形的部分。当然也可以像定义文本正则表达式一样，用一些更加简洁的字符代表图像正则的“像元素”。

步骤4：利用引申定义的正则语法描述出目标匹配模型：

在图3的基础上选择最能够描述图像特征的特征点，参照像元素库中的定义提取像元素，如图4。首先对目标外围特征点进行连通性连接，然后在连通图块内部按照最大相似度原则进行像元素的切割。即切割后的局部特征能够在像元素库中找到最相似的“像元素”。在切割后的图4中可以提取到形状像元：梯形、长方形、圆形。提取到的颜色像元为：w12(白色12号)、B10(黑色10号)，提取到的位置像元信息为“|-^||”(从上边位置到下边位置)、“|-^(0.25)||”(从上边位置到下面位置的四分之一处)、“|-^|(0.75)|”(从上边位置到下边位置的四分之三处)。

所提取到的像元素如下表：

表3基础像元素

基于表3中的像元素，可以构建出基于像元素的目标匹配正则表达:

表达式按照从左到右的优先级进行目标模型的描述。“{}”中的内容表示一个描述整体，即其中位置信息的描述都是相对于括号中的第一个像元素而言。上式中的描述可以理解为以一个色号为w12的梯形开始，这个梯形的垂直下方接一个色号为B10的色块元素，后面垂直方向为一个“{}”形式的描述体，描述体中的内容为一个色号W12开始的矩形，在其下边位置的1/4处有一个色号为B10的圆形，在下边的3/4处又有一个色号B10的圆形。其描述的图形特征如图5所示。

优选实施例：

本发明的一个最优具体实施方式：在目标物体完整面架设图像采集装置，获取到图像的最大物理特性，通过中值滤波和canny算子对目标边缘进行增强和降噪预处理，这样可以提高特征点的获取质量，接下来通过harris算子检测到图像中的边缘角点，选取最能标示被识别物物理特征的角点，通过颜色矩提出颜色信息，D4算子计算图像相对位置信息。最后利用建立好的像元素库通过引申定义的正则表达式语义描述出最接近识别目标的匹配模型。

基于字符元的正则表达式因其匹配效率高，适配性好，已在文本字符检索中得到了广泛的应用，图像匹配和字符匹配虽然在匹配内容上存在较大差异，但在匹配方法上可以找到其共同性，即都可以通过有规律的组织基础元素构建匹配模型的方法，对目标进行识别。基于此点共同性，本文将正则表达式的语义通过赋予图形属性特征进行了引申定义，引入了“像元素”的新概念和语义规则，实验表明，通过编写图像匹配正则表达式，完全能够快速、便捷的建立图像特征匹配模型，实现目标匹配的目的。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：芦兵;许晓东;夏纯中
技术所有人：江苏大学
我是此专利的发明人

上一篇：一种简易连接件的制作方法与工艺
上一篇：一种关于限制性玻尔兹曼机的改进方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。