基于字符编码标志的识别及定位方法与流程

文档序号：15447518发布日期：2018-09-14 23:32阅读：295来源：国知局

本发明属于数字近景摄影测量技术领域，具体涉及一种适用于大尺寸结构和动态测量对象的基于字符编码标志的识别及定位方法。

背景技术：

对大视场范围内的大尺寸结构进行动态测量时，结构表面往往缺乏清晰可辨识度高的纹理特征，不便于直接快速、准确地提取结构表面的特征信息，不能满足实验要求。目前，通常采用在被测结构上人工布设合作标志的方式产生特征点用于识别、追踪，因此，具有唯一编码值的人工合作标志的设计与应用受到广泛研究与关注，如何设计出结构简单，具有唯一编码值且数量丰富的方案且识别定位快速精准的方法成为行业研究的热点。

现有的编码合作标志主要有环形编码合作标志和点状分布编码合作标志两种，如范生宏于2006年在工业数字摄影测量中人工标志的研究与应用中提出的环型编码标志采用了同心圆环形编码方法，编码圆环被等角度分为n等分，每一等分的编码位采用0或1二进制，其设计原理简单，编码数量随着n值增大而增加，但当n增加到一定数量时，每一个编码位的区域变小。当目标物振动比较大或者摄像机成像畸变较大时，被测物表面上的编码标志图案成像也会发生失真，容易导致编码区识别错误而出现误判的现象。此外，现有的环形编码合作标志和点状分布编码合作标志的解码原理相对复杂，对印刷精度要求较高，且光照变化和镜头畸变会引起图像特征提取误差，进一步容易导致编码区识别错误而误匹配的现象。

因此，提供一种简易可靠的合作编码标志及相应的高精度定位和准确的解码识别方法是大尺寸动态测量领域的迫切需求。

技术实现要素：

本发明的目的在于避免现有技术中的不足而提供一种基于字符编码标志的识别及定位方法，其识别准确可靠，定位精度高。

本发明的目的通过以下技术方案实现：

一方面，本发明提供一种基于字符编码标志的识别方法，所述编码标志由实心圆和设置在实心圆内的编码字符组成，所述实心圆部分取背景色，所述编码字符部分取前景色，背景色与前景色具有对比灰度值，不同的编码字符对应设定有唯一的编码值，所述识别方法包括如下步骤：

s1、读入含有编码标志的图像；

s2、对含有编码标志的图像进行中值滤波，将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值，中值滤波具体采用二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升或下降二维数据序列：

g(x,y)＝med{f(x-k,y-l),(k,l∈w)}(1)

其中，f(x,y),g(x,y)分别为原始图像和滤波后图像，x为像素点在图像坐标系中x轴方向的坐标，y为像素点在图像坐标系中y轴方向的坐标，w为二维滑动模板；k,l是由二维滑动模板的尺寸所决定的变量，取整数，例如模板为3*3，那么k、l取-3～3之间的整数。

s3、采用阈值分割法对滤波后的图像进行分割二值化，获取前景色的字符特征区域achar，阈值分割法采用两个阈值(t1，t2)：

其中，b(x,y)为二值化分割后的图像；

s4、对分割后的字符特征区域进行分类识别，通过查表法获取该编码标志对应的编码值。

作为进一步的改进，在步骤s3中，阈值分割采用otsu双阈值法分割，具体为：

设一幅图像的灰度值分为0～255级，灰度值为i的像素数为ni，则总像素数n为：

各灰度值出现的概率pi为：

pi＝ni/n(4)

整幅图像的灰度平均值m为：

将全部灰度值分为三类：

c0＝{0～t1}，c1＝{t1+1～t2}，c2＝{t2+1～255}

设c0出现的概率为ω0，其灰度平均值为m0；c1出现的概率为ω1，其灰度平均值为m1。c2出现的概率为ω2，其灰度平均值为m2，则：

otsu双阈值法求取公式为：

根据式(12)求出每次对应的f(t1，t2)，其中的最大值对应的(t1,t2)即为otsu双阈值法求取的最佳阈值。

作为进一步的改进，在步骤s4中，对字符特征区域achar采用多层感知神经网络分类器训练的模型进行分类识别。

作为进一步的改进，在步骤s4中，采用多层感知神经网络分类器训练的模型训练字符模板，建立字符分类器。

作为进一步的改进，编码字符的训练样本包括数字、字母以及汉字，对任一形状的字符生成相应的旋转、倾斜、噪声、局部变形、径向变形、笔画宽度变化、放大、缩小后的变体样本库。

本发明提供的基于字符编码标志的识别方法，所述编码标志由实心圆和设置在实心圆内的编码字符组成，所述实心圆部分取背景色，所述编码字符部分取前景色，背景色与前景色具有对比灰度值，不同的编码字符对应设定有唯一的编码值，所述识别方法包括如下步骤：s1、读入含有编码标志的图像；s2、对含有编码标志的图像进行中值滤波，将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值，中值滤波具体采用二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升或下降二维数据序列；s3、采用阈值分割法对滤波后的图像进行分割二值化，获取前景色的字符特征区域achar；s4、对分割后的字符特征区域进行分类识别，通过查表法获取该编码标志对应的编码值。本发明基于字符编码标志，通过分类识别对字符编码标志中的不同的编码字符进行识别，得到对应设定的唯一编码值，其能够快速、准确、稳定地识别出合作编码标志。

另一方面，本发明还提供一种基于字符编码标志的定位方法，所述编码标志由实心圆和设置在实心圆内的编码字符组成，所述实心圆部分取背景色，所述编码字符部分取前景色，背景色与前景色具有对比灰度值，不同的编码字符对应设定有唯一的编码值，其特征在于，所述定位方法包括如下步骤：

s1、读入含有编码标志的图像；

s2、对含有编码标志的图像进行中值滤波，通过灰度阈值分割二值化获取编码标志的背景色的实心圆特征区域acircle和前景色的字符特征区域achar；

s3、对实心圆特征区域acircle内部缺失部分进行填充修复，得到完整的圆形区域atotal；

s4、对整体编码标志的圆形区域atotal进行灰度平滑；

s5、对平滑后的区域采用灰度质心法求取该编码标志的亚像素定位坐标。

作为进一步的改进，在步骤s4中，进行灰度平滑时，先获取原图像中编码标志圆区域的灰度均值t，再将字符特征区域achar对应的像素点灰度值ichar减去均值t，实心圆特征区域acircle对应的像素点灰度值icircle加上灰度均值t，灰度均值t计算公式如下：

其中，ichar(x,y),icircle(x,y)分别为字符特征区域和实心圆特征区域的图像灰度值，m,n分别为字符区域和实心圆特征区域的像素个数。

作为进一步的改进，在步骤s2中，阈值分割采用otsu双阈值法。

本发明提供的基于字符编码标志的定位方法，所述编码标志由实心圆和设置在实心圆内的编码字符组成，所述实心圆部分取背景色，所述编码字符部分取前景色，背景色与前景色具有对比灰度值，不同的编码字符对应设定有唯一的编码值，所述定位方法包括如下步骤：s1、读入含有编码标志的图像；s2、对含有编码标志的图像进行中值滤波，通过灰度阈值分割二值化获取编码标志的背景色的实心圆特征区域acircle和前景色的字符特征区域achar；s3、对实心圆特征区域acircle内部缺失部分进行填充修复，得到完整的圆形区域atotal；s4、对整体编码标志的圆形区域atotal进行灰度平滑；s5、对平滑后的区域采用灰度质心法求取该编码标志的亚像素定位坐标。本发明基于圆形的字符编码标志，通过阈值分割获取编码标志区域，对图像含有噪声和光照发生变化等情况都具有很好的鲁棒性，针对灰度平滑的圆形区域采用灰度质心方法，可以达到亚像素定位精度。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1为字符编码标志的示意图。

图2为字符编码标志区域分割示意图。

图3为字符编码标志对应的编码值索引表。

图4为基于字符编码标志的识别及定位方法的流程图。

图5为三层bp神经网络模型。

具体实施方式

为了使本领域的技术人员更好地理解本发明的技术方案，下面结合附图和具体实施例对本发明作进一步详细的描述，需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

本发明实施例所提供的识别方法及定位方法均基于如图1所示的字符编码标志，所述字符编码标志由实心圆和设置在实心圆内的编码字符组成，编码字符可以为数字、字母、汉字等任意具有一定形状的符号，字符的宽和高小于实心圆的直径。实心圆部分取背景色，字符形状部分取前景色；背景色与前景色具有鲜明的对比灰度值，如，实心圆取黑色，字符取白色。不同的编码字符对应设定有唯一的编码值，不同字符编码标志对应的编码值索引表如图3所示。上述字符编码标志通过对编码标志上的字符进行识别，可实现快速精确解码，圆形标志易于精确定位，适用于动态匹配以及大视场拼接等场合。

结合图2和图4所示，本发明实施例提供了一种基于上述字符编码标志的识别方法，所述识别方法包括如下步骤：

s1、读入含有编码标志的图像；

s2、对含有编码标志的图像进行中值滤波，中值滤波法是一种非线性平滑技术，它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替，让周围的像素值接近的真实值，从而消除孤立的噪声点。方法是采用二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升或下降二维数据序列：

g(x,y)＝med{f(x-k,y-l),(k,l∈w)}(1)

其中，f(x,y),g(x,y)分别为原始图像和滤波后图像，x为像素点在图像坐标系中x轴方向的坐标，y为像素点在图像坐标系中y轴方向的坐标，w为二维滑动模板；k,l是由二维滑动模板的尺寸所决定的变量，取整数，例如模板为3*3，那么k,l取-3～3之间的整数，例如模板为5*5，那么k,l取-5～5之间的整数。

s3、采用阈值分割法对滤波后的图像进行分割二值化，获取前景色的字符特征区域achar，阈值分割法采用两个阈值(t1，t2)：

其中，b(x,y)为二值化分割后的图像；

上述步骤实现了自动最优选取双阈值，对灰度直方图呈现三峰特性的字符编码标志图像进行分割，可以获得良好的二值化效果。

s4、对分割后的字符区域进行分类识别，通过查表法获取该编码标志对应的编码值。具体的，对字符特征区域achar采用多层感知神经网络分类器(mlp，multi-layerperceptron)训练的模型进行分类识别，采用多层感知神经网络分类器训练的模型训练字符模板，建立字符分类器。编码字符的训练样本包括数字、字母以及汉字，对任一形状的字符生成相应的旋转、倾斜、噪声、局部变形、径向变形、笔画宽度变化、放大、缩小后的变体样本库，大量的变形样本可大大提高分类器的正确识别率。

作为进一步优选的实施方式，在步骤s3中，阈值分割采用otsu双阈值法(日本学者otsu提出的一种算法，也叫最大类间方差法)分割，对图像含有噪声和光照发生变化等情况都具有很好的鲁棒性。otsu双阈值法具体为：

设一幅图像的灰度值分为0～255级，灰度值为i的像素数为ni，则总像素数n为：

各灰度值出现的概率pi为：

pi＝ni/n(4)

整幅图像的灰度平均值m为：

将全部灰度值分为三类：

c0＝{0～t1}，c1＝{t1+1～t2}，c2＝{t2+1～255}

设c0出现的概率为ω0，其灰度平均值为m0；c1出现的概率为ω1，其灰度平均值为m1。c2出现的概率为ω2，其灰度平均值为m2，则：

otsu双阈值法求取公式为：

根据式(12)求出每次对应的f(t1，t2)，其中的最大值对应的(t1,t2)即为otsu双阈值法求取的最佳阈值。

下面对多层感知神经网络分类器(mlp)训练模型进行说明：

图5给出了一个三层神经网络模型结构。输入向量为x＝(x1,x2,...xi,...xn)^t，将字符图像归一化到a×a(本实施例中a＝8)个网格大小，将其分割成8×8块，则n＝8×8＝64，x1代表字符相应像素点的灰度值，隐层(中间层)的输入向量为s＝(s1,s2,...sj,...sp)^t，隐层(中间层)的输出向量为b＝(b1,b2,...bj,...bp)^t，输出层的输入向量为c＝(c1,c2,...ck,...ct)^t，输出层的输出向量为y＝(y1,y2,...,yk,...yt)^t(其中yk＝0或1代表输入图像对应某字符的可能性)。

其中，输入层至隐层的连接权为隐层至输出层的连接权为隐层的阀值为h＝(h1,h2,...hj,...hp)^t，输出层的阀值为r＝(r1,r2,...rk,...rt)^t，激活神经元的传递函数为f(·)，多采用非线性变换函数—sigmoid函数(又称s函数)，本实施例中采用

则有以下关系式：

中间层的输入向量:s＝wx-h；

中间层的输出向量：b＝f(s)；

输出层的输入向量：c＝vb-r；

输出层的输出向量：y＝f(c)；

输出误差为：ek＝dk-yk；

输出误差的能量总和为：

对模型的训练过程即为找到最佳的权值和阀值，使得输出误差能量总和最小。本实施例中，我们采用梯度下降法获得模型参数的更新规律，即：

△vjk＝-β(dk-yk)yk(1-yk)bj

△rk＝λ(dk-yk)yk(1-yk)

以上公式中，λ、β∈(0～1)，dk为模型的理想输出值。

训练好之后就可以利用该mlp模型识别编码字符。

结合图2和图4所示，本发明实施例还提供一种基于字符编码标志的定位方法，所述编码标志由实心圆和设置在实心圆内的编码字符组成，所述实心圆部分取背景色，所述编码字符部分取前景色，背景色与前景色具有对比灰度值，不同的编码字符对应设定有唯一的编码值，所述定位方法包括如下步骤：

s1、读入含有编码标志的图像；

s2、对含有编码标志的图像进行中值滤波，通过灰度阈值分割二值化获取编码标志的背景色的实心圆特征区域acircle和前景色的字符特征区域achar，对图像含有噪声和光照发生变化等情况都具有很好的鲁棒性。

s3、对实心圆特征区域acircle内部缺失部分进行填充修复，得到完整的圆形区域atotal；

s4、对整体编码标志的圆形区域atotal进行灰度平滑：

进行灰度平滑时，先获取原图像中编码标志圆区域的灰度均值t，再将字符特征区域achar对应的像素点灰度值ichar减去均值t，实心圆特征区域acircle对应的像素点灰度值icircle加上均值t。

s5、对平滑后的圆形区域采用灰度质心法求取该编码标志的亚像素定位坐标：

其中，(xi,yi)表示区域中第i点的像素坐标，pi表示区域中第i点的灰度值。

采用灰度质心方法求取编码标志的坐标，可以达到亚像素定位精度。

作为进一步优选的实施方式，在步骤s4中，进行灰度平滑时，先获取原图像中编码标志圆区域的灰度均值t，再将字符特征区域achar对应的像素点灰度值ichar减去均值t，实心圆特征区域acircle对应的像素点灰度值icircle加上灰度均值t，灰度均值t计算公式如下：

其中，ichar(x,y),icircle(x,y)分别为字符特征区域和实心圆特征区域的图像灰度值，m,n分别为字符区域和实心圆特征区域的像素个数。

作为进一步优选的实施方式，在步骤s2中，阈值分割采用otsu双阈值法。

上面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，不能理解为对本发明保护范围的限制。

总之，本发明虽然列举了上述优选实施方式，但是应该说明，虽然本领域的技术人员可以进行各种变化和改型，除非这样的变化和改型偏离了本发明的范围，否则都应该包括在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王文韫;陈安华;李学军;胡小平
技术所有人：湖南科技大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。