一种基于模板和特征匹配相结合的小字符数字识别方法_2

文档序号:8381351阅读:来源:国知局
[0046]采用线基元进行形态学闭操作处理修复待识别数字字符图像的垂直方向窄细的间隙。
[0047]通过对字符图像各列求和值的大小确定待识别数字字符的左右边框。
[0048]对小字符数字所在区域生成一个掩膜模板并定位出小字符数字的具体过程为:
[0049]求出字符数字所在的左右边框起止边界之后,可求出字符所在区域的左右起止边界,综合运用字符间的窄细间隙和字符数目以及字符所占的宽度信息可以求得小字符数字所在区域的掩膜模板;
[0050]将各个小字符数字所在区域的矩形区域赋值为1,余下的赋值为O ;
[0051]将此掩膜和原图像进行交操作并将掩膜值为O的位置设置为d = 128的灰度值;
[0052]进行灰度增强运算来提高局部区域像素的强度;
[0053]用Otsu算法进行二值化操作;
[0054]进行形态学开运算去除区域面积小于W(30像素)的小区域目标。
[0055]根据掩膜得到各个数字字符的起始列坐标,分割出各个数字字符图像。
[0056]对各个数字字符所在区域进行区域标记操作,这里区域标记操作使用matlab中的bwlabel函数进行,如图8所示,这里根据有效区域不处于图像四周的边界位置和区域大小的属性信息至多只保存三个标记区域,根据标记数的不同采用不同的识别方法。
[0057]根据小字符区域标记数目的不同,有以下三种识别字符模式:
[0058]模式一,小字符区域标记数目为1,具体操作如下:
[0059]步骤1.1,提取数字字符所在区域,去除字符前后多余的图像噪声;
[0060]步骤1.2,根据得到的数字字符的高度H确定此数字字符是单个数字字符还是单个数字字符的一部分;若H大于h (12像素),则属于单个数字字符,如图4的第I个字符所示,转步骤1.3 ;否则属于单个字符的一部分,如图4的第5个字符所示转步骤1.4 ;
[0061]步骤1.3,将单个字符裁剪为和静态模板匹配的数字字符相同大小,
[0062]提取出待识别单个数字字符所在区域具有相同标准二阶中心矩的椭圆的离心率以及椭圆长轴与X轴的交角、图像的水平方向和垂直方向上像素值的偏度以及峰度值,
[0063]将上述六个特征作为一个特征行向量并进行归一化处理,
[0064]提取出待识别单个数字字符图像的一阶、二阶外围特征以及模板相关系数,
[0065]和静态模板对应特征进行匹配,
[0066]用欧氏距离进行度量,
[0067]对各个度量结果归一化后求和,输出求和后结果最小值时所对应的静态模板的数字字符类别;
[0068]步骤1.4,提取出单个字符部分所在区域的一阶、二阶外围特征以及模板相关性系数,
[0069]和静态模板对应特征的对应区域进行匹配,
[0070]用欧氏距离进行度量,
[0071]归一化求和后,
[0072]对取得最小值时所对应的模板字符类别作为输出结果;
[0073]模式二,小字符区域标记数目为2,具体操作如下:
[0074]步骤2.1,提取数字字符所在区域,去除字符前后多余的图像噪声;
[0075]步骤2.2,根据数字字符所在区域的高度值H判断是两个数字字符图像还是由一个数字字符图像断裂成两部分;若H大于t (20像素),则认为是两个数字字符,如图5的第5个字符所示,转步骤2.3 ;否则是由一个数字字符断裂而成的两部分,如图6的第5个字符所示,转步骤2.4 ;
[0076]步骤2.3,提取两个数字字符各自的所在区域,
[0077]分别提取出两个区域的一阶、二阶外围特征、中心穿线特征、模板相关系数,
[0078]和生成的双字符动态模板所对应区域位置的相应特征进行匹配,
[0079]采用欧氏距离进行度量,
[0080]归一化求和,
[0081]输出取得最小值时所对应的双字符模板中数字字符高度更高的数字字符类别;
[0082]步骤2.4,进行合并操作,将两部分所在区域和两部分之间的间隙合并为一个区域,
[0083]将区域裁剪为静态模板中所选字符字符的大小,
[0084]计算出模板相关系数,
[0085]归一化求和,
[0086]输出取得最小值时匹配模板所对应的数字字符类别;
[0087]模式三,小字符区域标记数目为3,则为两个数字字符,其中一个数字字符断裂为两部分,具体操作如下:
[0088]步骤3.1,提取数字字符所在区域,去除字符前后多余的图像噪声;
[0089]步骤3.2,根据中间部分的字符与上下两部分的垂直距离判断三个区域的字符的组合方式,距离更小的的两部分属于同一个数字字符,如图7第5个字符所示;
[0090]步骤3.3,合并属于同一个数字字符的两部分及其之间的间隙;
[0091]步骤3.4,分别提取出两个区域的一阶、二阶外围特征、中心穿线特征、模板相关系数;
[0092]步骤3.5,和生成的双字符动态模板所对应区域位置的相应特征进行匹配;
[0093]步骤3.6,采用欧氏距离进行度量;
[0094]步骤3.7,归一化求和后;
[0095]步骤3.8,输出取得最小值时所对应的双字符模板中字符高度更高的数字字符类别。
[0096]结合图3,所述双字符动态模板生成方法为:
[0097]步骤4.1,静态特征模板组合成双字符特征模板;
[0098]步骤4.2,提取待识别的双字符数字字符图像的各个数字字符的高度;
[0099]步骤4.3,在双字符特征模板中提取出与步骤4.2相应高度区域的双字符特征生成双字符动态模板。
[0100]实施例一
[0101]结合图4,读入待识别图像(如“原图”所示),进行二值化处理(如“二值化图像”所示),根据小字符数字左右两边的边框部分以及形态学后的字符间隔并结合小字符数字的宽度信息生成字符分割掩膜模板(如“掩膜模板”所示),进行形态学处理(如“形态学操作得到的图像”所示),分割出小字符数字图像(如“分割出的数字字符”所示),通过判断,前四个区域标记均属于一个字符,第五个区域标记属于单个字符的一部分,通过与静态模板对比得出数字字符所记载的信息为“00328”。
[0102]实施例二
[0103]结合图5,读入待识别图像(如“原图”所示),进行二值化处理(如“二值化图像”所示),根据小字符数字左右两边的边框部分以及形态学后的字符间隔并结合小字符数字的宽度信息生成字符分割掩膜模板(如“掩膜模板”所示),进行形态学处理(如“形态学操作得到的图像”所示),分割出小字符数字图像(如“分割出的数字字符”所示),通过判断,前四个区域标记均属于一个字符,第五个区域标记属于两个字符,通过与动态模板对比得出数字字符所记载的信息为“00701”。
[0104]实施例三
[0105]结合图6,读入待识别图像(如“原图”所示),进行二值化处理(如“二值化图像”所示),根据小字符数字左右两边的边框部分以及形态学后的字符间隔并结合小字符数字的宽度信息生成字符分割掩膜模板(如“掩膜模板”所示),进行形态学处理(如“形态学操作得到的图像”所示),分割出小字符数字图像(如“分割出的数字字符”所示),通过判断,前四个区域标记均属于一个字符,第五个区域标记属于一个字符的两部分,通过与静态模板对比得出数字字符所记载的信息为“00233”。
[0106]实施例四
[0107]结合图7,读入待识别图像(如“原图”所示),进行二值化处理(如“二值化图像”所示),根据小字符数字左右两边的边框部分以及形态学后的字符间隔并结合小字
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1