基于十六值变换的符号识别方法

文档序号:6357244阅读:145来源:国知局
专利名称:基于十六值变换的符号识别方法
技术领域
本发明属于图像数据处理与模式识别方法,具体涉及一种符号识别方法。
背景技术
符号识别是在各种纸质文档数字化过程中自动识别其上各种印刷体、手写体图符标注的过程。理想的符号识别能正确识别出数字化文档图像上的各种符号标注,并不受各种干扰的影响,从而使更高层的图像理解成为可能。传统的符号识别方法(参见文献张忻中.汉字识别技术.北京清华大学出版社,1992 ;周昌乐.手写汉字的机器识别.北京科学出版社,1997.) 一般有基于神经网络的识别和基于形状分析的识别两大类。神经网络是一种计算智能中的仿生结构算法,它是一类由结点相互连结所组成的计算模型,每一结点通过简单的运算完成从输入到输出的计算,然后这一输出结果通过连接传到其他结点。神经网络模拟了大脑神经系统,结点对应神经元,连接对应神经元传递信号的突触。基于神经网络的识别需要设计网络系统,还需要通过训练样本对其进行训练学习。而基于形状分析的识别提取待识别符号的形状描述特征进行匹配识别,属于统计模式识别的方法。这些传统方法在扫描图像质量好、不同符号之间差异很大而相同符号之间差异很小的情况下可以取得较好的识别效果。但在实际的扫描图像上,往往会有噪声和符号变形等因素的影响。不同应用背景的数字化文档图像中,有的符号是印刷体,有的符号是手写体,即使同一种符号之间可能存在较大形状差异。此外,从图像上分割出来的待识符号中还常常存在许多非法符号会对识别造成干扰。对于这些情况,如果采用传统的方法来识别则会出现时间开销大、算法适用范围窄、抗干扰能力差和识别率不高等缺点。

发明内容
本发明提出一种基于十六值变换的符号识别方法,解决现有符号识别方法抗干扰能力差、难以工程实用化的问题;其识别结果用于纸质文档数字化及自动理解,提高符号识别的可用性。基于十六值变换的符号识别方法,步骤为(1)特征知识库的建立步骤(1. 1)针对待识别符号的类型,准备该类型所有符号的标准符号图像;(1. 2)对于一个符号的图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,形成对其特征的描述;(1. 3)对准备的所有符号图像进行上一步的处理,建立某一类型所有符号的特征描述,即可构建出该类型符号的特征知识库。(2)符号识别步骤(2. 1)对输入图像进行二值化,从中分割出待识别的符号图像;(2. 2)统一尺度的保真规整化,即保持高宽比例将包含待识别符号图像的最小外接矩阵图像进行缩放,使其长边为一定值,并将图像居中填充到以该定值为边长的正方形空白图像中,形成规整化后的符号图像;(2. 3)使用背景十六值变换的特征表达方法,对规整化后的待识别图像的特征进行描述;(2. 4)基于特征知识库和背景区域的特征描述对图符进行识别。本发明相对现有技术具有以下优点1.提出了一种基于十六值变换的符号背景描述方法,通过该描述方法获取了图符背景区域的结构特征,该特征描述方法具有抗干扰能力强,能够适应小角度旋转、尺度缩放等特点,同时具有算法简洁、计算复杂度低的特点;2.基于符号背景十六值变换特征描述的符号标注识别方法,能够自动识别数字化图像上的各种印刷体、手写体符号,识别率高,同时具有算法简洁、计算复杂度低、易于工程实现等特点;采用本发明,可以快速识别数字化图像上的各种印刷及手写体符号标注,对于图像上的其它特殊符号标注,基于该特征描述方法也可以快速实现自动识别录入。同时该算法时间复杂度和空间复杂度都很低,可用非常低的硬件成本实现。在识别性能、处理速度和性价比等方面均优于现有符号识别系统。


图1是本发明的流程图;图2是数值背景表达算法示意图;
图3是数值背景表达结果示意图;图4是待识别的符号示例图;图5是图4中各符号经数值背景表达后典型背景区域的特征值示意图;图6是统一尺度的保真规整化示意图;图7是0 9十个待识别的手写体数字图像及其经数值背景表达后的结果,其中 (a)是0 9十个待识别的手写体数字图像示例,(b)是各数字图像经数值背景表达后典型背景区域的特征值示意图。
具体实施例方式为了更加清楚明白的阐述本发明的目的、技术方案和优点,下面结合附图及具体实施例对本发明作进一步详细的说明。针对传统的识别方法在有符号变形和非法符号干扰等情况下识别效果不理想的问题,本发明提出了一种基于十六值变换的符号识别方法。其基本思想是对二值符号图像 (图符)中的背景像素按照一定规律进行编码得到十六种不同的特征值,以此来反映每个背景像素所处的环境,从而反映图符的结构特征。该识别方法的处理流程如图1所示,首先预估需要识别的符号所属的类型,准备好该类型所有符号的图像,分别进行十六值背景表达,建立各符号与特征表达之间的联系,形成特征知识库,作为识别前的准备。输入一幅扫描的图像,首先作预处理,对图像进行二值化并从中分割出待识别的符号;接着对待识图符进行规整化,保持高宽比例将其规整为符合一定要求的图像;然后对规整化后的图像进行背景十六值数值表达变换,形成图符背景区域的特征值;最后利用知识库进行特征识别,并输出识别结果。图1是基于十六值变换的符号识别方法处理流程图。一种基于十六值变换的符号识别方法,包括(1)预估待识别符号的类型,构建包含该类型中所有符号的特征知识库的步骤;(2)基于知识库的符号识别步骤。其中,构建所述特征知识库的步骤具体为(1. 1)针对待识别符号的类型,准备该类型所有符号的符号图像,该符号图像满足(i) 一定尺寸(如64*64像素,与之后识别过程中对输入图像进行规整的尺寸一致)的正方形二值图像;(ii)符号的最小外接矩阵居中且其长边等于正方形图像边长;(iii)图像中的符号形态规整、标准。(1. 2)对于所准备的该类型中一个符号的标准图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,形成对其特征的描述;数值背景表达就是对图像中的背景点进行数值变换,以获取图符背景区域的结构特征。建立背景十六值变换特征的数值背景表达并确定图符的背景区域类型的过程主要分以下两步首先,计算该符号图像背景点的特征值。置背景点的初始特征值为0。数值变换就是对图像进行扫描,对每一个背景点P进行变换。具体做法是从P出发,分别向垂直向上(方向4)、垂直向下(方向2)、水平向左 (方向1)、水平向右(方向3)四个方向引射线,如图2所示。若在方向3上遇到遮挡(即遇到目标像素),则特征值加1 ;若在方向1上遇到遮挡,则特征值加2 ;若在方向2上遇到遮挡,则特征值加4 ;若在方向4上遇到遮挡,则特征值加8,如此形成每个背景点的特征值。所有背景点经过上述变换后,共可能形成C’4° + C14 + C42 + C43 + C = 16种不同的特征值,这16种特征值分别代表该像素所处的不同背景环境。表1列出了背景点所有可能的特征值。图3是一幅待识别符号图像的数值背景表达结果示意图(“*”表示符号的目标像素)。表1背景和区域的特征值及其表达的含义
权利要求
1.一种基于十六值变换的符号识别方法,通过图像处理方式对符号进行识别,该方法具体包括如下步骤(1)特征知识库的建立步骤(1.1)针对待识别符号的类型,准备该类型所有符号的符号图像;(1.2)对每个符号图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,获得代表该符号图像的特征表达,建立该类型所有图像符号的特征表达,即可构建出该类型符号的特征知识库;(2)符号识别步骤(2. 1)对输入图像进行二值化处理,从中分割出待识别的符号图像;(2. 2)统一尺度的保真规整化即保持高宽比例一定将包含待识别符号图像的最小外接矩阵图像进行缩放处理,使其长边为一定值,并将该缩放后的图像居中填充到以该定值为边长的正方形空白图像中,形成规整化后的符号图像;(2. 3)对规整化后的符号图像,建立背景十六值变换的特征表达,确定规整化后的符号图像背景区域的类型,从而获得代表该符号图像的特征表达;(2. 4)根据获得的符号图像的特征表达,利用上述构建的特征知识库,即可识别出待识别符号。
2.根据权利要求1所述的基于十六值变换的符号识别方法,其特征在于,所述步骤 (1. 1)中,所述准备的该类型所有符号的符号图像满足(i) 一定尺寸的正方形二值图像; ( )符号的最小外接矩阵居中且其长边等于所述正方形二值图像的边长。
3.根据权利要求1或2所述的基于十六值变换的符号识别方法,其特征在于,所述建立背景十六值变换的特征表达,即对符号图像中的各背景点进行数值变换,以获取符号图像背景区域的结构特征,其具体过程为(1. 2. 1)计算符号图像背景点的特征值首先,置各背景点的初始特征值为0 ;其次,对图像进行扫描,对每一个背景点的特征值进行数值变换,得到各背景点的特征值;(1. 2. 2)统计背景点特征值的分布,得到背景各区域的类型,进而获得符号图像的整个背景区域的特征表达首先,根据目标点对整个背景划分成的多个背景区域,统计各背景区域背景点的分布和数量,确定各背景区域的类型,即将处于同一区域内、具有同一特征值且数量最多的背景点的特征值指定为该背景区域的特征值;然后,通过各背景区域的面积和相对位置关系对符号图像的整个背景区域进行描述, 获得代表该符号图像的特征表达。
4.根据权利要求3所述的基于十六值变换的符号识别方法,其特征在于,所述对背景点的特征值进行数值变换具体过程为对每个背景点P,从P出发分别向该点的垂直和水平的四个方向引射线,若在其中的第一方向a上遇到遮挡即遇到目标,则该背景点特征值加1 ;若在与该第一方向相反的第二方向b上遇到遮挡,则该背景点特征值加2 ;若在垂直于该第一方向的第三方向c上遇到遮挡,则该背景点特征值加4 ;若在与该第三方向相反的第四方向d上遇到遮挡,则该背景点特征值加8,其中,所述第一方向为所述垂直和水平的四个方向中的任一方向。
5.根据权利要求1-4之一所述的基于十六值变换的符号识别方法,其特征在于,所述步骤(2. 1)中,首先将二值化的符号图像划分为若干个子图像,然后分别确定各子图像的门限值,进而获得二值图像中所有的连通域,并将最小外接矩阵的长和宽在一定范围之内的连通域作为待识别的符号图像。
6.根据权利要求1-5之一所述的基于十六值变换的符号识别方法,其特征在于所述步骤(2. 2)中,所述保真规整化具体为设符号图像的最小外接矩阵图像的高和宽分别为h 和w,那么缩放比率为r = 64/max (h, w)以符号图像左上方的顶点作为坐标原点,水平向右为X轴正向,垂直向下为y轴正向, 对于规整化后符号图像中的任一点(χ,y),给出如下不等式 χ < (64-wXr)/2, y < (64-hXr)/2, χ >= (64-wXr)/2+wXr, y >= (64-hXr)/2+hXr,若满足以上不等式之一,则直接将(x,y)置为背景点,否则(x,y)对应原最小外接矩阵图中的点(xc^y。),其中X0 = (x- (64-wXr)/2)/r, Y0 = (y-(64-hXr)/2)/r.。
全文摘要
本发明公开了一种基于十六值变换的符号识别方法,包括如下步骤(1.1)针对待识别符号的类型,准备该类型所有符号的符号图像(1.2)对每个符号图像,建立背景十六值变换的特征描述,获得代表该符号图像的特征表达,构建该类型符号的特征知识库(2.1)对输入图像进行二值化处理,从中分割出待识别的符号图像(2.2)对符号图像规整化(2.3)对规整化后的符号图像建立背景十六值变换的特征描述,获得代表该符号图像的特征表达(2.4)根据获得的符号图像的特征表达,利用构建的特征知识库,识别出符号。本发明能有效消除非法符号的干扰,具有特征提取简单、识别率高、识别速度快等特点,大大提高了符号识别技术的可用性。
文档编号G06K9/00GK102156876SQ201110080680
公开日2011年8月17日 申请日期2011年3月31日 优先权日2011年3月31日
发明者明德烈, 田甜, 田金文 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1