一种二值工程图中的字符检测方法

文档序号:6561585阅读:216来源:国知局
专利名称:一种二值工程图中的字符检测方法
技术领域
本发明涉及图像字符检测领域,特别是一种方便快捷准确的二值工程图中的字符检测方法。
背景技术
在自然场景图像中进行字符检测对于各类计算机视觉问题有着重要的作用,并可在此基础上探索自动导航、图像检索、基于内容的视频摘要等研究。此外,在基于内容的图像检索技术中,字符检测算法也扮演着重要的角色。传统的二值工程图中的字符检测方法有着对图元和图元之间粘连相交情况,或者字符串方向的限制,而且为了检测字符单元会进行耗时的非字符单元检测与移除工作。因此如何解决实际中存在的大量噪音和各种退化情况以及基于内容检索的实际需要,已成为进一步扩展各类基于字符检测应用的瓶颈之一。

发明内容
发明目的本发明所要解决的技术问题是针对现有技术的不足,提供一种二值工程图中的字符检测方法。为了实现本发明所述的目的,本发明提供的一种二值工程图中的字符检测方法, 其特征是,包含以下步骤(1)提取二值工程图中的局部一致性单元(local consecutive segment简称LCQ,得到局部一致性单元集合,所述局部一致性单元为一段方向和宽度不变的线段;(2)对局部一致性单元集合进行筛选,得到字符型局部一致性单元,并根据邻接性归并字符型局部一致性单元;(3)根据几何特征对字符型局部一致性单元中的字符区域进行筛选,得到字符块;(4)对所述字符块通过霍夫(Hough)变换找到字符串。本发明步骤(1)中,提取二值工程图的局部一致性单元包括以下步骤逐行扫描二值工程图,对于扫描过程中遇到的黑色行程r,进行以下步骤,所述黑色行程为一行的连续黑色像素寻找所有和黑色行程r邻接的局部一致性单元;遍历邻接的局部一致性单元,计算归属函数e (r,S),若归属函数e (r,S)等于1则将黑色行程r加入局部一致性单元S,否则创建一个新的局部一致性单元Smw,并将黑色行程r放入其中;归属函数e(r,S)的计算方法如下式
权利要求
1.一种二值工程图中的字符检测方法,其特征在于,包含以下步骤(1)提取二值工程图中的局部一致性单元,得到局部一致性单元集合,所述局部一致性单元为一段方向和宽度不变的线段;(2)对局部一致性单元集合进行筛选,得到字符型局部一致性单元,并根据邻接性归并字符型局部一致性单元;(3)根据几何特征对字符型局部一致性单元中的字符区域进行筛选,得到字符块;(4)对所述字符块通过霍夫变换找到字符串。
2.如权利要求1所述的一种二值工程图中的字符检测方法,其特征是,步骤(1)中,提取二值工程图的局部一致性单元包括以下步骤逐行扫描二值工程图,对于扫描过程中遇到的黑色行程r,进行以下步骤,所述黑色行程为一行的连续黑色像素寻找所有和黑色行程r邻接的局部一致性单元;遍历邻接的局部一致性单元,计算归属函数e (r, S),若归属函数e (r,S)等于1则将黑色行程r加入局部一致性单元S,否则创建一个新的局部一致性单元Snrat,并将黑色行程r放入其中;归属函数e(r,S)的计算方法如下式
3.如权利要求1所述的一种二值工程图中的字符检测方法,其特征在于,步骤O)中, 包括以下步骤采用下式计算局部一致性单元的数值Size (S)
4.如权利要求3所述的一种二值工程图中的字符检测方法,其特征在于,步骤(3)中, 根据几何特征对所得到的候选字符区进行筛选包括以下步骤对于候选字符区域包围盒CC,若满足以下三项的任意一项,则判定是非字符区域,并排除A)WBRatio < Ta, WBRatio表示候选字符区域包围盒CC的像素密度;B)HWRatio > Tb, HWRatio表示候选字符区域包围盒CC的高宽比OMaxLength < Tc, MaxLength表示候选字符区域包围盒CC的最长边;Ta、Tb、T。为的设定阈值。
5.如权利要求1所述的一种二值工程图中的字符检测方法,其特征在于,步骤中, 对所述字符块通过霍夫变换找到字符串包括以下步骤步骤(41),将所有距离小于值Td的相邻的字符块归并入一个连通集合中,Td使用如下公式计算Td - 0.5 xmax(^,>v). 其中h表示包围盒的高度,W表示包围盒的宽度,Z和。分别代表两个字符块包围盒的平均高度和宽度;步骤(42),以所述连通集合为单位进行霍夫变换,从中找到分布在一条直线上的字符块区域,将字符块区域中具有相同参数的候选字符区域进行合并,得到共线而且相邻的字符,从而得到字符串区域。
全文摘要
本发明提供了一种二值工程图中的字符检测方法,包括如下步骤对二值的线条图纸首先进行LCS单元提取,得到LCS集合;排除掉噪音型LCS及长直线条型LCS;对剩下的LCS进行归并,得到候选字符区域;对候选字符区域进行几何特征分析,从而进行筛选与排除;对得到的可信字符块进行Hough得到字符串。本发明的有益效果在于输入一张二值线条图纸,可自动定位到其中的字符区域,该区域可用于进一步的OCR过程等。该方法可节省大量人工读图的时间开销,得到的结果可以直观反应图纸中的文字内容。
文档编号G06T7/00GK102289662SQ20111021339
公开日2011年12月21日 申请日期2011年7月28日 优先权日2011年7月28日
发明者张振宇, 赵妍, 路通 申请人:南京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1