一种图片ocr识别系统的字符与背景粘连噪声消除方法

文档序号:9687950阅读:2410来源:国知局
一种图片ocr识别系统的字符与背景粘连噪声消除方法
【技术领域】
[0001] 本发明设及自然场景图片OCR识别系统,尤其设及一种图片OCR识别系统的字符与 背景粘连噪声消除方法。
【背景技术】
[0002] 在人工智能领域,光学字符识别OCR是一项十分重要的技术,由于智能手机的普及 W及云存储中海量图片的分类与捜索的需要,使得自然场景图片OCR识别成为近年来研究 的一个热点,OCR技术一般包括字符定位,字符切割,字符识别等几个过程,其中字符定位的 速度与精度,直接影响OCR识别技术的好坏,是整个OCR系统的关键。
[0003] OCR字符定位通常利用字符串的结构信息,通过全局捜索的方式对字符串所在区 域进行定位,而字符串结构信息的提取,最常用也是较有效的方法是通过二值化技术来提 取字符串图像的边缘,常用的二值化方法有固定阔值法、自适应阔值法、全局阔值法W及局 部阔值法等,无论哪一种算法,当面对复杂多变的环境,如不同季节、不同天气环境等复杂 情况,都会或多或少的引入各种各样的噪声,运些噪声将很容易导致定位失败,或产生大量 虚假字符信息,从而使得后续处理的计算量大大增加。
[0004] 对二值化所引入的噪声,现有的做法通常是采用一些滤波方法去滤除噪声,例如 中值滤波、数学形态学、二维小波分析等,运些不同的方法对不同的图像有不同的效果,常 用的线性低通滤波器和邻域平均的方法虽然可W去除部分噪声,但它们具有图像模糊的负 作用,中值滤波的方法可W消除孤立的噪声点,而且产生的模糊比较少,但是它对二值图像 去除噪声的效果并不好,数学形态学在一定程度上可W将部分黑色斑块腐蚀掉,但运样往 往会导致原图像变形加剧,不利于后续的计算。
[0005] 另外,在自然场景图片OCR识别中,由于光照、天气、杂物等因素的影响,使得二值 化噪声更多,实际工程应用中,独立的、离散的噪声往往比较容易区分,而与字符或者待识 别对象发生了粘连的噪声往往难W处理,粘连噪声带来的结果就是相应的字符位置范围受 到了干扰,导致字符的准确定位失败,从而影响了系统的整体识别率,如何消除自然场景中 的字符粘连噪声成了OCR识别中的一个关键问题,因此,提出一种能够满足实际应用需要 的、实现各种复杂环境下的实时字符粘连噪声消除技术显得十分重要,通过消除粘连噪声, 可减少非字符区域的干扰,从而提供OCR字符定位的准确性。

【发明内容】

[0006] 本发明的目的在于提供一种图片OCR识别系统的字符与背景粘连噪声消除方法, 针对现有自然场景图片的OCR技术,在噪声处理方面存在的不足,提出了一种新的粘连噪声 消除方法,在复杂多变的自然环境中,该方法解决了现有OCR应用系统对具有粘连噪声字符 定位困难的问题,实现字符位置的准确提取,并能满足工程应用的实时性要求。
[0007] 为了达到上述目的,本发明提供的技术方案是:所述的自然场景图片OCR识别系统 的字符与背景粘连噪声消除方法包括按顺序执行的下列步骤:
[000引一种图片OCR识别系统的字符与背景粘连噪声消除方法,所述的图片OCR识别系统 的字符与背景粘连噪声消除方法包括按如下步骤:
[0009] 1)根据OCR系统所应用的工程环境的先验知识,设置待识别字符的笔划长度 StrokeLen的有效范围;
[0010] 2)选取自然环境下的含有待识别字符的图像,并W均值差分模板的方式计算图像 差分边界图,所述差分边界图包含字符区域和背景区域;
[0011] 3)将上述得到的待识别图像的差分边界图进行阔值化,形成待识别图像的Ξ值化 边界图,所述Ξ值化边界图包含待识别区域和背景区域;
[0012] 4)在上述得到的待识别图像的Ξ值化边界图中,按照倾斜角度范围内、直线型边 界进行捜索,检查该边界是否超出了笔划长度的有效范围,当没有超出笔划长度的有效范 围,则认为是有效的边界点,并给予保留,当超出笔划长度的有效范围,则该边界判定为噪 声,将其从Ξ值边界图像中清除。
[0013] 所述步骤3)中,将所述待识别图像的差分边界图进行阔值化的公式如下:
[0014] 其中,P(x,y)是差分图中像素点(x,y)的差分值,ParamA和ParamB是预先设置的阔 值,cl,c2和c3是无符号整数,取值范围是[0,255];其中cl表示当前像素点的亮度比周围更 亮的边界,c2表示当前像素点的亮度比较周围更暗的边界,c3表示非边界的取值。
[0015] 所述的cl颜色为黑色,取值为C1 = 0;所述的c2颜色为白色,取值为c2 = 255,所述 的c3颜色为灰色,取值为c3 = 128,差分边界像素点的值分别为0、255,而非边界像素点的值 为128,即所述的黑色和白色的像素点为边界像素点,所述的灰色的像素点是非边界像素 点。
[0016] 所述步骤4)中,将所述待识别图像的Ξ值化图像按照倾斜角度范围内、直线型边 界进行捜索的算法步骤如下:
[0017] 4.1)计算倾斜角度在[α,β]范围内的直线倾斜偏移量检测模版;
[0018] 4.2)对Ξ值化图像中每一个边界点,利用步骤a)中得到的直线检测模版,检查从 该边界点出发、边界值相同,并且与模版匹配的连续边界线;
[0019] 4.3)对匹配的连续边界线,检查其长度是否属于有效范围,当属于有效范围,则保 留,否则该边界线为噪声边界,并将边界线上所有边界点所包含的边界像素值设置为c3。
[0020] 所述步骤4-1)中,所述计算倾斜角度在[α,β]范围内的直线检测模版的算法步骤 如下:
[0021] 4.1.1)根据步骤1)所设置的最长笔划长度StrokeLen,按照工程实际情况计算直 线模版数量Num、直线模版线条的长度Len W及该模版在y方向上的最大偏移值MaxOf f Y,计 算公式分别如下;
[0022]
[0023] 4.1.2)对每一个直线倾斜偏移量模版,按如下公式计算y方向的偏移值。
[0024]
xe [(Κ U叫,(')於'e [―Max'O們、Maxom'l
[0025] 所述步骤4.2)中将待识别图像的Ξ值化图像进行直线型边界的捜索算法,判断从 某边界点出发、边界值相同,并且与直线倾斜偏移量模版匹配的连续边界线的方法如下: [00%] 4.2.1)当所述直线的线宽为1的普通直线,该方法从出发点开始,从左到右检查是 否有直接相邻的等值边界点,当存在,则该直线上所有边界点都属于匹配点,否则就属于不 匹配点;
[0027] 4.2.2)当所述的直线线宽为Ν,基于八连通的广义直线,该方法从出发点开始,检 测八连通意义下的等值边界点,当存在运样的广义直线,则该广义直线上所有边界点都属 于匹配点,否则就属于不匹配点。
[0028] 本发明的有益效果是:本发明的一种图片OCR识别系统的字符与背景粘连噪声消 除方法,针对现有自然场景图片的OCR技术,在噪声处理方面存在的不足,提出了一种新的 粘连噪声消除方法,在复杂多变的自然环境中,该方法解决了现有OCR应用系统对具有粘连 噪声字符定位困难的问题,实现字符位置的准确提取,并能满足工程应用的实时性要求。
【附图说明】
[0029] 图1为本发明实施例的一种图片OCR识别系统的字符与背景粘连噪声消除方法的 流程图;
[0030] 图2为本发明
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1