一种图片ocr识别系统的字符与背景粘连噪声消除方法

文档序号：9687950阅读：2410来源：国知局

一种图片ocr识别系统的字符与背景粘连噪声消除方法
【技术领域】
[0001] 本发明设及自然场景图片OCR识别系统，尤其设及一种图片OCR识别系统的字符与背景粘连噪声消除方法。
【背景技术】
[0002] 在人工智能领域，光学字符识别OCR是一项十分重要的技术，由于智能手机的普及 W及云存储中海量图片的分类与捜索的需要，使得自然场景图片OCR识别成为近年来研究的一个热点，OCR技术一般包括字符定位，字符切割，字符识别等几个过程，其中字符定位的速度与精度，直接影响OCR识别技术的好坏，是整个OCR系统的关键。
[0003] OCR字符定位通常利用字符串的结构信息，通过全局捜索的方式对字符串所在区域进行定位，而字符串结构信息的提取，最常用也是较有效的方法是通过二值化技术来提取字符串图像的边缘，常用的二值化方法有固定阔值法、自适应阔值法、全局阔值法W及局部阔值法等，无论哪一种算法，当面对复杂多变的环境，如不同季节、不同天气环境等复杂情况，都会或多或少的引入各种各样的噪声，运些噪声将很容易导致定位失败，或产生大量虚假字符信息，从而使得后续处理的计算量大大增加。
[0004] 对二值化所引入的噪声，现有的做法通常是采用一些滤波方法去滤除噪声，例如中值滤波、数学形态学、二维小波分析等，运些不同的方法对不同的图像有不同的效果，常用的线性低通滤波器和邻域平均的方法虽然可W去除部分噪声，但它们具有图像模糊的负作用，中值滤波的方法可W消除孤立的噪声点，而且产生的模糊比较少，但是它对二值图像去除噪声的效果并不好，数学形态学在一定程度上可W将部分黑色斑块腐蚀掉，但运样往往会导致原图像变形加剧，不利于后续的计算。
[0005] 另外，在自然场景图片OCR识别中，由于光照、天气、杂物等因素的影响，使得二值化噪声更多，实际工程应用中，独立的、离散的噪声往往比较容易区分，而与字符或者待识别对象发生了粘连的噪声往往难W处理，粘连噪声带来的结果就是相应的字符位置范围受到了干扰，导致字符的准确定位失败，从而影响了系统的整体识别率，如何消除自然场景中的字符粘连噪声成了OCR识别中的一个关键问题，因此，提出一种能够满足实际应用需要的、实现各种复杂环境下的实时字符粘连噪声消除技术显得十分重要，通过消除粘连噪声，可减少非字符区域的干扰，从而提供OCR字符定位的准确性。

【发明内容】

[0006] 本发明的目的在于提供一种图片OCR识别系统的字符与背景粘连噪声消除方法，针对现有自然场景图片的OCR技术，在噪声处理方面存在的不足，提出了一种新的粘连噪声消除方法，在复杂多变的自然环境中，该方法解决了现有OCR应用系统对具有粘连噪声字符定位困难的问题，实现字符位置的准确提取，并能满足工程应用的实时性要求。
[0007] 为了达到上述目的，本发明提供的技术方案是:所述的自然场景图片OCR识别系统的字符与背景粘连噪声消除方法包括按顺序执行的下列步骤：
[000引一种图片OCR识别系统的字符与背景粘连噪声消除方法，所述的图片OCR识别系统的字符与背景粘连噪声消除方法包括按如下步骤：
[0009] 1)根据OCR系统所应用的工程环境的先验知识，设置待识别字符的笔划长度 StrokeLen的有效范围；
[0010] 2)选取自然环境下的含有待识别字符的图像，并W均值差分模板的方式计算图像差分边界图，所述差分边界图包含字符区域和背景区域；
[0011] 3)将上述得到的待识别图像的差分边界图进行阔值化，形成待识别图像的Ξ值化边界图，所述Ξ值化边界图包含待识别区域和背景区域；
[0012] 4)在上述得到的待识别图像的Ξ值化边界图中，按照倾斜角度范围内、直线型边界进行捜索，检查该边界是否超出了笔划长度的有效范围，当没有超出笔划长度的有效范围，则认为是有效的边界点，并给予保留，当超出笔划长度的有效范围，则该边界判定为噪声，将其从Ξ值边界图像中清除。
[0013] 所述步骤3)中，将所述待识别图像的差分边界图进行阔值化的公式如下：
[0014] 其中，P(x，y)是差分图中像素点（x，y)的差分值，ParamA和ParamB是预先设置的阔值，cl，c2和c3是无符号整数，取值范围是[0,255];其中cl表示当前像素点的亮度比周围更亮的边界，c2表示当前像素点的亮度比较周围更暗的边界，c3表示非边界的取值。
[0015] 所述的cl颜色为黑色，取值为C1 = 0;所述的c2颜色为白色，取值为c2 = 255，所述的c3颜色为灰色，取值为c3 = 128,差分边界像素点的值分别为0、255,而非边界像素点的值为128,即所述的黑色和白色的像素点为边界像素点，所述的灰色的像素点是非边界像素点。
[0016] 所述步骤4)中，将所述待识别图像的Ξ值化图像按照倾斜角度范围内、直线型边界进行捜索的算法步骤如下：
[0017] 4.1)计算倾斜角度在[α，β]范围内的直线倾斜偏移量检测模版；
[0018] 4.2)对Ξ值化图像中每一个边界点，利用步骤a)中得到的直线检测模版，检查从该边界点出发、边界值相同，并且与模版匹配的连续边界线；
[0019] 4.3)对匹配的连续边界线，检查其长度是否属于有效范围，当属于有效范围，则保留，否则该边界线为噪声边界，并将边界线上所有边界点所包含的边界像素值设置为c3。
[0020] 所述步骤4-1)中，所述计算倾斜角度在[α，β]范围内的直线检测模版的算法步骤如下：
[0021] 4.1.1)根据步骤1)所设置的最长笔划长度StrokeLen,按照工程实际情况计算直线模版数量Num、直线模版线条的长度Len W及该模版在y方向上的最大偏移值MaxOf f Y，计算公式分别如下；
[0022]
[0023] 4.1.2)对每一个直线倾斜偏移量模版，按如下公式计算y方向的偏移值。
[0024]
xe [(Κ U叫，（')於'e [―Max'O們、Maxom'l
[0025] 所述步骤4.2)中将待识别图像的Ξ值化图像进行直线型边界的捜索算法，判断从某边界点出发、边界值相同，并且与直线倾斜偏移量模版匹配的连续边界线的方法如下： [00%] 4.2.1)当所述直线的线宽为1的普通直线，该方法从出发点开始，从左到右检查是否有直接相邻的等值边界点，当存在，则该直线上所有边界点都属于匹配点，否则就属于不匹配点；
[0027] 4.2.2)当所述的直线线宽为Ν，基于八连通的广义直线，该方法从出发点开始，检测八连通意义下的等值边界点，当存在运样的广义直线，则该广义直线上所有边界点都属于匹配点，否则就属于不匹配点。
[0028] 本发明的有益效果是:本发明的一种图片OCR识别系统的字符与背景粘连噪声消除方法，针对现有自然场景图片的OCR技术，在噪声处理方面存在的不足，提出了一种新的粘连噪声消除方法，在复杂多变的自然环境中，该方法解决了现有OCR应用系统对具有粘连噪声字符定位困难的问题，实现字符位置的准确提取，并能满足工程应用的实时性要求。
【附图说明】
[0029] 图1为本发明实施例的一种图片OCR识别系统的字符与背景粘连噪声消除方法的流程图；
[0030] 图2为本发明

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王忠;周庆标;覃方颖;
技术所有人：浙江传媒学院;
我是此专利的发明人

上一篇：基于梯度回归树的车辆关键点检测方法及装置的制造方法
上一篇：基于素描线段拓扑结构的sar图像目标检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。