一种移动终端的光符识别中分区域判定背景色的方法

文档序号:6332885阅读:208来源:国知局
专利名称:一种移动终端的光符识别中分区域判定背景色的方法
技术领域
本发明涉及一种光符识别技术,特别是一种移动终端的光符识别中分区域判定背景色的方法。
背景技术
目前移动终端的光符识别技术中,判断待识别字符和背景的灰度均值的对比度这一步骤往往不受重视,因为在绝大多数情况下,如报刊,书籍,名片等的光符识别中,背景的灰度均值往往高(颜色浅),而前景字符的灰度均值往往低(颜色深)。所以在现在大多数光符识别的二值化过程中往往直接就假定这一点来进行处理。稍好一点的OCR识别系统会在识别前让用户选择底色深浅或自动计算整体图像的前景字符与背景的灰度对比度来指导二值化和识别,即使这样,现行技术的缺点是让用户指定的底色深浅往往针对于整个待识别图像而言,或者光符识别自动计算也是计算整个图像的前景字符与背景的灰度对比度。如果对于一幅图像背景和前景字符颜色对比度在整副图像的不同区域不一致的情况,该方法就无效了,也就导致部分字符无法识别。
另外,移动终端利用其摄像头进行光符识别的场景不仅包括对书籍、名片的识别,还有对广告牌上文字(如电话号码),公路标识牌上文字(如距离,地点名等),车辆牌照(中国常见的是蓝底白字的车牌)的牌照号码的识别。此时往往字符区域附近的背景灰度均值小于前景字符灰度均值,这与目前绝大多数光符识别应用于书籍报刊名片的对比度正好相反。同时由于车辆牌照、广告牌、公路标识牌等背景和前景字符灰度均值对比度在整副图像的不同区域不一致的情况是经常存在的,例如车牌是蓝底白字,但是车身上的大写电话号码等信息却是白底黑字的;个性化的名片上也有这种情况出现名字区域是背景色深,而联系方式区域是背景色浅。所以传统的计算整个图像的前景字符与背景的灰度对比度方法在该种情况下是毫无意义的,不可避免的造成了有些字符无法识别。

发明内容
本发明的目的是针对现有技术的不足,提供一种方法简单、可适用于不同的场景,光符识别准确度高的移动终端的光符识别中分区域判定背景色的方法。
为了解决上述技术问题,本发明所采取的技术方案是一种移动终端的光符识别中分区域判定背景色的方法,包括步骤1、锁定待识别区域;步骤2、对所述待识别区域作首次二值化处理;步骤3、根据所述首次二值化处理结果,分析获得所述待识别区域中的可能包含文字的子区域;步骤4、在其中一个需进行光符识别的子区域内,根据首次二值化处理结果统计黑白两色的像素的数量,从而判断该子区域的背景是为深底色背景还是浅底色背景;步骤5、根据所述背景的底色信息,进行子区域内的最终二值化算法和识别算法,从而获得该子区域内的文字内容;步骤6、重复步骤4和步骤5,直至完成所有的需进行光符识别的子区域的光符识别操作。
所述步骤2可以是在该待识别区域内,采用图像二值化方法计算图像二值化的整体阈值,从而完成首次二值化处理过程。
所述步骤3可以是利用所述首次二值化处理结果,作水平或垂直投影运算和版面分析算法,从而判定出有几个可能包含文字的子区域。
所述步骤4中,可以将该子区域内,黑白像素的数量较少的一方看做是前景字符,则当前景字符为黑色,表明该子区域的背景为浅底色背景;当前景字符为白色,表明该子区域的背景为深底色背景。
所述步骤1可以是在采用移动终端显示所拍摄的图像的同时,在显示屏上显示出可以移动并改变其大小的锁定框,用户通过操作该锁定框,锁定待识别的区域。
所述步骤3中可以在判定出可能包含文字的子区域后,在移动终端的显示屏上对整幅图像上的每个子区域以闪烁框的形式显示,用户通过移动终端上的方向键和确认键,选择其中需要光符识别的子区域。
如果用户在一段时间后依然没有选择需要光符识别的子区域,则可以默认所有的可能包含文字的子区域都需要进行光符识别。
当步骤4判断出背景为深底色背景还是浅底色背景后,可以在移动终端的显示屏上显示判断结果,由用户来验证其结果,在获得用户的确认后,再执行步骤5。
如果用户在一段时间后依然没有验证结果,则可以认为用户认为当前的判断结果正确,并以该判断结果进入所述步骤5在上述技术方案中,本发明先对一块区域内的不同程度底色的字符块进行分割,对分割后的每个子区域进行单独的背景与前景字符的对比度计算,智能的解决了对不同底色的字符进行区别对待,进行二值化和识别,因此本发明所提供的方法可以适用于对不同场景、不同背景色的光符识别,且具有光符识别准确度高、智能性强等特点。
具体实施例方式
下面将结合具体实施例对本发明作进一步详细说明。
本实施例提供的一种移动终端的光符识别中分区域判定背景色的方法,其步骤如下步骤1、利用移动终端上的拍摄装置(如摄像头)对需进行光符识别的图像进行拍摄,并在显示所拍摄的图像的同时,在显示屏上显示出可以移动并改变其大小的锁定框,用户通过操作该锁定框,锁定待识别的区域。所述锁定框可以采用带起止标记的横线或矩形框等。
步骤2、在该待识别区域内,采用最大类间方差法等图像二值化方法计算图像二值化的整体阈值,从而完成首次二值化处理过程。
步骤3、利用所述首次二值化处理结果,作水平或垂直投影运算和版面分析算法(如行分割算法等),从而判定出有几个可能包含文字的子区域。
这里,可以在移动终端的显示屏上对这几个可能包含文字的子区域用加闪烁框的形式显示出来,并且还可以使用户通过移动终端上的方向键、确认键来选择哪些子区域需要识别,从而使用户可以掌握控制该判断结果是否正确,并避免识别不需要的内容,避免无谓的增加识别程序的时间,提高工作效率。
如果用户在一段时间后没有选择需要光符识别的子区域,则默认所有的可能包含文字的子区域都需要进行光符识别。
步骤4、在其中一个需要进行光符识别的子区域内,根据首次二值化处理结果统计黑白两色的像素的数量,其中数量较少的一方看做是前景字符,则当前景字符为黑色,表明该子区域的背景为浅底色背景;当前景字符为白色,表明该子区域的背景为深底色背景。
由此则判断该子区域的背景是为深底色背景还是浅底色背景;本步骤也可以在步骤3中用户选择需要光符识别的子区域的同时进行,从而在用户选择时,移动终端的显示屏上即显示该子区域的背景色为深底色还是浅底色的提示,使用户一方面确认该子区域需要识别,另一方面确认系统判断该子区域的背景的结果是否正确。当用户确认后,再执行步骤5。如果等待一段时间后,还没有接收到用户输入的确认信息,则默认用户已经确认,自动进入步骤5。
步骤5、根据所述背景的底色信息,进行子区域内的最终二值化算法和识别算法,从而获得该子区域内的文字内容;步骤6、重复步骤4和步骤5,直至完成所有的子区域的光符识别。
在本实施例中,本发明先对一块区域内的不同程度底色的字符块进行分割,对分割后的每个子区域进行单独的背景与前景字符的对比度计算,智能的解决了对不同底色的字符进行区别对待,进行二值化和识别,而不会如传统算法一样,根据一个全局背景的判断来指导所有不同子区域的二值化和识别工作,造成部分字符无法识别。
权利要求
1.一种移动终端的光符识别中分区域判定背景色的方法,包括步骤1、锁定待识别区域;步骤2、对所述待识别区域作首次二值化处理;步骤3、根据所述首次二值化处理结果,分析获得所述待识别区域中的可能包含文字的子区域;步骤4、在其中一个需进行光符识别的子区域内,根据首次二值化处理结果统计黑白两色的像素的数量,从而判断该子区域的背景是为深底色背景还是浅底色背景;步骤5、根据所述背景的底色信息,进行子区域内的最终二值化算法和识别算法,从而获得该子区域内的文字内容;步骤6、重复步骤4和步骤5,直至完成所有的需进行光符识别的子区域的光符识别操作。
2.如权利要求1所述移动终端的光符识别中分区域判定背景色的方法,其特征在于所述步骤2是在该待识别区域内,采用图像二值化方法计算图像二值化的整体阈值,从而完成首次二值化处理过程。
3.如权利要求1所述移动终端的光符识别中分区域判定背景色的方法,其特征在于所述步骤3是利用所述首次二值化处理结果,作水平或垂直投影运算和版面分析算法,从而判定出有几个可能包含文字的子区域。
4.如权利要求1、2或3所述移动终端的光符识别中分区域判定背景色的方法,其特征在于所述步骤4中,将该子区域内,黑白像素的数量较少的一方看做是前景字符,则当前景字符为黑色,表明该子区域的背景为浅底色背景;当前景字符为白色,表明该子区域的背景为深底色背景。
5.如权利要求4所述移动终端的光符识别中分区域判定背景色的方法,其特征在于所述步骤1是在采用移动终端显示所拍摄的图像的同时,在显示屏上显示出可以移动并改变其大小的锁定框,用户通过操作该锁定框,锁定待识别的区域。
6.如权利要求5所述移动终端的光符识别中分区域判定背景色的方法,其特征在于所述步骤3中在判定出可能包含文字的子区域后,在移动终端的显示屏上对整幅图像上的每个子区域以闪烁框的形式显示,用户通过移动终端上的方向键和确认键,选择其中需要光符识别的子区域。
7.如权利要求6所述移动终端的光符识别中分区域判定背景色的方法,其特征在于如果用户在一段时间后依然没有选择需要光符识别的子区域,则默认所有的可能包含文字的子区域都需要进行光符识别。
8.如权利要求7所述移动终端的光符识别中分区域判定背景色的方法,其特征在于当步骤4判断出背景为深底色背景还是浅底色背景后,在移动终端的显示屏上显示判断结果,由用户来验证其结果,在获得用户的确认后,再执行步骤5。
9.如权利要求8所述移动终端的光符识别中分区域判定背景色的方法,其特征在于如果用户在一段时间后依然没有验证结果,则认为用户认为当前的判断结果正确,并以该判断结果进入所述步骤5。
全文摘要
本发明提供了一种移动终端的光符识别中分区域判定背景色的方法,主要是先对一块区域内的不同程度底色的字符块进行分割,对分割后的每个子区域进行单独的背景与前景字符的对比度计算,智能的解决了对不同底色的字符进行区别对待,进行二值化和识别。相对现有技术,本发明具有可以适用于对不同场景、不同背景色的光符识别,且光符识别准确度高、智能性强等特点。
文档编号G06K9/54GK1632820SQ20041010348
公开日2005年6月29日 申请日期2004年12月30日 优先权日2004年12月30日
发明者吴文钦, 王浩, 夏煜 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1