一种带摄像装置移动终端的光符识别处理方法

文档序号:6425033阅读:268来源:国知局
专利名称:一种带摄像装置移动终端的光符识别处理方法
技术领域
本发明涉及光符识别(OCR),特别涉及一种带摄像装置移动终端的光符识别处理方法。
背景技术
随着技术的发展,光符识别(OCR)已经进入了不同的应用领域。从条码识别到数字和字母识别,甚至利用扫描仪配合中文光符识别(OCR)软件把印刷文字输入到计算机。
现有技术中也出现了具有OCR功能的手机、数字相机和一些手持扫描装置,其可以通过对目标物体进行拍照,并利用内嵌的OCR功能实体或图象处理芯片识别出拍照影像中的有用文字信息,并进行存储。
但是,这些手机或手持装置对图像进行识别时,一般就是对整幅画面进行识别,针对性差,造成识别结果的错误率高;识别的非重点信息多,对重要信息容易形成干扰;而且,由于是对全部画面进行识别,也使得整体的处理速度缓慢。

发明内容
本发明的目的在于提供一种带摄像装置移动终端的光符识别处理方法,其在进行有用信息识别的时候针对性强,速度快,非重点信息干扰少,准确率也相对较高。
根据本发明的上述目的,本发明提出如下方案一种带摄像装置移动终端的光符识别处理方法,包括如下步骤
在目标图像上确定待处理区;根据上述待处理区对应于图像中的位置信息将该区域的字符分割出来;对已分割的字符进行识别,并将识别后的结果进行后处理。
其中,本发明所述方法中在目标图像上确定待处理区可用下面方法实现通过一条辅助识别的水平线压住待识别的字符行;线条的粗细和颜色改变不脱离本发明的保护范围;所述水平线在目标图像上的高度位置可以调节;在所述水平线上设置一个对字符识别起始位置进行确定的标志符;在所述水平线上设置一个对字符识别结束位置进行确定的标志符;所述标志符是一个圆点、三角点或其他图案等可以与所述水平线进行明显比对的标志;该标志符在水平线上的水平位置可以被调节;此外,在目标图像上确定待处理区也可用下面方法实现通过一个辅助识别的区域框圈定待识别的字符行;其中,该区域框是一个矩形框,框线的虚实不脱离本发明的保护范围,甚至可以仅有四个矩形框角所围成的矩形区域;该矩形框的高度和宽度是可以被调节的。
对比现有技术,本发明的优点在于利用本发明所述的方法,在对目标图像进行信息识别时,该方法可直接帮助手机使用者有针对性地限定待识别的文字区域,随后的OCR处理只对该限定区域内的文字进行处理,使得非重点信息所产生的干扰减少,识别结果的准确率也得到很大提高。
本发明的上述和其它目的、特征和优点从下面结合附图和并非特定的实施例的具体描述中将变得更明显。


图1是通过一条辅助识别的水平线压住待识别字符行的示意图;图2是通过一个辅助识别的矩形框圈定待识别字符行的示意图;图3是具体实施例中本发明所述方法实现的流程图。
具体实施例在下面的说明中,公知的功能或结构将不再详细说明,以避免与本发明的内容存在不必要的混淆。
本发明所述方案包括如下步骤在目标图像上确定待处理区;(可通过辅助识别的水平线压住待识别的字符行)根据上述待处理区对应于图像中的位置信息将该区域的字符分割出来;(利用OCR功能实体中的图像分割功能模块)对已分割的字符进行识别,并将识别后的结果进行后处理。
下面以可拍照的手机为例来对本发明所述方法进行阐述。
可拍照手机内的OCR功能的硬件基础是手机内置或外置摄像头和手机嵌入式数码相机图像处理芯片;拍摄功能是由驱动软件或硬件来完成对一副图像的抓获;如图1所示,是通过一条辅助识别的水平线压住待识别字符行进行识别的示意图。
在启动拍摄功能后,手机的屏幕上会实时显示出所见即所得的实时影像;此时如果手机使用者开启字符识别功能后,由手机内嵌的OCR功能实体或图像处理芯片在手机的显示屏幕上会出现一条水平线;同时水平线上可以有一个标记出来的圆点(相当于坐标轴的原点),该圆点用大的圆型点或其它图案标识出来;用手机对准拍摄对象(如名片),如果想要识别某行字符时,调整摄像头和对象的相对位置和角度,使得该水平线正好压住待识别的字符所在行,同时使圆点位于第一个待识别字符之前的位置,此时按下快门抓获一副图像;或者抓获图像后,在手机上调节水平线和圆点的位置,使得该水平线正好压住待识别的字符所在行,同时使圆点位于第一个待识别字符之前的位置;OCR功能实体对该图像进行识别时利用了该水平线在图像中的相对位置确定这种辅助定位信息,直接将图像位置处的字符提取出来并且识别,转化成ASCII码或字符的形式输出。
其中,LCD上的该水平线位于LCD的中间高度位置;通过设置,也可以将该水平线的高度和圆点位置进行变化;该高度位置信息是和后面的OCR功能模块中的图像分割;提取字符功能相联系的;OCR功能实体中的图像分割算法利用了该高度和圆点位置的信息来进行,准确性有了很好的保证,为提高字符识别率,降低误识别率做出了直接贡献。
通过水平线和圆点来限定待识别区域的具体处理可参照如下方法输入图像在进行内部的二值化处理后,字符本身是黑色,而行间隔处是白色;已知该水平线穿过待识别的字符行,而且第一个字符位于圆点之后;分别从该水平线向上和向下进行水平的从左向右的扫描,若扫描经过的像素的灰度值的总和小于一个较小的阈值时,说明已经到了字符行的上边界或下边界了;从而得到字符行的纵向边界坐标;同时由圆点对应于拍摄图像中的位置时,得到字符串的左边界;这样就可以将字符串从原图像中分割出来用于后续的单字符识别。
当然,上述方案中水平线在目标图像上的高度位置可以调节;该标志符在水平线上的水平位置可以被调节;也可以在所述水平线上设置一个对字符识别结束位置进行确定的标志符。
上述的这种方案可以广泛应用于各种场景,如对名片识别,对广告牌的电话号码等信息的识别,对车辆牌照的识别,对报刊文字中有关信息的识别中。利用可拍照手机进行识别的目的在于将识别和存储,话音或数据通信结合起来,使人获得信息,分享信息,利用信息变得更加方便。
图3是实现上述方案的流程图。
手机使用者进行操作,调整辅助识别的水平线和圆点压住待识别的字符行,使圆点位于待识别字符的前面;OCR功能实体中图像分割功能模块利用辅助的水平线的对应于图像中的位置信息将行字符分割出来;OCR功能实体中字符识别功能模块对已分割的字符进行识别;手机操作者利用得出的字符结果,进行后处理(存储、发送、拨打等操作)。
当然,在目标图像上确定待处理区也可以如图2所示的通过一个辅助识别的区域框圈定待识别的字符行;图2中用的是一个一个四个矩形框角所围成的矩形区域来确定带识别字符区;这种形式相对水平线更加直观。当然,该矩形框的高度和宽度也可以被设置为可调节的。
本发明所述带摄像装置移动终端的光符识别处理方法,并不仅仅限于说明书和实施方式中所列运用,上述的这种方案也可以应用于其它可摄影电子产品中,如数字相机,数字摄像机等等,它完全可以被适用于各种适合本发明之领域,对于熟悉本领域的人员而言可容易地实现另外的优点和进行修改,因此在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。
权利要求
1.一种带摄像装置移动终端的光符识别处理方法,其特征在于,包括如下步骤a.在目标图像上确定待处理区;b.根据上述待处理区对应于图像中的位置信息将该区域的字符分割出来;c.对已分割的字符进行识别,并将识别后的结果进行后处理。
2.根据权利要求1所述的带摄像装置移动终端的光符识别处理方法,其特征在于,在目标图像上确定待处理区可用下面方法实现通过一条辅助识别的水平线压住待识别的字符行。
3.根据权利要求2所述的带摄像装置移动终端的光符识别处理方法,其特征在于,所述水平线在目标图像上的高度位置可以调节。
4.根据权利要求2所述的带摄像装置移动终端的光符识别处理方法,其特征在于,在所述水平线上设置一个对字符识别起始位置进行确定的标志符。
5.根据权利要求4所述的带摄像装置移动终端的光符识别处理方法,其特征在于,输入图象在进行内部的二值化处理后,字符本身是黑色,而行间隔处是白色;已知该水平线穿过待识别的字符行,而且第一个字符位于所述标志符之后;分别从该水平线向上和向下进行水平的从左向右的扫描,若扫描经过的像素的灰度值的总和小于一个较小的阈值时,说明已经到了字符行的上边界或下边界了;从而得到字符行的纵向边界坐标;同时由标志符对应于拍摄图象中的位置时,得到字符串的左边界;这样就可以将字符串从原图象中分割出来用于后续的单字符识别。
6.根据权利要求2所述的带摄像装置移动终端的光符识别处理方法,其特征在于,在所述水平线上设置一个对字符识别结束位置进行确定的标志符。
7.根据权利要求4或6所述的带摄像装置移动终端的光符识别处理方法,其特征在于,所述标志符是一个可以与所述水平线进行明显比对的圆点或其他图案。
8.根据权利要求4或6所述的带摄像装置移动终端的光符识别处理方法,其特征在于,该标志符在水平线上的水平位置可以被调节。
9.根据权利要求1所述的带摄像装置移动终端的光符识别处理方法,其特征在于,在目标图像上确定待处理区可用下面方法实现通过一个辅助识别的区域框圈定待识别的字符行。
10.根据权利要求9所述的带摄像装置移动终端的光符识别处理方法,其特征在于,该区域框是一个矩形框。
11.根据权利要求10所述的带摄像装置移动终端的光符识别处理方法,其特征在于,该矩形框在目标图像上的高度位置或水平位置,以及该矩形框本身的高度和宽度是可调的。
全文摘要
本发明公开了一种带摄像装置移动终端的光符识别处理方法,其特征在于,包括如下步骤在目标图像上确定待处理区;根据上述待处理区对应于图像中的位置信息将该区域的字符分割出来;对已分割的字符进行识别,并将识别后的结果进行后处理。利用本发明所述的方法,在对目标图像进行信息识别时,该方法可直接帮助手机使用者有针对性地限定待识别的文字区域,随后的OCR处理只对该限定区域内的文字进行处理,使得非重点信息所产生的干扰减少,识别结果的准确率也得到很大提高。
文档编号G06K9/00GK1750016SQ20041007444
公开日2006年3月22日 申请日期2004年9月15日 优先权日2004年9月15日
发明者吴文钦 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1