图像处理方法和装置、字符识别方法和装置的制造方法

文档序号:9397171阅读:339来源:国知局
图像处理方法和装置、字符识别方法和装置的制造方法
【技术领域】
[0001]本公开涉及计算机视觉领域,尤其涉及一种图像处理方法和装置、字符识别方法和装置。
【背景技术】
[0002]随着扫描仪的广泛应用,在很多场合下,人们都通过扫描来得到字符的相关图像。随着不断发展的光学字符识别的相关技术,当人们需要将图像格式的字符进行编辑时,还能够根据图像格式的字符得到计算机能够识别的可编辑字符。例如,广泛使用的OCR文字识别软件就是利用OCR (Optical Character Recognit1n,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。利用该OCR软件进行文字识别时,如果一张图片中文字部分和图片部分相互交错,则识别效果很不理想。

【发明内容】

[0003]为克服相关技术中存在的问题,本公开提供一种图像处理方法和装置、字符识别方法和装置。
[0004]根据本公开实施例的第一方面,提供一种图像处理方法。所述方法包括:提取一灰度图像的纹理特征,生成纹理特征图;确定所述纹理特征图中的连通域和所述连通域的外接矩形;以及根据所述外接矩形中每一个外接矩形各自的像素点的特征参数分别确定所述每一个外接矩形内的图像是否为字符图像。
[0005]根据本公开实施例的第二方面,提供一种字符识别方法。所述方法包括:根据本公开提供的图像处理方法确定一图像中所包括的字符图像;以及对所确定的字符图像进行字符识别。
[0006]根据本公开实施例的第三方面,提供一种图像处理装置。所述装置包括:生成模块,用于提取一灰度图像的纹理特征,生成纹理特征图;连通域确定模块,用于确定所述纹理特征图中的连通域和所述连通域的外接矩形;以及字符图像确定模块,用于根据所述外接矩形中每一个外接矩形各自的像素点的特征参数分别确定所述每一个外接矩形内的图像是否为字符图像。
[0007]根据本公开实施例的第四方面,提供一种字符识别装置。所述装置包括:图像处理装置,用于根据本公开提供的图像处理方法确定一图像中所包括的字符图像;以及识别装置,用于对所确定的字符图像进行字符识别。
[0008]根据本公开实施例的第五方面,提供一种图像处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:提取一灰度图像的纹理特征,生成纹理特征图;确定所述纹理特征图中的连通域和所述连通域的外接矩形;以及根据所述外接矩形中每一个外接矩形各自的像素点的特征参数分别确定所述每一个外接矩形内的图像是否为字符图像。
[0009]根据本公开实施例的第六方面,提供一种字符识别装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:根据本公开提供的图像处理方法确定一图像中所包括的字符图像;以及对所确定的字符图像进行字符识别。
[0010]本公开的实施例提供的技术方案可以包括以下有益效果:
[0011]根据灰度图像的纹理特征图得到连通域,然后根据连通域的外接矩形中像素点的特征参数,判断出每一个外接矩形内的图像中是否为字符图像。这样,使得对所选图片进行文字识别时,只需对确定为字符图像的部分进行识别。因此,减少了运算量,加快了识别速度,节省了时间。
[0012]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
【附图说明】
[0013]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0014]图1是根据一示例性实施例示出的一种图像处理方法的流程图;
[0015]图2是根据另一示例性实施例示出的一种图像处理方法的流程图;
[0016]图3是根据一示例性实施例示出的选取图像的示意图;
[0017]图4是根据一示例性实施例示出的提取灰度图像的纹理特征的流程图;
[0018]图5是根据一示例性实施例示出的根据多个单方向纹理特征图确定纹理特征图的流程图;
[0019]图6是根据一示例性实施例示出的确定纹理特征图中的连通域和连通域的外接矩形的流程图;
[0020]图7是根据又一示例性实施例示出的确定纹理特征图中的连通域和连通域的外接矩形的流程图;
[0021]图8是根据一示例性实施例示出的确定纹理特征图中的连通域和连通域的外接矩形的示意图;
[0022]图9是根据一示例性实施例示出的合并外接矩形的示意图;
[0023]图10是根据一示例性实施例示出的确定每一个外接矩形内的图像是否为字符图像的流程图;
[0024]图11是根据一示例性实施例示出的确定每一个外接矩形各自的像素点的占空比率的流程图;
[0025]图12是根据一示例性实施例示出的确定每一个外接矩形各自的像素点的高频分量比率的流程图;
[0026]图13是根据一示例性实施例示出的一种字符识别方法的流程图;
[0027]图14是根据另一示例性实施例示出的一种字符识别方法的流程图;
[0028]图15是根据一示例性实施例示出的一种图像处理装置的框图;
[0029]图16是根据另一示例性实施例示出的一种图像处理装置的框图。;
[0030]图17是根据一示例性实施例示出的生成模块的框图;
[0031]图18是根据一示例性实施例示出的纹理特征图确定单元的框图;
[0032]图19是根据一示例性实施例示出的连通域确定模块的框图;
[0033]图20是根据一示例性实施例示出的连通域确定模块的框图;
[0034]图21是根据一示例性实施例示出的字符图像确定模块的框图;
[0035]图22是根据一示例性实施例示出的比率确定单元的框图;
[0036]图23是根据一示例性实施例示出的比率确定单元的框图;
[0037]图24是根据一示例性实施例示出的一种字符识别装置的框图;
[0038]图25是根据另一示例性实施例示出的一种字符识别装置的框图;以及
[0039]图26是根据一示例性实施例示出的一种图像处理装置或字符识别装置的框图。
【具体实施方式】
[0040]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0041]在本公开中,在未作相反说明的情况下,使用的方位词如“水平、竖直、横、竖、撇、捺”通常是指相对于用户的方向。
[0042]图1是根据一示例性实施例示出的一种图像处理方法的流程图。如图1所示,所述方法包括以下步骤。
[0043]在步骤Sll中,提取一灰度图像的纹理特征,生成纹理特征图。
[0044]纹理是一种反映图像中同质现象的视觉特征,体现了物体表面共有的内在属性,包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。如果要处理的图像是经过灰度化处理以后的灰度图像,可以在该步骤Sll中,基于相关技术中的基于统计、模型、结构或信号处理的方法来提取该灰度图像的纹理特征,生成纹理特征图。
[0045]在步骤S12中,确定纹理特征图中的连通域和连通域的外接矩形。
[0046]通常求图像中的连通域在是将图像进行二值化以后进行的。也就是,将图像中的像素点的像素值分为O和255两个值以后,根据像素值为O或255的像素点确定连通域。在该步骤S12中,可以将纹理特征图中的像素点按照其像素值分为两类,一类为连通域中的像素点,一类为非连通域中的像素点。从而确定纹理特征图中的连通域。根据连通域可以计算得到该连通域的外接矩形。
[0047]在步骤S13中,根据所述外接矩形中每一个外接矩形各自的像素点的特征参数分别确定所述每一个外接矩形内的图像是否为字符图像。
[0048]通常情况下,一个字符对应着一个连通域。因此,一个外接矩形即对应着一个字符。该步骤S13中,可以设置表示外接矩形中像素点的特征的特征参数,将一外接矩形的特征参数与对大量字符进行统计得到的特征参数进行比对,相似度较高的,可以认为该外接矩形内的图像为字符图像。也就是,判断一外接矩形是否为字符图像,可以以该外接矩形的像素点的特征参数为依据,而将所述外接矩形中每一个外接矩形都进行判断,最终得到纹理特征图中哪些外接矩形内的图像是字符图像的判断结果。
[0049]本公开的上述实施例中,根据灰度图像的纹理特征图得到连通域,然后根据连通域的外接矩形中像素点的特征参数,判断出每一个外接矩形内的图像中是否为字符图像。这样,使得对所选图片进行文字识别时,只需对确定为字符图像的部分进行识别。因此,减少了运算量,加快了识别速度,节省了时间。
[0050]如果要处理的图像不是灰度图像,可以先将要处理的图像进行灰度化,然后再实施以上步骤。图2是根据另一示例性实施例示出的一种图像处理方法的流程图。如图2所示,在图1的基础上,该方法还包括步骤S10。
[0051]在步骤SlO中,将一选定图像灰度化,得到所述灰度图像。
[0052]选定图像时,可以直接将一幅图像全部选定,也可以只选定一幅图像中的一部分,只对选定的部分进行处理。通常选定图像的框为矩形框,本公开中,以选定框为矩形框为例进行说明。
[0053]将选定图像灰度化可以采用常用的灰度化方法,例如,分量法、最大值法、平均值法和加权平均法。灰度化后得到的灰度图像中,像素点的像素值范围通常为0-255。将选定的图像灰度化之后,再进行步骤Sll中的提取纹理特征的步骤。
[0054]图3是根据一示例性实施例示出的选取图像的示意图。如图3所示,当用户看到图3中有一段诗词,要想将该段诗词转换成可编辑的字符,在WORD软件进行编辑,可以用图3中所示的矩形框选定该段诗词,经本公开的上述图像处理方法进行处理后,能够将其识别为字符图像,之后就可以将选定的诗词(图片格式)置于分类器中识别出来。如果用户选定的图像中还包括其他非字符的图像,则应用本公开提供的上述图像处理方法,可以只确定出其中的字符图像,在后续的字符识别中,只对确定为字符图像的图像进行识别。因此,减少了运算量,加快了识别速度,节省了时间。
[0055]图4是根据一示例性实施例示出的提取灰度图像的纹理特征的流程图。如图4所
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1