灰度字符的精确分割装置及方法

文档序号：6516088阅读：175来源：国知局

专利名称：灰度字符的精确分割装置及方法
技术领域：
本发明涉及一种灰度字符的分割装置及方法，具体地，涉及在经过粗略分割的低分辨率灰度文本行图像中对单个字符进行精确分割的方法和装置。
背景技术：
字符分割是字符识别的在先步骤之一，现在已有许多与该技术相关的论文和专利。比如Y.Lu，“Machine Printed Character Segmentation-An Overview”.Pattern Recognition，Vol.28，no.1，pp.67-80，Jan，1995；S.W.Lee，D.J.Lee，H.S.Park，“A New Methodology for Gray-ScaleCharacter Segmentation and Recognition”.IEEE transaction on patternanalysis and machine intelligence，Vol.18，no.10，pp.1045-1050，Oct，1996；Kamitani的美国专利No.6,327,385“Character segmentation deviceand character segmentation system”；Hanson的美国专利No.5,692,069“Apparatus for performingcharacter segmentation using slant histograms”；以及Tan的美国专利No.5,172,422“Fast character segmentation ofskewed text lines for optical character recognition”等。
以上论文和专利讲的都是如何处理互相接触的字符，其中许多方法都应用二值的字符图像，这些方法应用在低分辨率图像中会引起很多分割误差。目前，没有一篇论文或一项专利涉及低分辨率灰度字符的分割。
低分辨率字符的识别相当困难，而灰度特征法是可能的解决方法之一。但是如果字符未经过精确分割，那么从图像中提取的特征的效果会很差。所以，对低分辨率字符进行精确分割是成功提取灰度特征的必要步骤。
低分辨率字符的图像尺寸一般小于20*20象素，且字符的真实边界往往位于一个象素点以内。因此，对真实字符的边界进行精确定位对于之后的特征提取模块至关重要。很显然，需要一种能够对低分辨率的灰度字符图像进行精确分割的方法和装置。

发明内容
本发明鉴于现有技术的上述缺点产生，目的是提供一种灰度字符的精确分割装置及方法。
根据本发明的一个方面，本发明提供了一种灰度字符精确分割装置，包括调整分割单元，用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割，从而产生经调整分割的字符图像；字符图像二值化单元，用于根据输入的所述经调整分割的字符图像生成二值字符图像；消噪单元，用于消除所述字符图像二值化单元生成的二值字符图像中的噪声信息；最终字符图像分割单元，用于根据被消除了噪声信息的所述二值字符图像产生精确分割的字符图像。
优选地，还包括放大单元，设置在所述调整分割单元和所述字符图像二值化单元之间，用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前，放大所述经调整分割的字符图像。
优选地，还包括字符图像增强单元，设置在所述调整分割单元和所述字符图像二值化单元之间，用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前，对所述经调整分割的字符图像进行字符图像增强，使所述字符图像中的字符的笔画更加清晰。
优选地，还包括字符图像增强单元，设置在所述放大单元和所述字符图像二值化单元之间，用于在被所述放大单元放大了的所述经调整分割的字符图像输入所述字符图像二值化单元之前，对被放大了的所述经调整分割的字符图像进行字符图像增强，使所述字符图像中的字符的笔画更加清晰。
优选地，所述调整分割单元包括文本行方向检测单元，用于检测所述文本行图像中文本行的方向；字符图像大小计算单元，用于计算字符图像的大小；字符图像调整单元，根据所述文本行方向检测单元的检测结果和所述字符图像大小计算单元的计算结果，对字符图像进行调整，使字符图像包括字符的全部笔画。
优选地，所述字符图像增强单元包括背景象素值估算单元，用于估算所述字符图像的背景象素值；背景消除单元，用于根据所述背景象素值估算单元的估算结果消除所述字符图像的背景；象素值增强单元，用于增强消除背景之后的字符图像的象素值。
优选地，所述背景象素值估算单元使用直方图法估算背景象素值。
优选地，所述象素值增强单元使用S型函数增强消除背景之后的字符图像的象素值。
优选地，所述消噪单元包括连接组件分析单元，用于对所述二值字符图像中的连接组件进行分析，找出每个连接组件包含的象素点，计算所述二值字符图像中的连接组件的个数；噪声连接组件判断单元，用于判断一连接组件是否为噪声连接组件；噪声连接组件消除单元，用于消除所述二值字符图像中的被所述噪声连接组件判断单元判断为噪声连接组件的连接组件。
优选地，所述噪声连接组件判断单元根据以下条件判断一连接组件是否为噪声连接组件连接组件的尺寸＜所述二值字符图像的尺寸/比例尺度；连接组件的边界距所述二值字符图像边界的距离＜阈值；如果所述连接组件同时满足这两个条件，则判断该连接组件是噪声连接组件。
优选地，所述比例尺度为3或4。
根据本发明的另一方面，还提供了一种对经粗略分割的文本行图像中的单个灰度字符进行精确分割的方法，包括以下步骤调整分割步骤，用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割，从而产生经调整分割的字符图像；字符图像二值化步骤，用于对所述调整分割步骤处理过的字符图像进行二值化；消噪步骤，用于消除经所述二值化步骤生成的二值字符图像中的噪声信息；最终字符图像分割步骤，用于从被消除了噪声信息的所述二值字符图像中产生精确分割的字符图像。
优选地，包括放大步骤，用于放大所述分割调整步骤产生的经调整分割的字符图像。
优选地，包括字符图像增强步骤，用于对经所述放大步骤放大了的所述经调整的字符图像进行字符图像增强，使所述字符图像中的字符的笔画更加清晰。
其中，所述调整分割步骤包括文本行方向检测步骤，用于检测文本行的方向；字符图像大小计算步骤，用于计算字符图像的大小；字符图像调整步骤，根据所述文本行方向检测步骤的检测结果和所述字符图像大小计算步骤的计算结果，对字符图像进行调整，使字符图像包括字符的全部笔画。
其中，所述字符图像增强步骤包括背景象素值估算步骤，用于估算字符图像的背景象素值；背景消除步骤，用于根据所述背景象素值估算步骤的估算结果消除所述字符图像的背景；象素值增强步骤，用于增强消除背景之后的字符图像的象素值。
其中，在所述背景象素值估算步骤中使用直方图法估算背景象素值。
其中，在所述象素值增强步骤中使用S型函数来增强消除背景之后的字符图像的象素值。
其中，所述消噪步骤包括连接组件分析步骤，用于对所述二值字符图像中的连接组件进行分析，找出每个连接组件包含的象素点，计算所述二值字符图像中的连接组件中的个数；噪声连接组件判断步骤，用于判断一连接组件是否为噪声连接组件；消除步骤，消除所述二值字符图像中被所述噪声连接组件判断步骤判断为噪声连接组件的连接组件。
其中，在所述噪声连接组件判断步骤中根据以下条件判断一连接组件是否为噪声连接组件连接组件的尺寸＜所述二值字符图像的尺寸/比例尺度；连接组件的边界距所述二值字符图像边界的距离＜阈值；如果所述连接组件同时满足这两个条件，则判断该连接组件是噪声连接组件。
本发明能够精确得到低分辨率字符图像中字符的边界，从而可以有效地进行字符图像的分割，为有效进行字符识别的后续步骤(例如字符特征提取)提供保证。

图1是本发明的灰度字符精确分割装置的示意方框图；图2是图1中的调整分割放大单元的工作流程图；图3是图1中的字符图像增强及二值化单元的工作流程图；图4是图1中的消噪单元的详细工作流程图；图5是最终字符图像分割单元的详细工作流程图；图6-1示出了所输入的粗略分割的字符图像；图6-2是粗略分割调整的结果；图6-3是消除背景象素的结果；图6-4是二值化的结果；图6-5是消噪后的结果；图6-6是最终经过分割的字符图像结果。
具体实施例方式
下面结合附图详细说明本发明的原理和优选实施例。
本发明用于在已知一幅低分辨率的文本行图像以及该文本行图像中各个字符的粗略分割结果后，对各个字符进行精确的分割。经过这样分割的字符可以用于字符识别中的特征提取。粗略分割可以由手工大致框定字符的边界来完成，也可以利用图像的二值化结果来自动得到。这个框定的边界有可能包含很多背景区域，也可能把一个字符的部分边界分割开来。精确分割就是精确找到一个字符的上下左右边界。
图1是本发明的灰度字符精确分割装置的示意方框图。如图1所示，根据本发明的灰度字符精确分割装置包括调整分割放大单元102、字符图像增强及二值化单元103、消噪单元104、最终字符图像分割单元105。其输入为经粗略分割的低分辨率灰度文本行图像101，其输出为经过精确分割的字符图像106。应该注意到，上述的单元只是示例性的，不是对本发明的限制，调整分割放大单元102可进一步细分为调整分割单元以及放大单元，而字符图像增强及二值化单元103也可进一步细分为字符图像增强单元和字符图像二值化单元，并且，字符图像增强单元还可进一步细分为背景象素值估算单元、背景象素值消除单元和象素值增强单元。另外，调整分割放大单元可由文本行方向检测单元、字符大小计算单元、字符图像调整单元等构成。消噪单元可进一步分成连接组件分析单元、噪声连接组件判断单元和噪声连接组件消除单元。
如上所述，字符图像的粗略分割可以通过手工或者利用现有技术通过对二值化后的图像自动分割得到。随后调整分割放大单元102对所输入的低分辨率文本行图像的粗略分割的结果进行调整，然后由字符图像增强及二值化单元103进行字符图像增强及二值化，并由消噪单元104进行消噪，以生成无噪声的二值字符图像。最后，由最终字符图像分割单元105进行最终字符图像分割，找出在消噪单元104中生成的二值字符图像的字符的边界，在放大的灰度图像中显示出真正的字符边界，并进行提取。最终字符图像分割单元105的输出结果即是经过精确分割的字符图像106。
下面结合图2到图5详细说明上述各单元102-105中的操作。
在调整分割放大单元102中，首先利用所输入的文本行图像中各个字符的前后字符的粗略分割结果(参见图6-1)，对该字符的边界范围进行调整，然后对经过调整的图像内容进行提取(分割)和放大，从而真实字符的图像全部落在输出的已放大的灰度字符图像中。
图2示出了图1中的调整分割放大单元102的具体工作流程。该调整分割放大单元的输入是经粗略分割的低分辨率灰度文本行图像101。具体地，包括经粗略分割的当前字符图像之前的字符图像S201、当前字符图像S202和当前字符图像S202之后的字符图像S203。由于一个字符图像的边界调整涉及到其前一个字符图像和后一个字符图像的边界，因而首先由调整放大单元102的文本行方向检测单元(未示出)进行文本行方向检测(步骤S204)。如果是横向的文本行，在调整字符图像的左右边界时，调整以后的边界不应该过多超过其左右字符图像的边界范围。如果是纵向的文本行，在调整上下边界时，调整以后的边界不应该过多超过上下字符图像的边界范围。文本行方向检测的检测方法为1)利用所述文本行(例如上述三个字符)的粗略分割结果确定该文本行的边界框。上述的粗略分割的结果就是各字符图像的边界框(可参见图6-1)，由一个矩形的框来代表，宽度就是矩形的宽度，高度就是矩形的高度。可以利用现有的技术，通过找出这些字符(例如该三个字符)的边界框的最左、最右、最上、最下的坐标，而限定新的边界框。该边界框就是文本行边界框。
2)计算文本行边界框的宽度和高度。
3)如果宽度＞高度，则该文本行为水平文本行，反之为垂直文本行。
在判断出文本行图像中的文本行的方向之后，在优选实施例中，随即确定文本行的调整顺序。如果文本行方向为水平方向，即输入的是水平文本行，则先进行左右顺序的字符边界调整，然后进行上下顺序的字符调整。如果文本行方向不是水平方向，即输入的是垂直文本行，则先进行上下顺序的字符边界调整，再进行左右顺序的字符调整。应该注意到，上述的调整顺序是可以改变的。
接着由调整分割放大单元的字符图像大小计算单元(未示出)计算字符图像的大小。设当前字符图像之前的字符图像经粗略分割的左、右、上、下边界为xs_p，xe_p，ys_p，ye_p，当前字符图像经粗略分割的左、右、上、下边界为xs_c，xe_c，ys_c，ye_c，当前字符图像之后的字符图像经粗略分割的左、右、上、下边界为xs_n，xe_n，ys_n，ye_n.；当前字符图像经粗略分割的宽和高分别为width_c，height_c，当前字符的尺寸为size_c(即imagesize)。则如果width_c＞height_c则size_c＝width_c否则size_c＝height_c随后由调整分割放大单元102的字符图像调整单元对字符图像的边界进行调整。此处再假定当前字符图像经过边界调整的左、右、上、下边界为xs_cl，xe_cl，ys_cl，ye_cl。
调整的原则是对于水平文本行，将一个字符图像的左边界和右边界进行扩大，但不能过多包括其左右两侧的字符。上下边界的范围也要放宽一定程度以防止粗略分割把一个字符切成了2部分。放宽的程度根据字符尺寸size_c的一定比例决定。对于垂直文本行，将一个字符图像的上下边界进行扩大，但也不要过多包括其上下两侧的字符图像，并且其左右边界的范围也要放宽一定程度以防止粗略分割把一个字符切成了2部分。最后要求的效果是，即使粗略分割把一个字符的一部分误分在粗分割的范围之外，经过调整以后的分割结果也能够完整地包含该字符的所有部分。
如果文本行经检测为水平文本行，则进行字符左边界调整(步骤S206)、字符右边界调整(步骤S207)、字符上边界调整(步骤S208)和下字符边界调整(步骤S209)对当前字符的左、右、上、下边界进行调整。在下面的描述中，假设图像的左上角是坐标的原点，y的方向是沿坐标原点向下的方向，x的方向是沿坐标原点向右的方向。
步骤S206的字符图像左边界的调整规则为如果xe_p＜＝xs_c则xs_cl＝xe_p否则xs_cl＝xs_c步骤S207的字符图像右边界的调整规则为如果xe_c＜xs_n则xe_cl＝xs_n否则xe_cl＝xe_c步骤S208的字符图像上边界的调整规则为如果ys_c-r*size_c＞＝0则ys_cl＝ys_c-r*size_c否则
ys_cl＝0S209单元的字符图像下边界的调整规则为如果ye_c+r*size_c＜＝文本行的高度则ye_cl＝ye_c+r*size_c否则ye_cl＝文本行的高度在S208和S209单元中，r是控制调整的参数。比如r可以取值为0.2。
类似地，如果文本行经检测为竖直文本行，则进行字符上边界调整(步骤S210)、字符下边界调整(步骤S211)、字符左边界调整单元(步骤S212)和字符右边界调整(步骤S213)对当前字符的上、下、左、右边界进行调整。
步骤S210的调整规则为如果ye_p＜ys_c则ys_cl＝ye_p否则ys_cl＝ys_c步骤S211的调整规则为如果ye_c＜ys_n则ye_cl＝ys_n否则ye_cl＝ye_c步骤S212的调整规则为如果xs_c-r*size_c＞0则xs_cl＝xs_c-r*size_c否则xs_cl＝0步骤S213的调整规则为如果xe_c+r*size_c＜文本行宽度则xe_cl＝xe_c+r*size_c否则xe_cl＝文本行宽度在步骤S212和S213中，r是控制调整的参数。比如r可以取值为0.2。
经过调整之后，由xs_cl，xe_cl，ys_cl和ye_cl所界定的字符图像的图像内容被从文本行中切割出来(步骤S214)。这4个值确定了一个矩形的左右上下边界，文本图像中用这个矩形定义的边界就是所需要的部分，把这个部分的内容拷贝下来就是切割的过程。然后切割出来的字符图像将被放大到原尺寸的N倍(步骤S215)。图像放大算法可以参见冈萨雷斯，《数字图像处理(第二版)》，阮秋琦，阮宇智等译。电子工业出版社，2003年3月第一版，第50页。例如，N可以取值为4。调整分割放大的输出就是经过放大的灰度字符图像S216(可参见图6-3)。
应该注意上述的调整方法只是示例性的，也可以采用本领域技术人员所知的其它调整方法，只要这些方法可以使字符的真正边界全部落入调整以后的字符边界框内部。
图3是图1中的字符图像增强及二值化单元的工作流程图。字符图像增强的目的是为了让字符图像中的低分辨率下模糊的字符笔画变得清晰，如果不进行字符图像增强，后续的识别效果不好。如图3所示，在字符图像增强和二值化单元中，首先由背景象素值估算单元来估算背景象素值(S301)。这可以使用经过放大的字符图像S216的灰度直方图来获得。图像中灰度直方图的计算方法可以参照章毓晋编著，“图像处理和分析”，清华大学出版社，1991年3月。该直方图中的最大值对应的象素值就作为背景象素值。然后在步骤S302中由背景消除单元来消除背景。如果假设字符象素点的理想象素值是255的话，消除背景就是找出所有的背景象素点，并把背景象素点的象素值设置成0。具体地，假设该背景象素值为Vbk，例如在背景色较亮的情况下，检查输入的图像中的所有的象素点，如果一个象素点的灰度值大于Vbk，那么把该象素点的灰度值设置为Vbk，如果一个象素点的灰度值小于Vbk，那么该点的灰度值不变。前面假设的情况是字符的象素值低于背景的象素值，如果背景象素点的象素值低于字符象素点的象素值，即在背景色较暗的情况下，也可采用类似的处理，将灰度值小于Vbk的象素点的灰度值设置为Vbk，而保留灰度值大于Vbk的象素点，从而消除背景(S302)(参见图6-3)。之后，通过一个S型函数来增强消除了背景的灰度图像的象素值(S303)，增强的算法如下1、假设一个象素点的灰度值是g，首先对一幅图像中的每一个象素点的灰度进行如下的变换f(g)＝(exp((g-off)/t)-1)/(exp((g-off)/t)+1)；其中off和t是变换的参数，比如可以取off＝0，t＝96。
由于这个函数的形状是S形，因此又叫作S型函数。
2、找出经过变换以后的函数值的最大值和最小值max，min。
3、对每一个点的函数值进行如下操作g1＝(f(g)-min)*255/(max-min)；然后取g1的整数值，这个整数值就是经过图像增强以后的新的图像中该点的灰度值。
在字符增强之后，根据一个给定的阈值Th，将被增强的灰度图像二值化(步骤S304)。首先产生一幅新的图像，该图像的大小和原灰度图像是一致的，新图像象素点的取值由如下规则决定对经过增强以后的图像中的每一个象素点的灰度值进行判断，如果灰度值大于Th，把新图像中对应点的灰度值设置为255，反之设置为0。由于新图像象素点的取值只可能有2种选择0或者255，因此这个过程叫做二值化。二值化的结果是得出一幅二值字符图像S305(参见图6-4)。
通常，二值字符图像在字符边界附近会存在一些噪声部分，它们可能是背景象素，或者是因不精确的前后字符粗略分割而误划进来的字符笔画。本发明的方法要进行消噪处理，将这些噪声消除。也就是说，经过分割调整以后，虽然字符本身完全被包含在了调整的边界以内，但是这个边界内可能还包含相邻字符的部分笔画。这些笔画是噪声信息，因此需要消去噪声。
图4是图1中消噪单元104的消噪处理的详细流程图。如图4所示，首先由消噪单元的连接组件分析单元对输入的二值字符图像(S305)的连接组件(CC)进行分析。找出每个连接组件包含的象素点，得到连接组件的总数(S401)。连接组件就是一幅二值图像中彼此相连的象素的集合，比如“二”字里面有2个连接组件。图像中连接组件分析算法可以参见冈萨雷斯，《数字图像处理(第二版)》，第435页，阮秋琦，阮宇智等译。电子工业出版社，2003年3月第一版。
随后由噪声连接组件判断单元对各连接组件是否为噪声连接组件进行判断。在进行是否为噪声连接组件的判断时，首先要计算连接组件的尺寸及其与字符边界的距离。具体地，首先设置i＝0(S402)，其中i表示图像中连接组件的索引号，i＝0代表从第1个连接组件开始。然后从该第一个连接组件开始，获得各个连接组件的外边界框。连接组件中所有象素点的上下左右边界就是连接组件的外边界框。然后估计连接组件的尺寸Size，即取该连接组件的外边界框的宽度值和高度值中的较大者(S403)。并得到第i个连接组件(ith CC)的外边界框与字符图像边界(即xs_cl，xe_cl，ys_cl和ye_cl)之间的距离，将其规定为Distance(S404)。另外，假定字符图像的大小为imagesize，即上文的字符图像的尺寸，也就是字符图像的宽度值和高度值中的较大者。然后对该连接组件进行是否为噪声连接组件的判断(S405)，并在被判断为噪声连接组件的情况下，消除该连接组件(S406)。即如果一个连接组件满足了如下两个条件，那么该连接组件就被认为是一个噪声连接组件，将被从二值字符图像中消除。
两个条件如下1、Size＜imagesize/N12、Distance＜N2其中，N1是一个比例尺度，比如N1＝3，N2是距离的一个阈值。即如果一个连接组件尺度很小(例如小于字符图像尺寸的1/3)，本身距离字符边界的距离小于一定的阈值，那么这个组件就是噪声连接组件。
由噪声连接组件消除单元来消除噪声连接组件，消除噪声连接组件的方法如下1、创建一个新的和原来二值图像一样大小的图像，把新图像中所有象素点的值都设置为0。
2、对于原来二值图像中的非噪声连接组件(包括尚未判断的连接组件)中的每一个象素点，把新的图像中对应象素点的灰度值设置为255。
新的图像就是消除了该噪声连接组件的字符图像。
二值字符图像中所有的连接组件都要进行上述的尺寸计算、距离估算、噪声连接组件判断并在被判断为噪声连接组件时进行消除等步骤，最终输出二值化的无噪声字符图像S409(参见图6-5)。
具体地，噪声连接组件的判断和噪声连接组件的消除的步骤为在步骤S403中估算连接组件的尺寸，在步骤S404中估算该连接组件与边界的距离，然后在步骤S405中对连接组件是否满足上述两个条件进行判断，如果不满足这两个条件，则过程进入步骤S407，通过将i值加1来指定下一连接组件，并进入步骤S408。如果满足了这两个条件，则判断这个连接组件为噪声连接组件，并在步骤S406中将其消除，随后再进入步骤S407，指定下一连接组件，并进入步骤S408。在步骤S408中，判断是否已分析完所有的连接组件(图中的nCC表示组件总数)，如果未分析完，则进入步骤S403，从步骤S403开始进行所指定的连接组件的分析，如果分析完了所有的连接组件，则输出经过消噪的二值字符图像(S409)。
图5示出了最终字符图像分割单元105的详细工作流程图。首先输入经过消噪的二值字符图像(S409)，并设置i＝0(S501)，其中i表示图像中连接组件的索引号，i＝0代表从第1个连接组件开始。然后求出该连接组件的外边界框(S502)，即找出该连接组件的所有象素点的最上，最左，最右和最下边界。随后判断i是否等于0(步骤S503)，如果等于0(步骤S503中的是)，则将该连接组件的外边界框设置为暂定字符边界框(步骤S504)。否则(步骤S503中的否)，在步骤S505中将该连接组件的边界框与暂定字符边界框进行合并。也就是说，最初始的暂定字符边界框就是第一个连接组件的外边界框，从第二个连接组件开始，进行的操作是合并2个边界框，一个是当前的所有组件的外边界框(从第一个到当前连接组件的前一个的组合，即暂定字符边界框)，一个是当前连接组件的外边界框，从而得到新的暂定字符边界框。合并步骤是找到2个边界框的最上，最下，最左，和最右边界。就是合并以后的外边界框。然后在步骤S506中，通过将i值加1来指定下一连接组件，并在步骤S507中，判断是否已处理完所有的连接组件，如为处理完，则过程返回步骤S502，重复以上步骤，直至处理完所有的连接组件，这时得到的暂定字符边界框即所需的字符边界框。然后，在已放大的灰度字符图像S216中，提取出由该字符边界框所框定的灰度内容(S508)，即用该字符边界框定义的范围从放大灰度图像中把框定的图像拷贝出来。即经过精确分割的字符图像，这就是本发明的最终输出(参见图6-6)。
图6-1～6-6显示出以上各单元的输出结果图6-1示出了所输入的粗略分割；图6-2是调整分割放大之后的结果；图6-3是消除背景象素之后的结果；图6-4是二值化之后的结果；图6-5消噪之后的结果；图6-6是最终经过分割的字符图像。
本发明能够精确得到低分辨率图像中字符的边界，从而有效进行字符的分割，为字符识别的后续步骤，比如字符特征提取的有效性提供保证。
本领域的技术人员应明白，在不脱离本发明的精神和范围的情况下，可以对本发明进行各种修改和变化。因而本发明覆盖了落入所附的权利要求及其等同范围内的对本发明的所有修改和变化。
权利要求
1.一种灰度字符精确分割装置，其特征在于，包括调整分割单元，用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割，从而产生经调整分割的字符图像；字符图像二值化单元，用于根据输入的所述经调整分割的字符图像生成二值字符图像；消噪单元，用于消除所述字符图像二值化单元生成的二值字符图像中的噪声信息；最终字符图像分割单元，用于根据被消除了噪声信息的所述二值字符图像产生精确分割的字符图像。
2.根据权利要求1所述的灰度字符精确分割装置，其中，还包括放大单元，设置在所述调整分割单元和所述字符图像二值化单元之间，用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前，放大所述经调整分割的字符图像。
3.根据权利要求1所述的灰度字符精确分割装置，其中，还包括字符图像增强单元，设置在所述调整分割单元和所述字符图像二值化单元之间，用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前，对所述经调整分割的字符图像进行字符图像增强，使所述字符图像中的字符的笔画更加清晰。
4.根据权利要求2所述的灰度字符精确分割装置，其中，还包括字符图像增强单元，设置在所述放大单元和所述字符图像二值化单元之间，用于在被所述放大单元放大了的所述经调整分割的字符图像输入所述字符图像二值化单元之前，对被放大了的所述经调整分割的字符图像进行字符图像增强，使所述字符图像中的字符的笔画更加清晰。
5.根据权利要求1到4任一项所述的灰度字符精确分割装置，其中，所述调整分割单元包括文本行方向检测单元，用于检测所述文本行图像中文本行的方向；字符图像大小计算单元，用于计算字符图像的大小；字符图像调整单元，根据所述文本行方向检测单元的检测结果和所述字符图像大小计算单元的计算结果，对字符图像进行调整，使所述经调整分割的字符图像中包括字符的全部笔画。
6.根据权利要求3或4所述的灰度字符精确分割装置，其中，所述字符图像增强单元包括背景象素值估算单元，用于估算所输入字符图像的背景象素值；背景消除单元，用于根据背景象素值估算单元估算出的背景象素值来消除背景；象素值增强单元，用于增强消除背景之后的字符图像的象素值。
7.根据权利要求6所述的灰度字符精确分割装置，其中，所述背景象素值估算单元使用直方图法估算所述背景象素值。
8.根据权利要求6所述的灰度字符精确分割装置，其中，所述象素值增强单元使用S型函数增强所述象素值。
9.根据权利要求1到4任一项所述的灰度字符精确分割装置，其中，所述消噪单元包括连接组件分析单元，用于对所述二值字符图像中的连接组件进行分析，找出每个连接组件包含的象素点，计算所述二值字符图像中的连接组件的个数；噪声连接组件判断单元，用于判断一连接组件是否为噪声连接组件；噪声连接组件消除单元，用于消除所述二值字符图像中被所述噪声连接组件判断单元判断为噪声连接组件的连接组件。
10.根据权利要求9所述的灰度字符精确分割装置，其中，所述噪声连接组件判断单元根据以下条件判断一连接组件是否为噪声连接组件连接组件的尺寸＜所述二值字符图像的尺寸/比例尺度连接组件的边界距所述二值字符图像边界的距离＜阈值如果所述连接组件同时满足这两个条件，则判断该连接组件是噪声连接组件。
11.根据权利要求10所述的灰度字符精确分割装置，其中，所述比例尺度为3或4。
12.一种对经粗略分割的文本行图像中的单个灰度字符进行精确分割的方法，包括以下步骤调整分割步骤，用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割，从而产生经调整分割的字符图像；字符图像二值化步骤，用于对所述调整分割步骤处理过的字符图像进行二值化；消噪步骤，用于消除经所述二值化步骤生成的二值字符图像中的噪声信息；最终字符图像分割步骤，用于从被消除了噪声信息的所述二值字符图像中产生精确分割的字符图像。
13.根据权利要求12所述的方法，还包括放大步骤，用于在所述调整分割步骤产生的经调整分割的字符图像进行所述字符图像二值化步骤之前，放大所述经调整分割的字符图像。
14.根据权利要求13所述的方法，还包括字符图像增强步骤，在所述字符图像二值化步骤之前，用于对经所述放大步骤放大了的所述经调整的字符图像进行字符图像增强，使所述字符图像中的字符的笔画更加清晰。
15.根据权利要求12所述的方法，其中，所述调整分割的步骤包括文本行方向检测步骤，用于检测文本行的方向；字符图像大小计算步骤，用于计算字符图像的大小；字符图像调整步骤，根据所述文本行方向检测步骤的判断结果和所述字符图像大小计算步骤的计算结果，对字符图像进行调整，使字符图像包括字符的全部笔画。
16.根据权利要求14所述的方法，其中，所述字符图像增强步骤包括背景象素值估算步骤，用于估算字符图像的背景象素值；背景消除步骤，用于根据背景象素值估算步骤估算出的背景象素值来消除背景；象素值增强步骤，用于增强消除背景之后的字符图像的象素值。
17.根据权利要求16所述的方法，其中，在所述背景象素值估算步骤中使用直方图法估算所述背景象素值。
18.根据权利要求16所述的方法，其中，在所述象素值增强步骤中使用S型函数来增强消除背景之后的字符图像的象素值。
19.根据权利要求12到18中任一项所述的方法，其中，所述消噪的步骤包括连接组件分析步骤，用于对所述二值字符图像中的连接组件进行分析，找出每个连接组件包含的象素点，计算所述二值字符图像中的连接组件的个数；噪声连接组件判断步骤，用于判断一连接组件是否为噪声连接组件；噪声连接组件消除步骤，用于消除所述二值字符图像中被所述噪声连接组件判断步骤判断为噪声连接组件的连接组件。
20.根据权利要求19所述的方法，其中，在所述噪声连接组件判断步骤中根据以下条件判断一连接组件是否为噪声连接组件连接组件的尺寸＜所述二值字符图像的尺寸/比例尺度连接组件的边界距所述二值字符图像边界的距离＜阈值如果所述连接组件同时满足这两个条件，则判断该连接组件是噪声连接组件。
全文摘要
灰度字符精确分割装置及方法。灰度字符精确分割装置包括调整分割单元，用于对输入的经粗略分割的低分辨率文本行图像进行调整分割，从而产生经调整的字符图像；字符图像二值化单元，用于根据输入于其中的字符图像生成二值字符图像；消噪单元，用于消除所述二值化单元生成的二值字符图像中的噪声信息；最终字符图像分割单元，用于从被消除了噪声的所述二值字符图像中产生精确分割的字符图像。
文档编号G06K9/34GK1822027SQ20051000851
公开日2006年8月23日申请日期2005年2月18日优先权日2005年2月18日
发明者孙俊, 堀田悦伸, 胜山裕, 直井聪申请人:富士通株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙俊;堀田悦伸;胜山裕;直井聪
技术所有人：富士通株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。