文字识别方法和装置的制造方法

文档序号:9766202阅读:566来源:国知局
文字识别方法和装置的制造方法
【技术领域】
[0001] 本申请涉及数据处理技术领域,尤其涉及一种文字识别方法和装置。
【背景技术】
[0002] 文字识别领域中,文字的描述特征在很大程度上决定了识别的准确率和识别速 度。一般的文字识别中,基于二值图像的文字识别方法受前期预处理的影响较大,适合拍照 质量很好的应用场合。但对于打印的小票或其他印刷品,常常存在打印字不清晰,或印墨不 均匀的情况,适合采用灰度图像的识别方法。
[0003] 基于灰度图像的识别方法中,主流的化g特征法适用于数字的识别,G油or特征法 适用于中文的识别。G油or特征识别法是通过不同尺度和方向的G油or核对图像进行卷积 运算,然后抽取卷积图像后的像素点作为文字的描述特征。该方法具有较高的识别率,但运 算量比较大,对识别速度有较大的影响。

【发明内容】

[0004] 本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005] 为此,本申请的一个目的在于提出一种文字识别方法,该方法可W准确高效地识 别图像中的文字。
[0006] 本申请的另一个目的在于提出一种文字识别装置。
[0007] 为达到上述目的,本申请实施例提出的文字识别方法,包括:根据预设的特征算 子,获取待识别的图像的特征向量,所述特征算子用于根据当前处理的像素点的不同方向 上的相邻的局部像素点进行运算;将所述待识别的图像的特征向量与预先获取的文字样本 的特征向量进行比对,获取所述待识别的图像的文字识别结果,其中,所述文字样本的特征 向量是根据所述特征算子对所述文字样本进行运算后得到的。
[0008] 本申请实施例提出的文字识别方法,通过根据预设的特征算子,获取待识别的图 像的特征向量并与预先获取的文字样本的特征向量进行比对,获取待识别的图像的文字识 别结果,由于特征向量是根据预设的特征算子对当前处理的像素点的不同方向上的相邻的 局部像素点进行运算得到的,对文字的特征表述更加准确,提高了识别准确率,且计算简 单,提高了识别速度。
[0009] 为达到上述目的,本申请实施例提出的文字识别装置,包括:获取模块,用于根据 预设的特征算子,获取待识别的图像的特征向量,所述特征算子用于根据当前处理的像素 点的不同方向上的相邻的局部像素点进行运算;识别模块,用于将所述待识别的图像的特 征向量与预先获取的文字样本的特征向量进行比对,获取所述待识别的图像的文字识别结 果,其中,所述文字样本的特征向量是根据所述特征算子对所述文字样本进行运算后得到 的。
[0010] 本申请实施例提出的文字识别装置,通过根据预设的特征算子,获取待识别的图 像的特征向量并与预先获取的文字样本的特征向量进行比对,获取待识别的图像的文字识 别结果,由于特征向量是根据预设的特征算子对当前处理的像素点的不同方向上的相邻的 局部像素点进行运算得到的,对文字的特征表述更加准确,提高了识别准确率,且计算简 单,提高了识别速度。
[0011] 本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本申请的实践了解到。
【附图说明】
[0012] 本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变 得明显和容易理解,其中:
[0013] 图1是本申请一个实施例提出的文字识别方法的流程示意图;
[0014] 图2是本申请一个实施例中的特征算子的示意图;
[0015] 图3是本申请一个实施例中的分别采用每种特征算子,对所述待识别的图像进行 运算,得到与所述特征算子数量相同的至少一组的特征向量的流程示意图;
[0016] 图4是本申请一个实施例中采用特征算子a对待识别的图像进行运算,得到第一 图像和第二图像的示意图;
[0017] 图5是本申请一个实施例中根据所述第一图像得到第一组一维向量并根据所述 第二图像得到第二组一维向量的示意图;
[0018] 图6是本申请另一实施例提出的文字识别方法的流程示意图;
[0019] 图7是本申请另一实施例的文字识别装置的结构示意图;
[0020] 图8是本申请另一实施例的文字识别装置的结构示意图。
【具体实施方式】
[0021] 下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考 附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反, 本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同 物。
[0022] 下面参考附图描述根据本申请实施例的文字识别方法和装置。
[0023] 图1是本申请一实施例提出的文字识别方法的流程示意图,该方法包括:
[0024] SlOl ;根据预设的特征算子,获取待识别的图像的特征向量,所述特征算子用于根 据当前处理的像素点的不同方向上的相邻的局部像素点进行运算。
[00巧]其中,预设的特征算子包括至少一种。在本申请的一个实施例中,如图2所示,特 征算子可W是如下算子中的至少一项:
[0026] 第一种特征算子(图2中的算子a),所述第一种特征算子用于根据当前处理的像 素点的相邻行的局部像素点进行运算;
[0027] 第二种特征算子(图2中的算子b),所述第二种特征算子用于根据当前处理的像 素点的相邻列的局部像素点进行运算;
[0028] 第H种特征算子(图2中的算子C),所述第H种特征算子用于根据当前处理的像 素点的一种相邻对角线的局部像素点进行运算;
[0029] 第四种特征算子(图2中的算子d),所述第四种特征算子用于根据当前处理的像 素点的另一种相邻对角线的局部像素点进行运算。
[0030] 具体地,可W分别采用每种特征算子,对所述待识别的图像进行运算,得到与所述 特征算子数量相同的至少一组的特征向量,对所述至少一组的特征向量进行组合,获取待 识别的图像的特征向量。
[0031] 进一步地,参见图3,分别采用每种特征算子,对所述待识别的图像进行运算,得到 与所述特征算子数量相同的至少一组的特征向量,可W通过W下步骤实现:
[0032] S301 ;分别采用每种特征算子,对待识别的图像进行运算,得到第一图像和第二图 像。
[0033] 下面将W算子a为例对至少一组的特征向量的计算方法进行说明。
[0034] 具体地,参见图4,对于输入的待识别的图像Img,其经过算子a进行局部运算后会 得到两张同样大小的图像ImgO和Imgl。对图中的每个非边缘像素点PO,可W采用如下方 式确定所述像素点对应的第一图像和第二图像中的像素点的值:
[0035] 获取所述每种特征算子描述的方向上与所述像素点相邻的第一组像素点的灰度 值和第二组像素点的灰度值;获取所述第一组像素点的灰度值之和与所述第二组像素点的 灰度值之和之间的差值。具体地,在利用算子a进行计算时,则为计算PO上下相邻行局部 像素点的灰度值之和的差值V ;v= (pl+p2+p3)-(p4+p5+p6);其中,局部像素点是指左右和 /或上下相邻的像素点。送一步骤与现有的边缘计算算子的方法相近,但在本方案中,为了 去除因光照或打印不均匀造成的局部差值波动较大、便于向量归一化,还需要根据预先设 置的阔值和比较方向,对所述差值V进行二值化处理,得到第一图像中的像素点的值,W及 第二图像中的像素点的值: ,[I^V > B "[切< -6
[0036] 钟二1。、交; 0,[0,!?>-5
[0037] 其中,PO'是第一图像中的像素点的值,PO"是第二图像中的像素点的值,V是差 值,5是预先设置的阔值。
[003引经过二值化处理后,PO'和PO"的输出值变得比较稳定,受光照打印质量的影响很 小。5的取值,在具体实施例中可W取3*10,即默认像素间最小有10个灰度级的差别。
[0039] 上式中第一图像与第二图像中的差值V的比较方向不同,是由于图像中的字,局 部存在从黑到白、从白到黑的跳变,通过送两种不同的比较可W判断跳变的方式,或者是平 坦的区域,从而达到对局部像素纹理较准确的表示。
[0040] S302;根据所述第一图像得到第一组一维向量,根据所述第二图像得到第二组一 维向量。
[0041] 通常在文字识别中,图像大小为64*64或40*40,如果利用算子a计算后直接将 图像ImgO、Imgl中的像素点的值排成一维向量,则特征向量的维数将很大(2*64*64
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1