字符串识别方法和装置的制造方法

文档序号:8259550阅读:198来源:国知局
字符串识别方法和装置的制造方法
【技术领域】
[0001] 本发明涉及字符识别领域,更具体地涉及一种用于识别图像中的字符串的方法和 装直。
【背景技术】
[0002] 近几十年来,手写体或印刷体的中文字符识别技术在工业界和研究领域得到了广 泛的关注并取得了很多进展。然而,目前基于单字的识别技术研究得比较多,而基于整串 的汉字识别仅在某些受限的领域有应用。这是因为通用性汉字识别是一项复杂的任务,书 写风格,语言字符集,字符内部组件间距与字符间距的混淆,相邻字符粘连等因素直接影响 汉字识别精度。
[0003] 为解决以上问题,本领域的传统方法是将字符切分与识别纳入一个统一的优化框 架,首先,生成大量字符切分的候选,然后结合识别置信度与语言模型来评价所有可能的候 选,最终得到识别结果。文献【1】将基于字符的N阶语言模型与字符切分结合。文献【2】 提出一种融合单字和词级别语言模型的手写汉字识别方法。
[0004] 从大量字符切分的候选得到最终的识别结果是一个耗时的过程,因此需要一种能 够快速对字符串进行识别的方法。
[0005] [非专利文献1] Q.-F Wang, F. Yin, C.-L. Liu. Handwritten Chinese Text Recognition by Integrating Multiple Contexts. IEEE Trans. Pattern Anal. Mach. Intell.,2011。
[0006] [非专利文献 2] Y. Jiang, X. Q. Ding, Q. Fu,Z. Ren, Context driven Chinese string segmentation and recognition.Structural,Syntactic, and Statistical Pattern Recognition:Joint IAPR Int. Workshops, LNCS Vol. 4109,ppl27_135。

【发明内容】

[0007] 在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理 解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关 键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念, 以此作为稍后论述的更详细描述的前序。
[0008] 本发明的一个主要目的在于,提供一种字符串识别方法,包括:将包含字符串的图 像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;以一个基本单 元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;由多个识别器分 别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格; 根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的 候选路径进行过滤;以及在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
[0009] 根据本发明的一个方面,提供了一种字符串识别装置,包括:图像切分单元,用于 将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部 件;候选字符模式构成单元,用于将一个基本单元或多个相邻基本单元的组合构成候选字 符模式,以形成切分候选网格;切分识别候选网格形成单元,用于通过多个识别器分别对所 述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;候选路 径过滤单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分 识别候选网格中的候选路径进行过滤;以及字符串识别单元,用于在经过过滤的候选路径 中搜索最优路径,以得到字符串识别结果。
[0010] 另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
[0011] 此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其 上记录有用于实现上述方法的计算机程序代码。
[0012] 通过本发明,可以简化候选网格,加速路径搜索过程。
[0013] 通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优 点将更加明显。
【附图说明】
[0014] 参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其 它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似 的技术特征或部件将采用相同或类似的附图标记来表示。
[0015] 图1是示出根据本发明的一个实施例的字符串识别方法100的示例性流程图;
[0016] 图2A以字符串"铝镁合金外壳"为例,示出了将图像切分为基本单元的图;
[0017] 图2B示出了切分候选网格的示例图;
[0018] 图2C示出了切分识别候选网格的示例图;
[0019] 图3是约简后的切分识别候选网格的示例图;
[0020] 图4是可靠的切分候选模式和不可靠的切分候选模式的示例图;
[0021] 图5是示出根据本发明的一个实施例的字符串识别装置500的示例性配置的框 图;
[0022] 图6是示出候选路径过滤单元540的示例性配置的框图;
[0023] 图7是示出候选路径过滤单元540的又一示例性配置的框图;
[0024] 图8是示出候选路径过滤单元540的再一示例性配置的框图;
[0025] 图9是示出可以用于实施本发明的字符串识别方法和装置的计算设备的举例的 结构图。
【具体实施方式】
[0026] 下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描 述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应 当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知 的部件和处理的表示和描述。
[0027] 图1是示出根据本发明的一个实施例的字符串识别方法100的示例性流程图。
[0028] 如图1所示,在步骤S110中,将包含字符串的图像切分为多个基本单元,其中每个 基本单元包含一个字符或者一个字符的部件。图2A示出了包含字符串"铝镁合金外壳"的 图像被过切分为"韦","吕","韦","美","合","金","夕","卜","壳"多个基本单元。每个 基本单元对应一个字符(如"合")或字符部件(如"韦")。
[0029] 在步骤S120中,以一个基本单元或多个相邻基本单元的组合构成候选字符模式, 以形成切分候选网格。例如,可以得到如图2B所示的切分候选网格。
[0030] 在现有技术中,在得到切分候选网格之后,可以利用一个识别器对候选字符模式 进行识别得到切分识别候选网格。网格中的每一条路径(字符类别路径)通过融合了识别 置信度和语言模型的评判准则来打分。分值最高的最优路径即为最终的字符切分和识别结 果。
[0031] 基于切分候选网格和切分识别候选网格进行字符串识别就是在切分识别候选网 格中找到最优的一条路径(组合方式)。一条路径对应于一个候选字符模式序列X = Xf-Xn 和与之对应的字符类别序列C = cvcn。这条路径的评分可以通过如下公式(1)获得
[0032] f{ X, C)= a, logP(C) + Az ^log P(.v, | ) ( 1 )
[0033] 公式(1)中的函数包含两部分:
[0034] logP(C)是语言模型匹配分数。即一串字符序列与语言模型的匹配程度。以二元 n 模型为例,p(r)=外)r]/小v I)其中,p(Cl)是第一个字符为Cl的先验概率,p(Ci I h) /:29 是在语言模型中Ch和Ci两个字连续出现的概率。
[0035] P (Xi | Ci)是将Xi识别为Ci的置信度,识别器输出的识别分数与识别置信度的log 值成正比。
[0036] ^和入2是预设的权重。
[0037] 在遍历所有(X,C)组合之后,获得最高分数的路径就是最优切分识别路径。
[0038] 切分识别候选网格中的路径优化是一个非常耗时的过程,因为从大量候选字符模 式中确定字符类别,需要评估每条可能的路径。现有的方法通常采用动态规划(DP)或集束 搜索来加速路径评估的过程。
[0039] 为加快候选路径的评分过程,本发明提出一种对候选路径进行过滤的方法。
[0040] 在本发明的实施例中,一项字符识别任务可以交由多个不同的分类器处理。
[0041] 在根据本发明的实施例的字符串识别方法100的步骤S130中,由多个识别器分 别对切分候选网格中的每个候选字符模式进行识别,以得到切分识别候选网格。每个候选 字符模式在被识别器识别时,可以得到多个候选字符类别。例如,"铝"可能被识别为"铝"、 "侣"、"侶"、
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1