字符串识别方法和装置的制造方法_4

文档序号:8259550阅读:来源:国知局
述字符串为中 文字符串。
[0112] 附记13. -种字符串识别装置,包括:
[0113] 图像切分单元,用于将包含字符串的图像切分为多个基本单元,每个基本单元包 含一个字符或者一个字符的部件;
[0114] 候选字符模式构成单元,用于将一个基本单元或多个相邻基本单元的组合构成候 选字符模式,以形成切分候选网格;
[0115] 切分识别候选网格形成单元,用于通过多个识别器分别对所述切分候选网格中的 每个所述候选字符模式进行识别,以得到切分识别候选网格;
[0116] 候选路径过滤单元,用于根据所述多个识别器对每个所述候选字符模式的识别结 果,对所述切分识别候选网格中的候选路径进行过滤;以及
[0117] 字符串识别单元,用于在经过过滤的候选路径中搜索最优路径,以得到字符串识 别结果。
[0118] 附记14.根据附记13所述的字符串识别装置,其中,所述候选路径过滤单元包 括:
[0119] 分类单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果对每个 所述候选字符模式进行分类;以及
[0120] 第一候选路径过滤单元,如果所述候选字符模式被分类为可靠的,则所述第一候 选路径过滤单元用于在所述候选路径中仅保留将所述候选字符模式的识别结果中排在第 一位的识别结果作为节点的候选路径。
[0121] 附记15.根据附记14所述的字符串识别装置,其中,所述候选路径过滤单元还包 括第二候选路径过滤单元,如果所述候选字符模式被分类为可靠的,且所述候选字符模式 由多个基本单元构成,则所述第二候选路径过滤单元用于从所述候选路径中去除包括如下 节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元 构成。
[0122] 附记16.根据附记13所述的字符串识别装置,其中,所述候选路径过滤单元包 括:
[0123] 分类单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果对每个 所述候选字符模式进行分类;以及
[0124] 第二候选路径过滤单元,如果所述候选字符模式被分类为可靠的,且所述候选字 符模式由多个基本单元构成,则所述第二候选路径过滤单元用于从所述候选路径中去除包 括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基 本单元构成。
[0125] 附记17.根据附记14-16中任意一项所述的字符串识别装置,其中,所述分类单元 被配置为:如果所述多个识别器中一半以上的识别器对所述候选字符模式的识别结果是相 同的,则将所述候选字符模式分类为可靠的。
[0126] 附记18.根据附记14-16中任意一项所述的字符串识别装置,其中,所述分类单元 被配置为:为M个识别器中的每一个保留对所述候选字符模式的前N个候选识别结果,以识 别置信度为权值对K (K〈=M*N)个候选识别结果进行加权投票得到各自的投票分值,对所述 投票分值从大到小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大 预定阈值,则将所述候选字符模式分类为可靠的。
[0127] 附记19.根据附记14-16中任意一项所述的字符串识别装置,其中,所述切分识别 候选网格形成单元被配置为:所述多个识别器利用文字的互补特征对每个所述候选字符模 式进行识别。
[0128] 附记20.根据附记19所述的字符串识别装置,其中,所述互补特征包括灰度特征 和二值特征。
[0129] 附记21.根据附记14-16中任意一项所述的字符串识别装置,其中,所述多个识别 器采用各自独立的分类算法对每个所述候选字符模式进行识别。
[0130] 附记22.根据附记21所述的字符串识别装置,其中,所述分类算法包括高斯模型 和支持向量机。
[0131] 附记23.根据附记14-16中任意一项所述的字符串识别装置,其中,所述字符串识 别单元被配置为:利用语言模型来搜索最优路径,以得到字符串识别结果。
[0132] 附记24.根据附记14-16中任意一项所述的字符串识别装置,其中,所述字符串为 中文字符串。
【主权项】
1. 一种字符串识别方法,包括: 将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符 的部件; W-个基本单元或多个相邻基本单元的组合构成候选字符模式,W形成切分候选网 格; 由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,W得到 切分识别候选网格; 根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格 中的候选路径进行过滤;W及 在经过过滤的候选路径中搜索最优路径,W得到字符串识别结果。
2. 根据权利要求1所述的字符串识别方法,其中,对所述切分识别候选网格中的候选 路径进行过滤包括: 根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式 进行分类;W及 如果所述候选字符模式被分类为可靠的,则在所述候选路径中仅保留将所述候选字符 模式的识别结果中排在第一位的识别结果作为节点的候选路径。
3. 根据权利要求2所述的字符串识别方法,其中,如果所述候选字符模式被分类为可 靠的,且所述候选字符模式由多个基本单元构成,则从所述候选路径中去除包括如下节点 的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构 成。
4. 根据权利要求1所述的字符串识别方法,其中,对所述切分识别候选网格中的候选 路径进行过滤包括: 根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式 进行分类;W及 如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成, 则从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所 述多个基本单元中的部分基本单元构成。
5. 根据权利要求2-4中任意一项所述的字符串识别方法,其中,根据所述多个识别器 对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:如果所述多 个识别器中一半W上的识别器对所述候选字符模式的识别结果是相同的,则将所述候选字 符模式分类为可靠的。
6. 根据权利要求2-4中任意一项所述的字符串识别方法,其中,根据所述多个识别器 对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:为所述多个 识别器中的每一个保留对所述候选字符模式的前N个候选识别结果,W识别置信度为权值 为所述N个候选识别结果进行加权投票得到各自的投票分值,对所述投票分值从大到小进 行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阔值,则将所述 候选字符模式分类为可靠的。
7. 根据权利要求2-4中任意一项所述的字符串识别方法,其中,所述多个识别器利用 文字的互补特征对每个所述候选字符模式进行识别。
8. 根据权利要求7所述的字符串识别方法,其中,所述互补特征包括灰度特征和二值 特征。
9. 根据权利要求2-4中任意一项所述的字符串识别方法,其中,所述多个识别器采用 各自独立的分类算法对每个所述候选字符模式进行识别。
10. -种字符串识别装置,包括: 图像切分单元,用于将包含字符串的图像切分为多个基本单元,每个基本单元包含一 个字符或者一个字符的部件; 候选字符模式构成单元,用于将一个基本单元或多个相邻基本单元的组合构成候选字 符模式,W形成切分候选网格; 切分识别候选网格形成单元,用于通过多个识别器分别对所述切分候选网格中的每个 所述候选字符模式进行识别,W得到切分识别候选网格; 候选路径过滤单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果, 对所述切分识别候选网格中的候选路径进行过滤;W及 字符串识别单元,用于在经过过滤的候选路径中搜索最优路径,W得到字符串识别结 果。
【专利摘要】本发明涉及一种字符串识别方法和装置。一种字符串识别方法,包括:将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。通过本发明,可以简化切分识别候选网格,加速路径搜索过程。
【IPC分类】G06K9-20, G06K9-46
【公开号】CN104573683
【申请号】CN201310495142
【发明人】范伟, 何源, 孙俊
【申请人】富士通株式会社
【公开日】2015年4月29日
【申请日】2013年10月21日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1