字符串识别方法和装置的制造方法_3

文档序号:8259550阅读:来源:国知局
可以通过在任何计算装置上运行一个程序或者一组程序来 实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包 含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构 成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以 是任何公知的存储介质或者将来所开发出来的任何存储介质。
[0075] 在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具有 专用硬件结构的计算机,例如图9所示的通用计算机900安装构成该软件的程序,该计算机 在安装有各种程序时,能够执行各种功能等等。
[0076] 在图9中,中央处理单元(CPU)901根据只读存储器(ROM)902中存储的程序或从 存储部分908加载到随机存取存储器(RAM)903的程序执行各种处理。在RAM903中,也根 据需要存储当CPU901执行各种处理等等时所需的数据。CPU90UR0M902和RAM903经由总 线904彼此链路。输入/输出接口 905也链路到总线904。
[0077] 下述部件链路到输入/输出接口 905:输入部分906 (包括键盘、鼠标等等)、输出 部分907 (包括显示器,比如阴极射线管(CRT)、液晶显示器(IXD)等,和扬声器等)、存储部 分908 (包括硬盘等)、通信部分909 (包括网络接口卡比如LAN卡、调制解调器等)。通信部 分909经由网络比如因特网执行通信处理。根据需要,驱动器910也可链路到输入/输出 接口 905。可拆卸介质911比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱 动器910上,使得从中读出的计算机程序根据需要被安装到存储部分908中。
[0078] 在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆 卸介质911安装构成软件的程序。
[0079] 本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程 序、与设备相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子 包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(⑶-ROM)和数字通用盘 OVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是 R0M902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分 发给用户。
[0080] 本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读 取并执行时,可执行上述根据本发明实施例的方法。
[0081] 相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包 括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。
[0082] 本领域的普通技术人员应理解,在此所例举的是示例性的,本发明并不局限于此。
[0083] 在本说明书中,"第一"、"第二"以及"第N个"等表述是为了将所描述的特征在文 字上区分开,以清楚地描述本发明。因此,不应将其视为具有任何限定性的含义。
[0084] 作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/或单元可 以实施为软件、固件、硬件或其组合,并作为相应设备中的一部分。上述装置中各个组成模 块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领 域技术人员所熟知,在此不再赘述。
[0085] 作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网络向具有 专用硬件结构的计算机(例如图9所示的通用计算机900)安装构成该软件的程序,该计算 机在安装有各种程序时,能够执行各种功能等。
[0086] 在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征 可以以相同或类似的方式在一个或更多个其他实施方式中使用,与其他实施方式中的特征 相组合,或替代其他实施方式中的特征。
[0087] 应该强调,术语"包括/包含"在本文使用时指特征、要素、步骤或组件的存在,但 并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。
[0088] 此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其 他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发 明的技术范围构成限制。
[0089] 本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精 神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书 所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明 的公开内容将容易理解,根据本发明可以使用执行与在此的相应实施例基本相同的功能或 者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因 此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。
[0090] 基于以上的说明,可知公开至少公开了以下技术方案:
[0091]附记1.一种字符串识别方法,包括:
[0092] 将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个 字符的部件;
[0093] 以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选 网格;
[0094] 由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以 得到切分识别候选网格;
[0095] 根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选 网格中的候选路径进行过滤;以及
[0096] 在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
[0097] 附记2.根据附记1所述的字符串识别方法,其中,对所述切分识别候选网格中的 候选路径进行过滤包括:
[0098] 根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符 模式进行分类;以及
[0099] 如果所述候选字符模式被分类为可靠的,则在所述候选路径中仅保留将所述候选 字符模式的识别结果中排在第一位的识别结果作为节点的候选路径。
[0100] 附记3.根据附记2所述的字符串识别方法,其中,如果所述候选字符模式被分类 为可靠的,且所述候选字符模式由多个基本单元构成,则从所述候选路径中去除包括如下 节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元 构成。
[0101] 附记4.根据附记1所述的字符串识别方法,其中,对所述切分识别候选网格中的 候选路径进行过滤包括:
[0102] 根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符 模式进行分类;以及
[0103] 如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构 成,则从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式 的所述多个基本单元中的部分基本单元构成。
[0104] 附记5.根据附记2-4中任意一项所述的字符串识别方法,其中,根据所述多个识 别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:如果所 述多个识别器中一半以上的识别器对所述候选字符模式的识别结果是相同的,则将所述候 选字符模式分类为可靠的。
[0105] 附记6.根据附记2-4中任意一项所述的字符串识别方法,其中,根据所述多个识 别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:为M个 识别器中的每一个保留对所述候选字符模式的前N个候选识别结果,以识别置信度为权值 对K (K〈=M*N)个候选识别结果进行加权投票得到各自的投票分值,对所述投票分值从大到 小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阈值,则将 所述候选字符模式分类为可靠的。
[0106] 附记7.根据附记2-4中任意一项所述的字符串识别方法,其中,所述多个识别器 利用文字的互补特征对每个所述候选字符模式进行识别。
[0107] 附记8.根据附记7所述的字符串识别方法,其中,所述互补特征包括灰度特征和 二值特征。
[0108] 附记9.根据附记2-4中任意一项所述的字符串识别方法,其中,所述多个识别器 采用各自独立的分类算法对每个所述候选字符模式进行识别。
[0109] 附记10.根据附记9所述的字符串识别方法,其中,所述分类算法包括高斯模型和 支持向量机。
[0110] 附记11.根据附记2-4中任意一项所述的字符串识别方法,其中,在经过过滤的候 选路径中搜索最优路径,以得到字符串识别结果包括:利用语言模型来搜索最优路径,以得 到字符串识别结果。
[0111] 附记12.根据附记2-4中任意一项所述的字符串识别方法,其中,所
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1