一种文字识别方法及装置的制造方法_4

文档序号:9376207阅读:来源:国知局
U)、输入/输出接口、 网络接口和内存。
[0090] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/ 或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质 的示例。
[0091] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法 或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。 计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、 动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电 可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁 性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中 的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信 号和载波。
[0092] 还需要说明的是,术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的 包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包 括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要 素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除在包括所述 要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0093] 本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。 因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的 形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存 储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形 式。
[0094] 以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员 来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同 替换、改进等,均应包含在本申请的权利要求范围之内。
【主权项】
1. 一种文字识别方法,其特征在于,包括: 根据待识别文字的特征,确定所述待识别文字的备选文字; 针对每个备选文字,根据已识别的所述待识别文字的前一个文字,采用特殊校正模型 确定所述待识别文字是该备选文字的特殊后验概率;其中,所述特殊校正模型是预先根据 统计的出现在特殊应用场景中的词汇的词频得到的; 根据每个备选文字的特殊后验概率,对所述待识别文字进行识别。2. 如权利要求1所述的方法,其特征在于,根据每个备选文字的特殊后验概率,对所述 待识别文字进行识别之前,所述方法还包括: 针对每个备选文字,根据已识别的所述待识别文字的前一个文字,采用通用校正模型 确定所述待识别文字是该备选文字的通用后验概率; 根据每个备选文字的特殊后验概率,对所述待识别文字进行识别,具体包括: 根据每个备选文字的通用后验概率和特殊后验概率,对所述待识别文字进行识别。3. 如权利要求2所述的方法,其特征在于,根据每个备选文字的通用后验概率和特殊 后验概率,对所述待识别文字进行识别,具体包括: 针对每个备选文字,根据位于所述待识别文字之前的所有已识别文字所构成的子句的 可信度权值、将所述待识别文字识别为该备选文字的置信度、该备选文字的通用后验概率 和特殊后验概率,确定在所述待识别文字是该备选文字的条件下,位于所述待识别文字之 前的所有已识别文字与该备选文字所构成的子句的可信度权值; 将确定的可信度权值最大的备选文字确定为识别出的所述待识别文字。4. 如权利要求3所述的方法,其特征在于,采用公式商定在所述待识 别文字是该备选文字的条件下,位于所述待识别文字之前的所有已识别文字与该备选文字 所构成的子句的可信度权值Q(t,k); 其中,t表示所述待识别文字是第t个文字; t_l表示所述待识别文字的前一个文字是第t-1个文字; k表示确定的所述待识别文字的第k个备选文字; j表示已识别出的所述待识别文字的前一个文字为:在识别所述前一个文字时,针对 所述前一个文字确定出的第j个备选文字; Pi(ctik)表示当所述待识别文字是第一个文字时,所述待识别文字是第k个备选文字的 通用后验概率; P2 (ctik)表示当所述待识别文字是第一个文字时,所述待识别文字是第k个备选文字的 特殊后验概率; CF(ctik)表示将所述待识别文字识别为第k个备选文字的置信度; Q(t-1,j)表示位于所述待识别文字之前的所有已识别文字所构成的子句的可信度权 值; Pi(c\kIctu)表示当所述待识别文字不是第一个文字时,所述待识别文字是第k个备 选文字的通用后验概率; P2(C\kICtI,)表示当所述待识别文字不是第一个文字时,所述待识别文字是第k个备 选文字的特殊后验概率。5. 如权利要求1所述的方法,其特征在于,所述方法还包括: 当已识别出的文字中存在预设的易混字时,确定所述易混字所在的易混字集合,其中, 所述易混字集合中每个易混字的文字类型各不相同; 在各文字类型中,选择满足指定条件的文字类型,其中,针对待定文字类型,如果已识 别出的各文字中属于该待定文字类型的文字的数量最多,则该待定文字类型为满足指定条 件的文字类型; 将所述易混字调整为所述易混字集合中属于所述满足指定条件的文字类型的文字。6. -种文字识别装置,其特征在于,包括: 备选文字确定模块,根据待识别文字的特征,确定所述待识别文字的备选文字; 概率确定模块,针对每个备选文字,根据已识别的所述待识别文字的前一个文字,采用 特殊校正模型确定所述待识别文字是该备选文字的特殊后验概率;其中,所述特殊校正模 型是预先根据统计的出现在特殊应用场景中的词汇的词频得到的; 识别模块,根据每个备选文字的特殊后验概率,对所述待识别文字进行识别。7. 如权利要求6所述的装置,其特征在于,所述概率确定模块还用于,在所述识别模块 根据每个备选文字的特殊后验概率,对所述待识别文字进行识别之前,针对每个备选文字, 根据已识别的所述待识别文字的前一个文字,采用通用校正模型确定所述待识别文字是该 备选文字的通用后验概率; 所述识别模块具体用于,根据每个备选文字的通用后验概率和特殊后验概率,对所述 待识别文字进行识别。8. 如权利要求7所述的装置,其特征在于,所述识别模块具体用于,针对每个备选文 字,根据位于所述待识别文字之前的所有已识别文字所构成的子句的可信度权值、将所述 待识别文字识别为该备选文字的置信度、该备选文字的通用后验概率和特殊后验概率,确 定在所述待识别文字是该备选文字的条件下,位于所述待识别文字之前的所有已识别文字 与该备选文字所构成的子句的可信度权值,将确定的可信度权值最大的备选文字确定为识 别出的所述待识别文字。9. 如权利要求8所述的装置,其特征在于,所述识别模块具体用于,采用公式角定在所述待识 别文字是该备选文字的条件下,位于所述待识别文字之前的所有已识别文字与该备选文字 所构成的子句的可信度权值Q(t,k); 其中,t表示所述待识别文字是第t个文字; t_l表示所述待识别文字的前一个文字是第t-1个文字; k表示确定的所述待识别文字的第k个备选文字; j表示已识别出的所述待识别文字的前一个文字为:在识别所述前一个文字时,针对 所述前一个文字确定出的第j个备选文字; Pi(ctik)表示当所述待识别文字是第一个文字时,所述待识别文字是第k个备选文字的 通用后验概率; p2 (Ctik)表示当所述待识别文字是第一个文字时,所述待识别文字是第k个备选文字的 特殊后验概率; CF(ctik)表示将所述待识别文字识别为第k个备选文字的置信度; Q(t_l,j)表示位于所述待识别文字之前的所有已识别文字所构成的子句的可信度权 值; Pi(c\kIctu)表示当所述待识别文字不是第一个文字时,所述待识别文字是第k个备 选文字的通用后验概率; P2 (c\kIcti,)表示当所述待识别文字不是第一个文字时,所述待识别文字是第k个备 选文字的特殊后验概率。10.如权利要求6所述的装置,其特征在于,所述装置还包括: 校正模块,用于当已识别出的文字中存在预设的易混字时,确定所述易混字所在的易 混字集合,其中,所述易混字集合中每个易混字的文字类型各不相同;在各文字类型中,选 择满足指定条件的文字类型,其中,针对待定文字类型,如果已识别出的各文字中属于该待 定文字类型的文字的数量最多,则该待定文字类型为满足指定条件的文字类型;将所述易 混字调整为所述易混字集合中属于所述满足指定条件的文字类型的文字。
【专利摘要】本申请公开了一种文字识别方法及装置,用以解决现有技术在特殊应用场景中识别文字的精度较低的问题。该方法确定待识别文字的备选文字,并针对每个备选文字,采用特殊校正模型确定该待识别文字是该备选文字的特殊后验概率,再根据每个备选文字的特殊后验概率识别该待识别文字。由于上述特殊校正模型是预先根据统计的出现在特殊应用场景中的词汇的词频得到的,因此采用特殊校正模型可以准确的识别出符合特殊应用场景的文字,从而可以提高在特殊应用场景中识别文字的精度。
【IPC分类】G06K9/00, G06K9/20
【公开号】CN105095826
【申请号】CN201410156083
【发明人】张宇, 杜志军
【申请人】阿里巴巴集团控股有限公司
【公开日】2015年11月25日
【申请日】2014年4月17日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1