拒识方法和拒识装置的制作方法

文档序号:6441710阅读:479来源:国知局
专利名称:拒识方法和拒识装置的制作方法
技术领域
本发明一般地涉及字符识别。具体而言,本发明涉及一种基于拒识阈值映射对拒识判决进行优化的拒识方法和拒识装置。
背景技术
在0CR(optical character recognition,光学字符识别)研究中,离线手写字符识别由于其大的类别数目和大量书写风格的变化或者变形而仍然是一个挑战。例如,对于汉字字符识别来说,最常用的字符包括在具有3755个字符的一级国标字符集中。而剩下还有超过几千个汉字不常使用。手写汉字识别的较高准确度,比如接近99%等在实际应用中难以获得。因此,在很多实际应用中,如果可以拒识字符识别装置的不可靠的识别结果而通过人工或者其他方式处理那些识别结果,则剩余部分将具有较高的准确度。总的来说这是一个拒识问题,由此如何作出好的拒识判断是至关重要的。对于拒识,其目的是获得最低的错误比率同时拒识最少的识别结果。改善字符识别装置的识别能力可以获得更好的拒识,但是这不是这里要讨论的问题。在此,关注于拒识参数的优化,从而能够在不改变当前的识别技术和结果的同时而改善拒识性能。在过去几年中已经提出了许多拒识策略。例如,J. Pitrelli和M. P. Perrone 在"Confidence modeling for verification post-processing forhandwriting recognition, Proceedings of the 8th International Workshopon Frontiers in Handwriting Recognition(IWFHR2002),pp. 30-35,2002” 中以及 R. Bertolami、 Μ· Zimmermann禾口H. Bunke在"Rejectionstrategies for offline handwritten text line recognition, PatternRecognition Letters, 27 (16) :pp. 2005-2012,2006” 中提出了几种有效的置信量度方法,从而可以通过置信变换来改善拒识性能。另外,在Xu-ChengYiru Hong-Wei HaoΛYun-Feng Tang、Jun Sun 禾口 Satoshi Naoi 的"Rejection Strategies with Multiple Classifiers for HandwrittenCharacter Recognition, Proceedings of the 10th International Conferenceon Document Analysis and Recognition(ICDAR2009), pp. 1126-1130,2009” 中以及在 L. P. Cordelia、P. Foggia、C. Sansone、F. Tortorella 禾口 Μ· Vento 的“Optimizing the Error/Reject Trade-Off for a Multi-ExpertSystem Using the Bayesian Combining Rule, Proceedings of the JointIAPR International Workshops on Advances in Pattern Recognition,LNCS Vol. 1451,pp. 716—725,1998,,中, 还将来自多个分类器系统的交叉验证能力用于对拒识性能进行改善。此外,N. Gorski 在"Optimizing error-reject trade off in recognit ionsystems, Proceedings of the 4th International Conference on DocumentAnalysis and Recognition (ICDAR1997),pp. 1092-1096,1997” 中通过训练神经网络分类器来作出拒识判决。除了上述N. Gorski的方法是基于分类的系统之外,大多数方法使用阈值来判决是否拒识识别结果。这些方法均使用阈值作为通用方式,并且针对所有的样本应用相同的拒识阈值。但是,对于具体样本来说这并不是最优的方式。实际上,单个样本的局部信息可能会对拒识参数的选择产生相当大的影响。

发明内容
有鉴于此,本发明提出了一种新的拒识方法和拒识装置用于光学字符识别,能够基于拒识阈值映射对拒识判决进行优化,从而能够在不改变当前的识别技术和结果的同时达到改善拒识性能的目的。为了实现上述目的,根据本发明的一个方面,提供了一种拒识方法,包括从样本集合中搜索与中间识别结果相匹配的样本组;使用与匹配的样本组相对应的拒识阈值映射函数计算拒识阈值;以及根据计算的拒识阈值对识别结果进行拒识处理。根据本发明的另一个方面,提供了一种拒识装置,包括搜索单元,配置为从样本集合中搜索与中间识别结果相匹配的样本组;拒识阈值计算单元,配置为使用与搜索单元搜索的匹配的样本组相对应的拒识阈值映射函数计算拒识阈值;拒识处理单元,配置为根据拒识阈值计算单元计算的拒识阈值对识别结果进行拒识处理;以及存储单元,配置为存储所述样本集合和所述拒识阈值映射函数。优选地,如果没有搜索到与中间识别结果相匹配的样本组,则使用原始拒识阈值对识别结果进行拒识处理。根据本发明的一个具体实施例,拒识阈值映射函数为满足下述条件的函数
权利要求
1.一种拒识方法,包括从样本集合中搜索与中间识别结果相匹配的样本组;使用与匹配的样本组相对应的拒识阈值映射函数计算拒识阈值;以及根据计算的拒识阈值对识别结果进行拒识处理。
2.根据权利要求1所述的拒识方法,其中拒识阈值映射函数为满足下述条件的函数
3.根据权利要求2所述的拒识方法,其中拒识阈值映射函数为幂函数或分段线性函数。
4.根据权利要求3所述的拒识方法,其中
5.根据权利要求1所述的拒识方法,其中拒识阈值映射函数为满足下述条件的函数
6.根据权利要求5所述的拒识方法,其中拒识阈值映射函数为幂函数或分段线性函数。
7.根据权利要求6所述的拒识方法,其中
8.根据权利要求1至7任一所述的拒识方法,其中样本集合中的一个样本组包括两类样本;在从样本集合中搜索与中间识别结果相匹配的样本组时,从样本集合中搜索与中间识别结果的前两个候选类相匹配的样本组;以及在进行拒识处理时按照> Τ’的规则来进行拒识处理,其中&和&分别为中间识别结果的前两个候选的置信度,Τ’为计算的拒识阈值或原始拒识阈值。
9.根据权利要求1至7任一所述的拒识方法,其中样本集合中的一个样本组包括一类样本;在从样本集合中搜索与中间识别结果相匹配的样本组时,从样本集合中搜索与中间识别结果的第一个候选类相匹配的样本组;以及在进行拒识处理时按照& < T’的规则来进行拒识处理,其中&为中间识别结果的第一个候选的置信度,T’为计算的拒识阈值或原始拒识阈值。
10.一种拒识装置,包括搜索单元,配置为从样本集合中搜索与中间识别结果相匹配的样本组; 拒识阈值计算单元,配置为使用与搜索单元搜索的匹配的样本组相对应的拒识阈值映射函数计算拒识阈值;拒识处理单元,配置为根据拒识阈值计算单元计算的拒识阈值对识别结果进行拒识处理;以及存储单元,配置为存储所述样本集合和所述拒识阈值映射函数。
全文摘要
本发明公开了一种基于拒识阈值映射对拒识判决进行优化的拒识方法和拒识装置。根据本发明一个实施例的拒识方法包括从样本集合中搜索与中间识别结果相匹配的样本组;使用与匹配的样本组相对应的拒识阈值映射函数计算拒识阈值;以及根据计算的拒识阈值对识别结果进行拒识处理。
文档编号G06K9/62GK102279927SQ201010195920
公开日2011年12月14日 申请日期2010年6月8日 优先权日2010年6月8日
发明者于浩, 堀田悦伸, 孙俊, 朱远平, 直井聪 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1