手写字符识别方法以及设备与流程

文档序号:12200741阅读:313来源:国知局
手写字符识别方法以及设备与流程
本发明总体涉及用于手写字符识别的方法和设备。特别地,本发明涉及用于手写字符的离线识别的方法和设备,以及用于手写字符的在线识别和离线识别的组合(integration)的方法和设备。

背景技术:
近年来,具有通过手写来输入指令、信息等的功能的设备或系统已得到广泛应用,并且这样的设备或系统通常可包括用于接收来自用户的手写输入的接口。这样的设备可表现为多种形式,例如手机、控制台、打印机、复印机、扫描仪等。对于这样的设备或系统,手写输入(例如字符)的识别是关键。人们已经开发出了多种手写字符识别技术,其中两类主要的技术是在线识别和离线识别。在线识别通常是基于手写字符的在线信息(还可被称为在线特征),诸如字符的手写轨迹(handwrittentrace)中的笔划的数量/顺序以及轨迹点(trajectorypoint)等。基于在线信息,可获得一组候选字符作为在线识别结果,用户将从该在线识别结果中选择可能适当的一个字符。在线识别通常较快。但是,当手写字符轨迹模糊、不流畅时,笔划顺序以及笔划数量不能被精确地确定,并且在这样的情况下,在线识别的识别结果通常不精确,甚至是错误的。离线识别方法通常基于从手写字符的图像获得的离线信息(还可被称为离线特征),诸如字符形状(笔划区段的空间分布以及方向)等,并且从离线候选字符源中选择预定数量的候选字符作为识别结果,该离线候选字符源通常根据要被识别的字符的语言被设定,并且通常包含非常大量的字符。更具体而言,离线识别类似于手写字符与非常大的识别候选字符源中的每个字符的图像匹配,这意味着离线识别将对该源中的每个字符进行选择和处理。离线识别的精度通常受模糊的手写轨迹影响较小。但是,离线识别通常由于对于非常大量的候选字符中的每一个进行选择和处理而慢得多,并且具有大的计算成本。人们已经提出了一些用于改进手写字符的离线识别的技术。一种技术通过多层分类来加速手写字符的离线识别,如图1A所示。一般来说,离线识别的过程被分成多个层,并且通过利用先前层中的粗略分类,用于末级的离线识别的候选的数量将被减小,以便加速识别速度。首先,在用于获得离线识别结果的末级之前的每一层中,从手写字符轨迹的图像中提取粗略特征,并且然后将该粗略特征用于粗略分类以便减少用于进一步处理的候选字符的数量。最后,从手写字符轨迹的图像提取详细特征,并且然后将该详细特征用于详细分类以获得最终识别结果。在此上下文中,分类也等同于过滤。但是,在这样的技术中,粗略特征提取和分类仍是针对手写字符轨迹的图像进行的,而这样的图像处理仍需要高计算成本。由于在详细分类之前必须对于每一层执行粗略特征提取和分类,因此处理速度和计算成本仍不能显著改进。作为另一种技术,在线识别和离线识别可相组合以形成手写字符的混合识别,使得在线识别和离线识别的识别结果可互补地相互影响以便提高手写字符、尤其是其中笔划顺序或笔划数量难以确定的模糊字符的识别精度。离线识别和在线识别的组合通常以串行方式实施(下文将被称为级联式混合识别)或者以并行方式实施(下文将被称为并联式混合识别)。级联式混合识别意味着离线识别和在线识别被依次执行,并且离线识别和在线识别中的一个的识别结果将作为离线识别和在线识别中的另一个的候选,并且离线识别和在线识别的结果不组合。在一种情况下,由于在线识别相对快速,因此在线识别的识别结果通常作为离线识别的基础,并且离线识别的结果通常被从在线识别结果中选出。但是,由于在线识别为离线识别提供了较少的候选,并且对于模糊手写字符,在线识别精度受限,因此基于在线识别的结果的离线识别通常不能精确地获得最终识别结果,甚至当在线识别结果不包括正确的结果时可能不能获得正确的结果。日本专利申请特开No.H9-179938A公开了一种手写字符的级联式混合识别,其中离线识别被用作“粗略分类”以生成作为在线识别(“详细分类”)的输入的识别候选。更具体来说,离线识别仅被用作粗略分类以限制在线识别的识别候选。因此,由于离线识别仅仅被部分地且粗略地执行,因此该混合方法的识别速度提高。尽管级联式混合的计算速度可提高识别速度,但是这样的混合识别的识别精度可能不能被提高,这是因为这两种识别结果没有被组合,因此这两种识别的互补性没有被用于提高识别精度。并联式混合识别通常利用在线识别和离线识别的结果的组合,以便利用这两类识别的互补性。在一种简单的布置(现有技术1)中,在线识别和离线识别独立地操作,然后将识别结果相组合。更具体而言,在线识别和离线识别分别独立地获得N个候选字符,然后将来自在线识别和离线识别中的每一个的N个候选字符进行组合,如图1B所示。但是,由于手写字符轨迹仍通过完全离线识别被识别,该完全离线识别执行缓慢,并且这样的并联式识别依赖于该完全离线识别的精度,从而这样的并行识别的识别速度低。日本专利申请特开S55-140970A以及H9-288717A均公开了在线识别和离线识别被分别执行然后组合,只是它们的组合方式稍有不同。在JPS55-140970A中,仅得自在线识别和离线识别的字符码被获得并且用于组合,而没有获得它们的识别置信度。在JPH9-288717A中,在识别中,仅在线识别和离线识别结果的识别置信度被相加作为组合识别置信度。上述JPS55-140970A以及JPH9-288717A的计算成本高,这是因为在线识别和离线识别被独立地执行。此外,在JPS55-140970A中,由于仅得自在线识别和离线识别的字符码被获得且相加,因此组合效果并不好。在JPH9-288717A中,在线和离线识别结果的识别置信度在组合期间仅仅简单地相加,而没有进行任何其他处理。其效果在来自两种识别的识别置信度具有不同的度量时并不好。在复杂的方式(现有技术2)中,在线识别不仅提供了用于组合的识别结果,而且还提供了一些粗略识别结果作为离线识别的基础。更具体而言,如图1C所示,在线识别作为提供用于离线识别的M个候选字符的粗略分类器以及提供用于组合的N个候选字符的详细分类器两者操作,然后离线识别从该M个候选字符中识别N个候选字符以提高识别速度,并且来自离线识别的N个候选字符与来自在线识别的N个候选字符相组合以获得最终识别结果。但是,手写字符通常的在线识别仅输出若干个识别候选、例如8-10个候选作为其识别结果,这对于离线识别不足,因此离线识别结果的精度甚至最终识别结果的精度也不足。此外,当来自在线识别的M个候选中不包含正确的候选时,因为离线识别仅从M个候选生成结果,因此离线识别在其的N个候选字符中不能产生正确的候选字符。日本专利No.3595900公开了一种并联式混合识别方法,其中,首先利用离线识别来识别手写字符图像,并且输出N个候选作为在线识别的识别候选输入,然后通过在线识别从该N个候选中选择L个识别候选。此外,离线识别所得的N个候选中的前M个识别候选被选择作为离线识别结果,然后该M个候选和L个候选通过字符码和识别置信度来组合。JP3595900的方法可实现低计算成本。在JP3595900中,离线识别被用作第一级分类器,并且离线识别的识别结果被直接用作在线识别的候选。但是,一般来说,对于流畅/连笔的字符而言,在线识别比离线识别更鲁棒,并且当识别流畅/连笔字符时来自离线识别的识别结果可能不包括正确的候选,在识别结果的大小不足够大时尤其如此,在识别结果的大小不足够大的情况下离线识别不能输出许多最终识别候选,因此当离线识别被用作第一级的分类器时,组合识别对于流畅/连笔字符不能很好地工作,除非识别结果的大小增大,但是如果如此将不能实现低计算成本。人们已经提出了一些方法来改进混合式识别中在线识别结果和离线识别结果的组合。美国专利No.7953279描述了来自在线识别和离线识别的识别置信度的基于统计的组合算法,并且如图1D中所示地描述这样的算法的概略图。首先,在线和离线识别被分别执行以获得各自的识别结果,然后使用AdaBoost算法和/或基于神经网络的组合来确定组合函数,以将来自在线识别和离线识别的识别置信度组合。由于在线识别和离线是被仍将分离地执行,并且所使用的基于统计的算法通常复杂并且具有高计算开销,因此这样的混合识别的计算速度低并且计算成本高,对于大字符集识别尤其如此。美国专利No.7817857描述了根据基于神经网络的在线识别、基于神经网络的离线识别以及模板原型匹配的识别结果的基于比较器网的组合算法,并且如图1E中示出这样的算法的概略图。首先,依次或者并行地执行在线识别、离线识别和模板原型匹配,以获得在线识别结果和离线识别结果。然后,将来自不同识别的识别候选合并为组合列表,并且使用训练的比较器网来比较该组合列表中的任何候选对。在US7817857中,一方面,如果在线和离线识别被分离地执行,则计算成本高,对于大字符集识别尤其如此。另一方面,如果一种识别的识别结果被直接用作另一种识别的识别候选,则有时该另一种识别将不工作,这是因为当第一识别(在线识别或离线识别)的识别结果不包括正确的候选时,第二识别(离线识别或在线识别)不能获得更好的识别结果。因此,这种算法的精度仍需提高。此外,由于这种算法的组合利用了训练过程以执行组合,因此计算开销高。因此,仍需要提供一种改进的离线识别方法。仍需要提供一种改进的在线识别结果和离线识别结果的组合方式。仍需要提供一种改进的利用在线识别和离线识别两者的手写字符识别。

技术实现要素:
本发明旨在解决上述问题。本发明的一个目标是提供一种改进的手写字符的离线识别。本发明的另一个目标是提供一种改进的在线识别结果和离线识别结果的组合。本发明的还另一个目标是提供一种改进的利用在线识别和离线识别两者的手写字符识别。根据本发明的第一方面,提供了一种用于手写字符的离线识别的方法,该方法包括:过滤步骤,用于基于与所述手写字符有关的在线信息对识别候选字符源进行过滤;以及离线识别步骤,用于基于经过滤的识别候选字符源对所述手写字符进行离线识别,以获得所述手写字符的离线识别结果。根据本发明的第二方面,提供了一种手写字符的识别方法,包括:在线识别步骤,用于手写字符的在线识别;离线识别步骤,用于通过使用根据本发明的第一方面的方法进行手写字符的离线识别;以及组合步骤,用于组合得自所述在线识别步骤的在线识别结果与得自所述离线识别步骤的离线识别结果,以获得所述手写字符的最终识别结果。根据本发明的第三方面,提供了一种手写字符识别方法,包括:在线识别步骤,用于手写字符的在线识别;离线识别步骤,用于进行手写字符的离线识别;离线识别影响因子计算步骤,用于对于在线识别结果和离线识别结果中所包含的每一个字符,基于该字符的离线识别置信度以及在线识别结果和离线识别结果中的除该字符以外的具有最小离线识别置信度的字符的离线识别置信度,计算该字符的离线识别影响因子;组合置信度计算步骤,用于对于在线识别结果和离线识别结果中包含的每一个字符,通过将该字符的离线识别影响因子乘以该字符的在线识别置信度计算该字符的组合置信度;以及获取步骤,用于从根据各自的组合置信度按降序排序的在线识别结果和离线识别结果中所包含的所有字符中获取前预定数量的字符作为最终识别结果。根据本发明的第四方面,提供了一种用于手写字符的离线识别的设备,该设备包括:过滤单元,被配置用于基于与所述手写字符有关的在线信息对识别候选字符源进行过滤;以及离线识别单元,被配置用于基于经过滤的识别候选字符源对所述手写字符进行离线识别,以获得所述手写字符的离线识别结果。根据本发明的第五方面,提供了一种手写字符的识别设备,包括:在线识别单元,被配置用于手写字符的在线识别;离线识别单元,被配置用于通过使用根据本发明的第一方面的方法进行手写字符的离线识别;以及组合单元,被配置用于组合得自所述在线识别步骤的在线识别结果与得自所述离线识别步骤的离线识别结果,以获得所述手写字符的最终识别结果。根据本发明的第六方面,提供了一种手写字符识别设备,包括:在线识别单元,被配置用于手写字符的在线识别;离线识别单元,被配置用于进行手写字符的离线识别;离线识别影响因子计算单元,被配置用于对于在线识别结果和离线识别结果中所包含的每一个字符,基于该字符的离线识别置信度以及在线识别结果和离线识别结果中的除该字符以外的具有最小离线识别置信度的字符的离线识别置信度,计算该字符的离线识别影响因子;组合置信度计算单元,被配置用于对于在线识别结果和离线识别结果中包含的每一个字符,通过将该字符的离线识别影响因子乘以该字符的在线识别置信度计算该字符的组合置信度;以及获取单元,被配置用于从根据各自的组合置信度按降序排序的在线识别结果和离线识别结果中所包含的所有字符中获取前预定数量的字符作为最终识别结果。从参照附图的示例性实施例的以下描述,本发明的其它特征将变得清晰。附图说明并入说明书中并且构成说明书的一部分的附图示出了本发明的实施例,并且与描述一起用于解释本发明的原理。在附图中,相似的附图标记指示相似的项目。图1A至1E示出现有技术中的一些技术。图2是示出用于实现用于手写字符识别的设备的计算设备的布置的框图。图3是示出现有技术中的常用手写字符离线识别的概述的流程图。图4是示出根据本发明的第一实施例的离线识别方法的流程图。图5是示出根据本发明的第一实施例的设备的框图。图6是示出示例性的手写字符。图7是示出根据本发明的第二实施例的方法的流程图。图8是示出根据本发明的第二实施例的设备的框图。图9是示出根据本发明的第三实施例的方法的流程图。图10是示出根据本发明的第三实施例的设备的框图。图11是示出本发明与现有技术之间的识别精度比较。具体实施方式下文将参照附图详细描述本发明的实施例。本发明的实施例可被高效地应用于识别多种语言的字符,并且尤其适合于识别东亚语言,例如汉语、日语和韩语的字符。图2是示出用于实施根据本发明的手写字符识别设备的计算设备的布置的框图。为了简化起见,该设备被示出为置于单个计算设备中。但是,不管该设备被置于单个计算设备中还是被置于作为网络系统的多个计算设备中,该设备都是有效的。如图2所示,计算设备100用于实现手写字符识别的过程。此外,计算设备100可执行图像检测。计算设备100可包括CPU101、芯片组102、RAM103、存储控制器104、显示控制器105、硬盘驱动器106、CD-ROM驱动器107、以及显示器108。计算设备100还可包括连接于CPU101和芯片组102之间的信号线111、连接于芯片组102和RAM103之间的信号线112、连接于芯片组102和各种外围设备之间的外围设备总线113、连接于存储控制器104和硬盘驱动器106之间的信号线114、连接于存储控制器104和CD-ROM驱动器107之间的信号线115、以及连接于显示控制器105和显示器108之间的信号线116。客户设备120可直接或经由网络130连接到计算设备100。客户设备120可例如向计算设备100发送手写字符识别的过程所需要的指令和/或参数,并且计算设备100可将信息返回给客户设备120或者在显示器108上显示信息。[第一实施例]本发明提供了一种改进的手写字符离线识别,其与当前的离线识别相比至少能够加速手写字符的识别且具有相似甚至更高的精度。在现有技术中,离线识别可被以任一种方式实现。下文将参照图3来描述手写字符的常用离线识别的概述以便有助于离线识别的理解。离线识别过程通常基于手写字符轨迹。在步骤310中,手写字符的手写轨迹被转换成二维字符图像。更具体而言,获得手写轨迹的边界框,并且产生根据该边界框的尺寸的二维图像。然后,利用具有宽度为1个像素的黑线填充相邻轨迹点之间的空间。在步骤320中,从所获得的字符轨迹图像提取手写字符的离线特征。离线特征可能是8个方向的梯度特征矢量(576维)。当然,离线特征可以是任何其他形式。在步骤330中,离线特征矢量的大小被通过本领域中的任何技术(诸如,线性分辨分析(LDA))减小,以便从576维减小到64维。在步骤340中,将特征矢量与通常预先设定的字典相比较。字典还可被称为用于离线识别的识别候选字符源(离线识别候选字符源)。作为常用的技术,欧几里得距离被用于评估特征矢量与字典中包含的每个候选字符之间的匹配,并且确定候选字符的匹配得分,并且该欧几里得距离通常可被看做一种离线识别置信度。在步骤350中,匹配的候选字符被依据各自的匹配得分排序,并且前预定数量的候选字符被选择作为离线识别结果。如上所述,手写字符的离线识别通常处理手写字符轨迹的图像以提取其离线特征,并且将其与识别候选字符源中的每一个进行匹配,以便选择预定数量的字符作为识别结果,该识别结果还可被称为用户将从中选择可能正确的字符的候选,因此离线识别的计算成本和速度主要依赖于用于离线识别的候选字符的数量。由于大量的候选字符以及复杂的图像处理和匹配,常规离线识别的计算速度低并且计算成本高。本实施例的离线识别旨在基于手写字符的在线信息(还可被称为在线特征)改进手写字符的离线识别。下文,将参照图4描述根据本发明的第一实施例的离线识别方法。在步骤S401(下文被称为过滤步骤)中,基于与手写字符有关的在线信息过滤识别候选字符源。在步骤S402(下文将被称为离线识别步骤)中,基于经过滤的识别候选字符源来执行手写字符的离线识别,以获得手写字符的离线识别结果。在线信息可包括手写字符的手写轨迹的时间特征,并且该时间特征可包括手写字符的手写轨迹中的笔划顺序、笔划数、轨迹点数量和轨迹点顺序之中的至少一个。基于在线信息的对于候选字符源的过滤通常可执行过滤以便保留源中的符合该在线信息的字符,并且可被以多种方式实施,下文将以手写字符的笔划数为例来描述过滤步骤的过程,并且手写轨迹的笔划数通常可在字符手写期间通过任何技术被获得。在这样的情况下,过滤步骤可执行过滤以便保留识别候选字符源中的笔划数落在由手写字符的手写轨迹中的笔划数确定的笔划数范围内的字符,并且笔划数范围可从笔划数与第一阈值之间的差到该笔划数与第二阈值之和,并且可包括该笔划数与第一阈值之间的差以及该笔划数与第二阈值之和两者。例如,当笔划数为M时,手写字符的笔划数范围通常为[M-N1,M+N2],其中N1和N2分别是第一和第二阈值,并且N1和N2可相同或者不同。然后,从识别候选字符源中滤出其笔划数落在笔划数范围(即,[M-N1,M+N2])内的候选字符,作为用于进一步的离线识别的候选源。上述的与手写字符的手写轨迹中的笔划数有关的描述仅仅是一个示例,并且关于手写字符的其他类型的时间特征,也可执行过滤以便减少候选字符的数量。例如,当时间特征为手写轨迹中的笔划顺序时,过滤过程可被执行以保留其笔划顺序符合该手写轨迹中的笔划顺序的字符。当时间特征为轨迹点数量或轨迹点顺序时,过滤过程可与针对笔划数或笔划顺序的过程类似地执行。通过利用手写字符轨迹的这样的时间特征,识别候选字符源中的候选字符数量可被显著减小,因此基于减少数量的候选字符的离线识别可被加速。此外,由于这样的时间特征可在手写期间相对精确和迅速地获得,并且几乎不需要手写轨迹的任何图像处理,因此,这种过滤与当前的用于离线识别的粗略分类相比更快。因此,与当前离线识别相比,根据第一实施例的离线识别的整个识别过程可在其精度不劣化的情况下被进一步加速。在一些优选实现中,手写字符的一些其它的在线信息可被利用以进一步过滤识别候选字符源以进一步减少它的数量,以便进一步加速手写字符的离线识别。这种在线信息可包括来自手写字符的在线识别结果的字符结构信息(还可被称为字符结构特征),并且字符结构信息可被从在线识别操作确定,而不是对于手写字符的图像进行处理。字符结构信息可包括在线识别结果中包含的主要字符组成结构、在线识别结果中包含的主要偏旁部分等。下文,将详细描述来自手写字符的在线识别结果的字符结构信息为主要字符组成结构的情况。字符的组成结构可依赖于字符的语言被确定,并且例如对于汉语可包含上下结构和左右结构。通常,一个字符仅对应于一种字符组成结构。而且,主要字符组成结构可指的是由手写字符的在线识别结果中的每一个的组成结构构成的集合中的具有最高的出现频率的一种字符组成结构。出现频率可被表达为该集合中的一种字符组成结构的出现量与该集合的总数的比率。然后,过滤步骤可进一步执行过滤以保留识别候选字符源中的其字符组成结构符合该主要字符组成结构的字符。在这种情况的具体实现中,获得各在线识别结果的字符组成结构,然后可通过如下操作来确定每种字符组成结构的出现频率,即对具有该种字符组成结构的候选字符的数量进行计数并且计算该数量与该在线识别结果的总数的比率。然后,将选择具有最高出现频率的一种字符组成结构作为主要字符组成结构,以对源中的候选字符进行过滤,从而仅有具有该主要字符组成结构的候选字符被被保留以用于进一步的离线识别。在另一优选实现中,字符结构信息可以是在线识别结果中包含的主要基础组成部分(radicalcomponentpart),并且在线识别结果中的主要基础组成部分可被用于进一步减少用于离线识别的识别候选的数量。下文,将描述字符结构信息为在线识别结果中包含的主要基础组成部分的情况。字符的基础组成部分通常根据该字符的语言被预先设定,并且例如,可以是汉语中的偏旁,并且一个字符通常包括若干基础组成部分。要被使用的主要基础组成部分的数量通常可以是根据特定准则的预定数,并且例如可以是一个或两个。主要基础组成部分可指的是由手写字符的在线识别结果中的每一个的基础组成部分构成的集合中的在根据各基础组成部分的出现频率按降序排序时前预定数量的基础组成部分,并且该前预定数量的基础组成部分的出现频率之和可等于或大于一个阈值(第三阈值)。这里,基础组成部分的出现频率指的是该集合中的基础组成部分的出现数量与该集合中包含的基础组成部分的总数的比率。对于这样的字符结构信息,过滤步骤可进一步执行过滤以保留识别候选字符源中的包含预定数量的主要基础组成部分中的任一个的字符。在这种情况的具体实现中,首先,可根据基础组成部分词典来获得在线识别结果中的各字符的基础组成部分,该基础组成部分词典是对于要被识别的字符的语言而被预先设定的,这样的获得过程可被以本领域中公知的任何方式实施,因此为了清楚起见其细节被省略。然后,所获得的基础组成部分根据它们的出现频率被按降序排序。对于被排序的基础组成部分,出现频率之和大于等于第三阈值的前预定数量的基础组成部分将被选择作为要被使用的主要基础组成部分。例如,该预定数量可为3。然后,从识别候选字符中,将选择具有所选择的预定数量的主要基础组成部分中的任一个的候选字符作为进一步离线识别的基础。应注意,如上所述的基于字符组成结构的过滤过程和基于主要基础组成部分的过滤过程可被可替换地或组合地执行。当这两者被执行时,它们的执行顺序未被特别限制,并且基于主要基础组成部分的过滤和基于字符组成结构的过滤中的任一个可首先执行。在更优选的实现中,为了进一步加速离线识别,手写字符轨迹的笔划密度分布将被用作字符结构信息。下文,将描述在线识别结果的字符结构信息是笔划密度分布的情况。在更具体的实现中,首先,手写字符的手写轨迹区域根据在线识别结果的主要字符组成结构以及手写轨迹中的手写笔划的矩形被划分成子区域。这里,主要字符组成结构被用于确定手写轨迹中的笔划的划分方式,例如手写轨迹中的笔划是否将被以上下方式还是左右方式分割。手写笔划的矩形可以是围绕手写笔划的外接矩形,并且可被用于确定各被划分的笔划所属于的子区域。例如,对于上下结构的字符,如果一个笔划的外接矩形与另一个笔划的外接矩形沿水平方形重叠,则这两个笔划可被认为合并在一个子区域中。例如,当主要字符组成结构为左右组成结构时,字符可被以如下方式划分。‘和’->‘禾’,‘口’;‘洪’->‘氵’,‘共’;划分过程的具体操作是本领域中公知的,因此为了清楚起见在这里被省略。然后,将各子区域中的笔划数和总笔划长度中的至少一个计为该子区域的笔划密度分布。因此,手写字符轨迹的笔划密度分布可由各子区域的笔划密度分布构成。然后,从离线识别的候选字符中,例如根据预先设定的笔划密度分布字典获得每个候选字符的笔划密度分布,并且其笔划密度分布类似于手写字符的笔划密度分布的候选字符将被选择作为进一步离线识别的基础。在一种可能的实现中,对于从手写字符轨迹划分出的各子区域的笔划密度部分,识别候选字符中的各候选字符的对应子区域的笔划密度分布可被从该字典获得,并且然后与之相比较。当离线识别的候选字符的子区域分别具有与该手写字符的对应子区域类似的笔划密度分布时,可认为该候选字符是具有类似笔划密度分布的字符。子区域是否具有类似的笔划密度分布可被以现有技术中的多种方式确定,并且一种常用方式是确定子区域中的笔划密度分布与手写字符的对应子区域中的笔划密度分布之差是否小于预定阈值(第四阈值)。如果是,则可认为它们的笔划密度分布相似。当然,如本领域已知的,子区域的笔划密度分布可基于对于每个子区域中的笔划数和总笔划长度中的至少一个的其它类型的处理被以任何其它方式表达,并且可对于这样的笔划密度分布以对应的方式执行比较。这样的基于笔划密度分布的过滤可与如前所述的任何过滤组合。但是,由于与笔划密度分布有关的处理涉及手写字符的图像处理,因此该处理可具有相对高的计算成本。因此,优选地,其仅在当手写字符的在线识别结果中没有发现主要基础组成部分时被执行。利用基于根据手写字符的在线识别结果确定的字符结构信息的上述处理,根据第一实施例的手写字符的离线识别的性能可被进一步提高。首先,计算成本可得到改进,这是因为离线识别的候选字符显著减小,并且在线信息可被以相对简单且迅速的方式基于在线识别结果得到,而这也具有相对低的计算成本。相反,现有技术中的多层分类离线识别提取手写字符的离线特征以减少离线识别的候选字符,而这涉及图像处理并且具有高的计算成本。其次,尽管本实施例的离线识别利用了基于在线识别结果的在线信息,但是此方式与现有技术中的上述级联式混合识别也是截然不同的。这是因为,在级联式混合识别中,离线识别仅从在线识别的结果中选择预定数量的字符,并且可具有相对低的精度,甚至可能是错误的。相反,本实施例仅利用在线识别结果来对离线识别的候选字符进行过滤,因此可基于在线识别性能动态地限制离线识别的识别候选字符。也就是说,当在线识别可获得良好的识别效果是时,可获得更精确的轨迹特性评估,并且因此可获得更精确的在线信息,将离线识别的候选字符限制于为小的范围。即使当在线识别不能获得良好的结果时(例如,对于具有异常笔划顺序的字符),离线识别的识别候选字符可被自动扩展到较大的范围,因此离线识别的精度将不会劣化。图5是示出根据本发明的第一实施例的设备的框图。设备500是用于手写字符的离线识别的设备,并且可包括过滤单元501,被配置用于基于与手写字符有关的在线信息对识别候选字符源进行过滤,以及离线识别单元502,被配置用于基于经过滤的识别候选字符源来识别手写字符,以获得该手写字符的离线识别结果。更具体而言,该过滤单元501可配置用于基于手写字符的手写轨迹的时间特征执行过滤。该过滤单元501可进一步配置用于基于诸如主要字符组成结构、主要基础组成部分、笔画密度分布等的根据手写字符的在线识别结果确定的字符结构特征执行过滤。[示例]下文,为了更清楚地理解本发明的第一实施例的处理,将参照如图6所示的手写字符来解释手写字符的上述离线识别方法。离线识别的初始的识别候选字符数为2965(依赖于日语KANJI等级1)。首先,可将字符的手写轨迹中的笔划数确定为6,当第一阈值和第二阈值都被设定为3时,笔划数范围为[3,9],因此具有位于该范围[3,9]内的笔划数的识别候选字符将被选作进一步离线识别的基础。此时,剩余1087个候选字符。为了进一步加速离线识别,可执行手写字符的在线识别并且获得10个字符,如表1所示。序号获得的字符1近2迂3迫4返5江6迄7迎8呂9吃10竺然后,可基于手写字符的在线识别结果来确定字符结构信息。考虑上下结构和左右结构,可从上表1中确定具有上下结构的候选字符为:‘近’,‘迂’,‘迫’,‘返’,‘迄’,‘迎’,‘呂’,‘竺’,而具有左右结构的字符为:‘江’,‘吃’。由此可见,上下结构的出现频率为0.8,其大于左右结构的出现频率。因此,上下结构可被看做主要字符组成结构,并且将选择具有相同组成结构的识别候选字符。此时,剩余612个候选字符。然后,将基于手写字符的在线识别结果来确定主要基础组成部分。在此示例中,基础组成部分是偏旁,并且在偏旁根据它们的出现频率被降序排序的情况下,前2个偏旁被选择作为主要基础组成部分。在线识别结果中的前2个偏旁是:‘辶’,‘口’。然后,选择具有这前2个偏旁中的任一个的识别候选字符。此时,对于当前字符剩余44个候选。由上可见,离线识别的候选字符的数量可被显著减小,并且离线识别将从如此少的候选字符中产生其结果,因此其识别速度将大大提高。此外,由于在线信息基于在线识别结果被确定,这与字符图像处理和匹配相比需要较少的计算开销,因此本发明的离线识别的计算成本也可被改进。可替换的,笔划密度分布也可被确定并且用于限制识别候选字符的数量。并且在此示例中,利用笔划密度分布,对于当前字符仍存在44个候选。从上述示例可见,离线识别的计算成本、尤其是计算速度可被提高,而识别精度没有劣化。[第二实施例]如上所述,通常利用并联式混合识别来提高识别精度。因此,在第二实施例中,也提出了利用在线识别和离线识别的组合的并联式混合识别方法。下文将参照图7描述根据本发明的第二实施例的手写字符识别方法。在步骤S701(下文被称为在线识别步骤)中,执行手写字符的在线识别。在步骤S702(下文被称为离线识别步骤)中,通过使用根据第一实施例的方法来执行手写字符的离线识别。在步骤S703(下文被称为组合步骤)中,将来自在线识别步骤的手写字符的在线识别结果和来自离线识别步骤的手写字符的离线识别结果相组合,以获得手写字符的最终识别结果。在根据第二实施例的方法中,在线识别和离线识别可分别执行,其中离线识别可与本发明的第一实施例类似地执行,然后它们的结果被组合。为了清楚起见,本实施例中的离线识别的细节将不再描述。如上所述,离线识别的候选字符基于从手写字符的手写轨迹以及在线识别结果获得的在线信息被预先过滤。因此,在第一实施例中,在线识别和离线识别可彼此相关联,而不是如现有技术那样完全彼此无关。在线识别和离线识别的组合可被以现有技术中的任何方式执行。优选地,组合方式还可以是下文在第三实施例中所描述的组合方法。与手写字符有关的在线信息可在根据第二实施例的方法的过程期间得到,也就是说,根据第二实施例的方法可进一步包括获得如上所述的在线信息的步骤。可替换地,在线信息可与根据本发明的第二实施例的方法的过程分离地被获得,并且被用作离线识别步骤的输入。根据本实施例的手写字符的识别的性能可被提高。更具体而言,由于组合识别利用了在线识别结果和离线识别结果的互补性,其识别精度相对于简单的级联式混合识别增加。与常规的并联式混合识别相比,由于在根据第二实施例的识别方法中,其中的离线识别通过使用在线信息被预先过滤,离线识别被加速,因此相对于其中在线识别和离线识别被独立地执行并组合的简单的混合组合方式,混合识别的计算速度提高。此外,由于混合识别中的离线识别可如上所述实现与级联式混合识别相比增加的精度,因此该混合识别的识别精度也比如下这样的混合识别高,即该混合识别由在线识别和其中在线或离线识别结果被从先前的离线或在线识别结果中选择的级联式混合识别构成。总而言之,第二实施例的组合识别可在精度和计算成本之间实现更好的平衡。图8是示出根据本发明的第二实施例的设备的框图。设备800是用于手写字符的由离线识别和在线识别构成的组合识别的设备。该设备800可包括在线识别单元801,被配置用于执行手写字符的在线识别;离线识别单元802,被配置用于执行手写字符的离线识别;以及组合单元803,被配置用于将从在线识别单元得到的手写字符的在线识别结果和从离线识别单元得到的手写字符的离线识别结果相组合,以获得手写字符的最终识别结果。组合识别803可按本领域中的任何方式执行组合,也可根据本发明的第三实施例的方法执行组合。[第三实施例]如上所述,现有技术中的并联式混合识别中使用的组合是通过利用由在线识别和离线识别所识别的字符码,或者通过基于复杂的训练过程获得在线识别和离线识别的组合识别置信度,来执行的,但是前者不能实现适当的精确的组合识别结果,而后者具有高的计算成本。下文,将参照图9描述根据本发明的第三实施例的并联式混合识别中的在线识别结果和离线识别结果的改进的组合方式。在步骤S901(下文被称为在线识别步骤)中,执行手写字符的在线识别。在步骤S902(下文被称为离线识别步骤)中,执行手写字符的离线识别。在步骤S903(下文被称为离线识别影响因子计算步骤)中,对于在线识别结果以及离线识别结果中所包含的每一个字符,基于该字符的离线识别置信度来计算该字符的离线识别影响因子。在步骤S904(下文被称为组合置信度计算步骤)中,对于在线识别结果以及离线识别结果中所包含的每一个字符,通过将该字符的离线识别影响因子与该字符的在线识别置信度相乘以计算该字符的组合置信度。在步骤S905(下文被称为获取步骤)中,从根据各自的组合置信度按降序排序的在线识别结果和离线识别结果中所包含的所有字符中获取前预定数量的字符作为最终识别结果。特别地,对于每个字符,在线识别置信度和离线识别置信度可被确定。更具体而言,如果在线识别结果中的一个字符没有存在于离线识别结果中,则此字符的离线识别置信度被设定为预定离线识别置信度。并且,如果离线识别结果中的一个字符没有存在于在线识别结果中,则此字符的在线识别置信度可被设为预定在线识别置信度。这意味着在线识别结果和离线识别结果两者中的任一个中的一个识别字符总是具有在线识别置信度和离线识别置信度两者。然后,基于所确定的在线识别结果和离线识别结果的集合中所包含的各字符的离线识别置信度,计算各字符的离线识别影响因子。更具体而言,对于每个字符,其离线识别影响因子将基于其的离线识别置信度和如下字符的离线识别置信度(通常基于它们的比率)被计算,该字符为在线识别结果和离线识别结果中的除正被计算的字符以外的具有最小离线识别置信度的字符。在示例性实现中,对于基于离线识别的欧几里得距离,其中,Di指的是在线识别结果和离线识别结果中所包含的第i个字符的欧几里得距离值,即离线识别置信度,并且该第i个字符可被看做其离线识别影响因子正在被计算的字符;Dbest(i)指的是在线识别结果和离线识别结果中所包含的除第i个字符之外的最佳字符的距离值,best(i)是最佳字符的序数,并且在基于欧几里得距离的离线识别的情况下,“最佳字符”可指的是在线识别结果和离线识别结果之中除该第i个字符之外的具有最小距离的字符。在示例性实现中,在线识别结果和离线识别结果的集合可根据字符的离线识别置信度(诸如欧几里得距离)按升序排序,然后第一个字符将被选择为该集合中的最佳字符。在离线识别影响因子的计算期间,设集合的数目为N,第一字符的离线识别影响因子将基于第一字符和第二字符的离线识别置信度计算,并且第二到第N个字符中的每一个的离线识别影响因子将基于其离线识别置信度和该第一字符的离线识别置信度进行计算。然后,各字符的组合识别的识别置信度将通过将其在线置信度乘以其离线识别影响因子而被计算。在根据本发明的第三实施例的方法中,对于每个字符,来自离线识别的识别置信度被转换成对于其在线识别置信度的离线识别影响因子,并且被用于获得组合识别置信度。此计算与基于统计的用于训练置信度组合函数的算法相比简单,并且能够实现足够的精度。在线识别和离线识别的组合得到改进,因此识别结果的精度得到提高。在优选实现中,根据第三实施例的组合方法还可与根据第二实施例的方法一起使用。在这样的情况下,根据第一实施例执行离线识别,然后在线识别结果以及这样的离线识别结果可根据第三实施例被组合。因此,手写字符的识别精度可被进一步提高。图10是示出根据本发明的第三实施例的设备的框图。设备1000是用于手写字符的组合识别的设备,并且可包括在线识别单元1001,被配置用于执行手写字符的在线识别;离线识别单元1002,被配置用于执行手写字符的离线识别;离线识别影响因子计算单元1003,被配置用于对于在线识别结果以及离线识别结果中所包含的每一个字符,基于该字符的离线识别置信度来计算该字符的离线识别影响因子;组合置信度计算单元1004,被配置用于对于在线识别结果以及离线识别结果中所包含的每一个字符,通过将该字符的离线识别影响因子与该字符的在线识别置信度相乘以计算该字符的组合置信度;以及获取单元1005,被配置用于从根据各自的组合置信度按降序排序的在线识别结果和离线识别结果中所包含的所有字符中获取前预定数量的字符作为最终识别结果。[示例]下文,将示出根据第三实施例的方法的示例。首先,来自在线识别和离线识别的识别结果可被合并为一个列表。例如,对于如图6所示的手写字符,其在线识别结果和离线识别结果可被如表2所示地合并。表2序号在线识别结果离线识别结果1近2迂迂3迫4返返5江6迄迄7迎8呂9吃10竺11逗12辻13逐14逆15這16退17速然后,各字符的在线识别置信度和离线识别置信度被确定,如表3中所示。表3序号在线识别置信度离线识别置信度1C11D2Default2C12D22(D2min)3C13D2Default4C14D245C15D2Default6C16D267C17D2Default8C18D2Default9C19D2Default10C110D2Default11C1DefaultD21112C1DefaultD21213C1DefaultD21314C1DefaultD21415C1DefaultD21516C1DefaultD21617C1DefaultD217然后,可根据上述表达式计算各字符的离线识别影响因子,然后将其用于计算该字符的组合识别置信度。然后,上述列表中的字符可根据它们的组合识别置信度按降序排序,并且前10个字符将被选择作为根据本发明的第三实施例的识别结果。图11示出本发明与现有技术的识别精度之间的比较。由此可见,与由在线识别和在线或离线识别结果被从先前的离线或在线识别结果中选择的级联式混合识别所构成的并联式组合识别(现有技术2)相比本发明可实现更高的精度,并且与其中在线识别和离线识别被独立地执行并且组合的简单并联式组合识别(现有技术1)相比,本发明可实现类似的精度,但是本发明的计算速度快得多,这是因为如上所述,本发明的离线识别的候选字符比现有技术中的简单并联式混合识别中的离线识别的候选字符少得多。另外,可采用多种方式来实行本发明的方法和系统。例如,可通过软件、硬件、固件或它们的任何组合来实行本发明的方法和系统。上文所述的该方法的步骤的顺序仅是说明性的,并且除非另外具体说明,否则本发明的方法的步骤不限于上文具体描述的顺序。此外,在一些实施例中,本发明还可具体化为记录介质中记录的程序,包括用于实施根据本发明的方法的机器可读指令。因此,本发明还涵盖了存储用于实施根据本发明的方法的程序的记录介质。虽然已经参考示例实施例描述了本发明,应当理解,本发明不限于公开的示例实施例。下面的权利要求的范围将被给予最宽泛的解释,以便包含所有这些修改以及等同结构和功能。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1