用于手写识别的装置和方法

文档序号:6655704阅读:314来源:国知局
专利名称:用于手写识别的装置和方法
技术领域
本发明总的涉及电子设备的手写输入,并且尤其涉及一种用于手写识别的方法和设备。
背景技术
电子设备中的手写输入的使用提出了一组问题,例如,由于手写是单个的并且有时难于在不同的手写字符之间进行辨别。已经开发了不同的系统以便易于借助于手写而不是在键盘、键垫诸如此类上进行键入,而将字符输入到电子设备中。
在增加手写识别准确度的过程中,已经建议了不同的方式以辨别不同的字符。举例来说,一些系统需要用户以特定方式来书写字符,而另外一些系统包括能够“学习”单个用户的手迹的装置。
手写识别也可以考虑到关于字符所出现的语境的信息。
公开号US 2004/0017946的美国申请公开了一种手写汉字输入法和系统,包括基于键盘笔划(key stroke)输入的、可能的汉字列表。随着输入更多的键盘笔划,汉字列表得到调整并且当想要汉字出现在所述列表中时,用户可以借助于诸如鼠标或触针或手指轻敲之类的选择动作挑选字符。
欧洲专利EP 0686291公开了一种手写识别的方法,所述方法使用用于识别输入手写字的词典。为输入手写字的每个字符确认候选字符并且将候选字符的组合与所述词典中的词条相比较以提供可以表示所述输入的候选词。此外,最有可能字符串被确认为具有不考虑所述词典的、最高正确组合可能性的候选字符的组合。提供一种列表,所述列表包括候选词,并且如果没有候选词之一则列表包括最有可能的字符串。
借助于不同候选字符的组合进行对字的识别需要大量处理和非常大的词典。因此,需要缓和这些缺点同时仍然保留良好识别准确度的手写识别。

发明内容
提供一种用于在表示输入字符串的手写输入中识别字符的方法。根据该方法,确定输入字符串中未被识别字符之前的字符子串。使用手写识别来提供未被识别字符的一个或多个候选字符。然后选择一个或多个候选字符之一。所选择的候选字符是根据已确定的字符子串所选择的最有可能成为未被识别字符的正确识别的候选字符。
因此,根据该方法,一个时间识别一个地进行字符识别。字符的识别基于手写识别以提供候选字符,并且基于在将要识别的字符之前已经识别的字符子串。
通过将识别为每次一个字符,即不考虑形成多于一个的字符的候选字符组合,以降低处理量。同时,通过考虑未识别字符之前的确定的字符子串而达到准确性。
利用确定字符子串以便选择一个或多个候选字符之一的一种方式在于还包括存储的字符串的使用。然后一个或多个候选字符串可以被确认在存储的字符串之间,其中候选字符串每个包括与确定的字符子串相同的首写字符子串。所述选择可以基于一个或多个候选字符串。所述选择更具体地说可以基于在所述一个或多个候选字符串的每个字符串的首写字符子串之后的下一字符。
可以仅仅利用用于字符串的其它字符的手写识别的其它方法对单个字符执行所述方法。所述方法还可以当用于字符串时对一个字符连续地执行。
提供一种设备,用于在表示输入字符串的手写输入中识别字符。在所述设备中,处理器被配置成确定所述输入字符串中未被识别字符之前的字符子串。所述处理器还被配置成使用手写识别以提供用于未被识别字符的一个或多个候选字符。所述处理器还被配置成选择一个或多个候选字符之一,其中所述被选择的候选字符是基于确定字符子串最有可能成为未被识别字符的正确识别的一个。


在下面,参考附图以举例形式而不是限制地举例说明本发明,其中图1示出一种设备的示意性的框图,其中实现了依照本发明一种设备的一种实施方式;图2示出依照本发明一种方法的一种实施方式的流程图;以及图3A-C依照本发明举例说明手写字的识别。
具体实施例方式
图1示出设备100的示意性的框图,其中实现了依照本发明设备的一种实施方式。所述设备100可以例如是诸如移动电话、个人数字助理等之类的手持式设备、或易于或应该易于进行手写输入的任何设备。
所述设备100包括手写输入装置110。应当注意,依照本发明可以使用用于给定手写输入的任何方式和装置,诸如用户可以通过触针在其上给定手写输入的压敏屏幕。这种方式方法在所属技术领域内是公知的,这里不再给出进一步的描述。
设备100还包括处理器120,其可操作地连接到手写输入装置110。在本发明中可以实现的设备通常包括一个或多个微处理器或用于数字处理的其它设备。此外,在本发明的实施方式中实现的设备通常包括一平台,用于实现将通过用于数字处理的现有设备执行的不同计算方法。因此,用作处理器120的现有处理器之一是优选然而并非必须地,并且依照本发明通过处理器120执行的所述方法的实施方式的步骤是由给定现有领域设备和于此教导的本领域技术人员容易实现的。
设备100还包括用于存储字符串的存储器130。存储器可操作地连接到处理器120。和处理器120的情况一样,本发明可以实现的设备通常包括一个或多个存储器或用于数字存储器的其它设备。此外,一些设备甚至可以包括词典。因此,如此现有存储器优选然而并非必须地用作存储器130。本领域技术人员借助于现有技术的知识以及在此给出的教导很容易实现本发明方法中对于存储器中存储的字符串进行访问的步骤。
即便用于实现本发明的实施方式的设备不包括这种处理装置、平台、存储器等等,由于它们在所属技术领域内是公知的,因此也很容易包括在内。
尽管上面描述的设备100涉及通过压敏屏幕等等方式直接地输入到电子设备的手写字符串的输入,应当注意的是,本发明实施方式也可以用于诸如在纸上等等用于手写消息光学字符识别方法中使用字符识别的其它的应用。
图2示出依照本发明方法的实施方式流程图。手写输入已经给至电子设备,例如给至在图1中举例说明并参考该图进行描述的类型的设备。手写输入表示输入字符串,即一串字母表字母、数字、符号等等或其组合。将要识别的字符(在下文中未被识别的字符)以前(即直到并且包括此前字符)的手写输入的字符已经通过(包括但不局限于)依照所述本实施例的方法进行手写识别的方法进行识别。
在步骤210中,确定输入字符串的字符子串。字符子串或者可以由在手写输入所表示的输入字符串中未被识别的字符以前的所有字符组成,或者可以由未被识别的字符以前的字符的终结字符子串组成。在这方面,字符串的终结字符子串是从所述字符串第一字符之后的字符或后面的字符开始,并以所述字符串的末字符结束的字符串。
可以根据存储的字符串完成对将使用的字符子串的确定。所述存储的字符串至少包括一组频繁出现的词,但是还优选地包括短语、和在所考虑的语言中频繁出现的词根和字符序列,诸如“tion”、“ly”等。
在输入字符串中未被识别字符以前的完整的字符串与存储的字符串或一个或多个存储的字符串的初始子串之一相同的情况下,所述确定字符子串将是未被识别字符以前的完整字符串。换句话说,只要在输入字符串中至此识别的字符表明,在存储的字符串之间存在的短语、词或字符序列已经输入,那么所有先前字符被用作识别后续字符的基础。在这方面,字符串的初始字符子串是从一个字符串的第一字符开始,并在所述字符串的末字符之前结束的字符串。
在输入字符串中未被识别字符以前的完整的字符串与任何存储的字符串或任何存储的字符串的初始子串之一都不相同的其它情况下,所述确定字符子串往往不是完整的字符串。在此情况下,在输入字符串中至此识别的字符的第一字符(其表明在已经输入的存储的字符串之间不存在的短语、词或字符序列),可能会被用作确定字符子串的第一字符。更具体地说,未被识别字符以前的所述输入字符串的任何首写字符子串将被确认,其与存储的字符串之一或存储的字符串之一的首写字符子串之一相同,并且其与后续的字符一起同所存储的字符串的任何一个或所述存储的字符串的任何一个的首写字符子串都不相同。然后所述确定字符子串将以后续的字符开始,并且以未被识别字符以前的字符结束。
当将本发明应用到特定语言时,还可以进一步指定字符子串的确定,以便降低计算复杂性。当识别未被识别字符时,在允许所述方法考虑所有先前字符的替换实施方式中,所述确定可以被指定为仅仅考虑所述未被识别字符所属的词的先前字符。在该替换实施方式中,字符子串的确定包括确认词分离字符或指示,诸如空格字符。然后,未被识别字符所属的词的先前字符容易地被确认为在最后一个空格字符或在未被识别字符之前的其它的词分离指示之后的输入字符串的字符。如果所述词是在未被识别字符以前所有字符之后的输入字符串中的第一词,那么其将被确认为字符子串。
确定子串的其它的选择可能是,诸如由未被识别字符所属的词的先前字符和未被识别字符以前的完整词的字符组成的子串的确定。所述词容易地通过词分离字符或诸如空格字符之类的指示来确认。
在步骤210中确定字符子串之后,在步骤220中确认一个或多个候选字符串。在存储的字符串之中的候选字符串被确认为包括与确定的字符子串相同的首写字符子串的任何存储的字符串。可以使用用于字符串与存储的字符串的匹配的任何解决方案,和用于实现这种解决方案的装置,包括本领域技术人员公知的方法和装置。
应当注意的是,尽管上面已经公开了在存储的字符串之间查找的使用,也可以使用根据给定字符串来预测下一字符的任何其它方式,诸如继给定字符串之后在存储的概率之间查找给定字符的概率。
在步骤230中,提供了用于未被识别字符的一个或多个候选字符。通过手写识别提供候选字符。任何类型手写识别都可以用来提供所述候选字符,诸如在所属技术领域内公知的手写识别。
最后,在步骤240中,选择一个或多个候选字符之一。选择最有可能成为未被识别字符的正确识别的那个候选字符。候选字符的可能性是基于在所述一个或多个候选字符串中每个字符串的首写字符子串之后的下一字符。
在使用在所述一个或多个候选字符串中每个字符串的首写字符子串之后的下一字符替换实施方式中,可以使用任何方法来提供给定字符在给定字符串之后的概率。
应当注意的是,即使上面参考图2描述的本发明实施方式运用在已经识别了以前的字符的情况下的单个字符,但是根据先前已识别的字符可以每次识别一个地连续使用所述方法来识别所有字符。在这种情况下,将不必针对每个字符重复确定字符子串过程的所有步骤,而来自确定先前字符的字符子串的信息可以用于与将要识别的当前字符相关的字符子串的确定。这从参考图3A-C的描述中将更加显而易见。
图3A-C依照本发明举例说明了手写字的识别。框310a-c包括输入手写词,框320a-c包括用于框310a-c的手写字符的候选字符,而框330a-c包括在存储的字符串之间按字母顺序确认的候选串。
在下文中,即使当手写输入的字符被输入设备的时候每次识别一个,也可以在已经输入了所有字符之后每次一个地顺序进行识别。
在图3A中,如在框310a中表示的,已经输入了手写未被识别字符,并且如在框320a中显示的,通过手写识别提供的唯一候选字符是″t″。因此,在框310a中,字符″t″被选择为最可能的手写字符的识别。
在图3B中,如在框310b中表示的,已经输入了第二手写未被识别字符。在框320b中,字符″h″和字符″n″两者都通过手写识别提供为候选字符。在这种情况下,确定的字符子串是″t″。根据确定的字符子串,在框330b中确认多个候选字符串,诸如″than″、″that″、″the″,…,″title″,以及″to″。由于候选字符串按字母顺序出现,因此以″tn″开始的任何候选字符串可能会已经出现在″title″和″to″之间。由于在候选字符串之间的子串″t″之后没有具有″n″的候选字符串作为下一字符,并且在候选字符串之间的子串″t″之后具有″h″作为下一字符的至少三个候选字符串,因此在框310b中″h″被选为第二手写字符的最可能的识别。
在图3C中,如在框310c中表示的,已经输入了第三手写未被识别字符。在框320c中,字符″e″和字符″l″两者都通过手写识别提供为候选字符。在这种情况下,确定的字符子串是″th″。根据确定的字符子串,在框330c中确认多个候选字符串,诸如″the″、″theatre″、″theft″,…,″this″,以及″thom″。由于候选字符串按字母顺序出现,因此以″thl″开始的任何候选字符串可能会已经出现在″this″和″thom″之间。由于在候选字符串之间的子串″th″之后不存在具有“l”作为下一字符的候选字符串,并且在候选字符串之间的子串″th″之后具有″e″作为下一字符的至少三个候选字符串,因此在框31c中″e″被选为第二手写字符的最可能的识别。
在参考图3A-C描述的范例中,由于所述字符串始终与存储的字符串或一个或多个存储的字符串的首写字符子串相同,所述确定字符串始终是未被识别字符以前的完整的字符串。作为替代,如果手写字已经是″salsa″,并且具有″sals″作为首写字符子串的词或任何词不在存储的字符串之中,而词″sale″存在于其中,那么可以使用以下方法。直到并且包括第二″s″作为未被识别字符,未被识别字符以前的完整的字符串可能会被用作确定的子字符串。对于第二个″s″作为未被识别字符,没有候选字符串将被确认并且对一个或多个候选字符之一的选择可能会基于手写识别。作为选择,可以使用另一种方法,在这种情况中选择还基于先前单个字符。对于字符″a″作为未被识别字符,″sal″与存储的字符串″sale″的首写字符子串″sal″相同,并且与随后的字符″s″一起,这与存储的字符串的任何一个都不相同,或与存储的字符串的任何一个的首写字符子串也不相同。然后,确定的字符子串将以随后的字符″s″开始,并且以未被识别字符以前的字符结束,在这种情况下也是″s″。举例来说,在这种情况下来自手写识别的候选字符假如是″a″和″d″,多个候选字符串可能会被确认具有″sa″作为首写字符子串,诸如″sale″,但是可能没有一个具有″sd″作为首写字符子串。因此,字符″a″可能会被选为手写字符的最可能的识别。在词″schoolboy″不是存储的字符串之一的情况下,类似方法可以用于诸如″schoolboy″之类的词,而″school″和″boy″是具有以″school″或″boy″开始的首写字符子串的其它字符串。
尽管以上范例是针对英语而给出的,然而本领域技术人员很容易明白,如何将本发明应用到使用拉丁字母表、西里尔字母表等的其它语言的手写输入识别中。
本发明还可以应用于诸如中文之类的语言的手写识别,其中字符表示音节而每个字由一个或多个字符组成。
在中文中,词可以是单个字符或它们可以是两个或多个字符。举例来说,″Beijing(北京)″这个词具有两个字符,每个字符表示该词的每个音节。共同的短语可以由几个字符组成。词典列出字符、词和短语。这种词典的版本可以电子地存储在计算机或其它移动设备中。
通过在触一敏表面上写出每个字符,可以将中文文本输入到计算机或移动设备中。一些字符仅仅由微小差异来辨别,并且有时系统可能难以确定想要两个或多个类似的字符中的哪一个。
提出的发明可以以类似于对其它语言所描述的方式来改善模糊汉字的识别。当系统分不清字符时,它可以确认由一些或所有字符组成的子串,所述字符是在当前未被识别字符之前就已经输入的。它可以使用关于常用字和短语的存储信息,以便确定希望接着该子串的合适的候选项。可以使用该结果以在通过手写识别系统提出的候选项之间进行选择。
由于如中文这种语言中的书写文本不同以英文语言中书写的文本一样,通过空格字符显示字之间的分隔,因此在中文手写字符的识别中字符子串的确定无法仅仅利用空格字符来确认字分隔。作为替代,以上参考图2公开的先前字符的使用和与关于常用字和短语的存储信息的比较可以应用于确定字符子串。字符子串的确定还可以被重复,例如首先使用由一个字符组成的子串然后使用两个字符组成的子串,等。
作为选择,当输入手写字符时用户可以以某种方式来表示词之间的分隔,并且这种表示可以以类似于以上参考图2公开使用空格字符的方式而被使用。
权利要求
1.一种方法,用于在表示输入字符串的手写输入中识别字符,包括确定在输入字符串中未被识别字符之前的字符子串;通过手写识别提供用于未被识别字符的一个或多个候选字符;以及根据所确定的字符子串,选择最有可能成为未被识别字符的正确识别的一个或多个候选字符之一。
2.如权利要求1所述的方法,其中选择最有可能跟在该字符子串之后的候选字符。
3.如权利要求1所述的方法,还包括在存储的字符串中,确认包括与所确定的字符子串相同的首写字符子串的一个或多个候选字符串,其中所述选择基于一个或多个候选字符串。
4.如权利要求3所述的方法,其中所述选择基于所述一个或多个候选字符串的每个字符串的首写字符子串之后的下一字符。
5.如权利要求1所述的方法,其中字符子串的确定包括确定由在未被识别字符之前的输入字符串的所有字符组成的字符子串。
6.如权利要求1所述的方法,其中字符子串的确定包括确定由在未被识别字符之前的输入字符串的终结字符子串组成的字符子串。
7.如权利要求1所述的方法,其中字符子串的确定包括确认输入字符串中的空格字符;以及确定由在未被识别字符之前并且在一个确认的空格字符之后的输入字符串的终结字符子串组成的字符子串。
8.如权利要求7所述的方法,其中字符子串确定由在未被识别字符之前并且在未被识别字符之前被确认的最后一个空格字符之后的输入字符串的终结字符子串组成。
9.如权利要求3所述的方法,其中字符子串的确定包括确认未被识别字符以前的输入字符串的任何首写字符子串,其与存储的字符串之一相同或与一个或多个或存储的字符串的首写字符子串相同,并且其与后续的字符一起同存储的字符串的任何一个或所述存储的字符串的任何一个的首写字符子串都不相同;以及确定由在未被识别字符之前并且在任何确认的首写字符子串之后的输入字符串的终结字符子串组成的字符子串。
10.如权利要求3所述的方法,其中字符子串的确定包括确认输入字符串中的空格字符;以及确认在未被识别字符之前的并且在未被识别字符之前被确认的最后一个空格字符之后的输入字符串的任何词首写字符子串,其与存储的字符串之一相同或与一个或多个存储的字符串的首写字符子串相同,并且其与后续的字符一起同所存储的字符串的任何一个或所述存储的字符串的任何一个的首写字符子串都不相同;以及确定由在未被识别字符之前并且在任何被确认的词首写字符子串之后的输入字符串的终结字符子串组成的字符子串。
11.如权利要求3所述的方法,其中存储的字符串是从以下类型字符串中选择的短语、词、词根以及频繁使用的字符序列。
12.如权利要求1所述的方法,还包括对于在未被识别字符之前的输入字符串的序列中的每个字符通过手写识别为所述字符提供一个或多个候选字符;以及根据所述输入字符串中在所述字符之前的字符,选择最有可能成为所述字符的正确识别的一个或多个候选字符之一。
13.一种设备,用于在表示输入字符串的手写输入中识别字符,包括一个处理器,该处理器被配置成确定输入字符串中未被识别字符之前的字符子串;通过手写识别为所述未被识别字符提供一个或多个候选字符,以及根据确定的字符子串,选择最有可能成为未被识别字符的正确识别的一个或多个候选字符之一。
14.如权利要求13所述的设备,其中处理器被配置成选择最有可能跟在该字符子串之后的候选字符。
15.如权利要求13所述的设备,还包括用于存储字符串的存储器,并且其中处理器还被配置成在存储的字符串中,确认包括与所确定的字符子串相同的首写字符子串的一个或多个候选字符串,以及根据一个或多个候选字符串,选择最有可能成为未被识别字符的正确识别的一个或多个候选字符之一。
16.如权利要求15所述的设备,其中所述处理器被配置成根据在一个或多个候选字符串的每个字符串的首写字符子串之后的下一字符,选择最有可能成为所述未被识别字符的正确识别的一个或多个候选字符之一。
17.如权利要求13所述的设备,其中所述处理器还被配置成确认输入字符串中的空格字符,以及确定由在未被识别字符之前并且在未被识别字符之前确认的最后一个空格字符之后的输入字符串的终结字符子串组成的字符子串。
18.如权利要求13所述的设备,其中存储的字符串是从以下类型字符串中选择的短语、词、词根以及频繁使用的字符序列。
19.如权利要求13所述的设备,其中所述设备是移动终端。
20.一种方法,用于在表示输入字符串的手写输入中识别字符,包括确定输入字符串中未被识别字符之前的字符子串;在存储的字符串中,确认包括与所确定的字符子串相同的首写字符子串的一个或多个候选字符串,以及通过手写识别为所述未被识别字符提供一个或多个候选字符,以及根据在所述一个或多个候选字符串的每个字符串的首写字符子串之后的下一字符,选择最有可能成为所述未被识别字符的正确识别的一个或多个候选字符之一。
21.如权利要求20所述的方法,其中字符子串的确定包括确认输入字符串中的空格字符;以及确定由在未被识别字符之前并且在未被识别字符以前所确认的最后一个空格字符之后的输入字符串的终结字符子串组成的字符子串。
22.如权利要求20所述的方法,其中字符子串的确定包括确认输入字符串中的空格字符;确认在未被识别字符之前的并且在未被识别字符之前所确认的最后一个空格字符之后的输入字符串的任何词首写字符子串,其与存储的字符串之一相同或与一个或多个存储的字符串的首写字符子串相同,并且其与后续的字符一起同所存储的字符串的任何一个或所述存储的字符串的任何一个的首写字符子串都不相同;以及确定由在未被识别字符之前并且在任何已确认词首写字符子串的输入字符串的终结字符子串组成的字符子串。
23.一种移动终端,包括接口,用于检索表示输入字符串的手写输入;存储器,用于存储频繁出现字符串;处理器,该处理器被配置成确定输入字符串中未被识别字符之前的字符子串;在存储的字符串中确认包括与所确定的字符子串相同的首写字符子串的一个或多个候选字符串,以及通过手写识别为所述未被识别字符提供一个或多个候选字符,以及根据在所述一个或多个候选字符串的每个字符串的首写字符子串之后的下一字符,选择最有可能成为所述未被识别字符的正确识别的一个或多个候选字符之一。
24.如权利要求23所述的移动终端,其中所述处理器还被配置成确认所述输入字符串中的空格字符,并且确定由在未被识别字符之前并且在未被识别字符之前确认的最后一个空格字符之后的输入字符串的终结字符子串组成的字符子串。
25.如权利要求23所述的移动终端,其中所述处理器还通过以下操作来确定字符子串确认输入字符串中的空格字符;以及确认在未被识别字符之前并且在未被识别字符之前确认的最后一个空格字符之后的输入字符串的任何词首写字符子串,其与存储的字符串之一相同或与一个或多个存储的字符串的首写字符子串相同,并且其与后续的字符一起同所存储的字符串的任何一个或所述存储的字符串的任何一个的首写字符子串都不相同;以及确定由在未被识别字符之前并且在任何已确认词首写字符子串之后的输入字符串的终结字符子串组成的字符子串。
全文摘要
提供一种方法和设备,用于在表示输入字符串的手写输入中识别字符。确定在输入字符串中未被识别字符之前的字符子串。使用手写识别来提供用于被识别字符的一个或多个候选字符。然后选择一个或多个候选字符中的一个字符。所选择的候选字符是基于所确定字符子串、最有可能成为未被识别的字符的正确识别的那个候选字符。
文档编号G06K9/72GK1950831SQ200580014187
公开日2007年4月18日 申请日期2005年4月26日 优先权日2004年5月4日
发明者J·里曼 申请人:诺基亚有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1