以字典为基础与可能的字符串结合的手写物识别方法

文档序号:6408451阅读:158来源:国知局

专利名称::以字典为基础与可能的字符串结合的手写物识别方法
技术领域
:本发明是1993年12月1日提交的序列号是08/160,519的专利申请的继续部分,该专利申请引用在这里作为参考。本发明涉及手写物识别。所谓的个人数字辅助件,例如EO和Newton产品,一般具有一个触摸敏感屏幕,用户能在其上排版手写物。这些设备的作用是将手写字符输入进行数字化。起着接收手写输入功能的其它设备包括但不局限于台式计算机、调制解调器、寻呼机、高级电话机、数字或交互式电视设备、以及具有接入到能接受手写字符输入的数字化输入卡(digitizingtablet)的其它信息处理设备。还有能借助传真或扫描输入接收手写字符输入的其它设备。这些设备处理信息以尝试识别手写字符输入的信息内容,并将该信息显示给用户以便在处理过程中反馈、更正错误和识别手写字符输入。按照另一种先有技术的方法,访问一个字典,并将字典中的条目与最初的手写物分析结果相比较。使用这种方法,在字典中寻找那些最接近符合手写物样品特征的条目。与表示包含在字典中信息的手写物样品一起使用时该方法使用得相当好。然而,经常手写输入不在字典中。例如,固有名称、地址位置、缩写词和专业术语一般不包括在这类字典中。另一方面,扩大字典范围以实际上包括所有字和缩写词的方案,又因所需存储器的数量以及支持全部检索这样一种扩大范围的字曲所必须的计算总开销,故而目前这是一个不令人满意的解决方案,这使该方法变得很不实用。该先有技术的另一个问题是识别数据手写输入。许多数字与字典中可能存在的单词非常相似(例如,“15”可能很容易与“is”混淆)。写入“15”时,一个以字典为基础的系统将不能正确地识别“15”。据此,现在需要某种允许该输入能被正确地识别并给用户提供该手写字符输入的一个可能译文的方法。先有技术的手写物识别技术的另一个问题是数字化的手写字母数字输入已被分析后将它显示给用户时所采用的格式。具体地说,当输出含有错误时,先有技术显示输出的方法是混乱的。在许多情况下,用户记不住他们写了什么,也不意识输出中的错误以改正它们。据此,现在需要一种能避免或将这些局限性减小到最低程度并且同时按照允许用户直接参照他们预想的手写输入更正任何错误的格式给出信息的手写体识别技术。图1示出适合于支持按照本发明操作的个人数字辅助设备的俯视图。图2示出详细说明本发明的操作的流程图。图3示出详细说明本发明的操作的流程图。图4示出本发明的示例性显示的顶部平面图。图5示出本发明的示例性显示的顶部平面图。图6示出本发明的优选实施例的示例性显示的顶部平面图。图7示出本发明的优选实施例的示例性显示的顶部平面图。图8示出本发明的优选实施例的示例性显示的顶部平面图。按照一个优选实施例,利用字典条目比较和最可能的字符串分析技术来开发支持一种手写体识别过程的候选字。经两个过程产生的字最后选择作为识别字。按照本发明的一个优选实施例,手写字母数字输入和识别字同时地并且相互靠拢并列地被显示出来。这样靠拢并列能使用户在处理过程中更改错误以及手写字符输入识别时参考它们原始的手写输入。参考图1,个人数字辅助设备以参考数字100表示。所描绘的个人数字辅助设备(PDA)(100)构成一个通用的代表,可以包括例如本
技术领域
中已知EO或Newton个人数字辅助设备。这类设备一般包括一个外壳(101)和一个触摸屏幕(102),用适当的手操纵笔尖可在该触摸屏上手写字(103)。这类设备一般包括一个或多个微处理器或其它数字处理设备。为此,这些设备包括计算平台,能够很方便地按照本文的教导进行编程。可以理解这样的个人数字辅助设备包括一个准备好的平台,以接纳申请人的教导的实践,这里呈现出的教导也可以在许多其它操作环境实践。这样的环境的例子包括带有数字化屏幕或连接到数字化输入表面或能够接收传真的或扫描的图象输入的计算机,交互式电视,或能捕获手写输入并对其进行处理的其它系统。现在参考图2,这里公开了根据本教导的该设备的一般操作。当在触摸敏感显示器(102)上接收手写体形式的输入(200)时,本实施例中在PDA(100)上执行的手写体识别方法分析该手写体,以便提供(201)一个或多个候选字符,这些字符可以代表组成的字母数字字符,其中包括该手写输入。因在前面提到的EO和Newton产品中知道了这些例子,故这样的手写体分析技术在该
技术领域
中是可以理解的。下一步,该过程通过将字典的内容与候选字符的各种组合相比较并提供具有正确的相应可能性的这些不同的字典条目来辨认(202)一个或多个候选字。然后辨认最高可能性的条目作为候选字。(在一些应用中,可能适合于将其全部条目的每个条目与候选字符比较。在其它应用中,特别是处理容量有限的应用中,除非局部比较产生了至少一个准确表示的可能性门限,可以将每个字典条目只与候选字符的每种组合的一部分进行比较)。这种以字典为基础的方法在该
技术领域
中是可以理解的,因此这里不再对其做进一步说明。在使用字典条目辨认候选字的步骤(202)期间,该过程也辨认表示输入的最可能的字符串和表示数字和/或标点的最可能的数字字符串,在一个优选实施例中,该数字字符串包括最可能的数字串,该数字和/或标点是从数集0至9和普通数字标点,例如$和%中选取的。因此,拟定出一个字符串,其中经这样辨认的每个单独的候选字符具有单个的高准确的可能性。拟定第二个数字和标点串,其中经这样辨认的每个单独的候选数字和标点具有各自的高准确的可能性。重要的是,最可能的字符串和最可能的数(数字和标点)串这两者的拟定是不依赖任何字典条目进行的。辨认最可能的字符串或最可能的数串时不与字典条目进行比较。在这个特定实施例中,虽然不使用字典条目,但为了开发最可能的字符串,申请人利用字符的三字母组统计,考虑了具有准确的、可能性最高的个别候选字符组合。例如,通过参考该统计分析,申请人能够利用统计出的英文单词中字母组合“QUI”比“QXZ”更有可能出现的事实。三字母组统计分析用在单词识别中在本技术中是可以理解的,因此这里不需要对其做进一步说明。具体来讲,该过程辨认(202)如所开发的、参考字典的候选字,在不参考字典的情况下,辨认个别的和组合地表示字符串的可能的字串,该字串看起来最可能代表输入,和在不参考字典的情况下,辨认个别的和组合地表示数位、数字或标点的串的可能的字串,该字串看起来最可能代表输入。然后该过程提供(203)候选字、可能的字符串、以及可能的数位、数字或标点的串的表,供以后使用。现在参看图3,个人数字辅助设备访问这个表(300)并根据某个适当的度量标准从中选择(301)一个字。例如,在某些应用中,最好可以总是(或几乎总是)选择准确的可能性最高的候选字。在其它应用中,最好可以加重地加权选择最可能的字符串或最可能的数字串之中的一种或这两种。从许多候选字中自动选择时所应用的各种标准和技术在本
技术领域
中是可以理解的,这里不需对其做更详细的说明。从该表中已选择的选定字提供(302)给用户。一般地,在前面提到的显示屏幕(102)上将这个选择的字提供给用户。在过程中的一个错误导致提供错的选择字的情况下为能使用户回来查阅他们的原始手写输入,每个选定字601立即显示在所对应的原始手写输入的重绘副本603下面。每个选定字对准重绘输入的正下方。此外,根据手写体输入的原始坐标重绘原始输入,以维持一个输入行中的字的相对位置,向用户提供该原始输入的强烈的视觉提示。在图6中将对其说明。然后,用户可以表明一个需要,以使前面提到的表显示出来(303)。例如,在现有的个人数字辅助设备中,用户能在显示屏幕上表示该兴趣。(当然,如果用户没有表示显示(303)该表的兴趣,该过程结束(304)。当用户确实表示要求显示该表的兴趣时,该表被显示(305)在显示屏幕(102)上。显示该表时,用户有连续的机会结束该过程(306)。直到结束发生为止,该过程监测用户从表中选择不同的字。从表中选择不同字时,该过程用新选字代替(308)前面选择的字。然后,新选字紧靠近原始手写输入的图象显示。随着以后对包括前面选择的和未选择的各种字的选择,该过程能够重复,直到用户最后结束该过程(306)。结束(306)时,该过程确定(309)现在选择的字是否构成最可能的串。若是,在结束(311)前,该过程自动更新字典(310)以包括该可能的串。因此用户将确信新字被加到字典中,并在此后可用于与今后的手写输入进行比较。再参考图1,为了举例,假设用户已经在显示屏幕(102)上输入手写字“Fred”(103)。按前面所述对该输入进行分析,提供一个候选字表最可能的字符串,而在优选实施列中,如图8所示的将提供最可能的数字或标点串。如图4所示,该过程从表中选择一个最可能的相似,并给出该相似。特别是,在该优选实施例中,识别出的字“free”(401)靠近并列于原始输入(103)显示。如图6所示,显示出原始手写输入(603)的重绘副本。选定字(601)立即显示在所对应的手写输入(603)的重绘副本下方。每个选定字(601)最好正对其对应的手写输入(603)的下方。现在假设用户表示了查看该表的请求。图5描绘了一个样表的显示。在一个适当的窗口(501)中,经查阅字典拟定的候选字出现在窗口(501)的一个区域(502)中,如前面所述和图7所示。在该特定实施例中,候选字以小写字母和字首字母大写两种形式出现。在该特定例子中,字典中不包括单词“Fred”,因此单词“Fred”未出现在窗口(501)的这个区域(502)中,如图7所示。该实施例中,一条线(504)将第一区域(502)分出另一个区域(503),如前所述,最可能的字符串显示在窗口(501)的该不同区域(503)中。在该例子中,最可能的字符串中包括字“Fred”。该表按组成该表中条目是正确的可能性的顺序显示,最可能的条目第一个出现。在图8所示的优选实施例中,可能的字符串(810)和可能的数字串(815)(数字和标点)显示在窗口(501)一个分开的区域中。根据表示最可能的字符串(810)或最可能的数字串(815)实际上正确的概率如何的可信值,显示可能的选择的过程能够评估是否都不显示、显示一个或两个串。进行这个确定的方法可以各个实施例不同以适应所讨论的任务。例如,如果所讨论的任务中手写输入包括数字或标点的可能性高,每当要求观看该表(820)时,可以设定该过程显示一个可能的数串。本发明可设定显示可多可少的任选项。对于用户,五个任选项是适宜的数量,并且几乎总是包括正确答复。根据任选项的识别得分按优先次序将其排列,识别得分由识别器产生,是表示每个选择对象可能性如何的量度。根据识别器产生的同一可信量度选择可能的字符串和可能的数字串,这样,如果得分低于一个门限,该字串将不被显示。选择的可能的字串是按先是可能的字符串(如果出现),随后是可能数字串(如果出现)的顺序显示的。最后,按照优选实施例以及如图5、7和8所示,窗口(501)的另一部分(505)提供当前被选字的描绘。如果用户要选单词“Fred”,则包括单词“Fred”的字符将出现在所示的空格中,因此,出现“Fred”作为当前的被选字(505)。本发明总是打开窗口,交替的带有来自识别器显示在字符框中的最高可信值。当前被选字总是在所示的空格中表示。如图8所示,假设输入是数字,当显示可能的数字串时,显示的数字或标点值不是随机的,它是识别器输入的最好的译文。由于用户可以和其它输入一致地写数字,例如当写地址或送出一个带电话号码的便条,因此这是计算每个输入。如果数字或点值的得分足够高,将其作为优先选择显示在输入的下方;若不是,则只有当用户要求查看字选择或表时才显示。由于许多数字看起来象单词,因此本发明计算数字译文。例如,“15”看起来象单词“is”,因此识别器要为用户产生并显示两个选择。通过上面给出的教导规定得到有益和有利的数字。所述的实施例利用字典分析和最可能的字串分析制定一个可能一致的表,因此将会发现累加表中正确一致的可能性提高。再则,通过从表中把以字典为基础的候选字与最可能的字串分开,可获得更大的灵活性。例如,如果用户应该通过查阅字典拟定的候选字中选字,能够做出被选字拼写正确的坚定的推论,而且该过程能进行自动地关闭窗口,因此节省用户的时间和关闭窗口的麻烦。另一方面,虽然用户选择最可能的字符串可以代表表中最符合原始输入的字符串,但是拼写不正确的可能性仍然存在。在选择最可能的字串之后能保持窗口打开,以便为用户更好地提供进行少量拼写更正的能力和机会。当然,这样的更正可以以个别的字符为基础来进行,或用整个词来替换。此外,如有必要,也可以进行一种附加的可能的串分析,以结合如上所述的其它字一起提供附加的字母的或非字母的串。权利要求1.一种方法,其特征在于,包括以下步骤接收手写输入(200);分析手写输入提供多个候选字符(201);访问一个字典并至少将字典中的一些条目与候选字符的至少一些组合进行比较以辨认可能代表该输入的候选字(202);在不涉及字典的情况下,将组合的、对应是正确的、可能性最高的候选字符的组合辨认为可能的字符串(202);辨认数字或标点值的可能的数字串(202);提供一个表(203),包括至少一个候选字;当可能的字符串不是候选字之一时的该可能的字符串,否则在表中提供;和可能的数字串。2.一种方法,其特征在于,包括以下步骤接收来自用户的手写输入(103);分析手写输入提供多个候选字符(401);访问一个字典并至少将字典中的一些条目与候选字符的至少一些组合进行比较以辨认可能代表该输入的候选字(501);在不涉及字典的情况下,将组合的对应是正确的可能性最高的候选字符的组合辨认为可能的字符串(503);提供一个表(502),包括至少一个候选字;当可能的字符串不是候选字之一时的该可能的字符串,否则在表中提供;和可能的数字串;选择表中的一个字以提供一个被选字;将该被选字提供给用户。3.根据权利要求2所述的方法,其特征在于,进一步包括步骤从用户接收表示显示至少部分表的请求的输入;显示至少一个候选字,以及当可能的字符串不是候选字之一时的该可能的字符串,否则在表中提供。4.根据权利要求3所述的方法,其特征在于,进一步包括步骤从用户接收表示选择可能的字符串的输入;自动地更新字典以便包括该可能的字符串。5.根据权利要求2所述的方法,其特征在于,分析手写输入提供多个候选字符的步骤包括确定该多个候选字符中至少一些候选字符是正确的可能性的步骤。6.根据权利要求2所述的方法,其特征在于,访问一个字典并至少将字典中的一些条目与候选字符的至少一些组合进行比较以辨认可能代表该输入的候选字的步骤包括将字典中的所有条目与候选字符的至少一些组合进行比较以辨认可能代表该输入的候选字的步骤。7.根据权利要求6所述的方法,其特征在于,将字典中的所有条目与候选字符的至少一些组合进行比较的步骤包括至少将每个条目的一部分与候选字符的每种组合的至少一部分进行比较的步骤。8.根据权利要求2所述的方法,其特征在于,将组合的对应是正确的可能性最高的候选字符的组合辨认为可能的字符串的步骤包括确定单个候选字符准确性的可能性。9.根据权利要求8所述的方法,其特征在于,将组合的对应是正确的可能性最高的候选字符的组合辨认为可能的字符串的步骤还包括用字符的三字母组统计确定的结果确定单个候选字符的哪一个组合具有准确的可能性最高的步骤。10.一种方法,其特征在于,包括以下步骤接收来自用户的包含多个字符的字的手写输入(200);分析该输入提供可相应于包括该字的字符的多个候选字符(201);自动访问一个字典并至少将字典中的一些字的条目与候选字符的至少一些组合进行比较以辨认可能代表该字的候选字(202);在不涉及字典的情况下,自动将组合的对应是正确的可能性最高的候选字符的组合辨认为可能的字符串(202);自动辨认具有数字或标点值的可能的数字串(202);提供一个表,包括(203);至少一个候选字;当可能的字符串不是候选字之一时的该可能的字符串,否则在表中提供;和可能的数字串;选择表中的一个字以提供一个被选定(301);将该被选字提供给用户(302);从用户接收表示显示至少部分表的请求的输入(303);显示至少一个候选字,以及当可能的字符串不是候选字之一时的该可能的字符串否则在该表中提供(305)。全文摘要在手写体识别过程中,一个候选的识别字表被辨认为字典条目与被识别字符组合的各种组合比较和通过不查阅字典拟定的最可能的字符串分析的函数。该过程从表中选择(301)一个字并将该字呈现(302)给用户。于是用户有显示(303)该表的任选项。当显示该表时,通过查阅字典拟定的候选字以最可能的字符串和最可能的数字串分开的方式显示。用户可通过从该表中选择来改变所选的字。当用户选择最可能的字符串作为被识别的手写输入的正确表示时,该过程自动更新(310)字典以包括最可能的字符串。当用户最可能的数字串时可能发生同样的过程。文档编号G06K9/22GK1117319SQ94191064公开日1996年2月21日申请日期1994年11月10日优先权日1993年12月1日发明者约翰·L·C·塞伊鲍尔德,克里斯·A·科奇申请人:摩托罗拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1