提高基于表单的数据录入系统中的识别精度的方法

文档序号:6422311阅读:171来源:国知局
专利名称:提高基于表单的数据录入系统中的识别精度的方法
技术领域
本发明涉及在解释录入到基于表单的数据录入系统中的数据领域提高识别精度的方法。
背景技术
许多不同的系统需要用户通过一个或多个不同装置来交互并提供数据。在线系统包括在互联网网页上发现的那些,而离线系统包括手写表单创建,其中手写表单在以后由适合的设备来扫描和解释。其他在线系统包括语音识别系统,其中响应于特定的提示,用户被提示说话。
与亦公知为自然语言系统的这种数据输入系统有关的问题包括由于不同的用户以不相容的方式说话、书写或不然录入数据所造成的噪声和歧义。
交叉引用涉及本发明的各种方法、系统和设备被公开于本发明的申请人或受让人提交的以下共同未决的申请中。所有这些共同未决的申请的公开内容在此引入作为交叉参考。
5October 2002Australian Provisional Application 2002952259“Methods and Apparatus(NPT019)”.
15October 2002PCT/AU02/01391,PCT/AU02/01392,PCT/AU02/01393,PCT/AU02/01394and PCT/AU02/01395.
26November 2001PCT/AU01/01527,PCT/AU01/01528,PCT/AU01/01529,PCT/AU01/01530and PCT/AU01/01531.
11October 2001PCT/AU01/01274.
14August2001PCT/AU01/00996.
27November 2000PCT/AU00/01442,PCT/AU00/01444,PCT/AU00/01446,PCT/AU00/01445,PCT/AU00/01450,PCT/AU00/01453,PCT/AU00/01448,PCT/AU00/01447,PCT/AU00/01459,PCT/AU00/01451,PCT/AU00/01454,PCT/AU00/01452,PCT/AU00/01443,PCT/AU00/01455,PCT/AU00/01456,PCT/AU00/01457,PCT/AU00/01458 and PCT/AU00/01449.
20October 2000PCT/AU00/01273,PCT/AU00/01279,PCT/AU00/01288,PCT/AU00/01282,PCT/AU00/01276,PCT/AU00/01280,PCT/AU00/01274,PCT/AU00/01289,PCT/AU00/01275,PCT/AU00/01277,PCT/AU00/01286,PCT/AU00/01281,PCT/AU00/01278,PCT/AU00/01287,PCT/AU00/01285,PCT/AU00/01284 and PCT/AU00/01283.
15September 2000PCT/AU00/01108,PCT/AU00/01110 and PCT/AU00/01111.
30June 2000PCT/AU00/00762,PCT/AU00/00763,PCT/AU00/00761,PCT/AU00/00760,PCT/AU00/00759,PCT/AU00/00758,PCT/AU00/00764,PCT/AU00/00765,PCT/AU00/00766,PCT/AU00/00767,PCT/AU00/00768,PCT/AU00/00773,PCT/AU00/00774,PCT/AU00/00775,PCT/AU00/00776,PCT/AU00/00777,PCT/AU00/00770,PCT/AU00/00769,PCT/AU00/00771,PCT/AU00/00772,PCT/AU00/00754,PCT/AU00/00755,PCT/AU00/00756 andPCT/AU00/00757.
24May2000PCT/AU00/00518,PCT/AU00/00519,PCT/AU00/00520,PCT/AU00/00521,PCT/AU00/00522,PCT/AU00/00523,PCT/AU00/00524,PCT/AU00/00525,PCT/AU00/00526,PCT/AU00/00527,PCT/AU00/00528,PCT/AU00/00529,PCT/AU00/00530,PCT/AU00/00531,PCT/AU00/00532,PCT/AU00/00533,PCT/AU00/00534,PCT/AU00/00535,PCT/AU00/00536,PCT/AU00/00537,PCT/AU00/00538,PCT/AU00/00539,PCT/AU00/00540,PCT/AU00/00541,PCT/AU00/00542,PCT/AU00/00543,PCT/AU00/00544,PCT/AU00/00545,PCT/AU00/00547,PCT/AU00/00546,PCT/AU00/00554,PCT/AU00/00556,PCT/AU00/00557,PCT/AU00/00558,PCT/AU00/00559,PCT/AU00/00560,PCT/AU00/00561,PCT/AU00/00562,PCT/AU00/00563,PCT/AU00/00564,PCT/AU00/00565,PCT/AU00/00566,PCT/AU00/00567,PCT/AU00/00568,PCT/AU00/00569,PCT/AU00/00570,PCT/AU00/00571,PCT/AU00/00572,PCT/AU00/00573,PCT/AU00/00574,PCT/AU00/00575,PCT/AU00/00576,PCT/AU00/00577,PCT/AU00/00578,PCT/AU00/00579,PCT/AU00/00581,PCT/AU00/00580,PCT/AU00/00582,PCT/AU00/00587,PCT/AU00/00588,PCT/AU00/00589,PCT/AU00/00583,PCT/AU00/00593,PCT/AU00/00590,PCT/AU00/00591,PCT/AU00/00592,PCT/AU00/00594,PCT/AU00/00595,PCT/AU00/00596,PCT/AU00/00597,PCT/AU00/00598,PCT/AU00/00516,PCT/AU00/00517 and PCT/AU00/00511.
现有技术描述US 5237628描述了一种光学识别系统,其能够识别机器打印的字符但不能识别手写字符,以通过定位机器打印的域(field)标识符来定位数字图像中的表单域。一旦域已被标识,则离线手写字符识别被用于识别每个域中的各个字符。
US5455872公开了一种基于域的识别系统,其能够选择用于与表单中的特定域一起使用的分类符的最优类型(例如约束手印、无约束手印、无约束草书)。该系统使用适应性加权系统和置信值来确定要使用的最佳分类符。
US5235654描述了一种结合表单限定能力与字符识别处理器的系统。
SiberSystems提供了一种利用表单限定语言的产品,其使用人工智能技术来推断出现在表单上的不同域类型。
发明概述一般而言,本发明提供了本发明涉及一种解释输入到基于表单的数据录入系统的数据的方法,包括将所录入的数据解码成特定表单域以使其信息内容可被确定,所述信息内容处于相容机器可读格式,其中对数据的所述解码包括确定信息内容的一个或多个可能值,某些预定的可能结果被给予了相对较高的是正确的概率,并且所述预定可能结果依赖于特定表单域的前后关系。
优选地,对数据的所述解码是对所写数据或语音数据进行的。
所述解码可在线进行,其中解码与数据录入同期进行,或者离线进行,其中解码在数据录入之后的某个时间进行。
优选地,特定表单域已与之关联了可能解码数据的预定词典,并且所述词典可被用于约束解码过程以使特定解码必须存在于词典中,或者应当至少有它是这样的某个概率。
优选地,某些可能解码可被给予较高的是正确的概率。其实例可以是姓名域,其中Smith具有比Smithfield高的是正确解码的概率。
本发明的实施例所提供的优点在于,通过基于数据所录入的域的前后关系来解码数据输入,在自然语言系统中可实现对数据输入的较为成功的识别。
附图简述为了较好地理解本发明并理解如何实施它,现在将参照附图仅通过举例来描述本发明,在附图中

图1示出具有两个输入域的典型表单;图2示出具有两个不同输入域的另一个典型表单;并且图3a和3b示出两个不同但相似的手写样本。
优选实施例详述在优选实施例中,本发明被配置成与Netpage联网计算机系统一起工作,其详述在我们的共同未决申请中给出,具体而言包括2002年5月30日提交的题为“Sensing Device”的PCT申请WO0242989、2002年5月30日提交的题为“Interactive Printer”的PCT申请WO0242894、2002年2月21日提交的题为“Interface Surface Printer Using Invisible Ink”的PCT申请WO0214075、2002年5月30日提交的题为“Apparatus For InteractionWith A Network Computer System”的PCT申请WO0242950以及2003年4月24日提交的题为“Digital Ink Database Searching Using HandwritingFeature Synthesis”的PCT申请WO03034276。将理解,相对于基本系统,不是每个实施都将必然体现在这些申请中描述的所有或即使大部分特定细节和扩展。然而,该系统以其最完整的形式被描述以帮助理解本发明的优选实施例和方面起作用的前后关系。
简而言之,Netpage系统的优选形式通过利用显隐编码纸的页和光学成像笔提供了对在线信息的交互式纸基接口。Netpage系统所产生的每个页都被唯一地标识并存储在网络服务器上,并且使用Netpage笔进行的与纸的所有用户交互都被捕获、解释和存储。数字打印技术方便了Netpage文档的按需打印,从而使交互式应用被开发。Netpage打印机、笔和网络基础结构提供了对传统基于屏幕的应用和在线发行服务的纸基替换,并且支持用户界面功能性,如超文本导航和表单输入。
典型地,打印机通过宽带连接从发行商或应用提供商接收文档,其是以红外标签的显隐型式打印的,所述标签的每个都对页上的标签的位置和唯一的页标识符进行编码。当用户在页上书写时,成像笔解码这些标签并将笔的运动转换成数字墨。数字墨在无线通道上被传送到中继基站,然后被发送给网络以便于处理和存储。所述系统使用页的所述描述来解释数字墨,并且通过与应用交互来执行所请求的动作。
应用通过发行文档来提供内容给用户,并且处理用户提交的数字墨交互。典型地,应用响应于用户输入而产生一个或多个交互式页,其被传送到网络以被存储、再现和最终作为输出打印给用户。Netpage系统允许通过提供用于以下的服务来开发复杂的应用文档发行,再现和递送,经鉴定的事务处理和安全支付,手写识别和数字墨搜索,以及使用生物测定技术的用户验证,如签名校验。
本发明的实施例可在在线或离线情况下工作以解码自然语言输入数据。这样的输入数据可采取手写、口说字的形式或其他非约束的输入形式。
为描述的目的,“在线”指的是实时,即与数据输入同期而解码输入数据的系统。换句话说,解码过程能够对动态信息起作用,如组成所写字符的各种笔画的轨迹。典型的在线系统是互联网网页,其中输入例如以借助于指示笔和适当图形输入板录入的手写字符的形式被接受。
为描述的目的,“离线”指的是输入数据被记录但直到以后的某个时间不进行解码的系统。换句话说,解码仅能够对输入的静态表示起作用,如所写字符的位像。典型的离线系统是手写表单数据捕获系统,其中用户使用手写和常规笔来完成表单,并且在以后的时间,所完成的表单被扫描和处理以提取其中的编码的数据。
如已经指出的,使用自然语言输入系统为系统设计者提出了许多问题。存在大范围的不同书写风格,不但因人而异,而且甚至是在同一人在不同场合或使用不同书写工具的情况下。同样,存在语音的各种各样的口音、语调、方言和音调,每个都使得难以区分来自不同说话者的语音输入。
本发明的实施例提供了一种用于提高各种自然语言数据输入系统中的识别精度的方法。所述提高是通过基于域本身的某些属性来约束可在特定域中录入的可能数据集而实现的。在一个实施例中,约束可以是绝对的,这是因为在域中录入的数据必须在与该域关联的限定数据集中找到。
在其他实施例中,约束可以是部分的,这在因为较大的加权被给予在限定数据集中找到的数据输入。在这些情况下,如果数据条目被解码并被发现不存在于较高权重的结果的列表中,则它仍被接受,而在先前的实施例中,这样的结果将被低估(discount)。
在基于表单的数据录入系统中,表单包括一个或多个域,其每个都能够接收数据条目。在以下描述中,为方便起见,本发明的实施例将主要根据被设置成接收手写输入的系统来描述,但技术人员将认识到,其他形式的数据输入,如话音,亦可得益于本发明的实施例。
图1示出典型的表单100,其旨在从两个分离的域110、120捕获姓名信息。标志为“名字”的域110被提供以捕获来自给出其名字的用户的输入。标志为“姓”的第二域120被提供以捕获来自给出其姓的用户的输入。
在第一种情况下,关联的处理系统,不论在线或离线,能够解码输入数据,并且基于在域标志“名字”中隐含的信息来约束可能的结果。处理系统被提供有常见名字的数据库,因此当手写输入被解码时,较大的加权被给予存在于常见名字数据库中的所解码的输入的可能值。举例来说,特定的用户可被叫做“Greg”。然而,在该特定书写风格中,其名字可能看起来象是“Grey”。
图3a示出表单域中用户对其名字的再现的图形表示。图3b示出同一用户将如何再现词“Grey”,并且显然两个表示很相似,而当与“Grey”的“y”比较时,差异仅在于“Greg”中的末字母“g”的封闭的上部分。
当处理系统设法解码和解释所写输入时,较大的加权被给予“Greg”,因为这更象是合法的名字。注意在此情况下,“Grey”是将在可接受词的词典中发现但不可能展示在常见名字列表中的词。以这种方式,通过给予在其他合法词之上的对常见名字的偏好来约束数据已产生了正确结果。在可能有两个或多个结果并且全部出现在约束列表中的其他情况下,用户可被提示重新录入数据,或者被呈现选项以从可能结果列表中选择可能结果中的正确结果。
相同的过程可适合于有可能在不同表单中发现的不同域。以下非详尽示例列表详述了几个域和可被应用于解码过程以提高从给定输入产生正确结果的可能性的约束种类。当然,本领域的技术人员将认识到,根据其特定特性,不同域可具有被应用于其的前后关系约束。
域标志串 前后关系处理名字、名等 常见名字的大列表可广泛而公开地用于作为在识别期间限定处理约束的词典来使用。常常从普查数据得出的这些列表包括关联的先验概率,从而使常见名字,如“John”
和“David”被较为频繁地匹配。如果指示书写者性别的来自表单或其他地方的附加信息可用,则分离的男性和女性列表可被用于进一步提高识别精度。
注意在识别期间,可允许词汇表以外的词(即未出现在姓名词典中的姓名)以确保不常见且唯一拼写的姓名仍可被正确识别。这可通过以下而做到组合词典编码与概率语法模型(如字符元语法(character n-gram)),其包含有关通常在姓名中发现的字符序列的先验概率的信息。
姓、姓氏、家 类似于以上域,但使用姓词典。注意在西方姓名中,跨姓等 越人群通常有大得多的姓的可变性,因此词汇表以外的词的概率必须比用于名字识别高。
地址 大多数地址遵循常规型式(例如住宅号码,之后是街道名称和街道类型)。在识别进行时通过例如使用常规表达匹配或通过改变合法字符集(即数位唯一,字母唯一,“/”被允许或不被允许等),识别系统可在解码期间采用这种型式。
除此之外,地址中的一些元素亦可借助于词典来解码,如街道类型(“街道”、“路”、“场所”、“大街”、“新月形”、“广场”、“山”等)或者街道名称(常见街道名称包括“主要”、“教堂”、“北”、“主干”等)。
郊区、城镇等 郊区和城镇的完整列表可自由而公开地用于大多数地区。该信息可结合其他信息而使用,如州或邮政编码/邮区编码信息(如果可用)以进一步减少识别的可选项。
例如,如果已确认了居住国家是例如澳大利亚,则仅有用于州或区的下一级划分的七个可能值。一旦该域已被解码,则那个州/区内的郊区或城镇的进一步约束词典可被用于模仿可能的结果。
州如果国家/地区已知,则州的列表可用。每个州都可被给予人来自那个州的可能性上的先验概率对应(即大的人口多的州可被给予较高的先验概率)。如果邮政编码/邮区编码已知,则可使用进一步的约束。
电话号码 电话号码遵循可在识别期间使用的常规型式(例如“(##)####-####”)。另外,用于电话号码的合法字符集被约束到数字唯一,从而进一步限制了潜在的识别可选项。
邮区/邮政编 给定国家内的邮区/邮政编码通常遵循特定型式。例如码在澳大利亚,邮政编码总是四个数位长;在USA是五个数位;而在UK是一个或多个字母,然后是两个或多个数字,然后再次是一个或多个字母的混合。如果对应的州和郊区选项可用,则附加的解码约束可用。
国家、地区等 可能国家/地区标志的完整列表是公开可用的。
生日、出生日 所写的日期通常遵循常规型式,并具有单独由数字组成期、其他日期 或由数字和定界字符,如“-”或“/”组成的约束字符集等电子邮件、电 电子邮件地址遵循特定型式并具有适当指定的字符集。
邮、电子邮件 可被用于匹配电子邮件地址的示例常规表达是地址等“/^([a-zA-Z0-9_\.\-])+\@(([a-zA-Z0-9\-])+\.)+([a-zA-Z0-9])+$/”.
除此之外,电子邮件联系信息亦可用于用户(例如使用Microsoft Windows Messaging API(MAPI)),则电子邮件地址的列表可在识别期间被用作词典。类似地,常见电子邮件域名(例如“hotmail.com”、“yahoo.com”、“email.com”等)可被用作词典条目以指导识别。
信用卡、信用 信用卡号具有特定格式(例如“####-####-####-####”)
卡号等和约束字符集。另外,通常有亦可在识别期间被使用的验证规则(例如校验数位检验)。例如,如果对于信用卡号识别有两个等概率结果,则校验数位验证在选择正确结果中可能是有用的。
语言/现场 世界上所所说的语言列表是自由可用的,并且目前被许多网表单所使用。一旦特定书写者的语言已知,它可被用于改进对其他类型输入的处理。其实例包括用于文本识别的不同的语言特定的词典(例如英语、德语、法语等)、改变合法识别字符集(例如允许一些西欧语言所使用的重音字母),以及改变用于日期识别的格式。
除了使用公用或专用词典以外,特定域标志亦可随着时间的过去而编制其自己的词典,从而使用先前识别的响应来指导和约束未来的数据条目。以这种方式,采用本发明实施例的系统可提高其识别能力,这是因为它们随着时间的过去而起作用,并且“学习”解码过程的较为可能的结果。以这种方式,例如随着时间的过去而变得较为普及的姓名可被给予较高的先验加权。
大多数表单限定格式支持许多不同的域类型,如文本域、选择列表域、组合域(即组合文本输入与选择列表的域)、签名域、复选框、按钮等。域类型给出期望输入数据类型的某种指示(例如文本输入域指示文本条目)。如果文档格式允许数据类型被明确限定(例如XML/XForms),则识别系统可使用该信息来约束识别过程。
除了域类型以外,表单常常还包含有关在每个域中应录入的数据类型的信息。该信息通常被包含在与特定域关联的属性中。其一个实例是一般与列表输入域关联的选择串的集合。这些串表示用户必须从中做出选择的选项,并且可在识别期间被用作词典元素。类似地,对组合域的识别可与字符语法组合而使用选择串的词典以允许识别除了在选项列表中所列的那些以外的词。
标准的输入域亦可包含可在识别进程(procedure)中进行帮助的属性。例如,一些输入域类型具有旗标,其指示所录入的值必须是数字的,从而向识别系统表示所识别的字符集应仅包括数位。输入域亦可包含掩码属性,其是指示输入必须匹配指定型式的串(例如,“####AA”需要录入四个数位,然后是两个大写的字母顺序的字母,如“2002CY”)。该掩码可被用于在串中的每个偏差处约束合法识别字符集并由此提高识别精度。
许多表单指定可被用于指导识别过程的验证参数。例如数字输入域可指定可被用于约束识别结果的最小和最大值。其他域可约束当用户已将值录入到域中时执行的验证程序码(例如JavaScript)。该码可被执行多次,其中每个单独的识别结果作为一个参数,从而允许放弃不符合验证要求的潜在可替换结果。
除了使用标准表单域属性来改进识别过程以外,还可通过使用定制属性将识别特定的信息添加给域。该信息仅当使用识别系统来处理表单输入时被使用。这样,表单仍可在需要时正常使用(例如通过网浏览器使用键盘进行的数据录入),这是因为定制属性被忽略;然而,如果需要识别,则定制参数可被用于改进识别结果。
定制域属性的一些实例包括字符集定义(其中用于域的合法字符集被明确定义)和常规表达。如果使用视觉线索来显示或打印域以指导字符间距(例如表单上的框,其中每个框必须包含单个字符),所述指导的参数可与域关联为定制属性以帮助手写识别的字符分割阶段。例如,通过指定边界长方形的坐标和使用字符框用于输入的域中的行和列的数目,可向识别系统通知每个字符的期望位置,从而允许进行较为精确的识别。
有关前后关系处理和语言模化的信息亦可被编码于定制属性中。一些手写识别系统使用语言模型的组合来帮助识别手写文本(例如元语法字符模型,标准词典,用户特定的词典)。这些模型通常使用一组加权来组合,该加权指示使用每个指定模型将正确解码输入词的可能性。然而,当可根据期望输入来定制加权时产生最精确的结果。通过包括语言模型权重来作为用于域的定制属性,可通过在每表单或甚至每域的基础上调节模型权重来实现较为精确的识别。
为允许对识别进程的较多控制,定制验证程序码(例如JavaScript)可与域关联,其在已完成手写识别进程之后在每个潜在结果上执行,从而允许选择最适当的结果。然而,不是使用布尔验证函数(即串合法或无效),该函数可返回指示所述串将被录入的概率的置信值。该概率可与字符分类进程组合以选择最适当的识别结果。以这种方式,即使解码结果具有与之关联的低置信值,如果其他检验确认它是有效响应,则它仍可被系统接受。简单的布尔途径可导致合法输入被低估。
对该方案的改进是在系统识别每个字符时定义由识别者调用的语言模型概率函数。这允许识别系统在识别进程中在早期剪除不可能或无效的识别串,从而允许高效地识别长文本串。在识别进程中,通过考虑所识别的字符的不同组合而产生了大量的潜在结果。典型地,对于每个字母位置,有大量的潜在字符可选项。结果,识别系统通常使用定向搜索(beamsearch)技术,从而使每个字母位置处的n个最佳可选项被考虑,其中n典型地处于10和100之间。这样,每个位置处的n个最可能的结果被存储,而其余的被放弃。
然而,在每个步骤选择n个最佳结果需要在每个步骤而不是在已完成识别进程之后来自语言模型的验证,否则被语言模型限定为不可能或未必可能的高得分串可被保留而有效但低得分的串被放弃。结果,经改进的语言模型函数应当能计算和返回子串概率,从而使识别者可在每个步骤组合字符分类概率与子串概率,并由此选择n个最可能的串。这种灵活途径允许实施几乎任何语言模型,包括词典和字符马尔可夫模型。
以下部分描述如何提取数据以用于各种一般使用的表单定义格式,包括HTML、XForms和PDF(Adobe可移植文档格式)。
超文本置标语言(HTML)是标准的置标符号集,其被用于定义想要显示在万维网浏览器中的文本和图形页的格式。HTML是万维网联盟(W3C)的正式推荐,并且被定义在1999年12月24日的W3C“HTML4.01规范”中。XHTML,作为XML应用的HTML的改订,与HTML很相似,并且被定义在2002年8月1日的W3C“XHTML 1.0可扩展超文本置标语言(第二版)”,并且类似地,SGML,其被定义在ISO“信息处理-文本和办公系统-标准通用置标语言(SGML)”,1986年的ISO8879。
用于表单的一些示例HTML代码在以下给出(该代码可在浏览器中产生的输出的实例在图1中给出)。
<html>
<form ACTION=″cgi-bin/form.exe″METHOD=post>
<p><b>Please Enter Your Name</b></p>
<p>First Name<INPUT TYPE=″TEXT″NAME=″FirstName″CUSTOM=″Hello″></p>
<p>Last Name<INPUT TYPE=″TEXT″NAME=″LastName″></p>
<p><INPUT TYPE=″SUBMIT″NAME=″Submit″></p>
</form>
</html>
通常,与输入域关联的域标志可从HTML文档源容易地得出。一般而言,域标志紧接着在输入域定义(如以上所示)之前出现为正常文本。在其他情况下,再现文档的布局可被分析以确定哪些文本标志应与哪些输入域关联(例如当表被用于表单布局时)。另外,与许多输入元素关联的“姓名”属性可包含将允许确定域类型的文本。
标准HTML包含许多元素,其可被有用地用作对识别系统的暗示。一些实例包括·可被用于限制识别文本的长度的INPUT元素的“最大长度”属性,·表示有效输入串集的与SELECT元素关联的OPTION元素(其可在识别期间用作词典条目),以及·可被用于限定字符间距指导的TEXTAREA元素中的“行”和“列”属性(例如加框输入,其中每个字母必须被写在分离的框中)。
除此之外,定制属性亦可被容易地添加给HTML域元素(例如CUSTOM=“Hello”),这是因为处理一个页的浏览器和其他系统必须忽略未知的属性。以这种方式,表单设计者可将定制元素添加给HTML源代码,其将仅由识别系统使用并将被“哑”浏览器安全地忽略。
XFORMS是标准的表单定义语言,其由W3C定义并描述在2002年8月21日的“XForms 1.0”W3C工作草案中。XForms已被发展为HTML表单的后继者,并且通过允许相同的表单在台式计算机、手持装置、信息设备甚至是纸上起作用来实施装置独立的表单。为此,与HTML不同,XForms确保了数据定义被保持与演示分离。XForms代码的实例在以下给出。该代码可在浏览器中产生的输出的实例在图2中给出。
<xform>
<submitInfo action=″form.exe″method=″post″/>
</xform>
<input xform=″payment″ref=″cc″>
<caption>Credit Card Number</caption>
</input><input xform=″payment″ref=″exp″>
<caption>Expiration Date</caption>
</input><submit xform=″payment″>
<caption>Submit</caption>
</submit>
以与HTML类似的方式,可通过检查输入域定义中的标题元素从XForms代码得出域标志。除此之外,XForms亦支持类似于先前针对HTML所述的输入域元素,包括列表选择元素“<selectOne>”和“<selectMany>”和关联的“<item>”元素,其可在识别处理期间用作词典条目。
XForms规范包括用于域输入的数据类型集,包括日期、货币、数字、串、时间和URI类型。该信息可由识别系统用于提高识别精度。类似地,所述规范包括数据属性(例如当前值(currency)、小数位、整数等)和验证属性(最小值、最大值、型式、范围),其可被用于进一步改进识别结果。
可移植文档格式(PDF)是Adobe定义的文档格式,其已成为用于基于互联网的文档发布的事实上的标准。最近,Adobe已添加了交互式元素,其允许用于在线使用的表单定义。
象HTML和XForms一样,PDF表单元素具有特定类型(例如文本、签名、组合框、列表框),其限定元素的表现并由此可被用作用于手写识别系统的指导。它们亦包含域名称(例如“/T(名字)”),其可包含指示要录入到域中的数据类型的有用标志。列表和组合域包含限定有效选择串的选项集(“/Opt[(Option1)(Option2)]”。
附加域属性包括格式区分符(例如数字、百分比、日期、时间、邮区编码、电话号码、社会保障号等)以及当数据已被录入到域中时执行的JavaScript验证码。定制属性亦可被容易地结合在域定义中,如以上所示(“/CUSTOM ATTRIBUTE(Hello World)”)。
可使用适当的经编程和设定条件的微处理器来实施本发明的实施例。这样的微处理器可形成专门设计用于在字符识别环境下工作的定制系统的一部分,或者它可以是通用计算机,如台式PC、其亦能执行其他较为一般的任务。
根据以上描述,对本领域的普通技术人员将显然的是可在本发明的范围内进行各种修改。
本发明包括在此明确公开的任何新特征或特征组合或者其任何通用化形式,而不管它是否涉及要求权利的发明或解决所针对的任何或所有问题。
权利要求
1.一种解释输入至基于表单的数据录入系统的数据的方法,包括将所录入的数据解码成特定表单域以使其信息内容可被确定,所述信息内容处于相容机器可读格式,其中对数据的所述解码包括确定信息内容的一个或多个可能值,某些预定的可能结果被给予了相对较高的是正确的概率,并且所述预定可能结果依赖于特定表单域的前后关系。
2.如权利要求1所述的方法,其中对数据的所述解码是与数据录入同期而进行的(在线)。
3.如权利要求1的所述的方法,其中对数据的所述解码是在数据录入之后的某个时间进行的(离线)。
4.如前述权利要求的任何一项所述的方法,其中数据录入是通过手写字符和话音之一或两者来实现的。
5.如前述权利要求的任何一项所述的方法,其中特定表单域已关联了其可能解码数据的预定词典,所述词典被用于约束解码过程。
6.如权利要求5所述的方法,其中词典中的某些条目被指定了是正确解码数据的较高概率。
7.如权利要求5或6的任一项所述的方法,其中所述域是姓名域,并且预定词典包括与所选姓名关联的性别的指示。
8.如权利要求5或6的任一项所述的方法,其中所述域是地址域,其具有分等级设置的子域以使子域中的被解码条目可被用于约束另一个子域中的条目。
9.如权利要求5或6的任一项所述的方法,其中所述域是电话号码域,并且被约束以使唯一有效数据仅包括数字。
10.如前述权利要求的任何一项所述的方法,其中所述域是信用卡号,其中唯一有效数据包括固定数目的数字,所述数字进一步可通过使用校验和来校验。
11.如前述权利要求的任何一项所述的方法,其中所述域来自包括以下的组邮区/邮政编码;国家;日期;电子邮件地址;和/或语言。
12.如前述权利要求的任何一项所述的方法,其中所述系统是使用以下标准化文件格式之一来实施的HTML、XML、PDF和XForms。
13.如前述权利要求的任何一项所述的方法,其中定制验证程序与所述域关联,该定制验证程序在一可能值上被执行。
14.如权利要求13所述的方法,其中定制验证程序是JavaScript程序。
15.如前述权利要求的任何一项所述的方法,其中域掩码与所述域关联,该域掩码检验可能值符合预定串型式。
16.如前述权利要求的任何一项所述的方法,其中可能值从选择列表或组合列表得出,包含先前识别的响应。
全文摘要
本发明涉及一种解释输入到基于表单的数据录入系统的数据的方法,包括将所录入的数据解码成特定表单域以使其信息内容可被确定,所述信息内容处于相容机器可读格式,其中对数据的所述解码包括确定信息内容的一个或多个可能值,某些预定的可能结果被给予了相对较高的是正确的概率,并且所述预定可能结果依赖于特定表单域的前后关系。
文档编号G06K9/00GK1705958SQ200380101486
公开日2005年12月7日 申请日期2003年10月10日 优先权日2002年10月15日
发明者乔纳森·利·纳珀, 保罗·拉普斯顿 申请人:西尔弗布鲁克研究有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1