特别用于信息管理工具的改进的辅助输入方法和系统的制作方法

文档序号:6479129阅读:166来源:国知局
专利名称:特别用于信息管理工具的改进的辅助输入方法和系统的制作方法
技术领域
本发明涉及用于在数据管理软件中(特别是通过自动整合)辅助输入输入数据的 方法。
背景技术
现有技术的方法例如涉及通过识别纸件形式的结算记录(通常为账单)中含有的 光学信息,在信息化的结算系统中进行结算记录的数据流整合。在图1中示出这样的已知方法的具体示例。参考图1,当期望将数据自动整合到企 业资源计划(ERP)数据中时,需要产生能够被整合到软件包中的结构化数据流。该数据流 通常具有两种可能的类型数据流来自具有适当规定的标准文件格式(EDIFACT、XML、PDF、 文本、表格文件等)的EDI类型的电子传输系统,然后被处理成关口软件包的输入规格;或 者数据流来自ADR系统(用于“自动文档识别”)并且被处理成关口软件包的输入规格。因此,处理串如下纸件-> 扫描仪一 >0CR_>域提取_>待整合的数据结构_>安全登录_>数据管理 软件。然而,在这样的方法中,通常要处理可靠性缺陷(扫描错误或者不完整数据)、不 完整数据和/或存在特定情况。这就是输入数据需要由操作员验证或者人工更正和/或由操作员额外人工输入 以实现确定地整合到软件的结构化数据流终点中(特别是在针对第三方的管理的情况下, 对于比较目的、分析工作、结算工作等)的原因。使得在数据流被发送至软件后需要第二次 验证,以补充和/或验证该软件中的数据整合。在终点软件(例如软件包)除了提供在系统键盘辅助下在输入域中输入之外,仅 提供允许在系统中引入数据的不完整的、较弱的(在关口方面甚至不存在)机会的情况下, 出现另一类型的困难。这种情况例如为其代码是保密的已有软件(例如有主软件),并且结 构化数据流的整合能力很差,甚至不存在或者文档提供很差。此外,该类型方法实际上在关于原始数据进行修正时不提供对终点软件包的反 馈。通常,软件包的反馈类型限于错误代码,通常是实时的,验证软件未实现任何学习。因 此,在软件中引起的修正在结构化数据流的准备中通常不予考虑。

发明内容
本发明的目的在于,克服现有技术的限制,并且特别在于克服数据管理软件包缺 乏关口输入的情况,甚至在于克服低质量的服务,或者克服缺乏来自这样的关口的机会 (例如缺乏关口反馈)的情况。本发明的另一目的在于,简化和优化通常必要的作为补充的人工输入,以赢得生 产时间,这特别是通过将所述人工输入成组在一起组成具有更正步骤/OCR模块验证的处 理的单个点实现。
本发明的另一目的在于,在不使整个处理复杂化的情况下,授权进行丰富输入。最后,本发明的目的在于,利用这些丰富,以提高用于馈送辅助输入的数据提取的质量。为此,提出装备软件包输入界面,以使其具有三个角色,即自动或半自动整合关 口,允许附加输入的屏幕,以及最终作为信息源(即,已经包括在管理工具中的和/或从用 于丰富初始提取的操作者动作和对原始数据源执行的加工处理中获得的数据,以永久性改 善这些处理)。因此,本发明允许使用软件输入屏幕,作为软件中的自动或者半自动输入关口。因 此实现在软件包输入屏幕处的功能性丰富增添。实际上,软件输入屏幕因此成为软件的安 全的登录。更特别地,本发明特别为信息管理工具提供用于辅助输入的方法,该管理工具在 具有配备了设备服务的操作系统的信息系统中执行,其特征在于,该方法包括以下步骤(a)从外部源输入原始数据,(b)从所述原始数据提取相关数据,(c)使用所述设备服务以向属于管理工具的已有输入界面的相应域记录所提取的 数据,以实现附加输入和整体验证。通过术语“设备服务”,表示一组由操作系统及其开窗模块或者任何办公环境提供 的特征。这些服务包括下述若干特征-探究界面窗口的软件结构以通过编程确定其构成(例如,发现窗口包括菜单、 “ok”按钮、若干输入域,发现什么样的域或者什么样的文本包括什么样的值,等等)的机

石1_确定和/或被告知用户动作(按下键、点击按钮,等等)的机会,以及-确定和/或被告知界面状态变化(当按下特定的键例如“回车”键时,确定前端 窗口、确定光标位置、确定默认功能,等等)的机会,以及-模拟用户动作的机会,如输入键、鼠标点击,以及移动和改变窗口大小、移动焦
pJj绝绝 ΛΛ j寸寸ο所有这些操作的联合使用允许完全实现输入屏幕。特别地,通过操作系统功能调 用、API (应用程序接口)能够实现这些设备服务。下文为该方法的一些有益方面但非全部方面*设备服务特别允许发现已有输入屏幕的样式和内容,以及允许模拟用户动作;*在记录步骤之前,该方法包括所提取的相关数据的、以预输入域组织的显示步 骤,以便实现其预验证;*提取步骤包括将纸上的图像数字化成数字图像,或者结构化文件或根据预定 的描述语言描述的文件的读取步骤;*提取步骤包括光学字符识别或者文档转化,得到列出的字母数字元素及相关坐 标,或者包括词汇和句法分析;*该方法还包括通过使用基于提取规则而提取出的数据的鉴定验证;*步骤(b)包括通过使用基于规则的预输入,为各预输入域分配可能的值;*通过调用操作系统级和管理工具级的API函数以模拟管理工具的输入模块域的输入,执行记录步骤(C);*该方法还包括将在管理工具的已有输入模块中人工输入附加数据的步骤,以及 根据附加数据进行的预输入规则库和/或提取规则库的丰富步骤;*该方法包括同时在第一显示区域中显示原始数据表示、在第二显示区域中显示 预输入域以及在第三显示区域中显示已有输入模块的输入屏幕的步骤。本发明还提供信息系统,包括中央处理单元、程序和工作存储器、输入装置和显示 装置,其特征在于,该系统包括能够执行如上限定的方法的程序。


通过阅读下文中对本发明优选实施例的详细描述(作为非限制性示例给出并且 参考附图进行),本发明的其他发面、目标和优点将变得更加清楚,附图中图1为根据现有技术用于辅助输入的方法的示意图;图2为根据本发明用于辅助输入的方法的示意图;以及图3至图6为通过根据本发明的用于辅助输入的方法获得的屏幕图像的示例。
具体实施例方式
现在将通过参考本发明的经典应用的示例详细描述本发明,所述经典应用为自动 将供应商账单的内容并入ERP。参考图2,根据本发明的辅助输入的输入数据涉及以下步骤序列1)从其外部源输入原始数据,这是a、通过将纸上的图像转换成数字图像的扫描仪进行,b、或者通过读取例如为EDIFACT或XML类型的或者根据PDF、XPS、Postscript等 类型的页面描述语言所描述的结构化文件的接收自动机进行;2)从原始文件中提取相关数据,这是a、通过能够在所扫描文档的图像中找到文本要素及其位置的光学字符识别(OCR) 模块进行,b、或者通过用于PDF、文本、PostScript、XPS类型的文档的转换程序(例如为 PSF2XML类型)进行,所述程序允许将文档变换成文本式片段列表,所述片段与其在文档中 的X、Y坐标相关;C、或者通过关于XML类型的结构化文件的词汇和句法分析进行。3)数据的鉴定借助于已有规则库,该规则库以人工方式提供,然后由用户丰富,通 过这样,程序能够将彼此隔开的每个域的语义与合适的可信度结合。下文中给出一些规则示例 若数据为具有两位的数字,在小数点后结合有欧元符号,并且位于其左侧的文本 为“含所有的税”,则“含所有的税”这一数据可具有高可信度; 若标识出供应商的名字或者其SIREN号(法国商业注册号),则很可能不含税的 净值会位于由同一供应商发出的所有文件的相同区域中。4)分两个子步骤准备输入(预输入模块)a、与输入屏幕操作有关的第二规则库允许根据前一步骤的结果向每个输入屏幕域分配0、1或者N个潜在值,b、经过如此鉴定的数据被提供给能够通过参考源显示区域而在预输入区域中验 证、完成或者更正该数据的用户,该源显示区域根据情况可包括i、所扫描文档的或者以页面描述语言描述的典型文档的原始表示;ii、或者,在XML、EDIFACT等类型的结构化文件的情况下为文档的重组表示。5)半自动输入,具有以下两个主要子步骤a、当用户决定要验证在预输入屏幕中的数据时,这些值于是被自动记录到管理软 件的已有输入屏幕的相应的域;该记录通过调用管理工具的已有功能(在可用时)来执行, 或者,例如通过以下过程来执行i、调用操作系统的设备服务,以找到管理软件的搜索输入窗口,ii、调用用于模拟鼠标类型输入装置上的动作的机器的操作系统的设备服务,iii、调用用于模拟深度按下与待记录的字母数字数据对应的机器键盘按键的操 作系统的设备服务,b、在该已有的、因而其一些域已被预先填充的输入屏幕上,用户能够决定通过使 用属于管理软件的程序在最终验证之前完成输入;在这些附加的输入期间,根据本发明的 方法有利地提出,这些附加输入(例如通过相应的键盘动作/鼠标检测出)也被馈送给预 输入模块(上述参考点4),并且这用于实现以下步骤6)。6)然后,预输入模块执行以下操作a、丰富上述第二规则库,于是当一组类似数据出现时,能够给用户制定更丰富的 预输入建议。例如,根据这些附加输入的反馈,预输入模块可进一步通过自动将结算工作码 与供应商结合来推出在下一次输入时建议的结算工作码。b、例如通过保持账单域的位置,丰富上述第一规则库。图3至图4和图5至图6示出由本发明的方法和系统产生的显示的两个示例。如这些附图所示,根据本发明的一个方面,有利的是在公共显示窗口中提供以下 内容-第一区域Z1,包括原始文档的图形表示,具有带框的字母数字元素A、B、C、D等, 代表存在在提取步骤中恢复的值;-预输入第二区域Z2,其中,可对所提取的信息进行检查和验证;以及-第三区域Z3,该第三区域Z3是管理软件的已有输入屏幕。图3示出在区域Z3的屏幕中记录所收集的数据之前的显示,该记录在图4中示 出,在图4中,记录的字母数字元素由与例如区域Zl中参考标记相同的参考标记A、B、C等 标明。图5和图6示出根据同一原理的另一示例。当然,本领域的技术人员可想到本发明的一些变型和修改。例如,可以针对预输入区域和Z2、Z3输入使用半透明表示机制,以利于这些区域 的显示和可理解性。因此,预输入区域Z2消失,以形成区域Z3上的透明的罩,以实现输入屏幕的功能
性丰富。区域Z2的一些特征也可被扩展到区域Zl上,以允许从被建议用于软件包的输入屏幕域的、原始数据的识别出的区域开始,作为终点域(例如为上下文菜单的形状)。在区域Zl的显示中,也可以通过例如如下机制,将文本区域(例如标签)与输入 屏幕中限定的区域结合-利用鼠标,通过框选或者单击选择相关区域;-响应该选择,显示包括可能的预输入屏幕域的列表的快捷菜单;-通过使用鼠标,选择期望使该文本区域与之匹配的域。
权利要求
一种特别用于信息管理工具的辅助输入的方法,该管理工具在具有操作系统的信息系统中执行,该操作系统配备有设备服务,其特征在于,该方法包括步骤(a)从外部源输入原始数据;(b)从所述原始数据提取相关数据;(c)使用所述设备服务以向属于所述管理工具的已有输入界面的相应域记录所提取的数据,以实现附加输入和整体验证。
2.根据权利要求1所述的方法,其中,所述设备服务特别地使得能够发现已有输入屏 幕的样式和内容并且模拟用户动作。
3.根据权利要求1或2所述的方法,在记录步骤之前,包括所提取的相关数据的、以 预输入域组织的显示步骤,以便实现其预验证。
4.根据权利要求1至3中任一项所述的方法,其中,所述提取步骤包括将纸上的图像 数字化成数字图像,或者结构化文件或根据预定的描述语言所描述的文件的读取步骤。
5.根据权利要求1至4中任一项所述的方法,其中,所述提取步骤包括光学字符识别 或者从文档到字母数字元素及相关坐标的列表的转换,或者包括词汇和句法分析。
6.根据权利要求1至5中任一项所述的方法,该方法在步骤(b)后还包括借助于基 于提取规则而提取出的数据的中间鉴定步骤。
7.根据权利要求1至6以及权利要求3中任一项所述的方法,其中,所述显示步骤包 括借助于预输入规则库,为各个不同的预输入域分配可能的值。
8.根据权利要求1至7中任一项所述的方法,其中,通过调用所述操作系统的设备服务 以模拟所述管理工具的输入模块域中的输入,执行所述记录步骤。
9.根据权利要求1至8中任一项所述的方法,还包括在所述管理工具的已有输入模 块中人工输入附加数据的步骤,以及根据所述附加数据进行的预输入规则库和/或提取规 则库的丰富步骤。
10.根据权利要求1至9中任一项所述的方法,包括同时在第一显示区域中显示原始数 据表示、在第二显示区域中显示预输入域以及在第三显示区域中显示已有输入模块的输入 屏幕的步骤。
11.一种信息系统,包括中央处理单元、程序以及工作存储器、输入设备以及显示设备, 其特征在于,所述信息系统包括能够实现根据权利要求1至10中任一项所述的方法的程序。
全文摘要
一种特别用于信息管理工具的辅助输入的方法,该管理工具在具有操作系统的信息系统中执行,该操作系统配备有设备服务,其中,该方法包括步骤(a)从外部源输入原始数据,(b)从所述原始数据提取相关数据,(c)使用所述设备服务,向属于所述管理工具的已有输入界面的相应域记录所提取的数据,以使得实现附加输入和整体验证。特别应用于诸如供应商账单等账目的半自动输入。
文档编号G06F17/24GK101903877SQ200880120100
公开日2010年12月1日 申请日期2008年12月10日 优先权日2007年12月10日
发明者伊曼纽尔·福勒舍利斯 申请人:舍伦希亚
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1