语句解析校正系统的制作方法

文档序号:9355188阅读:372来源:国知局
语句解析校正系统的制作方法
【专利说明】语句解析校正系统
[0001] 相关申请的夺叉引用
[0002] 本申请是依照35U.S.C. § 363提交的国际申请,根据35U.S.C. § 119(e) (1),本申 请要求享有先前于2012年10月25日根据35U.S.C. § 111(b)提交的临时申请61/718, 553 的优先权。
【背景技术】
[0003]自动语句解析处理具有从一种语言到另一种语言的翻译到语音识别的诸多用途。 "解析处理"包括将一个句子拆分成其构成短语:名词短语、动词短语和介词短语。短语的定 义是构成一个组成部分并且由此充当句子句法中的单个单元的一个或多个单词的群组。短 语始终包括语言(speech)的标题部分,并且经常还会包含其他单词。通常,任一短语都可 以包括其他短语,也就是嵌套短语。
[0004] 短语可被合并成从句。并且一个或多个从句可被合并成一个句子。句子可以单独 由拼写术语来限定,也就是被限定成是大写字母与句点(句号)之间的内容。从句既可以 包含也可以不包含通常但并不是始终为句子所有的名词、动词和宾语。
[0005] 此类解析处理中的一个具体问题是解决歧义。设想这样一个句子"Theoldlady hitthethiefwithherpurse"。这个句子可以是指"老妇人用她的手提包打小偷"。或 者它也可以是指"老妇人打了拿她的手提包的小偷"。毫无疑问,这两种含义的差别是很大 的。
[0006] 在这种时候,自动解析处理将无法轻易地解决这些歧义。实际上,即使是人也不能 始终做到这一点,然而,人们往往能够通过参考相邻的句子乃至全文来做出有根据乃至非 常精确的推测。
[0007] 举个例子,如果以上这个句子的前一个句子是"老妇人拿着棒球棍和手提包沿街 行走",那么人们会准确地假设这个老妇人是用棒球棍打小偷的。另一方面,如果后面一句 话是"小偷倒在地上,老妇人继续行走,手提包没有丢",那么比较稳妥的假设是她用她的手 提包打了小偷。
[0008]申请人的先前专利所描述的系统使用的是用于产生非常精确的分析处理的算法。 这些专利包括以下序号的美国专利:
[0009] 1998 年 09 月 01 日发布的 5, 802, 533
[0010] 2001 年 08 月 21 日发布的 6, 279, 017
[0011] 2006 年 04 月 25 日发布的 7,036,075
[0012] 2010 年 07 月 27 日发布的 7,765,471
[0013] 2010 年 12 月 28 日发布的 7,861,163
[0014] 这些算法产生的是依照构成从句来对文本中的每个句子进行解析的层次列表。如 果精确解析句子至关重要,并且可以通过延迟最终的列表来允许通过人工输入校正任何可 能出现的错误,那么可以通过直接的人工编辑来校正这些列表。作为示例,如果解析处理是 用于实时翻译的系统的一部分,那么将无法实施人工输入。
[0015] 层次列表有可能会很复杂。与所有基于文本的信息呈现一样,此类列表很容易被 误解,并且很难精确地检查出错误。检查此类列表的人往往会在一段时间之后丧失注意力, 并且将无法精确地纠正存在错误的表,甚至会完全漏掉错误。相应地,以更多图形和较少文 本的方式来显示句子结构的系统将允许更精确地校正此类列表。

【发明内容】

[0016] -种改进的语句解析系统具有:计算机,用于从计算机接收显示信号的显示屏,所 述显示信号形成显示屏上的多个显示对象以及显示屏上的光标图像,以及受用户控制的光 标控制部件。作为示例,所述光标控制部件可以是计算机鼠标。
[0017] 光标控制部件向计算机提供用于指定光标在显示屏上的位置的光标控制信号,以 及具有分别允许用户将下方对象附着于光标和将光标与下方对象分离的附着和分离状态 的光标动作信号。在光标动作信号处于附着状态期间,对象是可以用光标移动的。响应于 光标控制信号的分离状态而将对象与光标分离,将下方的对象在当前的位置放下。
[0018] 计算机接收用于对构成句子的字符进行编码的输入语句信号,并且依照预先选择 的解析算法来提供用于编码所述句子中的名词、动词和介词短语的初始解析版本的初始解 析语句信号。然而,在一些情况中,初始解析版本并不足够精确。本发明则提供了一种手段 来帮助校对者解决这个问题。
[0019] 计算机首先配置成显示部件,所述显示部件接收初始解析语句信号,并且产生用 于显示屏的解析图像显示信号。在显示屏上创建的解析图像显示信号显示依照初始顺序排 列的语句文本,其中该语句文本具有处于连续行的句子中的名词、动词和介词短语,其间的 关系是用缩进或水平偏移指定的。
[0020] 然后,计算机配置成接收解析语句信号的格式化部件,该部件以可扩展容器 (excon)格式来为句子中的每个短语创建excon图像。这其中的每个图像都包括短语以及 短语特有的装饰。然后,格式化部件将excon图像编码在excon格式信号中,该信号定义了 每个excon图像的形状以及指定初始解析的每个excon图像与其他excon图像的初始拓扑 关系。
[0021] 最后,计算机配置成校正部件,该校正部件接收excon格式信号以及光标控制和 动作信号,并且响应于此来将光标附着于excon图像。然后,用户通过操作光标控制部件来 移动光标和excon图像。
[0022] -旦将excon图像置于用户预期的位置,则用户会将光标与excon图像分离,由此 将excon图像留在该预期位置。在光标移动的同时,校正部件会提供依照所述附着、移动和 分离活动来创建图像的显示信号。响应于光标动作信号从附着到分离状态的变化,该校正 部件产生最终解析图像显示信号,该信号会在显示屏上创建每个excon图像与其他excon 图像之间的最终拓扑关系,并且所述关系指定经更改的解析。编码在最终解析图像显示信 号中的语句文本具有处于连续行列的句子中的名词、动词和介词短语,并且这些短语具有 指示最终解析的缩进。
[0023] 该系统中的装饰可以包括处于excon内部的图案,并且短语是能够通过该图案而 被看到的。举例来说,该图案可以包括能在显示屏上看到的线条。Excon图像内部的每条线 都可以具有相似的类型,并且与该excon图像内部的其他线条是隔开的。至少一个excon 图像内部的线条可以是实线,并且另一个excon图像内部的线条可以是虚线。
[0024] 优选地,该格式化部件包括线条合并部件,其中由两个重叠的excon图像定义的 显示屏上的区域会显示这两个重叠的excon图像所特有的线条。
[0025] 在另一个版本中,所述装饰包括颜色,并且短语是能够透过该颜色阅读的。在这个 版本中,格式化部件优选包括颜色合并部件,其中由两个重叠的excon图像定义的显示屏 上的区域会显示与这两个重叠的excon图像特有的颜色不同的颜色。由两个重叠的excon 图像所定义的显示屏上的区域的颜色与这两个重叠的excon图像中的每种颜色都可以具 有光谱关系。
[0026] 校正部件可以发布响应于该信号的分离状态来指定文本在附着于光标的excon 图像内部的缩进的信号。该校正部件可以发布响应于光标和动作信号来改变至少一个 excon图像的尺寸的显示信号。
[0027] 该计算机还可以配置成转换部件,该部件接收最终解析图像信号并将其转换成关 于原始语句的线性文本列表中的标记标签集合。然后,该转换部件将标记标签集合编码到 最终的元标签列表信号中。
【附图说明】
[0028] 图1是构成本发明的功能部件的框图。
[0029] 图2是包含了用于显示关于样本语句的初始解析的屏幕显示的计算机系统的框 图。
[0030] 图3显示的是图2中的计算机系统的框图,其中该屏幕显示展示的是使用本发明 作为辅助来改善样本语句解析的第一个阶段。
[0031] 图4显示的是图2中的计算机系统的框图,其中该屏幕显示展示的是使用本发明 作为辅助来改善样本语句解析的第二个阶段。
[0032] 图5显示的是图2中的计算机系统的框图,其中该屏幕显示展示的是使用本发明 作为辅助来改善样本语句解析的最终阶段。
【具体实施方式】
[0033] 图1显示的是用户用来校正解析语句的图形图像的系统10的框图。其目的是在 执行了机器解析处理之后,允许用户通过排列和重新排列单个短语来更精确地反映句子的 实际意义,而不会改变句子短语的初始顺序。
[0034]申请人现在应该解决的是"软件"发明的问题。与某些人所想的相反,基于软件或 固件的发明是具有物理结构的。在将被设计成实施一项发明的软件加载到微处理器或其他 类型的指令处理器中并执行该软件时,该指令处理器其实会变成一台与加载和执行指令之 前的机器不同的机器。
[0035] 本发明的指令会促使指令处理器的单个电子组件(逻辑门、导线、放大器、存储器 部件、时钟等等)以一种在执行指令之前无法实施的方式来进行交互。这些组件在导线上 接收和发送与这些组件在运行本发明的指令之前所接收和发送的信号不同的信号。本发明 的软件促使各种指令处理器组件进行协作和交互,以便形成包含了本发明的功能部件。随 着指令的继续运行,这些组件中的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1