用于使用多个所选知识库来回答自然语言问题的设备和方法_3

文档序号:9422795阅读:来源:国知局
L、SparQL或直接回答)而执行查询,并且将结果经由接口而传送到前端。另外,该组件可以提供关于回答的地理和统计可视化的多个web (网络)服务。
[0063]-安全性分派器:问题回答流水线可以连接到安全性分派器以验证用户既能够访问所要求的数据源以及也能够访问可能是回答的部分的特定数据项。安全性模型可以将用户划分成某些群组,并且每个这样的群组地指派基于行的访问。用户可以属于这样的群组中的一个或多个。
[0064]相应的实体(例如候选搜索实体或假说生成实体)可以以硬件和/或以软件来实现。如果所述实体以硬件来实现,则它可以体现为设备,例如体现为计算机或处理器或系统(例如计算机系统)的部分。如果所述实体以软件来实现,则它可以体现为计算机程序产品、函数、例程、程序代码或可执行对象。
[0065]第一方面的任何实施例可以与第一方面的任何实施例相组合以获得第一方面的另一实施例。
[0066]根据第二方面,建议了用于使用多个所选的知识库来回答自然语言问题的方法。
[0067]在第一步骤中,提供针对所接收的自然语言问题的信息单元的多个面向三分法的表示。每个面向三分法的表示包括针对面向三分法的表示的知识库特定的概念、概念实例、概念实例关系以及概率值。
[0068]在第二步骤中,生成关于在概念、概念实例和概念实例关系之间的链接的多个假说。
[0069]在第三步骤中,基于用所生成的假说而查询辅知识库以及面向三分法的表示的概率值而对所生成的假说进行排列。
[0070]在第四步骤中,基于经排列的假说而从多个可用的知识库中选择多个知识库。
[0071]根据第三方面,建议了一种计算机程序产品,其具有程序代码,所述程序代码当运行在至少一个计算机上时用于执行以上讨论的用于使用多个所选知识库而回答自然语言问题的方法。
[0072]计算机程序产品(比如计算机程序装置)可以体现为存储器卡、USB棒、⑶-ROM、DVD或体现为可以从网络中的服务器下载的文件。例如,这可以通过从无线通信网络传递具有计算机程序产品的相应的文件来提供。
[0073]本发明的另外的目的、特征和优点将从结合附图理解的随后的描述和随附权利要求变得显而易见。
【附图说明】
[0074]图1示出了自然语言问题回答设备的第一实施例的示意性框图;
图2示出了面向三分法的表示的实施例的示意性框图;
图3示出了假说的实施例的示意性框图;
图4示出了自然语言问题回答设备的第二实施例的示意性框图;
图5示出了自然语言问题回答设备的第三实施例的示意性框图;以及图6示出了用于使用多个所选的知识库而回答自然语言问题的方法的序列的实施例。
[0075]在图中,同样的参考标号指明同样的或功能上等同的元件,除非以其它方式进行指示。
【具体实施方式】
[0076]在图1中,描绘了用于使用多个所选知识库而回答自然语言问题NQ的自然语言问题回答设备100的第一实施例的示意性框图。
[0077]自然语言问题回答设备100包括候选搜索实体10、假说生成实体11、假说排列实体12以及知识库路由实体13。
[0078]候选搜索实体10被配置成提供针对所接收的自然语言问题NQ的信息单元的多个面向三分法的表示TR。每个面向三分法的表示TR包括针对面向三分法的表示TR的知识库特定的概念C、概念实例Cl、概念实例关系R以及概率值PV。针对这样的面向三分法的表示TR的示例被示出在图2中。
[0079]根据图2的示例,概念实例关系R包括在概念C和概念实例Cl之间的关系REL以及概念实例Cl对概念C的潜在引用REF。
[0080]所接收的自然语言问题NQ的每个信息单元包括自然语言问题的至少一个词、自然语言问题的词的序列和/或自然语言问题的词的聚合。
[0081]此外,假说生成实体11接收面向三分法的表示TR并且被配置成生成关于在所接收的面向三分法的表示TR的概念C、概念实例Cl和概念实例关系R之间的链接的多个假说H。
[0082]特别地,假说生成实体11针对所接收的自然语言问题NQ的面向三分法的表示TR的概念C、概念实例Cl和概念实例关系R的每个可能的组合而生成一个假说H。每个所生成的假说H包括概念C的概念值CV、概念实例Cl的概念实例值CIV以及概念实例关系R的值RV (参见图3)0
[0083]此外,假说排列实体12被配置成基于用所生成的假说H而查询辅知识库20以及面向三分法的表示TR的概率值PV而对所生成的假说H进行排列。
[0084]此外,假说排列实体12可以基于用所生成的假说H而查询辅知识库20以及面向三分法的表示TR的概率值PV来向每个所生成的假说H指派置信度得分CS。在这方面,假说排列实体12可以基于所指派的置信度得分CS来对所生成的假说H进行排列。
[0085]知识库路由实体13被配置成基于经排列的假说RH而从多个可用的知识库中选择多个知识库(知识库的子集)。由假说排列实体12输出经排列的假说RH。
[0086]特别地,知识库路由实体13被配置成基于经排列的假说RH以及被指派给经排列的假说RH的置信度得分CS来从多个可用的知识库中选择知识库的子集。
[0087]另外,知识库路由实体13可以使用经学习的模型以用于选择要使用的多个知识库。
[0088]图4示出了用于使用多个所选知识库来自动回答自然语言问题NQ的自然语言问题回答设备100的第二实施例。
[0089]如在第一实施例中那样,图4的设备100包括候选搜索实体10、假说生成实体11、假说排列实体12以及知识库路由实体13。
[0090]另外,图4的设备100包括输入分派器14、问题分析实体15、查询生成实体16、验证实体17、查询翻译实体18、回答提取实体19、辅知识库20、非结构化知识库21、主知识库22、回答响应组件31以及安全性分派器32。
[0091]另外,设备100包括问题回答实体130,所述问题回答实体130包括实体15_22。
[0092]输入分派器14接收自然语言问题NQ并且将它提供给问题分析实体15。问题分析实体15响应于所接收的自然语言问题NQ而提供增强的问题EQ。增强的问题EQ可以包括自然问题NQ和对自然语言问题NQ的多个注解。所述多个注解可以至少包括自然语言问题NQ的信息单元。
[0093]问题分析实体15耦合到查询生成实体16。查询生成实体16被配置成基于由问题分析实体15所提供的增强的问题EQ而生成查询QU,以用于查询非结构化知识库21以及主知识库22。
[0094]候选搜索实体10耦合到查询生成实体16并且被配置成通过使用所述生成的查询QU而查询非结构化知识库21和主知识库22来提供针对面向三分法的表示TR的概率值PV。
[0095]候选搜索实体10耦合到验证实体17。换言之,验证实体17耦合在候选搜索实体10和假说生成实体11之间。验证实体17被配置成基于预学习的在先模型34而验证面向三分法的表示TR。在这方面,假说生成实体11可以被配置成生成关于在经验证的面向三分法的表示TR的概念C、概念实例Cl以及概念实例关系R之间的链接的多个假说H。
[0096]另外,假说排列实体12可以基于用所生成的假说H而查询辅知识库20以及面向三分法的表示TR的概率值PV来向每个所生成的假说H指派置信度得分CS。在这方面,假说排列实体12可以基于所指派的置信度得分CS并且使用后模型35来对所生成的假说H进行排列。
[0097]知识库路由实体13 (知识库路由器)被配置成基于经排列的假说RH和被指派给经排列的假说RH的置信度得分CS而从多个可用的知识库中选择知识库的子集。
[0098]知识库路由实体13耦合到查询翻译实体18。查询翻译实体18被配置成使用由后两个实体(即假说排列实体12以及知识库路由实体13)所收集的信息。查询翻译实体18使用该信息来以代表性查询语言构造最终查询。例如,查询翻译实体18可以并入用于SQL、Apache Lucene、SparQL和Solut1n Object查询的四个不同的翻译模块。后者指代与目标应用一起使用的领域特定的对象表示。
[0099]另外,查询翻译实体18可以还定义DB、RDF或Lucence列,其中可以找到潜在的回答值。最后,查询翻译实体18可以定义需要传播给用户的所谓的表示模型及其属性。例如,它指示是否已经在直接仿真陈述的方面生成了回答,或者它指代基于列表的回答并且因此需要执行所生成的查询以收集回答列表。
[0100]查询翻译实体18耦合到回答提取实体19以及安全性分派器32。
[0101]回答提取实体19可以聚焦于针对给定的输入问题NQ的实际回答预计。也就是说,回答提取实体19要么关于明确的问题而应用于仿真陈述过滤器,或通过使用后推算和计算而应用回答后处理器。最终,基于所得到的回答模式(如果存在的话),直接回答或回答查询可以被传递到输出分派器或回答响应组件31。
[0102]回答响应组件31 (或回答管理器)可以协调在问题回答实体33内的后端和前端通信。回答响应组件31可以借助于相应的表示模式(例如SQL、SparQL或直接回答)而执行查询,并且将结果经由接口而传送到前端。另外,回答响应组件31可以提供关于回答的地理和统计可视化的多个web服务。
[0103]如以上提及的,查询翻译实体18也耦合到安全性分派器32
...
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1