在对话交互中消除用户意图歧义的制作方法_3

文档序号:8449208阅读:来源:国知局
的访问信息库的说明性例子
[0055]以下描述说明在如上所描述的结构化和非结构化信息库的上下文中进行的信息检索任务的例子。
[0056]在一些情况下,用户对一些类型(本文一般地称为意图类型)中的一个或多个实体感兴趣,用户希望通过只指定实体必须满足的属性字段约束来发现这些实体。注意,有时当用户想要某种类型实体的一些属性时,意图可以是(类型,属性)对。例如,如果用户想要电影的等级,则意图可以被视作(类型,属性)=(电影,等级)。这种查询约束在本文一般地称为只有属性的约束(attribute-only constraints)。
[0057]每当用户指出实体名称或指定足够的信息来直接匹配期望意图类型实体的属性时,它就是只有属性的约束。例如,当用户通过名称和一些附加属性(例如,在60年代制作的“Cape Fear”)识别电影时,或者当他指定与他想要找到的电子邮件匹配的主题时,或者当他基于价格区间询问宾馆时,或者当他指定他想要32GB,黑色的iPod touch时。
[0058]但是,在一些情况下,用户不仅通过指定关于意图类型实体的属性字段约束,而且还通过在其它实体上指定属性字段约束或指出其它实体的名称而对意图类型中的一个或多个实体感兴趣,其中该意图类型实体以一些明确定义的方式经关系连接到所述其它实体。这种查询-约束在本文被一般地称为面向连接的约束。
[0059]面向连接的约束的例子是当用户想根据指定电影的两个或更多个演员找出电影(意图类型)或根据演员和该电影赢得的奖项找出电影时。另一个在电子邮件上下文中的例子是如果用户想要最近七天里从特定公司的某些发件人接收到的电子邮件(意图类型)的情况。类似地,还有的例子是如果用户想要预定火车站以及星巴克连锁店附近的宾馆房间(意图类型)的情况。还有的另一个例子是如果用户想要Samsung制造的还与NintendoWii兼容的电视机(意图类型)的情况。所有这些都是面向连接的约束查询的实例。
[0060]在以上面向连接的约束的例子中,用户明确地描述或指定连接到意图实体的其它实体。这种约束在本文被一般地称为面向明确连接的约束并且这些实体被称为明确的实体。
[0061]同时,其它查询包含包括未指定或隐含实体作为约束规范的一部分的面向连接的约束。在这种情况下,用户试图识别不通过未知项与用户确实知道的项之间的关系而知道的一些信息、实体、属性等。这种约束在本文被一般地称为面向隐含连接的约束并且未指定的实体在本文被一般地称为约束的隐含的实体。
[0062]例如,用户可能希望通过指出电影中两个人物的名字来识别她正在寻找的电影。但是,该用户不记得其中一个人物的名字,但她确实记得扮演该人物的特定演员。因此,在她的查询中,她通过名字指出一个人物并且通过指出未知人物是由特定演员扮演的来识别该未知人物。但是,考虑以下对特定信息检索目标的用户约束:用户想知道在关于指定角色(例如,人物“Tony Montana”)的未指定的电影中由指定的演员(例如,“MichellePfeiffer”)扮演的角色(意图)。在这个例子中,用户的约束包括对应于电影“Scarface”的未指定的或隐含的实体。类似地,假如用户想知道由指定的演员“Scarlett Johansson”和在指定的电影“Star Wars”中扮演指定角色“Ob1-Wan Kenobi”的未指定的演员主演的电影(意图)。在这个例子中,隐含实体是演员“Ewan McGregor”并且意图实体是由“ScarlettJohansson” 和 “Ewan McGregor” 主演的电影 “The Island,,。
[0063]在电子邮件库的上下文中,例子包括用户想要得到来自指定公司“Intel”的未指定男士的最后的电子邮件(意图),其中该用户在上星期经电子邮件(属性指示器)被介绍给该未指定的男士。在这个例子中,隐含实体是可经员工/公司关系通过检查来自“Intel”的联系人发现的、上周第一次与该用户是共同电子邮件收件人的联系人。
[0064]以上三个例子是面向连接的约束,但是它们包括未指定的或隐含的实体作为约束规范的一部分一一我们把这种约束称为面向隐含连接的约束并且把未指定的实体称为约束的隐含实体。
[0065]在面向连接的约束的上下文中,将信息库的实体和关系基本地映射到图的节点和边是有用的。特别地采用图模型代替实体关系模型的动机是观察到自然语言对话中的相关性、近似性和关联性可简单地通过诸如链接-距离以及在一些情况下的最短路径和最小重量树的概念来建模。在对话过程中,当用户对话涉及与实际寻找实体相关的其它实体时,将信息检索作为简单的图搜索问题的子程序有效地帮助减少对句子结构深入明确理解的依赖,这对实现会有巨大的好处。即使用户意图计算是歧义的或不确定的,只要实体已经在用户话语中被识别出,则基于图解释的问题处理就使得我们的系统能够以比其它可能的方式智能得多的方式响应。
[0066]用于消除用户意图/输入歧义的对话交互界面
[0067]我们现在描述用于消除用户意图/输入歧义的本发明实施例的对话交互界面。如果用户能够通过利用对信息检索系统说话并且可选地利用触摸或利用键盘或鼠标选择选项来提交查询或指令与信息检索系统交互,则我们认为它是对话交互界面。对用户查询的响应可以通过机器产生的口语文本到语音的转换来完成,并且可以通过在用户屏幕上显示的信息进行补充。对话交互界面一般而言几乎始终允许用户针对信息检索系统对之前查询的响应做出回应来提交他的下一个信息检索查询或指令,使得信息检索会话是一系列的操作,其中每个操作都是用户首先提交查询或指令接着系统向用户做出响应。
[0068]本质上,本公开内容中描述的对话交互界面的实现是比用于消除用户输入/意图歧义的图形Π更有效和更令人印象深刻的范例。在许多情况下,尤其当涉及从大量可能的属性或存在的明确和隐含连接的节点中灵活选择时,图形UI方法不会很好地工作或者根本不工作。在这种情况下,对话交互界面是更自然的匹配,此外,随着改进的语音识别技术的来临,这将取悦用户。
[0069]现在,我们描述用于对话交互的信息检索系统的体系结构、组件以及实现。
[0070]对话系统体系结构
[0071]图1表示本发明实施例的整体系统体系结构和基本信息流。用户101说出他/她的问题,该问题被送到语音文本转换引擎102。虽然输入可以是语音,但是本发明并不排除输入是直接的文本输入。用户输入的文本形式被送到会话对话内容模块103。该模块起跨对话维护状态的作用,它的一个用处是在对话过程中帮助理解用户意图,如以下所描述的。会话对话连同语言分析器(或语音标注器(speech tagger)的一部分)106以及以下描述的其它实体识别器模块将句子分解为它的组成部分,组成部分可以被广义地归类为(I)意图一一用户的实际意图,诸如寻找电影、播放歌曲、调到频道、响应电子邮件等⑵实体一一描述意图的名词或代词短语,及(3)属性一一对实体的限定词,诸如“最近的”电影、“更少的”暴力等。在以提供智能和有意义的对话为目标的环境中,意图有时是所有三个类别中最重要的。任何好的搜索引擎仅仅通过从句子中提取实体一一而无需理解语法或意图,就可以相当好地执行信息检索任务。
[0072]例如,当假定用户询问“我的女儿能和我看pulp fict1n吗? ”,大多数搜索引擎会显示对pulp fict1n的链接,如果通过那个链接就可以得到等级的话,那么这可能就够了。但是在对话界面中,期望明显更高一一系统理想地必须理解与电影等级以及它适合的年龄组的期望响应对应的(电影,等级)意图。退化到搜索引擎那种响应的对话界面响应从用户的角度看相当于系统的失败。当意图未知或不能清楚地辨认时,意图的确定、以及更重要的看起来更接近人类响应的对用户问题的响应对于致力于比搜索引擎更接近人类交互的对话界面来说是关键。
[0073]意图分析器108是分析意图并将意图分类到领域的特定于领域的模块,并且结合其它模块一起工作,这些其它模块包括特定于领域的实体识别器107、基于用户的个人偏好将意图分类的基于个性化的意图分析器109以及特定于领域的图引擎110。特定于属性的搜索引擎111帮助识别属性,并且这些属性的权重影响它们限定的实体。虽然图1是显示用于特定领域的模块的对话体系结构,但是本发明的实施例包括可以接受用户输入并进行其中用户意图可以跨领域的对话的对话界面。在本发明的实施例中,这是通过具有多个图1中示出的特定于领域的体系结构的实例并且跨领域对意图的权重进行评分以确定用户意图来实现。这种评分机制还用于隐含地确定对话主题切换(例如,在娱乐信息检索会话的过程中,用户可能正好说“我饿了”)。另一个新对话开始被隐含地确定的例子:
[0074]用户:我们什么时候进行Yankees比赛
[0075]响应:NewYork Yankees 在 7 月 6 日星期五(7pm)与 Boston Red Sox 比赛,可以在NESN HD观看
[0076]用户:你能为我录制这场比赛吗
[0077]响应:已安排录制New York Yankees对Boston Red Sox在7月6日星期五(7pm)的比赛。
[0078]用户:Netflix上有Iron Man电影吗
[0079]响应:Iron Man和Iron Man 2马上就可以在Netflix上得到。你想将它们添加到你的即时队列吗?
[0080]在其中来自不同领域的响应同样可能的情况下,本公开内容中描述的系统的实施例向用户提出消除歧义的问题:
[0081]用户:我在寻找好的音乐应用
[0082]响应:你想要流音乐还是想要关于音乐的新闻和信息?
[0083]在这个例子中,本公开内容中描述的说明性系统识别出题材“音乐”并且使用知识图跨音乐题材中的流行应用计算两个区分因素:流广播类型产品以及新闻和信息应用。
[0084]用户:我想要更多关于不同艺术家和乐队的信息
[0085]响应:这里是流行应用的列表:last.fm,allmusic等。
[0086]系统识别短语信息并且将应用结果列表过滤到那些更多基于新闻和信息的应用。
[0087]语言分析模块106在体系结构中是可插拔模块,以使得系统能够支持多种语言。尽管对用户输入的语义的理解不限于语言模块106自身,但是诸如对话上下文模块103或图引擎110的体系结构的核心模块是语言无关的。如前面所提到的,除了句子分析和执行诸如将代词关联到其主语/宾语等任务之外,语言模块自身不可以做得更多。(“在近期的Daniel Craig 电影的原声曲目(Original Sound Track) (OST)中的 Led Zeppelin 歌曲…谁演唱的它? ”);独自地跨交流关联代词是无效的。是与会话对话上下文模块103的交互使得能够如下跨交流地进行代词的解析:
[0088]Ql:谁在新的 star wars 中扮演 ob1-wan Kenobi ?
[0089]Al:Ewan McGregor
[0090]Q2:他与 Scarlet Johansson 的电影怎么样?
[0091]尽管乍看起来对话会话上下文可能像是对最后一个或多个活动实体的简单状态维护,但是下面的例子示出了对话会话上下文中潜在的复杂性:
[0092]Ql:谁在 Kramer vs.Kramer 中扮演主角?
[0093]Al:Meryl Streep 和 Dustin Hoffman
[0094]Q2:他的更多电影有哪些?
[0095]A2:这里是一些 Dustin Hoffman 的电影…[Dustin Hoffman 电影列表]
[0096]Q3:她的更多电影有哪些?
[0097]A3:[如果有的话,列出电影列表]
[0098]Q4:他的早期电影有哪些?
[0099]A4:[如果有的话,列出电影列表]
[0100]Q5:她的近期电影有哪些?
[0101]A5:[如果有的话,列出电影列表]
[0102]Q6:在最近过去的时间里他们再次一起表演
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1