在对话交互中消除用户意图歧义的制作方法

文档序号：8449208阅读：308来源：国知局

在对话交互中消除用户意图歧义的制作方法
【专利说明】在对话交互中消除用户意图歧义
[0001]相关申请交叉引用
[0002]本申请要求以下专利申请的权益，其内容通过引用被结合于此:
[0003]于2013 年 3 月 13 日提交的标题为“Disambiguating User Intent inConversat1nal Interact1n System for Large Corpus Informat1n Retrieval，，的美国专利申请N0.13/801,812 ;及
[0004]于2012 年 7 月 31 日提交的标题为“Disambiguating User Intent inConversat1nal Interact1n System for Large Corpus Informat1n Retrieval，，的美国临时专利申请N0.61/677，895。
技术领域
[0005]本发明涉及在用于信息检索的对话交互系统中用于消除用户意图歧义的方法，并且更具体地涉及利用结构化信息和用户偏好的技术。
【背景技术】
[0006]本发明涉及在用于大型语料信息检索的对话交互系统中用于“最优地”和“智能地”消除用户意图/输入的歧义的方法，其中意图/输入具有一种或多种的以下歧义:(1)词汇歧义(多个合格响应在词汇上与用户输入匹配)或(2)语义歧义，其中歧义在于时间(基于时间属性的多个合格响应)，或者歧义在于位置(基于位置属性的多个合格响应)，或者歧义在于任何内容属性或内容属性的组合(基于用户指定的一个或多个内容属性的多个合格响应)或者仅仅是在用户请求固有的非特殊性中产生的又导致多个合格响应的歧义(例如，宽泛的意图请求)。在本公开内容中描述的“最优”消除歧义方法的实现使得系统能够问最少量的澄清问题(在理想的情况下，根本不问任何问题)来理解用户意图。本公开内容中描述的“智能”消除歧义方法的实现使得系统能够自然地进行消除歧义的交流，类似于人类在对话中澄清歧义的方式。该系统利用特定于领域的结构化知识、时间、用户的位置(如果可以得到的话)、以及用户偏好签名(如果可以得到的话)来执行最优的和智能的歧义消除。本公开内容中描述的方法是语言无关的并且在特定于语言的模块的帮助下可以被应用到多种语言。此外，本文公开的方法尤其适于具有高度语义歧义和冲突的大型语料信息库，其中高度语义歧义和冲突是由于库中的给定实体或概念可以以多种方式被引用并且同一词语会在不同含义的上下文中出现的事实引起的。
[0007]对话系统的关键性能度量不是当用户意图/输入没有歧义时它的响应多好地匹配用户意图，而是当用户意图/输入具有歧义时它如何响应。好的对话系统在其可能的响应策略的技能中不具有喷出大量响应的奢侈条件一一像搜索引擎将喷出结果那样，即使在用户输入/意图中存在歧义。对于搜索引擎而言，以某种相关性顺序为歧义的输入/意图显示所有的结果将会被赞美为好搜索引擎的标志。在对话系统中为歧义的用户输入/意图采用相同的方法将相当于在星巴克令人疑惑地遇到过分热心的销售人员，只因为用户健忘地不能描述用户脑中特定种类的咖啡(例如，Caffe Latte)，销售人员就一口气地说出十种咖啡选项。这里，尽管销售人员清楚地理解意图是咖啡(而不是茶)，但是销售人员没有留意存在许多与意图匹配的选项的事实一一更聪明的销售人员可能会说“噢，有多种咖啡可选，你想让我给你快速过一遍这些选项吗？ ”
[0008]本公开内容在宽泛意义上使用术语“歧义”来捕获当存在匹配用户输入的多个合格响应(有一个以下提到的例外)时的情形。如在本公开内容中所使用的，术语“歧义”的含义的一个例子可以从以下例子中得到理解:尽管好的对话系统将致力于理解用户意图并产生最简洁的针对性的响应，其中取决于问题，该响应可以理想地只是一个简洁的响应(例如，问题“今晚SOX比赛吗？ ”可能产生只显示red sox比赛的时间和地点的响应，其中redsox是根据用户的签名推断出的)，但是这并不一定暗示所有的用户问题都产生单个响应。这也不暗示对问题提供多个选项将是次优的。例如，如果用户陈述“给我显示附近的星巴克”，则最好的响应将是显示标有所有靠近该用户的星巴克结果的地图，使得用户可以从可视化地图中毫不费劲地选出任何一个。即使对于诸如“给我显示附近的餐馆”之类的更宽泛的意图请求，在地图上显示多个响应也是系统可以提供的最好响应。
[0009]在这两个例子中意图都是清楚的一一但是响应在某种意义上是“歧义”的，因为它多于一个一一系统不知道用户会喜欢哪个特定的餐馆。但如果存在用户偏好签名，则它可以产生从其它响应中突出的具有最优选的星巴克/餐馆的响应。在以上提到的这些例子中，多个响应并不真正是歧义响应，而是都与用户意图匹配的一组“选项”(当然用户可能由于主观原因仍不选择星巴克或餐馆)。这里使用“选项”一词是为了与“响应”区分，以显示用户想要多个选项一一而不是只有一个选项(即使系统有用户偏好签名，它仍将提供多个
“选项”)。另一个例子是--“给我显示Meryl Streep的电影(movies) ”。在这个例子中，
用户想要Meryl Streep的多个电影以便从中“选择”。
[0010]在本公开内容中描述的方法将着重于其中歧义(或多个合格响应)源于不能提供可通过良好的置信度被认为是与用户意图相匹配的一个清楚的“选项”或一组“选项”的情况。而且，当用户想要特定的一个或多个选项时，虽有挑选那个特定的选项或选项集合的词汇和/或语义歧义，但是负担落在系统上。这种歧义不是由于系统的缺陷或“缺少智能”，而正是由于用户提交的问题中的固有歧义(词汇或语义)。
[0011]本公开内容中描述的方法将着重于为其中由于用户意图/输入中的固有歧义而不可能提供一组选项的这些歧义情况消除歧义的方法。星巴克/餐馆和“Meryl Streep"的响应是无需歧义解决方案的最好情况的情形。这些系统响应与上面提到的对问题“今晚有sox比赛吗”的简洁响应简直一样好——多个响应是“选项”而不是响应中有歧义。
[0012]在本公开内容中还使用“歧义” 一词来处理例外情况一一当根本不存在与用户意图/输入相匹配的响应时。在这种边界条件下，歧义可能是由于多种多样的原因，从用户没有正确地表达意图到仅仅是在信息领域空间中不存在匹配。例如，如果用户问“今晚有SOX比赛吗”，但是今晚没有任何SOX比赛，那么这就是其中不存在与用户想看比赛的意图的匹配的例子。
[0013]从严格的请求/响应来说，这里不存在歧义。但是在人类交互中，当用户表达不可被满足的意图时，会产生合理的问题“我能给用户提供可能接近满足原来意图的东西吗？ ”。通常，提供接近的替代选项的响应常会被赞赏。在“今晚有SOX比赛吗”的例子中，响应“今晚没有，但是有一场昨天晚上你错过的比赛”(这种响应可以利用用户的偏好签名和过往历史记录来创建)。本发明的实施例将这种无响应的情况视为“空(null)响应歧义”的情况，并且产生尽量接近满足用户意图的响应。另一个例子是，“X和Y—起演过电视剧吗？ ”。假设X和Y从来没有一起演过电视剧，那么本发明的实现将利用特定于领域的结构化知识来产生“没有，他们没有一起演过电视剧，但是回到1989年他们确实在电影Z中一起主演过”。这里，特定于领域的结构化知识被用于产生对“空响应歧义”情况的响应。
[0014]本公开内容中描述的大多数歧义的例子主要基于数字娱乐空间。但是，本公开内容中描述的方法可以应用到任何信息领域(娱乐、诸如电子邮件、通讯录等的个人语料库)，并且也可以跨不同的信息领域。
[0015]用户意图/输入中的歧义可以是不同类型的。一种可能性是用户输入中的词汇歧义，但是用户有明确的意图。例如，假如用户说“我想看那个Beethoven电影”。三部电影具有“Beethoven电影”的资格--1936年关于作曲家Beethoven的电影、1992年关于名为Beethoven的狗的电影、或者1994年关于Beethoven的著名电影“ Immortal Beloved”。用户的意图显然只是这些电影中的一个(基于请求中“那个”的使用)，但是用户的输入词汇上与三个合格的响应相匹配。在这种情况下，好的对话系统绝不会提供这三个合格的响应作为三个平等的有效选项让用户从中选取一个。这样的系统将是其性能已退化到提供结果的搜索引擎性能的对话系统一一很显然，除了可能的某个相关性度量外，该系统对词语Beethoven没有内部的理解。
[0016]致力于更接近人类之间对话的对话系统将问用户“你是指关于作曲家的电影还是关于狗的电影？” 一一很像人在对话中将回应的。该消除歧义的问题本身是对话系统理解词语Beethoven的指示，更像人类所做的。例如，同样消除歧义的问题可能被构造成“你是指作曲家Beethoven还是狗Beethoven ? ”。虽然这仍然是好的消除歧义的响应，但是之前的响应更接近正常的说话，其中正是有歧义的词语，即Beethoven，被从给用户的消除歧义的响应中去除。总而言之，好的对话系统在其对词汇歧义的响应中将尤为敏感并且将产生更像人类的消除歧义响应，因为这种响应是决定系统水准的关键度量，其中系统水准的范围可能从“搜索引擎智能”到“自然对话智能”。
[0017]歧义的另一种形式在于时间或线性连续性的语义歧义。如果用户说“我想看Borghia"(电视系列剧)，则在用户想看的季中存在歧义，尽管当前季在大多情况下会被认为是合理的响应。但是，如果用户已经从第一季观看该系列剧，则理想地，跟在最后观看的一季之后的季将是理想的。当用户在观看一系列连续内容(像David Attenborough的自然系列“Life on earth”)的过程中时，也可能出现这种形式的歧义。在这种情况下，歧义的解决方案理想地也通过以用户最后观看的剧集开始加以解决。在任何这两种情况下(季或线性系列)，如果用户没有以时间或线性顺序观看，那么消除歧义的问题是不可避免的。但是，如果用户说“我想看下一个Borghia”，那么用户意图可以被解释为指用户最后观看的一集后面跟着的剧集。
[0018]歧义的另一种形式在于导致多个合格响应的位置的歧义。例如，请求给我显示在夏威夷拍摄的那个Spielberg电影”将产生多个电影Jurassic Park及其续集--Lost
world和Jurassic Park II1--所有这些都在位置夏威夷拍摄。这里，用户通过问“那个
Spielberg电影”只想要一个电影。更接近人类响应的响应会是“Jurassic park是在夏威夷拍摄的。它的续集“Lost World”和“Jurassic Park III”也是在那里拍摄的”。
[0019]在另一个例子中，如果用户问“今晚有tiger的比赛吗”，那么用户可能指DetroitTigers棒球队或Louisiana Tigers足球队(Louisiana Tigers足球队比使用同一名字的该棒球队更流行)。但是，如果用户的位置已知是在Louisiana，那么很可能用户指Louisiana足球队。但是，如果用户的位置已知是在Detroit，那么该问题可以映射到Detroit棒球队。在其中用户正在旅行并且位置未知的情况下，则在问题中存在需要加以解决的歧义，尤其当不存在关于用户对任何这两支球队的偏好的先前信息时。此外，如果该问题是在赛季期间提出的，那么除了位置之外，这也可能是消除歧义的因素。一般而言，在用户指定的任何属性中都可能存在歧义，而不仅仅是在位置和时间中一一以上例子示出了在诸如位置和时间的属性中的歧义。
[0020]在从意图的最宽泛程度来理解用户意图时也可能存在歧义。例如，如果用户说“我今晚想看电影”，即使用户偏好签名是已知的，用户也可能对动作片或悬疑电影感兴趣。因此，在这两种题材类型之间仍然存在需要加以解决的歧义。在一些现有对话系统中使用的消除歧义机制是使用户经历多层决策树，向用户提出问题以缩小选项。人类从来没有在自然对话中做过这种“算法树遍历方法”，这使得该策略对于致力于接近自然对话的对话系统来说是不可接受的。这种多层决策树遍历对一些诸如航班预订过程的领域来说在某种程度上是可以接受的，但是当应用在诸如娱乐空间

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M·阿拉瓦穆丹;R·巴尔维;S·万卡塔拉曼;V·阿加瓦尔;A·萨瓦尔卡;G·拉马默尔赛;A·N·莫海迪恩佩瑟迪恩;K·C·S·雷迪;
技术所有人：韦韦欧股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。