在对话交互中消除用户意图歧义的制作方法_4

文档序号:8449208阅读:来源:国知局
过吗?
[0103]A6:[如果有的话,列出电影列表]
[0104]Q7:他们到底曾经一起再次表演过吗?
[0105]在以上例子中,实体Meryl Streep和Dustin Hoffman被间接地在六个问题中引用,有时一起并且有时分开。以上例子还说明了本发明实施例与围绕中心主题进行探索式交流的简单请求响应系统的一个重要区别。本发明的实施例不仅解决了交流中的歧义,它们还同时促进了与对对话中早前提到的实体和/或意图的隐含引用的探索式交流一一那些在丰富的人类交互中自然而然所做的一些事情。
[0106]以下例子说明用户引用甚至没有在之前交流中明确指出的实体(面向隐含连接的约束)。
[0107]Ql:哪个节目里有那个提到基于非碳生命形式的可能性的有生理缺陷的科学家?
[0108]Al:那是Stephen Hawking的关于外星人的发现频道的节目。
[0109]Q2:他在David Attenborough制作的另一个节目中吗?
[0110]另一个对话状态维护不限于仅实体及其属性的例子是当系统也维护意图的状态时,使得意图被跨对话交流携带,如在以下例子中很明显的:
[0111]Ql:“我的女儿能和我看pulp fict1n吗”
[0112]Al:Quentin Tarantino的pulp fict1n由于图像暴力和裸露被评为R级。
[0113]Q2:他的其它电影呢怎样?
[0114]A2:它们都被评为 R 级-Reservoir Dogs, Jackie Brown, Kill Bill, DeathProof。
[0115]在这个例子中,除了维护实体“Quentin Tarantino”的状态使得系统能够在Q2中理解对他(以“他的”的形式)的代词引用之外,系统还跨交流跟踪用户意图一一用户意图是“等级”。正是这个维护促进了如A2中的简洁和定向的响应,几乎与人类交互相配。
[0116]在特定于领域的意图和实体分析器108,107与基于个性化的意图分析器109密切协同工作下,以上说明的定向的响应是可能的。这些模块都受到特定于应用的属性搜索引擎111的帮助,特定于应用的属性搜索引擎111帮助确定相关的属性(例如,最近的、较少的暴力、更多的动作)并且给它们分配权重。因此,在上述所有模块协同工作(查询执行引擎104起协调作用)的处理之后,来自语音文本转换引擎102的用户输入交流将产生用户输入的一个或多个候选解释。例如,响应于问题“你有关于Bombay bomb blast的电影KayMenon吗? ”,系统可能有两种可替换的候选表示,其中一种候选表示使“Bombay”作为实体(有叫作Bombay的电影)并使“bomb blast”作为另一个属性,另一种候选表示使“Bombaybomb blast”作为单个实体。系统接着通过进行与用户的对话,根据作为演员的另一个识别的实体Kay KayMenon的存在,试图在这些候选表示之间进行解析。
[0117]在某些情况下,歧义的解决可以在不进行对话的情况下通过已知的用户偏好来完成。例如,用户可能询问“今晚有sox比赛吗?”,虽然这个问题具有歧义部分一一球队是
Boston Red Sox还是Chicago White Sox的歧义--但是如果系统意识到用户的偏好是
Red Sox,那么如果那天晚上有一场Red Sox的比赛的话,响应可以定向到显不Red Sox的比赛时间表。在其中存在多个跨领域的匹配的情况下,结果产生较高整体信心分值的领域匹配将胜出。当适用时,也可以基于查询的性质做出结果的个性化。例如,如果用户声明“给我显示今晚的Tom Cruise的电影”,那么这个查询不应该应用个性化,而是只返回TomCruise的最近的电影。但是,如果用户声明“给我显示今晚的体育运动”,则系统应当应用个性化并基于用户的明确偏好或从用户活动信息的各种来源捕获到的隐含动作来显示已知的该用户感兴趣的体育运动和比赛。
[0118]与其中用户的偏好(隐含或明确地推断的)以二进制的方式被应用(像开或关的“开关”)的现有系统不同,本发明的实施例以上下文相关的方式使用用户偏好签名(在本公开内容中也称作个人图,其捕获用户活动和兴趣,包括隐含地确定的和明确地确定的两者)来解决用户输入中的歧义,并且如果适用的话,还对结果选择应用个性化以提供具有高可能性匹配用户意图的最佳响应。如果可用的话,本发明的某些实施例使用用户偏好签名来解决用户输入中的歧义。但是,在刚提到的消除歧义步骤之后,为了裁剪结果而使用签名非常依赖于用户输入中指定的实体的定义的精确度水平。
[0119]用户偏好签名可以由系统利用已知的用于发现和存储这种用户偏好信息的技术来提供。例如,在于2010年8月10日授权的标题为Methods and Systems for Selectingand Presenting Content Based on Learned Per1dicity of User Content Select1ns的美国专利N0.7,774,294、于2010年11月16日授权的标题为Methods and Systems forSelecting and Presenting Content on a First System Based on User PreferencesLearned on a Second System的美国专利N0.7,835,998、于2008年12月2日授权的标题为User Interface Methods and Systems for Selecting and Presenting Content Basedon User Navigat1n and Select1n Act1ns Associated with the Content 的美国专利N0.7, 461, 061 以及于 2012 年 2 月 7 日授权的标题为 Methods and Systems for OrderingContent Items According to Learned User Preferences 的美国专利 N0.8,112,454 中阐述的方法和系统可以与本文所公开的技术一起使用,其中每个专利都通过引用被结合于此。但是,用户偏好签名和/或信息的使用不限于在所结合的申请中阐述的技术。
[0120]关系或连接引擎110是起理解用户输入以提供定向的响应作用的模块之一。该关系引擎可以以多种方式实现,图数据结构是其中一个例子,使得我们可以通过名称图引擎来称呼关系引擎。图引擎在实体之间已知的加权连接的背景下评估用户输入。
[0121]实体定义的精确度水平在图引擎110的节点中捕获。图引擎110中的每个实体节点都被分配有歧义指数,这是为实体统计上确定的分值一一并且可以是连续区间的值,比如从“低”值到“高”值,其中“低”意味着低歧义性并且“高”意味着高歧义性,以及这些端点限定值之间的所有中间值。这个歧义指数用于确定何时可以利用个人图(如果有的话)。一个例子是下面的对话:
[0122]用户:今晚有比赛吗?(或)今晚我们进行比赛吗?
[0123]响应:BostonRed Sox 与 Florida Marlins 今晚(7pm)进行比赛,可以在 ESPN HD观看。
[0124]在这个例子中,用户输入的“sox”具有高歧义指数。系统将动词短语“有比赛吗”映射到实体类型体育运动并且基于该用户的个人图为他/她关联实体Boston Red Sox。个性化的决定受“sox”歧义指数的驱动。形容词“今晚”充当时间指示器用于改进查询。注意,尽管用户的输入有歧义,但是在基于个人偏好将用户的意图解析为“red sox”之后,输入不再有歧义(假定“red sox”的“低”歧义分值)。因此,由于歧义指数现在低了(在映射到Boston red sox之后),所以结果没有被个性化。在可替换的变化中,代词“我们”被与实体Boston Red Sox相关联。
[0125]另一个例子如下:
[0126]用户:我们什么时候进行Yankees比赛
[0127]响应:NewYork Yankees 在 7 月 6 日星期五(7pm)与 Boston Red Sox 比赛,可以在NESN HD观看
[0128]用户:你能为我录制该比赛吗
[0129]响应:已安排录制New York Yankees 对 Boston Red Sox 在 7 月 6 日(7pm)星期五的比赛。
[0130]在这个例子中,系统提取实体New York Yankees并且基于用户个人图使代词“我们”归到实体Boston Red Sox。
[0131]以上执行的个性化是基于用户过去活动的签名,包括在社交网站、媒体消费、短信、推特(tweeting)活动等中的,并且还包括电子邮件、日历预约项、任务/待办事项列表、文档等用户个人语料库的签名。如前面所描述的,虽然用户的偏好签名在一些情况下用于解决用户输入中的歧义(例如,今晚有“sox”比赛吗,“我们”今晚比赛吗),但是在解决用户输入歧义之后,仍然具有高歧义指数的实体的出现确定是否应该利用用户的个人图来剪裁结果来匹配用户的意图。例如,即使用户在他的个人图中有Tom Cruise和Demi Moore,以下的查询也将不会触发结果个性化一一这是因为用户的意图是明确的和无歧义的。
[0132]用户:TomCruise 与 Demi Moore 合作过吗?
[0133]由于在这个查询中的实体具有低歧义指数,因此对它的响应将不应用用户的个人图信息。但是,对于以下查询:
[0134]用户:今晚有sox比赛吗?
[0135]由于“sox”具有与它相关联的歧义指数,因此将应用个性化。下面提供了帮助解决用户输入中的歧义并且个性化结果以匹配用户兴趣的用户个人图的更多例子:
[0136]用户:“sox何时与 San Fransisco Giants 比赛”
[0137]情况1:Red Sox在用户的签名中
[0138]响应:“BostonRed Sox 这个赛季不与 San Francisco Giants 比赛”
[0139]情况2:Red Sox不在用户的签名中
[0140]回答:“你是指Boston Red Sox 还是 Chicago White Sox”
[0141]注意,虽然明确指出了其中一个实体San Francisco Giants (歧义指数是“低”),但是我们仍然需要使用个性化来消除其它实体“sox”(其基于“高”歧义指数)的歧义。总而言之,“高”的“歧义指数”意味着使用“个人图”来解决歧义,但是一旦歧义被解决,如果它变成“非常精确指定的实体”的情况,那么就不使用“个性化”来计算回答。但是,如果甚至在消除歧义步骤之后歧义指数仍然高,则应用个性化。
[0142]歧义消除的例子
[0143]图4说明命名实体之间的连接和链接的图的一部分。在用户提出请求“给我显示
Beethoven电影”的例子中,歧义本质上是词汇的--该问题与关于作曲家Beethoven的电影和有名为Beethoven的狗的电影相匹配。图4示出了命名的实体“Beethoven”,其具有到这个节点的链接,链接在抽象意义上表示作曲家Beethoven的系统“心智模型(mentalmodel) ”。存在一个等效的子图,其具有称为“Beethoven”的实体,它的链接和属性清楚地将它识别为犬。当用户输入与这些不同实体相匹配时(这两者之间的图距离连同这些节点的属性的相关性是这些实体的接近程度的量度),该系统意识到歧义更可能是词汇上的并且利用这两个节点的关键的区分属性一一人和狗一一来提交消除这两个节点的歧义的适当响应。一旦这个关键的消除歧义的差异被系统推断出,则产生的响应可以变化。在一个实施例中,系统可以提交消除歧义的问题“你是指作曲家还是名为Beethoven的狗? ”,接着针对用户的反馈进行响应。
[0144]在另一个实施例中,通过说“如
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1