基于语音输入的自然语言处理选择演示广告的系统和方法

文档序号:6476686阅读:328来源:国知局
专利名称:基于语音输入的自然语言处理选择演示广告的系统和方法
技术领域
参考图3,其中示出了根据本发明各方面的用于选择和演 示基于语音输入的广告的示例性方法。所述方法可以从操作305开始, 其中可以在语音用户界面处接收至少包括用户话语的基于语音的输 入。语音用户界面可以包括任何适合的用于接收话语的机构(例如麦 克风),并且显而易见的是其可以与任何合适的启用语音的设备通过界 面连接(interface with),该启用语音的设备包括个人导航设备、个人 数字助理、媒体设备、远程信息设备、个人电脑、手机或其它。
0261 之后,在操作310中可以识别包含在语音输入中的一个或 多个请求。例如,请求可以包括检索信息、执行任务、调查或收集信 息或者其它与系统或设备交互的请求。例如,对导航设备的语音输入 可以包括计算路线或检索基于位置信息的请求。在另一个示例中,对 手机发出的语音输入可以包括设置电话呼叫、购买铃声或记录语音备 忘录的请求。此外,在各种应用中,语音输入可以包括多个请求、多 模式请求、跨设备请求、跨应用程序请求或其它类型的请求。例如, 在操作305中接收的话语可以是"给我去Chang的餐馆的路线,并 且给他们打电话,这样我能预定座位。,,因此话语可以包括多个请求, 该多个请求包括跨设备请求(例如利用导航设备计算路线,并且利用 手机打电话),以及跨应用请求(例如利用语音搜索引擎搜索地址和/或电话号码,并且利用导航应用程序计算路线)。
02" 请求可以是用户与系统或设备之间的会话式交互的 一部 分,由此在当前话语中的请求的解析可以基于在当前会话中的之前的 话语、之前会话中的话语、基于情境的信息、局部的和/或全局的用户 描述或者其它信息。例如,可以基于包含在之后的请求中的信息再次 解析之前的请求,可以基于包含在之前的请求中的信息解析当前请求, 等等。此外,会话式交互可以是各种形式,包括基于询问的会话、教 导会话、探索性会话或其它类型的会话。例如,会话式语言处理器可 以识别会话的类型,并且可以相应地从话语中提取信息,以便在操作 310中识别一个或多个请求。此外,会话式语言处理器可以确定任意 请求是否不完整或模糊,并且可以相应釆取行动(例如系统响应可以 提示用户澄清不完整的和/或模糊的请求)。因此会话式语言处理器可 以利用各种技术识别会话类型、解析话语、识别请求或执行其它任务, 例如在前面提到的共同待审的专利申请中所描述的,其中这些申请被 整体结合于此作为参考。
028
一旦识别了一个或多个请求,就可以在操作315中基于 识别的请求采取行动,同时可以在操作320中选择一 个或多个广告(下 文中将详细描述)。例如,可以在操作315中调用一个或多个情境适当 的应用程序以服务所述请求(例如语音搜索引擎、导航应用程序、电 子商务应用程序或其它可以基于请求而调用的应用程序)。此外,在操 作"0中,信息可以被传达给广告服务器,以便选择与所述请求相关 的一个或多个广告。因此,如图3中所示,在操作315中釆取行动和 在操作中选择广告可以是相关的操作(例如可以选择广告以帮助 解析不完整的和/或模糊的请求)。
029
一旦在操作315中釆取行动(例如服务所述请求)并且在 操作320中选择一个或多个广告(例如与所述请求相关),则可以在操 作325中向用户演示输出。所述输出可以指示与操作315相关的行动 的结果。例如,输出可以包括被请求的信息、被请求任务是否成功完 成的指示、是否需要额外的信息为请求服务(例如包括对信息的提示)或者其它与基于请求做出的行动相关的信息。此外,所述输出可以包
括广告,如在操作320中选择的。例如,所述输出可以包括基于文本 的、基于图像的、基于视频的、基于音频的或其它类型的广告,这对 本领域技术人员来说是显而易见的。此外,所迷输出可以包括其它类 型的广告,包括号召行动(例如基于位置的优惠券或购买机会、试用 下载或者其它可操作的广告或营销)。
030可以联系请求基于各种标准来选择广告。例如,可以基于 请求的词语或其它内容、涉及请求的词语或其它内容的相关词语或内 容来选择广告,等等。在另一个示例中,可以基于被请求的任务/信息 选择广告(例如电影放映的请求可能会导致选择特定影院的广告)。在 另一个示例中,可以基于与被请求任务/信息相关的主题或类型选择广 告(例如,购买机票的请求可以导致选择与预定航线相关的目的地的 酒店的广告)。在另一个示例中,可以基于位置信息(例如可以基于利 用导航设备识别的用户的地理位置附近来选择广告)、用户特定的和/ 或全局的用户描述(例如可以基于用户特定的和/或全局的喜好、广告 商活动标准等选择广告)选择广告。
031基于语音的输入的内容可以根据各种标准确定,包括情境 或概念上的信息(例如语义指示符、限定词或其它信息)。例如,给定 的概念可以包括各种语义上等价的具有相同意思的指示符。因此,例 如,基于语音的输入可以是"播放歌曲!"、"播放音乐,,或其它变化形 式,其每一个都可以被解析为与特定主题(或概念)"音乐"相关。因 此,请求中的概念或内容信息可以用于选择广告。例如,用户可以请 求计算华盛顿州西雅图市的路线(例如"我如何到达Space Needle ")。基于被请求的任务的情境(例如"导航","西雅图"等), 语音搜索引擎可以检索Space Needle的地址,而导航应用程序可以计 算路线。此外,用户描述信息可以指示用户正在从城外访问西雅图(例 如所述描述可以显示出用户的家在Sacramento),因此,可以选择西 雅图的流行景点的广告。在另一个示例中,用户可以请求与体育事件 相关的信息(例如"给我周日老鹰队比赛的开场时间")。基于被请求信息的情境(例如"搜索"、"体育"、"费城"等),可以对被请求的信息重 新进行搜索,同时可选择老鹰队的队服或纪念品的广告。
032] 在各实例中,包含在请求中或可以从请求中推断出的概 念、语义指示符、限定词或其它信息可以指示出请求的探索性质。换 句话说,探索性请求可以识别会话的目标,而不是要执行的特殊任务 或要检索的信息。同样的,在各种应用中,为了使会话朝向所述目标 发展,可以在操作320中选择广告。例如,探索性请求可以包括导航 路线的请求(例如"我想到博物馆去,帮我找出一些有趣的东西,,)。基 于被请求任务的情境(例如"导航","景点"等),可以识别会话的目标, 并且可以在操作315中服务所述请求(例如语音搜索引擎可以基于用 户优选的主题定位附近的景点)。此外,广告应用程序可以在操作320 中选择适当的广告,其中广告可选择成尝试使得所述会话朝向所述目 标发展。例如,统计学描述(例如用户描述、全局描述、基于主题的
计或其它特性的其它用户之间的密切关系。因此,除了在搮作315中 重新检索有关博物馆的信息,还可以在操作320中选择用户可能会感 兴趣的博物馆的广告。
033在各种实例中,请求可以包括不完整的、模糊的、未能识 别的或其它不充分的语义指示符、情境、限定词或其它识别所述请求 所需的信息。换句话说,所述请求可以包括要识别的不充分的信息或 者推断要执行的任务、要检索的信息或会话的目标。因此,可以基于 共享的知识从所述请求中提取和/或推断出尽可能多的信息,该共享的 知识为比如情境、用户或全局描述信息、之前的话语、之前的会话等。 同样的,服务所述请求可以包括生成响应和/或与广告应用程序通讯, 以便使会话朝向可服务的请求发展。例如,在操作315中服务所述请
之后的用户输入,从而使会话向前发展。 例如,所述请求可以包括不完整的、模糊的或未能识别的 信息(例如"你知道[含糊的词语l西雅图吗?")。可以识别^C请求的任务的情境(例如"西雅图"),但是被识别的情境不足以合适地采取行动 以服务所述请求。可以基于会话中之前的话语、描述信息或其它信息 推断出额外的信息。但是,当额外信息不能提供充足的信息以推断出
合理的假设时,在操作315中服务所述请求可以包括生成响应以进展 之后的用户输入并且使会话向前发展(例如可以基于用户的优选主题 检索关于各主题的信息)。此外,在操作320中广告应用程序可以选择 广告,以便使会话向前发展(例如可以基于反映出与西雅图有关的特 定广告和用户喜好、描迷等之间的密切关系的用户和/或全局描迷来选 择广告)。因此,通过选择广告、指出广告不令人满意的地方或者与广 告交互,所述交互可以用于为之后的会话过程建立情境和共享的知识。 例如,用户可以选择广告,并且对之后基于语音的输入的解析(例如"电 话通知他们","价格范围是多少?"等)可以用基于语音的输入所涉及 的广告的共享知识进行解析。因此,广告可以以使广告商向消费者推 销的方式进行使用,同时改进消费者与设备的交互。其它的优点对本 领域技术人员来说是显而易见的。
035显而易见的是,操作320可以利用各种技术基于语音输入 和/或包含于语音输入中的请求选择广告。例如,广告商可以限定目标 观众、营销标准、活动策略、预算限制、概念、语义指示符、相关主 题、类型和/或与广告相关的任何其它适当的信息。例如,广告商可以 支付额外费用以使一广告相对于类似广告(例如与竟争者相关的广告) 处于优先位置。在另一个示例中,各种统计学描述可以定义广告、主 题、用户等之间的密切关系(例如基于点击率或转换率、或其它追踪 信息,如下文中将详细描述的)。因此,可以在操作320中利用各种技 术包括请求的内容、与所述请求相关的行为/行动、用户描述、用户喜 好、统计规格、广告商特定标准来选择广告,以使会话向前发展、解 决模糊的请求,或者利用其它方式,这是显而易见的。
036在操作325中向用户演示的输出可以以各种方式提供给 用户。例如,在各种应用中,输出可以包括基于语音或音频的响应。 在另一个示例中,当相关设备包括显示设备时,输出可以显示在显示设备上。显而易见的是,还可以使用上述方式的许多组合或变形,如 利用显示设备上的信息增强语音响应。例如,用户可以请求与餐馆有 关的信息,广告可以基于指示出用户最喜爱某种类型的餐厅的用户喜 好进行选择(例如可以基于指示出用户喜好中餐的用户描述来选择中
餐馆)。因此,在一个示例中,在操作325中演示的输出可以显示与请 求信息匹配的各个餐馆的信息,同时可以向用户演示中餐馆的语音广 告(例如通过麦克风或其它向用户播放语音的适当的设备)。许多其它 的变形也是显而易见的(例如,可以在显示设备上显示图形广告,同 时可以以音频播放对应的或不同的语音广告)。 可以在操作345中追踪用户广告交互。例如,操作345可 以追踪与用户、会话、主题、情境或其它标准有关的历史数据,以便 将信息与所选广告联系在 一 起。因此追踪信息可以用于建立统计学描 述,该统计学描述定义了密切关系、点击率或转换率,或者其它与各 广告、主题相关的信息或其它在用户特定和/或全局用户水平上的标 准。因此,可以在广告、主题、概念、统计或其它基于用户对广告的行为的标准(例如用户是否在操作330中与广告交互)之间生成组或 图。 本发明的各方面和实施方式可以被描述为包括特定特征、 结构或特性,但每个方面或实施方式都不是必须包括所述特定特征、 结构或特性。此外,当将某特定特征、结构或特性与某一方面或实施 方式结合在一起描述时,应当认为无论是否清楚地加以描述,该特征、 结构、或特性与其它方面或实施方式的结合都是显而易见。因此,在 不背离本发明的范围和精神的前提下可以做出各种变化和修改。说明 书和附图
应当认为仅仅是示例性的,本发明的范围应当根据所附权利 要求加以确定。
权利要求
1、一种响应基于语音的输入选择和演示广告的方法,所述方法包括接收基于语音的输入,所述接收到的基于语音的输入包括请求;基于所述接收到的请求从至少一个知识源中检索信息;基于所述接收到的请求和所述检索到的信息选择广告;以及向用户演示所选择的广告。
2、 根据权利要求1所述的方法,其中所述检索到的信息涉及所述 基于语音的输入的内容、与所述请求相关的行动、所述用户的位置、 特定用户描述或全局用户描述中的一个或多个。
3、 根据权利要求1所述的方法,其中选择所述广告包括当所述接 收到的输入所包括的信息不足以解决所述请求时识别与解决所述请求 相关的广告。
4、 根据权利要求1所述的方法,还包括追踪所述用户与所述被演 示的广告之间的交互。
5、 根据权利要求4所述的方法,其中所述追踪用于建立一个或多 个用户的统计学描述。
6、 根据权利要求5所述的方法,其中所述统计学描述识别一个或 多个广告、概念、类型和/或用户描述之间的密切关系。
7、 根据权利要求4所述的方法,其中所述追踪用来建立用于解析 之后的基于语音的输入的情境。
8、 根据权利要求4所述的方法,还包括响应所述交互采取行动。
9、 根据权利要求8所述的方法,其中所述行动包括基于所述交互 执行任务和/或检索信息。
10、 根据权利要求1所述的方法,其中所述至少一个知识源包括 用户的一般公共信息和用户的特定私人信息。
11、 一种用于响应基于语音的输入选择和演示广告的系统,所述 系统包4舌至少一个输入设备,其接收基于语音的输入,所述接收到的基于语音的输入包括请求;以及至少一个处理器,其能够操作以便基于所述接收到的请求从至少 一 个知识源中检索信息;基于所述接收到的请求和所述检索到的信息选择广告;以及向用户演示所选择的广告。
12、 根据权利要求11所述的系统,其中所述检索到的信息涉及所述基于语音的输入的内容、与所述请求相关的行动、所述用户的位置、特定用户描述或全局用户描述中的一个或多个。
13、 根据权利要求11所述的系统,其中选择所述广告包括当所述接收到的输入所包括的信息不足以解决所述请求时识别与解决所述请求相关的广告。
14、 根据权利要求11所述的系统,还包括追踪所述用户与所述被演示的广告之间的交互。
15、 根据权利要求14所述的系统,其中所述追踪用于建立一个或多个用户的统计学描述。
16、 根据权利要求15所述的系统,其中所述统计学描述识别一个或多个广告、概念、类型和/或用户描述之间的密切关系。
17、 根据权利要求14所述的系统,其中所述追踪用来建立用于解析之后的基于语音的输入的情境。
18、 根据权利要求14所述的系统,还包括响应所述交互采取行动。
19、 根据权利要求18所述的系统,其中所述行动包括基于所述交互执行任务和/或检索信息。
20、 根据权利要求11所述的系统,其中所述至少一个知识源包括用户的 一般公共信息和用户的特定私人信息。
全文摘要
本发明提供一种基于语音输入的自然语言处理选择和演示广告的系统和方法。用户话语可以在输入设备处被接收,并且会话式自然语言处理器可以识别话语中的请求。基于被识别的请求可以选择和向用户演示至少一个广告。所述广告可以演示为自然语言响应,因此使广告的演示生成一种会话式的感觉。可以追踪所述请求和用户随后与广告的交互,以便建立用户统计学描述,从而增强之后对广告的选择和演示。
文档编号G06Q30/00GK101689267SQ200880009312
公开日2010年3月31日 申请日期2008年2月6日 优先权日2007年2月6日
发明者M·肯尼威克, T·弗里曼 申请人:沃伊斯博克斯科技公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1