使用声调细微差别的搜索结果的制作方法

文档序号：9438938阅读：343来源：国知局

使用声调细微差别的搜索结果的制作方法
【专利说明】
【背景技术】
[0001]搜索引擎已经成为用于获得关于多种主题和/或话题的信息的常见常用来源。此夕卜，尽管人们常常使用桌面型或膝上型计算机来与搜索引擎进行交互，但是人们越来越频繁地通过移动设备来与搜索引擎进行交互。当通过移动设备与搜索引擎交互时，变得越发常见的是，人们通过语音输入来与搜索引擎进行交互。
[0002]现今，许多搜索引擎尽很大努力来提供特别为计算机用户定制的高质量的搜索结果和/或广告。其目的在于，改善计算机用户对于搜索引擎的总体体验，以便确保计算机用户返回到所述搜索引擎而非另外的搜索引擎，从而竞争搜索服务。

【发明内容】

[0003]以下的概要被提供来以简要形式介绍概念的选择，下面将在【具体实施方式】中对这些概念进行进一步的描述。本概要既不是旨在标识所要求保护主题的关键特征或必要特征，也不是旨在被用来限制所要求保护主题的范围。
[0004]许多语音到文本的转换系统提供精确结果。然而，语音通信包括人与人的交流可以表达出但是当前在语音到文本的转换中不被捕获的许多发音的细微差别。这些发音的细微差别表达了与人们谈话相关的消息或属性。这些“发音的细微差别”包括关于以下项的属性:性别、年龄、心情、感情、紧迫性、问题、种族、国籍、出身的国家或地区、社会等级等等。
[0005]根据所公开主题的方面，给出了用于对音频查询作出响应的计算机实现的方法。更特别地，响应于接收到发音的搜索查询(即，音频查询)，将音频查询转换为文本表示。除了转换音频查询之外，识别音频查询的发音细微差别。根据音频查询的文本表示并且鉴于发音细微差别来识别搜索结果。响应于音频查询而准备搜索结果呈现，其中搜索结果呈现基于所识别的搜索结果并且还基于发音细微差别。响应于音频查询而返回搜索结果呈现。
[0006]根据所公开主题的附加方面，给出了承载计算机可执行指令的计算机可读介质，所述计算机可执行指令在由处理器执行时实施用于对音频查询作出响应的方法。在执行计算机可执行指令中并且响应于接收到发音搜索查询(即，音频查询)，将音频查询转换为文本表示。除了转换音频查询之外，获得音频查询的发音细微差别。根据音频查询的文本表示并且鉴于发音细微差别来识别搜索结果。响应于音频查询而准备搜索结果呈现，其中搜索结果呈现基于所识别的搜索结果并且还基于发音细微差别。响应于音频查询而返回搜索结果呈现。
[0007]根据所公开主题的另外的方面，给出了用于对音频查询作出响应的计算机系统。计算机系统包括处理器和存储器，其中处理器作为附加组件的一部分或者结合附加组件执行存储器中存储的指令，以对从计算机用户接收的音频查询作出响应。附加组件包括被配置为允许通过网络进行通信的网络通信组件。附加组件还包括音频-文本转换器、发音检测器、搜索结果识别组件和搜索结果呈现生成器。音频-文本转换器被配置为将音频查询转换为音频查询的文本表示。发音检测器被配置为识别音频查询的发音细微差别。响应于接收到来自内容数据存储库的音频查询并且鉴于音频查询的发音细微差别，搜索结果识别组件识别搜索结果。搜索结果呈现生成器基于所识别出的多个搜索结果并且鉴于音频查询的发音细微差别而生成针对发出请求的计算机用户的搜索结果呈现。
[0008]所公开主题的附加方面包括用于提供音频文件的文本表示的计算机实现的服务。在包括处理器、存储器和网络通信组件的计算机系统上实现的服务被配置为，通过网络通信组件从外部的发出请求方接收用于翻译的音频文件。响应于接收到音频文件，所述服务提供音频文件的文本翻译，从音频文件识别出的发音细微差别集合以及与所述发音细微差别集合相对应的置信度/风险值对的集合。
【附图说明】
[0009]所公开主题的前述方面以及许多伴随优势将变得更加容易被意识到，这是因为，当结合下图进行时，通过参照以下描述，它们将被更好地理解，其中。
[0010]图1是图示了适合于实现所公开主题的方面的示例性联网环境的方框图。
[0011]图2是图示了在处理语音查询中在计算设备上的计算机用户与搜索引擎之间的交互的方框图。
[0012]图3是图示了根据所公开主题的方面用于对音频搜索查询作出响应的示例性例程的流程图。
[0013]图4是图示了用于提供音频文件的音频到文本的翻译以及具有对应的置信度/风险值的音频文件的细微差别的示例性例程的流程图。
[0014]图5是图示了根据所公开主题的一个实施例进行配置的示例性搜索引擎的方框图，以及。
[0015]图6是图示了根据所公开主题的一个实施例进行配置的音频-文本翻译服务的方框图。
【具体实施方式】
[0016]出于清楚的目的，本文档中术语“示例性”的使用应当被解释为充当某事项的说明或示例，其不应当被解释为该事项的理想和/或主要的说明。“API”是应用编程接口的缩写，即，旨在用作用于与外部设备和/或软件组件进行通信的接口的协议。“音频查询”应当被解释为在音频文件中捕获的发音搜索查询。“音频文件”应当被解释为包括文档/文件(其含有记录的音频数据(即发音的言语(speech))以及流送的音频数据)二者。
[0017]发音细微差别对应于在对言语进行发音的人/实体上所反映的言语的发音方面。发音细微差别关于人的言语(或言语模式)的方面，并且作为说明而非限制，其可以反映以下各项中的任一项:性别、年龄、心情、感情、紧迫性、问题、种族、国籍、出身的国家或地区、社会等级等等。作为说明，发音细微差别可以基于声调、强调、词语和短语使用、语速等。
[0018]发音的搜索查询的发音细微差别可以用于改善响应于查询的搜索结果。除了帮助搜索引擎在音频查询被翻译成文本表示之后识别更相关的搜索结果之外，发音细微差别还可以用于在识别搜索结果之前修改文本翻译。当然，细微差别也可以在翻译之后用于过滤和/或改进响应于搜索查询而识别出的搜索结果。此外，发音细微差别可以用于增强针对用户的搜索结果的呈现。为了更加全面地意识到所公开主题的这些方面，现在参照图。
[0019]转到图1，图1是图示了适合于实现所公开主题的方面，尤其是关于对来自计算机用户的音频查询作出响应的示例性联网环境100的方框图。所图示的联网环境100包括连接到网络108 (比如因特网、广域网或WAN等等)的一个或多个用户计算机，比如用户计算机102-106。出于本公开的目的，用户计算机是属于计算机用户或者可由计算机用户访问以便使用的计算机或计算设备。搜索引擎110也连接至网络108，所述搜索引擎110被配置为响应于经由网络108通过用户计算机102从一个或多个人/计算机用户(比如计算机用户101)接收的音频查询而提供搜索结果。除了响应于搜索查询尤其是音频查询而提供搜索结果之外，搜索引擎110还被配置为生成搜索结果的呈现，该呈现部分地根据音频查询的发音细微差别进行更新。
[0020]本领域技术人员将意识到，一般而言，搜索引擎110对应于托管在一个或多个计算机或计算系统上的、位于和/或分布在网络108各处的在线服务。搜索引擎110接收通过网络108从各个计算机用户(比如通过网络108使用用户计算机102从计算机用户101)提交的搜索查询，并且对其作出响应。特别地，响应于从计算机用户接收到搜索查询/音频查询，搜索引擎110获得与按照搜索查询定义的所接收的搜索查询以及在音频查询中识别出的一个或多个发音细微差别相关和/或有关的搜索结果信息。搜索结果信息典型地包括搜索结果，即，对于在处于网络108各处的各个网络位置(比如内容站点112-116)处可用的相关和/或有关内容的引用(典型地，以超链接的形式)。其他信息也可以被包括在搜索结果信息中，比如广告、社交信息等等。内容站点可以包括(作为说明而非限制):新闻电台/门户/源，比如新闻内容站点112 ;在线购物站点(未示出);服务站点，比如音频到文本翻译站点114 ;社交媒体和联网站点，比如社交站点116 ;教育和研究站点(未示出)；等等。
[0021]根据所公开主题的方面并且如下文更详细地描述的那样，响应于接收到音频查询，除了将音频查询翻译成文本表示之外，还识别音频查询的一个或多个发音细微差别。所述一个或多个发音细微差别可以用于更新文本表示，包括澄清一个或多个查询项目的模糊之处，校正一个或多个查询项目的拼写错误等等。基于文本表示识别搜索结果，此外，可以根据所述一个或多个发音细微差别来识别搜索结果。基于所识别的搜索结果来准备搜索结果呈现。可以在根据所述一个或多个发音细微差别来识别的搜索结果呈现中包括附加信息。
[0022]图2是图示了在处理语音查询中在计算设备202上的计算机用户201与搜索引擎110之间的交互的方框图200。该过程开始于计算机用户201对着计算机用户的计算设备202对搜索查询进行发音。计算设备202捕获

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D.库塞梅克;L.邓尼尔;H.孔;N.麦;N.克里什纳穆尔蒂;T.L.拿;
技术所有人：微软技术许可有限责任公司;
我是此专利的发明人

上一篇：无模式数据的检测和可视化的制作方法
上一篇：用于向用户设备提供与情境有关的上下文的方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。