语音搜索方法、装置和系统的制作方法

文档序号：2827767阅读：182来源：国知局

语音搜索方法、装置和系统的制作方法
【专利摘要】本发明提出一种语音搜索方法、装置和系统，其中，所述语音搜索方法，包括以下步骤：接收用户的语音搜索请求；对语音搜索请求进行意图解析，以获取用户的搜索意图；根据用户的搜索意图获取搜索结果；以及根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并将语音对话结果提供给用户。本发明的语音搜索方法，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
【专利说明】语音搜索方法、装置和系统

【技术领域】
[0001]本发明涉及语音搜索【技术领域】，特别涉及一种语音搜索方法、装置和系统。

【背景技术】
[0002]随着语音识别技术的发展，语音搜索已逐步应用于各种终端设备中。目前的语音搜索产品通过对用户输入的搜索语音进行语音识别，以将搜索语音转换成文字，并分析出其中的关键字，然后根据关键字搜索相匹配的搜索结果或者根据关键字在问答系统的数据库中查询对应的问答结果，并将搜索结果以语音、网页、文字等形式展现给用户。
[0003]但是，用户输入的语音往往都是偏口语化的表达，而如果跟进由此转换成的文本中提取的关键进行检索，结果的命中率会很差。特别是在连续的语音搜索中，口语的表达还依赖于用户之前搜索的上下文，缺乏这些上下文的文本检索也会造成结果的不准确。而基于问答系统的虽然能够结合上下文给出回答，但是给出的回答结果是从数据库中查询的到的固定的单一的文本回答，没有和真正相应的检索资源相匹配，难以满足用户的需求。

【发明内容】

[0004]本发明旨在至少在一定程度上解决上述技术问题。
[0005]为此，本发明的第一个目的在于提出一种语音搜索方法，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加智能、精准地满足了用户需求。
[0006]本发明的第二个目的在于提出一种语音搜索装置。
[0007]本发明的第三个目的在于提出一种语音搜索系统。
[0008]为达上述目的，根据本发明第一方面实施例提出了一种语音搜索方法，包括以下步骤:接收用户的语音搜索请求；对所述语音搜索请求进行意图解析，以获取所述用户的搜索意图；根据所述用户的搜索意图获取搜索结果；以及根据所述搜索结果和所述用户的搜索意图生成所述语音搜索请求的语音对话结果，并将所述语音对话结果提供给所述用户。
[0009]本发明实施例的语音搜索方法，可对用户的语音搜索请求进行意图解析以获取用户的搜索意图，并根据用户的搜索意图获取搜索结果，从而可根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并转换成语音提供给用户，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
[0010]本发明第二方面实施例提供了一种语音搜索装置，包括:接收模块，用于接收用户的语音搜索请求；意图解析模块，用于对所述语音搜索请求进行意图解析，以获取所述用户的搜索意图；获取模块，用于根据所述用户的搜索意图获取搜索结果；生成模块，用于根据所述搜索结果和所述用户的搜索意图生成所述语音搜索请求的语音对话结果；以及第一提供模块，用于将所述语音对话结果提供给所述用户。[0011 ] 本发明实施例的语音搜索装置，可对用户的语音搜索请求进行意图解析以获取用户的搜索意图，并根据用户的搜索意图获取搜索结果，从而可根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并转换成语音提供给用户，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
[0012]本发明第三方面实施例提供了一种语音搜索系统，包括客户端和本发明第二方面实施例额语音搜索装置。
[0013]本发明实施例的语音搜索系统，可对用户的语音搜索请求进行意图解析以获取用户的搜索意图，并根据用户的搜索意图获取搜索结果，从而可根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并转换成语音提供给用户，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
[0014]本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

【专利附图】

【附图说明】
[0015]本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中:
[0016]图1为根据本发明一个实施例的语音搜索方法的流程图；
[0017]图2为根据本发明一个实施例的S102的具体实现方法的流程图；
[0018]图3为根据本发明另一个实施例的语音搜索方法的流程图；
[0019]图4为根据本发明一个实施例的语音搜索装置的结构示意图；
[0020]图5为根据本发明一个具体实施例的语音搜索装置的结构示意图；
[0021]图6为根据本发明另一个实施例的语音搜索装置的结构示意图；
[0022]图7为根据本发明又一个实施例的语音搜索装置的结构示意图；
[0023]图8为根据本发明一个实施例的语音搜索系统的结构示意图；
[0024]图9为根据本发明一个具体实施例的语音搜索系统的工作原理示意图。

【具体实施方式】
[0025]下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。
[0026]在本发明的描述中，需要理解的是，术语“多个”指两个或两个以上；术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。
[0027]下面参考附图描述根据本发明实施例的语音搜索方法、装置和系统。
[0028]为了，本发明提出了一种，语音搜索方法，包括以下步骤:接收用户的语音搜索请求；对语音搜索请求进行意图解析，以获取用户的搜索意图；根据用户的搜索意图获取搜索结果；以及根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并将语音对话结果提供给用户。
[0029]图1为根据本发明一个实施例的语音搜索方法的流程图。如图1所示，根据本发明实施例的语音搜索方法，包括:
[0030]SlOl，接收用户的语音搜索请求。
[0031]在本发明的一个实施例中，语音搜索请求为用户进行搜索时输入的语音。举例来说，如果用户希望搜索明天的天气，可输入语音“明天天气怎么样”。
[0032]S102，对语音搜索请求进行意图解析，以获取用户的搜索意图。
[0033]在本发明的一个实施例中，如图2所示，对语音搜索请求进行意图解析可具体包括:
[0034]S201，对语音搜索请求进行语音识别，以获取语音搜索请求中的搜索关键字。
[0035]在本发明的实施例中，对语音搜索请求进行语音识别后可得到用户输入的语音对应的文字内容，并可对得到的文字内容进行语义分析，以获取其中的搜索关键字。举例来说，对于语音搜索请求“明天天气怎么样”，可通过语音识别，分析出搜索关键字为“明天”和“天气”。
[0036]S202，根据所述搜索关键字获取所述语音搜索请求的上下文信息。
[0037]其中，语音搜索请求的上下文信息为用户历史输入的与该语音搜索请求相关联的内容，可为语音或者文字内容。具体地，可通过对话问答系统(DA&QA)记录用户历史输入的内容，另外，对话问答系统中还包括了一些常用的问题-回答结果。因此，可根据语音搜索请求的搜索关键字在对话问答系统中查询到语音搜索请求相关联的内容，从而得到语音搜索请求的上下文信息。
[0038]S203，根据所述语音搜索请求的上下文信息解析所述用户的搜索意图。
[0039]在本发明的实施例中，由于用户在输入语音搜索请求时，可能根据已输入的内容进行省略或简要输入。因此，可根据用户输入的语音搜索请求对应的上下文信息将语音搜索请求的内容补充完整，并进一步进行语音分析以得到用户的搜索意图。
[0040]举例来说，例如，当用户输入语音搜索请求“适合洗车么”时，查询到用户之前已对“明天天气怎么样”进行了搜索，则可根据“明天天气怎么样”将语音搜索请求“适合洗车么”补充完整为“明天天气适合洗车么”，即可得到用户的搜索意图为“明天的天气是否适合洗车”。
[0041]S103，根据用户的搜索意图获取搜索结果。
[0042]在本发明的实施例中，在解析出用户的搜索意图后，即可根据用户的搜索意图获取对应的搜索结果。举例来说，对于用户的搜索意图“明天的天气是否适合洗车”，获取明天的天气，并获取洗车需要的天气条件，并在明天天气适合洗车时，还可进一步获取洗车相关的信息，如洗车注意事项、技巧等。
[0043]S104，根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并将语音对话结果提供给用户。
[0044]具体地，在本发明的一个实施例中，可根据结果生成与用户搜索意图相对应的对话结果，例如，对于用户的搜索意图“明天的天气十分适合洗车”，根据搜索结果“明天晴天，微风”以及适合洗车的天气，可组合生成一个与用户搜索意图对应的对话回答“明天晴天微风，适合洗车”。由此，可智能地针对用户输入的语音搜索请求给出对应的语音回答。
[0045]本发明实施例的语音搜索方法，可对用户的语音搜索请求进行意图解析以获取用户的搜索意图，并根据用户的搜索意图获取搜索结果，从而可根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并转换成语音提供给用户，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
[0046]在本发明的一个实施例中，在根据用户的搜索意图获取搜索结果之后可还包括:对搜索结果进行渲染，并提供搜索结果展示页面，以展示渲染后的搜索结果，可通过文字、图片等视觉展示形式展示给用户，从而，能够为用户提供更丰富、多样化的搜索结果，便于用户获取所需要的信息，进一步提升了用户的搜索体验。
[0047]图3为根据本发明另一个实施例的语音搜索方法的流程图。
[0048]如图3所示,该语音搜索方法,包括:
[0049]S301，接收用户的语音搜索请求。
[0050]在本发明的一个实施例中，语音搜索请求为用户进行搜索时输入的语音。举例来说，如果用户希望搜索明天的天气，可输入语音“明天天气怎么样”。
[0051]S302，对语音搜索请求进行意图解析，以获取用户的搜索意图。
[0052]在本发明的一个实施例中，对语音搜索请求进行意图解析可具体包括如图2所示的步骤:
[0053]S201，对语音搜索请求进行语音识别，以获取语音搜索请求中的搜索关键字。
[0054]在本发明的实施例中，对语音搜索请求进行语音识别后可得到用户输入的语音对应的文字内容，并可对得到的文字内容进行语义分析，以获取其中的搜索关键字。举例来说，对于语音搜索请求“明天天气怎么样”，可通过语音识别，分析出搜索关键字为“明天”和“天气”。
[0055]S202，根据所述搜索关键字获取所述语音搜索请求的上下文信息。
[0056]其中，语音搜索请求的上下文信息为用户历史输入的与该语音搜索请求相关联的内容，可为语音或者文字内容。具体地，可通过对话问答系统(DA&QA)记录用户历史输入的内容，另外，对话问答系统中还包括了一些常用的问题-回答结果。因此，可根据语音搜索请求的搜索关键字在对话问答系统中查询到语音搜索请求相关联的内容，从而得到语音搜索请求的上下文信息。
[0057]S203，根据所述语音搜索请求的上下文信息解析所述用户的搜索意图。
[0058]在本发明的实施例中，由于用户在输入语音搜索请求时，可能根据已输入的内容进行省略或简要输入。因此，可根据用户输入的语音搜索请求对应的上下文信息将语音搜索请求的内容补充完整，并进一步进行语音分析以得到用户的搜索意图。
[0059]举例来说，例如，当用户输入语音搜索请求“适合洗车么”时，查询到用户之前已对“明天天气怎么样”进行了搜索，则可根据“明天天气怎么样”将语音搜索请求“适合洗车么”补充完整为“明天天气适合洗车么”，即可得到用户的搜索意图为“明天的天气是否适合洗车”。
[0060]S303，根据用户的搜索意图获取搜索结果。
[0061]在本发明的实施例中，在解析出用户的搜索意图后，即可根据用户的搜索意图获取对应的搜索结果。举例来说，对于用户的搜索意图“明天的天气是否适合洗车”，获取明天的天气，并获取洗车需要的天气条件，并在明天天气适合洗车时，还可进一步获取洗车相关的信息，如洗车注意事项、技巧等。
[0062]S304，根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果。
[0063]具体地，在本发明的一个实施例中，可根据结果生成与用户搜索意图相对应的对话结果，例如，对于用户的搜索意图“明天的天气十分适合洗车”，根据搜索结果“明天晴天，微风”以及适合洗车的天气，可组合生成一个与用户搜索意图对应的对话回答“明天晴天微风，适合洗车”。由此，可智能地针对用户输入的语音搜索请求给出对应的回答。
[0064]S305，对语音搜索请求进行特征识别，以获取用户的语音特征。
[0065]其中，用户的语音特征包括用户的身份特征数据、年龄特征数据和用户所处的地区特征数据中的一种或多种。
[0066]在本发明的实施例中，用户的身份特征数据可包括用户的性别信息；年龄特征数据为用户所属的年龄阶段，如青少年、中年、老年等；可获取所述日常语音数据的基频特征，并根据所述基频特征获取所述用户的身份特征数据和/或年龄特征数据。基频特征是指声音中最低且通常情况下最强的频率，通常被认为是声音的基础音调。男性和女性的声音的基频特征以及不同年龄段的人的声音的基频都具有较大的区别，因此可预先根据不同性别对应的基频特征和不同年龄段对应的基频特征的建立基频特征数据库。从而将据获取的到的用户的日常语音数据的基频特征与基频特征数据库中的基频特征进行比对，以得到该用户的身份特征数据和/或年龄特征数据。
[0067]用户所处的地区特征是指用户所在地或者用户的籍贯地区，可根据用户所使用语言类型来判断。语言类型可包括不同语种、方言等，例如、英语、日语、韩语、阿拉伯语、粤语、四川方言等。具体地，可对所述日常语音数据进行语义解析，以获取所述日常语音数据所属的语言类型，并根据所述所属的语言类型获取所述用户所处的地区特征数据。在对日常语音数据进行语义解析后，可得到语音的具体内容。然后，根据具体内容中的词汇、语义等于预先建立的语言词汇数据库进行比对，其中，语言词汇数据库中包括不同语言类型对应的词汇库。从而可根据用户的日常语音数据对应的词汇比对出对应的语言类型，并进一步预测出该用户所处的地区特征数据。例如，如果用户使用的是葡萄牙语，则用户可能为来自葡萄牙语使用国的用户或者用户正处于葡萄牙语使用国，如果用户使用的是粤语，则用户可能为来自广东、香港等地的用户或者用户正处于广东、香港等地。
[0068]S306，根据用户的语音特征判断用户所使用的语言类型。
[0069]在本发明的实施例中，可根据用户所处的地区特征数据判断用户所使用的语言类型，例如，如果用户所处地区特征数据对应的是四川，则可知用户使用的语言类型为四川方言。
[0070]在本发明的另一个实施例中，步骤S305和S306也可在步骤S303之前执行，或者，步骤S305和S306也可与步骤S303和S304同时并行执行。
[0071]S307，根据用户所使用的语言类型对语音对话结果进行类型转换，并将类型转换后的语音对话结果提供给用户。
[0072]举例来说，如果用户使用的语音类型为四川方言，则可将语音对话结果转换四川方言后提供给用户。
[0073]S308，根据用户的语音特征对多个搜索结果进行排序，并将排序后的搜索结果在搜索结果展示页面中进行展示。
[0074]在本发明的实施例中，可根据用户的不同语音特征对搜索结果进行排序，具体地，可增加与用户的语音特征相匹配的结果的排序权重，以使其展示能够优先展示，更符合用户的个性化需求。
[0075]举例来说，如果用户搜索A地附近美食，而该用户的所处地域特征数据为四川，则可将搜索结果中川菜排在前面提供给用户，如果用户为青年女性用户，则可将一些美容、养眼的美食排在前面提供给用户，从而能够满足不同用户的多样化及个性化需求。
[0076]其中，S308是可选的。
[0077]本发明实施例的语音搜索方法，可根据语音搜索请求获取用户的语音特征，并根据语音特征将语音对话结果转换为符合用户使用的语言类型，还可根据用户的语音特征对搜索结果进行排序，能够满足不同用户的多样化和个性化需求，便于用户快速准确的获取需要的资源，进一步提升了用户的搜索体验。
[0078]为了实现上述实施例，本发明还提出一种语音搜索装置。
[0079]—种语音搜索装置，包括:接收模块，用于接收用户的语音搜索请求；意图解析模块，用于对语音搜索请求进行意图解析，以获取用户的搜索意图；获取模块，用于根据用户的搜索意图获取搜索结果；生成模块，用于根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果；以及第一提供模块，用于将语音对话结果提供给用户。
[0080]图4为根据本发明一个实施例的语音搜索装置的结构示意图。
[0081]如图4所示，根据本发明实施例的语音搜索装置，包括:接收模块10、意图解析模块20、获取模块30、生成模块40和第一提供模块50。
[0082]具体地，接收模块10用于接收用户的语音搜索请求。在本发明的一个实施例中，语音搜索请求为用户进行搜索时输入的语音。举例来说，如果用户希望搜索明天的天气，可输入语音“明天天气怎么样”。接收模块10即可接收到语音搜索请求“明天天气怎么样”。
[0083]意图解析模块20用于对语音搜索请求进行意图解析，以获取用户的搜索意图。更具体地，在本发明的一个实施例中，如图5所示，意图解析模块20具体包括:语音识别单元21、获取单元22和解析单元23，其中，
[0084]语音识别单元21用于对语音搜索请求进行语音识别，以获取语音搜索请求中的搜索关键字；在本发明的实施例中，语音识别单元21对语音搜索请求进行语音识别后可得到用户输入的语音对应的文字内容，并可对得到的文字内容进行语义分析，以获取其中的搜索关键字。举例来说，对于语音搜索请求“明天天气怎么样”，可通过语音识别，分析出搜索关键字为“明天”和“天气”。
[0085]获取单元22用于获取语音搜索请求对应的上下文信息；其中，语音搜索请求的上下文信息为用户历史输入的与该语音搜索请求相关联的内容，可为语音或者文字内容。更具体地，获取单元22可通过对话问答系统(DA&QA)记录用户历史输入的内容，另外，对话问答系统中还包括了一些常用的问题-回答结果。因此，获取单元22可根据语音搜索请求的搜索关键字在对话问答系统中查询到语音搜索请求相关联的内容，从而得到语音搜索请求的上下文信息。
[0086]解析单元23用于根据所述搜索关键字获取所述语音搜索请求的上下文信息。在本发明的实施例中，由于用户在输入语音搜索请求时，可能根据已输入的内容进行省略或简要输入。因此，解析单元23可根据用户输入的语音搜索请求对应的上下文信息将语音搜索请求的内容补充完整，并进一步进行语音分析以得到用户的搜索意图。
[0087]举例来说，例如，当用户输入语音搜索请求“适合洗车么”时，查询到用户之前已对“明天天气怎么样”进行了搜索，则可根据“明天天气怎么样”将语音搜索请求“适合洗车么”补充完整为“明天天气适合洗车么”，即可得到用户的搜索意图为“明天的天气是否适合洗车”。
[0088]获取模块30用于根据用户的搜索意图获取搜索结果。在本发明的实施例中，在解析出用户的搜索意图后，获取模块30即可根据用户的搜索意图获取对应的搜索结果。举例来说，对于用户的搜索意图“明天的天气是否适合洗车”，获取明天的天气，并获取洗车需要的天气条件，并在明天天气适合洗车时，还可进一步获取洗车相关的信息，如洗车注意事项、技巧等。
[0089]生成模块40用于根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果。更具体地，在本发明的一个实施例中，生成模块40可根据结果生成与用户搜索意图相对应的对话结果，例如，对于用户的搜索意图“明天的天气十分适合洗车”，根据搜索结果“明天晴天，微风”以及适合洗车的天气，可组合生成一个与用户搜索意图对应的对话回答“明天晴天微风，适合洗车”。
[0090]第一提供模块50用于将语音对话结果提供给用户。
[0091]由此，可智能地针对用户输入的语音搜索请求给出对应的回答。
[0092]本发明实施例的语音搜索装置，可对用户的语音搜索请求进行意图解析以获取用户的搜索意图，并根据用户的搜索意图获取搜索结果，从而可根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并转换成语音提供给用户，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
[0093]图6为根据本发明另一个实施例的语音搜索装置的结构示意图。
[0094]如图6所示，根据本发明实施例的语音搜索装置，包括:接收模块10、意图解析模块20、获取模块30、生成模块40、第一提供模块50和第二提供模块60。
[0095]具体地，第二提供模块60用于对所述搜索结果进行渲染，并提供搜索结果展示页面，以展示所述渲染后的搜索结果。第二提供模块60可通过文字、图片等视觉展示形式展示给用户，从而能够为用户提供更丰富、多样化的搜索结果，便于用户获取所需要的信息，进一步提升了用户的搜索体验。
[0096]图7为根据本发明又一个实施例的语音搜索装置的结构示意图。
[0097]如图7所示，根据本发明实施例的语音搜索装置，包括:接收模块10、意图解析模块20、获取模块30、生成模块40、第一提供模块50、第二提供模块60、特征识别模块70、转换模块80和排序模块90。
[0098]具体地，特征识别模块70用于在接收用户的语音搜索请求之后对语音搜索请求进行特征识别，以获取用户的语音特征。用户的语音特征包括用户的身份特征数据、年龄特征数据和用户所处的地区特征数据中的一种或多种。其中，用户的语音特征包括用户的身份特征数据、年龄特征数据和用户所处的地区特征数据中的一种或多种。
[0099]在本发明的实施例中，用户的身份特征数据可包括用户的性别信息；年龄特征数据为用户所属的年龄阶段，如青少年、中年、老年等；可获取所述日常语音数据的基频特征，并根据所述基频特征获取所述用户的身份特征数据和/或年龄特征数据。基频特征是指声音中最低且通常情况下最强的频率，通常被认为是声音的基础音调。男性和女性的声音的基频特征以及不同年龄段的人的声音的基频都具有较大的区别，因此特征识别模块70可预先根据不同性别对应的基频特征和不同年龄段对应的基频特征的建立基频特征数据库。从而将据获取的到的用户的日常语音数据的基频特征与基频特征数据库中的基频特征进行比对，以得到该用户的身份特征数据和/或年龄特征数据。
[0100]用户所处的地区特征是指用户所在地或者用户的籍贯地区，特征识别模块70可根据用户所使用语言类型来判断。语言类型可包括不同语种、方言等，例如、英语、日语、韩语、阿拉伯语、粤语、四川方言等。更具体地，特征识别模块70可对所述日常语音数据进行语义解析，以获取所述日常语音数据所属的语言类型，并根据所述所属的语言类型获取所述用户所处的地区特征数据。在对日常语音数据进行语义解析后，可得到语音的具体内容。然后，根据具体内容中的词汇、语义等于预先建立的语言词汇数据库进行比对，其中，语言词汇数据库中包括不同语言类型对应的词汇库。从而可根据用户的日常语音数据对应的词汇比对出对应的语言类型，并进一步预测出该用户所处的地区特征数据。例如，如果用户使用的是葡萄牙语，则用户可能为来自葡萄牙语使用国的用户或者用户正处于葡萄牙语使用国，如果用户使用的是粤语，则用户可能为来自广东、香港等地的用户或者用户正处于广东、香港等地。
[0101]转换模块80用于根据用户的语音特征判断用户所使用的语言类型，以及根据用户所使用的语言类型对语音对话结果进行类型转换，并将类型转换后的语音对话结果提供给用户。在本发明的实施例中，转换模块80可根据用户所处的地区特征数据判断用户所使用的语言类型，例如，如果用户所处地区特征数据对应的是四川，则可知用户使用的语言类型为四川方言，转换模块80可将语音对话结果转换四川方言后提供给用户。
[0102]排序模块90用于在根据用户的搜索意图获取搜索结果之后，根据用户的语音特征对多个搜索结果进行排序，并将排序后的搜索结果在搜索结果展示页面中进行展示。在本发明的实施例中，排序模块90可根据用户的不同语音特征对搜索结果进行排序，更具体地，排序模块90可增加与用户的语音特征相匹配的结果的排序权重，以使其展示能够优先展示，更符合用户的个性化需求。
[0103]举例来说，如果用户搜索A地附近美食，而该用户的所处地域特征数据为四川，则可将搜索结果中川菜排在前面提供给用户，如果用户为青年女性用户，则可将一些美容、养眼的美食排在前面提供给用户，从而能够满足不同用户的多样化及个性化需求。
[0104]其中，排序模块是90可选的。
[0105]本发明实施例的语音搜索装置，可根据语音搜索请求获取用户的语音特征，并根据语音特征将语音对话结果转换为符合用户使用的语言类型，还可根据用户的语音特征对搜索结果进行排序，能够满足不同用户的多样化和个性化需求，便于用户快速准确的获取需要的资源，进一步提升了用户的搜索体验。
[0106]为了实现上述实施例，本发明还提出一种语音搜索系统。
[0107]本发明实施例的语音搜索系统，包括:客户端和本发明上述实施例的语音搜索装置。
[0108]图8为根据本发明一个实施例的语音搜索系统的结构示意图。
[0109]如图8所示，该语音搜索系统，包括客户端100和语音搜索装置200。
[0110]本发明实施例的语音搜索系统，可对用户的语音搜索请求进行意图解析以获取用户的搜索意图，并根据用户的搜索意图获取搜索结果，从而可根据搜索结果和用户的搜索意图生成语音搜索请求的语音对话结果，并转换成语音提供给用户，不再是对搜索结果进行简单的语音播报，而是以对话的形式与输入的语音搜索请求相呼应，更加智能。此外，可分析出用户的搜索意图，并获取相应的搜索结果来生成语音对话结果，更加精准地满足了用户需求，结果更加准确，个性化和人性化。
[0111]图9为根据本发明一个具体实施例的语音搜索系统的工作原理示意图。如图9所示，用户通过客户端输入语音搜索请求后，客户端将该语音搜索请求发送至语音搜索装置。该语音搜索装置包括语音识别功能模块、语音搜索核心IE、对话问答系统(DA&QA)以及0DP(0nline Development Platform,在线开发平台)系统。当语音搜索装置接收到语音搜索请求时，首先由音识别功能模块进行语音识别以获取搜索关键字QUERY和用户的语音特征，语音搜索核心IE在得到语音识别的搜索关键字QUERY和用户的语音特征后请求对话问答系统，对话问答系统可基于用户上下文对当前QUERY做变化进行意图解析，以获取用户的搜索意图，并从资源服务请求对应的资源。问答系统结合请求到的资源和用户的搜索意图给出合理的对话结果，返回给语音搜索核心IE。语音搜索核心IE可将资源的ID (Identity,身份标识码)发送给ODP系统，以使ODP系统获取对应的资源，并使用模板渲染对从资源服务器请求的资源进行渲染，并将渲染结果通过语音搜索核心IE返回给客户端，从而可在搜索结果页面中展示搜索与用户的语音搜索请求对应的搜索结果。
[0112]此外，语音搜索核心IE可根据用户的语音特征(地域、性别等)指导ODP系统做搜索结果的筛选排序，使搜索结果展现更加合理；还可根据用户的地域特征将搜索结果转换成方言或者外语，并通过客户端播放。由此，满足了不同用户的个性化需求。
[0113]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属【技术领域】的技术人员所理解。
[0114]在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPR0M或闪速存储器)，光纤装置，以及便携式光盘只读存储器(⑶ROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
[0115]应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。
[0116]本【技术领域】的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0117]此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0118]上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0119]在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0120]尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同限定。
【权利要求】
1.一种语音搜索方法，其特征在于，包括以下步骤: 接收用户的语音搜索请求；对所述语音搜索请求进行意图解析，以获取所述用户的搜索意图；根据所述用户的搜索意图获取搜索结果；以及根据所述搜索结果和所述用户的搜索意图生成所述语音搜索请求的语音对话结果，并将所述语音对话结果提供给所述用户。
2.如权利要求1所述的语音搜索方法，其特征在于，所述对所述语音搜索请求进行意图解析具体包括: 对所述语音搜索请求进行语音识别，以获取所述语音搜索请求中的搜索关键字；根据所述搜索关键字获取所述语音搜索请求的上下文信息；根据所述语音搜索请求的上下文信息解析所述用户的搜索意图。
3.如权利要求1所述的语音搜索方法，其特征在于，在所述根据所述用户的搜索意图获取搜索结果之后还包括: 对所述搜索结果进行渲染，并提供搜索结果展示页面，以展示所述渲染后的搜索结果。
4.如权利要求1-3任一项所述的语音搜索方法，其特征在于，在接收用户的语音搜索请求之后还包括: 对所述语音搜索请求进行特征识别，以获取所述用户的语音特征；根据所述用户的语音特征判断所述用户所使用的语言类型；根据所述用户所使用的语言类型对所述语音对话结果进行类型转换，并将类型转换后的语音对话结果提供给所述用户。
5.如权利要求4所述的语音搜索方法，其特征在于，所述搜索结果为多个，在所述根据所述用户的搜索意图获取搜索结果之后，还包括: 根据所述用户的语音特征对所述多个搜索结果进行排序，并将排序后的搜索结果在所述搜索结果展示页面中进行展示。
6.如权利要求4或5所述的语音搜索方法，其特征在于，所述用户的语音特征包括所述用户的身份特征数据、年龄特征数据和所述用户所处的地区特征数据中的一种或多种。
7.一种语音搜索装置，其特征在于，包括: 接收模块，用于接收用户的语音搜索请求；意图解析模块，用于对所述语音搜索请求进行意图解析，以获取所述用户的搜索意图；获取模块，用于根据所述用户的搜索意图获取搜索结果；生成模块，用于根据所述搜索结果和所述用户的搜索意图生成所述语音搜索请求的语音对话结果；以及第一提供模块，用于将所述语音对话结果提供给所述用户。
8.如权利要求7所述的语音搜索装置，其特征在于，所述意图解析模块具体包括: 语音识别单元，用于对所述语音搜索请求进行语音识别，以获取所述语音搜索请求中的搜索关键字；获取单元，用于根据所述搜索关键字获取所述语音搜索请求的上下文信息；解析单元，用于根据所述语音搜索请求的上下文信息解析所述用户的搜索意图。
9.如权利要求7所述的语音搜索装置，其特征在于，还包括: 第二提供模块，用于对所述搜索结果进行渲染，并提供搜索结果展示页面，以展示所述渲染后的搜索结果。
10.如权利要求9所述的语音搜索装置，其特征在于，还包括: 特征识别模块，用于在接收用户的语音搜索请求之后对所述语音搜索请求进行特征识另U，以获取所述用户的语音特征；转换模块，用于根据所述用户的语音特征判断所述用户所使用的语言类型，以及根据所述用户所使用的语言类型对所述语音对话结果进行类型转换，并将类型转换后的语音对话结果提供给所述用户。
11.如权利要求10所述的语音搜索装置，其特征在于，所述搜索结果为多个，还包括: 排序模块，用于在所述根据所述用户的搜索意图获取搜索结果之后，根据所述用户的语音特征对所述多个搜索结果进行排序，并将排序后的搜索结果在所述搜索结果展示页面中进行展示。
12.如权利要求9或10所述的语音搜索装置，其特征在于，所述用户的语音特征包括所述用户的身份特征数据、年龄特征数据和所述用户所处的地区特征数据中的一种或多种。
13.一种语音搜索系统，其特征在于，包括: 客户端；如权利要求7-12任一项所述的语音搜索装置。
【文档编号】G10L15/22GK104239459SQ201410443478
【公开日】2014年12月24日申请日期:2014年9月2日优先权日:2014年9月2日
【发明者】张宏驰, 马旭申请人:百度在线网络技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张宏驰;马旭
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：依据环境参数及群体趋向数据的语音识别方法和系统的制作方法
上一篇：一种声音录制的方法及装置制造方法