一种信息搜索方法及其设备与流程

文档序号:11230493阅读:514来源:国知局
一种信息搜索方法及其设备与流程

本发明涉及语音识别技术领域,尤其涉及一种信息搜索方法及其设备。



背景技术:

随着科技不断的发展与完善,智能手机、可穿戴设备和平板电脑等终端设备已经成为了人们生活中不可或缺的一个部分。语音识别技术在各种终端设备中的应用也日趋成熟,其中,自然语音识别的因其可以识别用户按照个人语言习惯输入的语音,应用前景更为广泛。现有技术中,终端设备的语音识别系统可以识别命令式的语音(例如:识别歌手名、歌曲名或者影视剧名等),实现对多媒体信息的点播,例如,点歌或点播电影等,然而,当用自然语音点播多媒体信息时,终端设备中的语音识别系统由于不能准确理解语音中的关键词信息,降低了点播的成功率。



技术实现要素:

有鉴于此,本发明实施例提供一种信息搜索方法及其设备,可以将自然语音转化为文本信息,再根据文本信息中的字段信息搜索语音信息对应的多媒体信息,提高了终端设备基于自然语音识别的点播系统点播成功率。

为了解决上述技术问题,本发明实施例提供了一种信息搜索方法,所述方法包括:

获取所输入的语音信息,并对所述语音信息进行识别处理以生成所述语音信息对应的文本信息;

对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息;

采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段;

采用所述关键字段和所述目的字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

相应地,本发明实施例还提供了一种信息搜索设备,所述设备包括:

文本信息生成单元,用于获取所输入的语音信息,并对所述语音信息进行识别处理以生成所述语音信息对应的文本信息;

字段信息获取单元,用于对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息;

字段信息分类单元,用于采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段;

媒体信息输出单元,用于采用所述关键字段和所述目的字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

在本发明实施例中,通过获取所输入的语音信息,对语音信息进行识别处理以生成语音信息对应的文本信息,并对文本信息进行分词处理以获取文本信息中的至少一个字段信息,采用预设词汇库在至少一个字段信息中获取语音信息的关键字段和目的字段,最后采用关键字段和目的字段搜索语音信息对应的多媒体信息列表,并输出多媒体信息列表。通过将自然语音转化为文本信息,并对文本信息进行分词处理和词汇匹配处理得到语音信息对应的关键字段和目的字段,再采用关键字段和目的字段搜索语音信息对应的对媒体信息,提高了终端设备基于自然语音识别点播系统的点播成功率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种信息搜索方法的流程示意图;

图2是本发明实施例提供的另一种信息搜索方法的流程示意图;

图3是本发明实施例提供的一种信息搜索设备的结构示意图;

图4是本发明实施例提供的另一种信息搜索设备的结构示意图;

图5是本发明实施例提供的字段信息分类单元的结构示意图;

图6是本发明实施例提供的媒体信息输出单元的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的信息搜索方法可以应用于终端设备利用自然语音识别系统点播多媒体信息(例如:通过识别自然语音,点播歌曲、影视剧、综艺节目等)的应用场景中,例如:通过获取所输入的语音信息,对语音信息进行识别处理以生成语音信息对应的文本信息,并对文本信息进行分词处理以获取文本信息中的至少一个字段信息,采用预设词汇库在至少一个字段信息中获取语音信息的关键字段和目的字段,最后采用关键字段和目的字段搜索语音信息对应的多媒体信息列表,并输出多媒体信息列表。通过将自然语音转化为文本信息,并对文本信息进行分词处理和词汇匹配处理得到语音信息对应的关键字段和目的字段,再采用关键字段和目的字段搜索语音信息对应的对媒体信息,提高了终端设备基于自然语音识别的点播系统的点播成功率。

本发明实施例中所涉及的信息搜索设备可以包括平板电脑、智能手机、可穿戴设备以及移动互联网设备(mid)等具备自然语音识别功能的终端设备。

下面将结合附图1和附图2,对本发明实施例提供的信息搜索方法进行详细介绍。

图1是本发明实施例提供的一种信息搜索方法的流程示意图。如图1所示,本发明实施例中所述的方法可以包括以下步骤s101-步骤s104。

s101,获取所输入的语音信息,并对所述语音信息进行识别处理以生成所述语音信息对应的文本信息。

具体的,所述信息搜索设备可以获取用户所输入的语音信息。可以理解的是,所述语音信息可以是自然语音信息,所述自然语音与指令式语音不同,通过自然语音人们用自己惯用的语气、惯用的词将要表达的意思表达出来(例如,‘播放张磊最流行的民谣’),而指令式语音是机器可以识别的命令词(例如,关灯、开灯、前进、后退等)。

进一步的,所述信息搜索设备可以采用预设的语音识别处理方法(例如,基于深度神经网络(deepneuralnetworks,dnn)的语音识别算法、模糊识别算法或计算机网络工具包(computationalnetworktoolkit,cntk)等)对所述语音信息进行识别处理,并生成所述语音信息对应的文本信息。

s102,对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。

具体的,所述信息搜索设备可以对所述语音信息对应的所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。可以理解的是,所述分词处理可以是基于文本匹配的分词方法、基于条件随机场的分词方法(conditionalrandomfield,crf)、概率统计算法或机器学习方法等。可以理解的是,所述文本信息经过所述分词处理后,可以被分为至少一个字段信息。例如:所述文本信息为“播放张磊最流行的民谣”,则经过所述分词处理后,该文本信息可以被分为的字段信息可以是“播放\张磊\最\流行的\民谣”。

s103,采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段。

具体的,所述信息搜索设备可以采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段。可以理解的是,所述目的字段可以是所述语音信息中的核心词汇,所述关键字段可以是与所述目的字段相关联的用于辅助所述目的字段描述所述语音信息的词汇。例如,当所述语音信息经过处理后得到的所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,所述信息搜索设备采用所述预设词汇库在该字段信息中获取的目的字段可以为“民谣”,关键字段可以为“张磊\最\流行的”。

可以理解的是,所述预设词汇库可以是所述信息搜索设备通过获取用户所输入的训练词汇,并基于预设语法分类方式对所述训练词汇进行分类处理,最后在分类处理后生成的词汇库。可以理解的是,所述预设语法分类方式可以是基于词性的语法分类方式,例如,可以是基于名词属性、形容词属性和副词属性的分类方式,可以理解的是,所述信息搜索设备可以将所述训练词汇中的词汇按照词汇属性进行分类。例如,名词属性的训练词汇分类至名词属性的词汇库,形容词属性的训练词汇分类至形容词属性的词汇库或者副词属性的训练词汇分类至副词属性的词汇库等。

s104,采用所述关键字段和所述目的字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

具体的,所述信息搜索设备可以采用所述关键字段和所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的多媒体信息列表。

可选的,当所述至少一个字段信息中只有目的字段不存在关键字段时,所述信息搜索设备可以采用所述目的字段搜索所述语音信息对应的多媒体信息列表。例如,当语音信息为“我现在想听民谣”时,与之对应的至少一个字段信息可以是“我\现在\想\听\民谣”,其中只有“民谣”这一个目的字段,没有与“民谣”相关的用于对民谣做进一步限定的关键字段,则所述信息搜索设备可以只采用目的字段“民谣”从服务器所在的网络侧搜索出对应的各类民谣。

可选的,当所述至少一个字段信息中既包含目的字段又包含关键字段时,所述信息搜索设备可以采用所述目的字段和所述关键字段搜索所述语音信息对应的多媒体信息列表。例如,当语音信息为“我现在想听欢快的民谣”时,与之对应的至少一个字段信息可以是“我\现在\想\听\欢快的\民谣”,其中“民谣”是目的字段,“欢快的”是关键字段,与民谣相关联用于进一步限定民谣的类型,则所述信息搜索设备可以采用目的字段和关键字段“欢快的民谣”从服务器所在的网络侧搜索出对应类型的民谣。

进一步的,所述信息搜索设备可以输出所述多媒体信息列表。可以理解的是,所述信息搜索设备可以将搜索到的多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述信息搜索设备可以输出所述多媒体信息列表中的多媒体信息对应的多媒体内容。例如,所述信息搜索设备获取到多媒体信息列表(例如,欢快的民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的欢快的民谣歌曲的音频内容。

在本发明实施例中,通过获取所输入的语音信息,对语音信息进行识别处理以生成语音信息对应的文本信息,并对文本信息进行分词处理以获取文本信息中的至少一个字段信息,采用预设词汇库在至少一个字段信息中获取语音信息的关键字段和目的字段,最后采用关键字段和目的字段搜索语音信息对应的多媒体信息列表,并输出多媒体信息列表。通过将自然语音转化为文本信息,并对文本信息进行分词处理和词汇匹配处理得到语音信息对应的关键字段和目的字段,再采用关键字段和目的字段搜索语音信息对应的对媒体信息,提高了终端设备基于自然语音识别点播系统的点播成功率。

请参见图2,为本发明实施例提供了另一种信息搜索方法的流程示意图。如图2所示,本实施例中的所述信息搜索方法可以包括以步骤s201-步骤s210。

s201,获取所输入的训练词汇,基于预设语法分类方式对所述训练词汇进行分类处理,并在分类处理后生成预设词汇库。

具体的,所述信息搜索设备可以获取用户所输入的训练词汇,并可以基于预设语法分类方式对所述训练词汇进行分类处理。可以理解的是,所述预设语法分类方式可以是基于词性的语法分类方式,例如,可以是基于名词属性、形容词属性和副词属性的分类方式,可以理解的是,所述信息搜索设备可以将所述训练词汇中的词汇按照词汇属性进行分类。例如,名词属性的训练词汇分类至名词属性的词汇库,形容词属性的训练词汇分类至形容词属性的词汇库或者副词属性的训练词汇分类至副词属性的词汇库等。

进一步的,所述信息搜索设备对所述训练词汇进行分类处理后可以生成预设词汇库。可以理解的是,所述预设词汇库可以包括第一词汇库、第二词汇库和第三词汇库,所述第一词汇库可以为名词属性的词汇库,所述第二词汇库可以为形容词属性的词汇库,所述第三词汇库可以为副词属性的词汇库。

s202,获取所输入的语音信息,并对所述语音信息进行识别处理以生成所述语音信息对应的文本信息。

具体的,所述信息搜索设备可以获取所输入的语音信息,可以理解的是,所述语音信息可以是自然语音信息(例如,‘播放张磊最流行的民谣’)。

进一步的,所述信息搜索设备可以采用预设的语音识别处理方法(例如,基于dnn的语音识别算法、模糊识别算法或计算机网络工具包cntk等)对所述语音信息进行识别处理,并生成所述语音信息对应的文本信息。

s203,对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。

具体的,所述信息搜索设备可以对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。可以理解的是,所述分词处理可以是基于文本匹配的分词方法、基于crf的分词方法、概率统计算法或机器学习方法等。可以理解的是,所述文本信息经过所述分词处理后,可以被分为至少一个字段信息。例如:所述文本信息为“播放张磊最流行的民谣”,则经过所述分词处理后,该文本信息可以被分为的字段信息可以是“播放\张磊\最\流行的\民谣”。

s204,将所述至少一个字段信息中与所述第一词汇库的第一词汇相匹配的第一字段信息设置为目的字段。

具体的,所述信息搜索设备可以将所述至少一个字段信息中与所述第一词汇库的第一词汇相匹配的第一字段信息设置为目的字段。例如,当所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,“张磊”和“民谣”可以与所述第一词汇库中的词汇即名词属性的词汇相匹配时,所述信息搜索设备可以将“张磊”和“民谣”确定为该语音信息的目的字段。

s205,当所述至少一个字段信息中存在与所述目的字段相关联的,且与所述第二词汇库的第二词汇相匹配的第二字段信息时,将所述第二字段信息确定为第一关键字段。

具体的,当所述至少一个字段信息中存在与所述目的字段相关联的,且与所述第二词汇库的第二词汇相匹配的第二字段信息时,所述信息搜索设备可以将所述第二字段信息确定为第一关键字段。例如,当所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,所述信息搜索设备确定“张磊”和“民谣”为目的字段后,可以确定与该目的字段相关联词汇为“播放”和“流行的”,而与所述第二词汇库中的词汇相匹配的即词性为形容词属性的词汇只有“流行的”,从而所述信息搜索设备可以确定“流行的”为所述至少一个字段信息中的第一关键字段。

s206,当所述至少一个字段信息中存在与所述第一关键字段相关联的,且与所述第三词汇库的第三词汇相匹配的第三字段信息时,将所述第三字段信息确定为第二关键字段。

具体的,当所述至少一个字段信息中存在与所述第一关键字段相关联的,且与所述第三词汇库的第三词汇相匹配的第三字段信息时,所述信息搜索设备可以将所述第三字段信息确定为第二关键字段。例如,当所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,所述信息搜索设备确定“张磊”和“民谣”为目的字段、“流行的”为第一关键字段后,可以确定与“张磊”、“民谣”和“流行的”相关联的词汇为“最”,且“最”与所述第三词汇库中的词汇相匹配,即与词性为副词属性的词汇相匹配,从而所述信息搜索设备可以确定“最”为所述至少一个字段信息中的第二关键字段。

在本发明实施例中,采用预设词汇库将所述至少一个字段信息中的字段信息分类为目的字段、第一关键字段和第二关键字段,通过对字段信息的精确分类,增加了通过字段信息搜索语音信息对应的多媒体信息列表的准确性。

需要说明的是,本发明实施例中所述的目的字段可以是所述至少一个字段信息中的至少一个词汇,所述第一关键字段和所述第二关键字段只是为了区分关键字段的,并不是对关键字段进行排名,可以理解的是,除了第一关键字段和第二关键字段还可以有第三、第四等等关键字段,其他的关键字段在本发明实施例中不在进行详细说明。

s207,当所述至少一个字段信息中存在所述目的字段且不存在所述第一关键字段和所述第二关键字段时,采用所述目的字段搜索所述语音信息对应的第一多媒体信息列表,并输出所述第一多媒体信息列表。

具体的,当所述至少一个字段信息中存在所述目的字段且不存在所述第一关键字段和所述第二关键字段时,所述信息搜索设备可以采用所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的第一多媒体信息列表,例如,当语音信息为“我现在想听民谣”时,与之对应的至少一个字段信息可以是“我\现在\想\听\民谣”,其中只有“民谣”这一个目的字段,没有与“民谣”相关联的用于对民谣做进一步限定的第一关键字段和第二关键字段。所述信息搜索设备可以采用所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的第一多媒体信息列表,例如,可以采用“民谣”这一目的字段搜索“我现在想听民谣”这一语音信息对应的民谣歌曲的信息列表。

进一步的,所述信息搜索设备可以输出所述第一多媒体信息列表。可以理解的是,所述信息搜索设备可以将搜索到的第一多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述信息搜索设备可以输出所述第一多媒体信息列表中的第一多媒体信息对应的第一多媒体内容。例如,所述信息搜索设备获取到第一多媒体信息列表(例如,民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的民谣歌曲的音频内容。

s208,当所述至少一个字段信息中存在所述目的字段和所述第一关键字段且不存在所述第二关键字段时,采用所述目的字段和所述第一关键字段搜索所述语音信息对应的第二多媒体信息列表,并输出所述第二多媒体信息列表。

具体的,当所述至少一个字段信息中存在所述目的字段和所述第一关键字段且不存在所述第二关键字段时,所述信息搜索设备可以采用所述目的字段和所述第一关键字段从服务器所在的网络侧搜索出所述语音信息对应的第二多媒体信息列表,例如,当语音信息为“播放张磊流行的民谣”时,与之对应的至少一个字段信息可以是“播放\张磊\流行的\民谣”,其中“张磊”和“民谣”为目的字段,“流行的”为第一关键字段,不存在第二关键字段,所述信息搜索设备可以根据目的字段和第一关键字段即“张磊\流行的\民谣”从服务器所在的网络侧搜索出对应的民谣歌曲的列表。

进一步的,所述信息搜索设备可以输出所述第二多媒体信息列表。可以理解的是,所述信息搜索设备可以将搜索到的第二多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述信息搜索设备可以输出所述第二多媒体信息列表中的第二多媒体信息对应的第二多媒体内容。例如,所述信息搜索设备获取到第二多媒体信息列表(例如,张磊流行的民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的民谣歌曲的音频内容。

s209,当所述至少一个字段信息中存在所述目的字段、所述第一关键字段和所述第二关键字段时,采用所述目的字段、所述第一关键字段和所述第二关键字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

具体的,当所述至少一个字段信息中存在所述目的字段、所述第一关键字段和所述第二关键字段时,所述信息搜索设备可以采用所述目的字段、所述第一关键字段和所述第二关键字段从服务器所在的网络侧搜索出所述语音信息对应的多媒体信息列表,例如,当语音信息为“播放张磊最流行的民谣”时,与之对应的至少一个字段信息可以是“播放\张磊\最\流行的\民谣”,其中“张磊”和“民谣”为目的字段,“流行的”为第一关键字段,“最”为第二关键字段,所述信息搜索设备可以根据目的字段、第一关键字段和第二关键字段即“张磊\最\流行的\民谣”从服务器所在的网络侧搜索出对应的民谣歌曲的列表。

进一步的,所述信息搜索设备可以输出所述多媒体信息列表。可以理解的是,所述信息搜索设备可以将搜索到的多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述信息搜索设备可以输出所述多媒体信息列表中的多媒体信息对应的多媒体内容。例如,所述信息搜索设备获取到多媒体信息列表(例如,张磊最流行的民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的民谣歌曲的音频内容。

s210,获取所述多媒体信息列表中的多媒体信息对应的多媒体内容,并对所述多媒体内容进行输出。

具体的,所述信息搜索设备可以获取所述多媒体信息列表中的多媒体信息所对应的多媒体内容,可以理解的是,所述多媒体信息列表可以是多媒体信息(歌曲名称、演唱者、发表时间等)组成的列表,所述多媒体内容可以是所述多媒体信息所指示的具体内容(例如,歌曲名称a、演唱者、发表时间等歌曲信息所指示的歌曲a的音频内容)。

进一步的,所述信息搜索设备可以对多媒体内容进行输出,可以理解的是,所述信息搜索设备可以直接播放所述多媒体内容(例如,歌曲a的音频内容)。

在本发明实施例中,通过直接对多媒体信息列表中的多媒体信息对应的多媒体内容进行输出,降低了播放多媒体内容的操作复杂度。

在本发明实施例中,通过获取所输入的语音信息,对语音信息进行识别处理以生成语音信息对应的文本信息,并对文本信息进行分词处理以获取文本信息中的至少一个字段信息,采用预设词汇库在至少一个字段信息中获取语音信息的关键字段和目的字段,最后采用关键字段和目的字段搜索语音信息对应的多媒体信息列表,并输出多媒体信息列表。通过将自然语音转化为文本信息,并对文本信息进行分词处理和词汇匹配处理得到语音信息对应的关键字段和目的字段,再采用关键字段和目的字段搜索语音信息对应的对媒体信息,提高了终端设备基于自然语音识别点播系统的点播成功率;通过对至少一个字段信息中字段的精确分类,增加了通过字段信息搜索语音信息对应的多媒体信息列表的准确性;通过直接对多媒体信息列表中的多媒体信息对应的多媒体内容进行输出,降低了播放多媒体内容的操作复杂度。

下面将结合附图3-附图6,对本发明实施例提供的信息搜索设备进行详细介绍。需要说明的是,附图3-附图6所示的设备,用于执行本发明图1和图2所示实施例的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明图1和图2所示的实施例。

请参见图3,为本发明实施例提供了一种信息搜索设备的结构示意图。如图3所示,本发明实施例的所述信息搜索设备1可以包括:文本信息生成单元11、字段信息获取单元12、字段信息分类单元13和媒体信息输出单元14。

文本信息生成单元11,用于获取所输入的语音信息,并对所述语音信息进行识别处理以生成所述语音信息对应的文本信息。

具体实现中,所述文本信息生成单元11可以获取用户所输入的语音信息。可以理解的是,所述语音信息可以是自然语音信息(例如,‘播放张磊最流行的民谣’)。

进一步的,所述文本信息生成单元11可以采用预设的语音识别处理方法(例如,基于dnn的语音识别算法、模糊识别算法或计算机网络工具包cntk等)对所述语音信息进行识别处理,并生成所述语音信息对应的文本信息。

字段信息获取单元12,用于对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。

具体实现中,所述字段信息获取单元12可以对所述语音信息对应的所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。可以理解的是,所述分词处理可以是基于文本匹配的分词方法、基于条件随机场的分词方法crf、概率统计算法或机器学习方法等。可以理解的是,所述文本信息经过所述分词处理后,可以被分为至少一个字段信息。例如:所述文本信息为“播放张磊最流行的民谣”,则经过所述分词处理后,该文本信息可以被分为的字段信息可以是“播放\张磊\最\流行的\民谣”。

字段信息分类单元13,用于采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段。

具体实现中,所述字段信息分类单元13可以采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段。可以理解的是,所述目的字段可以是所述语音信息中的核心词汇,所述关键字段可以是与所述目的字段相关联的用于辅助所述目的字段描述所述语音信息的词汇。例如,当所述语音信息经过处理后得到的所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,所述字段信息分类单元13采用所述预设词汇库在该字段信息中获取的目的字段可以为“民谣”,关键字段可以为“张磊\最\流行的”。

可以理解的是,所述预设词汇库可以是所述信息搜索设备1通过获取用户所输入的训练词汇,并基于预设语法分类方式对所述训练词汇进行分类处理,最后在分类处理后生成的词汇库。可以理解的是,所述预设语法分类方式可以是基于词性的语法分类方式,例如,可以是基于名词属性、形容词属性和副词属性的分类方式,可以理解的是,所述信息搜索设备1可以将所述训练词汇中的词汇按照词汇属性进行分类。例如,名词属性的训练词汇分类至名词属性的词汇库,形容词属性的训练词汇分类至形容词属性的词汇库或者副词属性的训练词汇分类至副词属性的词汇库等。

媒体信息输出单元14,用于采用所述关键字段和所述目的字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

具体实现中,所述媒体信息输出单元14可以采用所述关键字段和所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的多媒体信息列表。

可选的,当所述至少一个字段信息中只有目的字段不存在关键字段时,所述媒体信息输出单元14可以采用所述目的字段搜索所述语音信息对应的多媒体信息列表。例如,当语音信息为“我现在想听民谣”时,与之对应的至少一个字段信息可以是“我\现在\想\听\民谣”,其中只有“民谣”这一个目的字段,没有与“民谣”相关的用于对民谣做进一步限定的关键字段,则所述媒体信息输出单元14可以只采用目的字段“民谣”从服务器所在的网络侧搜索出对应的各类民谣。

可选的,当所述至少一个字段信息中既包含目的字段又包含关键字段时,所述媒体信息输出单元14可以采用所述目的字段和所述关键字段搜索所述语音信息对应的多媒体信息列表。例如,当语音信息为“我现在想听欢快的民谣”时,与之对应的至少一个字段信息可以是“我\现在\想\听\欢快的\民谣”,其中“民谣”是目的字段,“欢快的”是关键字段,与民谣相关联用于进一步限定民谣的类型,则所述媒体信息输出单元14可以采用目的字段和关键字段“欢快的民谣”从服务器所在的网络侧搜索出对应类型的民谣。

进一步的,所述媒体信息输出单元14可以输出所述多媒体信息列表。可以理解的是,所述媒体信息输出单元14可以将搜索到的多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述媒体信息输出单元14可以输出所述多媒体信息列表中的多媒体信息对应的多媒体内容。例如,所述媒体信息输出单元14获取到多媒体信息列表(例如,欢快的民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的欢快的民谣歌曲的音频内容。

在本发明实施例中,通过获取所输入的语音信息,对语音信息进行识别处理以生成语音信息对应的文本信息,并对文本信息进行分词处理以获取文本信息中的至少一个字段信息,采用预设词汇库在至少一个字段信息中获取语音信息的关键字段和目的字段,最后采用关键字段和目的字段搜索语音信息对应的多媒体信息列表,并输出多媒体信息列表。通过将自然语音转化为文本信息,并对文本信息进行分词处理和词汇匹配处理得到语音信息对应的关键字段和目的字段,再采用关键字段和目的字段搜索语音信息对应的对媒体信息,提高了终端设备基于自然语音识别点播系统的点播成功率。

请参见图4,为本发明实施例提供了另一种信息搜索设备的结构示意图。如图4所示,本发明实施例的所述信息搜索设备1可以包括:文本信息生成单元11、字段信息获取单元12、字段信息分类单元13、媒体信息输出单元14、词汇库生成单元15和媒体内容输出单元16。

词汇库生成单元15,用于获取所输入的训练词汇,基于预设语法分类方式对所述训练词汇进行分类处理,并在分类处理后生成预设词汇库。

具体实现中,所述词汇库生成单元15可以获取用户所输入的训练词汇,并可以基于预设语法分类方式对所述训练词汇进行分类处理。可以理解的是,所述预设语法分类方式可以是基于词性的语法分类方式,例如,可以是基于名词属性、形容词属性和副词属性的分类方式,可以理解的是,所述信息搜索设备可以将所述训练词汇中的词汇按照词汇属性进行分类。例如,名词属性的训练词汇分类至名词属性的词汇库,形容词属性的训练词汇分类至形容词属性的词汇库或者副词属性的训练词汇分类至副词属性的词汇库等。

进一步的,所述词汇库生成单元15对所述训练词汇进行分类处理后可以生成预设词汇库。可以理解的是,所述预设词汇库可以包括第一词汇库、第二词汇库和第三词汇库,所述第一词汇库可以为名词属性的词汇库,所述第二词汇库可以为形容词属性的词汇库,所述第三词汇库可以为副词属性的词汇库。

文本信息生成单元11,用于获取所输入的语音信息,并对所述语音信息进行识别处理以生成所述语音信息对应的文本信息。

具体实现中,所述文本信息生成单元11可以获取所输入的语音信息,可以理解的是,所述语音信息可以是自然语音信息(例如,‘播放张磊最流行的民谣’)。

进一步的,所述文本信息生成单元11可以采用预设的语音识别处理方法(例如,基于dnn的语音识别算法、模糊识别算法或计算机网络工具包cntk等)对所述语音信息进行识别处理,并生成所述语音信息对应的文本信息。

字段信息获取单元12,用于对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。

具体实现中,所述字段信息获取单元12可以对所述文本信息进行分词处理以获取所述文本信息中的至少一个字段信息。可以理解的是,所述分词处理可以是基于文本匹配的分词方法、基于crf的分词方法、概率统计算法或机器学习方法等。可以理解的是,所述文本信息经过所述分词处理后,可以被分为至少一个字段信息。例如:所述文本信息为“播放张磊最流行的民谣”,则经过所述分词处理后,该文本信息可以被分为的字段信息可以是“播放\张磊\最\流行的\民谣”。

字段信息分类单元13,用于采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段。

具体实现中,所述字段信息分类单元13可以采用预设词汇库在所述至少一个字段信息中获取所述语音信息的关键字段和目的字段。可以理解的是,所述目的字段可以是所述语音信息中的核心词汇,所述关键字段可以是与所述目的字段相关联的用于辅助所述目的字段描述所述语音信息的词汇。

请一并参见图5,为本发明实施例提供了字段信息分类单元13的结构示意图。如图5所示,所述字段信息分类单元13可以包括:

目的字段设置子单元131,用于将所述至少一个字段信息中与所述第一词汇库的第一词汇相匹配的第一字段信息设置为目的字段。

具体实现中,所述目的字段设置子单元131可以将所述至少一个字段信息中与所述第一词汇库的第一词汇相匹配的第一字段信息设置为目的字段。例如,当所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,“张磊”和“民谣”可以与所述第一词汇库中的词汇即名词属性的词汇相匹配时,所述目的字段设置子单元131可以将“张磊”和“民谣”确定为该语音信息的目的字段。

第一字段确定子单元132,用于当所述至少一个字段信息中存在与所述目的字段相关联的,且与所述第二词汇库的第二词汇相匹配的第二字段信息时,将所述第二字段信息确定为第一关键字段。

具体实现中,当所述至少一个字段信息中存在与所述目的字段相关联的,且与所述第二词汇库的第二词汇相匹配的第二字段信息时,所述第一字段确定子单元132可以将所述第二字段信息确定为第一关键字段。例如,当所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,所述目的字段设置子单元131确定“张磊”和“民谣”为目的字段后,所述第一字段确定子单元132可以确定与该目的字段相关联词汇为“播放”和“流行的”,而与所述第二词汇库中的词汇相匹配的即词性为形容词属性的词汇只有“流行的”,从而所述第一字段确定子单元132可以确定“流行的”为所述至少一个字段信息中的第一关键字段。

第二字段确定子单元133,当所述至少一个字段信息中存在与所述第一关键字段相关联的,且与所述第三词汇库的第三词汇相匹配的第三字段信息时,将所述第三字段信息确定为第二关键字段。

具体实现中,当所述至少一个字段信息中存在与所述第一关键字段相关联的,且与所述第三词汇库的第三词汇相匹配的第三字段信息时,所述第二字段确定子单元133可以将所述第三字段信息确定为第二关键字段。例如,当所述至少一个字段信息为“播放\张磊\最\流行的\民谣”时,所述目的字段设置子单元131确定“张磊”和“民谣”为目的字段,所述第一字段确定子单元132确定“流行的”为第一关键字段后,所述第二字段确定子单元133可以确定与“张磊”、“民谣”和“流行的”相关联的词汇为“最”,且“最”与所述第三词汇库中的词汇相匹配,即与词性为副词属性的词汇相匹配,从而所述第二字段确定子单元133可以确定“最”为所述至少一个字段信息中的第二关键字段。

在本发明实施例中,采用预设词汇库将所述至少一个字段信息中的字段信息分类为目的字段、第一关键字段和第二关键字段,通过对字段信息的精确分类,增加了通过字段信息搜索语音信息对应的多媒体信息列表的准确性。

需要说明的是,本发明实施例中所述的目的字段可以是所述至少一个字段信息中的至少一个词汇,所述第一关键字段和所述第二关键字段只是为了区分关键字段的,并不是对关键字段进行排名,可以理解的是,除了第一关键字段和第二关键字段还可以有第三、第四等等关键字段,其他的关键字段在本发明实施例中不在进行详细说明。

媒体信息输出单元14,用于采用所述关键字段和所述目的字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

具体实现中,所述媒体信息输出单元14可以采用所述关键字段和所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的多媒体信息列表。

请一并参见图6,为本发明实施例提供了媒体信息输出单元14的结构示意图。如图6所示,所述媒体信息输出单元14可以包括:

第一信息输出子单元141,用于当所述至少一个字段信息中存在所述目的字段且不存在所述第一关键字段和所述第二关键字段时,采用所述目的字段搜索所述语音信息对应的第一多媒体信息列表,并输出所述第一多媒体信息列表。

具体实现中,当所述至少一个字段信息中存在所述目的字段且不存在所述第一关键字段和所述第二关键字段时,所述第一信息输出子单元141可以采用所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的第一多媒体信息列表,例如,当语音信息为“我现在想听民谣”时,与之对应的至少一个字段信息可以是“我\现在\想\听\民谣”,其中只有“民谣”这一个目的字段,没有与“民谣”相关联的用于对民谣做进一步限定的第一关键字段和第二关键字段。所述第一信息输出子单元141可以采用所述目的字段从服务器所在的网络侧搜索出所述语音信息对应的第一多媒体信息列表,例如,可以采用“民谣”这一目的字段搜索“我现在想听民谣”这一语音信息对应的民谣歌曲的信息列表。

进一步的,所述第一信息输出子单元141可以输出所述第一多媒体信息列表。可以理解的是,所述第一信息输出子单元141可以将搜索到的第一多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述第一信息输出子单元141可以输出所述第一多媒体信息列表中的第一多媒体信息对应的第一多媒体内容。例如,所述第一信息输出子单元141获取到第一多媒体信息列表(例如,民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的民谣歌曲的音频内容。

第二信息输出子单元142,用于当所述至少一个字段信息中存在所述目的字段和所述第一关键字段且不存在所述第二关键字段时,采用所述目的字段和所述第一关键字段搜索所述语音信息对应的第二多媒体信息列表,并输出所述第二多媒体信息列表。

具体实现中,当所述至少一个字段信息中存在所述目的字段和所述第一关键字段且不存在所述第二关键字段时,所述第二信息输出子单元142可以采用所述目的字段和所述第一关键字段从服务器所在的网络侧搜索出所述语音信息对应的第二多媒体信息列表,例如,当语音信息为“播放张磊流行的民谣”时,与之对应的至少一个字段信息可以是“播放\张磊\流行的\民谣”,其中“张磊”和“民谣”为目的字段,“流行的”为第一关键字段,不存在第二关键字段,所述第二信息输出子单元142可以根据目的字段和第一关键字段即“张磊\流行的\民谣”从服务器所在的网络侧搜索出对应的民谣歌曲的列表。

进一步的,所述第二信息输出子单元142可以输出所述第二多媒体信息列表。可以理解的是,所述第二信息输出子单元142可以将搜索到的第二多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述第二信息输出子单元142可以输出所述第二多媒体信息列表中的第二多媒体信息对应的第二多媒体内容。例如,所述第二信息输出子单元142获取到第二多媒体信息列表(例如,张磊流行的民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的民谣歌曲的音频内容。

媒体信息输出子单元143,用于当所述至少一个字段信息中存在所述目的字段、所述第一关键字段和所述第二关键字段时,采用所述目的字段、所述第一关键字段和所述第二关键字段搜索所述语音信息对应的多媒体信息列表,并输出所述多媒体信息列表。

具体实现中,当所述至少一个字段信息中存在所述目的字段、所述第一关键字段和所述第二关键字段时,所述媒体信息输出子单元143可以采用所述目的字段、所述第一关键字段和所述第二关键字段从服务器所在的网络侧搜索出所述语音信息对应的多媒体信息列表,例如,当语音信息为“播放张磊最流行的民谣”时,与之对应的至少一个字段信息可以是“播放\张磊\最\流行的\民谣”,其中“张磊”和“民谣”为目的字段,“流行的”为第一关键字段,“最”为第二关键字段,所述媒体信息输出子单元143可以根据目的字段、第一关键字段和第二关键字段即“张磊\最\流行的\民谣”从服务器所在的网络侧搜索出对应的民谣歌曲的列表。

进一步的,所述媒体信息输出子单元143可以输出所述多媒体信息列表。可以理解的是,所述媒体信息输出子单元143可以将搜索到的多媒体信息以列表的形式显示输出在终端设备的当前显示页面内。

可选的,所述媒体信息输出子单元143可以输出所述多媒体信息列表中的多媒体信息对应的多媒体内容。例如,所述媒体信息输出子单元143获取到多媒体信息列表(例如,张磊最流行的民谣系列中的民谣歌曲列表)后,可以直接顺序播放所有搜索到的民谣歌曲的音频内容。

媒体内容输出单元16,用于获取所述多媒体信息列表中的多媒体信息对应的多媒体内容,并对所述多媒体内容进行输出。

具体实现中,所述媒体内容输出单元16可以获取所述多媒体信息列表中的多媒体信息所对应的多媒体内容,可以理解的是,所述多媒体信息列表可以是多媒体信息(歌曲名称、演唱者、发表时间等)组成的列表,所述多媒体内容可以是所述多媒体信息所指示的具体内容(例如,歌曲名称a、演唱者、发表时间等歌曲信息所指示的歌曲a的音频内容)。

进一步的,所述媒体内容输出单元16可以对多媒体内容进行输出,可以理解的是,所述信息搜索设备可以直接播放所述多媒体内容(例如,歌曲a的音频内容)。

在本发明实施例中,通过直接对多媒体信息列表中的多媒体信息对应的多媒体内容进行输出,降低了播放多媒体内容的操作复杂度。

在本发明实施例中,通过获取所输入的语音信息,对语音信息进行识别处理以生成语音信息对应的文本信息,并对文本信息进行分词处理以获取文本信息中的至少一个字段信息,采用预设词汇库在至少一个字段信息中获取语音信息的关键字段和目的字段,最后采用关键字段和目的字段搜索语音信息对应的多媒体信息列表,并输出多媒体信息列表。通过将自然语音转化为文本信息,并对文本信息进行分词处理和词汇匹配处理得到语音信息对应的关键字段和目的字段,再采用关键字段和目的字段搜索语音信息对应的对媒体信息,提高了终端设备基于自然语音识别点播系统的点播成功率;通过对至少一个字段信息中字段的精确分类,增加了通过字段信息搜索语音信息对应的多媒体信息列表的准确性;通过直接对多媒体信息列表中的多媒体信息对应的多媒体内容进行输出,降低了播放多媒体内容的操作复杂度。

需要说明的是,对于以上各方法实施例,为了简单描述将其表述为一系列动作的组合,但本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,某些步骤可以采用其他顺序或同时进行。其次,本领域技术人员应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的操作和单元并不一定是本发明所必须的。且在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

另外,本发明各个实施例中的各功能单元可以集成在一个处理的单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。其中所述的存储介质包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1