音频文件中语音信息的搜索方法、装置及设备的制作方法

文档序号:6575439阅读:299来源:国知局
专利名称:音频文件中语音信息的搜索方法、装置及设备的制作方法
技术领域
本发明涉及音频搜索技术领域,尤其涉及一种音频文件中语音信息的搜索方法、 装置及设备。
背景技术
在信息量成几何级数增长的信息时代,搜索技术已成为人们工作和生活中必不可 少的关键技术之一,使得人们能够快捷准确地从信息海洋中搜索到自己需要的信息,从而 极大地提高了工作和生活效率。随着搜索技术日趋成熟,其应用越来越广泛,人们对搜索技 术的要求也在不断提升,对音频搜索的需求日益增加。现有的音频搜索技术主要包括以下两种方式方式一、预先由人工为音频文件添加文字信息,即为音频文件建立标签,基于特定 关键字对音频文件的标签进行搜索。该方式无法满足按照音频文件的内容对音频文件进行 全文搜索的需求。同时,由于音频文件的标签无法涵盖音频文件的全部内容,并且标签由人 工建立,主观因素较大,导致音频搜索的准确度低,很难保证搜索结果的完整性,也无法准 确定位特定关键字在搜索结果中的具体位置;如果音频资源库中音频文件的数量巨大,将 使得人工建立标签的工作量巨大,导致大量人力资源的耗费。方式二、基于音频匹配技术对音频文件进行搜索,首先需要提取待搜索的音频信 息的频谱或者能量的特征值,然后提取音频资源库中各音频文件的音频信息的频谱或者能 量的特征值,最后进行特征值的匹配。音频匹配技术侧重于音频本身的特征值的匹配,该方 式同样无法满足按照音频文件的内容对音频文件进行全文搜索的需求。同时,该方式对搜 索所输入的音频信息要求苛刻,不仅要求输入的音频信息的内容与音频资源库中音频文件 的内容相一致,而且还要求音频信息的频率和能量与音频资源库中音频文件的频率和能量 相接近,才能成功匹配,导致音频搜索的效率低,易用性差。现有技术中提供的音频搜索技术,没有提供基于音频文件的内容进行全文搜索的 方案,并且音频搜索的准确度低、效率低、易用性差。

发明内容
本发明提供一种音频文件中语音信息的搜索方法及装置,用以实现对音频文件的 内容进行全文搜索,提高音频搜索的准确度和效率,提升音频搜索的易用性。相应的,本发明还提供一种终端设备和网站服务器。本发明提供了一种音频文件中语音信息的搜索方法,包括对音频资源库中每一个包括语音信息的音频文件进行语音识别,转化为包括文字 信息的文本文件,并对各文本文件的文字信息进行分词处理;根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确定每一 个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信息建立关键字的 索引数据库,所述索引数据库中存储每一个关键字与每一个音频文件的相关度、以及每一
4个音频文件的相关信息;当接收到携带特定关键字的语音信息搜索请求时,在所述索引数据库中进行所述 特定关键字的匹配,并根据与所述特定关键字具有相关度的音频文件的相关信息提供相应 的音频文件。本发明提供了一种音频文件中语音信息的搜索装置,包括语音识别模块,用于对音频资源库中每一个包括语音信息的音频文件进行语音识 别,转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;索引建立模块,用于根据每一个文本文件所包括的词提取对应的音频文件所包括 的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相 关信息建立关键字的索引数据库;索引数据库,用于存储每一个关键字与每一个音频文件的相关度、以及每一个音 频文件的相关信息;搜索处理模块,用于当接收到携带特定关键字的语音信息搜索请求时,在所述索 引数据库中进行所述特定关键字的匹配,并根据与所述特定关键字具有相关度的音频文件 的相关信息提供相应的音频文件。本发明提供了一种终端设备,包括该音频文件中语音信息的搜索装置。本发明提供了一种网站服务器,包括该音频文件中语音信息的搜索装置。本发明提供的音频文件中语音信息的搜索方法、装置及设备,通过语音识别将包 括语音信息的音频文件转化为包括文字信息的文本文件,根据音频文件对应的文本文件即 音频文件的全部内容,建立关键字的索引数据库;在用户输入特定关键字发起语音信息的 搜索操作时,基于关键字的索引数据库提供与该特定关键字具有相关度的音频文件,从而 实现了对音频文件的内容进行全文搜索,弥补了现有音频搜索技术的不足;由于关键字的 索引数据库基于语音识别技术建立,且涵盖了音频文件的全部内容,从而提高了音频搜索 的准确度,基于关键字的搜索也提高了音频搜索的效率;在用户发起搜索时,只需输入特定 关键字即可,提升了音频搜索的易用性。


图1为本发明实施例提供的音频文件中语音信息的搜索装置框图;图2为本发明实施例提供的音频文件中语音信息的搜索方法流程图;图3为实施例一提供的音频文件中语音信息的本地搜索方法流程图;图4为实施例二提供的音频文件中语音信息的网络搜索方法流程图。
具体实施例方式本发明实施例旨在提供一种基于关键字对音频文件的内容进行全文搜索的方案, 能够根据用户输入的特定关键字,对音频资源库中各音频文件的内容进行全文搜索,并向 用户提供相应的音频文件。基于关键字对音频文件的内容进行全文搜索,能够有效提高音 频搜索的准确度和效率,提升音频搜索的易用性。如图1所示,本发明实施例首先提供了一种音频文件中语音信息的搜索装置,包 括
语音识别模块101,用于对音频资源库中每一个包括语音信息的音频文件进行语 音识别,转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;词是汉语中最小的、能独立活动的、有意义的语言成分,词可以包括一个汉字、两 个汉字或者多个汉字。现有技术中各种分词算法可以实现对文字信息的分词处理,分词算 法主要包括三种类型基于字符串匹配的分词算法、基于理解的分词算法和基于统计的分 词算法;索引建立模块102,用于根据每一个文本文件所包括的词提取对应的音频文件所 包括的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件 的相关信息建立关键字的索引数据库103 ;索引数据库103,用于存储每一个关键字与每一个音频文件的相关度、以及每一个 音频文件的相关信息;搜索处理模块104,用于当接收到携带特定关键字的语音信息搜索请求时,在索引 数据库103中进行该特定关键字的匹配,并根据与该特定关键字具有相关度的音频文件的 相关信息提供相应的音频文件。具体实施中,为了提升音频搜索的精确度,在向用户提供相应的音频文件的同时, 还可以向用户提供该特定关键字在相应的音频文件中出现的具体位置,在该应用场景下, 索引建立模块102在建立索引数据库103时还结合每一个音频文件所包括的关键字在该音 频文件中出现的时间信息;相应的,索引数据库103,还用于存储每一个关键字在具有相关 度的音频文件中出现的时间信息;搜索处理模块104,还用于在提供与该特定关键字具有 相关度的音频文件的同时,还提供该特定关键字在具有相关度的音频文件中出现的时间信 息。为了准确确定每一个音频文件所包括的关键字在该音频文件中出现的时间信息,具体 实施中,语音识别模块101,还用于对各文本文件的文字信息进行分词处理之后,为各文本 文件所包括的词添加其在对应的音频文件中出现的时间信息,即为各文本文件所包括的词 加上一个时间戳。具体实施中,音频资源库中可能存在不包括语音信息的音频文件,例如仅包括音 乐旋律的音频文件,在该应用场景下,该音频文件中语音信息的搜索装置还包括音频解析模块105,用于对音频资源库中每一个音频文件进行语音解析,根据语音 解析结果提取出包括语音信息的音频文件。过滤掉不包括语音信息的音频文件之后,即可对音频资源库中每一个包括语音信 息的音频文件进行语音识别。具体实施中,音频资源库中的音频文件可能会发生变化,为了保证搜索结果的准 确度和完备性,该音频文件中语音信息的搜索装置还包括更新模块106,用于定期或者在音频资源库中的音频文件发生变化时,对索引数据 库103进行更新;具体的,如果音频资源库中添加了新的音频文件,则对该新的音频文件进行语音 识别、分词处理、关键字提取,确定该新的音频文件与所包括的关键字的相关度,并结合该 新的音频文件的相关信息在索引数据库103中增加该新的音频文件与所包括的关键字的 相关度、以及该新的音频文件的相关信息;如果音频资源库中删除了已有的音频文件,则在 索引数据库103中删除与该已有的音频文件相关的所有信息。
6
本发明实施例提供的音频文件中语音信息的搜索装置针对本地搜索和网络搜索 均可适用。如果该音频文件中语音信息的搜索装置设置在终端侧即用户的终端设备中,可 以实现用户对本地音频资源库中各音频文件的内容进行本地搜索。本地音频资源库是指 用户的终端设备中的本地存储器,例如本地硬盘、本地磁盘等。在本地音频资源库中,音 频文件的相关信息包括音频文件的文件名称和本地存储路径,所述的本地存储路径例如 “E:\音乐”,表示存储在本地E盘名称为“音乐”的文件夹下。针对本地搜索,在提供与该特 定关键字具有相关度的音频文件的同时,还提供与该特定关键字具有相关度的音频文件的 文件名称和本地存储路径。具体实施中,音频文件的相关信息还可以包括音频文件的大小、 类型、修改时间等其它相关信息,相应的,在提供与该特定关键字具有相关度的音频文件的 同时,还可以提供与该特定关键字具有相关度的音频文件的上述其它相关信息。如果该音频文件中语音信息的搜索装置设置在网络侧即提供音频搜索业务的网 站的网站服务器中,通过网站服务器与安装在终端侧的浏览器之间的相互配合,可以实现 用户对网络音频资源库中各音频文件的内容进行网络搜索。网络音频资源库是指网站数据 库,在网络音频资源库中,音频文件的相关信息包括音频文件的文件名称和URL(统一资源 定位符)。针对网络搜索,所述的根据与该特定关键字具有相关度的音频文件的相关信息提 供相应的音频文件是指提供与该特定关键字具有相关度的音频文件的超链接。基于同一技术构思,本发明实施例同时提供了一种音频文件中语音信息的搜索方 法,如图2所示,包括S200、对音频资源库中每一个音频文件进行语音解析,根据语音解析结果提取出 包括语音信息的音频文件;具体实施中,如果音频资源库中每一个音频文件均包括语音信息,则无需执行该 步骤,直接从S201开始执行。S201、对音频资源库中每一个包括语音信息的音频文件进行语音识别,转化为包 括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;具体实施中,对各文本文件的文字信息进行分词处理之后,还可以为各文本文件 所包括的词添加其在对应的音频文件中出现的时间信息。S202、根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确 定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信息建立关 键字的索引数据库,相应的,关键字的索引数据库中存储每一个关键字与每一个音频文件 的相关度、以及每一个音频文件的相关信息;具体实施中,音频文件与所包括的关键字的相关度基于相关度算法确定,音频文 件与所包括的关键字的相关度与该关键字在音频文件中出现的次数有关,出现次数越多, 相关度越高;具体实施中,为了提升音频搜索的精确度,在建立关键字的索引数据库时还结合 每一个音频文件所包括的关键字在该音频文件中出现的时间信息,相应的,关键字的索引 数据库中还存储每一个关键字在具有相关度的音频文件中出现的时间信息。至此,已经完成了音频文件中语音信息的搜索准备阶段,在搜索准备阶段,需要对 音频资源库中每一个音频文件进行处理,基于语音识别技术识别出语音信息并将语音信息 转换为对应的文字信息;文字信息经分词处理和关键字提取以及确定出每一个音频文件与所包括的关键字的相关度之后建立关键字的索引数据库。关键字的索引数据库建立完成之后,即可进入音频文件中语音信息的搜索执行阶 段,搜索执行阶段由用户发起,通过输入特定关键字发起语音信息的搜索操作,则该方法还 包括如下步骤S203、当接收到携带特定关键字的语音信息搜索请求时,在关键字的索引数据库 中进行该特定关键字的匹配,并根据与该特定关键字具有相关度的音频文件的相关信息提 供相应的音频文件;具体实施中,一般按照相关度由高到低对与该特定关键字具有相关度的音频文件 进行排序,相关度越高排序越靠前;如果关键字的索引数据库中还存储每一个关键字在具有相关度的音频文件中出 现的时间信息,为了便于用户对搜索结果中的特定关键字进行准确定位,在提供与该特定 关键字具有相关度的音频文件的同时,还提供特定关键字在具有相关度的音频文件中出现 的时间信息,具体以时间轴的形式给出。具体实施中,还包括定期或者在音频资源库中的音频文件发生变化时,对关键字 的索引数据库进行更新的步骤。下面将分别以本地搜索和网络搜索为例,详细说明本发明实施例提供的音频文件 中语音信息的搜索方案。实施例一本实施例提供音频文件中语音信息的本地搜索方案,对应的音频资源库(可以称 为本地音频资源库)设置在终端侧,具体为用户的终端设备中的本地存储器,为了实现对 音频文件中语音信息的本地搜索,需要在用户的终端设备中设置本发明实施例提供的音频 文件中语音信息的搜索装置。音频文件中语音信息的本地搜索流程,如图3所示,包括本地 搜索准备阶段和本地搜索执行阶段。本地搜索准备阶段,包括如下步骤S301、终端设备从音频资源库中提取一个未处理的音频文件,对当前的音频文件 进行语音解析;S302、终端设备根据语音解析结果判断当前的音频文件是否包括语音信息,如果 是,则执行S303、如果否,则转向执行S307 ;S303、终端设备对当前的音频文件进行语音识别,转化为包括文字信息的文本文 件;S304、终端设备对当前的文本文件的文字信息进行分词处理,并为当前的文本文 件所包括的词添加其在对应的音频文件中出现的时间信息;S305、终端设备根据当前的文本文件所包括的词提取对应的音频文件所包括的关 键字,确定当前的音频文件与所包括的关键字的相关度;S306、终端设备将当前的音频文件与所包括的关键字的相关度、当前的音频文件 的文件名称和本地存储路径、以及当前的音频文件所包括的关键字在该音频文件中出现的 时间信息,存储到关键字的索引数据库中;S307、终端设备将当前的音频文件设置为已处理;S308、终端设备判断音频资源库中是否还存在未处理的音频文件,如果是,则返回 执行S301,如果否,则关键字的索引数据库建立完成,即本地搜索准备阶段完成,后续可以
8进入本地搜索执行阶段。如果用户在本地搜索工具栏中输入特定关键字,发起语音信息的本地搜索,则本 地搜索执行阶段,包括如下步骤S309、当接收到携带特定关键字的语音信息的本地搜索请求时,终端设备在关键 字的索引数据库中进行该特定关键字的匹配;S310、终端设备根据与该特定关键字具有相关度的音频文件的文件名称和本地存 储路径,提供相应的音频文件以及该特定关键字在具有相关度的音频文件中出现的时间信 息,当然还可以一并提供该音频文件的文件名称和本地存储路径;相应的,音频文件以及该特定关键字在具有相关度的音频文件中出现的时间信 息、该音频文件的文件名称和本地存储路径,在终端设备上进行展现供用户查看。需要指出的是,具体实施中由于本地音频资源库中的音频文件会发生变化,例如 用户在终端设备的本地存储器中添加了新的音频文件或者删除了本地存储器中已有的音 频文件,因此需要定期或者在本地音频资源库中的音频文件发生变化时,对关键字的索引 数据库进行更新,以保证本地搜索结果的准确度和完备性。实施例二本实施例提供音频文件中语音信息的网络搜索方案。对应的音频资源库(可以称 为本地音频资源库)设置在网络侧,具体为网站数据库,为了实现对音频文件中语音信息 的网络搜索,需要在提供音频搜索业务的网站的网站服务器中设置本发明实施例提供的音 频文件中语音信息的搜索装置。音频文件中语音信息的网络搜索流程,如图4所示,包括网 络搜索准备阶段和网络搜索执行阶段。网络搜索准备阶段,包括如下步骤S401、网站服务器从音频资源库中提取一个未处理的音频文件,对当前的音频文 件进行语音解析;S402、网站服务器根据语音解析结果判断当前的音频文件是否包括语音信息,如 果是,则执行S403,如果否,则转向执行S407 ;S403、网站服务器对当前的音频文件进行语音识别,转化为包括文字信息的文本 文件;S404、网站服务器对当前的文本文件的文字信息进行分词处理,并为当前的文本 文件所包括的词添加其在对应的音频文件中出现的时间信息;S405、网站服务器根据当前的文本文件所包括的词提取对应的音频文件所包括的 关键字,确定当前的音频文件与所包括的关键字的相关度;S406、网站服务器将当前的音频文件与所包括的关键字的相关度、当前的音频文 件的文件名称和URL、以及当前的音频文件所包括的关键字在该音频文件中出现的时间信 息,存储到关键字的索引数据库中S407、网站服务器将当前的音频文件设置为已处理;S408、网站服务器判断音频资源库中是否还存在未处理的音频文件,如果是,则返 回执行S401,如果否,则关键字的索引数据库建立完成,即网络搜索准备阶段完成,后续可 以进入网络搜索执行阶段。如果用户在终端侧的浏览器的网络搜索工具栏中输入特定关键字,发起语音信息 的网络搜索,则网络搜索执行阶段,包括如下步骤
S409、当接收到携带特定关键字的语音信息的网络搜索请求时,网站服务器在关 键字的索引数据库中进行该特定关键字的匹配;S410、网站服务器根据与该特定关键字具有相关度的音频文件的文件名称和URL, 提供相应的音频文件的超链接以及该特定关键字在具有相关度的音频文件中出现的时间 fn息;相应的,音频文件的超链接以及该特定关键字在具有相关度的音频文件中出现的 时间信息,通过传输网络发送给终端侧的浏览器,在终端设备上进行展现供用户查看。需要指出的是,具体实施中由于网络音频资源库中的音频文件会发生变化,例如 网站数据库中添加了新的音频文件或者删除了已有的音频文件,因此需要定期或者在网络 音频资源库中的音频文件发生变化时,对关键字的索引数据库进行更新,以保证网络搜索 结果的准确度和完备性。本发明提供的音频文件中语音信息的搜索方法、装置及设备,通过语音识别将包 括语音信息的音频文件转化为包括文字信息的文本文件,根据音频文件对应的文本文件即 音频文件的全部内容,建立关键字的索引数据库;在用户输入特定关键字发起语音信息的 搜索时,基于关键字的索引数据库提供与该特定关键字具有相关度的音频文件,从而实现 了对音频文件的内容进行全文搜索,弥补了现有音频搜索技术的不足;由于关键字的索引 数据库基于语音识别技术建立,且涵盖了音频文件的全部内容,从而提高了音频搜索的准 确度,基于关键字的搜索也提高了音频搜索的效率;在用户发起搜索时,只需输入特定关键 字即可,提升了音频搜索的易用性。本发明提供的音频文件中语音信息的搜索方法、装置及设备,在关键字的索引数 据库中还存储每一个关键字在具有相关度的音频文件中出现的时间信息,在用户输入特定 关键字发起语音信息的搜索时,基于关键字的索引数据库还可以提供该特定关键字在具有 相关度的音频文件中出现的时间信息,从而实现了准确定位特定关键字在搜索结果中的具 体位置。本领域的技术人员应明白,本发明的实施例可提供为方法、装置、设备或计算机程 序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的 实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算 机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序 产品的形式。本发明是参照根据本发明实施例的方法、装置、设备和计算机程序产品的流程图 和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机 程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器 以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用 于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置ο这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造 性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优 选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
1权利要求
一种音频文件中语音信息的搜索方法,其特征在于,包括对音频资源库中每一个包括语音信息的音频文件进行语音识别,转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信息建立关键字的索引数据库,所述索引数据库中存储每一个关键字与每一个音频文件的相关度、以及每一个音频文件的相关信息;当接收到携带特定关键字的语音信息搜索请求时,在所述索引数据库中进行所述特定关键字的匹配,并根据与所述特定关键字具有相关度的音频文件的相关信息提供相应的音频文件。
2.如权利要求1所述的方法,其特征在于,在建立所述索引数据库时还结合每一个音 频文件所包括的关键字在该音频文件中出现的时间信息,所述索引数据库中还存储每一个 关键字在具有相关度的音频文件中出现的时间信息;以及在提供与所述特定关键字具有相关度的音频文件的同时,还提供所述特定关键字在具 有相关度的音频文件中出现的时间信息。
3.如权利要求2所述的方法,其特征在于,还包括对各文本文件的文字信息进行分词处理之后,为各文本文件所包括的词添加其在对应 的音频文件中出现的时间信息。
4.如权利要求1、2或3任一所述的方法,其特征在于,按照相关度由高到低对与所述特 定关键字具有相关度的音频文件进行排序。
5.如权利要求1所述的方法,其特征在于,所述音频资源库设置在终端侧,所述语音信 息搜索请求为语音信息的本地搜索请求,所述音频文件的相关信息包括音频文件的文件名 称和本地存储路径;以及在提供与所述特定关键字具有相关度的音频文件的同时,还提供与所述特定关键字具 有相关度的音频文件的文件名称和本地存储路径。
6.如权利要求1所述的方法,其特征在于,所述音频资源库设置在网络侧,所述语音信 息搜索请求为语音信息的网络搜索请求,所述音频文件的相关信息包括音频文件的文件名 称和统一资源定位符URL ;以及所述根据与所述特定关键字具有相关度的音频文件的相关信息提供相应的音频文件 是指提供与所述特定关键字具有相关度的音频文件的超链接。
7.如权利要求1所述的方法,其特征在于,还包括对音频资源库中每一个音频文件进行语音解析,根据语音解析结果提取出包括语音信 息的音频文件。
8.如权利要求1所述的方法,其特征在于,还包括定期或者在所述音频资源库中的音频文件发生变化时,对所述索引数据库进行更新。
9.一种音频文件中语音信息的搜索装置,其特征在于,包括语音识别模块,用于对音频资源库中每一个包括语音信息的音频文件进行语音识别, 转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;索引建立模块,用于根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信 息建立关键字的索引数据库;索引数据库,用于存储每一个关键字与每一个音频文件的相关度、以及每一个音频文 件的相关信息;搜索处理模块,用于当接收到携带特定关键字的语音信息搜索请求时,在所述索引数 据库中进行所述特定关键字的匹配,并根据与所述特定关键字具有相关度的音频文件的相 关信息提供相应的音频文件。
10.如权利要求9所述的装置,其特征在于,所述索引建立模块在建立所述索引数据库时还结合每一个音频文件所包括的关键字 在该音频文件中出现的时间信息;所述索引数据库,还用于存储每一个关键字在具有相关度的音频文件中出现的时间信息;所述搜索处理模块,还用于在提供与所述特定关键字具有相关度的音频文件的同时, 还提供所述特定关键字在具有相关度的音频文件中出现的时间信息。
11.如权利要求10所述的装置,其特征在于,所述语音识别模块,还用于对各文本文件的文字信息进行分词处理之后,为各文本文 件所包括的词添加其在对应的音频文件中出现的时间信息。
12.如权利要求9所述的装置,其特征在于,还包括音频解析模块,用于对音频资源库中每一个音频文件进行语音解析,根据语音解析结 果提取出包括语音信息的音频文件。
13.如权利要求9所述的装置,其特征在于,还包括更新模块,用于定期或者在所述音频资源库中的音频文件发生变化时,对所述索引数 据库进行更新。
14.一种终端设备,其特征在于,包括如权利要求9至13任一所述的搜索装置。
15.一种网站服务器,其特征在于,包括如权利要求9至13任一所述的搜索装置。
全文摘要
本发明公开了一种音频文件中语音信息的搜索方法、装置及设备,用以实现对音频文件的内容进行全文搜索,提高音频搜索的准确度和效率,提升音频搜索的易用性。所述搜索方法,包括对音频资源库中每一个包括语音信息的音频文件进行语音识别,转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信息建立关键字的索引数据库;当接收到携带特定关键字的语音信息搜索请求时,在索引数据库中进行特定关键字的匹配,并根据与特定关键字具有相关度的音频文件的相关信息提供相应的音频文件。
文档编号G06F17/30GK101996195SQ20091009166
公开日2011年3月30日 申请日期2009年8月28日 优先权日2009年8月28日
发明者刘威, 樊科, 薛頔 申请人:中国移动通信集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1