分析音频文件的语音特征的方法和装置的制造方法

文档序号:8382008阅读:406来源:国知局
分析音频文件的语音特征的方法和装置的制造方法
【技术领域】
[0001]本发明涉及音频分析和处理,更具体而言,涉及分析音频文件的语音特征的方法和装置。
【背景技术】
[0002]现有技术中已经提出多种方法来分析各类应用对象。例如,搜索引擎可以捕获网站内容,并通过提取关键词等方式分析网站内容,还可以根据关键词或其他分析结果为网站打上标签。一些图片处理工具可以对图片进行分析,例如比对两个图片的相似性,进而进行模糊匹配等。然而,对于音频文件,特别是主要包含语音内容的音频文件,现有技术并没有有效的方法对其进行内容和特征的分析。而另一方面,在许多情况下,希望获得关于音频文件的特征信息,从而可以对音频文件进行分类、匹配、推荐等进一步操作。
[0003]在一个典型例子中,外语学习者获得了一些外语内容的音频文件,以期进行听力练习。然而,由于现有技术并没有有效的音频分析方法,学习者只能根据音频文件的标题、来源(来源于新闻播报、电影片段或是专用听力材料)等信息来选择音频文件,并且只能在听过该音频文件之后才能判断所选择的音频文件是否符合自己的听力水平。这显然浪费了大量的时间和精力。
[0004]在另一例子中,提供音频文件的资料库期望对音频文件进行分类或分级,以便于进行管理或向用户推荐音频文件。然而,在无法对音频文件进行有效分析的情况下,资料库只能根据该音频文件的文件大小、作者等属性信息进行分类,无法基于更加本质的与音频有关的特征进行分类。
[0005]因此,希望提出新的方案,能够有效地对音频文件的语音特征进行分析。

【发明内容】

[0006]考虑到现有技术中的不足,本发明提出一种方案,旨在对音频文件的语音特征进行分析。
[0007]根据本发明的一个方面,提供了一种分析音频文件的语音特征的方法,包括:采用多种声学模型对所述音频文件中的语音内容进行语音识别,以获得多个识别结果;对比所述多个识别结果以获得对比结果;基于对比结果确定所述音频文件的语音声学特征。
[0008]根据本发明另一方面,提供了一种为用户推荐音频文件的方法,包括:确定用户适合的语音特征;获取多个音频文件各自的语音特征,所述多个音频文件各自的语音特征通过利用前述方面的方法对所述多个音频文件进行分析而确定;将语音特征与所述用户适合的语音特征相匹配的音频文件推荐给所述用户。
[0009]根据本发明另一方面,提供了一种用于分析音频文件的语音特征的装置,包括:语音识别单元,配置为采用多种声学模型对所述音频文件中的语音内容进行语音识别,以获得多个识别结果;结果对比单元,配置为对比所述多个识别结果以获得对比结果;声学特征确定单元,配置为基于对比结果确定所述音频文件的语音声学特征。
[0010]根据本发明又一方面,提供了一种为用户推荐音频文件的装置,包括:用户特征确定单元,配置为确定用户适合的语音特征;文件特征获取单元,配置为获取多个音频文件各自的语音特征,所述多个音频文件各自的语音特征通过利用前述方面的装置对所述多个音频文件进行分析而确定;匹配单元,配置为将语音特征与所述用户适合的语音特征相匹配的音频文件推荐给所述用户。
[0011]利用本发明实施例的方法和装置,可以对音频文件进行语音分析,从而为用户提供关于音频文件中语音内容特点的信息。基于这样的信息,还可以为用户推荐适合用户水平的音频文件。
【附图说明】
[0012]通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
[0013]图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图;
[0014]图2示出根据一个实施例的分析音频文件的方法的流程图;
[0015]图3A和3B不出根据本发明实施例的标记首频文件的例子;
[0016]图4示出根据一个实施例的推荐音频文件的方法的流程图;
[0017]图5示出根据本发明一个实施例的分析音频文件的语音特征的装置的示意框图;以及
[0018]图6示出根据本发明一个实施例的推荐音频文件的装置的示意框图。
【具体实施方式】
[0019]下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0020]所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
[0021]可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0022]计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0023]计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一但不限于一无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0024]可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言一诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0025]下面将参照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
[0026]也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruct1nmeans)的制造品(manufacture)。
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1