一种音频数据的比较方法和装置的制作方法

文档序号:2823915阅读:202来源:国知局
专利名称:一种音频数据的比较方法和装置的制作方法
技术领域
本发明涉及音频数据处理技术领域,更具体地说,涉及一种音频数据的比较方法 和装置。
背景技术
现有的唱歌评分技术,通常是对于一份唱歌数据,根据其音高和节奏和原唱的接 近程度进行评分。唱歌评分应用的大部分的应用场景是用户跟随伴奏的节奏演唱,评分系 统通过分析录音数据和伴奏(原唱),对比其中关系到唱歌评分性能好坏的参数,判断用户 唱歌的好坏,最终给出评分结果。这里假定用户的录音数据中噪声数据比较少,采用通常的 基频提取策略可以准确提取出来。唱歌评分中最重要的是用户演唱数据的音高曲线和标准音高曲线之间的差异,如 图1所示,即Dist=\tey{t)-g{t)\dt(1)上式中,f(t)、g(t)分别表示标准基频和唱歌数据基频,tb、te分别表示演唱开始 和结束时间,误差Dist值越大,则得分越低,反之,得分越高。通常,标准音高曲线的获得可以通过以下两种途径(1)以 MIDI (Musical Instrument Digital Interface,乐器数字接口)文件记录 音高信息。这种制作方式对工作人员音乐的专业知识要求相当高,而且制作的工作量比较 大,不利于唱歌评分大规模应用;(2)从原唱数据中提取原唱的基频曲线。现有的常见的基频提取算法包括时域AMDF(Average magnitudedifference function,平均幅度差函数)、自相关函数法等;频域谐波峰值法;以及时频分析法。引用上 述基频提取算法处理带有环境噪声、背景音乐声时,往往获得的评分性能较差。在有MIDI或者标准的清唱数据情况下,唱歌评分问题基本解决。但很多时候,这 样的MIDI或清唱资源无法获得,能获得的是MP3或MTV形式的音频数据。对于MP3或MTV 形式的音频数据,现有技术的解决方案有对原唱数据直接提取基频。然而,通过发明人的研究证实通过音高分析的方式提取原唱基频的方式一般采 用第一基频候选的方式或者先保留若干候选然后通过动态规划(Dynamic Programming)的 方式寻找最优的基频曲线。评分时通过对比测试数据基频曲线和标准音高曲线的差异给出 评分结果。这种方法最大的问题就在原唱歌曲中带有伴奏,常用的基频提取算法从带有伴 音原唱中提取基频时容易出现大量的错误基频值,无法直接得到原唱的音高值。实验发现 仅仅保留这些基频提取算法得到的评分性能很不理想。

发明内容
有鉴于此,本发明实施例提供一种音频数据的比较方法和装置,以实现对MP3或 MTV形式的测试音频数据同标准音频数据之间的比较。
4
本发明实施例提供一种音频数据的比较方法,包括由预置的基准数据经过准确分段、训练得到高斯混合模型GMM,利用所述GMM对测 试数据对应的标准数据进行分段;提取对应所述测试数据的第一基频数据;对每段中的标准数据进行分帧,提取对应所述标准数据的基频候选点数据,结合 每段中所述测试数据和标准数据的误差,获得对应所述标准数据的第二基频数据;将所述第一基频数据和第二基频数据进行比较,得出比较结果。优选的,所述对每段中的标准数据进行分帧,提取对应所述标准数据的基频候选 点数据,包括对所述测试数据按照预置帧长及帧移进行分帧,获取每帧测试数据中所有采样点 的基频均值;将所述采样点的基频值减去所述基频均值,并对相减之后的采样点的基频进行汉 宁窗函数处理;保留上述采样点中最大自相关系数对应的时间周期值,将所述时间周期值作为所 述标准数据的基频候选值的选取基准,并将所述标准数据的基频候选点数据转换为音高数 据。优选的,所述结合所述测试数据和标准数据的初始误差,获得对应所述标准数据 的第二基频数据,包括获取每段中所述测试数据和标准数据的初始误差;根据所述初始误差以及基频候选点数据,确定误差面积;获取所述误差面积中对应每段测试数据的最小值,并根据对应每段测试数据的平 均误差中的最小值获取对应的初始误差,确定对应所述标准数据的第二基频数据。进一步,所述方法还包括当所述第二基频数据和第一基频数据的比较结果满足预置值时,存储所述第二基 频数据,作为标准模板。优选的,所述将所述第一基频数据和第二基频数据进行比较,得出比较结果,包 括通过所述第一基频数据和第二基频数据之间的误差面积,得出比较结果。进一步,所述方法还包括将根据所述误差面积获得的每段数据的比较结果通过加权求平均值的方式,得到 整个测试数据和标准数据之间的比较结果。一种音频数据的比较装置,包括标准数据获取模块,用于由预置的基准数据经过准确分段、训练得到高斯混合模 型GMM,利用所述GMM对测试数据对应的标准数据进行分段;第一基频提取模块,用于提取对应所述测试数据的第一基频数据;第二基频提取模块,用于对每段中的标准数据进行分帧,提取对应所述标准数据 的基频候选点数据,结合每段中所述测试数据和标准数据的初始误差,获得对应所述标准 数据的第二基频数据;比较模块,用于将所述第一基频数据和第二基频数据进行比较,得出比较结果。
优选的,所述第二基频提取模块,具体包括采样点基频均值获取子模块,用于对所述测试数据按照预置帧长及帧移进行分 帧,获取每帧测试数据中所有采样点的基频均值;基频处理子模块,用于将所述采样点的基频值减去所述基频均值,并对相减之后 的采样点的基频进行汉宁窗函数处理;基频候选点获取子模块,用于保留上述采样点中最大自相关系数对应的时间周期 值,将所述时间周期值作为所述标准数据的基频候选值的选取基准,并将所述标准数据的 基频候选点数据转换为音高数据;初始误差获取子模块,用于获取每段中所述测试数据和标准数据的初始误差;代价函数确定子模块,用于根据所述初始误差以及基频候选点数据,确定代价函 数;第二基频确定子模块,用于获取所述代价函数中对应每段测试数据的平均误差中 的最小值,并根据对应每段测试数据的平均误差中的最小值获取对应的初始误差,确定对 应所述标准数据的第二基频数据。进一步,所述装置还包括存储模块,用于当所述第二基频数据和第一基频数据的比较结果满足预置值时, 存储所述第二基频数据,作为标准模板。优选的,所述比较模块通过所述第一基频数据和第二基频数据之间的误差面积, 得出比较结果。进一步,所述比较模块还通过将根据所述误差面积获得的每段数据的比较结果通 过加权求平均值的方式,得到整个测试数据和标准数据之间的比较结果。同现有技术相比,本发明提供的技术方案将标准数据的基频提取规整和测试数据 的比较结合起来,能够准确提取标准数据的基频;通过分析标准数据获得标准数据和测试 数据的分段边界,可以辅助测试数据和标准数据之间的比较;此外,将每次获得的标准数据的基频进行存储,便于实现评分比较模板的自动优 化。


为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中 所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实 施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图 获得其他的附图。图1为现有技术唱歌评分中比较用户演唱数据的音高曲线和标准音高曲线之间 差异的示意图;图2为本发明实施例提供的一种音频数据的比较方法流程示意图;图3为本发明实施例提供的另一种音频数据的比较方法流程示意图;图4为本发明实施例提供的一种音频数据的比较装置结构示意图;图5为本发明实施例提供的另一种音频数据的比较装置结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。首先对本发明提供的一种音频数据的比较方法进行说明,参照图2所示,所述方 法包括步骤101、由预置的基准数据经过准确分段、训练得到高斯混合模型GMM,利用所 述GMM对测试数据对应的标准数据进行分段;该步骤中,所述基准数据可以是对应测试数据的标准数据,也可以是预置的用于 进行分段获取边界、并按照分段结果训练以获得GMM的其他数据。步骤102、提取对应所述测试数据的第一基频数据;步骤103、对每段中的标准数据进行分帧,提取对应所述标准数据的基频候选点数 据,结合每段中所述测试数据和标准数据的初始误差,获得对应所述标准数据的第二基频 数据;步骤104、将所述第一基频数据和第二基频数据进行比较,得出比较结果。本发明提供的技术方案将标准数据的基频提取规整和测试数据的比较结合起来, 能够准确提取标准数据的基频。其中,对每段中的标准数据进行分帧,提取对应所述标准数据的基频候选点数据 的实现方式具体包括对所述测试数据按照预置帧长及帧移进行分帧,获取每帧测试数据中所有采样点 的基频均值;将所述采样点的基频值减去所述基频均值,并对相减之后的采样点的基频进行汉 宁窗函数处理;保留上述采样点中最大自相关系数对应的时间周期值,将所述时间周期值作为所 述标准数据的基频候选值的选取基准,并将所述标准数据的基频候选点数据转换为音高数 据。此外,结合所述测试数据和标准数据的初始误差,获得对应所述标准数据的第二 基频数据的具体实现方式包括获取每段中所述测试数据和标准数据的初始误差;根据所述初始误差以及基频候选点数据,确定误差面积;获取所述误差面积中对应每段测试数据的最小值,并根据对应每段测试数据的平 均误差中的最小值获取对应的初始误差,确定对应所述标准数据的第二基频数据。需要说明的是,在将所述第一基频数据和第二基频数据进行比较,得出比较结果 的实现过程中,本发明实施例通过所述第一基频数据和第二基频数据之间的误差面积,得 出比较结果。除此之外,还可以将根据所述误差面积获得的每段数据的比较结果通过加权 求平均值的方式,得到整个测试数据和标准数据之间的比较结果。从而,使得测试数据和标 准数据之间的比较结果更为准确。作为本发明的另一个优选实施例中,如图3所示,上述音频数据的比较方法还可
7以包括以下步骤步骤105、当所述第二基频数据和第一基频数据的比较结果满足预置值时,存储所 述第二基频数据,作为标准模板。本发明实施例中,当第二基频数据和第一基频数据的比较结果满足预置值时,通 过将每次获得的标准数据的基频进行存储,便于实现评分比较模板的自动优化。通过本发明实施例,可以预置测试数据和标注数据之间相似的程度值,当测试数 据同标准数据相比,相似度达到该预置值时,便将该过程中获得的对应标准数据的第二基 频数据进行存储,作为标注模板。为了便于对本发明技术方案的理解,下面通过具体的实例对整体方案进行详细的 介绍说明。以MP3或MTV形式的音频为例,原唱即本发明实施例中所述的标准数据,其通常包 含伴奏和人声两部分,其中人声包含的是歌曲的主旋律的信息,是唱歌评分所需要的;而伴 奏则属于编曲,对主旋律起到诠释的作用,但很多时候和主旋律不一致。这也是目前基于原 唱进行唱歌评分的主要问题。—般,MTV形式的音频数据是双声道数据,其中,左声道为伴奏,右声道为原唱(人 声加伴奏),可以采用谱减、回声消除等方法在对右声道数据进行滤波,滤去部分伴奏音乐, 这样可以提高基频提取的准确性。当用户希望对自己的唱歌数据进行评分时,首先应对应用户的唱歌数据获取相应 的标准数据,即原唱数据。对于原唱数据,可以精确标注出数据中每段开始和结束的边界, 利用其中含有原唱和不带原唱的数据分别训练GMM模型。 获取对应测试数据的标准数据,采用分割GMM模型对标准数据经过分段之后,便 可以分别对测试数据和标准数据进行基频的提取。对于测试数据基频的提取,可以采用通用的时域自相关函数的基频提取算法,对 于基频不为0的值按照下面公式y = 12 · Iog2 (χ/440)+69(2)转换成音高,其中x为输入频率,单位为赫兹;y为输出音高,单位为半音。对于测试数据输出的音高,可以按照如下方式规整半倍频对任一时刻t,统计此时刻前后各50帧共100帧基频的均值μ,如果是开始位置, 开始位置之前的数据帧不足50,则在这时刻后面多取一些基频值;结束位置同理。然后对 于t时刻基频值pt,取{pt_24,pt-12,pt, pt+12,pt+24}中和μ距离最小的,认为是这个时 刻的音高的真实值。此处仅以统计时刻的前后各50帧计算基频的均值,在具体实施时,对 于统计时刻前后帧的帧数选取,可以根据实际应用场景进行设定,本发明实施例对此并不 做具体限定。在对于标准数据基频的提取过程中,按照预置帧长及帧移进行分帧,例如对标准 数据以25ms为帧长、IOms为帧移进行分帧,其中每一帧数据包含的采样点为χ (η),(η = 1, 2……N),统计这一帧数据的基频均值,将所述采样点的基频值减去所述基频均值,并对相 减之后的采样点的基频进行汉宁窗函数处理,对这帧数据加汉宁窗w(n),(η = 1,2……N), 得到χ' (η)。根据基频计算公式(2)式,计算每一帧数据采样点中所有自相关系数,保留自相关系数最大时该最大自相关系数对应的时间周期值,并将该时间周期值作为所述标准数据 的基频候选值的选取基准。对于所有保留的基频值,如果其对应的半倍频点不在其中,并且对应的基频值是 可能的基频取值,则将符合该条件的半倍频值一并加入候选中,按照公式(2)转换成为半
曰°唱歌评分时,不同人演唱时起调会有些差异,而评分过程中需要消除起调差的影 响,定义△表示测试数据和标注数据之间起调的差值。当测试数据经过分段处理之后,设第i段包含T帧数据,T帧测试数据的音高分别 为PI,PI......Plj,原唱对应的有基频候选点为,其中、为第i帧数
据基频候选点数目},则定义如下代价函数dist = X mm (I ρ 二 - ρ,-Α\)/Ν(3)
i=l ‘- ' i -I其中,N为dist计算时,所有原唱基频候选点、测试数据基频值均不为0的数据的 帧数。对于每一个Δ」=0. 1 · j,{j e Ζ, -120 ( j ( 120},分别计算第i段数据的平 均误差^^iT以及帧数Ni, j。如果i兴1,则第i段数据之前所有的数据由于起调差Aj而产 生的平均误差为^、帧数为乂!7,则(3)式中的代价函数应当按照如下方式进行更新
'distp^ei = (dist= .Nfr; + dist二-N. .)/(Npre +N.)(4) dist;: = dist二
其中,力碎7最小时对应的Δ记为Atei,同时,得到最终基频如下式所示
Pu = P二,k = arg(min(|ρ二 |))(5)
本发明实施例中,最终的评分过程是通过计算测试数据的基频和标准数据的基频
之间的误差面积来给出最终的评分,即
dist = Yj min(| p[t - p\t - Δ广 \,MAXCOST) /N1(6)
t其中,Xi表示通过基频提取得到的标准数据的基频;片,为测试数第i段第t个参 与评分时刻的基频值;即第i段测试数据和标准数据之间由于起调差产生的误差,通过 前面基于多候选基频提取策略获得;N为所有测试数据和标准数据中基频均不为0的帧数; MAXC0ST表示误差上限,可预先设定。在对于每一段测试数据确定提取基频的开始和结束位置的基础上,设标准数据中 每段的开始和结束位置分别为Segstart、Segmd,测试者提供的测试数据对应的基频的开始和 结束位置分别为Pstot、Pmd,则第i段测试数据的比较得分按照下式进行规整
_2](ZlKi-Ki-^i\+MAXCOST*Kt) /
SentScorei = ^/(N^Ki) (7) 上式中,Ki表示每段测试数据每一帧开始和结束位置没有唱的部分中超过10%的 帧数,Ti为每段中标准数据和测试数据中基频均不为0的帧数。
实际操作过程中,在获得标准数据的基频候选点之后,需要对测试数据对应的基 频进行上下的平移,直至平移之后与标准数据的基频候选点之间的误差最小,即消除由测 试数据和标注数据之间起调产生的误差△,使得对于测试数据中的每段数据,都对应同一 起调标准。通过计算测试数据的基频和标准数据的基频之间的误差面积,给出最终的评分结果。为了进一步提高数据对比的精确度,对于整个片段的评分可以按照标准数据的实 际长度进行加权求平均值,即
Σ (lrc^-LRCstart)*SentScoreiTonescore = ^-;-
T(LRCend-LRCstart) ” (8)则最终整个片段的评分结果可以按照如下公式得到 FinalScore = a · Tonescore+b (9)其中a,b分别为线性回归系数。上述实施例中,可以实时存储对应所述标准数据的第二基频数据,从而达到更新、 优化标准数据基频曲线的目的。本发明实施例中,在对测试数据进行比较时,可以进行标准数据基频曲线的选取, 做法如下对于测试数据中的每段内容,如果根据系统选取的标准数据基频曲线,得到测试 数据的得分高过某个预先设定的门限,则将对此测试数据评分时利用的标准数据基频曲线 Template保存,作为后续评分的参考模板。对于一份新的测试数据Testcm,若系统已经存储了一份相同测试数据Testbest对 应的标准数据基频模板Templatet,则对于Testem中的每一段测试数据,如果采用上述多候 选基频提取策略获得的评分结果不如Testbest中对应获得的评分结果,则采用Testbest中使 用的标准数据基频模板进行评分;反之,则保留由当前多候选基频提取得到的基频曲线作 为模板获得的评分结果,如果得分高于预先规定的门限,则将当前得到的基频曲线存储作 为标准数据基频模板。相应上述音频数据的比较方法实施例,本发明还提供了一种音频数据的比较装 置,如图4所示,所述装置包括标准数据获取模块401,用于由预置的基准数据经过准确分段、训练得到高斯混合 模型GMM,利用所述GMM对测试数据对应的标准数据进行分段;第一基频提取模块402,用于提取对应所述测试数据的第一基频数据;第二基频提取模块403,用于对每段中的标准数据进行分帧,提取对应所述标准数 据的基频候选点数据,结合每段中所述测试数据和标准数据的初始误差,获得对应所述标 准数据的第二基频数据;比较模块404,用于将所述第一基频数据和第二基频数据进行比较,得出比较结^ ο本发明提供的音频数据的比较装置将标准数据的基频提取规整和测试数据的比 较结合起来,能够准确提取标准数据的基频。
需要说明的是,上述第二基频提取模块,具体可以包括 采样点基频均值获取子模块,用于对所述测试数据按照预置帧长及帧移进行分 帧,获取每帧测试数据中所有采样点的基频均值;基频处理子模块,用于将所述采样点的基频值减去所述基频均值,并对相减之后 的采样点的基频进行汉宁窗函数处理;基频候选点获取子模块,用于保留上述采样点中最大自相关系数对应的时间周期 值,将所述时间周期值作为所述标准数据的基频候选值的选取基准,并将所述标准数据的 基频候选点数据转换为音高数据;初始误差获取子模块,用于获取每段中所述测试数据和标准数据的初始误差;代价函数确定子模块,用于根据所述初始误差以及基频候选点数据,确定误差面 积;第二基频确定子模块,用于获取所述误差面积中对应每段测试数据的最小值,并 根据对应每段测试数据的平均误差中的最小值获取对应的初始误差,确定对应所述标准数 据的第二基频数据。在本发明的另一个音频数据的比较装置实施例中,如图5所示,所述装置还可以 包括存储模块,用于当所述第二基频数据和第一基频数据的比较结果满足预置值时, 存储所述第二基频数据,作为标准模板。通过将每次获得的标准数据的基频进行存储,便于实现评分比较模板的自动优 化。在具体实施时,所述比较模块可以通过所述第一基频数据和第二基频数据之间的 误差面积,得出比较结果。为了进一步提高数据对比的精确度,所述比较模块还通过将根据所述误差面积获 得的每段数据的比较结果通过加权求平均值的方式,得到整个测试数据和标准数据之间的 比较结果。对于装置实施例而言,由于其基本相应于方法实施例,所以描述得比较简单,相关 之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所 述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可 以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。 可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普 通技术人员在不付出创造性劳动的情况下,即可以理解并实施。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质 中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为 磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory, RAM)等。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。 对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的 一般原理可以在不脱离本发明实施例的精神或范围的情况下,在其它实施例中实现。因此,本发明实施例将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和 新颖特点相一致的最宽的范围。
权利要求
一种音频数据的比较方法,其特征在于,所述方法包括由预置的基准数据经过准确分段、训练得到高斯混合模型GMM,利用所述GMM对测试数据对应的标准数据进行分段;提取对应所述测试数据的第一基频数据;对每段中的标准数据进行分帧,提取对应所述标准数据的基频候选点数据,结合每段中所述测试数据和标准数据的误差,获得对应所述标准数据的第二基频数据;将所述第一基频数据和第二基频数据进行比较,得出比较结果。
2.根据权利要求1所述的音频数据的比较方法,其特征在于,所述对每段中的标准数 据进行分帧,提取对应所述标准数据的基频候选点数据,包括对所述测试数据按照预置帧长及帧移进行分帧,获取每帧测试数据中所有采样点的基 频均值;将所述采样点的基频值减去所述基频均值,并对相减之后的采样点的基频进行汉宁窗 函数处理;保留上述采样点中最大自相关系数对应的时间周期值,将所述时间周期值作为所述标 准数据的基频候选值的选取基准,并将所述标准数据的基频候选点数据转换为音高数据。
3.根据权利要求1所述的音频数据的比较方法,其特征在于,所述结合所述测试数据 和标准数据的初始误差,获得对应所述标准数据的第二基频数据,包括获取每段中所述测试数据和标准数据的初始误差;根据所述初始误差以及基频候选点数据,确定误差面积;获取所述误差面积中对应每段测试数据的最小值,并根据对应每段测试数据的平均误 差中的最小值获取对应的初始误差,确定对应所述标准数据的第二基频数据。
4.根据权利要求4所述的音频数据的比较方法,其特征在于,所述方法还包括当所述第二基频数据和第一基频数据的比较结果满足预置值时,存储所述第二基频数 据,作为标准模板。
5.根据权利要求1所述的音频数据的比较方法,其特征在于,所述将所述第一基频数 据和第二基频数据进行比较,得出比较结果,包括通过所述第一基频数据和第二基频数据之间的误差面积,得出比较结果。
6.根据权利要求5所述的音频数据的比较方法,其特征在于,所述方法还包括将根据所述误差面积获得的每段数据的比较结果通过加权求平均值的方式,得到整个 测试数据和标准数据之间的比较结果。
7.一种音频数据的比较装置,其特征在于,所述装置包括标准数据获取模块,用于由预置的基准数据经过准确分段、训练得到高斯混合模型 GMM,利用所述GMM对测试数据对应的标准数据进行分段;第一基频提取模块,用于提取对应所述测试数据的第一基频数据;第二基频提取模块,用于对每段中的标准数据进行分帧,提取对应所述标准数据的基 频候选点数据,结合每段中所述测试数据和标准数据的初始误差,获得对应所述标准数据 的第二基频数据;比较模块,用于将所述第一基频数据和第二基频数据进行比较,得出比较结果。
8.根据权利要求7所述的音频数据的比较装置,其特征在于,所述第二基频提取模块,具体包括采样点基频均值获取子模块,用于对所述测试数据按照预置帧长及帧移进行分帧,获 取每帧测试数据中所有采样点的基频均值;基频处理子模块,用于将所述采样点的基频值减去所述基频均值,并对相减之后的采 样点的基频进行汉宁窗函数处理;基频候选点获取子模块,用于保留上述采样点中最大自相关系数对应的时间周期值, 将所述时间周期值作为所述标准数据的基频候选值的选取基准,并将所述标准数据的基频 候选点数据转换为音高数据;初始误差获取子模块,用于获取每段中所述测试数据和标准数据的初始误差; 代价函数确定子模块,用于根据所述初始误差以及基频候选点数据,确定代价函数; 第二基频确定子模块,用于获取所述代价函数中对应每段测试数据的平均误差中的最 小值,并根据对应每段测试数据的平均误差中的最小值获取对应的初始误差,确定对应所 述标准数据的第二基频数据。
9.根据权利要求7所述的音频数据的比较装置,其特征在于,所述装置还包括存储模块,用于当所述第二基频数据和第一基频数据的比较结果满足预置值时,存储 所述第二基频数据,作为标准模板。
10.根据权利要求7所述的音频数据的比较装置,其特征在于,所述比较模块通过所述 第一基频数据和第二基频数据之间的误差面积,得出比较结果。
11.根据权利要求10所述的音频数据的比较装置,其特征在于,所述比较模块还通过 将根据所述误差面积获得的每段数据的比较结果通过加权求平均值的方式,得到整个测试 数据和标准数据之间的比较结果。
全文摘要
本发明公开了一种音频数据的比较方法和装置,其中,所述比较方法包括由预置的基准数据经过准确分段、训练得到高斯混合模型GMM,利用所述GMM对测试数据对应的标准数据进行分段;提取对应所述测试数据的第一基频数据;对每段中的标准数据进行分帧,提取对应所述标准数据的基频候选点数据,结合每段中所述测试数据和标准数据的误差,获得对应所述标准数据的第二基频数据;将所述第一基频数据和第二基频数据进行比较,得出比较结果。通过本发明实施例,能够准确提取标准数据的基频,从而实现测试音频数据同标准音频数据之间的比较。
文档编号G10L15/10GK101968958SQ20101053021
公开日2011年2月9日 申请日期2010年11月2日 优先权日2010年11月2日
发明者刘丹, 刘庆峰, 胡国平, 胡郁, 蒋成林, 魏思 申请人:安徽科大讯飞信息科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1