一种音频质量评测方法及系统的制作方法

文档序号:10625475阅读:260来源:国知局
一种音频质量评测方法及系统的制作方法
【专利摘要】本发明公开了一种音频质量评测方法及系统,属于语音信号处理技术领域。该音频质量评测方法包括:接收用户输入的音频数据;对所述音频数据进行转码处理,得到多个音频采样点数据;分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。该音频质量评测方法,综合多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需要。
【专利说明】
-种音频质量评测方法及系统
技术领域
[0001] 本发明设及语音信号处理技术领域,特别设及一种音频质量评测方法及系统。
【背景技术】
[0002] 随着数字音频处理技术的不断发展,对音频质量的要求越来越高。如何确定合适 的评测标准对音频质量进行评测,从而得到符合要求的音频,成为当前的重要课题。
[0003] 在音频技术发展的初期,由于没有客观的评测标准,通常组织大量的音频试听人 员通过人工试听各种音频,来对音频质量进行评测、打分。该种方式由于需要大量的人员参 与,经济成本高、实验周期长,并且基于每个评测人员的喜好、标准具有主观性、难W统一, 从而无法保证评测结果的客观性和准确性。 阳004] 随着技术的发展,人们通过对音频质量影响较大的指标加 W总结,形成音频质量 参数作为音频质量的客观评测标准。其中,典型的音频质量参数主要有:截幅、响度、信噪比 和噪声能量。在实际应用中,根据音频使用场合的不同,选择其中一项音频质量参数,对该 场合下的音频质量进行评测。该种评测方式由于仅考虑音频质量的某项指标,评测结果只 对特定场合具有参考意义,而无法适用于其他场合,普适性较差。

【发明内容】
阳〇化]本发明实施例提供了一种音频质量评测方法及系统,综合多项音频质量参数对音 频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需要。
[0006] 本发明实施例提供的技术方案如下:
[0007] 一方面,提供了一种音频质量评测方法,包括:
[0008] 接收用户输入的音频数据;
[0009] 对所述音频数据进行转码处理,得到多个音频采样点数据;
[0010] 分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和 频谱上限频率;
[0011] 根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱 上限频率,计算音频质量得分。
[0012] 优选地,所述计算频谱上限频率包括:
[0013] 对所述音频采样点数据进行分帖处理;
[0014] 计算每帖音频数据的频谱上限频率;
[0015] 统计所述频谱上限频率在全频带内的次数直方图,从频谱上限频率最大的次数直 方图开始选取预设宽度的频带范围;
[0016] 确定所述预设宽度的频带范围内的每个所述次数直方图的中屯、频率点,并统计所 述中屯、频率点出现的次数;
[0017] 将所述次数作为加权系数,计算所述中屯、频率点的加权平均值;
[0018] 将所述加权平均值作为所述频谱上限频率。
[0019] 优选地,所述计算平均响度包括:
[0020] 对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对 值数据;
[0021] 对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝 对值数据;
[0022] 计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅绝对值数据的 平均振幅值;
[0023] 将所述平均振幅值作为所述平均响度。
[0024] 优选地,所述根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能 量和所述频谱上限频率,计算音频质量得分包括:
[00巧]获取预设的初始音频质量得分;
[0026] 分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声 能量和所述频谱上限频率,确定运五个音频质量参数异常情况的累计扣分;
[0027] 计算所述初始音频质量得分与所述累计扣分的差值;
[0028] 将所述差值作为所述音频质量得分。
[0029] 优选地,所述方法还包括:
[0030] 根据所述音频质量得分确定音频质量等级;
[0031] 将所述音频质量等级作为评测结果。
[0032] 另一方面,提供了一种音频质量评测系统,包括:
[0033] 接收模块,用于接收用户输入的音频数据;
[0034] 转码模块,用于对所述音频数据进行转码处理,得到多个音频采样点数据;
[0035] 第一计算模块,用于分别计算所述音频采样点数据的爆音截幅点比例、平均响度、 信噪比、噪声能量和频谱上限频率;
[0036] 第二计算模块,用于根据所述第一计算模块计算得到的所述爆音截幅点比例、所 述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。
[0037] 优选地,所述第一计算模块包括第一计算子模块,用于计算频谱上限频率;所述第 一计算子模块,包括:
[0038] 分帖单元,用于对所述音频采样点数据进行分帖处理;
[0039] 第一计算单元,用于计算每帖音频数据的频谱上限频率;
[0040] 第一统计单元,用于统计所述频谱上限频率在全频带内的次数直方图;
[0041] 选择单元,用于从所述第一统计单元统计的频谱上限频率最大的次数直方图开始 选取预设宽度的频带范围;
[0042] 确定单元,用于确定所述预设宽度的频带范围内的每个所述次数直方图的中屯、频 率占.
[0043] 第二统计单元,用于统计所述确定单元确定的所述中屯、频率点出现的次数;
[0044] 第二计算单元,用于将所述第二统计单元统计的所述中屯、频率点出现的次数作为 加权系数,计算所述中屯、频率点的加权平均值,并将所述加权平均值作为所述频谱上限频 率。
[0045] 优选地,所述第一计算模块还包括第二计算子模块,用于计算所述平均响度;所述 第二计算子模块,包括:
[0046] 第一提取单元,用于对所述音频采样点数据的振幅绝对值提取一层包络,得到一 层包络音频振幅绝对值数据;
[0047] 第二提取单元,用于对所述一层包络音频振幅绝对值数据再提取一层包络,得到 二层包络音频振幅绝对值数据;
[0048] 第Ξ计算单元,用于计算所述一层包络音频振幅绝对值数据和所述二层包络音频 振幅绝对值数据的平均振幅值,并将所述平均振幅值作为所述平均响度。
[0049] 优选地,所述第二计算模块包括:
[0050] 获取单元,用于获取预设的初始音频质量得分;
[0051] 第四计算单元,用于分别根据计算得到的所述爆音截幅点比例、所述平均响度、所 述信噪比、所述噪声能量和所述频谱上限频率,确定运五个音频质量参数异常情况的累计 扣分;
[0052] 第五计算单元,用于计算所述初始音频质量得分与所述累计扣分的差值,并将所 述差值作为所述音频质量得分。
[0053] 优选地,所述系统还包括:确定模块,用于根据所述音频质量得分确定音频质量等 级,并将所述音频质量等级作为评测结果。
[0054] 本发明实施例提供的音频质量评测方法及系统,对用户输入的音频数据转码后得 到多个音频采样点数据,通过计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、 噪声能量和频谱上限频率五个音频质量参数,进而根据音频质量参数计算得到音频质量得 分。该音频质量评测方法及系统,由于综合了多项音频质量参数对音频质量进行评测,评测 结果普适性较强,能够满足多数应用场合的需求。
【附图说明】
[0055] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一 些实施例,对于本领域普通技术人员来讲,还可W根据运些附图获得其他的附图。
[0056] 图1是本发明实施例提供的一种音频质量评测方法的流程图;
[0057] 图2是本发明实施例提供的一种频谱上限频率的计算方法流程图;
[0058] 图3是本发明实施例提供的一种平均响度的计算方法流程图;
[0059] 图4是本发明实施例提供的一种音频质量得分的计算方法流程图;
[0060] 图5是本发明实施例提供的另外一种音频质量评测方法的流程图;
[0061] 图6是本发明实施例提供的一种音频质量评测系统的结构示意图;
[0062] 图7是本发明实施例提供的第二种音频质量评测系统的结构示意图;
[0063] 图8是本发明实施例提供的第Ξ种音频质量评测系统的结构示意图; W64] 图9是本发明实施例提供的第四种音频质量评测系统的结构示意图;
[0065] 图10是本发明实施例提供的第五种音频质量评测系统的结构示意图。
【具体实施方式】
[0066] 为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施 方式对本发明实施例作进一步的详细说明。
[0067] 本发明实施例提供了一种音频质量评测方法,如图1所示,包括:
[0068] 步骤101 :接收用户输入的音频数据。
[0069] 步骤102 :对音频数据进行转码处理,得到多个音频采样点数据。
[0070] 具体地,可W根据对输出音频数据的格式要求及用户输入音频数据中携带的编码 信息进行转码工具的选择,采用转码工具对音频数据进行转码处理。例如可W选择ffmpeg 作为转码工具对音频数据进行转码处理,转码后的音频格式为单通道,采样率为16k,采样 精度为16bit的wav格式。由于ffmpeg转码工具能够自动分析原始音频的格式信息,因 此,可W支持任意格式的输入音频数据。在使用中可W预先确定所要输出的音频格式,采用 ffmpeg能够将输入的音频数据转换为所确定的音频格式进行输出。
[0071] 步骤103 :分别计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声 能量和频谱上限频率。
[0072] 其中,爆音截幅点比例指音频采样点数据中振幅值超过振幅截幅口限值的采样点 数目与全部采样点数目的比值。爆音截幅点比例越小,音频质量越高。预先设置音频振幅 截幅口限值η (例如,设置η = 3000),统计步骤102得到的音频采样点数据中振幅值超过 振幅截幅口限值η的采样点数目为suml,全部采样点数目为sum,则爆音截幅点比例α = sum1/sum。
[0073] 响度,指人耳感觉到的声音强弱,即声音的响亮程度。响度的大小主要依赖于声 强,也与声音的频率有关。在本发明实施例中,采用振幅值来表征响度的大小,更具体地,采 用平均振幅值来表征平均响度的大小,其中,可W通过对音频采样点数据的振幅绝对值提 取包络,进行平均响度值的计算。
[0074] 如图3所示,为本发明实施例提供的一种平均响度的计算方法的流程图,包括W 下步骤:
[00巧]步骤301 :对音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振 幅绝对值数据。
[0076] 其中,一层包络音频振幅绝对值数据为采样点极大值的集成,例如采用β 1表示, 在对平均响度的计算精度要求不高的场合,可W将一层包络音频振幅绝对值数据直接作为 平均响度。
[0077] 步骤302 :对一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频 振幅绝对值数据。
[0078] 为了提高平均响度的计算精度,可W对一层包络音频振幅绝对值数据进一步提取 一层包络,得到二层包络音频振幅绝对值数据,例如采用β 2表示。
[0079] 步骤303 :计算一层包络音频振幅绝对值数据和二层包络音频振幅绝对值数据的 平均振幅值,并将平均振幅值作为平均响度。
[0080] 通过计算一层包络音频振幅绝对值数据β 1和二层包络音频振幅绝对值数据0 2 的平均振幅值β,即β = (β 1+62)/2,将β作为平均响度,能够确保平均响度的计算精 度。
[0081] 信噪比(signal-to-noise ratio)是描述信号中有效成分与噪声成分的比例关系 参数,W 丫表示,信噪比越大,噪声越小。由于噪声W波的形式存在,具有一定的能量,因 此,可W通过噪声能量来作为衡量音频质量的参数之一,其中,噪声能量可W采用E表示。 本领域技术人员通过常用计算工具,例如speex工具,能够方便地计算出信噪比丫和噪声 能量E。
[0082] 频谱指频率的分布曲线。音频信号的频谱按照频率的高低覆盖一定宽度的频带 范围。由于音频信号并非在所有的频带范围内都有效,例如,对于常规的未经处理的音频 信号而言,通常在较窄范围内的低音频段内的音频信号有效,而对于覆盖频带范围较宽的 高音频段内的音频信号无效。也即,在音频频谱中存在一个频率值,该频率值为音频频谱中 实际有效的最高频率值,我们称之为频谱上限频率。通过频谱上限频率能够将音频频谱划 分为有效音频和无效音频两部分,具体而言,高于频谱上限频率的音频信号无效,而低于该 频谱上限频率的音频信号值才有效,体现在频谱图上,将高于频谱上限频率的音频信号用 暗色表示,而将低于频谱上限频率的音频信号采用亮色表示。其中,将音频信号区分为有效 音频和无效音频并非指音频信号绝对的有效或无效,而是根据其对音频质量的影响大小而 言,我们认为无效音频对音频质量影响较小,可W忽略不计,而有效音频对音频质量影响较 大,需要在音频质量评测中重点给予评测。在未引入频谱上限频率的概念之前,在对音频信 号进行音频质量评测时,需要对全频带内的音频信号按照相同的采样频率进行采样、分析, 由于在全频带范围内无效频带所覆盖的范围往往宽于有效频带范围,因此,导致采样数据 中有较大一部分为无效频带内的数据,从而导致花费大量精力进行分析的数据对实际音频 质量基本无参考意义,也即,多做了很多的无用功。此外,由于音频信号的全频带范围较宽, 从而导致在处理同样数据量的情况下,采样精度较低,从而影响整体计算精度,并且在对大 量无效频带中的数据进行处理过程中,容易发生错误,从而引发整体评测结果出错。引入频 谱上限频率后,将全频带范围分为有效音频和无效音频,只对音频信号中的有效音频进行 采样、分析,而对无效音频不予处理,由于无效音频覆盖的频带宽度远大于有效音频宽度, 从而大大减小了数据处理量,并且减小了对无效音频处理出错的概率,此外,由于处理带宽 较小,可W大幅提高采样精度,从而保证评测结果更加准确。例如,音频信号的频带范围为 0~20曲Z,其中,频谱上限频率为4曲Z,也即,0~4曲Z为有效频带,而4k~16曲Z为无效 频带,则引入频谱上限频率后,相当于截取宽度为0~4曲Z的频带进行音频质量评测,明显 比对0~20曲Z的频带进行音频质量评测所需要处理的数据量减少,因此,可W对0~4曲Z 频宽范围内采用较高的采样频率进行采样,从而使得处理结果更加精确。
[0083] 如图2所示,为本发明实施例提供的一种频谱上限频率的计算方法的流程图,包 括:
[0084] 步骤201 :对音频采样点数据进行分帖处理。
[00化]具体可W采用常规方式进行分帖处理,例如采用Matl油提供的分帖处理函数对 音频采样点数据进行分帖处理,从而能够得到多帖音频数据。
[0086] 步骤202 :计算每帖音频数据的频谱上限频率。
[0087] 对音频采样点数据进行分帖处理,得到多帖音频数据后,可W分别计算每 帖音频数据的频谱上限频率fi。假设频谱的频率范围是0~PHz,那么每帖音频数 据在频率范围上存在一个最大频率点THz,使得该帖音频数据在T~P化范围内的 频谱值都小于等于一个口限值ξ,其中,ξ是一个接近于0的值。具体计算方法是 做Ν点的FFT,,对应16曲Ζ采样率,频谱的频率范围是0~8曲Ζ,表现为W 8k/N为 频带宽度的N个中屯、频率为
的频带的频谱幅度值,即
根据频谱上限频率的定义,按 照频带中屯、频率从大到小的顺序计算出第一个频谱幅度值大于某个设定口限值,例如ξ =0. 3的频带的中屯、频率,即为该帖音频数据的上限频率fi。
[0088] 步骤203 :统计频谱上限频率在全频带内的次数直方图,从频谱上限频率最大的 次数直方图开始选取预设宽度的频带范围。
[0089] 根据计算出的每帖数据的上限频率fi(i = 0, 1,…M),其中,Μ为总帖数,在N个 频带上统计上限频率fi =化出现的次数化(η = 0, 1···,Ν),制作全频带范围内的次数直 方图,从最大上限频率的次数直方图开始选取预设宽度的频带范围,例如,从8曲Ζ处往下 取宽度为甜Ζ的频带,一般地,通过音频测试集上的参数调优,优选将频带宽度选择为S = Iko
[0090] 步骤204 :确定预设宽度的频带范围内的每个次数直方图的中屯、频率点,并统计 中屯、频率点出现的次数。
[0091] 对于每个次数直方图而言,容易确定其中屯、频率点化,从而容易统计出该预设宽 度频带范围内的上限频率fi =化出现的总次数To
[0092] 步骤205 :将次数作为加权系数,计算中屯、频率点的加权平均值,将加权平均值作 为频谱上限频率。
[0093] W S = 1曲Z宽度为频带从高频部分往低频部分平滑,平滑长度为8k/N Hz,计算 出新的频带内上限频率^町出现的总次数T 1,依次计算T, (j = 0, 1,…胖),由于频带是从 0~1曲Z开始,保证频带的宽度为1曲Z不变,频带开始频率依次增加8k/N的平滑长度,最 终的频带是7曲Z~8曲Z,频带的开始频率组成一个起始值为0,终值为化,步长为8k/N的 等差数列,因此,
^十算Tmgy= max {T , I (j = 0, 1,. . .,W)}对应的频带中所 有宽度为8k/N的最小频带的中屯、频率F。的加权平均,权重系数为对应的C。,其结果即为最 终的音频数据的频谱上限频率f。
[0094] 步骤104 :根据爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率,计 算音频质量得分。
[0095] 如图4所示,为本发明实施例提供的一种音频质量得分的计算方法流程图,包括:
[0096] 步骤401 :获取预设的初始音频质量得分。
[0097] 其中,初始音频质量得分可W根据评分规则事先设置好,例如在采用百分制评分 规则的情况下,可W将初始音频质量得分设置为100分。
[0098] 步骤402 :分别根据计算得到的爆音截幅点比例、平均响度、信噪比、噪声能量和 频谱上限频率,确定运五个音频质量参数异常情况的累计扣分。
[0099] 根据上述步骤103计算得到的爆音截幅点比例α、平均响度β、信噪比丫、噪声能 量Ε和频谱上限频率f五个音频质量参数后,根据事先设置的扣分规则,能够分别确定运五 个音频质量参数异常情况下的扣分情况,从而计算出五个音频质量参数异常情况下的累计 扣分。
[0100] 具体可W通过采集大量的音频数据作为样本进行统计、分析,得出音频质量在各 种不同使用场合下的得分情况,然后综合得出各音频质量参数异常情况下的扣分情况(音 频质量参数正常情况下扣分为0),从而保证评分结果能够适用于多数场合的应用需求。为 了保证评测结果更加精确,可W将每个音频质量参数在不同数值范围时,所对应的扣分设 置为不同值。
[0101] 例如:(1)当α《0. 006时,将扣分设置为0 ;当0. 006 < α < 0. 01时,将扣分设 置为A山;当α >0.01时,将扣分设置为A巧],其中,AU] < A凹; 阳10引 似当0 > 1200时,将扣分设置为0 ;当1000《0《1200时,将扣分设置为 B[l];当0 < 1000时,将扣分设置为B巧],其中,8山<B凹; 阳103] (3)当丫 > 16. 8时,将扣分设置为0 ;15. 5《丫《16. 8时,将扣分设置为C[l]; 13. 5《丫 < 15. 5时,将扣分设置为C[2];当丫 < 13. 5时,将扣分设置为C巧],其中,C[l] <C巧]<C[3];
[0104] (4)当E < 43. 43时,将扣分设置为0 ;当E > 43. 43且丫 < 52. 55时,将扣分设 置为D[l];当E > 43. 43且52. 55《丫 < 54. 55时,将扣分设置为D巧];当43. 43,且 丫 > 54. 55时,将扣分设置为0巧],其中,D[l] <D[2] <D[3]; 阳1化](5)当f <6000或f > 7000时,将扣分设置为0 ;当6000《f < 7000且丫 > 6000 时,将扣分设置为E[l];当6000《f < 7000且5000《丫 < 6000时,将扣分设置为E[2]; 当6000《f < 7000且丫 < 5000时,将扣分设置为E巧],其中,E[l] <E[2] <E巧]。 阳 106]上述扣分 A[1]、A[2]、B[1]、B[2]、C[1]、C[2]、U3]、D[1]、M2]、D[3]、E[1]、E[2] 和E[3]分别根据统计数据得出,事先设置好,根据各音频质量参数的数值选择不同的扣 分,其中,A巧]+B巧]+C[3]+M3]+E[3]《预设的初始质量得分,从而保证最终计算得到的音 频质量得分> 0。 阳107] 根据各音频质量参数对音频质量的影响大小,分别将信噪比γ作为单独的评测 参数进行评测,又将信噪比丫与噪声能量Ε结合、将信噪比丫与频谱上限频率f相结合作 为评测参数对音频质量进行评测,当信噪比γ同时满足(3)、(4)和巧)中的条件时,需要 分别对各项单独进行扣分。
[010引根据上述爆音截幅点比例α、平均响度β、信噪比丫、噪声能量Ε和频谱上限频 率f五个音频质量参数,能够分别计算出各项参数对应的扣分,将各项扣分求和,能够计算 出五个音频质量参数异常情况下的累计扣分。
[0109] 步骤403:计算初始音频质量得分与累计扣分的差值,并将差值作为音频质量得 分。
[0110] 在本发明实施例中,将初始音频质量得分与各音频质量参数异常情况下的累计扣 分的差值作为音频质量得分,由于充分考虑了爆音截幅点比例α、平均响度β、信噪比丫、 噪声能量Ε和频谱上限频率f五个音频质量参数对音频质量的影响,能够保证评测结果满 足多数场合的应用需求。 阳111] 如图5所示,上述音频质量评测方法还可W包括: 阳112] 步骤105 :根据音频质量得分确定音频质量等级,并将音频质量等级作为评测结 果。
[0113] 可W预先设置评级标准,在计算出音频质量得分score后,进一步根据音频质量 得分score确定所属的音频质量等级level,将音频质量等级作为最终的评测结果反馈给 用户。 阳114] 例如,将音频质量等级设置为五级,当0《score《20时,对应的音频质量等 级level为一级;当20 < score《40时,对应的音频质量等级level为二级;当40 < score《60时,对应的音频质量等级level为Ξ级;当60 < score《80时,对应的音频 质量等级level为四级;当80 < score《100时,对应的音频质量等级level为五级。其 中,level越高代表用户的唱歌水平越高。
[0115] 本发明实施例提供的音频质量评测方法,对用户输入的音频数据转码后得到多个 音频采样点数据,通过计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能 量和频谱上限频率五个音频质量参数据在频率范围上存在一个最大频率点THz,使得该帖 音频数据在T~P化范围内的频谱值都数,进而根据音频质量参数计算得到音频质量得分。 该音频质量评测方法及系统,由于综合了多项音频质量参数对音频质量进行评测,评测结 果普适性较强,能够满足多数应用场合的需求。
[0116] 相应地,本发明实施例还提供了一种音频质量评测系统,如图6所示,包括:
[0117] 接收模块501,用于接收用户输入的音频数据;
[0118] 转码模块502,用于对音频数据进行转码处理,得到多个音频采样点数据;
[0119] 第一计算模块503,用于分别计算音频采样点数据的爆音截幅点比例、平均响度、 信噪比、噪声能量和频谱上限频率;
[0120] 第二计算模块504,用于根据第一计算模块503计算得到的爆音截幅点比例、平均 响度、信噪比、噪声能量和频谱上限频率,计算音频质量得分。 阳121] 如图7所示,上述第一计算模块503包括第一计算子模块601,用于计算频谱上限 频率;其中,第一计算子模块601的一种具体结构包括: 阳122] 分帖单元701,用于对音频采样点数据进行分帖处理; 阳123] 第一计算单元702,用于计算每帖音频数据的频谱上限频率;
[0124] 第一统计单元703,用于统计频谱上限频率在全频带内的次数直方图;
[01巧]选择单元704,用于从第一统计单元703统计的频谱上限频率最大的次数直方图 开始选取预设宽度的频带范围;
[01%] 确定单元705,用于确定预设宽度的频带范围内的每个次数直方图的中屯、频率 占. '?、、,
[0127] 第二统计单元706,用于统计确定单元705确定的中屯、频率点出现的次数;
[0128] 第二计算单元707,用于将第二统计单元706统计的中屯、频率点出现的次数作为 加权系数,计算中屯、频率点的加权平均值,并将加权平均值作为频谱上限频率。
[0129] 如图8所示,上述第一计算模块503还包括第二计算子模块602,用于计算平均响 度;其中,第二计算子模块602的一种具体结构包括:
[0130] 第一提取单元708,用于对音频采样点数据的振幅绝对值提取一层包络,得到一层 包络音频振幅绝对值数据; 阳131] 第二提取单元709,用于对一层包络音频振幅绝对值数据再提取一层包络,得到二 层包络音频振幅绝对值数据;
[0132] 第Ξ计算单元710,用于计算一层包络音频振幅绝对值数据和二层包络音频振幅 绝对值数据的平均振幅值,并将平均振幅值作为平均响度。
[0133] 如图9所示,上述第二计算模块504包括:
[0134] 获取单元801,用于获取预设的初始音频质量得分; 阳135] 第四计算单元802,用于分别根据计算得到的爆音截幅点比例、平均响度、信噪比、 噪声能量和频谱上限频率,确定运五个音频质量参数异常情况的累计扣分; 阳136] 第五计算单元803,用于计算初始音频质量得分与累计扣分的差值,并将差值作为 音频质量得分。
[0137] 如图10所示,上述音频质量评测系统进一步包括:
[0138] 确定模块505,用于根据音频质量得分确定音频质量等级,并将音频质量等级作为 评测结果。
[0139] 本发明实施例提供的音频质量评测系统,对用户输入的音频数据转码后得到多个 音频采样点数据,通过计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能 量和频谱上限频率五个音频质量参数,进而根据音频质量参数计算得到音频质量得分。该 音频质量评测方法及系统,由于综合了多项音频质量参数对音频质量进行评测,评测结果 普适性较强,能够满足多数应用场合的需求。
[0140] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实 施例而言,由于其基本相似于方法实施例,所W描述得比较简单,相关之处参见方法实施例 的部分说明即可。W上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明 的模块或单元可W是或者也可W不是物理上分开的,作为单元显示的部件可W是或者也可 W不是物理单元,即可W位于一个地方,或者也可W分布到多个单元上。可W根据实际的需 要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付 出创造性劳动的情况下,即可W理解并实施。 阳141] W上所述仅为本发明的较佳实施例,并不用W限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种音频质量评测方法,其特征在于,包括: 接收用户输入的音频数据; 对所述音频数据进行转码处理,得到多个音频采样点数据; 分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱 上限频率; 根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限 频率,计算音频质量得分。2. 根据权利要求1所述的音频质量评测方法,其特征在于,所述计算频谱上限频率包 括: 对所述音频采样点数据进行分帧处理; 计算每帧音频数据的频谱上限频率; 统计所述频谱上限频率在全频带内的次数直方图,从频谱上限频率最大的次数直方图 开始选取预设宽度的频带范围; 确定所述预设宽度的频带范围内的每个所述次数直方图的中心频率点,并统计所述中 心频率点出现的次数; 将所述次数作为加权系数,计算所述中心频率点的加权平均值; 将所述加权平均值作为所述频谱上限频率。3. 根据权利要求1所述的音频质量评测方法,其特征在于,所述计算平均响度包括: 对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数 据; 对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值 数据; 计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅绝对值数据的平均 振幅值; 将所述平均振幅值作为所述平均响度。4. 根据权利要求1所述的音频质量评测方法,其特征在于,所述根据所述爆音截幅点 比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分 包括: 获取预设的初始音频质量得分; 分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量 和所述频谱上限频率,确定这五个音频质量参数异常情况的累计扣分; 计算所述初始音频质量得分与所述累计扣分的差值; 将所述差值作为所述音频质量得分。5. 根据权利要求1至4任一项所述的音频质量评测方法,其特征在于,所述方法还包 括: 根据所述音频质量得分确定音频质量等级; 将所述音频质量等级作为评测结果。6. -种音频质量评测系统,其特征在于,包括: 接收模块,用于接收用户输入的音频数据; 转码模块,用于对所述音频数据进行转码处理,得到多个音频采样点数据; 第一计算模块,用于分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪 比、噪声能量和频谱上限频率; 第二计算模块,用于根据所述第一计算模块计算得到的所述爆音截幅点比例、所述平 均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。7. 根据权利要求6所述的音频质量评测系统,其特征在于,所述第一计算模块包括第 一计算子模块,用于计算频谱上限频率;所述第一计算子模块,包括: 分帧单元,用于对所述音频采样点数据进行分帧处理; 第一计算单元,用于计算每帧音频数据的频谱上限频率; 第一统计单元,用于统计所述频谱上限频率在全频带内的次数直方图; 选择单元,用于从所述第一统计单元统计的频谱上限频率最大的次数直方图开始选取 预设宽度的频带范围; 确定单元,用于确定所述预设宽度的频带范围内的每个所述次数直方图的中心频率 占. 第二统计单元,用于统计所述确定单元确定的所述中心频率点出现的次数; 第二计算单元,用于将所述第二统计单元统计的所述中心频率点出现的次数作为加权 系数,计算所述中心频率点的加权平均值,并将所述加权平均值作为所述频谱上限频率。8. 根据权利要求6所述的音频质量评测系统,其特征在于,所述第一计算模块还包括 第二计算子模块,用于计算所述平均响度;所述第二计算子模块,包括: 第一提取单元,用于对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包 络音频振幅绝对值数据; 第二提取单元,用于对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层 包络音频振幅绝对值数据; 第三计算单元,用于计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅 绝对值数据的平均振幅值,并将所述平均振幅值作为所述平均响度。9. 根据权利要求6所述的音频质量评测系统,其特征在于,所述第二计算模块包括: 获取单元,用于获取预设的初始音频质量得分; 第四计算单元,用于分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述 信噪比、所述噪声能量和所述频谱上限频率,确定这五个音频质量参数异常情况的累计扣 分; 第五计算单元,用于计算所述初始音频质量得分与所述累计扣分的差值,并将所述差 值作为所述音频质量得分。10. 根据权利要求6至9任一项所述的音频质量评测系统,其特征在于,所述系统还包 括:确定模块,用于根据所述音频质量得分确定音频质量等级,并将所述音频质量等级作为 评测结果。
【文档编号】G10L25/60GK105989853SQ201510091491
【公开日】2016年10月5日
【申请日】2015年2月28日
【发明人】杨将, 杨溥, 吴维昊
【申请人】科大讯飞股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1