一种基于模式识别Hi-Fi音质检测方法

文档序号:9351144阅读:416来源:国知局
一种基于模式识别Hi-Fi音质检测方法
【技术领域】
[0001] 本发明涉及音频信号处理和,具体涉及一种基于模式识别Hi-Fi音质检测方法。
【背景技术】
[0002] Hi-Fi音频指的是原版CD音频,这类音频由各大唱片公司等制作,采用专业的录 音及混响设备,对原始声音信息采样量化,而且没有经过频谱裁剪,所以保留了原始各个频 段的信息。
[0003] 伴随着网络的快速普及以及带宽的增加,人们对于音乐质量的要求也越来越高, 无损音乐资源的交流也从音乐发烧友间向普通大众过渡。但如何鉴别这类资源的真伪,音 乐爱好者和音乐类公司都有着迫切的需要。通过人工检测虽然有较高的准确率,但仅仅适 用于个人,对于音乐类公司千万级数量的曲库来说,无法简单的通过人工检测来过滤曲库。
[0004] 采用计算机检测的方法,目前应用的较多的是通过划分频率的方法。其步骤包括, 将时域音频信息通过傅里叶变换转换为频域,对于大多数采样率为44100的音频来说,转 换成频域后所能表示的最大频率为22050Hz。然后通过分析某个截止频率以上频率信息的 缺少情况来判别音频的质量。例如,某些压缩算法,为了减小音频的体积,将原始音频通过 该算法压缩后,高频信息是有缺失的。上述方法既是基于以上原理,通过划分截止频率的方 法来判别音频质量,将高频信息缺失到一定程度的音频判定为假无损。
[0005] 上述方法能在一定程度上解决无损音频质量检测的问题,但有两个较大的不足。
[0006] 本发明是基于贝叶斯网络的分类方法,下面介绍贝叶斯网络的相关技术背景。
[0007] 贝叶斯学派奠基性的工作是贝叶斯的论文"过于几率性问题求解的评论"完成的。 著名数学家拉普拉斯利用贝叶斯的方法导出了重要的相继律,从此,贝叶斯的方法和理论 逐渐被人理解和重视起来。二战期间,瓦尔德提出了统计的决策理论,该理论中,贝叶斯占 有重要的地位。80年代以后,由于人工智能尤其是机器学习的发展和数据挖掘的兴起,贝叶 斯理论得到了越来越宽广的发展和应用。
[0008] 贝叶斯网络,又称置信网络(beliefnetwork)或概率有向无环图模型 (probabilisticdirectedacyclicgraphicalmodel),是贝叶斯方法与图形理论的有机 结合。从 1988 年由Pearl【Probabilisticreasoninginintelligentsystems:networks ofplausibleinference】提出后,已经成为近几年来研究的热点。Jensen将贝叶斯网 络定义为一种可以表达一组随机变量之间概率关系的概率模型图【Nielsen.Bayesian networksanddecisiongraphs】。它通过有向无环图(DAG)来表达一组随机变量和其 条件依赖,是朴素贝叶斯方法的扩展,可以表达和分析多源信息,进而处理不确定性问题 [Complexsystemssimulationforriskassessmentinfloodincidentmanagement] [InfluencesofvariablesonshipcollisionprobabilityinaBayesianbelief networkmodel】,是目前不确定知识表达和推理领域最有效的理论模型之一。Cooper【A simpleconstrain-basedalgorithmforefficientlyminingobservationaldatabases forcausalrelationships】在1997年提出来一种简单易行的因果关系挖掘算法,该算法 利用贝叶斯网络结构的性质,对数据集进行搜索并找出满足条件的因果关系。Silverstein 【Scalabletechniquesforminingcausalstructures】在 1998 年尝试了大型事件数据 库的挖掘。通常,贝叶斯网络是个有向无环图,图中的节点代表可观测量、潜在变量或者未 知变量等。图中的边代表了条件依赖,用条件概率进行表达关系强度,没有边相连的节点表 明它是独立的。贝叶斯网络用于表达和分析不确定性和概率性的事件,应用于有条件地依 赖多种控制因素的决策,可以从不完全、不精确或不确定的知识或信息中做出推理。其数学 定义如下:
[0009] 给定一个随机变量集合X=(X1,X2,...,XJ,X1表示Xi的取值。表达式p(X1= X1,X2=x2,. . .,Xn=xn)表示一个联合概率,也就是当X1,X2,. ?.,父"的值分别为X1,X2, . ? .,Xn 时的概率。其中,联合概率的一般形式为:
[0011] 贝叶斯网络的引用方面,主要有以下三类应用。
[0012] 一是通过贝叶斯网络进行分类和回归分析。
[0013] 贝叶斯网络具有不完全数据处理、因果关系学习等能力,具有良好的预测能力。实 践结果表明,贝叶斯网络可以用于分析具有高维高噪性和非线性相关关系的参数变量分析 问题中,有助于提高这类数据的分析效率。文献【基于类约束的贝叶斯网络分类学习】中提 至IJ,贝叶斯网络分类器与联合分类器具有相同的分类能力,由于具有概率推断能力,根据条 件独立性能够有效地降低维度,显著提高学习效率。实现贝叶斯网络分类器的核心是贝叶 斯网络结构学习。

【发明内容】

[0014] 本发明的目的在于针对上述不足提供一种快速准确的判断Hi-Fi无损音频的方 法。
[0015] 本发明的技术方案如下:
[0016] -种基于模式识别Hi-Fi音质检测方法,其特征在于包含如下步骤:
[0017] 1)选取采样率为44100HZ的无损音频和有损音频,对无损音频和有损音频进行区 别标记,
[0018] 2)将标记后的音频进行傅里叶变换,将时域信号转换成频域信号,
[0019]3)从频率11050Hz到22050Hz每隔500Hz的频率衰减均值作为一个频率特征, 总共22个特征,依次从1到22对其编号,即i= 1,2, 3. ..,22 ;
[0020] 设无损音频由R。表示,有损音频由R1表示,考虑相邻两个特征间的关系,对于无 损音频,特征间的关系可由(?IR。),(a21ai,R。),. . .,(a221a21,R。)表示,可以分别得到其条件 概率p(aiIR。),p(a21a1;R。),? ? ?,p(a221a21,R。),对应于有损音频的特征Ca11R1),(a21a1;R1),? ..,(a221a21,R1),可分别得到其条件概率p(a:IR1),p(a21a:,R1),. ..,p(a221a21,R1),训练贝叶 斯网络分类器;
[0021] 4)对待测音频进行傅里叶变换,将时域信号转换成频域信号,
[0022]5)按步骤3)的方法提取频率特征并计算取频率特征分别属于无损音频和有损音 频的条件概率,进而得到分别属于无损音频和有损音频的联合概率,即可判别出待测音频 属于无损音频或是有损音频。
[0023] -般的,为保证本方法的精度,所述的步骤1)中无损音频和有损音频的数量均要 求大于100首,且所选取的样品越多,本发明方法的精度越高。
[0024] 对于有损和无损,其在频率上的特征差别主要体现在16000Hz以上的高频部分, 无损音频的高频衰减较为自然和缓慢,有损音乐的高频信息衰减的急速,所以可以通过高 频部分的特征来判别无损音频。
[0025] 对于整体能量就小的舒缓型音频来说,其整体频率衰减较大,不仅仅体现在高频 部分,也包括中频,所以本方法将特征扩展到11050Hz开始的高频部分,这样可以一定程度 上避免对无损舒缓型音频的判别误差。综上所述,本方法选取了从11050Hz到22050Hz每隔 500Hz的频率衰减均值作为一个特征,总共22个特征,编号分别从1到22。本发明提出的 算法对于真无损音频具有很高的检测成功率,同时保证对于假无损有比较低的误判率。并 从与auCDtect的对比中可以看出,本发明提出的方法能达到业界较为先进的水品。
【附图说明】
[0026] 图1是贝叶斯网络训练分类流程图
[0027] 图2是普通无损音频频谱;
[0028] 图3是舒缓无损首频频谱;
[0029] 图4是有损音频频谱;
[0030] 图5是音频时域波形;
[0031] 图6是标记了特征选取方法的频率特征图;
[0032] 图7是基于贝叶斯网络的特征和音频质量的关系图;
【具体实施方式】
[0033] 下面结合附图进一步说明本发明。应当理解,以下实例仅用于说明本发明,而不能 作为本发明的限制,在不背离本发明精神和实质的前提下,进行的修改或替换,均属于本发 明的范围。
[0034] 如图1所示,为本发明的流程图,由于选取的音乐采样率均为44100HZ,所以最大 频率均为22050HZ。图2为一首普通的Hi-Fi无损流行歌曲的频谱,从图中可以看出
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1