水印加载装置及水印加载的方法

文档序号：9261971阅读：543来源：国知局

水印加载装置及水印加载的方法
【技术领域】
[0001]本发明涉及语音处理技术，尤其涉及一种可用于音频水印加载的水印加载装置及水印加载方法。
【背景技术】
[0002]在许多技术应用中，经常需要对媒体文件(音频、视频、图像等)添加一些信息，或作为标记信息，或为了保护媒体文件，但是，不管目的如何，这些添加的信息一般都是隐藏的，不被用户感知的。对于此类添加信息，通常使用“水印”概念，对音频、视频或是图像文件，均可通过加载相应的水印信息实现相应目的。加载的水印应以不影响原始媒体文件品质为前提，同时加载水印后媒体文件应具有较好的鲁棒特性，能够抵抗文件的压缩。
[0003]在听觉研究中，掩蔽是指一种声音对听觉系统感受另一种声音的影响。人的听觉具有掩蔽效应。掩蔽效应是指当两个声音同时在一个系统中传输时，一个较弱的声音由于另外一个较强的声音的出现而变得无法听到的现象。如何将掩蔽效用应用于媒体文件的水印加载，从而基于掩蔽效应实现水印信息的隐藏，同时又达到加载水印的目的，是一个值得研究与关注的问题。

【发明内容】

[0004]有鉴于此，本发明提供一种水印加载装置，能够有效而简单的为音频文件加载用户所需水印息。
[0005]此外，本发明还提供一种水印加载方法，能够有效而简单的为音频文件加载用户所需水印信息。
[0006]本发明实施方式提供的水印加载装置，用于为原始音频加载水印。所述水印加载装置包括解析单元、预设单元和判断单元。解析单元用于对原始音频进行预处理，计算原始音频的音量和音高，存储所述音量和所述音高作为原始音频信息；预设单元用于设置参数，所述参数包括用于筛选水印加载目标段的音量门限值和音高门限值；判断单元用于将原始音频信息与音量门限值及音高门限值进行对比以得出水印加载的目标段并为目标段加载水印信息。
[0007]优选的，所述参数还包括水印加载强度，所述水印加载强度指水印加载完成后音频文件的信噪比值。
[0008]优选的，水印信息为高斯白噪声。
[0009]优选的，判断单元在原始音频中一段音频的音量大于音量门限值且原始音频中一段音频的音高低于音高门限值时，判定原始音频中一段音频为水印加载的目标段。
[0010]本发明实施方式所提供的水印加载方法，应用于水印加载装置。所述方法包括以下步骤:对原始音频进行预处理，计算原始音频的音量和音高，存储所述音量和所述音高作为原始音频信息；设置参数，所述参数包括用于筛选水印加载目标段的音量门限值和音高门限值；将所述原始音频信息与所述音量门限值及所述音高门限值进行对比以得出水印加载的目标段并为所述目标段加载水印信息。
[0011]优选的，所述参数还包括水印加载强度，所述水印加载强度指水印加载完成后音频文件的信噪比值。
[0012]优选的，水印信息为高斯白噪声。
[0013]优选的，水印加载方法还包括如下步骤:当原始音频中一段音频的音量大于音量门限值且原始音频中一段音频的音高低于音高门限值时，判定原始音频中一段音频为水印加载的目标段。
[0014]本发明实施方式中所提供水印加载装置及水印加载方法通过选取音频文件中低频段且高音量部分嵌入高斯白噪声水印信息，利用掩蔽效应隐藏水印信息，同时使加载水印的SNR可控，也不影响原始音频的品质，并具有较好的鲁棒特性。
【附图说明】
[0015]图1是本发明中水印加载装置一实施方式的功能模块图。
[0016]图2是本发明中水印加载装置另一实施方式的功能模块图。
[0017]图3是本发明水印加载装置实现音频文件水印加载一实施方式的流程图。
[0018]图4是图3中步骤S300中实现音频文件预处理一实施方式的细化流程图。
[0019]图5是图3中步骤S302及步骤S304中实现音频文件水印加载一实施方式的细化流程图。
[0020]图6是对某一音频文件分别计算音高及音量所得的分析结果图。
[0021]图7是依据用户设定门限值对图6分析结果进行目标段选取的示意图。
[0022]图8是本发明水印加载方法在matlab平台上进行仿真后的结果对比。
[0023]图9中是图8中包含水印信息的音频文件与经过压缩的包含水印信息的音频文件在matlab仿真平台上对比。
[0024]主要元件符号说明
[0025]水印加载装置 10
[0026]处理器101
[0027]存储媒介102
[0028]解析单元1021
[0029]预设单元122
[0030]判断单元1023
[0031]数据库1024
[0032]如下【具体实施方式】将结合上述附图进一步说明本发明。
【具体实施方式】
[0033]图1是本发明中水印加载装置10 —实施方式的功能模块图。在本实施方式中，水印加载装置10包括解析单元1021、预设单元1022、判断单元1023及数据库1024。此处，水印加载装置10可以是常见的具有数字处理及编解码功能的编解码器或其他计算机设备，本文对此不作限制。
[0034]解析单元1021用于对需要进行水印加载的原始音频进行预处理。当用户确认需要对原始音频加载水印时，解析单元1021对原始音频进行解析，将原始音频分隔成多个音框，每个音框为一帧。此处，每一帧音频的长度可由用户自行设定。对于分隔而成的各个音框，解析单元1021从第一个音框开始，逐一计算每个音框内原始音频信号的音量及音高，并将计算所得的音量及音高存入位于数据库1024的缓存中。此处，音量用于衡量原始音频信号的能量强弱，音高则以Hz为单位，与音频信号的频率相关。每个音框在缓存中会有对应的单元记录其测量信息，如buffer (i)，i=l, 2，3…等,具体记录方式并不限于此。解析单元1021持续对原始音频信号进行预处理直至每个音框的音高及音量均计算完毕为止。
[0035]预设单元1022用于对水印加载相关参数进行设置。预设单元1022接收用户的输入，对水印长度N、水印加载强度SNR及原始音频目标段判断门限进行预设定，后续依据此设定对原始音频信号进行水印加载。这里，水印加载强度是指加载水印后音频文件的信噪t匕，预设值为用户可接收的最小数值，如预设单元1022预设SNR=60dB，是指SNR的数值需在60之上。门限值包括两个，一个音量门限值，一个是音高门限值。
[0036]判断单元1023用于将原始音频信息与预设门限值进行对比，判断得出水印加载目标段并进行水印信息的加载。为了更好地隐藏水印信息，依据人耳掩蔽效应，低频较易掩蔽高频，本发明加载水印时取低频段为目标，同时考虑到语音信号的能量影响，本发明也从时域上进行筛选，选取音量较高的语音段为目标。如，当门限值分别为音量=0.15V及音高=200Hz时，则当某音框内语音信号的频率小于等于200Hz且音量大于等于0.15V时，则该段语音被判断为目标段，判断单元1023将依据预设置相关参数对其进行水印加载。判断单元1023对原始音频的每个音框逐一进行判断得到各个目标段并为其加载水印信息，直至水印长度达到预设定长度N。此处，水印加载时所需噪声的强度由预设定SNR及门限值决定，噪声强度需保证加载水印后的音频信号信噪比达到预设定的SNR，为使噪声强度一致，可以门限音量作为实际音频音量计算所需噪声强度。另，为使加载水印后的音频文件不会产生过多的杂音同时易于分析及方便提取，水印加载时可采用高斯白噪声。
[0037]请参阅图2，所示为本发明中水印加载装置10另一实施方式的功能模块图。此处水印加载装置10包括解析单元1021、预设单元1022、判断单元1023、数据库1024、处理器101以及存储媒介102。单元1021?1024为存储于存储媒介102中的可执行程序，功能与图1中描述的一致，处理器101执行这些可执行程序，以实现其各自功能。
[0038]请参阅图3，所示为本发明中水印加载装置10实现音频文件水印加载一实施方式的流程图。在本实施方式中，该方法通过图1或图2所示的各个单元来实现。下面将对此进行叙述。
[0039]在步骤S300中，解析单元1021将原始音频分隔成多个音框，每个音框为一帧。对于分隔而成的各个音框，解析单元1021从第一个音框开始，逐一计算每个音框内原始音频信号的音量及音

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨鹏;
技术所有人：鸿富锦精密工业（深圳）有限公司;鸿海精密工业股份有限公司;
我是此专利的发明人