一种基于音频断点的时域数字音频水印方法

文档序号：8488605阅读：1023来源：国知局

一种基于音频断点的时域数字音频水印方法
【专利说明】
[0001]
技术领域
[0002] 本发明属于音频信号处理和音频制品专利保护领域，涉及音频信号的水印嵌入和提取。
[0003]
【背景技术】
[0004] 今年来，随着计算机网络技术的产生和迅猛发展，大量的数字化音乐制品在网络上广泛的传播。这样一来，对非法分子来说，音频作品的复制，篡改和发布都已经变得非常容易。这就给版权所有者和整个音乐市场带来了巨大的损失。
[0005] 基于这一背景，用于数字作品版权保护的数字水印技术就发展了起来，数字音频水印算法主要分为时间域和变换域数字水印算法。时域水印算法主要有P.Bassia等人提出的最低有效位（LSB)算法和由W.Bender等人提出的回声隐藏算法等；变换域水印算法主要有扩频水印算法、相位水印算法、离散傅里叶变换域算法、离散余弦变换域算法和离散小波变换域算法等。
[0006] 时域下的音频水印算法原理比较简单易于理解，但也存在致命的弱点。比如，最低有效位算法对某些信号处理技术比较敏感，鲁棒性较差；回声隐藏算法虽然具有较好的感知透明性和一定的鲁棒性，但利用回声检测的办法是很容易把水印信息检测出来的。变换域的音频水印算法一般都具有较好的性能，可以满足一些苛刻的要求，但是这类算法需要算法编写者具备一些高等的数学知识和过硬的编程能力，且程序中的操作会让人很难理解。就拿离散小波变换预（DWT)算法来说，钮心忻等人在2000年提出了一种基于小波变换的数字水印算法。它将高斯白噪声作为水印信号嵌入到音频信号的小波变换域中，先选择适当的小波基对原音频信号进行L级分解，然后只对第L级的详细分量 < 中绝对值最大的前N(假设N为水印信号的长度）个值做关于水印信号x(i) (i=l，2，_ ? *，N)的特定公式变换。同样的，相应的水印检测算法是先对音频信号进行相同的小波变换，然后根据原始的音频信号找到隐藏的N个随机数的位置并求出相应的数值(i) (i=l，2，_ ? *，N)。最后，由X'和x的相关函数计算出的相关系数可以判别是否有正确的水印信号的存在。虽然小波变换具有良好的时频局部特性，但非信号处理相关专业的学者们甚至连离散傅里叶变换（DFT)都不知道是什么，这就给算法编写带来了技术上的障碍。
[0007] 由于这些原因，在时域中寻求各方面性能较好的数字水印算法就显得较为重要。本发明所提出的水印算法是在时域下，嵌入少量的音频断点（零信号）并根据水印信息来改变音频断点周围原音频信号的能量值来达到嵌入水印的目的的，水印的提取依赖音频断点。原理简单，编程过程并不繁杂。经实验，效果感知透明性，鲁棒性等都较好，值得进一步研宄和探索。
[0008]

【发明内容】

[0009] (一）要解决的技术问题本发明的目的，是要提供一种时域下基于音频断点嵌入和提取数字音频水印的方法，依据水印信息的数值和原始音频的能量值直接在原始音频的基础上改变其能量值的大小。这种算法充分考虑了原始音频的能量情况，最好还辅以有一套水印嵌入位置选取规则（本发明中并未实现)，只在原始信号的基础之上稍作改动，在不影响或很少影响原始音频听觉质量的前提条件下，保证水印具有较好的鲁棒性，抗裁剪性和很少的信息增加量(音频的长度增加非常少)。在水印的提取环节，提取算法要具备能够自行筛选出嵌入水印的位置，排除一些在数值逻辑上看似是水印的信息，但是须大量保存原始水印信息的能力。这就需要算法研宄者对音频信号做较多的研宄分析，制定出多重合理的水印信息筛选工序。
[0010]此外，虽不算是本发明的范围，对水印信息的加密处理也是必须的。因为当不法分子获得水印的提取规则和音频分段信息后，就能够很容易的篡改水印的信息，这对音频的作者会造成很大的经济、个人名誉和知识产权方面的损失。
[0011] 本发明所用的水印提取方案只需要一些原始音频的分段信息和水印信号的重构参数，不需要原始音频和原始水印的参与，是一种盲水印算法，因此实用性较好。
[0012](二）技术方案为达到上述目的，本发明采用以下方案： 1、首先将水印信号平均分成P份，然后将音频信号等分成t份，再将每一份等分成P 份，表明将水印信息重复插入t次，每一次将其分成P份插入到每一个小模块中，共分fxJP 份插入； 2、依据一定水印嵌入规则，依次改变原始音频中相应位置的能量值，并在其前中后都插入用于信息标识的音频断点，其长度为Z; 3、将第2步中所修改过的音频片段（共份，且前中后都插入断点）和剩余无需修改的音频片段按照原音频的时间顺序重新拼接好，并再写成一首完整的音乐文件； 4、将重新写好后的音频按照事先规定的分段信息t和p的值分段，然后为了减少工作时间，设置选择因子，将音频信号大概嵌入水印的位置和其前后的一小段音频都选择下来，用于下一步检测； 5、对选择下来的每一份音频信号从头至尾进行检测，每一次检测以一串长度为 3*z+2*p_l的数据串为单位，将满足条件的音频信号比特位的数据串信息的首地址记录下来； 6、将满足条件的首地址按所在的分段号分成组别前后做差，对这些差值进行筛选，选出值大小合理且出现次数最多的定为最后的水印间隔final_interval。从每一组的首地址中选出最合理的一个（满足条件的第一个）放入对应数组new_position的相应位置上去，并且凭借间隔final_interval推算出所有首地址； 7、先凭借算出的首地址信息提取出所有嵌入水印的数据串，然后根据p和h的值将水印重新编排成一幅幅水印图像，并将完整的多幅图像叠加。根据事先存好置乱迭代参数运用Arnold反变换恢复出目标水印图像； 8、将嵌入水印信息的WAV文件压缩成其他格式的音频文件，如MP3、FLAC、APE等，然后再将其解压成WAV文件，使用检测算法提取其中的水印信息并作出相关评价。由于水印嵌入多次，所以该算法一定具有较好的抗裁剪性能。对于水印算法的听觉透明性，可以直接通过人耳的听觉情况做出评价，实验表明这一性能较好。此外，对于一般的数字信号处理，可以对嵌入水印的音频信号做滤波、重采样、加噪等操作，然后再用检测算法去做提取操作并做出合理的评价。
[0013] 本发明的用途与优越性(有益效果） 1、这种水印算法能够提取成功的关键在于音频中嵌入的断点。经实验表明，当音频中的断点持续时间在2ms以下，人耳是很难分辨出的。这就给这种算法在必须满足听觉要求的原则上带来了操作的可行性。
[0014] 2、本水印算法是在时域中根据目标水印图像来直接改动原始音频中某些位置的音频能量值，这种水印信息就存在于本身音频信号的差别之中，故水印能够抵抗一般的数字信号处理。加之，这种差别对于本身的音频来说实在是太微弱，一般人耳很难分辨的出，有较好听觉特性。此外，虽然还未实现，但如果水印嵌入的位置能够根据原始音频的能量信息（嵌入的位置使得在原始音频的基础上须作改动操作的较少或者水印所在位置整体能量值的细微改动难引起人耳的感觉）来确定，那么水印嵌入算法的听觉特性会更加优越。
[0015] 3、这种水印算法提出的意义在于，已有的时域水印算法在原理上都很简单，如最低有效位算法和回声隐藏算法等，此类算法大多不具有较好的鲁棒性或是较容易检测出水印信息，故用于音乐作品的版权保护可能稍显不足；而一般的变换域水印算法，诸如离散余弦变换域算法和离散小波变换域算法等，虽然具备良好的听觉特性和鲁棒性，但在原理上就给许多未深入研宄的人带来了理解上的困难，且一般加入音频中的水印信息是高斯白噪声这一类的事先预存好的信息，这就降低了版权的说服力。本发明的操作对象是时域上直接比特位音频能量值，通俗易懂，并且实验证明还具备良好的听觉特性和鲁棒性(嵌入操作需待改进)，这就给本发明带来了一定的价值。
[0016]
【附图说明】
[0017] 1、图1为嵌入的水印信息的编排方式； 2、图2为插入水印信息和断点前后局部音频信号的变化情况，图（a)中显示的是原始音频信号局部时域波形图像而图（b)中显示了插入水印和断点后的局部音频波形图像，上下对比可以发现，插入水印信息的波形图对于原波形来说并没有较大的改变，这种细微的能量改变不仅将水印信息隐藏在了原始音频上，而且由于其对于整首音频来说实在是微乎其微，所以又保证了较好的听觉特性； 3、图3为水印的提取框图； 4、图4中所展示的是将同一嵌入水印的WAV格式的音频压缩成不同格式的音频，再将其反压缩成WAV格式的音频，并从中提取出水印的图像，从左至右依次是：原WAV格式，MP3， FLAC，APE。可以看到，从FLAC和APE反压缩后的音频文件中提取出的水印图像和原插

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王双维;卢宇;郑彩侠;曹晓林;刘天星;
技术所有人：东北师范大学;
我是此专利的发明人

上一篇：一种用于语音信号增强的谱减法
上一篇：应用于远场识别的前处理方法和装置的制造方法