一种基于音频内容分类的水印嵌入及检测方法

文档序号：8382018阅读：262来源：国知局

一种基于音频内容分类的水印嵌入及检测方法
【技术领域】
[0001] 本发明属于通信技术领域，涉及一种基于音频内容分类的水印嵌入及检测方法。
【背景技术】
[0002] 数字水印（Digital Watermarking)技术是将一些标识信息（即数字水印）直接嵌入数字载体(包括多媒体、文档、软件等）当中，但不影响原载体的使用价值，也不容易被人的知觉系统(如视觉或听觉系统）觉察或注意到。通过这些隐藏在载体中的信息，可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是信息隐藏技术的一个重要研究方向。近年来，被广泛地应用到网络音视频领域，主要用于数字媒体产品的知识产权保护和防伪。
[0003] 数字音频水印技术是指将待嵌入的隐藏标记例如：节目标识和用户识别号等，以数字信号处理的方法加载到音频数据中，这种标记通常是不可见、不可感知的，只有通过专用的水印检测器才能够提取。从而可以保证音频作品的版权。
[0004] 音频广播系统所传输的节目流包括各种类型的声音信号，且信号变化很大。而数字音频水印嵌入算法对不同类型的音频信号表现出不同的特性。因此，如何提取音频节目流中的音频特征信息，是解决这一问题的关键。音频的自动分类，如针对语音和音乐的分类，作为提取音频信号特征的重要手段之一，日益引起人们的重视。
[0005] 传统的音频广播系统在电台端首先由制作室制作播出音频节目，经过SDH环网 (Synchronous Digital Hierarchy,同步数字体系）或光传输网，传输至发射台调制器端，调制并发射模拟音频广播信号。上述步骤主要完成节目的制作，节目的传输和节目的播出。具体步骤为：由总控室制作的节目如实时性的新闻类节目、访谈类节目及非实时性的广告类播放节目和音乐类节目，这些音频节目以PCM样点的形式输出给音频处理器进行音频预处理，然后进行编码、复用输出TS流，将该TS流经过SDH环网或光网传输到发射台，在发射台中经过解码、解复用输出模拟音频并调制发射模拟音频广播信号。
[0006] 随着文化生活的日益丰富，广播节目内容的制作量也逐渐增加。同时，针对广播节目的盗版情况也大幅增加。因此，如何保证广播节目制作方的版权利益、有效防范盗版情况的发生，日益成为一个被广播节目制作方所关注的关键问题。

【发明内容】

[0007] 本发明要解决的技术问题是，提供一种针对性强、提高水印各项性能的基于音频内容分类的水印嵌入及检测方法。
[0008] 本发明采用的技术方案是：一种基于音频内容分类的水印嵌入方法，其步骤如下：步骤一，将来自音频广播系统制作室输出的AES/EBU (Audio Engineering Society/ European Broadcast Union,即音频工程师协会/欧洲广播联盟)格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段；步骤二，对某一段音频信号进行自适应能量检测，如该段音频信号经检测为静音信号，则不进行水印信号的嵌入，否则转入步骤三；步骤三，将音频信号段进行音频特征分析，并基于内容进行分类，包括语音、音乐两类；步骤四，根据该音频信号段所属类别，首先在音频段前半部嵌入音频类别码，然后分别采用不同的水印嵌入算法进行嵌入。
[0009] 进一步，步骤一的音频分段是将音频广播系统制作室输出的音频节目源分割为指定长度数目的采样点的音频子段，两个相邻子段间有50%的重叠部分。
[0010] 进一步，步骤二的自适应能量检测是利用语音和噪音在能量上的这种差别进行检测，该算法通过比较输入信号的能量与语音能量阀值的大小，来判断输入的信号是否为语音，输入信号每帧的能量可由下面的公式得出：
【主权项】
1. 一种基于音频内容分类的水印嵌入方法，其步骤如下：步骤一，将来自音频广播系统制作室输出的AES/EBU格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段；步骤二，对某一段音频信号进行自适应能量检测，如该段音频信号经检测为静音信号，则不进行水印信号的嵌入，否则转入步骤三；步骤三，将音频信号段进行音频特征分析，并基于内容进行分类，包括语音、音乐两类；步骤四，根据该音频信号段所属类别，首先在音频段前半部嵌入音频类别码，然后分别采用不同的水印嵌入算法进行嵌入。
2. 根据权1所述的一种基于音频内容分类的水印嵌入方法，其特征在于：步骤一的音频分段是将音频广播系统制作室输出的音频节目源分割为指定长度数目的采样点的音频子段，两个相邻子段间有50%的重叠部分。
3. 根据权1所述的一种基于音频内容分类的水印嵌入方法，其特征在于：步骤二的自适应能量检测是利用语音和噪音在能量上的这种差别进行检测，该算法通过比较输入信号的能量与语音能量阀值的大小，来判断输入的信号是否为语音，输入信号每帧的能量可由下面的公式得出：
(公式1) 表示第j帧的能量，x(i)为输入的信号，N为帧长，其具体包括： A1，计算初始化阀值，初始化的阀值是由静默时期的信号能量计算得出，一般做法是认为通话开始前200ms是没有语音的，所以初始化的阀值是由前8192点的数据计算得出，如公式（2)所示：
(公式2) 头刀忉妬1七的网但所以当4>kJ；时表示第j帧为语音，反之表示为噪音，其中k为一常数，一般k为2 ; A2,判断第一帧阀值是否为静音，若公式2中Er〈 0.0003,则被认为该帧为静音帧； A3,如果音频已停止，结束；否则，按照公式2,计算当前帧的功率； A4,计算阀值比，如下式，
A5,计算阀值抖动参量；因为背景噪声是非平稳的，所以阀值也要根据噪声能量进行自适应的改变，变化方法见式：
I为新的阀值 ^为旧的阀值为背景噪声能量而P为加权值，（〇〈P〈l) 一般取〇. 2,即如下式计算阀值抖动参量， E_new= 0. 8*E_old+0. 2*a; A6,对该帧进行自适应能量判断，在原来算法里的判决规则是当$?>kJ；，而k为一常数，一般k为2，但是由于一般音频节目流中信噪比是在不断变化的，所以k值也应该随着信噪比的变化而变化，而信噪比可由下式得出：
其中，尾为语音帧的能量，異为静音判决的阀值，而k值的更新式由下式得出：其中卢为遗忘因子，一般取值〇.2。
4. 根据权1所述的一种基于音频内容分类的水印嵌入方法，其特征在于：步骤三中的音频段分类时，音频节目信号首先通过预处理操作，然后进入分类器，通过基于内容的分类，将音频段分为语音或音乐；其具体包括： B1，选取相关特征对广播节目音频流音频信号进行特征分析并提取； B2,利用初级分类器得到初步分类的结果； B3,利用音频类别的前后相关性，使用上下文分类器修正初始分类得到最终分类的结果。
5. 根据权1~4之一所述的一种基于音频内容分类的水印嵌入方法，其特征在于：步骤四中的语音类音频段选择基于心理声学模型I的扩频水印嵌入算法，音乐类音频段选择基于心理声学模型II的扩频水印嵌入算法。
6. -种基于音频内容分类的水印检测方法，其步骤如下：步骤一，读取音频节目流，并按照固定长度进行分段；步骤二，对该段音频信号进行自适应能量检测，若该段音频信号经检测为静音信号，则不进行水印信号的检测，否则转入步骤三；步骤三，对该音频段前半部进行检测，判断该音频段所属音频类别；步骤四，根据步骤三给出的音频类别，将音频段输入到不同水印检测算法中，进行水印检测，并输出结果。
【专利摘要】本发明提供了一种基于音频内容分类的水印嵌入方法，其步骤如下：步骤一，将来自音频广播系统制作室输出的AES/EBU格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段；步骤二，对某一段音频信号进行自适应能量检测，如该段音频信号经检测为静音信号，则不进行水印信号的嵌入，否则转入步骤三；步骤三，将音频信号段进行音频特征分析，并基于内容进行分类，包括语音、音乐两类；步骤四，根据该音频信号段所属类别，首先在音频段前半部嵌入音频类别码，然后分别采用不同的水印嵌入算法进行嵌入。本发明在对音频进行分类的基础上，有针对性地选择适应音频所属分类的水印嵌入算法，有效发挥单一算法的优势，提高水印的各项性能。
【IPC分类】G10L19-018
【公开号】CN104700841
【申请号】CN201510069647
【发明人】黄寅, 王晓光, 程伟, 吴小茜
【申请人】浙江省广电科技股份有限公司
【公开日】2015年6月10日
【申请日】2015年2月10日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄寅;王晓光;程伟;吴小茜;
技术所有人：浙江省广电科技股份有限公司;
我是此专利的发明人

上一篇：声音信号的时延估计方法和装置的制造方法
上一篇：用于音频编码/解码/转码的频率域中水印插入的制作方法