用于音频编码/解码/转码的频率域中水印插入的制作方法

文档序号：8382017阅读：609来源：国知局

用于音频编码/解码/转码的频率域中水印插入的制作方法
【技术领域】
[0001]本公开内容一般而言涉及音频处理，并且更具体而言涉及音频处理期间的水印插入。
【背景技术】
[0002]水印作为一种类型的数字标记，常常被嵌到音频数据中，以为了版权保护目的来识别音频数据的所有者或来源，或者以传送其它非音频信息。通常，水印在编码之前或编码之后被添加到音频数据中。但是，这种方法使水印相当容易被检测和修改，并且因此容易被未授权的实体篡改或去除。

【发明内容】

[0003]本公开内容的实施例涉及用于水印插入的方法和设备。在一些实施例中，阐述了用于水印插入的方法。该方法包括:在音频处理设备处，基于输入音频数据生成频率系数流；将数字水印嵌到所述频率系数流中，以生成经修改的频率系数流；以及处理经修改的频率系数流，以生成输出音频数据。
[0004]在其它实施例中，阐述了一种音频处理设备。该音频处理设备包括:初始处理模块，用来基于输入音频数据生成频率系数流；加水印模块，用来将数字水印嵌到所述频率系数流中，以生成经修改的频率系数流；以及最终处理模块,用来处理经修改的频率系数流，以生成输出音频数据。
[0005]在又一些其它实施例中，阐述了一种非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质存储指令集合，该指令集合操纵至少一个处理器执行本公开内容中所描述的方法。
【附图说明】
[0006]通过参考附图，本公开内容可以得到更好的理解，并且其众多特征和优点将对本领域技术人员变得明晰。
[0007]图1是根据本公开内容的至少一个实施例的说明在频率域中实现加水印的音频处理设备的框图。
[0008]图2是根据本公开内容的至少一个实施例的说明在音频编码处理期间用于加水印的音频处理设备的操作的流程图。
[0009]图3是根据本公开内容的至少一个实施例的说明在音频解码处理期间用于加水印的音频处理设备的操作的流程图。
[0010]图4是根据本公开内容的至少一个实施例的说明使用线性相加操作的示例加水印处理的流程图，其中该线性相加操作使用来自时间到频率变换处理的频率系数。
【具体实施方式】
[0011]图1-4说明了用于在音频数据作为时间到频率域变换处理的结果而被表示为频率域中的频率系数时给音频数据加水印的示例技术。在至少一个实施例中，初始处理模块从输入音频数据生成频率系数集合。通过基于水印数据修改每个集合的至少一些频率系数以生成经修改的频率系数集合，水印数据被嵌到音频数据中。最终处理模块接着用经修改的频率系数集合来完成音频数据的处理，以生成具有这样嵌入的水印数据的输出数据。在编码的上下文中，输入音频数据是未编码的音频数据并且初始处理模块包括频率域变换模块，该频率域变换模块对未编码的音频数据执行时间到频率域变换处理，以生成频率系数集合。在这种上下文中的最终处理模块包括使用经修改的频率系数集合完成音频数据编码的最终编码过程，并且因此生成经编码的音频数据作为输出音频数据。时间到频率域变换处理可以包括基于离散余弦变换(DCT)的变换处理，诸如改进的DCT (MDCT)处理，或者基于傅立叶的处理，诸如快速傅立叶变换(FFT)处理。在解码的上下文中，输入音频数据包括经编码的音频数据并且初始处理模块可以包括从经编码的多媒体数据提取频率系数集合的初始解码模块，并且最终处理模块包括使用经修改的频率系数集合完成音频解码处理的最终解码模块。在转码操作中，用于加水印的滤波器系数的修改可以在输入的经编码音频数据的解码期间或者在要输出的作为结果的音频数据的编码期间发生。
[0012]在一些实施例中，通过基于水印数据的对应位来修改频率系数集合的至少一个子集，水印数据嵌在频率系数集合中。这种修改可以包括，例如，如果对应的位值是O则是一个值的线性相加，以及如果对应的位值是I则是一个不同的值的线性相加。集合的每个频率系数都可以这样被修改，或者只有该集合的频率系数的一个子集可以被修改。通过以这种方式以逐个集合为基础地修改频率系数，水印可以按照以下方式嵌到音频数据中:允许使用例如本领域中已知的平均检测器或最似然(most-likelihood)检测器来检测水印的存在，同时还比常规的时间域加水印技术对未授权的篡改更有弹性(resilient)。
[0013]图1以框图形式说明了根据本公开内容的至少一个实施例的音频处理设备100。音频处理设备100可以代表其中音频的编码、解码或转码可以被有利使用的任何多种多样的音频处理设备。为了说明，音频处理设备100可以实现为用来与对应视频内容关联地编码、解码或转码音频数据的多媒体处理系统的一部分。另选地，音频处理设备可以实现为用来生成独立于任何视频内容的经处理的音频内容的独立系统，其中音频内容诸如代表音乐歌曲、有声读物等的音频内容。
[0014]在所绘出的例子中，音频处理设备100包括输入缓冲区102、初始处理模块104、加水印模块106、最终处理模块108以及输出缓冲区110。初始处理模块104、加水印模块106和最终处理模块108每个都可以完全以硬编码逻辑(即，硬件)实现，实现为存储在非暂时性计算机可读存储介质(例如，存储器114)中的软件112和访问并执行该软件的一个或多个处理器116的组合，或者实现为硬编码逻辑和软件执行的功能的组合。为了说明，在一个实施例中，音频处理设备100实现为片上系统(SOC)，由此模块104、106和108的部分实现为硬件逻辑，其它部分经存储在SOC处并且被SOC的处理器116执行的固件(软件112的一个实施例)来实现。
[0015]音频处理设备100的硬件可以使用单个处理器116或多个处理器116实现。这种处理器116可以包括中央处理单元(CPU)、图形处理单元(GPU)、微控制器、数字信号处理器、现场可编程门阵列、可编程逻辑设备、状态机、逻辑电路系统、模拟电路系统、数字电路系统、或者基于存储在存储器114或其它非暂时性计算机可读存储介质中的操作指令来操纵信号(模拟的和/或数字的)的任何设备。存储器114可以是单个存储器设备或者多个存储器设备。这种存储器设备可以包括硬盘驱动器或者其它盘驱动器、只读存储器、随机存取存储器、易失性存储器、非易失性存储器、静态存储器、动态存储器、闪存存储器、高速缓存存储器、和/或存储数字信息的任何设备。应当指出，当处理模块经状态机、模拟电路系统、数字电路系统和/或逻辑电路系统实现其一个或多个功能时，存储对应的操作指令的存储器可以嵌在包括该状态机、模拟电路系统、数字电路系统和/或逻辑电路系统的电路系统中或者在该电路系统外面。
[0016]作为一般性的操作概述，音频处理设备100从音频源(例如，现场录音、来自CD或DVD的脉冲编码调制的音频数据等)接收输入音频数据120，并且在输入音频数据120被接收到时将其缓冲在输入缓冲区102处。接着，初始处理模块104处理缓冲的输入音频数据120，以生成代表音频数据120的至少一部分的时间到频率变换的频率系数集合。频率系数集合的这种输出在本文被称为频率系数的流122。接着，通过修改流122的一些或全部集合的一些或全部频率系数以生成经修改的频率系数集合(在本文中被称为“经修改的频率系数流126”)，加水印模块106嵌入水印数据124。接着，经修改的频率系数流126被最终处理模块108用来生成输出音频数据128，该输出音频数据128在被传输到中间或最终目的地之前可以被缓冲在输出缓冲区110中。
[0017]在一些实施例中，这种处理在音频处理设备100作为编码系统的上下文中被执行，使得输入音频数据120是未编码的音频数据(例如，表示原始模拟音频波形的脉冲编码调制(PCM)数据)并且输出音频数据128是经编码的音频数据，诸如根据一个版本的高级音频编码(AAC)标准、一个版本的运动图片专家组(MPEG)2音频级别3 (MP3)标准等当中的一个或多个而编码的音频数据。在这种实现中，初始处理模块104包括频率域变换模块134，该频率域变换模块134对输入音频数据120执行时间到频率域变换，以生成频率系数流122。因而，频率域变换模块134可以应用例如基于离散余弦变换(DCT)的变换(诸如改进的DCT(MDCT)处理)、基于傅立叶的处理(诸如快

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨奇;冯杰;
技术所有人：VIXS系统公司;
我是此专利的发明人

上一篇：一种基于音频内容分类的水印嵌入及检测方法
上一篇：多声道声音采集的方法、装置、手机及系统的制作方法