具有水印插入/提取功能的音频编码/解码设备及其方法

文档序号:7628107阅读:220来源:国知局
专利名称:具有水印插入/提取功能的音频编码/解码设备及其方法
技术领域
本发明涉及数据隐藏方法中的数字水印技术,特别涉及具有水印插入/提取功能,能够插入/提取水印信息的音频编码/解码设备及其方法。
背景技术
通常,水印技术涉及把叫做“水印”的秘密信息嵌入到媒体中,例如视频、图像、音频和文本。嵌入的水印信息的提取被局限于知道它的人。一般的用户不能从普通媒体中分辩有水印的媒体。
特别地,数字媒体带来了版权保护的新问题,由于数字媒体与模拟媒体相比有它的优点,易于存取、传输、编辑和存储,并且通过电波和通信网络进行数据分发时不会引起数据恶化。数字水印作为一种保护版权不被侵犯的方法受到了关注。
数字水印技术不仅用来插入信息以辨别所有者从而保护版权,而且用于插入用于版权保护、分发确认、广播监视等等的插入控制信息或用于将信息例如显示时间控制信息、同步(口型同步)、内容信息和歌词插入实时媒体如音频、视频等等以及传输插入的信息。
同样地,数字水印技术根据其功能具有不同的特点,但隐藏性和健壮性无疑是本质的特点。
作为最基本要求的隐藏性意味着原始媒体和插入水印的媒体当用户看或听它们的时候是不可辨别的。
健壮性意味着尽管插入数字水印的媒体会改变,例如通过在分发和传输所必需的滤波、压缩、添加噪声和降级,但插入的水印仍被保留。
特别地,用于版权保护和复制保护的水印应该健壮以便它能应付意在消除水印的有目的的攻击。同时,用于防伪标识的水印被损坏或处理时,它很容易消失。
更进一步地,用于将附加信息,例如显示时间控制信息、口型同步、内容信息和歌词嵌入媒体的水印在抵抗有意攻击或失真时,其健壮性相对较差。
图1是原理视图,示出了通用的数字水印插入/提取系统。
如图1所示,使用了水印插入系统110将水印数据嵌入到数字媒体(音频、视频、图像、文本等等)中。此时,用于安全的密钥或公钥根据水印算法被附加地使用。
紧接着,插入的水印通过使用水印提取系统130从插入水印的媒体中被提取出来。此时,根据该水印算法可能需要原始媒体,并且仅使用插入时所需的公钥,就能执行解码。
在水印提取过程中不需要原始媒体的系统被称为“盲水印技术”。
在水印技术方法中,音频信号水印方法有不同的例子,比如最低有效位(LSB)编码方法、回波隐藏方法、扩频通信方法等等。
在LSB编码方法中,为了加入需要的信息,量化音频抽样的最低有效位会变形。LSB编码方法使用了一个特性,即音频信号的最低有效位的改变几乎不会影响音质。LSB编码方法的优点是插入和提取执行简单和音质失真小,但它的缺点是在信号处理例如有损压缩或滤波时很脆弱。
更进一步地,在回波隐藏方法中,听不见的回波被插入到音频信号中。就是说,回波隐藏方法根据被插入的二进制水印信息将具有不同时延的回波插入和编码到音频信号中,该信号以预定间隔被细分。在解码过程中,通过在每个细分周期中检测回波时延,二进制信息被解码。在此情况,插入的信号不是噪声,而是与原始信号具有相同特征的音频信号本身。因此,即使插入的信号被听到,插入的信号也不会当作失真信号。相反,插入的信号被期望能提供更好地音调。因此,回波隐藏方法对高质量音频水印技术是合适的,它的缺点在于因为使用对数倒谱操作执行检测,该方法计算量大,而且万一在时域被细分的周期的同步丢失,解码则不能被执行。
更进一步地,扩频通信方法是一种典型的水印技术方法,在视频水印技术甚至大多数音频水印技术中也很普及。在扩频通信方法中,音频信号通过离散傅立叶变换被转换成频率信号,然后二进制水印信息被扩频到PN(伪噪声)序列来插入扩展信息到频率转换的音频信号中。插入的水印可以使用相关器利用PN序列的高度自相关特性被检测出来,并具有抗干扰的健壮性和极好的加密性。相反,扩频通信方法的缺点在于音质被恶化,插入和提取计算量大,而且当水印高强度以提高健壮性时,压缩编码不完全。
同样地,总结现有的音频水印技术,其缺点在于其实现方法复杂,因为水印信息通常在原始信号压缩和解码前插入到原始信号中,并因此它的计算量很大而且原始信号在压缩时容易变形。

发明内容
因此,本发明涉及具有水印插入/提取功能的音频编码/解码设备及其方法,其充分地消除了由现有技术的限制和缺陷导致的一个或多个问题。
本发明的目的是提供具有水印插入/提取功能的音频编码/解码设备及其方法,其中,通过在数字音频和图像压缩编码过程中插入水印到比特流中,能够容易地插入和提取水印数据,并且能够防止原始音频信号和插入的水印失真。
本发明的另外的优点、目的和特征的将在随后的描述中部分阐明,通过检验随后内容或通过对本发明的实践来学习,本发明的优点、目的和特征对本领域普通技术人员将变得显而易见。通过所述的说明书和权利要求以及附图所特别指出的结构可以实现本发明的目的和其它的优点。
为实现这些目的和其他的优点以及根据本发明的目的,如在此具体实施和广泛说明的,高音质音频编码设备包括比特分配单元,使用输入音频信号的每个子带的SMR(信号掩蔽比)值给每个子带分配比特;量化单元,根据通过比特分配单元分配的比特数目,量化输入音频信号的每个子带抽样;水印插入单元,用于插入水印数据到没有分配比特的量化的子带抽样的位置中,并且编码插入水印的子带抽样;和比特流产生单元,用于将量化的子带抽样,插入水印的子带抽样,比例因子信息和比特分配信息转换成音频比特流的格式,并且传输格式转换的音频比特流。
优选地,水印插入单元将插入了水印数据的子带的比例因子的值设置为0或接近于0。
在本发明的另一方面,高音质音频解码设备包括比特流提取单元,用于从压缩传输的音频流中提取量化的子带抽样、插入水印的子带抽样、比特分配信息和比例因子信息;水印提取单元,利用从比特流提取单元中提取的比特分配信息和比例因子信息,来提取插入水印的子带抽样中的水印数据,并输出提取的水印;反量化单元,利用从比特流提取单元中提取的比特分配信息和比例因子信息,对量化的子带抽样进行反量化;和滤波器组,把通过反量化单元把反量化的子带抽样转换成时域抽样,并输出作为结果的解码音频信号。
在本发明的另一方面,一个高音质的音频编码方法包括以下步骤a)编码输入的音频信号到多个子带抽样,并分配比特给每个子带;b)根据分配的比特的数目量化每个编码子带抽样;c)在量化的子带抽样中,插入水印数据到没有分配比特的子带抽样的位置中,并编码插入水印的子带抽样;并且d)把量化的子带抽样、插入水印的子带抽样、比例因子信息和比特分配信息转换成音频比特流的格式,并且传输格式转换的音频比特流。
在本发明的另一方面,高音质的音频解码方法包括以下步骤a)从压缩传输的音频比特流中提取量化的子带抽样、插入水印的子带抽样、比例因子信息和比特分配信息;b)利用插入水印数据的子带的比特分配信息从相应的子带中提取水印数据,并输出提取的水印;c)利用相应子带的比特分配信息和比例因子信息,对量化的子带抽样反量化;d)将反量化的子带抽样转换成时域抽样,并输出作为结果的解码音频信号。
因此,本发明能够对于插入水印的比特流提取水印信息并同时解码音频信号,本发明也能够解码现有的未插入水印的MPEG比特流。此外,本发明能通过现有的MPEG解码器无失真地解码出插入水印的MPEG比特流。
应该明白的是,本发明的前面的一般性描述和下面的详细描述是示例性的,并意在提供如权利要求所述的本发明的进一步的解释。


所包括的附图提供本发明的进一步解释,并结合和构成本申请的一部分,本发明的实施例连同说明书用来解释本发明的原理。在附图中图1是示出了现有的数字水印插入/提取系统原理视图;图2是阐述了现有的MPEG编码器的结构的框图;图3是阐述了现有的子带抽样与比例因子之间的不同关系的视图;图4是阐述了现有的MPEG音频比特流的AAU结构视图;图5是阐述了现有的MPEG解码器的结构框图;图6是阐述了根据本发明嵌入了数字水印插入和提取设备的高音质音频编码器和解码器原理的视图;图7是阐述了根据本发明具体实施的包括水印插入单元的高音质音频编码设备的结构框图;图8是阐述了根据本发明具体实施的包括水印提取单元的高音质音频解码设备的结构框图;图9是阐述了根据本发明的多个例子的视图,其中水印被插入到量化的子带抽样的区域中;以及图10是阐述了根据本发明插入了水印的MPEG音频比特流的AAU结构视图。
具体实施例方式
现在将详细参考本发明的优选实施例,其范例在附图中示出。只要有可能,整个附图中使用的相同的参考数字表示相同的或类似的部分。
在说明书中,相同或类似的元件由相同的附图标记表示,尽管它们出现在不同的附图中,而且因为认为没有必要,其详细的描述将被省略。
在描述本发明之前,需要注意的是,用于公开本发明的大多数术语与本领域公认的通用术语是一致的,但有些术语是由申请人根据需要选择的而且将在本发明随后的描述中公开。因此,由本申请定义的术语最好基于其在本发明中的含义进行理解。
本发明公开一种通过修改一部分MPEG音频编码和解码方法来插入和提取水印的设备和方法。
根据本发明的具有水印提取功能的MPEG音频解码设备,能够针对插入水印的比特流提取水印信息同时解码音频信号。此外,该MPEG音频解码设备能够解码未插入水印的现有的MPEG音频比特流。
此外,根据本发明的插入了水印的MPEG音频比特流能够通过现有的MPEG音频解码器不失真地解码信号。在这里,现有的MPEG音频解码器不能察觉出是否有水印插入。
在描述根据本发明的MPEG音频编码解码过程中的水印的插入和提取操作之前,将描述现有的MPEG音频编码和解码设备以更好地理解本发明。
一般地,MPEG音频标准包含总共三个模式,称为第一层到第三层。较高的层能够实现高质量和高压缩,同时它也增加了硬件的规模。就是说,第一层具有这样的特征,比如256Kbps的比特率、32个子带、比特分配、比例因子和每帧384个抽样。第二层具有这样的特征,比如193Kbps的比特率、32个子带、比特分配、比例因子和每帧三组的1152个抽样。此外,第三层具有这样的特征,比如128Kbps的比特率、混合滤波组、比特分配、比例因子、每帧1152个抽样、霍夫曼编码和熵编码。
此外,MPEG音频编码设备,和其它高音质音频编码技术一样,利用基于与听力相关的听觉特征的心理声学模型,来消除音频信号中可察觉的冗余,并具有与现有数据压缩算法相结合的结构来消除音频信号中的统计冗余。
根据本发明的具体实施,将描述处在三层MPEG音频模型中的第二层。
图2是框图,阐述了现有MPEG音频编码器的结构,例如,MPEG第二层音频编码设备。
首先,PCM(脉冲编码调制)类型的音频信号被输入到子带滤波器组210和FFT(快速傅立叶变换)单元230中。
子带滤波器组210消除音频信号中的统计冗余,并输出音频信号到量化单元270。FFT单元230将输入的音频信号转换成频域的音频信号,并输出频域的音频信号到SMR(信号掩蔽比)计算单元240中。
为了有效地利用听觉特性,要求将音频信号划分成频率分量。从而,子带滤波器组210将以平均频率间隔将整个带宽细分成32个子带,并编码这些输入音频信号的子带。就是说,当音频信号通过使用加权重叠相加算法的平均间隔滤波器组210的32个块时,音频信号被编码成子带抽样,并因此消除了统计冗余。
FFT单元230通过FFT将输入的音频信号转换成频域的音频信号,并输出转换的频率信号到SMR计算单元240。就是说,使用FFT的心理声学模型从经FFT处理的频率信号获得听不见的噪声级的掩蔽阈值,用来消除音频信号中可察觉到的冗余,并基于掩蔽阈值计算每个子带的SMR值。然后,由FFT单元230转换的频谱以及从比例因子提取单元220中提取的比例因子均被输入到SMR计算单元240中。此外,从比例因子提取单元220中提取的比例因子通过比例因子编码单元260编码,然后输出到量化单元270和比特流产生单元280。
在这里,作为声音感知重要特性的‘掩蔽’现象是指这样的现象,即低于某个特定阈值的低音会被高音所掩盖的现象,也就是,高音抑制了低音的感知的现象。频率掩蔽现象表示两声音共存的情况。就是说,当具有特定频率的纯音可以掩蔽另一个具有不同频率的声音时,频率掩蔽导致被掩蔽的具有特定阈值之上的能量的声音可听得到。在这里,该特定阈值称为掩蔽阈值,该值不同于绝对阈值。绝对阈值是指能够感知任何声音的阈值。
在另一方面,当通过SMR计算单元240计算出来的SMR值被输入到比特分配单元250时,比特分配单元250利用SMR值给每个子带分配最小比特来掩蔽量化噪声,并输出分配了比特的子带抽样到量化单元270和比特流产生单元280。就是说,在动态比特分配过程中,比特分配单元250给每个子带分配比特,从而基于SMR值,使量化噪声被信号掩蔽。
量化单元270通过比例因子编码单元260编码的比例因子,来划分滤波器组210输出的每一子带抽样,使得每个子带抽样被标准化,量化单元270根据分配的比特的数目来量化已标准化的子带抽样,并输出该子带抽样到比特流产生单元280中。
比特流产生单元280将量化的子带抽样、通过比特分配单元250输出的比特分配信息和通过比例因子编码单元260输出的比例因子信息,转换成MPEG标准定义的比特流格式,并且传输格式转换的比特流。
就是说,在MPEG音频编码设备中,转换到频域的子带抽样被分成作为尺寸因子的比例因子和标准化的抽样值,并且传输比特流形式的子带抽样。通常,频谱被分成标准谱系数群(normal spectrumcoeffient group),其被称为比例因子带。这个谱系数被称作比例因子,其中比例因子用于改变谱因子带的所有谱系数的放大。
子带抽样用以下方程1描述[方程1]x(i)=scf(b)*ix(i)x(i)子带抽样scf(b)每个子带的比例因子ix(i)标准化的子带抽样i子带抽样索引b子带索引图3是阐述了现有的子带抽样与比例因子之间的不同的关系的视图,就是说,图3示出了根据方程1,子带抽样(a)被分成用于每个子带的比例因子(b)和标准化的子带抽样(c)。
在这里,比例因子提取单元220通过每个子带三个提取总共96个比例因子。然而,在比特流的真实传输中,上面的比例因子值没有被传输。而是代之以传输6比特的比例因子索引。然后,通过比例因子标准化的子带抽样被根据每个子带分配的比特数目来量化,并且传输比特流形式的量化的子带抽样。
比例因子编码过程是用于每个带宽的抽样数据编码的组成部分。在这个比例因子编码过程中,相应带的相似抽样数据值被采集,并且量化噪声的出现被抑制,而且通过影响听力相关的心理效应,噪声不会被察觉。与听力相关的心理效应涉及最小的可听见的阈值效应和掩蔽效应。由于掩蔽效应,比特不会被分配到不可感知的频带上。
在MPEG第2层音频编码中,为了减少比例因子索引的传输量,使用了一种方法用于传输1到3的模式,其中比例因子根据比例因子选择信息(SCFSI)而不同。例如,通过确定在一个子带中计算出来的3比例因子索引是否相似,如果相似,可以传输1代表值,如果不相似,可以传输各自的值。此外,根据每个子带的比特分配信息,对于没有分配比特的子带,其不会传输标准化的子带抽样、比例因子选择信息(SCFSI)和比例因子索引。
图4是阐述了现有的MPEG音频比特流的AAU结构的视图,并且原理性地示出了MPEG第2层音频比特流的构成,该音频比特流通过比特流产生单元280传输。
就是说,MPEG音频比特流由AAU(音频存取单元)组成。在这里,AAU是能够独立解码的最小单元,预定抽样的数据通常压缩和存储于其中。如图4所述,AAU由头部、CRC(循环冗余校验)位、比特分配信息、比例因子选择信息、比例因子索引信息、压缩编码的子带抽样数据和辅助数据组成。在这里,辅助数据是指当音频抽样数据的末端没有到达AAU的末端时,存储在AAU的剩余部分的数据,其中,除了MPEG音频数据之外的任何数据都可以被插入到AAU的剩余部分。
图5是阐述了现有MPEG解码器的结构的框图。MPEG音频信号的解码过程与图3所示的MPEG音频信号的编码过程相反。
首先,比特流提取单元510从通过MPEG音频编码设备压缩和传输的比特流中提取所需的信息,例如头信息、比特分配信息、比例因子选择信息、比例因子索引、量化的子带抽样等等,并输出提取的信息到比例因子解码单元520和反量化单元530中。在这里,比例因子解码单元520基于提取的信息来解码比例因子,并输出解码的比例因子到反量化单元530中。
反量化单元530通过将解码的比例因子和比特分配信息应用到方程1中,来恢复子带抽样,并然后输出恢复的子带抽样到复合子带滤波器组540中。紧接着,复合子带滤波器组540将子带抽样转换成32个时域抽样,并输出作为结果的解码音频信号。
图6是阐述了根据本发明的嵌入了数字水印插入和提取设备的高音质音频编码器和解码器的示意图。
特别地,下面,将根据本发明的具体实施,描述其中水印插入和提取设备被嵌入到如图2和图5所示的上述MPEG第二层音频编码和解码设备中的情况。
参看图6,用于执行音频编码和水印插入的高音质音频编码器610接收用于压缩编码高音质音频信号和用于插入的水印信息,并执行音频编码和水印编码。在这里,通过修改现有高音质音频编码器的一部分,通过水印插入单元611插入水印。
此外,用于执行音频解码和水印提取的高音质音频解码器630通过修改现有的高音质音频解码器的一部分来提取水印,现有的高音质音频解码器用于解码压缩的比特流和恢复原始的音频信号。在这里,即使现有的不包含水印提取设备的高音质音频解码器仍能够正常地解码音频比特流并得到输出的音频信号(PCM)。
图7是阐述了根据本发明具体实施的包括水印插入单元的高音质音频编码设备的结构框图。
参考图7,根据本发明的水印插入单元700被添加到如图2所示的高音质音频编码器的量化单元270的输出端和比例因子编码单元260。就是说,通过修改现有的高音质编码过程中的比例因子编码过程,在产生比特流之前,插入水印。在这里,通过比特流产生单元280产生的水印被插入到其中的音频比特流,与现有的音频比特流是一样的。
现在,将参考图7,描述在高音质音频编码过程中的水印插入过程。
水印插入单元700将水印隐藏在比特分配过程中的32个子带中没有分配比特的子带的量化子带抽样中。
例如,如图3所示,因为在相应高频带的子带中没有信号,比例因子为0,而且子带抽样值在量化后仍为0。就是说,比特分配单元250没有为子带分配比特。
从而,水印插入单元700保持比例因子的值为0或接近0,并安插水印数据到相应子带抽样的某个位置,以便编码插入了水印的子带抽样。然后,高音质音频编码器可以根据方程1读取水印值,但这个水印对实际解码的音频信号没有任何影响。就是说,插入水印的比特流与没有插入的水印的比特流在感知上没有差别。
例如,在MPEG第二层音频编码方法的情况下,传输的比例因子索引中的最小值为0.0000012。在这里,该值比最大值小-286dB,比中间的比例因子索引0.00155小-143dB。从而,相应的子带产生的信号是听不到的。
图9是阐述了根据本发明将水印插入到量化的子带抽样区域中的多个例子视图。图9示出子带抽样(a)被分成用于每个子带的比例因子(b)和标准化的子带抽样(c)。
换句话说,图9示出了一个例子,即水印被插入到没有分配比特的第k个子带中。在这里,第k个子带的比例因子的值为0或接近0。
就是说,为了插入水印信号,根据水印比特的数目,将比特分配到没有分配任何比特的相应子带中。根据MPEG标准,因为一个子带由36个子带抽样组成,例如,当3比特被分配到相应的子带时,可以插入对应于108比特长的水印信息。在比特被分配来插入水印的子带里,比例因子设置成接近0的值,并且然后将以二进制比特流形式表示的水印数据插入到子带抽样区域。结果,比特分配信息可以根据水印数据的量来设置,并且水印可以插入到一帧中的一个或多个子带中。
此外,水印插入单元700将包含以上插入水印的子带抽样的量化的子带抽样输出到比特流产生单元280中。比特流产生单元280产生如10所示的音频比特流,并传输产生的音频比特流。
图10是阐述了根据本发明的其中插入了水印的MPEG音频比特流的AAU结构视图。图10原理性地示出了MPEG第二层音频比特流的格式,其中插入了通过比特流产生单元280传输的水印。
如图10所示,根据本发明的AAU比特流是由头、CRC(循环冗余校验)位、比特分配信息、比例因子选择信息、比例因子索引信息、包含插入水印的子带的子带抽样数据和辅助数据组成。
图8是阐述了根据本发明具体实施的包括水印提取单元的高音质音频解码设备的结构框图。
首先,比特流提取单元510从通过MPEG音频编码设备压缩和传输的比特流中,提取所需的信息,例如头信息、比特分配信息、比例因子选择信息、比例因子索引、量化的子带抽样等等,并将提取的信息输出到比例因子解码单元520和水印提取及反量化单元(de-quantization unit)800中。在这里,比例因子解码单元520基于提取的比例因子选择信息和比例因子索引信息来解码相应子带的比例因子,并输出解码的比例因子到水印提取及反量化单元800中。
水印提取及反量化单元800利用解码的比例因子和比特分配信息在反量化之前提取出二进制的水印。
在这里,水印提取及反量化单元800利用比例因子索引信息,来确定量化的子带抽样是插入了水印的子带抽样还是插入了标准音频信号的子带抽样。如果量化的子带抽样是插入了水印的子带抽样,水印提取及反量化单元800利用相应子带的比特分配信息提取二进制的水印。
然后,水印提取及反量化单元800通过插入解码的比例因子和比特分配信息到上面的方程1,来恢复每个子带抽样,并然后输出恢复的子带抽样到复合子带滤波器组540。在这里,尽管插入了水印的子带抽样的比例因子值被反量化,因为比例因子值为0或接近0的值,所以该比例因子值仍为0或接近0。从而,水印不会被作为听得见的声音输出。此外,在没有水印提取单元的现有高音质音频解码器中,因为比例因子为0或接近0的值,其不能检测出是否有水印插入。就是说,尽管插入了水印的子带被解码,其产生听不见的音频信号。
紧接着,复合子带滤波器组540将反量化的子带抽样转换成32个时域抽样,并输出作为结果的解码音频信号。
已基于上面的高音质音频编码方法中的MPEG第二层音频编码方法描述本发明的具体实施,但是应理解的是,根据本发明的上述原理,可广泛地应用把要传输的信息划分为实际抽样和尺寸因子例如比例因子,并产生比特流的音频和图像编码方法。
在如上所述的高音质音频和图像解码方法中,对于特定的情况,即比例因子和量化的抽样被划分和传输的情况,当在比特流的量化的抽样中插入水印信息时,能够产生与现有解码器兼容的比特流。此外,通过使用能够提取水印信息的编码器,能够提取与原始信号不同的附加水印信息。此外,因为水印信息可以是涉及相关内容的版权信息,利用水印信息来保护版权并利用水印信息来控制存取操作,例如解码、复制和再现或类似的操作,都是可能的。此外,用于监视的识别信息、在音频信号和视频信号之间的同步信息,以及附加信息,例如标题、歌词、题注等被传输时,可能够使用。就是说,保持与现有解码器的适应性并同时获取附加信息传输信道也是可能的。此外,当水印提取方法被提供给特定的人时,利用相应的水印进行私人通信是可能的。
从以上的描述显而易见的是,本发明提供了一个具有水印插入/提取功能的音频编码/解码设备及其方法,其中,能够利用在数字音频和图像信号的编码过程中传输的量化抽样的比特流来隐藏听不见的水印信息,并在压缩编码和解码的过程中有效地插入和提取水印。就是说,具有水印提取功能的MPEG音频解码设备能够提取水印信息并同时解码关于插入水印的比特流的音频信号,而且还能够解码没有插入水印的现有MPEG比特流。
此外,本发明提供了一种具有水印插入/提取功能的音频编码/解码设备及其方法,其能够通过现有MPEG解码器无失真地解码插入了水印的MPEG比特流,其中,因为现有的MPEG解码器不能察觉出是否插入了水印,因此能够保持适应性。
此外,本发明提供了一种具有水印插入/提取功能的音频编码/解码设备及其方法,其中,因为水印被插入到编码的比特流中,所以能够简单地执行水印插入和提取过程,而仅轻微增加计算强度。
对于本领域技术人员来说显而易见的是,在不脱离本发明的精神或范围的情况下,在本发明中可以做出各种修改和变化。因此,本发明意在覆盖落入所附权利要求及其等效物范围内的本发明的修改和变化。
权利要求
1.一种高音质音频编码设备,包括比特分配单元,用于使用输入的音频信号的每个子带的SMR(信号掩蔽比)值给每个子带分配比特;量化单元,根据比特分配单元分配的比特数目,量化输入的音频信号中每个子带抽样;水印插入单元,用于将水印数据插入到没有分配比特的子带的量化的子带抽样的位置中,并且编码插入水印的子带抽样;和比特流产生单元,用于将量化的子带抽样、插入水印的子带抽样、比例因子信息和比特分配信息转换成音频比特流的格式,并且传输格式转换的音频比特流。
2.如权利要求1所述的音频编码设备,其中,该量化单元通过相应子带的比例因子划分在输入的音频信号中每个子带抽样,以便每个子带抽样标准化,并且量化已标准化的子带抽样。
3.如权利要求1所述的音频编码设备,其中该水印插入单元把插入了水印数据的子带的比例因子设置为0或接近0的值。
4.如权利要求1所述的音频编码设备,其中当确定插入了水印数据的子带时,该水印插入单元根据需要插入到相应子带的水印数据的量来分配比特,并且将所需的二进制流的水印数据插入到子带抽样的位置。
5.如权利要求1所述的音频编码设备,其中,该比特流产生单元将子带抽样和比例因子分离,并传输比特流。
6.一种高音质音频解码设备,包括比特流提取单元,用于从压缩传输的音频比特流中提取量化的子带抽样、插入水印的子带抽样、比特分配信息和比例因子信息;水印提取单元,利用从比特流提取单元提取的比特分配信息和比例因子信息,来从插入水印的子带抽样中提取水印数据,并输出提取的水印;反量化单元,利用从比特流提取单元提取的比特分配信息和比例因子信息,对量化的子带抽样进行反量化;和滤波器组,把通过反量化单元反量化的子带抽样转换成时域抽样,并输出作为结果的解码的音频信号。
7.如权利要求6所述的音频解码设备,其中,该水印提取单元利用提取的比例因子信息中的比例因子索引,来确定插入水印的子带是否出现。
8.一种高音质音频编码方法,包括步骤a)将输入的音频信号编码成多个子带抽样,并分配比特给每个子带;b)根据分配的比特的数目量化每个编码子带抽样;c)在量化的子带抽样中,将水印数据插入到没有分配比特的子带抽样的位置中,并编码插入水印的子带抽样;以及d)把量化的子带抽样、插入水印的子带抽样、比例因子信息和比特分配信息转换成音频比特流的格式,并且传输格式转换的音频比特流。
9.如权利要求8所述的音频编码方法,其中,所述步骤a)使用每个子带的SMR值分配比特给每个子带。
10.如权利要求8所述的音频编码方法,其中,所述步骤b)通过相应子带的比例因子来划分编码的子带抽样,以便编码的子带抽样标准化,并且根据分配的比特数目来量化已标准化的子带抽样。
11.如权利要求8所述的音频编码方法,其中,所述步骤c)把插入了水印数据的子带的比例因子设置为0或接近0的值。
12.如权利要求8所述的音频编码方法,其中,所述步骤c)当确定插入水印数据的子带时,根据需要插入到相应的子带的水印数据的量来分配比特,并且将所需的二进制流的水印数据插入到子带抽样的位置。
13.一种高音质的音频解码方法,包括步骤a)从压缩传输的音频比特流中提取量化的子带抽样、插入水印的子带抽样、比特分配信息和比例因子信息;b)利用插入水印数据的子带的比特分配信息,从相应的子带中提取水印数据,并输出提取的水印;c)利用相应子带的比特分配信息和比例因子信息,对量化的子带抽样反量化;d)将反量化的子带抽样转换成时域抽样,并输出作为结果的解码的音频信号。
14.如权利要求13所述的音频解码方法,其中,所述步骤b)利用比例因子信息来确定插入水印数据的子带。
15.如权利要求14所述的音频解码方法,其中,所述步骤b)利用比例因子信息中的比例因子索引来确定插入水印数据的子带是否出现。
全文摘要
本发明公开了一种音频编码/解码设备及其方法,其具有水印插入/提取功能,能够在数字音频和图像编码过程中插入/提取水印信息到/从比特流中。该高音质音频编码设备包括比特分配单元,使用输入音频信号中的每个子带的SMR(信号掩蔽比)值给每个子带分配比特;量化单元,用于根据通过比特分配单元分配的比特数目来量化输入音频信号的每个子带抽样;水印插入单元,用于在没有分配比特的子带的量化子带抽样的位置中插入水印数据,并且编码插入水印的子带抽样;和比特流产生单元,用于将量化的子带抽样、插入水印的子带抽样、比例因子信息和比特分配信息转换成音频比特流的格式,并且传输格式转换的音频比特流。
文档编号H04N7/24GK1808568SQ20051012514
公开日2006年7月26日 申请日期2005年11月21日 优先权日2004年11月19日
发明者吴贤午 申请人:Lg电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1