一种基于音频水印的语音带宽扩展的装置和方法

文档序号：2819023阅读：364来源：国知局

专利名称：一种基于音频水印的语音带宽扩展的装置和方法
技术领域：
本发明涉及语音处理技木，特别涉及一种基于音频水印的语音带宽扩展的装置和方法。
背景技术：
人类语音信号的主要能量集中于0. 3 3. 4KHz,4KHz带宽就可保证足够的可懂度。因此，国际电信联盟(ITU)制定的公用电话网(PSTN)编码标准G. 711 (即A律和μ律) 的采样频率为8ΚΗζ，并一直沿用至今。窄带语音在保证一定可懂度的同吋，降低了对通信带宽的需求，但这是以牺牲语音的自然性为代价的。窄带语音丢失了原始语音中的高频分量，所以它听起来不够自然。为了提高语音质量，ITU-T提出了第一个用于远程电话会议的宽带语音编解码器G. 722。宽带语音通信可以通过重新设计传输链路来实现，但是对于庞大的PSTN固话网络来说，重新设计传输链路耗资过大。传统的水印是指纸张对着光线时所见的标记，一般用于重要票据的真伪检測。而数字水印技术是利用多媒体数字作品普遍存在的冗余性和随机性，把某些数字信息嵌入到数字作品中，实现信息的隐藏传输。数字水印主要用于保护数字作品的版权和完整性。由于人的听觉比视觉灵敏，将水印嵌入到音频比嵌入到图像要困难的多。基于最低有效位(LSB)的音频水印基于LSB的语音带宽扩展的方法是将高频參数嵌入到编码码流的最低位来实现，该方法嵌入水印的数量多、算法简单，适合误码率较低的通信信道。基于时域回声隐藏技术的音频水印基于时域回声隐藏技术的音频水印是利用了人耳听觉特性中的时域掩蔽效应一个声音信号虽然已经结束，但它对另ー个声音的听觉能力还有影响。该方法嵌入的水印数量较少，嵌入水印以后对原始的声音有一定的影响。基于频域离散傅里叶变换的音频水印该方法首先对音频信息进行DFT变换，然后选择其中频率范围为2. 4 6. 4kHz的DFT系数进行水印嵌入，并用表示水印序列的频谱分量来替换相应的DFT系数。该方法虽然有很好的稳健性，但当嵌入水印与原始DFT系数差别过大时，对原始语音的影响较大。基于频域离散余弦变换的音频水印该方法先对时域信号做离散余弦变换，然后对序列进行修正离散余弦变换(MDCT)，通过对MDCT的系数进行改变以嵌入水印。该方法有很好的稳健性，但嵌入水印的数量较少。现有技术的缺点以上方法在稳健性、隐蔽性和嵌入水印数量三个方面不能做到很好的均衡，都有其各自的缺点，因此不能够较好的用于语音带宽扩展。

发明内容
针对现有音频水印实现带宽扩展的各种缺点和不足，本发明提供了ー种基于音频水印的语音带宽扩展的装置和方法。
为了达到上述目的，本发明提供的一种基于音频水印的语音带宽扩展的方法，包括以下步骤
步骤Α.使用QMF分析滤波器组模块将宽带语音分成两个部分0 8000Hz的窄带语音和8000 16000Hz的高频分量；并将两个输出信号采样频率降至8KHz，得到低频信号み(《) 和高频信号·%( )。步骤B.通过提取高频參数模块提取30个高频參数16个时域包络參数、12个频域包络參数、平均时域包络參数和平均频域包络參数；该部分參考了文献《基于分层宽带语音编解码系统的DTX/CNG算法研究与实现》的做法，以下是各个參数的具体提取方法
步骤Bi.提取16个时域包络參数和平均时域包络參数
每20ms的高频分量み(/ )等分为16段，每段包括10个采样点；16个时域包络參数为
权利要求
1. 一种基于音频水印的语音带宽扩展的方法，包括以下步骤，其中步骤B、步骤F2、F3 參考了文献《基于分层宽带语音编解码系统的DTX/CNG算法研究与实现》中的做法步骤A.使用QMF分析滤波器组模块将宽带语音分成两个部分0 8000Hz的窄带语音和8000 16000Hz的高频分量；并将两个输出信号通过ー个降采样模块，将采样频率降至吕腿ん得到低频信号みら)和高频信号·%(/ )；模块提取30个高频參数16个时域包络參数、12个频域包络參数、平均时域包络參数和平均频域包络參数；以下是各个參数的具体提取方法步骤Bi.提取16个时域包络參数和平均时域包络參数每20ms的高频分量み(/ )等分为16段，每段包括10个采样点；16个时域包络參数为
2. 一种基于音频水印的语音带宽扩展的装置，其特征在干，所述基于音频水印的语音带宽扩展的装置包括QMF分析滤波器组模块、提取高频參数模块、G. 711编解码模块、水印嵌入模块、提取水印模块、恢复高频语音模块及QMF合成滤波器组模块；所述QMF分析滤波器组模块将宽带语音分成两个部分0 8000Hz的窄带语音和 8000 16000Hz的高频分量；并将两个输出信号通入降采样模块，将采样频率降至8KHz，得到低频信号·sz fc)和高频信号·；所述提取高频參数模块提取30个高频參数16个时域包络參数、12个频域包络參数、平均时域包络參数和平均频域包络參数；该部分參考了文献《基于分层宽带语音编解码系统的DTX/CNG算法研究与实现》的做法，以下是各个參数的具体提取方法提取16个时域包络參数和平均时域包络參数模块每20ms的高频分量み(/ )等分为16段，每段包括10个采样点；16个时域包络參数为
全文摘要
本发明公开了一种基于音频水印的语音带宽扩展的装置及方法。该装置及方法开始部分，人发出的语音是宽带信号，在通过电话线传输之前，将高频参数嵌入到窄带码流中，通过电话线传输窄带语音信号；在接收端进行A律解码，然后提取高频参数，使用此高频参数恢复宽带语音中的高频部分，最后将高频语音和低频语音合成宽带语音。该装置及方法利用音频水印的特性，在窄带语音中建立一条隐藏的信道，利用此信道传输高频语音的参数，从而在不改变原有网络协议的前提下，实现了语音信号的频带扩展。
文档编号G10L19/00GK102543086SQ20111042239
公开日2012年7月4日申请日期2011年12月16日优先权日2011年12月16日
发明者殷福亮, 赵承勇, 陈喆申请人:大连理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈喆;殷福亮;赵承勇
技术所有人：大连理工大学
我是此专利的发明人

上一篇：听力补偿方法
上一篇：一种基于g．711．1的语音带宽扩展的装置和方法