基于极值点的可伸缩语音压缩恢复技术的制作方法

文档序号:7531200阅读:263来源:国知局
专利名称:基于极值点的可伸缩语音压缩恢复技术的制作方法
技术领域
本发明涉及一种语音信号的压缩和恢复技术,属于语音信号通信技术领域。
背景技术
目前,数字化的语音信号的压缩与恢复技术被广泛应用于通信和多媒体领域。为此,国际电信联盟ITU,国际标准化组织ISO,国际电报电话咨询委员会CCITT以及世界各国的技术标准管理部门都语音信号的压缩与恢复制定一系列的标准,目的就是为了促进语音信号技术的进一步发展和更广泛的应用。在通信领域存在带宽的限制,在多媒体领域存在存储介质容量的限制,因此,语音信号在传输或存储之前一般要经过压缩处理,以节省通讯带宽和存储空间。一般地说,语音信号的压缩倍数与其恢复后的语音质量成反比。因此,对于具体的应用领域,要根据具体需求,在语音信号的压缩倍数与其恢复后的语音质量之间需求一个平衡点,使得语音信号的压缩倍数与其恢复后的语音质量都能够满足要求。目前,对于语音信号的压缩主要有3类实现技术一类是时域的预测编码压缩技术。该类技术的优点是恢复后的语音质量一般较好,计算量较小,但压缩的倍数一般不能太大,否则失真严重。另一类是基于参数分析的压缩技术。该类技术的优点是压缩的倍数可以较大,但恢复后的语音质量一般不高,计算量也较大。第三类是基于听觉特性的压缩技术。该类技术的优点是恢复后的语音质量一般较好,压缩的倍数一般也可以较大,但计算量较大,需要对语音信号做频域特征分析和频域与时域之间的相互转换。因此,综合考虑对语音信号的压缩倍数、恢复后的语音质量、计算量等因素是目前语音压缩与恢复技术的发展趋势。

发明内容
本发明是一种基于时域的对语音信号的压缩和恢复的技术,压缩倍数可以调节,恢复后的语音质量较好,计算量也较小。试验证明,对原始的语音信号的PCM格式的数据压缩倍数在10倍左右时,恢复后的语音质量仍然很好。
本发明所采用的技术方案是数字化后的语音信号用一个有限序列{x(n)}表示,其中n表示语音样本的序号,x(n)表示第n个样本点的取值。数字化后的语音信号的局部极植点包括两类一类是正极植点,另一类是负极值点。正极植点是指对于第n个样本点x(n),如果它满足x(n-1)<x(n)且x(n)>x(n+1),则称x(n)为一个正极植点;负极植点是指对于第n个样本点x(n),如果它满足x(n-1)>x(n)且x(n)<x(n+1),则称x(n)为一个负极植点。
首先对数字化后的语音信号计算所有的局部极值点,包括正极值点和负极值点,然后计算相邻的局部极值点的相对差,相对差的定义为假设y(k)和y(k+1)是语音信号x(n)的两个局部极值点,那么,y(k)关于y(k+1)的相对差是abs[y(k)-y(k+1)]/abs[y(k)],其中,abs[*]表示对括号[]内的表达式*取绝对值运算。根据伸缩系数(对应于压缩系数)的要求,对于相对差小于某个阈值的极值点不作为极值点处理。伸缩系数与阈值是正比例关系。这时,假设{y(k)}是语音信号{x(n)}的局部极值点的有限序列,那么,对语音信号{x(n)}的压缩存储是{(y(k),c(k))},其中y(k)表示语音信号{x(n)}的第k个极值点的样本值,c(k)表示第k个极值点y(k)到第k+1个极值点y(k+1)之间的语音信号{x(n)}的样本个数。
对按照上述方案压缩后的语音信号,再进行恢复的过程如下首先读取相邻的2个数据对(y(k),c(k))及(y(k+1),c(k+1)),根据c(k)的大小,在极值点y(k)和y(k+1)上进行一次或高次多项式插值,计算出y(k)和y(k+1)之间的c(k)个语音样本点,然后再对数据对(y(k+1),c(k+1))及(y(k+2),c(k+2))做类似的插值计算和处理,直到所有的(y(k),c(k))都处理完毕。这时,从压缩过的语音信号中就恢复了需要的语音信号。
权利要求
1.本发明涉及一种基于极值点的可伸缩语音压缩恢复技术,其特征是对数字化后的语音信号先计算其局部极植点,然后基于局部极植点分别进行语音信号的压缩和恢复。数字化后的语音信号用一个有限序列{x(n)}表示,其中n表示语音样本的序号,x(n)表示第n个样本点的取值。
2.根据权利要求1,局部极植点包括两类一类是正极植点,另一类是负极值点。正极植点是指对于第n个样本点x(n),如果它满足x(n-1)<x(n)且x(n)>x(n+1),则称x(n)为一个正极植点;负极植点是指对于第n个样本点x(n),如果它满足x(n-1)>x(n)且x(n)<x(n+1),则称x(n)为一个负极植点。
3.根据权利要求1,对数字化后的语音信号进行压缩的技术特征是首先计算所有的局部极值点,包括正极值点和负极值点,然后计算相邻的局部极值点的相对差,相对差的定义为假设y(k)和y(k+1)是语音信号x(n)的两个局部极值点,那么,y㈦关于y(k+1)的相对差是abs[y(k)-y(k+1)]/abs[y(k)],其中,abs[*]表示对括号 内的表达式*取绝对值运算。根据伸缩系数(对应于压缩系数)的要求,对于相对差小于某个阈值的极值点不作为极值点处理。伸缩系数与阈值是正比例关系。这时,假设{y(k)}是语音信号{x(n))的局部极值点的有限序列,那么,对语音信号{x(n)}的压缩存储是{(y(k),c(k))},其中y(k)表示语音信号{x(n)}的第k个极值点的样本值,c(k)表示第k个极值点y(k)到第k+1个极值点y(k+1)之间的语音信号{x(n))的样本个数。
4.根据权利要求1,对按照上述权利要求3所述的方法进行压缩后的语音信号,再进行恢复的技术特征是首先读取相邻的2个数据对(y(k),c(k))及(y(k+1),c(k+1)),根据c(k)的大小,在极值点y(k)和y(k+1)上进行一次或高次多项式插值,计算出y(k)和y(k+1)之间的c(k)个语音样本点,然后再对数据对(y(k+1),c(k+1))及(y(k+2),c(k+2))做类似的插值计算和处理,直到所有的(y(k),c(k))都处理完毕。这时,从压缩过的语音信号中就恢复了需要的语音信号。
全文摘要
一种基于时域的对语音信号的压缩和恢复的技术,压缩倍数可以调节,恢复后的语音质量较好,计算量也较小。试验证明,对原始的语音信号的PCM格式的数据压缩倍数在10倍左右时,恢复后的语音质量仍然很好。该项技术可应用于通信和多媒体等领域。
文档编号H03M7/30GK1750122SQ20051011770
公开日2006年3月22日 申请日期2005年11月7日 优先权日2005年11月7日
发明者章森 申请人:章森
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1