一种基于混沌映射与人耳模型的音频压缩与恢复方法与流程

文档序号:35530468发布日期:2023-09-21 09:20阅读:43来源:国知局
一种基于混沌映射与人耳模型的音频压缩与恢复方法与流程

本发明涉及音频压缩,具体地说,涉及一种基于混沌映射与人耳模型的音频压缩与恢复方法。


背景技术:

1、音频在制作出来后,为了使音频得到传输,会将音频压缩储存起来,再进行流通,而音频在制作的过程中,会录入一下高频率的声音,而人耳对不同频率的声音敏感度不同,会使录入的高频率的声音无法被人耳所听到,在对音频进行压缩时,音频的高的也会被压缩,如此人耳无法听到的音频被压缩进入,会增加压缩后文件占用的空间,压缩的音频数据占用的空间大,增加数据存储的空间以及降低传输的速度,同时存在音频在压缩的过程中出现数据缺失的情况,如此便需要一种在进行音频压缩时避免音频出现数据缺失,并在压缩后降低数据占用的空间。


技术实现思路

1、本发明的目的在于提供一种基于混沌映射与人耳模型的音频压缩与恢复方法,以解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供一种基于混沌映射与人耳模型的音频压缩与恢复方法,包括以下步骤:

3、对音频进行压缩:

4、s1、使用离散傅里叶变换将原始音频信号转换为频域表示;

5、s2、使用混沌映射算法,生成一个混沌序列,并将此混沌序列被作为压缩的密钥;

6、s3、使用混沌序列对频域表示的音频信号进行加密;

7、s4、根据人耳模型,对加密的频域系数进行丢弃或量化;

8、s5、使用压缩算法对量化后的系数进行编码和压缩;

9、对音频进行恢复:

10、s6、对压缩的音频数据进行解码和解压缩,还原量化后的频域系数;

11、s7、使用密钥序列重新应用混沌置乱,以还原加密的频域系数;

12、s8、使用反离散傅里叶变换将频域信号转换回时域表示;

13、s9、根据人耳模型的逆过程,对恢复的音频信号进行加权和滤波;

14、s10、获取经过压缩和恢复的音频信号。

15、作为本技术方案的进一步改进,所述s1中将原始音频信号转换为频域表示的步骤为:

16、s1.1、将原始音频信号划分为固定长度的片段;

17、s1.2、对每个片段进行dft计算,得到频域表示数据;

18、s1.3、使用振幅谱(即频谱)和相位谱表示得到的频域表示数据。

19、作为本技术方案的进一步改进,所述s2中生成混沌序列的算法采用logistic映射算法,其算法公式为:

20、x_{n+1}=r*x_n*(1-x_n)

21、其中,x_n是序列的当前值,r是混沌参数,r取值范围在3.57-4.0之间,x_{n+1}是序列的下一个值;

22、其生成混沌序列的步骤如下:

23、s2.1、初始化:选择初始值x_0(通常在范围(0,1)内选择),选择混沌参数r,并确定序列长度n;

24、s2.2、循环计算:使用logistic映射算法,迭代计算序列的下一个值x_{n+1}=r*x_n*(1-x_n),重复计算n次;

25、s2.3、数值处理:将生成的混沌序列映射到所需的数值范围;

26、s2.4、序列使用:将生成的混沌序列作为压缩的密钥。

27、作为本技术方案的进一步改进,所述s3中使用混沌序列对频域表示的音频信号进行加密的步骤如下:

28、s3.1、将音频信号转换到频域表示;

29、s3.2、生成混沌序列:使用混沌映射算法生成一个与音频信号长度相匹配的混沌序列;

30、s3.3、对混沌序列进行归一化处理,将其映射到[0,2π]或[0,1]的范围内;

31、s3.4、将混沌序列与频域表示的音频信号进行乘法运算;

32、s3.5、将得到的乘积结果进行逆傅里叶变换,将其转换回时域表示。

33、作为本技术方案的进一步改进,所述s4中,根据人耳模型对加密的频域系数进行丢弃或量化的具体步骤如下:

34、s4.1、获取人耳对不同频段的敏感度,并根据人耳模型,确定哪些频段的频域系数可以被丢弃或量化;

35、s4.2、对频域系数应用阈值或量化:将频域表示的音频信号的各个频段的系数与阈值或量化步长进行比较;

36、s4.3、根据信号的重要性,调整不同频段的阈值或量化步长;

37、s4.4、对调整后的频域系数进行逆傅里叶变换,将其转换回时域表示。

38、作为本技术方案的进一步改进,所述s5使用压缩算法对量化后的系数进行编码和压缩的步骤如下:

39、s5.1、对量化后的系数进行编码:将量化后的系数转换为二进制数据流;

40、s5.2、应用压缩算法进行压缩:使用压缩算法对编码后的系数进行压缩;

41、s5.3、存储或传输压缩后的数据:将压缩后的数据进行存储或传输。

42、作为本技术方案的进一步改进,所述s6中,对压缩的音频数据进行解码和解压缩,还原量化后的频域系数的步骤如下:

43、s6.1、根据压缩时选择的压缩算法,选择相应的解压缩算法进行解码和解压缩,将压缩的音频数据进行解压缩;

44、s6.2、进行解码:将解压缩后的数据进行解码,将数据从二进制形式转换为量化后的系数;

45、s6.3、还原量化后的频域系数:使用逆量化算法将解码后的数据还原为量化前的频域系数;

46、s6.4、进行逆变换:将还原的频域系数进行逆变换。

47、作为本技术方案的进一步改进,所述s7中使用密钥序列重新应用混沌置乱还原加密的频域系数的步骤如下:

48、s7.1、生成密钥序列:使用相同的初始条件和控制参数,生成与加密时使用的密钥序列相同的混沌序列;

49、s7.2、重新应用混沌置乱:使用生成的密钥序列,对加密的频域系数进行重新应用混沌置乱;

50、s7.3、进行反量化:使用相同的量化步长和方法进行反量化,还原量化前的系数;

51、s7.4、进行逆变换:将经过混沌置乱和反量化的频域系数进行逆变换。

52、作为本技术方案的进一步改进,所述s8中使用反离散傅里叶变换将频域信号转换回时域表示的步骤为:

53、s8.1、准备频域信号:准备已经在频域进行过傅里叶变换的信号;

54、s8.2、通过逆变换还原频域系数:使用反离散傅里叶变换公式,将频域信号的各个频率分量(频域系数)还原回时域表示;

55、s8.3、将复数时域信号转化为实数表示。

56、作为本技术方案的进一步改进,所述s9中根据人耳模型的逆过程,对恢复的音频信号进行加权和滤波的步骤如下:

57、s9.1、基于人耳模型的加权:根据人耳对不同频率的声音敏感度不同,将人耳对不同频率的敏感度进行加权;

58、s9.2、基于人耳模型的滤波:根据人耳对声音的感知的一个频率响应特性,对人耳的频率响应特性进行滤波处理;

59、s9.3、重建和处理:经过加权和滤波后,对信号进行动态范围控制处理。

60、与现有技术相比,本发明的有益效果:

61、1、该基于混沌映射与人耳模型的音频压缩与恢复方法中,在对音频进行压缩的过程中,对人耳所无法听到的高频率的声音进行去除,降低音频压缩后所占用的空间,同时在对音频数据进行压缩的过程中,将音频数据分割为多段并进行编号,再进行数据的压缩,如此来确保数据压缩后的完整性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1