一种音频信号隐式表示方法及系统

文档序号:44197625发布日期:2025-12-26 23:44阅读:23来源:国知局
技术特征:

1.一种音频信号隐式表示方法,其特征在于,方法步骤包括:

2.根据权利要求1所述的一种音频信号隐式表示方法,其特征在于,所述s2中l层网络的傅里叶-kan网络模型,具体是由傅里叶基函数连接神经元(l,i)和(l+1,j)构建而成;所述傅里叶基函数取代传统激活函数,其具体表达式为:

3.根据权利要求1所述的一种音频信号隐式表示方法,其特征在于,所述s3中的倒频金字塔配置具体为:为傅里叶-kan网络模型的各层分配不同的频率阈值,且所分配的频率阈值随层数增加而不变或递减,以形成倒频金字塔结构。

4.根据权利要求3所述的一种音频信号隐式表示方法,其特征在于,所述s3中的频率初始化处理具体为根据傅里叶基函数的对称性,初始化傅里叶系数,其具体表达式为:

5.根据权利要求4所述的一种音频信号隐式表示方法,其特征在于,所述的频率自适应后的网络模型包含多频段表示,所述多频段表示由倒频金字塔配置和频率初始化处理联合构建,其具体表达式为:

6.根据权利要求1所述的一种音频信号隐式表示方法,其特征在于,所述s4中优化频率自适应后的网络模型的网络参数具体过程为:使用梯度下降法或其变体对网络参数进行迭代优化,所述网络参数包括傅里叶系数和偏置,迭代次数设为1000次,学习率初始值设为0.001,从优化后的网络中提取傅里叶系数和偏置,更新网络参数,输出优化后的网络模型。

7.根据权利要求6所述的一种音频信号隐式表示方法,其特征在于,所述s4中的损失函数采用均方误差损失函数,其具体表达式为:

8.根据权利要求1所述的一种音频信号隐式表示方法,其特征在于,所述s5中的连续音频信号振幅具体是基于由傅里叶-kan网络模型中的层间激活值计算得到,第(l+1,j)神经元的层间激活值tl+1,j为所有传入傅里叶基函数输出的总和,且用矩阵进行表示,其具体表达式为:

9.根据权利要求8所述的一种音频信号隐式表示方法,其特征在于,所述的连续音频信号振幅的具体公式为:

10.一种音频信号隐式表示系统,其特征在于,系统应用如权利要求1-9任一所述的一种音频信号隐式表示方法工作,系统包括输入模块、模型构建模块、频率自适应模块、优化模块和输出模块;


技术总结
本发明涉及一种音频信号隐式表示方法及系统。首先接收待处理音频信号的离散时间坐标,对其执行归一化处理以输出归一化时间坐标;接着基于傅里叶基函数,构建包含多层网络的傅里叶‑KAN网络模型;随后对该傅里叶‑KAN网络模型进行倒频金字塔配置与频率初始化处理,从而得到频率自适应后的网络模型;之后借助损失函数,基于梯度下降法对频率自适应后网络模型的网络参数进行优化;最后将归一化时间坐标输入优化后的网络模型,模型所输出的音频信号振幅即为最优音频信号表示。与现有技术相比,本发明具有高频分量捕获能力强、强鲁棒性、高效性及不依赖位置编码等优点。

技术研发人员:张林,李林飞,沈莹
受保护的技术使用者:同济大学
技术研发日:
技术公布日:2025/12/25
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!