一种音频信号隐式表示方法及系统

文档序号：44197625发布日期：2025-12-26 23:44阅读：23来源：国知局

技术特征：

1.一种音频信号隐式表示方法，其特征在于，方法步骤包括：

2.根据权利要求1所述的一种音频信号隐式表示方法，其特征在于，所述s2中l层网络的傅里叶-kan网络模型，具体是由傅里叶基函数连接神经元(l,i)和(l+1，j)构建而成；所述傅里叶基函数取代传统激活函数，其具体表达式为：

3.根据权利要求1所述的一种音频信号隐式表示方法，其特征在于，所述s3中的倒频金字塔配置具体为：为傅里叶-kan网络模型的各层分配不同的频率阈值，且所分配的频率阈值随层数增加而不变或递减，以形成倒频金字塔结构。

4.根据权利要求3所述的一种音频信号隐式表示方法，其特征在于，所述s3中的频率初始化处理具体为根据傅里叶基函数的对称性，初始化傅里叶系数，其具体表达式为：

5.根据权利要求4所述的一种音频信号隐式表示方法，其特征在于，所述的频率自适应后的网络模型包含多频段表示，所述多频段表示由倒频金字塔配置和频率初始化处理联合构建，其具体表达式为：

6.根据权利要求1所述的一种音频信号隐式表示方法，其特征在于，所述s4中优化频率自适应后的网络模型的网络参数具体过程为：使用梯度下降法或其变体对网络参数进行迭代优化，所述网络参数包括傅里叶系数和偏置，迭代次数设为1000次，学习率初始值设为0.001，从优化后的网络中提取傅里叶系数和偏置，更新网络参数，输出优化后的网络模型。

7.根据权利要求6所述的一种音频信号隐式表示方法，其特征在于，所述s4中的损失函数采用均方误差损失函数，其具体表达式为：

8.根据权利要求1所述的一种音频信号隐式表示方法，其特征在于，所述s5中的连续音频信号振幅具体是基于由傅里叶-kan网络模型中的层间激活值计算得到，第(l+1，j)神经元的层间激活值tl+1，j为所有传入傅里叶基函数输出的总和，且用矩阵进行表示，其具体表达式为：

9.根据权利要求8所述的一种音频信号隐式表示方法，其特征在于，所述的连续音频信号振幅的具体公式为：

10.一种音频信号隐式表示系统，其特征在于，系统应用如权利要求1-9任一所述的一种音频信号隐式表示方法工作，系统包括输入模块、模型构建模块、频率自适应模块、优化模块和输出模块；

技术总结
本发明涉及一种音频信号隐式表示方法及系统。首先接收待处理音频信号的离散时间坐标，对其执行归一化处理以输出归一化时间坐标；接着基于傅里叶基函数，构建包含多层网络的傅里叶‑KAN网络模型；随后对该傅里叶‑KAN网络模型进行倒频金字塔配置与频率初始化处理，从而得到频率自适应后的网络模型；之后借助损失函数，基于梯度下降法对频率自适应后网络模型的网络参数进行优化；最后将归一化时间坐标输入优化后的网络模型，模型所输出的音频信号振幅即为最优音频信号表示。与现有技术相比，本发明具有高频分量捕获能力强、强鲁棒性、高效性及不依赖位置编码等优点。

技术研发人员：张林,李林飞,沈莹
受保护的技术使用者：同济大学
技术研发日：
技术公布日：2025/12/25

完整全部详细技术资料下载

当前第2页1 2

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！