音频信号处理方法、电子设备及存储介质与流程

文档序号：41464344发布日期：2025-03-28 18:04阅读：65来源：国知局

本申请涉及大模型技术、音频处理领域，具体而言，涉及一种音频信号处理方法、电子设备及存储介质。

背景技术：

1、音频作为最常用的一种数据模态，广泛存在于日常生活中，并且扮演着不可或缺的角色。随着大语言模型(large language model，llm)的崛起，人工智能领域掀起了多模态统一建模的浪潮，音频作为一种重要的数据模态具有重要的研究意义。相关技术中已研发出多种不同的音频量化编码模型用于实现对于音频信号的量化编码处理，即将连续的音频信号转换为离散的数字信号，从而在尽量保持原始音频信号的质量的同时，降低存储或传输所需的数据量。但是，相关技术中的音频量化编码模型由于主要利用音频信号的时域结构进行编码，从而导致编码利用率低下、量化编码质量较差。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种音频信号处理方法、电子设备及存储介质，以至少解决相关技术中对音频信号进行量化编码处理时的编码利用率低下、编码质量差的技术问题。

2、根据本申请实施例的一个方面，提供了一种音频信号处理方法，包括：获取原始音频信号；对原始音频信号进行域转换处理，得到转换结果，其中，转换结果用于表示由原始音频信号转换得到的多种表示形式的时域信号与频域信号；对转换结果进行音频编码处理，得到编码结果，其中，编码结果用于在预设应用场景下对原始音频信号进行还原。

3、根据本申请实施例的另一方面，还提供了一种音频信号处理方法，包括：获取编码结果，其中，编码结果用于在预设应用场景下对原始音频信号进行还原，编码结果通过对转换结果进行音频编码处理后得到，转换结果通过对原始音频信号进行域转换处理后得到，转换结果用于表示由原始音频信号转换得到的多种表示形式的时域信号与频域信号；对编码结果进行语音重构处理，得到重构音频信号。

4、根据本申请实施例的另一方面，还提供了一种音频信号处理方法，包括：获取原始音频信号；采用目标音频信号处理模型对原始音频信号进行域转换处理以得到转换结果，对转换结果进行音频编码处理以得到编码结果，以及对编码结果进行语音重构处理以得到重构音频信号，其中，转换结果用于表示由原始音频信号转换得到的多种表示形式的时域信号与频域信号，编码结果用于在预设应用场景下对原始音频信号进行还原；对重构音频信号进行播放。

5、根据本申请实施例的另一方面，还提供了一种电子设备，包括：存储器，存储有可执行程序；处理器，用于运行程序，其中，程序运行时执行本申请实施例中任意一项的音频信号处理方法。

6、根据本申请实施例的另一方面，还提供了一种计算机可读存储介质，计算机可读存储介质包括存储的可执行程序，其中，在可执行程序运行时控制计算机可读存储介质所在设备执行本申请实施例中任意一项的音频信号处理方法。

7、在本申请实施例中，通过获取原始音频信号，并对原始音频信号进行域转换处理，得到转换结果，最后对转换结果进行音频编码处理，得到编码结果，达到了在预设应用场景下对原始音频信号进行可靠还原的目的，从而实现了提升对于音频信号的编码利用率和编码质量的技术效果，进而解决了相关技术中对音频信号进行量化编码处理时的编码利用率低下、编码质量差的技术问题。

8、容易注意到的是，上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释，并不构成对本申请的限定。

技术特征：

1.一种音频信号处理方法，其特征在于，包括：

2.根据权利要求1所述的音频信号处理方法，其特征在于，所述音频信号处理方法应用于音频信号编码模型，所述音频信号编码模型包括：域转换器，对所述原始音频信号进行域转换处理，得到所述转换结果包括：

3.根据权利要求2所述的音频信号处理方法，其特征在于，所述音频信号编码模型还包括：编码器，对所述转换结果进行音频编码处理，得到所述编码结果包括：

4.根据权利要求3所述的音频信号处理方法，其特征在于，所述音频信号编码模型还包括：量化器，所述音频信号处理方法还包括：

5.根据权利要求3所述的音频信号处理方法，其特征在于，对所述转换结果进行音频编码处理，得到所述编码结果包括：

6.根据权利要求4所述的音频信号处理方法，其特征在于，对所述编码结果进行逐层量化处理，得到所述量化结果包括：

7.根据权利要求6所述的音频信号处理方法，其特征在于，所述音频信号处理方法还包括：

8.根据权利要求7所述的音频信号处理方法，其特征在于，基于所述目标码本对所述编码结果进行逐层残差量化处理，得到所述量化结果包括：

9.根据权利要求4所述的音频信号处理方法，其特征在于，所述音频信号处理方法还包括：

10.根据权利要求1所述的音频信号处理方法，其特征在于，通过终端设备提供一图形用户界面，所述图形用户界面所显示的内容至少部分地包含一电商服务查询场景，所述音频信号处理方法还包括：

11.一种音频信号处理方法，其特征在于，包括：

12.根据权利要求11所述的音频信号处理方法，其特征在于，所述音频信号处理方法应用于音频信号解码模型，所述音频信号解码模型包括：解码器和域反转器，对所述编码结果进行语音重构处理，得到所述重构音频信号包括：

13.一种音频信号处理方法，其特征在于，包括：

14.根据权利要求13所述的音频信号处理方法，其特征在于，所述音频信号处理方法还包括：

15.一种电子设备，其特征在于，包括：

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的可执行程序，其中，在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至14中任意一项所述的音频信号处理方法。

技术总结
本申请公开了一种音频信号处理方法、电子设备及存储介质，涉及大模型技术、音频处理领域。其中，该方法包括：获取原始音频信号；对原始音频信号进行域转换处理，得到转换结果，其中，转换结果用于表示由原始音频信号转换得到的多种表示形式的时域信号与频域信号；对转换结果进行音频编码处理，得到编码结果，其中，编码结果用于在预设应用场景下对原始音频信号进行还原。本申请解决了相关技术中对音频信号进行量化编码处理时的编码利用率低下、编码质量差的技术问题。

技术研发人员：杜志浩,张仕良,胡凯,郑斯奇
受保护的技术使用者：杭州阿里云飞天信息技术有限公司
技术研发日：
技术公布日：2025/3/27

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杜志浩,张仕良,胡凯,郑斯奇
技术所有人：杭州阿里云飞天信息技术有限公司
我是此专利的发明人

上一篇：一种天线结构、射频装置和毫米波雷达的制作方法
下一篇：内容分享控制方法、系统和电子设备与流程

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！