音频可视化控制方法及其装置、设备、介质与流程

文档序号:40772393发布日期:2025-01-24 21:09阅读:163来源:国知局

本申请涉及网络直播技术,尤其涉及一种音频可视化控制方法及其装置、设备、介质。


背景技术:

1、随着互联网技术的快速发展,直播已成为人们日常生活中不可或缺的一部分。在直播过程中,为了增强用户的互动体验和沉浸感,音频效果的表现变得尤为重要。尤其是音乐类直播,音频可视化效果能够将无形的声音转化为直观的视觉元素,极大地丰富了用户的观看体验。

2、尽管现有的音频可视化技术在一定程度上实现了音频信号的可视化,但它们在实际应用中仍存在一些缺陷。

3、首先,现有的音频可视化技术在处理复杂音乐风格和音频信号时,往往缺乏足够的灵活性和适应性。例如,在音乐风格频繁变换或音频信号强度波动较大的情况下,现有技术难以准确捕捉和反映音频信号的细微变化,导致可视化效果与音乐节奏出现脱节。

4、其次,现有的音频可视化技术大多依赖于简单的频谱分析,这种方法往往只能提供音频信号的单维度信息,如频率分布。这种单一的维度限制了可视化效果的丰富性和表现力,难以满足用户对于更加动态和多样化视觉效果的需求。

5、再者,现有的音频可视化技术可能应用时域分析技术来实现,该技术在处理背景噪音时也存在一定的局限性。在嘈杂的直播环境中,背景噪音可能会干扰音频信号的分析和处理,导致音频节奏不准确,可视化效果也受到负面影响。

6、此外,现有技术在实现音频可视化时,可能应用更为复杂的深度学习算法来确定音乐节奏,为此需要较高的计算资源和处理时间,这在实时直播场景中可能会影响系统的响应速度和用户体验。

7、由此可见,尽管现有的音频可视化技术在一定程度上实现了音频信号的可视化,但它们在适应复杂音频环境、提高可视化效果的丰富性和准确性方面仍有待改进。


技术实现思路

1、本申请的目的在于解决上述问题而提供一种音频可视化控制方法及其相应的装置、设备,以及非易失性可读存储介质。

2、根据本申请的一个方面,提供一种音频可视化控制方法,包括如下步骤:实时跟踪确定直播间的音频流中各个音频帧的频谱信息,确定每个音频帧的能量变化率;对应每个当前音频帧,基于当前音频帧的所述能量变化率确定当前音频帧是否存在候选节拍点;对应每个当前音频帧,基于当前及先前的全部音频帧的能量变化率所构成的能量变化序列确定理想节拍点;利用所述理想节拍点判断所述候选节拍点是否属于实际节拍点,以将所述实际节拍点用于驱动所述直播间播放音频可视化特效。

3、根据本申请的另一方面,提供一种音频可视化控制装置,包括:频谱分析模块,设置为实时跟踪确定直播间的音频流中各个音频帧的频谱信息,确定每个音频帧的能量变化率;单帧分析模块,设置为对应每个当前音频帧,基于当前音频帧的所述能量变化率确定当前音频帧是否存在候选节拍点;序列分析模块,设置为对应每个当前音频帧,基于当前及先前的全部音频帧的能量变化率所构成的能量变化序列确定理想节拍点;节拍确定模块,设置为利用所述理想节拍点判断所述候选节拍点是否属于实际节拍点,以将所述实际节拍点用于驱动所述直播间播放音频可视化特效。

4、根据本申请的另一方面,提供一种音频可视化控制设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的音频可视化控制方法的步骤。

5、根据本申请的另一方面,提供一种非易失性可读存储介质,其以计算机可读指令的形式存储有依据所述的音频可视化控制方法所实现的计算机程序,所述计算机程序被计算机调用运行时,执行该方法所包括的步骤。

6、本申请的技术方案为直播场景中的音频可视化提供了显著的优势,通过实时分析音频流的频谱信息和能量变化率,能够精确捕捉音乐节奏的细节变化,确保可视化效果与音乐节奏同步。该方案通过动态调整节拍点的确定以适应音频信号的实时变化,提高了节拍检测的准确性和音频可视化效果的动态性。同时,智能决策机制增强了节拍点的确定精度,减少了背景噪音的干扰,保证了即使在嘈杂环境中也能提供高质量的音频可视化效果。此外,本申请避免了依赖资源密集型的深度学习算法,减少了计算资源消耗和处理时间,使得直播观众能够即时享受到精准的音频可视化特效,提升了直播的互动性和观赏性。



技术特征:

1.一种音频可视化控制方法,其特征在于,包括:

2.根据权利要求1所述的音频可视化控制方法,其特征在于,实时跟踪确定直播间的音频流中各个音频帧的频谱信息,确定每个音频帧的能量变化率,包括:

3.根据权利要求1所述的音频可视化控制方法,其特征在于,对应每个当前音频帧,基于当前音频帧的所述能量变化率确定当前音频帧是否存在候选节拍点,包括:

4.根据权利要求1所述的音频可视化控制方法,其特征在于,对应每个当前音频帧,基于当前及先前的全部音频帧的能量变化率所构成的能量变化序列确定理想节拍点,包括:

5.根据权利要求1所述的音频可视化控制方法,其特征在于,利用所述理想节拍点判断所述候选节拍点是否属于实际节拍点,包括:

6.根据权利要求1至5中任意一项所述的音频可视化控制方法,其特征在于,利用所述理想节拍点判断所述候选节拍点是否属于实际节拍点,以将所述实际节拍点用于驱动所述直播间播放音频可视化特效之后,包括:

7.根据权利要求6所述的音频可视化控制方法,其特征在于,包括:实时跟踪确定直播间的音频流中各个音频帧的频谱信息之后,包括:

8.一种音频可视化控制装置,其特征在于,包括:

9.一种音频可视化控制设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。

10.一种非易失性可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,所述计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。


技术总结
本申请涉及网络直播领域,公开一种音频可视化控制方法及其装置、设备、介质,所述方法包括:实时跟踪确定直播间的音频流中各个音频帧的频谱信息,确定每个音频帧的能量变化率;对应每个当前音频帧,基于当前音频帧的所述能量变化率确定当前音频帧是否存在候选节拍点;对应每个当前音频帧,基于当前及先前的全部音频帧的能量变化率所构成的能量变化序列确定理想节拍点;利用所述理想节拍点判断所述候选节拍点是否属于实际节拍点,以将所述实际节拍点用于驱动所述直播间播放音频可视化特效。本申请通过实时分析音频流的能量变化率,实现了精准的节拍点检测,能更精准地呈现音频可视化效果,有效提升了直播环境中用户的互动体验和沉浸感。

技术研发人员:贺晨
受保护的技术使用者:广州方硅信息技术有限公司
技术研发日:
技术公布日:2025/1/23
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1