动态效果卡拉OK的制作方法

文档序号：42293056发布日期：2025-06-27 18:27阅读：51来源：国知局

背景技术：

1、本发明涉及动态处理记录的音频内容的声乐伴奏，特别是卡拉ok系统中的动态效果。

2、传统的“卡拉ok”是一种通常在俱乐部和酒吧提供的互动娱乐，人们使用麦克风随着录制的音乐唱歌。这首音乐通常是一首著名流行歌曲的器乐版本。歌词通常与移动符号、变色或音乐视频图像一起显示在视频屏幕上，以引导演唱者。硬件和一些软件(例如智能手机应用)系统包括用户声音的数字信号处理等功能，例如添加混响并将其声音调谐到指定的音调。

3、卡拉ok系统通常配有带麦克风、放大器和扬声器的电声系统，以增强演唱者的声音。该卡拉ok设备播放主唱音轨缺失的特殊音乐音轨。音乐本身融合了在音乐制作过程中应用的许多音频效果。因此，对于卡拉ok演唱者的声音，电声系统也应该应用一些音频效果，使音乐和卡拉ok的的贡献在风格上非常契合。

4、因此，卡拉ok设备通常提供各种音频效果，可以选择这些效果来丰富演唱者的声音。例如，用于强调相关频率的均衡器、用于减少音量变化的压缩器、具有可调混响时间的混响效果、将声音的衰减回声添加到输出信号的延迟、创建多个演唱者同时唱歌的副歌效果、为声音增加明亮感的激励器、音高变换或和声器效果等等。

5、车载卡拉ok，有时也被称为“拼车卡拉ok(carpool karaoke)”(指詹姆斯·科登主演的电视节目)，是一种可以由乘客或车辆驾驶员表演的卡拉ok。商用产品可支持多种功能，例如捕获车内多名乘客的声音，减少车辆扬声器的反馈声音。

技术实现思路

1、传统的卡拉ok系统需要调整不同类型歌曲的个人效果。例如，可能与节奏较快的歌曲的最佳混响时间相比，慢速歌曲的混响时间可能更长。同样，最好将两个连续回声之间的延迟时间与歌曲的节奏相匹配。根据歌曲的乐器，可能需要调整均衡器以将声音嵌入混音中。民谣或情感歌曲可能需要音量变化，而在充满活力的歌曲中，声音的动态应该被压缩。此外，这些潜在的调整也可以在与歌曲的当前部分相关的歌曲内变化，与主歌相比，副歌可能会选择不同的效果。目前可用的卡拉ok系统需要手动调整这些效果。希望有一个更自动化的系统来帮助自动调整相关参数，而不一定需要任何手动调整。

2、车辆环境给卡拉ok系统带来了许多挑战，包括相对“沉寂”的声学环境，以及道路噪声和其它环境噪声的存在，这些噪声的音量很大，并且会因例如速度和道路类型而变化，还可能包括警报器和建筑打桩机等外部噪声。非常一般地，本文档中描述的一个或更多个系统和方法根据所唱音频的特征和/或用户唱歌的声学环境动态地改变用户(即演唱者)输入的处理特征。系统处理的优点可以包括改进的用户体验(例如，使用该系统更有趣或更吸引人)和/或更高质量的音频输出(例如，组合呈现的音频和捕获的音频的结果具有更理想和/或令人愉悦的特征)。

3、在本文档中，“卡拉ok”一词应广义地解释为包括任何情况，在这些情况下，系统被配置为向一个或更多个用户呈现声学信号，并在呈现声学信号期间捕获一个或更多个用户所产生音频。出于讨论的目的，下面可以将呈现的声学信号称为“歌曲”，而不意味着音频信号包括演唱或口语，也不限定其为伴唱音乐；并且捕获的音频(或其处理版本)可以称为用户的“人声”，而不意味着捕获的音频必然包括歌词或其它口语或唱词。最后，不要求向卡拉ok系统的用户呈现歌曲等的文本，也不要求捕获的音频必须与歌曲一起呈现给用户。

4、在一个方面，计算机实现的卡拉ok系统根据歌曲的属性调整相关设置，例如通过分析歌曲的音频信号自动确定。

5、在一些实施例中，卡拉ok系统被部署用于车辆中，例如，供车辆的驾驶员和/或一名或更多名乘客使用。例如，可以使用多个麦克风作为分布式扬声器专用麦克风，或者将多个麦克风在阵列配置中近距离使用，以处理波束形成器聚焦到乘客说话的特定方向。使用多个麦克风，该系统还可以检测有参加卡拉ok的演唱者数量，以及他们坐在车里的座位。然后，系统可能会为各个贡献者分配不同的音频效果(例如自动增益控制(agc))，以确保各个演唱贡献者的一致水平。例如，后座上的演唱者可能会被分配背景演唱者的典型效果。也许也可以应用一些音高变换，例如八度音阶的转置。

6、在一些实施例中，根据基本属性(例如速度、音量动态、音乐风格、流派、歌曲结构等)分析所选歌曲。根据这些属性，选择并配置一组效果。在一些实施例中，这些信息中的一些可能已经可以从数据库中获得(例如，音高频率、节奏和复调可以从midi文件中获得，关于流派的信息可以从数据库获得)，因此不需要自动提取。在一些实施例中，可以通过手动调谐来准备歌曲的预先定义音频效果集，例如，用户手动调谐最喜欢的歌曲，从而确保最佳(即最理想)的音频效果集。

7、在一些实施例中，音频效果可以在一首歌曲内改变。例如，副歌和主歌可能使用不同的效果设置。例如，基于副歌的重复，副歌与主歌的确定可以自动确定。作为另一个实例，与歌曲期间相比，可以在歌曲结束时应用不同的效果，例如在人声中断结束时引入延迟效果，而延迟效果不会持续有效，因为这可能会对演唱者造成干扰。

8、在一些实施例中，可以根据背景噪声来调整音频效果。例如，在高噪声情况下，可以应用更高的播放增益和更少的混响。可以使用与卡拉ok相同的麦克风估计背景噪声。此类音频效果能够尤其适用于车载应用，其中背景噪声可能较大且随时间变化。在一些实施例中，麦克风和扬声器不一定专用于卡拉ok，例如，集成到音频娱乐系统、免提电话系统和/或声音助理系统中。

9、在一些实施例中，卡拉ok系统被配置为与其它位置的其它卡拉ok系统交互，从而形成分布式卡拉ok系统，使用户们能够从多个位置参与。对于车载卡拉ok系统，车辆通过移动通信系统连接，多辆车中的驾驶员和/或乘客可以为一首歌提供人声，例如，通过系统同步或以其它方式协调歌曲和人声的播放。演唱者的声音不仅在本地车辆中播放，还会传输到其它车辆，与远端的声音一起添加到卡拉ok音轨中。两辆车的音频播放可以尽可能同步，混响效果中考虑了同步中的剩余失配(这可能是不可避免的)。来自远端汽车的声音可以用不同的音频效果进行处理，将其作为副歌放在环绕扬声器上。例如，两辆车a和b中的音乐同时开始并同步。然后，来自汽车a的演唱者声音被馈送到远端汽车b的效果部分，例如，在其中产生环绕效果、混响等。汽车b中的演唱者声音也将被传输到汽车a。

10、在一个方面，通常，一种用于对用户输入进行动态音频修改以与源歌曲的播放一起呈现的方法包括处理麦克风信号以产生表示用户输入的音频声音信号。

11、基于源歌曲的特征确定一种或更多种音频修改方法的参数值，并使用根据所确定的参数值配置的音频修改方法来处理音频声音信号，以产生增强的人声信号。这种修改的优点是，用户在更换歌曲时不必手动重新调整参数，这在用户忙于其它任务(例如驾驶车辆)的情况下可能特别有利。

12、增强的人声信号和源歌曲被组合以产生音频驱动信号，并且该音频驱动信号被提供给用户进行声学呈现。

13、在麦克风处获取声学信号以产生麦克风信号。声学信号至少包括用户的声音和音频驱动信号的声学呈现。处理麦克风信号然后可以包括基于利用音频驱动信号的参考和源歌曲中的至少一个的自适应来去除音频驱动信号中的声学呈现。声学信号可以包括环境噪声，并且麦克风信号的处理包括降噪。

14、音频修改方法包括混响、回声、激励和音高修改处理中的一种或更多种。

15、源歌曲的特征包括流派、节奏、音调和拍号中的一个或更多个。

16、确定参数值包括确定在歌曲期间变化的时变参数值。这种时变可能是有利的，因为歌曲的不同部分(例如副歌和主歌)可能需要不同的处理。

17、原始人声信号和去除人声的歌曲信号可以被确定为对应于原始源歌曲，并且将增强的人声信号和源歌曲组合包括将增强的人声信号和去除人声的歌曲信号组合。

18、处理音频声音信号以确定用户输入的声音水平。声音水平可以表示声音的存在或不存在，或者可以表示声音音量或能量。

19、确定声音信号在第一时段期间存在用户输入，在第二时段期间不存在用户输入。

20、形成音频驱动信号，包括在第一时段期间组合音频声音信号和去除人声的歌曲信号以产生音频驱动信号。

21、形成音频驱动信号，包括在第二时段期间组合原始人声信号和去除人声的歌曲信号以产生音频驱动信号。当用户忘记歌词并开始以较低的水平唱歌时，这种原始人声的呈现可能是有利的。

22、形成音频驱动信号还包括在第一间隔期间，以基于所确定的声音水平的衰减水平(例如，基于声音水平的历史或时间滤波)组合原始人声信号。当用户可能不确定歌词，并开始以较低的水平唱歌时，这种衰减的原始人声呈现可能是有利的。

23、确定原始人声信号和去除人声的歌曲信号包括在播放源歌曲之前接收所述人声信号和所述去除人声的信号。

24、确定原始人声信号和去除人声的歌曲信号包括处理原始源歌曲，以对原始源歌曲的人声分量和去除人声的分量进行混音。

25、在麦克风信号中检测到声音，并且在麦克风信号中未检测到声音的时段内，提供与原始源歌曲相对应的信号，包括提供至少一些原始人声信号，用于向用户进行声学呈现。

26、在第一车辆的车舱内采集麦克风信号，并在第一车辆的车舱内呈现音频驱动信号。

27、从第二车辆接收远程人声信号，并将增强的人声信号、远程人声信号和源歌曲组合以产生音频驱动信号。

28、增强的人声信号被提供用于在第二车辆中呈现。

29、歌曲在第一车辆和第二车辆中的呈现是同步的。

30、在向用户呈现歌曲期间，在第一车辆处基于源歌曲的特征确定一种或更多种音频修改方法的参数值。

31、在向用户呈现歌曲之前，基于源歌曲的特征确定一种或更多种音频修改方法的参数值。

32、在另一个方面，一般来说，非暂态机器可读介质上存储有指令。当处理器执行这些指令时，会使处理器执行上述任何一种方法的所有步骤。

33、在另一个方面，一般来说，音频处理系统包括处理器，该处理器被配置为执行上述方法中的任何一种的所有步骤。音频处理系统可以包括车载音频处理系统。音频处理系统可以集成到音频娱乐系统、免提电话系统或声音助理系统中的至少一个。

34、本发明的其它特征和优点从以下描述和权利要求中显而易见。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：菲利普·布林,斯特凡·理查德,蒂姆·豪利克,蒂莫·马泰哈,马库斯·巴克
技术所有人：赛轮思经营公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！