使用所分离的对象编辑音频信号的方法和相关联的装置与流程

文档序号:17814901发布日期:2019-06-05 21:31阅读:229来源:国知局
使用所分离的对象编辑音频信号的方法和相关联的装置与流程

本文描述的示例性和非限制性实施例一般涉及音频技术,更具体地,涉及在所混合的声音生产中的控制单个音频对象的方法和用于这种方法的装置。



背景技术:

各种技术允许终端用户在音乐或其他音频已经被混合的正式制作之后分离音频轨道或对象。这些技术包括dolbyatmos、盲信号分离(bss)和mpeg空间音频对象编码(saoc)。音乐生产者通常想要限制终端用户应用这些技术的能力以努力保持原始生产的音乐的完整性。



技术实现要素:

以下发明内容仅旨在是示例性的。该发明内容不旨在限制权利要求的范围。

在一示例性方面中,一方法包括:提供包括两个或多个离散轨道的音频文件;将所述两个或多个离散轨道分离;对所述两个或多个离散轨道中的至少一个离散轨道能够被改变的量设置限制;以及将经分离的和经限制的离散轨道作为供终端用户使用的文件输出。

根据另一示例性方面,一方法包括:接收包括两个或多个离散轨道的音频文件;以针对两个或多个离散轨道中的至少一个离散轨道确定对可能的重新混合的所设置的限制;编辑所述两个或多个离散轨道中的至少一个;基于针对两个或多个离散轨道中的至少一个离散轨道所确定的对可能的重新混合的设置的限制来重新混合两个或多个离散轨道。

根据另一示例性方面,一种装置包括:至少一个处理器;包括计算机程序代码的至少一个非瞬态存储器,所述计算机程序代码被配置为与所述至少一个处理器一起使得所述装置至少:接收包括两个或多个离散轨道的音频文件;将所述两个或多个离散轨道彼此分离;分析两个或多个离散轨道,以针对两个或多个离散轨道中的至少一个离散轨道确定对可能的重新混合的设置的限制;以及允许用户基于针对两个或多个离散轨道中的至少一个离散轨道所确定的对可能的重新混合的设置的限制来重新混合两个或多个离散轨道。

附图说明

结合附图在以下描述中解释前述方面和其他特征,其中:

图1是对终端用户改变音乐制作者的最终音乐混合的能力设置限制的方法的一个示例性实施例的流程图;

图2是对终端用户改变音乐制作者的最终音乐混合的能力设置限制的方法的另一个示例性实施例的流程图;

图3是对终端用户改变音乐制作者的最终音乐混合的能力自动地设置限制的方法的另一示例性实施例的流程图;

图4是接收音乐文件的用户界面的框图;

图5是在其显示器上具有基于滑块的控制的用户界面的示意图;

图6是用户界面的示意图,该用户界面的示意图示出了乐队艺术家的可操纵图像的显示;

图7是图6的用户界面的示意图,示出了放大的可操作图像之一;

图8是图6的用户界面的示意图,示出了与可操纵图像之一相关联的视觉对象;和

图9是与数据库通信的用户界面的框图。

具体实施方式

参考附图,本文公开了允许终端用户在定义的限制内改变乐器和语音轨道的混合的方法的示例性实施例。本文还公开了用于执行这类方法的装置的示例性实施例。尽管一些技术(例如,cd、mp3等)不允许终端用户改变轨道的混合,但是更新的技术确实做出了这样的运行。这种改变可以经由使用诸如dolbyatmos、盲信号分离(bss)和mpeg空间音频对象编码(saoc)之类的技术格式。例如,dolbyatmos允许完全自由地编辑乐器和语音轨道。然而,由于很少或没有关于源信号或用于其的混合过程的用户可用信息,bss提供稍微较少的自由的编辑能力。使用bss进行编辑也可能导致产品遭受分离伪影。类似地,在使用mpegsaoc时,允许自由编辑,但是由于相对于源轨道在对象分离中的过于激烈的变化,音频质量可能受到影响。

在任何编辑技术中,音乐录制可以使用任何用于自动辨别声音录制合适的方法识别被。可以使用任何合适的算法(例如,duetbss算法)将一些音乐文件分离为乐器和语音轨道。另外,每个轨道中的乐器可以通过任何合适的自动乐器识别算法来识别。通过分析主导标签的音乐,也可以识别歌曲中的主导乐器。

在使用任何前述技术来分离音轨时,终端用户可能倾向于过度地修改音乐或其他音频以满足他们的喜好。例如,吉他演奏者可能想要更好地听到歌曲中的吉他轨道以便学习音符或和弦,歌手可能想要理解歌词,观看电影的人可能想要听到爆炸声更大或者过滤掉背景噪音以便听到一个角色在说什么,或者一个人可能只想要听到一个无需听到音乐、笑声轨道或其他背景声音的声音轨道,以便将整体音量保持在最低限度。

然而,出于一个或多个原因,音频或音乐制作者通常不想要允许终端用户进行完全控制。特别地,出于与版权相关的原因,艺术家和制作者想要限制终端用户将乐器完全单独分成单独轨道的能力,因为这些经分离的轨道可以被用于未授权的项目。对歌曲的极端地改变也可能使该歌曲听起来很糟糕,并且当该歌曲的这种版本被广泛传播时(例如,通过因特网),原始艺术家可能招致负面评论和/或不良宣传。此外,值得注意的是,从喜剧节目中移除笑声轨道通常会消除或减少任何喜剧效果。

因此,艺术家和制作者通常都不喜欢他们的工作产品被终端用户过度地修改。为了解决对已生产的音频的过度修改的问题,音乐艺术家和音乐生产者可能希望通过设置(自动地或手动地)以下限制来限制终端用户修改歌曲(或其他工作产品)的能力:关于终端用户可以重新混合音频文件(例如,组合、平移、添加混响、添加自动调谐能力、改变水平(例如,相对于其他水平的放大水平)等)的程度。这样的限制可以包括基于音频源的位置(例如,声音传播的方向)和经分离的音频源的回放来分离音频源。可以通过基于与音频相关联的元数据操纵回放选项来施加其他限制。本文公开的示例性实施例涉及对乐器轨道的分离施加限制(其不同于基于声音传播方向的分离)以及限制回放中的分离质量。

本文公开的示例性实施例涉及音乐制作者在已经分离乐器轨道之后限制终端用户对歌曲的音频混合的操纵(使用用户界面(ui))的方法和工具。操纵可以具有自动地限制或可以由音乐制作者设置的限制。本文描述的示例性实施例在决定限制时考虑了分离系统的质量。在备选的方案中,音乐制作者可以考虑所分离的乐器轨道的质量。此外,终端用户可能能够超出限制并听取结果,但是可以阻止他们保存或发布(在给予许可的情况下)超过限制的重新混合。另外,本文公开的示例性实施例可以被用来使得没有经验的终端用户能够在bss的帮助下重新混合他们自己的所录制内容,同时限制由于过度重新混合而损害录制内容的质量的风险。

参考图1,一个对改变最终混合的能力设置限制的方法的示例性实施例,该实施例通常由参考标号100标明,并且在下文中被称为“方法100”。方法100能够与传统音频文件一起工作,例如,仅与仅制作者的最终混合一起工作。在方法100中,制作者手动地设置终端用户可以改变最终制作者混合的限制。

方法100由音乐制作步骤110、第一分离步骤120和限制设置步骤130初始化。在音乐制作步骤110中,音乐制作者使用乐器和人声的离散轨道(例如,每个轨道一个乐器,每个轨道一个人声等)以制作歌曲的优选的混合。然后,音乐制作者可以以特定的格式(例如,单声道、立体声、5.1等)输出和/或保存优选的混音。限制作为元数据与实际歌曲音频一起被存储。在一些实施例中,以mpegsaoc格式存储歌曲音频,并且元数据被添加到saoc格式的空闲元数据字段中。在一些其他实施例中,以mpegsaoc格式存储歌曲音频,并且将元数据添加到mp4容器。在一些其他实施例中,歌曲音频被存储为aac(高级音频编码),并且将元数据添加到aac格式的空闲元数据字段中。使用mpegsaoc,将轨道存储在该格式中,并且修改存储的轨道很容易。

对于aac,优选的混合的轨道可能需要在修改之前被分离成离散轨道,如第一分离步骤120中所指示的。在音乐制作端以及在用户端都使用音频对象分离系统。分离系统可能需要相同,以便音乐制作者决定的元数据在用户端也适用。对于一些格式,可以使用bss将优选的混音分离为乐器轨道。然而,如果使用saoc,则分离被内置。然而,在任何情况下,尽管轨道被认为是离散的,但由于制作中(例如,特别是对于aac和saoc)的限制,其分离可能是不完美的。

在限制设置步骤130中,音乐制作者听取具有不同重新混合的经分离的轨道并确定用户重新混合的允许限制。以这种方式,音乐制作者确保所确定的限制适合于所使用的分离质量。当然,制作者在决定限制时也可以考虑除分离质量以外的其他方面。这些方面可以包括艺术观点等。制作者还可以设置如下限制,诸如,例如“无法衰减人声轨道”(因此该限制可能为零,即不允许该轨道的改变)、“背景演唱轨道必须始终比主要的人声轨道至少低3db”等等。在一些示例性实施例中,可以使用计算机程序来确定限制。

在音乐制作步骤110、第一分离步骤120和/或限制设置步骤130之后,作为输出文件140输出分离/限制的音频和元数据。在各种示例性实施例中,输出文件140可以是由音乐制作者为终端用户制作完成的音频文件,并且可以包括乐器和/或人声轨道。

如果期望的话,可以对输出文件140进行加密,使得只有批准版本的播放器程序才能对其进行解密。以这种方式,可以使得终端用户不能使用其他播放器程序来过度地重新混合歌曲。换句话说,在允许保存、复制或共享内容之前数字版权管理(drm)方案可以估计改变的程度(由用于编辑或重新混合的允许限制来定义)。然后在发送步骤150中将输出文件140存储、流传输和/或发送到播放器程序。

当播放器程序从发送步骤150接收输出文件140时,播放器程序检查元数据的存在并允许终端用户相应地重新混合歌曲。如第二分离步骤160中所示,可以使用bss将优选的混合的音频文件分离为乐器和/或语音轨道。另一方面,如果第二分离步骤160中的分离是经由saoc,则分离被内置。在第二分离步骤160中使用dolbyatmos的实施例中,至少一些轨道可能已经是离散的,因为dolbyatmos通常通过发送步骤150维持轨道的分离。如重新混合步骤170中所示,元数据被接收,对元数据进行分析以确定关于终端用户可以重新混合轨道到什么程度的限制,并且终端用户听取音频并可以使用ui将其重新混合到允许的范围。在这样做时,终端用户可以不超过在限制设置步骤130中由制作者在元数据中设置的限制。

然而,在一些实施例中,在限制超过步骤180中可以允许终端用户超过设置的限制。在设置超过步骤180中,终端用户可以暂时超过设置的限制,但是不可以存储结果。在一些其他实施例中,仅当终端用户持续操纵控制(例如,将手指放在控制按钮上)时,才允许终端用户超过设置的限制。

参考图2,对改变最终混合的能力设置限制的方法的另一示例性实施例,该实施例通常由参考标号200来标明,并且在下文中被称为“方法200”。在方法200中,除了制作者的最终优选的混合之外还提供原始轨道。在方法200的系统中,借助于原始轨道信息自动地设置限制。

利用音乐制作步骤210、第一分离步骤220、质量估计步骤225和限制设置步骤230启动方法200。在音乐制作步骤210中,可以从音乐制作中获得原始乐器轨道。音乐制作者制作歌曲的优选的混合并以特定格式(例如,单声道、立体声、5.1等)输出和/或保存它。

如第一分离步骤220中所示,优选的混合被分离成乐器轨道。所分离的乐器轨道可能与原始乐器轨道略有不同,因为分离可能不是完美的。可以使用用于传统音乐文件的bss和用于saoc文件的saoc来完成分离。

在质量估计步骤225中,使用不同的标准估计分离的质量。在一些实施例中,在质量评估中仅考虑文件格式。saoc文件被认为具有高质量,而bss文件被认为具有较低质量。还可以计算文件的不同度量,例如,系统可以计算原始乐器轨道和经分离的轨道之间的互相关性。较高的相关性通常对应于较高的质量。

在限制设置步骤230中,可以为终端用户可以如何重新混合文件设置的限制。通常,较高质量的文可以被更多地编辑件,较低质量的文件可以被更少地编辑。可以将限制写入元数据中。

除了与分离质量相关的限制外,还可能存在其他限制。播放器程序可以分析歌曲的轨道的不同特性。分析可以包括使用自动乐器识别算法识别乐器、识别歌曲的主导乐器、识别乐曲的速度、识别频域或时域特性,诸如脉冲、过零率、频谱倾斜、整体频谱、歌曲的瞬态或正弦性等。可以对整首歌曲执行分析,也可以仅对歌曲的某些部分执行分析。终端用户可以使用ui来重新混合歌曲。播放器程序软件基于分析为终端用户重新混合设置限制。限制可以是例如“主导乐器不能被衰减”、“人声轨道不能被衰减”、“速度>180bpm的歌曲不能加速”等。此外,限制可以与音乐分析结合使用(例如,“主导乐器不能被衰减超过2db”、“人声轨道不能被衰减”等)。也可以将这些限制写入元数据中。

然后将经分离/经估计/经限制的音频和元数据作为输出文件240作为乐器轨道输出。然后在发送步骤250中将输出文件240存储、流传输和/或发送给终端用户。

当播放器程序从发送步骤250接收输出文件240时,播放器程序接收音乐歌曲文件,音乐歌曲文件具有描述用于编辑的限制的元数据。播放器程序在第二分离步骤260中将歌曲分离成音频对象轨道。在第二分离步骤260中,可以使用bss或saoc(具有内置分离)来分离音频文件。

如重新混合步骤270中所示,终端用户可以使用ui来重新混合歌曲。终端用户可能不会重新混合歌曲,以便重新混合将超过元数据中设置的限制。例如,限制可以是“乐器可以被设置得更大或更安静但不多于在元数据中所描述的”。对于每个轨道,元数据可以包含例如以分贝为单位的限制。例如,这种限制可以是,如果分离质量低,则“轨道3的水平可以由用户修改为从-3db至+3db”,以及如果分离质量高,则“轨道3的水平可以由用户修改为从-12db至+12db”。

在方法200的一些实施例中(与方法100一样),在限制超过步骤280中终端用户可以超过设置的限制。在限制超过步骤280中,终端用户可以暂时超过设置的限制,但结果可能不被存储。在一些其他实施例中,仅当终端用户持续操纵控制(例如,将手指放在控制按钮上)时,才允许终端用户超过设置的限制。

参考图3,在没有关于原始乐器轨道的信息的情况下自动地设置限制的方法的另一示例性实施例,该实施例通常由参考标号300来标明,并且在下文中被称为“方法300”。方法300与传统音频文件一起操作,例如,仅与制作者的最终混合一起操作。

方法300包括音乐制作步骤310,其中可从音乐制作中获得一个或多个原始乐器轨道。音乐制作者制作歌曲的优选的混合并以特定格式(例如,单声道、立体声、5.1等)输出和/或保存它。在音乐制作步骤310之后,优选的混合作为乐器轨道的输出文件340被输出,并在发送步骤350中存储、流传输和/或发送给终端用户。

在分离步骤360中,播放器程序接收没有元数据的音乐歌曲文件。播放器程序将优选的混音分离成乐器轨道。可以使用用于传统音乐文件的bss和用于saoc文件的saoc来完成分离。

然后可以在终端用户质量估计步骤365中估计分离的质量。终端用户质量估计步骤365可以采用不同的标准。在一些实施例中,在质量评估中仅考虑文件格式。saoc文件被认为具有高质量,而bss文件被认为具有较低质量。还可以计算文件的不同度量,例如,系统可以计算经分离的轨道之间的互相关性。如果轨道具有低相关性,则可以认为分离具有高成功率。然而,如果轨道具有高相关性,则可以认为分离具有较低成功率。

如限制设置步骤367中所示,关于终端用户可以如何重新混合文件来设置限制。在这样的步骤中,较高质量的文件可以被较多地编辑,并且较低质量的文件可以被较少地编辑。例如,如果分离质量低,则“轨道3的水平可以由用户修改从-3db至+3db”,并且如果分离质量高,则“轨道3的水平可以由用户修改为从-12db至+12db”。

除了与分离质量相关的限制之外,还可能存在其他限制。例如,播放器程序可以分析歌曲的轨道的不同特征。分析可包括使用自动乐器识别算法识别乐器、识别歌曲的主导乐器、识别乐曲的速度、识别频域或时域特性,诸如脉冲、过零率、频谱倾斜、整体频谱、歌曲的瞬态或正弦性等。可以对整首歌曲执行分析,也可以仅对歌曲的某些部分执行分析。用户可以使用ui来重新混合歌曲。播放器程序软件基于分析为用户重新混合设置限制。限制可以是例如“主导乐器不能被衰减”、“人声轨道不能被衰减”、“速度>180bpm的歌曲不能加速”等。此外,限制可以与音乐分析结合使用(例如,“主导乐器不能被衰减超过2db”、“人声轨道不能被衰减”等)。

如重新混合步骤370中所示,终端用户可以使用ui来重新混合歌曲。终端用户可能不会重新混合歌曲,以便重新混合将超过设置的限制。

在限制超过步骤380中终端用户可以超过设置的限制。在限制超过步骤380中,终端用户可以暂时超过设置的限制,但结果可能不被存储。在一些其他实施例中,仅当终端用户持续操纵控件(例如,将手指放在控制按钮上)时,才允许终端用户超过设置的限制。

参考图4,可以将来自任何前述示例性实施例的乐器轨道接收到供终端用户使用的装置或电子设备中。装置或电子设备可以是由参考标号400标明的用户界面(ui),并且在下文中被称为“ui400”。ui400包括控制器410和显示器420。控制器410可以包括处理器430和存储器440,软件450位于存储器440中。乐器轨道可以是音乐文件460。

参考图5,ui400可以包括在显示器420上的基于滑块的简单控制,其中每个滑块500表示歌曲中的轨道。终端用户可以通过操纵每个轨道对应的滑块500来改变每个轨道。

参考图6,ui400可以是图形化的用户界面(gui),其显示乐队的艺术家的图像600、610、620并且允许终端用户操纵图像600、610、620以便同时操纵艺术家的音频组合。与结合滑块的ui相比,gui可以将ui400的使用渲染得更直观。图像600、610、620可以是例如专辑封面艺术。每个图像600、610、620可以具有不同的颜色或视觉效果,以指示可以还是不可以编辑与图像相关联的乐器。

特别是在ui400是图形化的实施例中,音乐文件460可以包括视觉文件,其中视觉文件的视觉对象已经被映射到乐器和/或语音,即,音乐文件460中的音乐对象。然后终端用户可以操纵视觉对象,同时自动地操纵音乐对象。音乐对象的操纵包括但不限于选择乐队成员视觉对象以增加其轨道音量等。如图7中所示,作为视觉对象的乐队成员的图像600可以被捏得更大以增加它们的轨道音量。操纵还可以包括移动乐队成员视觉对象以移动其轨道的听觉空间位置,例如,将乐队成员的相关联轨道从左扬声器移动到右扬声器,反之亦然。如图8中所示,诸如自动调谐800、低音/高音810、扬声器之间的平衡820、混响、均衡等的音频效果可以表现为视觉对象。然后,终端用户可以通过操纵视觉对象来控制这些效果的量。每个轨道可以具有它自己的效果。

参考图9,ui400可以使用任何合适的方法来识别音乐文件中的歌曲。例如,ui400可以访问在线(或其他)数据库900,ui400可以使用该数据库900来搜索录制在音乐文件中的艺术家。ui400还可以搜索艺术家和/或他们的乐器的在线图像。ui400可以进一步将音乐文件划分为乐器/语音轨道(使用,例如,duetbss算法),并且还可以识别每个轨道中的乐器(使用例如任何合适的自动乐器识别算法)。ui400可以基于艺术家的乐器的知识将每个轨道映射到艺术家。可以显示艺术家或他们的乐器的图像,并且终端用户可以基于此来操纵各个轨道。此外,如果存在具有相同乐器的若干演奏者,则ui400可以将那些轨道加在一起而不是示出乐器图像的艺术家图像或艺术家的群组或合成图像。

ui400的其他方面可以包括当演奏者改变或静默时在歌曲的不同部分处在显示器420上显示不同的图片。另外,与歌曲相关联的录制标签可以提供具有相关联图片的若干示例混合,其中乐队成员视觉对象与混合匹配。这样的系统可以基于用户设置或终端用户的先前习惯自动选择终端用户优选的混合。例如,如果终端用户总是将贝斯手混合得较响,则可以选择其中贝斯手是所有演奏者中最响的混合。可以向终端用户提供混合的视觉确认,因为系统向他或她示出了贝斯手视觉对象比其他人大的图像。

终端用户在ui400上的重新混合也可以是基于声道(channel-based)的,使得终端用户在多声道音频中的不同声道中以不同方式放大/衰减乐器。以这种方式,终端用户可以控制乐器的感知空间位置。不同的放大量也可以在元数据中被限制或通过自动分析来限制,例如,与空间位置相关联的较高质量文件可以比较低质量文件更多地改变。

在ui400的任何实施例中,终端用户可以超过由音乐制作者设置的限制。在ui400中,这可以例如在触摸显示设备上是可见的,使得控件在限制已被超过之后移动得更慢并且终端用户必须滑动多次以移动控件。控件可以是如图5中所示的滑块或者可以是图标。终端用户可以以超过重新混合的限制来听取歌曲,但是可以拒绝由ui400保存和/或传输重新混合的版本。

在其中终端用户可以超过由制作者设置的限制的ui400的实施例中,可以通过例如在触摸显示设备上使其可见而在显示器420上注意到超出限制,使得重新混合仅在用户将其手指放在滑块上并使其保持在滑块最大值之上的情况下超出限制。当用户松开其手指时,滑块返回到最大值。

除了将本文描述的示例性实施例用于音乐文件之外,本文描述的实施例适用于音频广播、电话会议、电影音频、有声读物等。本文描述的示例性实施例还可以与终端用户自己录制的内容一起使用,因为允许终端用户重新混合他们自己的内容是有益的特征(但是具有bss的传统重新混合可能需要一些专业知识,这可能导致最终结果听起来不理想,从而可能导致终端用户停止使用它)。然而,利用本文描述的示例性实施例,bss可以由没有经验的终端用户使用,并且他们降低他们自己内容的整体质量的风险较小。

关于本文所描述的实施例:可以为每个乐器各自地设置重新混合的限制;即使使用向后兼容的音频格式发送音频,诸如使用音频对象分离和元数据的aac或mp3之类使用,艺术家也可以设置关于乐器的限制;在一些实施例中,可以自动地设置用于重新混合的限制;在一些实施例中,即使没有元数据,也可以使用自动的关于乐器的限制;并且实现了用于终端用户创建个人音乐混合的直观方式。

现在参考本文描述的所有附图,任何前述的示例性实施例可以用软件、硬件、应用逻辑、或软件、硬件和应用逻辑的组合来实现。软件、应用逻辑和/或硬件可以驻留在ui400中以重新混合音频。如果期望的话,软件、应用逻辑和/或硬件的全部或部分可以驻留在任何其他合适的位置。在示例实施例中,将应用逻辑、软件或指令集维护在各种计算机可读介质中的任何一个计算机可读介质上。“计算机可读介质”可以是能够包含、存储、传递、传播或传送指令以供指令执行系统、部件或设备(诸如计算机)使用或与其结合使用的任何介质或装置。计算机可读介质可以包括计算机可读存储介质,计算机可读存储介质可以是可以包含或存储指令以供指令执行系统、部件或设备(诸如计算机)使用或与之结合使用的任何介质或部件。

在一个示例性实施例中,一种方法包括:提供包括两个或多个离散轨道的音频文件;将两个或多个离散轨道分离;对两个或多个离散轨道中的至少一个离散轨道可以被改变的量设置限制;以及将经分离的和经限制的离散轨道作为供终端用户使用的文件输出。

在该方法中,对两个更多离散轨道中的每一个可以被改变的量设置限制可以包括将限制存储为元数据。将限制存储为元数据可以包括手动地在元数据中设置的限制。手动地在元数据中设置的限制可以包括手动地确定能够接受的声音的上限和下限。将限制存储为元数据可以包括基于音频文件中的两个或多个离散轨道的配置自动地在元数据中设置的限制。自动地在元数据中设置的限制可以包括基于音频文件的两个或多个离散轨道与在分离之后的两个或多个离散轨道之间的相关性来确定声音质量。该方法还可以包括加密输出的文件。将限制存储为元数据可以包括以空间音频对象编码格式存储音频。将限制存储为元数据可以包括以空间音频对象编码格式存储音频并将元数据在mp4容器中存储。

在另一示例性实施例中,一种方法包括:接收包括两个或多个离散轨道的音频文件;分析两个或多个离散轨道,以针对两个或多个离散轨道中的至少一个离散轨道确定对可能的重新混合的所设置的限制;编辑两个或多个离散轨道中的至少一个离散轨道;基于针对两个或多个离散轨道中的至少一个离散轨道所确定的对可能的重新混合的设置的限制来重新混合两个或多个离散轨道。

该方法还可以包括在分析之前将两个或多个离散轨道彼此分离。将两个或多个离散轨道彼此分离可以基于盲信号分离格式或空间音频对象编码格式。该方法可以进一步包括超过所确定的对可能重新混合的设置限制。所接收的音频文件可以不包括元数据。分析两个或多个离散轨道可以包括计算两个或多个分离的离散轨道之间的相关性,并基于所计算的相关性设置对可能的重新混合程度的限制。

在另一示例性实施例中,一种装置包括:至少一个处理器;包括计算机程序代码的至少一个非瞬态存储器,计算机程序代码被配置为与至少一个处理器一起,使得装置至少以:接收包括两个或多个离散轨道的音频文件;将两个或多个离散轨道彼此分离;分析两个或多个离散轨道,以针对两个或多个离散轨道中的至少一个离散轨道确定对可能的重新混合的设置的限制;以及允许用户基于针对两个或多个离散轨道中的至少一个离散轨道所确定的对可能的重新混合的设置的限制来重新混合两个或多个离散轨道。

可以进一步使得装置基于盲信号分离格式将两个或多个离散轨道彼此分离。可以进一步使得装置基于空间音频对象编码格式将两个或多个离散轨道彼此分离。可以进一步使得装置允许用户超过所确定的可能重新混合的设置限制。分析两个或多个离散轨道可以包括还使得装置计算两个或多个分离的离散轨道之间的相关性,并基于所计算出的相关性设置对可能重新混合的程度的限制。

应该理解,前面的描述仅是说明性的。本领域技术人员可以设计出各种替换和修改。例如,各种从属权利要求中记载的特征可以以任何合适的组合彼此组合。另外,来自以上描述的不同实施例的特征可以选择性地组合成新的实施例。因此,该描述旨在涵盖落入所附权利要求范围内的所有这些替代、修改和变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1