空间音频装置的制造方法

文档序号：9476595阅读：348来源：国知局

空间音频装置的制造方法
【技术领域】
[0001] 本申请涉及用于空间音频信号处理的装置。本发明进一步涉及但不限于用于移动设备内的空间音频信号处理的装置。
【背景技术】
[0002] 空间音频信号正被更频繁地用于产生更身临其境的音频体验。立体声或多通道记录可从记录或捕获装置传递给收听装置，并使用合适的多通道输出（诸如多通道扬声器布置）和具有虚拟环绕处理的一对立体声头戴式受话器或头戴式耳机来进行重放。
[0003] 应当理解，在不久的将来，诸如移动电话这样的移动装置将有可能具有多于两个扩音器。这提供了记录真实的多通道音频的可能。通过先进的信号处理，进一步有可能的是：通过确定诸如关联于音频源的方向这样的参数和基于其方向对所述音频源进行处理，对从特定或所需方向来自扩音器的音频信号进行波束成形或定向处理。

【发明内容】

[0004] 本申请的各个方面因而提供了一种空间音频捕获和处理，由此可以对收听方位或视频和音频捕获方位差别进行补偿。
[0005] 根据第一方面，提供了一种用于分离音频源的方法，其包括：接收至少两个音频信号；将所述至少两个音频信号变换为所述至少两个信号的频域表示；根据所述至少两个音频信号的频域表示生成观察空间协方差矩阵；生成包括至少一个波束成形器内核的空间协方差矩阵模型；生成音频对象的线性量值（magnitude)模型；将所述空间协方差矩阵模型和所述线性量值模型进行合并；确定至少一个合并参数，使得用于合并的所述至少一个参数尝试优化所述合并；以及基于所述至少一个合并参数对所述音频对象进行聚类以产生分离的音频源。
[0006] 接收所述至少两个音频信号可以包括以下中的至少一个：从扩音器生成所述音频信号，其中，所述扩音器从至少一个音频源接收声波；以及从存储器接收所述音频信号，所述音频信号描述了来自至少一个音频源的声波。
[0007] 将所述至少两个音频信号变换为所述至少两个信号的频域表示可以包括：对所述至少两个音频信号实施时间到频率变换。
[0008] 根据所述至少两个音频信号的频域表示生成观察空间协方差矩阵可以包括：根据所述两个频域表示的自协方差生成观察空间协方差矩阵。
[0009] 所述方法可以进一步包括：通过生成对扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的时间延迟，生成至少一个波束成形器内核。
[0010] 生成至少一个波束成形器内核可以包括：生成对所述扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的所述时间延迟的自协方差。
[0011] 生成音频对象的线性模型可以包括：对音频对象量值实施非负矩阵因式分解。
[0012] 对音频对象量值实施非负矩阵因式分解可以包括：利用均匀分布在零和一之间的随机值对线性模型参数Zk。、tlk和V k]进行初始化。
[0013] 将空间协方差矩阵模型和所述线性量值模型进行合并可以包括：将所述空间协方差矩阵模型乘以由所述线性模型表示的量值包络。
[0014] 确定至少一个合并参数可以包括：确定空间协方差模型参数，以便最小化所述观察空间协方差矩阵与所述空间协方差模型之间的差别。
[0015] 确定所述空间协方差模型参数可以包括：基于复值非负矩阵因式分解实施迭代式优化，从而使得表示所述至少一个音频对象的线性量值模型的参数被迭代地更新，直到所述线性量值模型参数在各个更新之间不显著改变，或者处理了所定义数量的迭代为止。
[0016] 基于所述复值非负因式分解实施所述迭代式优化可以包括：根据复数非负矩阵因式分解的优化框架更新线性模型参数zk。、tlk和v k];以及更新所述空间协方差矩阵模型量值。
[0017] 更新所述空间协方差矩阵模型量值可以包括：更新所述至少两个音频信号的估计量的相对量值差别。
[0018] 基于所述至少一个合并模型参数对所述音频对象进行聚类以产生分离的音频源可以包括：根据所述至少一个音频对象和根据所估计的线性量值模型参数生成至少一个音频源。
[0019] 所述方法可以进一步包括：基于与所述至少一个音频源相关联的所述至少一个合并模型参数，合成至少一个音频信号。
[0020] 根据第二方面，提供了一种装置，其包括：用于接收至少两个音频信号的构件；用于将所述至少两个音频信号变换为所述至少两个信号的频域表示的构件；用于根据所述至少两个音频信号的频域表示生成观察空间协方差矩阵的构件；用于生成包括至少一个波束成形器内核的空间协方差矩阵模型的构件；用于生成音频对象的线性量值模型的构件；用于将所述空间协方差矩阵模型和所述线性量值模型进行合并的构件；用于确定至少一个合并参数，从而使得用于所述合并的所述至少一个参数尝试优化所述合并的构件；以及用于基于所述至少一个合并参数对所述音频对象进行聚类以产生分离的音频源的构件。
[0021] 用于接收所述至少两个音频信号的构件可以包括以下中的至少一个：从扩音器生成所述音频信号，其中，所述扩音器从至少一个音频源接收声波；以及从存储器接收所述音频信号，所述音频信号描述了来自至少一个音频源的声波。
[0022] 用于将所述至少两个音频信号变换为所述至少两个信号的频域表示的构件可以包括：用于对所述至少两个音频信号实施时间到频率变换的构件。
[0023] 用于根据所述至少两个音频信号的频域表示生成所述观察空间协方差矩阵的构件可以包括：根据所述两个频域表示的自协方差生成观察空间协方差矩阵。
[0024] 所述装置可以进一步包括：用于通过生成对所述扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的时间延迟，生成至少一个波束成形器内核的构件。
[0025] 用于生成至少一个波束成形器内核的构件可以包括：生成对所述扩音器矩阵周围的空间场所进行采样的一组查看方向在频域中的时间延迟的自协方差。
[0026] 用于生成音频对象的线性模型的构件可以包括：对音频对象量值实施非负矩阵因式分解。
[0027] 用于对音频对象量值实施非负矩阵因式分解的构件可以包括：用于利用均匀分布在零和一之间的随机值对线性模型参数zkc]、4和V k]进行初始化的构件。
[0028] 用于对空间协方差矩阵和所述线性量值模型进行合并的构件可以包括：用于将所述空间协方差矩阵模型乘以由所述线性模型表示的量值包络的构件。
[0029] 用于确定至少一个合并参数的构件可以包括：确定空间协方差模型参数，以便最小化所述观察空间协方差矩阵和所述空间协方差模型之间的差别。
[0030] 用于确定所述空间协方差模型参数的构件可以包括：基于复值非负矩阵因式分解实施迭代式优化，从而使得表示所述至少一个音频对象的所述线性量值模型的参数被迭代地更新，直到所述线性量值模型参数在各个更新之间不显著改变，或者处理了所定义数量的迭代为止。
[0031] 用于基于复值非负因式分解实施所述迭代式优化的构件可以包括：用于根据复数非负矩阵因式分解的优化框架更新线性模型参数zkc]、hJPVk,的构件；以及用于更新所述空间协方差矩阵模型量值的构件。
[0032] 用于更新所述空间协方差矩阵模型量值的构件可以包括：用于更新所述至少两个音频信号的估计量的相对量值差别的构件。
[0033] 用于基于所述至少一个合并模型参数对所述音频对象进行聚类以产生分离的音频源的构件可以包括：用于根据所述至少一个音频对象和根据所估计的线性量值模型参数生成至少一个音频源的构件。
[0034] 所述装置可以进一步包括：用于基于与所述至少一个音频源相关联的所述至少一个合并模型参数来合成至少一个音频信号的构件。
[0035] 根据第三方面，提供了一种装置，其包括：至少一个处理器以及包括用于一个或多个程序的计算机代码的至少一个存储器，所述至少一个存储器和所述计算机代码被配置为与所述至少一个处理器一起促使所述装置至少：接收至少两个音频信号；将所述至少两个音频信号变换为所述至少两个信号的频域表示；根据所述至少两个音频信号的频域表示生成观察空间协方差矩阵；生成包括至少一个波束成形器内核的空间协方差矩阵模型；生成音频对象的线性量值模型；将所述空间协方差矩阵模型和所述线性量值模型进行合并；确定至少一个合并参数，从而使得用于所述合并的所述至少一个参数尝试优化所述合并；以及基于所述至少一个合并参数对所述音频对象进行聚类以产生分离的音频源。
[0036] 接收所述至少两个音频信号可以促使所述装置执行以下中的至少一个：接收从扩音器生成的所述音频信号，其中，所述扩音器从至少一个音频源接收声波；以及从存储器接收所述音频信号，所述音频信号描述了来自至少一个音频源的声波。
[0037] 将所述至少两个音频信号变换为所述至少两个信号的频域表示可以促使所述装置对所述至少两个音频信号实施时间到频率变换。
[0038] 根据所述至少两个音频信号的频域表示生成所述观察空间协方差矩阵可以促使所述装置：根据所述两个频域表示的自协方差生成观察空间协方差矩阵。
[0039] 可以进一步促使所述装置：通过生成对所述扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的时间延迟，生成至少一个波束成形器内核。
[0040] 生成至少一个波束成形器内核可以促使所述装置：生成对所述扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的时间延迟的自协方差。
[0041] 生成音频对象的线性模型可以促使所述装置：对音频对象量值实施非负矩阵因式分解。
[0042] 对音频对象量值实施非负矩阵因式分解可以促使所述装置：利用均匀分布在零和一之间的随机值对线性模型参数zkc]、4和v k]进行初始化。
[0043] 将空间协方差矩阵模型和所述线性量值模型进行合并可以促使所述装置：将所述空间协方差矩阵模型乘以由所述线性模型表示的量值包络。
[0044] 确定至少一个合并参数可以促使所述装置：确定空间协方差模型参数，以便最小化所述观察空间协方差矩阵和所述空间协方差模型之间的差别。
[0045] 确定所述空间协方差模型参数可以促使所述装置：基于复值非负矩阵因式分解实施迭代式优化，从而使得表示所述至少一个音频对象的线性量值模型的参数被迭代地更新，直到所述线性量值模型参数在各个更新之间不显著改变，或者处理了所定义数量的迭代为止。
[0046] 基于复值非负因式分解实施所述迭代式优化可以促使所述装置：根据复数非负矩阵因式分解更新线性模型参数zk。、tlk和v k];以及更新所述空间协方差矩阵模型量值。
[0047] 更新所述空间协方差矩阵模型量值可以促使所述装置：更新所述至少两个音频信号的估计量的相对量值差别。
[0048] 基于所述至少一个合并模型参数对所述音频对象进行聚类以产生分离的音频源可以促使所述装置：根据所述至少一个音频对象和根据所估计的线性量值模型生成至少一个音频源。
[0049] 可以进一步促使所述装置：基于与所述至少一个音频源相关联的所述至少一个合并模型参数，合成至少一个音频信号。
[0050] 根据第四方面，提供了一种装置，其包括：输入端，其被配置为接收至少两个音频信号；频域变换器，其被配置为将所述至少两个音频信号变换为所述至少两个信号的频域表示；空间协方差处理器，其被配置为根据所述至少两个音频信号的频域表示生成观察空间协方差矩阵；波束成形器，其被配置为生成包括至少一个波束成形器内核的空间协方差矩阵模型；矩阵因式分解器，其被配置为生成音频对象的线性量值模型；将所述空间协方差矩阵模型和所述线性量值模型进行合并；以及进一步被配置为确定至少一个合并参数，从而使得用于所述合并的所述至少一个参数尝试优化所述合并；以及分离器，其被配置为基于所述至少一个合并参数对所述音频对象进行聚类，以产生分离的音频源。
[0051] 所述输入端可以包括以下中的至少一个：至少一个扩音器输入端，其被配置为接收从扩音器生成的所述音频信号，其中，所述扩音器从至少一个音频源接收声波；以及至少一个存储器输入端，其被配置为从存储器接收所述音频信号，所述音频信号描述了来自至少一个音频源的声波。
[0052] 所述频域变换器可被配置为：对所述至少两个音频信号实施时间到频率变换。
[0053] 所述空间协方差处理器可被配置为：根据所述两个频域表示的自协方差生成观察空间协方差矩阵。
[0054] 所述波束成形器可被配置为：通过生成对所述扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的时间延迟，生成至少一个波束成形器内核。
[0055] 所述波束成形器可被配置为：生成对所述扩音器阵列周围的空间场所进行采样的一组查看方向在频域中的所述时间延迟的自协方差。
[0056] 所述矩阵因式分解器可被配置为：对音频对象量值实施非负矩阵因式分解。
[0057] 所述矩阵因式分解器可被配置

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M·维勒尔莫;M·塔米;J·尼库恩;T·维尔塔宁;
技术所有人：诺基亚技术有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。