音频信号的时频定向处理的制作方法

文档序号:9816456阅读:503来源:国知局
音频信号的时频定向处理的制作方法
【专利说明】
[0001]相关申请的交叉引用
[0002] 本申请要求以下申请的权益,其中每个申请通过引用方式并入本文中:
[0003] #于2013年9 月 24 日递交的、名称为 "TIME-FREQUENCY DIRECTIONAL FACTORIZATION FOR SOURCE SEPARATION(用于源分离的时频定向因子分解)"的美国临时 申请 No .61/881,678;
[0004] #于2013年9 月24 日递交的、名称为"SOURCE SEPARATION USING DIRECTION OF ARRIVAL HIST0GRAMS(利用到达方向直方图的源分离)"的美国临时申请No. 61 /881,709;
[0005] #于2013年 9 月23 日递交的、名称为"SMOOTHING TIME-FREQUENCY SOURCE SEPARATION MASKS(平滑时频源分离掩码)"的美国临时申请No. 61/919,851;
[0006] ?于2013年9月23日递交的且于2014年8月14日公开为美国专利公开2014/ 0226838、名称为"SIGNAL SOURCE SEPARATION(信号源分离)"的美国申请No. 14/138,587; 以及
[0007] #于2014年4月11 日递交的、名称为 "APPARATUS, SYSTEMS,AND METHODS FOR PROVIDING CLOUD BASED BLIND SOURCE SEPARATION SERVICES(用于提供基于云的盲目源 分离服务的装置,系统和方法)"的美国临时申请No. 61/978,707。
[0008] 本申请还涉及到于2014年3月27日公开的、名称为"SOURCE SEPARATION USING A CIRCULAR MODEL(利用圆形模型的源分离)"的国际申请公开W02014/047025,但是不要求该 申请的递交日的权益,该申请也通过引用方式并入本文中。
技术领域
[0009 ]本发明涉及音频信号的时频定向处理。
【背景技术】
[0010] 由于获取来自扬声器的期望信号的声波环境,对于包括智能手机、汽车等在内的 个人用户设备的口语输入的使用很有挑战性。一种利用多个麦克风信号从兴趣源分离信号 的广义方法是束成形,其使用以波长级以上的距离分离的多个麦克风来提供对麦克风系统 的定向灵敏度。然而,束成形方法会受例如麦克风的分离不足限制。
[0011] 已经开发了多种用于从单个麦克风信号进行非监督(例如,"盲目")源分离的技 术,包括利用时间相对频率分解的技术。一些这样的技术利用非负矩阵因子分解(NMF)。一 些技术已经应用于多个麦克风信号可用例如具有宽距间隔的麦克风的情形。
[0012] 用于语言处理的方法,例如语言识别,利用用户设备处的一些处理能力以及这些 处理的结果传输到服务器计算机,在服务器计算机中执行进一步的处理。这种方法的实施 例描述于例如美国专利8,666,963 "Method and Apparatus for Processing Spoken Search Queries(用于处理口语搜索查询的方法和装置)"。

【发明内容】

[0013] 在一个方面,处理在用户设备中获取的声信号的方法包括如下一者或两者:从一 组紧密间隔的麦克风获取并行信号,以及使用多层计算方法,在该多层计算方法中一些处 理在用户设备处执行,而另外的处理在与用户设备通信的一个或多个服务器计算机中执 行。获取的信号利用能量内容以及到达方向的时间相对频率估计来处理。在一些实施例中, 使用非负矩阵或张量因子分解方法来确定多个源,每个源与来自该源的信号的对应到达方 向关联。在一些实施例中,表征到达信息的方向的数据从用户设备传递给服务器计算机,在 服务器计算机中执行基于方向的处理。
[0014] 在另一方面中,一般地,处理所获取的多个信号的方法使用在用户设备处的对应 的多个声传感器。信号具有来自多个空间上分布的声源的部分。该方法包括:利用用户设备 处的处理器根据多个获取的信号中的至少一个信号来计算时间相关谱特性,所述谱特性包 括多个成分;利用用户设备处的处理器根据多个获取信号中的至少两个信号来计算方向估 计,谱特性的每个计算的成分具有方向估计中的对应一个;利用计算的谱特性和计算的方 向估计作为输入来执行分解程序以确定多个信号的多个源,谱特性的每个成分具有与确定 的源中的至少一个的计算关联度,并且每个源具有与至少一个方向估计的计算关联度;以 及利用分解程序的结果来选择性地处理来自一个源的信号。
[0015] 方面可以包括以下特征中的一个或多个的任意组合,理解的是除非特别指出,否 则这些特征中都不是特定实施方案所必要的。
[0016] 根据获取信号计算出的时间相关谱特性的多个成分中的每个成分与多个连续时 间帧中的时间帧相关联。例如,根据获取信号计算出的时间相关谱特性的多个成分中的每 个成分与频率范围相关联,由此计算的成分形成获取信号的时频特征化。在至少一些实施 例中,每个成分表示对应的时间和频率范围内的能量(例如,经由单调函数,诸如平方根)。
[0017] 计算成分的方向估计包括计算表示获取信号中的划分的到达方向的数据。例如, 计算表示到达方向的数据包括如下至少之一 :(a)计算表示一个到达方向的数据,以及(b) 计算表示至少一个到达方向的排除的数据。作为另一实施例,计算表示到达方向的数据包 括利用(a)相位和(b)获取信号的到达时间中的至少一项来确定与成分相关联的优化方向。 优化方向的确定可以包括执行(a)伪逆运算,以及(b)最小二乘误差估计中的至少一项。计 算表示到达方向的数据可以包括计算如下至少之一 :(a)到达方向的角度表示,(b)到达方 向的方向向量表示,以及(c)到达方向的量化表示。
[0018] 执行分解包括将计算的谱特性和计算的方向估计组合而形成表示按时间、频率和 方向索引的分布的数据结构。例如,该方法可以包括利用形成的数据结构来执行非负矩阵 或张量因子分解。在一些实施例中,形成数据结构包括形成表不其中缺失分布的输入项中 的大部分的稀疏数据结构的数据结构。
[0019] 执行分解包括确定包括每个成分与对应源的关联度的结果。在一些实施例中,关 联度包括二进制关联度。
[0020] 利用分解的结果来选择性地处理来自一个源的信号包括形成作为对应所述源的 获取信号的部分的估计的时间信号。例如,形成时间信号包括使用成分与所确定源的计算 关联度来形成所述时间信号。
[0021] 利用分解的结果来选择性地处理来自一个源的信号包括利用对应所述源的获取 信号的估计部分来执行自动语言识别。
[0022] 执行分解处理和利用分解程序的结果中的至少部分被执行为服务器计算系统与 用户设备进行数据通信。例如,该方法进一步包括从用户设备向服务器计算系统传送如下 至少之一 :(a)方向估计,(b)分解程序的结果,以及(c)利用分解的结果作为获取信号的部 分的估计而形成的信号。在一些实施例中,该方法进一步包括将使用分解程序的结果的结 果从服务器计算系统传送到用户设备。在一些实施例中,该方法进一步包括将数据从服务 器计算系统传送到用户设备,用于在用户设备处执行分解程序。
[0023] 在另一方面中,一般地,包括处理器和具有多个传感器元件的声传感器的信号处 理系统被配置为执行上文阐述的方法中的任一方法的全部步骤。
[0024] 在另一方面中,一般地,信号处理系统包括:集成到具有多个传感器元件的用户设 备中的声传感器;以及也集成在用户设备中的处理器。处理器被配置为:利用用户设备处的 处理器来根据多个获取信号中的至少一个信号计算时间相关谱特性,所述谱特性包括多个 成分;利用用户设备处的处理器来根据多个获取信号中的至少两个信号来计算方向估计, 谱特性的每个计算成分具有对应一个方向估计;利用计算的谱特性和计算的方向估计作为 输入来执行分解程序以确定多个信号的多个源,谱特性的每个成分具有与至少一个所确定 的源的计算关联度,每个源具有与至少一个方向估计的计算关联度;以及使得利用分解程 序的结果来选择性地处理来自一个源的信号。
[0025] 在一些实施例中,实现所述结果的利用包括利用用户设备的处理器来选择性地处 理所述信号。
[0026] 在一些实施例中,系统进一步包括用于与服务器计算机通信的通信接口,并且实 现结果的利用包括将分解程序的结果经由所述通信接口传送到所述服务器计算机。
[0027] 在另一方面中,一般地,包括具体实施在非暂态机器可读介质上的指令的软件,所 述指令在用数据处理系统的一个或多个处理器上的执行引起所述系统到上述方法中的任 一方法的全部步骤。
[0028] -个或多个方面解决
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1