用于音频信号的处理的方法和装置与流程

文档序号：12698285阅读：195来源：国知局

技术领域

本发明涉及用于音频信号的处理的装置。本发明进一步涉及，但不限于，用于在音频设备中处理音频和语音信号的装置。

背景技术：

电信装置中，麦克风或麦克风阵列典型地用于捕获声波，并将他们作为表示随后可被处理并发送至其他设备或被存储用以稍后回放的音频或语音的电子信号输出。目前，技术允许使用麦克风阵列中的多个麦克风来捕获声波，并且可将来自每个麦克风的结果音频信号传送至音频处理器，以协助隔离期望的声波。

通过高级的处理功能，可使用两个或更多个麦克风，其中以应用于来自每个麦克风的音频信号的可变增益和延迟因子的方式进行自适应滤波，以尝试对麦克风阵列接收模式波束成形。换句话说，波束成形生成可调整的音频敏感概况(profile)。

尽管对接收的音频信号波束成形可协助提高来自背景噪声的语音信号的信噪比，但是他对于麦克风阵列装置和信号源的相对位置特别敏感。因此，装置典型地设计有麦克风，并且具有宽的波束成形意味着全向声音提取和低增益不敏感记录，从而响亮的声音不切断系统。

此外，用于电子设备的视频和音频记录或捕获正变得普遍。随着电子设备上图像记录质量日益增加，他们变得更加可接受地用于事件(例如，音乐演奏会、家庭事件等)的每日记录，这些事件之前需要使用专用的音频和视频记录装置。

移动装置上的典型的视频记录功能使得用户能够快速调整图像质量或改变相机，从而用户可放大或缩小(使用数字或光学或数字光学缩放技术的组合)，或可改变其他记录参数，例如闪光、图像亮度或对比度等。这些参数中任一个的改变的结果在这样的实现方式下可被用户清楚地看到，这样，可快速地抓住差质量的视频捕获并且调整参数以生成改进的记录。然而，音频记录功能没有赶上这样的改进。典型地，音频记录装置的用户或操作者在技术上不知道正被记录的声音属性，因此可能不知道声音电平或声音来自哪个方向，因此不能在差的或不精确的音频记录在机型中时抓住，所以无法选择或调整设备的记录功能以改进记录。此外，即使当装置已经设计为向用户提供某些协助，他通常以用户无法与其交互的方式来显示。

此外，传统的视频记录设备典型地尝试生成一种音频捕获装置，其对于方位的范围并且在相机指向的方向具有静态概况。这样的装置中，难以分离视频记录的方向，换句话说，相机朝向的方向、以及视频记录装备的方向/方位和概况。例如，通常将典型的视频记录器设计为仅在相同方向记录视频和音频。

本发明考虑到信息的使用可在音频记录的控制下协助装置，因此例如通过精确的音频概况化协助所捕获的音频信号的噪声的降低。

技术实现要素：

本发明的实施例旨在解决上述问题。

根据本发明的第一方面，提供一种方法，包括：提供与至少一个音频信号相关的至少一个音频参数的视觉表示；经由接口检测与所述音频参数的视觉表示的交互；以及依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

提供与至少一个音频信号相关的至少一个音频参数的视觉表示包括以下步骤的至少一个：确定所述至少一个音频信号的捕获声压电平；确定用于所述至少一个音频信号的音频波束成形概况；确定用于所述至少一个音频信号的至少一个频带的音频信号概况；以及确定与所述至少一个音频信号有关的错误条件。

当所述参数是所述至少一个音频信号的捕获声压电平时提供与至少一个音频信号相关的至少一个音频参数的视觉表示包括以下步骤的至少一个：将当前捕获声压电平作为当前电平来显示；以及将用于预定时间段的峰值捕获声压电平作为峰值电平来显示。

控制与所述音频参数相关的所述至少一个音频信号的处理包括：改变所述至少一个音频信号捕获的增益。

当所述参数是用于所述至少一个音频信号的音频波束成形概况时提供与至少一个音频信号相关的至少一个音频参数的视觉表示包括以下步骤的至少一个：将所述音频波束成形概况作为表示音频波束成形角度的圆弧段来显示；以及将所述音频波束成形概况作为与反映视频记录角度的其他圆弧段相对的表示音频波束成形角度的圆弧段来显示。

当所述参数是用于所述至少一个音频信号的至少一个频带的音频信号概况时提供与至少一个音频信号相关的至少一个音频参数的视觉表示包括以下步骤的至少一个：显示所述至少一个音频信号的平均方位；显示峰值声压电平音频信号方位；显示表示与段相关的角度的至少一个音频信号的声压电平的所述段，其中所述段的半径取决于所述声压电平；以及显示表示所述至少一个音频信号的声压电平的至少一个轮廓，其中所述轮廓半径取决于所述声压电平。

控制与所述音频参数相关的所述至少一个音频信号的处理包括：改变所述音频波束成形角度的方位或概况宽度。

所述波束成形角度定义关于所述至少一个音频信号的空间过滤的中心点的角度。

当所述参数是与所述至少一个音频信号有关的错误条件时提供与至少一个音频信号相关的至少一个音频参数的视觉表示包括以下步骤的至少一个：显示剪辑警报；显示所述至少一个音频信号的捕获错误条件；以及显示与所述至少一个音频信号的捕获相关的硬件错误。

控制与所述音频参数相关的所述至少一个音频信号的处理包括以下步骤的至少一个：改变所述音频波束成形角度的方位或概况宽度；改变所述至少一个音频信号的增益；以及改变记录模式。

根据本发明的第二方面，提供一种装置，包括至少一个处理器和含有计算机程序代码的至少一个存储器，所述至少一个存储器和计算机程序代码被配置为，通过所述至少一个处理器，使得所述装置至少执行以下步骤：提供与至少一个音频信号相关的至少一个音频参数的视觉表示；经由接口检测与所述音频参数的视觉表示的交互；以及依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

提供与至少一个音频信号相关的至少一个音频参数的视觉表示使得所述装置至少执行以下步骤的至少一个：确定所述至少一个音频信号的捕获声压电平；确定用于所述至少一个音频信号的音频波束成形概况；确定用于所述至少一个音频信号的至少一个频带的音频信号概况；以及确定与所述至少一个音频信号有关的错误条件。

当所述参数是所述至少一个音频信号的捕获声压电平时提供与至少一个音频信号相关的至少一个音频参数的视觉表示使得所述装置至少执行以下步骤的至少一个：将当前捕获声压电平作为当前电平来显示；以及将用于预定时间段的峰值捕获声压电平作为峰值电平来显示。

控制与所述音频参数相关的所述至少一个音频信号的处理使得所述装置至少执行以下步骤：改变所述至少一个音频信号捕获的增益。

当所述参数是用于所述至少一个音频信号的音频波束成形概况时提供与至少一个音频信号相关的至少一个音频参数的视觉表示使得所述装置至少执行以下步骤的至少一个：将所述音频波束成形概况作为表示音频波束成形角度的圆弧段来显示；以及将所述音频波束成形概况作为与反映视频记录角度的其他圆弧段相对的表示音频波束成形角度的圆弧段来显示。

当所述参数是用于所述至少一个音频信号的至少一个频带的音频信号概况时提供与至少一个音频信号相关的至少一个音频参数的视觉表示使得所述装置至少执行以下步骤的至少一个：显示所述至少一个音频信号的平均方位；显示峰值声压电平音频信号方位；显示表示与段相关的角度的至少一个音频信号的声压电平的所述段，其中所述段的半径取决于所述声压电平；以及显示表示所述至少一个音频信号的声压电平的至少一个轮廓，其中所述轮廓半径取决于所述声压电平。

控制与所述音频参数相关的所述至少一个音频信号的处理使得所述装置至少执行以下步骤：改变所述音频波束成形角度的方位或概况宽度。

所述波束成形角度定义关于所述至少一个音频信号的空间过滤的中心点的角度。

当所述参数是与所述至少一个音频信号有关的错误条件时提供与至少一个音频信号相关的至少一个音频参数的视觉表示使得所述装置至少执行以下步骤：显示剪辑警报；显示所述至少一个音频信号的捕获错误条件；以及显示与所述至少一个音频信号的捕获相关的硬件错误。

控制与所述音频参数相关的所述至少一个音频信号的处理使得所述装置至少执行以下步骤的至少一个：改变所述音频波束成形角度的方位或概况宽度；改变所述至少一个音频信号的增益；以及改变记录模式。

根据本发明的第三方面，提供一种装置，包括：显示器处理器，配置为提供与至少一个音频信号相关的至少一个音频参数的视觉表示；交互视频接口，配置为确定与所述音频参数的视觉表示的交互；以及音频处理器，配置为依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

显示器处理器还被配置为确定以下内容的至少一个：所述至少一个音频信号的捕获声压电平；用于所述至少一个音频信号的音频波束成形概况；用于所述至少一个音频信号的至少一个频带的音频信号概况；以及与所述至少一个音频信号有关的错误条件。

显示器处理器可当所述参数是所述至少一个音频信号的捕获声压电平时进一步显示以下内容的至少一个：将当前捕获声压电平作为当前电平来显示；以及将用于预定时间段的峰值捕获声压电平作为峰值电平来显示。

所述处理器可被配置为改变所述至少一个音频信号捕获的增益。

显示器处理器还被配置为确定以下内容的至少一个：将所述音频波束成形概况作为表示音频波束成形角度的圆弧段；将所述音频波束成形概况作为与反映视频记录角度的其他圆弧段相对的表示音频波束成形角度的圆弧段。

显示器处理器可当所述参数是用于所述至少一个音频信号的至少一个频带的音频信号概况时显示以下内容的至少一个：所述至少一个音频信号的平均方位；峰值声压电平音频信号方位；表示与段相关的角度的至少一个音频信号的声压电平的所述段，其中所述段的半径取决于所述声压电平；以及表示所述至少一个音频信号的声压电平的至少一个轮廓，其中所述轮廓半径取决于所述声压电平。

所述处理器可改变所述音频波束成形角度的方位或概况宽度。

所述波束成形角度定义关于所述至少一个音频信号的空间过滤的中心点的角度。

显示器处理器还可被配置为显示以下内容的至少一个：剪辑警报；所述至少一个音频信号的捕获错误条件；以及与所述至少一个音频信号的捕获相关的硬件错误。

所述处理器可被配置为改变以下内容的至少一个：所述音频波束成形角度的方位或概况宽度；所述至少一个音频信号的增益；以及记录模式。

根据本发明的第四方面，提供一种装置，包括：处理部件，配置为提供与至少一个音频信号相关的至少一个音频参数的视觉表示；接口处理部件，配置为经由接口检测与所述音频参数的视觉表示的交互；以及音频处理部件，配置为依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

根据本发明的第五方面，提供一种通过指令编码的计算机可读介质，当计算机执行时其执行以下步骤：提供与至少一个音频信号相关的至少一个音频参数的视觉表示；经由接口检测与所述音频参数的视觉表示的交互；以及依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

一种电子设备可包括上述装置。

一种芯片可包括上述装置。

附图说明

为了更好地理解本发明，现在通过实例参照附图，其中：

图1示意性示出采用本申请的实施例的装置；

图2更详细地示意性示出图1中所示的装置；

图3示意性示出根据一些实施例的视觉化音频参数的装置和实例；

图4更详细地示意性示出实例的视觉化音频参数；

图5示意性示出根据其他一些实施例的实例的视觉化的音频参数；

图6示意性示出展现本申请的一些实施例的操作的流程图；以及

图7示出根据本申请的一些实施例的声音定向参数视觉化的实例。

具体实施方式

下文描述了提供在麦克风阵列中提高音频捕获和记录灵活性的装置和方法。由此，首先参照图1，其示出示例性电子设备10或装置的示意性框图，其可结合增强的音频信号捕获性能分量和方法。

装置10例如可以是用于无线通信系统的移动终端或用户装备。其他实施例中，装置可以是音频播放器，例如mp3播放器或媒体播放器，配备有适当的麦克风阵列和传感器，如下所述。

在一些实施例中，装置10包括处理器21。处理器21可配置为执行各个程序代码。实现的程序代码可包括音频捕获/记录提高代码。

实现的程序代码23可例如存储于存储器22中，用于每当需要时又处理器21提取。存储器22可进一步提供用于存储数据的段24，例如，根据实施例处理了的数据。

实施例中，音频捕获/记录提高代码可至少部分地以硬件或固件实现。

在一些实施例中，处理器21可经由数模转换器(DAC)32链接至扬声器33。

数模转换器(DAC)32可以是任意适合的转换器。

扬声器33例如可以是用于为用户的耳朵生成从DAC 32输出的电子音频信号生成的声波的任意适当音频变换器装备。在一些实施例中，扬声器33可以是耳机或回放扬声器，并且可经由头戴式耳机连接器链接至电子设备10。在一些实施例中，扬声器33可包括DAC 32。此外，在一些实施例中，扬声器33可无线地链接至电子设备10，例如，通过使用如蓝牙A2DP简档阐述的低功率射频连接。

处理器21进一步链接至收发器(TX/RX)13，链接至用户接口(UI)15以及存储器22。

用户接口15可使得用户例如经由键板向电子设备10输入命令，和/或例如经由显示器(未示出)从电子设备10获得信息。此外，可理解，在一些实施例中，用户接口可以是输入和显示技术的任意适当组合，例如，适用于从用户接收输入和向用户显示信息的触摸屏显示器。

收发器13可以是任何适当的通信技术，并且被配置为能够例如经由无线通信网络与其他电子设备通信。

在一些实施例中，装置10还可在麦克风阵列11中包括至少两个麦克风，根据本申请的实施例用于输入或捕获声波并输出要处理的音频或语音信号。根据一些实施例，音频或语音信号可经由收发器13发送至其他电子设备或可存储于存储器22的数据部分24用于稍后处理。

为此，用户可经由用户接口15激活使用至少两个麦克风控制音频信号的捕获的相应程序代码或硬件。这样的实施例中，装置10还可包括数模转换器(ADC)14，其被配置为将来自麦克风阵列11的输入模拟音频信号转换成数字音频信号并向处理器21提供数字音频信号。

在一些实施例中，装置10可从电子设备上没有物理实现的麦克风阵列11接收音频信号。例如，在一些实施例中，扬声器33装置可包括麦克风阵列。然后，扬声器33装置可发送来自麦克风阵列11的音频信号，因此装置10可经由收发器从另一电子设备接收具有相应编码的音频数据的音频信号比特流。

在一些实施例中，处理器21可执行存储器22中存储的音频捕获/记录增强程序代码。这些实施例中，处理器21可处理接收的音频信号数据，并输出处理后的音频数据。

在一些实施例中，也可代替立即处理，将接收的音频数据存储于存储器22的数据段24中，例如，用于稍后处理和呈现或向另一电子设备转发。

此外，电子设备可包括传感器或传感器库16。传感器库16接收关于电子设备10正在运行的环境的信息，并将该信息传送至处理器21，以影响音频信号的处理，并且特别地，在音频捕获/记录应用中影响处理器21。传感器库16可包括以下传感器组的至少一个。

在一些实施例中，传感器库16可包括相机模块。在一些实施例中，相机模块包括至少一个相机，其具有将图像聚焦于例如电荷耦合器件(CCD)的数字图像捕获装置的镜头。在其他实施例中，数字图像捕获装置可以是任意适合的图像捕获设备，例如互补金属氧化物半导体(CMOS)图像传感器。在一些实施例中，相机模块还包括闪光灯，其用于在捕获对象的图像之前照明对象。在这样的实施例中，闪光灯链接至用于控制闪光灯的操作的相机处理器。在其他实施例中，相机可被配置为执行用于低周边光感测的红外和近红外感测。至少一个相机也可链接至用于在将处理后的图像传送至处理器之前处理从至少一个相机接收的信号的相机处理器。相机处理器可链接至可存储用于相机处理器在捕获图像时执行的程序代码的本地相机存储器。此外，在一些实施例中，可使用本地相机存储器作为用于在本地处理之前和期间存储捕获的图像的缓冲器。在一些实施例中，相机处理器和相机存储器分别在处理器21和存储器22中实现。

此外，在一些实施例中，相机模块可在回放扬声器装置上物理地实现。

在一些实施例中，传感器库16包括位置/方位传感器。在一些实施例中，方位传感器可通过数字罗盘或固态罗盘实现，其被配置为确定电子设备对于水平轴的方位。在一些实施例中，位置/方位传感器可以是重力传感器，其被配置为输出电子设备对于垂直轴的方位。重力传感器例如可实现为以到垂直的各个角度设置的水银开关的阵列，其中开关的输出指示电子设备对于垂直轴的角度。在一些其他实施例中，位置/方位传感器可以是加速度计或回转仪。

也可理解，装置10的结构可通过许多方式补充和改变。

可理解，图2至5所述的示意性结构和图6中的方法步骤仅代表包括图1中所示的电子设备中实现的示例性所示的一些实施例的完整音频捕获/记录链条的部分操作。

关于图2和图6，更详细地示出实现和操作的应用的一些实施例。

关于图2，对于本申请的一些实施例中采用的组件更详细地示出装置10的示意图。

此外，关于图6，示出本申请的一些实施例中可采用的一系列操作的流程图。

在一些实施例中，本申请向装置的用户或操作者提供一种交互灵活的音频和/或音频视觉记录方案。在这些实施例中，用户接口15可通过实时测量和显示声域(sound field)向用户提供来自记录的音频信号的所需的信息，从而装置的操作者或用户可理解正在记录什么。此外，在一些实施例中，使用相同的用户接口，装置的操作者也可实时调整参数，因此可调整记录的声域，由此避免记录或捕获差质量的音频信号。

在一些实施例中，先前描述的装置包括麦克风的阵列(至少两个)。同样先前所述的麦克风阵列11被配置为输出来自阵列中的每个麦克风的捕获的音频信号。然后，在一些实施例中，音频信号可被传送至模数转换器14。然后，模数转换器可连接至波束成形器和增益控制处理器101。在一些实施例中，如图2所示，每个麦克风可实现为数字麦克风，换句话说，具有集成的模数转换器，并且来自每个麦克风的输出直接输出至波束成形器和增益控制处理器101。

可理解，尽管以下实例描述了音频信号的捕获，在一些其他实施例中可将相同的装置配置为例如在存储器22中存储捕获的音频信号，或经由收发器13将捕获的音频信号发送至其他装置。

图6中，通过步骤501示出初始化麦克风阵列的操作。

在一些实施例中，波束成形和增益控制处理器101接收来自麦克风阵列的音频信号，并且被配置为对于来自相关的麦克风阵列的音频信号执行滤波或波束成形操作。可实现任意适当的音频信号波束成形操作。此外，在一些实施例中，波束成形和增益控制处理器101被配置为生成应用于从麦克风阵列中的“n”个麦克风接收的音频信号的初始加权矩阵。

在一些实施例中，波束成形和增益控制处理器101可接收相机传感器信息并生成初始波束成形和增益控制参数，从而麦克风阵列尝试捕获具有相同概况(方向和扩展)的音频信号，作为视频相机。

图6中，通过步骤503示出初始波束成形和增益控制的操作。

在一些实施例中，波束成形和增益控制处理器101可进一步混合波束成形后的音频信号，以生成“k”个不同的音频通道。例如，波束成形和增益控制可将数目“n”个麦克风音频信号数据流混合到数目“k”个音频通道中。例如，在一些实施例中，波束成形器和增益控制器101可通过两个音频通道输出立体声信号输出。在其他实施例中，可生成单通道或多通道输出。例如，波束成形和增益控制处理器可通过6个音频通道将波束成形的音频流混合成5.1音频输出，或任意适合的通道组合输出。在这些实施例中，波束成形和增益控制处理器101使用任意适当技术以生成这些音频通道输出。

在一些实施例中，如图2所示，波束成形和增益控制处理器101可将混合后的波束成形信号输出至音频编解码器103。此外，如图2所示，在一些实施例中，波束成形和增益控制处理器可执行第二混合，并将第二混合的“m”通道输出至音频表征视觉化处理器105。

在一些实施例中，音频编解码器103可处理音频通道数据，以编码音频通道，生成适合于存储或传输的更有效编码的数据流。音频编解码器103可采用任意适合的音频编解码操作，例如MPEG-4AAC LC、Enhanced aacPlus(还已知为AAC+、MPEG-4HE AAC v2)、Dolby Digital(还已知为AC-3)、和DTS。根据该实施例，音频编解码器103可被配置为将编码后的音频流输出至存储器22，或使用收发器13发送编码后的音频流，或在某个稍后日期解码音频流并经由数目转换器32将音频流传递至回放扬声器33。

在一些实施例中，音频表征视觉化处理器105被配置为关于来自波束成形和增益控制处理器101的混合后的输出信号执行音频参数评估方面的测试。例如，在一些实施例中，音频表征视觉化处理器105可关于接收的音频信号执行电平确定计算。换句话说，计算捕获的音频信号的能量值。此外，在一些实施例中，音频表征视觉化处理器105确定峰值电平，换句话说，对于先前(预定)时间段的最高电平。

在一些实施例中，音频表征视觉化处理器105计算从波束成形的音频信号输入的音频信号的方向。例如，在一些实施例中，对于每个通道输出计算波束成形的麦克风阵列音频信号能量电平，以生成近似音频方向。

在一些其他实施例中，音频表征视觉化处理器105还可对于接收的音频信号检查非最佳捕获事件。例如，音频表征视觉化处理器105可确定当前电平或峰值电平是否达到高值，其中当前记录增益设置太高并且记录变形或“剪辑”，因为最大振幅不能够被精确编码或捕获。

类似地，音频表征视觉化处理器105可确定接收的音频信号的主角使得麦克风阵列没有最佳地用于记录或捕获音频信号。例如，如果麦克风的物理配备使得他们无法直接接收声波。在这样的实例中，某些方向或方位难以检测并且可被指示，但是在这样的实施例中，指示可能是稳定的并且不变。此外，这样的情形不会因为原始麦克风阵列设计。例如，可建立阻挡的或阴影的区域，其中用户阻挡某些麦克风，例如，在一些实施例中，通过可被检测和指示的手指。类似地，可指示阵列中的故障麦克风。

图6中，通过步骤505示出例如电平确定、或峰值电平确定的至少一个音频参数的计算。

此外，在一些实施例中，音频表征视觉化处理器105可根据例如电平、峰值电平、和方向参数的音频特征生成这些值的视觉化。

图6中，通过步骤507示出视觉化计算。

然后，这些视觉化元素可传递至用户接口显示元件111，向装置的操作者显示。图6中，通过步骤509示出显示音频特征的操作。

对于图3，示出音频参数的视觉化的显示的实例。装置10包括用户接口15，和具体地用户接口显示元件。在用户接口显示器上显示相机捕获的图像，在图像上覆盖了音频特征视觉化201。对于图4，更详细地示出音频特征视觉化的实例。音频特征视觉化201包括声压电平视觉化307，其向装置的用户指示由装置捕获的当前和峰值音量电平。例如，当前音量电平可由第一条长度来指示，以及峰值音量电平可由背景条长度来指示。在一些实施例中，声压电平视觉化也可示出“增益”电平——应用于来自麦克风阵列的接收的音频信号的当前增益。

此外，在一些实施例中，音频特征视觉化包括声音方向性指示符，其提供所捕获的音频信号的方向的指示。在一些实施例中，这可通过指示峰值音量来自哪个方向的罗盘点或向量来指示。在一些实施例中，可通过使用表示音频信号的主频率的不同颜色显示罗盘点，来使用声音方向性指示符以进一步指示记录的声音的频率。

对于图7，示出根据一些实施例的方向性指示符视觉化。示出上述罗盘方向性指示符601，其中罗盘点指示的方向指示峰值功率方向，或在一些实施例中，可通过其他适当方式实现平均功率指示符。在一些实施例中，也可在声音方向性指示符305上指示不同可识别的“声音源”的声音方向性。例如，在这些实施例中，可使用相对线长度来显示声音源的各个相对振幅值，从而在第一方向用长线指示响亮的声音源603a，在各个其他方向用更短的线长度指示两个其他声音源603b和603c。

在一些实施例中，还如图7所示，可将音频电平信息规则扇区，并且在这些显示的扇区的每个中检测和捕获声音电平。4个扇区605a、605b、605c和605d示出来自这些扇区的声音的相对振幅，其中扇区半径的长度取决于在该方向的扇区内的相对音量。

此外，如图7所示，在一些实施例中，扇区可以是不规则形状。图7示出指示第一区域的声音方向性的第一不规则扇区607a；具有更高但更窄概况的第二不规则扇区607b，因此其指示非常本地化的声音源；具有更低音量但是更大外形面积的第三不规则扇区607c，因此其可指示类似宽噪音的声音源。

此外，在一些实施例中，图7中还示出的方向性指示符视觉化示出轮廓组。每个轮廓对应于一定的频率或频带以及从对应于声音电平的中心与电平格/测量有关的距离。

在一些实施例中，音频特征视觉化204还可包括波束成形的概况形式的当前波束成形配置的指示符。例如，如图4所示，波束成形配置指示符303的音频概况特征视觉化示出指示符扇区，其代表圆弧概况形式的由波束成形操作覆盖的概况。例如，波束成形为全向(和360度)的圆弧概况也是360度。在一些实施例中，可显示波束成形方向概况，以例如通过线的厚度或圆弧的面积或通过增益之间的颜色差来显示相对波束成形增益。

在一些实施例中，还对于浏览概况视觉化301示出事件概况特征视觉化。浏览概况视觉化301示出由相机捕获的当前浏览角度，并且可表示为围绕中心视觉化部分的另一圆弧。因此，在一些实施例中，浏览概况视觉化301可依据对相机应用的缩放量来改变，从而缩放越大，浏览角度301越窄。

对于图5，示出音频特征视觉化的另一实例。这个实例中，音频概况特征视觉化303指示波束成形焦点远窄于浏览角度301。此外，对于图5，示出音频视觉化特征可包括可显示警报消息401的文本信息。这个实例中，警报消息指示在音频捕获处理中存在剪辑或声音变形的高可能性。

先前所述的用户接口15还可用于提供输入。例如，使用在用户接口显示器111上显示的音频特征视觉化，例如使用触摸屏，用户可提供随后可控制音频信号处理的输入。

图6中，通过步骤511示出使用用户接口输入113对输入的检测。

例如，在一些实施例中，装置可依据在(声压电平)SPL条指示符307上感测的输入调整增益控制。例如，触控处理器107可检测或确定触摸屏上的输入，其中输入移动并朝向条的底部，通过向波束成形和增益控制处理器101输出增益控制信号使得增益减小，而在检测到输入向上时触控处理器107将通过向波束成形和增益控制处理器101输出增益控制信号向上调整增益。这样的实施例中，用户接口输入可通过触控礼券107来处理，其被配置为在检测到任意适合的识别输入时向波束成形和增益控制处理器101输出相关的控制信号。

图6中，通过步骤513示出增益电平的调整的操作。然后，将通过随后被视觉化的音频特征来反映增益电平的任何调整。

此外，在一些实施例中，通过检测到接近于音频角度指示符的输入，也可改变波束成形概况。例如，在触摸屏上使用“多点触摸”，在检测到多个输入的挤压或打开，触控处理器107可向波束成形和增益控制处理器101输出控制信号，分别缩窄或扩宽波束成形概况。在一些其他实施例中，可使用触控处理器107检测的单独输入，通过向波束成形和增益控制处理器101发送的类似控制信号来改变波束成形的“中心”的方位。

这些实施例中，在检测到指示波束成形改变请求的任何适当输入时，触控处理器107可随后向波束成形和增益控制处理器101输出适当的控制信号，以调整波束成形特征。

图6中，通过步骤517示出波束成形特征的调整。然后，该操作向回循环，以进一步确定音频信号的新电平和峰值电平确定。

此外，在一些实施例中，传感器16可向波束成形和增益控制处理器101提供输入。例如，在一些实施例中，装置可希望保持聚焦于特定音频方向，其方位不同于视频角度方向。例如，在装置记录来自舞台区的方向的音频时，如图3所示，但是随后移动将装置10的角度改变为聚焦于另一人或对象，但是仍旧保持从舞台的音频记录。这样的实施例中，传感器可提供装置的位置或方位的指示，其可用于检测装置的改变并因此控制波束成形操作。

因此，这些实施例中，相机位置的改变可使得波束成形和增益控制处理器101依据传感器值调整浏览角度或波束成形参数，以保持在先前方向的音频记录。方位的这个改变也可通过视觉化处理器105来指示，其中显示浏览角度和音频角度的改变。

此外，可使用相机形式的传感器来控制捕获的音频信号的波束成形和增益控制和/或音频特征的视觉化。例如，在检测到缩放的调整时相机的电平可进一步用作对于波束成形和增益控制处理器101的控制输入。在一些实施例中，若将音频角度关联至浏览角度，当在波束成形中使用更窄角度中的相机缩放时或当相机取消缩放成更宽角度时，波束成形变宽。在其他实施例中，将浏览概况信息传送至音频特征视觉化处理器105，以计算和显示音频和视频概况之间的正确概况关系。

因此，这样的实施例中，可向用户提供足够信息，以作出智能的决定和控制机制，因此避免生成差质量的音频记录。

此外，本申请的实施例图形化示出在装置周围对于“音频图片”发生了什么以及与“音频图片”相关地当前音频记录参数是什么。使用这个信息，该装置可被配置为这样调整例如波束宽度和增益的音频记录参数，从而他们适合于当前记录。

因此，例如，若该装置被操作为记录一大组参与者前方的呈现，该装置可这样操作以使用窄(但是高增益)的波束成形概况捕获近来自参与者的语音，因此避免其他声音源干扰语音的捕获的可能性。

可理解，在一些实施例中，波束成形和增益控制处理器111、和/或特征确定和视觉化处理器105和/或触控处理器107可实现为程序或处理器21的一部分。在一些其他实施例中，以上处理器可实现为硬件。

尽管对于作为增益或波束宽度的参数的控制描述了上述控制方法，但是本领域技术人员可理解，可根据显示的信息改变其他捕获或记录参数。例如，在一些实施例中，可显示信息，并且能够被控制以改变记录模式。记录模式的改变可包括作为频率滤波主页的控制惭怍。例如，当注意到低频率噪声时，该装置可提供建议或允许控制捕获概况对麦克风信号高通滤波。在一些其他实施例中，记录模式的改变可涉及在不同混音之间切换，以基于显示的信息生成一个混音。例如，捕获的立体声信号可能由于噪声电平而不被接受，并且该装置可建议切换至单一信号捕获模式。类似地，若信号电平足以使得多通道音频捕获处理，该装置可通过显示这个信息建议捕获多通道混音，例如5.1音频混音、或2.0立体声混音。

因此，至少一个实施例中，提供一种方法，包括：提供与至少一个音频信号相关的至少一个音频参数的视觉表示；经由接口检测与所述音频参数的视觉表示的交互；以及依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

尽管以上实例描述了在电子设备10或装置中操作的本发明的实施例，但是可理解，以下描述的本发明可实现为任意音频处理器的一部分。因此，例如，本发明的实施例可实现于音频处理器中，其可在固定或有线通信路径的音频处理。

因此，用户设备可包括例如在上述本发明实施例中描述的音频处理器。

可理解，术语“电子设备”和“用户装备”旨在覆盖任意适合类型的无线用户装备，例如移动电话、便携式数据处理设备或便携式web浏览器。

一般地，本发明的各个实施例可实现于硬件或专用电路、软件、逻辑或其任意组合中。例如，某些方面可实现于硬件中，而其他方面可实现于可由控制器、微处理器或其他计算设备执行的估计或软件中，但是本发明不限于此。尽管可将本发明的各个方面示例和描述为框图、流程图、或使用某些其他图形表示，但是可很好地理解，这里所述的这些框图、装置、系统、技术或方法可实现于，作为非限制性实例的硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备、或其某些组合。

因此，概括地，至少一个实施例中提供一种装置，包括：显示器处理器，配置为提供与至少一个音频信号相关的至少一个音频参数的视觉表示；交互视频接口，配置为确定与所述音频参数的视觉表示的交互；以及音频处理器，配置为依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

本发明的实施例可通过移动设备(例如处理器实体中)的数据处理器可执行的计算机软件、或通过硬件、或通过软件和硬件的组合来实现。此外，这个方面，应注意，附图中的逻辑流程的任意方框可代表程序步骤、或互连的逻辑电路、方框和功能、或程序步骤和逻辑电路、方框和功能的组合。软件可存储于这样的物理介质上作为存储器芯片、或处理器中实现的存储器块、例如硬盘或软盘的磁介质、以及例如DVD的光学介质和其数据变形CD。

因此，至少一个实施例包括用在计算机执行时执行以下步骤的指令编码的计算机可读介质，所述步骤包括：提供与至少一个音频信号相关的至少一个音频参数的视觉表示；经由接口检测与所述音频参数的视觉表示的交互；以及依据所述交互处理与所述音频参数相关的所述至少一个音频信号。

存储器可以是适合于本地技术环境的任意类型，并且可使用任意适合数据存储技术来实现，例如基于半导体的存储器设备、闪存、磁存储器设备和系统、光存储器设备和系统、固定存储器和可移动存储器。数据处理器可以是适合于本地技术环境的任意类型，并且可包括作为非限制性实例的通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、门电平电路和基于多核处理器架构的处理器中的一个或多个。

本发明的实施例可在例如集成电路模块的各个组件中实践。集成电路的设计基本上是高度自动化的处理。复杂的和强大的软件工具可用于将逻辑级别的设计转换成准备在半导体基板上蚀刻和形成的半导体电路设计。

程序(例如由Mountain View的Synopsys公司，California、San Jose的California and Cadence Design提供的那些)自动地使用很好建立的设计规则以及预先存储的设计模块的库路由导体和定位组件。一旦完成了半导体电路的设计，可通过标准化的电子格式(例如Opus、GDSII等)将得到的设计发送至半导体制造设施或“工厂”用于制造。

本申请中，术语“电路”指的是如下全部：

(a)仅硬件的电路方案(例如仅逻辑和/或数字电路中的方案)；和

(b)电路和软件(和/或固件)的组合，例如(i)处理器的组合或(ii)处理器/软件(包括数字信号处理器)、软件、和存储器的一部分，他们在一起工作以使得例如移动电话或服务器的装置执行各个功能；和

(c)电路，例如微处理器或微处理器的一部分，其需要软件或固件进行操作，即使软件或固件不物理地存在。

这个“电路”的定义应用于本申请中的这个术语的所有使用，包括任何权利要求。作为进一步实例，如本申请中，术语“电路”还涵盖仅处理器(或多个处理器)或处理器的一部分及其(或他们的)附加软件和/或固件的实现。术语“电路”还涵盖(例如并且如果适用于特定权利要求元素)用于移动电话的基带集成电路或应用处理器集成电路或服务器中的类似集成电路、蜂窝网络设备、或其他网络设备。

以上描述通过示例性和非限制性实例提供了本发明的示例性实施例的完整和信息性的描述。然而，各个修改和改变当接合附图和所附权利要求时在以上实施例的方面对于本领域技术人员可变得清楚。然而，本发明的技术的所有这些和类似修改将仍旧落入所附权利要求定义的本发明的范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：V·M·米吕拉;J·J·马基宁;K·J·耶尔维宁;M·K·卡亚拉
技术所有人：诺基亚技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。