使用波束形成算法来记录信号的方法和设备的制作方法

文档序号：2824574阅读：133来源：国知局

专利名称：使用波束形成算法来记录信号的方法和设备的制作方法
技术领域：
本发明总体构思涉及一种记录信号的设备，更具体地讲，涉及一种使用至少两个麦克风和波束形成算法来记录信号的设备以及使用该设备记录信号的方法。
背景技术：
通常，用于记录诸如音频信号的声音信号的便携式记录或再现设备使用嵌入其中的小麦克风来记录声音信号。因此，记录的声音信号包括大量的周围的噪声，该噪声降低了记录的声音信号的质量。
因此，需要去除周围的噪声的技术。通常，用于去除频谱噪声的设备使用频谱相减方法来去除周围的噪声。
在频谱相减方法中，首先，从麦克风输入的模拟信号被转换为数字信号。然后，在时域内将该数字信号划分为帧。之后，处理帧形式的数字信号以减小帧之间的信息断裂和数字信号的失真。最后，使用快速傅立叶变换(FFT)将该数字信号变换为频率信号。
频率信号的频谱信息包括幅值频谱信息和相位频谱信息。幅值频谱信息在频谱相减方法中使用，相位频谱信息在逆快速傅立叶变换(IFFT)中使用。
在频谱相减方法中，从音频信号和噪声混合在其中的幅值频谱中减去噪声频谱的估计。这里，噪声频谱是在频率信号的噪声区域中的幅值频谱的平均值。
当噪声特性为正常时，噪声频谱的估计类似于实际噪声的频谱。因此，通过应用频谱相减方法而获得的幅值频谱是语音信号的幅值频谱。
例如，假设输入的噪声+音频信号的频谱为Y(w)，噪声频谱的估计为N’(w)，则相减后的信号的频谱为Y(w)-N’(w)。该操作示于图1A和图1B中。
如图1A所示，出现了频谱的幅值为负值的区域。即，如果频谱的幅值小于预定的正阈值110，则该频谱的幅值由预定的正阈值110代替。此操作示于下面的等式(1)中。
如果(Y(w)-N’(w))＞阈值→Y(w)-N’(w)如果(Y(w)-N’(w))＜阈值→阈值 …(1)图1B示出在其中小于预定的正阈值110的频谱的幅值由预定的正阈值110代替的频谱的波形。
然而，如图1B所示，在频谱相减之后，出现了由三条垂直线所指示的孤立的音乐噪声(musical noise)。孤立的音乐噪声被定义为在窄带宽中的相对较低的幅度(level)的频率分量，并且出现较短的时间，然后消失。孤立的音乐噪声听起来像是不规则的机械噪声，特别是当信号具有低的信噪比(SNR)时，孤立的音乐噪声干扰人的听觉。
因此，由于在记录阶段，用于记录信号的传统的便携式设备不能处理与信号一起被记录的不必要的噪声，因此用于记录信号的传统的便携式设备不能去除包括在通过小麦克风记录的信号中的不期望的声音或噪声。因此，记录的信号的质量非常差，包括了很多噪声。另外，即使在用于记录信号的传统的便携式设备中使用去噪技术，在记录的信号中仍将残存音乐噪声。

发明内容
本发明总体构思提供一种在使用至少两个麦克风的便携式设备中记录音频信号的方法，其中，在记录阶段使用波束形成算法从音频信号中去除噪声。
本发明总体构思还提供一种使用上述的记录音频信号的方法来记录信号的设备。
本发明总体构思的另外的方面和优点将部分地在下面的描述中被阐述，并且部分地将从该描述中变得明显，或者可通过实施本发明总体构思而了解。
本发明总体构思的上述和/或其他方面可通过提供一种记录音频信号的方法来实现，该方法包括以下步骤将多个麦克风设置在多个预定的位置处，以当接收到从声源输出的声音信号时产生音频信号；通过调整由所述多个麦克风的每个接收的音频信号的延迟和幅度(level)来从音频信号形成波束；和由用户调整波束的角度和宽度。
本发明总体构思的上述和/或其他方面还可通过提供一种记录音频信号的设备来实现，该设备包括多个麦克风，位于预定的位置处，用于当接收到声音信号时产生音频信号；波束形成单元，通过调整所述麦克风的每个音频信号的延迟和幅度来从音频信号形成波束；显示单元，显示在波束形成单元中形成的波束的波束图案；和波束角度和/或宽度调整单元，传送与从波束形成单元输出的波束的角度和宽度调整值相应的音频信号的每个的延迟值和幅度值。
本发明总体构思的上述和/或其他方面还可通过提供一种记录音频信号的设备来实现，该设备包括多个麦克风，用于从声源接收声音信号，并产生与各声音信号相应的音频信号；波束形成单元，用于根据音频信号的预定的延迟值和幅度值中的相应的延迟值和幅度值来调整音频信号；和记录单元，用于记录从调整的音频信号形成的信号。
本发明总体构思的上述和/或其他方面还可通过提供一种记录信号的方法来实现，该方法包括从声源接收声音信号并产生与各声音信号相应的音频信号；根据音频信号的预定的延迟值和幅度值中的相应的延迟值和幅度值来调整音频信号；和记录从调整的音频信号形成的信号。
本发明总体构思的上述和/或其他方面还可通过提供一种具有可执行代码的计算机可读存储介质而实现，该可执行代码用于执行一种记录音频信号的方法，该方法包括从声源接收声音信号并产生与各声音信号相应的音频信号；根据音频信号的预定的延迟值和幅度值中的相应的延迟值和幅度值来调整音频信号；和记录从调整的音频信号形成的信号。
本发明总体构思的上述和/或其他方面还可通过提供一种具有可执行代码的计算机可读存储介质而实现，该可执行代码用于执行一种记录音频信号的方法，该方法包括将多个麦克风设置在多个预定的位置处，以当接收到从声源输出的声音信号时产生音频信号；通过调整所述多个麦克风的每个的音频信号的延迟和幅度来从音频信号形成波束；和由用户调整波束的角度和宽度。

从下面结合附图对实施例的描述，本发明总体构思的这些和/或其他方面和优点将变得更加清楚，附图中图1A和图1B通过显示由传统的设备记录的包括噪声的音频信号的频谱、以及在从该音频信号的频谱中减去噪声频谱之后的频谱来示出频谱相减方法；图2是根据本发明总体构思的实施例的使用波束形成算法来记录信号的设备的示图；图3是图2的设备的前视图；图4是图2的设备的方框图；图5A显示由图2的设备的麦克风产生的音频信号的波形和延迟时间；图5B是图4的设备的波束形成单元的详细的示图；图6A和图6B是图4的设备的波束形成单元的波束形成图案的示图；和图7是示出根据本发明总体构思的实施例的使用波束形成算法来记录信号的方法的流程图。
具体实施例方式
现在，将详细说明本发明总体构思的实施例，其例子示于附图中，在附图中相同的标号始终表示相同的部件。下面，将参照附图描述这些实施例以解释本发明的总体构思。
图2是根据本发明总体构思的实施例的使用波束形成算法来记录信号的设备210的示图。
参照图2，设备210包括麦克风阵列，并采用波束形成算法来接收与方向性噪声或背景噪声混合的音频信号并从接收的音频信号去除噪声。波束形成算法是一种具有高灵敏度的去噪方法。麦克风阵列可包括依照预定的几何排列安装在设备210中的四个麦克风M1、M2、M3和M4，用于从声源接收音频信号。所述声源可被设置在与设备210相距较远的位置。用户可调整在记录操作中使用的麦克风的数量和麦克风的位置，以获得声源的较好的聚焦。该设备可以是录音设备、运动图像专家组音频层3(MP3)播放器等。
波束形成算法可通过给麦克风阵列施加合适的加权量并将期望的声音信号放大，来减小当期望的声音信号的方向与噪声信号的方向不同时的空间相干噪声。
麦克风M1、M2、M3和M4被置于与声源相距不同距离的位置。因此，由声源产生的声波在不同的时间段后到达麦克风M1、M2、M3和M4的每一个。因此，当声源的位置已知时，通过计算麦克风的声波的到达时间之间的差异并补偿声波的延迟，可使麦克风M1、M2、M3和M4的每个的波形匹配。麦克风M1、M2、M3和M4从声源接收声波并产生音频信号。
参照图2，由于麦克风M1、M2、M3和M4的音频信号之间的相位差异，经麦克风M1、M2、M3和M4输入的音频信号的每个具有时间差异(即，延迟时间)。由于声波传播时间随着与声源之间的距离的不同而不同，所以该时间差异出现。音频信号的每个的振幅随着延迟时间而变化。因此，通过调整经麦克风M1、M2、M3和M4输入的音频信号的每个的延迟时间和幅度(level)，可调整指示声源所在的记录区域的波束。可通过选择所述波束的角度和宽度来指示该记录区域。
图3是图2的设备210的前视图。
参照图3，设备210包括四个麦克风M1、M2、M3和M4、公共声音再现按钮320、用于调整波束的调整按钮330和用于显示波束的波束显示窗口340。
公共声音再现按钮320用于选择在存储器中记录声音或从存储器再现声音。用于调整波束的按钮330经调整按钮(+、-、R、L和ENTER)来调整波束的角度和宽度。这里，调整的波束的角度和/或宽度被显示在波束显示窗口340中。波束显示窗口340除了显示与波束调整有关的同屏显示(OSD)之外还显示表示记录区域的波束图。
图4是图2的设备210的方框图。设备210包括依照预定的几何排列安装在设备210上的麦克风M1、M2、M3和M4、波束形成单元410、波束角度调整按钮420、波束宽度调整按钮430、显示单元440、噪声消除单元450、和编码单元460。噪声消除单元450是可选的。这里，麦克风M1、M2、M3和M4的位置是固定的。然而，通过还包括麦克风有效和/或无效开关，可调整在记录操作中使用的麦克风的数量。
波束形成单元410通过麦克风M1、M2、M3和M4的每个来接收音频信号，计算通过麦克风M1、M2、M3和M4输入的音频信号之间的相关，并为音频信号的每一个计算延迟时间。在计算的延迟时间中考虑由波束角度调整按钮420和波束宽度调整按钮430输入的参考延迟和幅度值，从而调整音频信号的每一个的延迟时间和幅度并通过组合音频信号来形成波束。
波束角度调整按钮420通过调整波束形成单元410的音频信号的每个的延迟时间来调整波束的角度。
波束宽度调整按钮430通过调整波束形成单元410的音频信号的每个的延迟时间和幅度来调整波束的宽度。即，可根据参考延迟时间和幅度值来计算和/或调整波束的角度和宽度。
显示单元440显示由波束形成单元410形成的波束图案。另外，显示单440显示由波束角度调整按钮420和波束宽度调整按钮430调整的波束图案。
噪声消除单元450使用诸如频谱相减方法的噪声消除算法来去除包括在从波束形成单元410输出的音频信号中的噪声分量。
编码单元460将从噪声消除单元450输出的声源信号编码为预定的压缩格式，该声源信号通过波束形成算法和噪声消除算法从其中去除了噪声。
最后，由编码单元460编码的信号被记录在诸如存储器的记录介质中。
图5A显示根据本发明总体构思的实施例在接收到与各个音频信号对应的各个波(声音信号)之后由麦克风M1、M2、...、Mi产生的音频信号的波形和延迟时间。
参照图5A，从声源发出的声音信号在不同的传播时间内传播到麦克风阵列的麦克风M1、M2、…、Mi。从声源发出的声音信号传播不同的距离后到达麦克风，从而被延迟。在时间Δ1来自麦克风M1的第一音频信号与第一声音信号对应，在时间Δ2来自麦克风M2的第二音频信号与第二声音信号对应，并且由于麦克风M2距离声源比麦克风M1远，因此Δ2＞Δ1。因此，分别由第一麦克风M1和第二麦克风M2产生的第一音频信号和第二音频信号具有时间差Δ2-Δ1。
图5B是图4的设备的波束形成单元410的详细的示图。
参照图5B，延迟处理单元530被连接到多个麦克风M1、M2、...、Mi，并从麦克风M1、M2、...、Mi的每个接收音频信号。延迟处理单元530确定通过麦克风M1、M2、...、Mi输入的音频信号之间的相关，为音频信号的每一个计算延迟时间，并根据计算的延迟时间延迟音频信号的每一个。另外，当用户输入与波束的角度和/或宽度调整相应的延迟和/或幅度值时，延迟处理单元530调整音频信号的每一个的延迟和幅度。
加法单元540将延迟和/或幅度被调整的音频信号的每一个相加，并形成波束，该波束指示在其中与音频信号对应的波形将被接收的区域。即，该波束的每个波束图案的形状表示由麦克风接收的音频信号的区域。
图6A和图6B是图4中所示的波束形成单元410的波束形成图案的示图。
参照图6A和图6B，波束的角度和宽度可随着在记录操作中使用的麦克风的数量而变化。另外，用户可通过根据麦克风相对于声源的位置或设备210的位置调整音频信号的延迟时间以及音频信号的幅度，来改变波束的角度和宽度。
图7是示出根据本发明总体构思的实施例的使用波束形成算法来记录信号的方法的流程图。
首先，接收从声源输出的信号并产生音频信号的多个麦克风被设置在记录和/或再现设备上(操作712)。
然后，确定用户是否按下用于调整波束的按钮330(操作732)。
然后，如果用户按下用于调整波束的按钮330，则从声源输出的信号被输入到麦克风的每一个(操作734)。
这里，检查是否接收到由波束角度调整按钮420或波束宽度调整按钮430输出的信号(操作714)。如果接收到由波束角度调整按钮420或波束宽度调整按钮430输出的信号，则设置与波束的角度和/或宽度对应的、将被施加到每一个音频信号的延迟时间和幅度值(操作716)。
然后，由每个麦克风输入的音频信号被延迟并被相加以形成波束。这里，通过根据与波束的角度和/或宽度对应的信号的所述延迟和幅度值补偿输入至每个麦克风的信号的延迟和幅度，来调整波束的角度和宽度，所述波束指示相对于声源接收和产生音频信号的记录区域(操作736和操作738)。
然后，确定是否另外采用诸如频谱相减的噪声消除算法(操作742)。这里，如果采用了噪声消除算法，则诸如频谱相减的噪声消除操作被执行以进一步减小噪声(操作744)。即，音频信号从波束形成单元410输出到噪声消除单元450，以从该音频信号去除噪声。
通过波束形成算法和噪声消除算法去除了噪声的音频信号被编码为预定的压缩格式(操作746)。
编码的音频信号被记录在诸如存储器的记录介质中(操作748)。
根据如上所述的本发明总体构思，通过在嵌入记录功能的用于记录或再现信号的便携式设备中采用波束形成算法，在记录阶段，除了作为记录对象的声源的信号之外，周围的不需要的声音和噪声被消除。另外，通过另外使用除了波束形成算法之外的噪声消除算法，记录的信号的不需要的噪声被进一步减小。此外，用户可根据产生将被记录的声音的声源的位置来调整指示记录区域的波束的方向和宽度。
尽管已参照其示例性实施例具体地显示和描述了本发明的总体构思，但是本领域的普通技术人员将理解，在不脱离权利要求所限定的本发明总体构思的精神和范围的情况下，可进行各种形式和细节上的改变。
本发明总体构思还可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是任何可存储可随后被计算机系统读取的数据的数据存储装置。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置和载波(如通过互联网的数据传输)。计算机可读记录介质还可分布在连接到计算机系统的网络之上，从而该计算机可读代码可以以分布式方式被存储和执行。
尽管已显示和描述了本发明总体构思的几个实施例，但是本领域的技术人员将理解，在不脱离权利要求所限定的本发明总体构思的精神和范围的情况下，可在这些实施例中进行改变。
权利要求
1.一种记录音频信号的方法，包括通过设置在预定的位置处的多个麦克风的每个来接收音频信号；通过调整经所述多个麦克风的每个接收的音频信号的延迟和幅度，从通过所述多个麦克风的每个接收的音频信号形成波束；和由用户调整所述波束的角度和宽度。
2.如权利要求1所述的方法，其中，在调整所述波束的角度和宽度的步骤中，由用户调整经所述多个麦克风的每个接收的每个音频信号的延迟和幅度。
3.如权利要求1所述的方法，其中，所述形成波束的步骤包括使用通过所述多个麦克风的每个接收的音频信号来计算相关；计算通过所述多个麦克风的每个接收的音频信号之间的延迟时间；通过在计算的延迟时间中考虑由用户输入的延迟值和幅度值，来补偿通过所述多个麦克风的每个接收的音频信号的延迟和幅度；和将通过所述多个麦克风的每个接收的音频信号相加。
4.如权利要求1所述的方法，其中，所述多个麦克风被设置于设备上预定的位置处。
5.一种用于记录音频信号的设备，包括多个麦克风，位于预定的位置处，用于当接收到声音信号时产生音频信号；波束形成单元，通过调整所述麦克风的每个音频信号的延迟和幅度来从所述音频信号形成波束；显示单元，显示在波束形成单元中形成的波束的波束图案；和波束角度和/或宽度调整单元，传送与从波束形成单元输出的波束的角度和宽度调整值相应的音频信号的每个的延迟值和幅度值。
6.如权利要求5所述的设备，还包括麦克风有效/无效开关，控制所述多个麦克风使其选择性地打开和关闭。
7.如权利要求5所述的设备，其中，所述波束形成单元包括延迟处理单元，计算由所述多个麦克风的每个产生的音频信号之间的相关，然后计算音频信号之间的延迟时间，并通过在计算的延迟时间中考虑由用户输入的延迟值和幅度值来补偿每个音频信号的延迟和幅度；和加法单元，将在延迟处理单元中延迟的音频信号相加，并形成指示从其接收声音信号的声源的区域的波束。
8.如权利要求5所述的设备，还包括噪声消除单元，从由波束形成单元输出的音频信号去除噪声。
9.如权利要求5所述的设备，其中，所述角度和/或宽度调整单元包括波束角度调整按钮，在波束形成单元中调整由所述麦克风的每个产生的音频信号的延迟；和波束宽度调整按钮，在波束形成单元中调整由所述麦克风的每个产生的音频信号的延迟和幅度。
10.一种记录信号的设备，该设备包括多个麦克风，用于从声源接收声音信号，并产生与各声音信号相应的音频信号；波束形成单元，用于根据各音频信号的预定的延迟值和幅度值中的相应的延迟值和幅度值来调整音频信号；和记录单元，用于记录从调整的音频信号形成的信号。
11.如权利要求10所述的设备，还包括显示单元，用于显示表示延迟值和幅度值的波束。
12.如权利要求11所述的设备，还包括用户接口，允许用户通过输入波束的波束角度和波束宽度的值来指示声源相对于所述多个麦克风的位置。
13.如权利要求12所述的设备，其中，所述显示单元包括显示波束形状的窗口，该波束具有与所述位置、延迟值和幅度值相应的波束角度和波束宽度。
14.如权利要求10所述的设备，还包括预记录处理单元，用于从调整的音频信号所形成的信号过滤噪声。
15.如权利要求14所述的设备，其中，所述预记录处理单元通过应用频谱相减方法来过滤噪声。
16.如权利要求10所述的设备，还包括用于压缩所述信号的编码单元，其中，所述记录单元记录压缩的信号。
17.如权利要求10所述的设备，还包括用户接口，允许用户从所述多个麦克风中选择使用至少两个麦克风。
18.如权利要求10所述的设备，还包括用户接口，允许用户选择将被使用的麦克风的数量。
19.如权利要求10所述的设备，还包括用户接口，包括与所述多个麦克风相应的多个开关，用于允许用户打开/关闭任何麦克风。
20.一种记录信号的方法，该方法包括从声源接收声音信号并产生与接收的声音信号相应的音频信号；根据所述音频信号的预定的延迟值和幅度值中的相应的延迟值和幅度值来调整所述音频信号；和记录从调整的音频信号形成的信号。
21.一种具有可执行代码的计算机可读存储介质，该可执行代码用于执行一种记录音频信号的方法，该方法包括从声源接收声音信号并产生与各声音信号相应的音频信号；根据所述音频信号的预定的延迟值和幅度值中的相应的延迟值和幅度值来调整所述音频信号；和记录从调整的音频信号形成的信号。
22.如权利要求21所述的具有可执行代码的计算机可读存储介质，该可执行代码用于执行一种记录音频信号的方法，该方法还包括在记录之前，使用频谱相减方法从音频信号中过滤不需要的噪声。
23.如权利要求21所述的具有可执行代码的计算机可读存储介质，该可执行代码用于执行一种记录音频信号的方法，该方法还包括在记录之前压缩音频信号。
24.一种具有可执行代码的计算机可读存储介质，该可执行代码用于执行一种记录音频信号的方法，该方法包括将多个麦克风设置在多个预定的位置处，以当接收到从声源输出的声音信号时产生音频信号；通过调整所述多个麦克风的每个的音频信号的延迟和幅度来从音频信号形成波束；和由用户调整波束的角度和宽度。
全文摘要
一种使用波束形成算法来记录由至少两个麦克风接收的音频信号的方法和设备。该方法包括将多个麦克风设置在多个预定的位置处，以当接收到从声源输出的声音信号时产生音频信号；通过调整所述多个麦克风的每个的音频信号的延迟和幅度来从音频信号形成波束；和由用户调整波束的角度和宽度。
文档编号G10L21/02GK1805278SQ20051012420
公开日2006年7月19日申请日期2005年11月21日优先权日2005年1月14日
发明者高由卿, 李俊弦, 高秉燮申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高由卿;李俊弦;高秉燮
技术所有人：三星电子株式会社
我是此专利的发明人

上一篇：自动控制输入等级的语音识别系统及语音识别方法
上一篇：用户界面设计装置和方法