用于基于扬声器位置信息处理音频信号的方法和设备与流程

文档序号:12162745阅读:290来源:国知局
用于基于扬声器位置信息处理音频信号的方法和设备与流程

技术领域

与示例性实施例一致的设备和方法涉及一种用于基于输出音频信号的扬声器的位置信息处理音频信号的方法和设备。



背景技术:

音频系统可以通过如5.1声道、2.1声道和立体声的多个声道输出音频信号。可以基于输出音频信号的扬声器的位置来处理或输出音频信号。

但是,扬声器的位置可从音频信号被处理时所参照的它们的原始位置改变。换句话说,由于扬声器的移动性,根据扬声器被安装的周围环境,扬声器的位置可以可以不被固定。因此,在扬声器的位置变化时,音频系统可能在向收听者提供高质量的音频信号方面存在问题,这是因为在没有考虑扬声器的当前位置的情况下处理音频信号。



技术实现要素:

一个或更多个示例性实施例提供一种用于根据扬声器信息适应性地处理音频信号,特别地,用于基于输出音频信号的扬声器的位置信息处理音频信号的方法和设备。

根据示例性实施例的一个方面,一种处理音频信号的方法包括:获取被配置为输出音频信号的扬声器的位置信息和性能信息;基于位置信息选择频带;基于性能信息,从关于音频信号的选择的频带确定将被增强的区间;以及对确定的区间应用增益值。

对频带的选择可以包括:基于收听者的位置,确定中心轴;以及基于扬声器和中心轴之间的线性距离,选择频带。

应用增益值可以包括:基于收听者的位置,确定中心轴;以及基于扬声器和中心轴之间的距离,确定增益值。

所述方法还可包括:基于位置信息,确定参数;以及使用确定的参数处理音频信号。所述参数可包括用于基于扬声器的位置信息校正音频信号的声像的声级的增益和用于基于扬声器的位置信息校正音频信号的声像的相位差的延迟时间中的至少一个。

在提供多个扬声器时,参数还可包括用于校正音频信号的声像的方向的平移增益。

所述方法还可包括:获取时域中的帧之间的音频信号的能量变化;根据能量变化确定帧的增益值;以及对与帧相应的音频信号的部分应用确定的增益值。

所述方法还可包括:基于被应用增益值的区间来检测发生了掩蔽的区间;以及对音频信号的被检测到的区间应用增益值,使得音频信号的与被检测到的区间相应的部分具有大于或等于掩蔽阈值的值。

应用增益值可以包括:从音频信号提取非单声道信号;基于非单声道信号的最大值来确定增益值;以及对音频信号应用确定的增益值。

根据另一示例性实施例的一个方面,一种音频信号处理可设备包括:接收器,被配置为获取被配置为输出音频信号的扬声器的位置信息和性能信息;控制器,被配置为基于位置信息选择频带,基于性能信息从关于音频信号的选择的频带确定将被增强的区间,并且对确定的区间应用增益值;以及输出单元,被配置为输出由控制器处理的音频信号。

附图说明

根据下面的结合附图对示例性实施例的描述,以上和/或其它方面将变得明显并且更加容易被认识到,在附图中:

图1是示出根据示例性实施例的音频系统的示例的视图;

图2是示出根据示例性实施例的处理音频信号的处理的示例的视图;

图3是示出根据示例性实施例的基于扬声器位置信息处理音频信号的方法的流程图;

图4是示出根据示例性实施例的扬声器的示例性布置的示例性视图;

图5是示出根据示例性实施例的根据频带放大音频信号的示例的曲线图;

图6是示出根据示例性实施例的多个扬声器的示例性布置的示例的视图;

图7是根据示例性实施例的根据能量变化处理音频信号的方法的流程图;

图8是示出根据示例性实施例的根据能量变化处理音频信号的示例的视图;

图9是根据示例性实施例的基于非单声道信号的幅度处理音频信号的方法的流程图;

图10是示出根据示例性实施例的基于非单声道信号的幅度处理音频信号的方法的框图;

图11是示出根据示例性实施例的在掩蔽的中高频带中放大音频信号的示例的示例性视图;以及

图12是示出根据示例性实施例的音频信号处理设备的框图。

具体实施方式

现在将详细地参考实施例,其示例在附图中被示出。但是,为了避免不必要地模糊本发明的主题,将省略关于公知的功能或配置的详细描述。另外,应该注意,在整个说明书和附图中,相同的附图标记表示相同的元件。如本文中使用的,术语“和/或”包括相关列举项目中的一个或更多个的所有的任何组合。诸如在一列元件之后使用的“…中的至少一个”的表述修饰整列元件,并且不修饰该列中的各个元件。

说明书和权利要求中所用的术语或词语不被解释为局限于典型的或字典含义,但是,应该被解释为具有与基于如下原则的本发明的技术思想对应的含义和构思:发明人可以在最佳的方法中适当地定义描述他或她的发明的术语的构思。因此,说明书中描述的实施例和附图所示的配置并不表示本发明的技术思想,而仅仅是示例性的实施例。因此,应该理解,可以存在在提交时可替换的各种等同物和修改。

同样地,附图中的一些元件被放大或省略,并且,每个元件不必一定是按比例的。因此,本发明不局限于附图所示的相对尺寸或间隔。

此外,当一个部件被提及为“包括(或包含或具有)”其它元件时,应当这样理解,它可以只包括(或包含或具有)那些元件或者包括(或包含或具有)其它元件和那些元件,除非另有具体描述。在本公开中,当一个部件(或元件、装置等)被提及为与另一个部件(或元件、装置等)“连接”时,应当这样理解,前者可以与后者“直接连接”或者经由中间部件(或元件、装置等)与后者“电连接”。

除非另有明确说明,单数形式包括复数指示物。在本说明书中,应该这样理解,诸如“包含”、“具有”和“包括”之类的术语意图指示本说明书中公开的特征、数字、步骤、动作、组件、部件或其组合的存在,并不意图排除一个或更多个其他的特征、数字、步骤、动作、组件、部件或其组合可能存在或可能被添加的可能性。词语“示例性”在本文中用于表示“用作示例或示意”。本文中描述为“示例性”的任意方面或设计不必被解释为优选或优于其它方面或设计。

本文所用的术语“单元”表示软件或硬件组件,例如,现场可编程门阵列(FPGA)或专用集成电路(ASIC),并且,“单元”可执行任何角色。但是,“单元”并不限于软件或硬件。“单元”可被配置在可寻址的存储介质中或者执行一个或更多个处理器。因此,作为一个示例,“单元”可包括元件(如软件元件,面向对象的软件元件,类元件和任务元件)、进程、函数、属性、过程、子例程、程序代码段、驱动程序、固件、微代码、电路、数据、数据库、数据结构、表、数组和变量。此外,在元件和“单元”中提供的功能可以被组合为更小量的元件和“单元”,或者进一步被分成另外的元件和“单元”。

另外,在本公开中,音频对象是指音频信号中包括的每个声音分量。各种音频对象可以被包括在一个音频信号中。例如,通过记录现场管弦乐队表演产生的音频信号包括从如吉他、小提琴、双簧管等多个乐器产生的多个音频对象。

另外,在本公开中,声像是指收听者感觉到从该处产生声源的位置。实际的声音是从扬声器输出的,但是,每个声源虚拟聚焦的点被称为声像。声像的大小和位置可以取决于输出声音的扬声器而变化。当来自声源的声音的位置明显并且收听者可分开地、清楚地听见来自声源的声音时,可认为声像定位非常好。可能存在作为收听者可感觉到从该处产生每个音频对象的声源的地方的声像。

在下文中,将参照附图详细地描述本公开的示例性实施例,使得本领域的技术人员可以容易地实现这些实施例。但是,本发明可以许多不同的形式实施,并且不应该被解释为局限于本文中所产述的实施例。在附图中,为了清楚起见,将省略与示例性实施例的描述无关的部分。而且,相同的附图标记始终表示相同的元件。

在下文中,将参照附图描述本发明的示例性实施例。

图1是示出根据示例性实施例的音频系统的示例的视图。

如图1所示,输出音频信号的扬声器111可以被定位在收听者周围。扬声器111可以输出由音频信号处理设备处理的音频信号。在扬声器是具有良好的移动性的装置(例如,无线扬声器)时,扬声器111的位置可以实时地改变。根据实施例的音频信号处理设备可以感测到扬声器111的位置的变化,并且,可以基于关于改变的位置的信息处理音频信号。音频信号处理设备可以根据扬声器111的位置的变化适应性地处理音频信号。

参照图1的附图标记110,扬声器111可以与多媒体装置112连接来充当低音炮。低音炮可以输出通过多媒体装置112或其他扬声器难以输出的低频带音频信号。低频带音频信号通过低音炮被增强和输出。因此,可以更有效地表示音频信号的立体效果、体积感、重量感和宏伟感。在扬声器111充当低音炮的条件下,当从扬声器111输出的低频带音频信号的方向感没有被适当地识别时,可以更有效地识别上述的立体效果、体积感、重量感和宏伟感。随着输出音频信号的频率下降,方向感没有被适当地识别。但是,从扬声器111增强和输出的音频信号的频带宽变窄,因此,可能难以适当地实现通过增强和输出低频带音频信号而产生的效果。

例如,在具有一般大小的房间或客厅中,收听者难以识别关于扬声器111的位置的80Hz以下的音频信号的输出方向。但是,在从扬声器111增强和输出80Hz以下的音频信号时,可以适当地实现通过增强和输出低频带音频信号而产生的声音效果。

参照附图标记120,可以从扬声器111输出比附图标记110高的频带的音频信号。附图标记120中从扬声器111输出的音频信号的方向感可能比附图标记110中从扬声器111输出的音频信号的方向感容易被收听者识别。由于扬声器111更靠近收听位置的前方被定位,所以音频信号更靠近收听者的前方被输出。因此,可以减少收听者感觉到的方向感。另外,当扬声器111被定位到收听位置的左边或右边时,可以根据扬声器111的位置强烈地识别从扬声器111输出的输出信号的方向。

因此,根据示例性实施例的音频信号处理设备可以根据扬声器111的位置信息来选择音频信号意图被放大的频带。例如,可以基于根据收听位置确定的扬声器111和中心轴之间的线性距离来选择音频信号的频带。该设备可以确定与音频信号的选择的频带对应的区间并可以对该区间应用增益值。通过对根据扬声器111的位置信息确定的音频信号的区间应用增益值并然后输出音频信号,可以优化通过增强和输出低频带音频信号而产生的声音效果。

可以基于收听者的移动装置(例如,智能电话)的位置来确定收听者的位置。但是,本公开的实施例并不局限于此。收听者的位置可以基于例如可穿戴装置、个人数字助理(PDA)终端等各种终端装置被确定。

图2是示出根据示例性实施例的处理音频信号的处理的示例的视图。图2的处理可以由上述的音频信号处理设备实现。

参照图2,音频信号处理处理可以包括分析系统和音频信号的处理210、确定要增强的频带和增益的处理220和应用增益的处理230。

在处理210中,该设备可以分析输出音频信号和音频信号的配置信息的系统。例如,该设备可以获取输出音频信号的扬声器的位置信息和性能信息。扬声器的性能信息可以包括关于可以由每个扬声器输出的音频信号的频带和幅度的信息。音频信号的配置信息可以包括关于音频信号的频带和幅度的信息。

该设备可以基于扬声器的性能信息检测不是由扬声器输出的音频信号的频带,并且可以基于检测到的频带的音频信号放大另一个频带的音频信号。例如,该设备可以通过不是由扬声器输出的频带的音频信号的幅度放大另一个频带的音频信号,并且可以输出放大的音频信号。

在处理220中,该设备可以确定要增强的频带并可以确定要应用于与确定的频带对应的音频信号的增益。该设备可以基于在分析系统和音频信号的处理210中获取的扬声器的位置信息来选择要放大的频带。另外,该设备可以基于扬声器位置信息确定增益或者获取确定的增益值。

例如,该设备可以基于扬声器位置信息选择频带和获取要应用于选择的频带的增益值。该设备可以选择要放大的音频信号的频带,使得可以优化地输出低频带音频信号。

另外,该设备可以基于扬声器位置信息获取要应用于从扬声器输出的音频信号的增益值,而没有选择频带。该设备可以基于扬声器位置信息获取增益值,使得音频信号的声像可以被定位到参考位置。

在处理230中,该设备可以对音频信号应用在处理220中确定的增益。另外,在对音频信号应用在处理220中确定的增益之后,该设备可以分析要应用增益的音频信号并根据分析的结果校正音频信号。

例如,该设备可以获取时域中的音频信号的能量变化,并且,还可以基于音频信号的能量变化确定要应用于音频信号的增益。该设备可以通过对音频信号应用基于能量变化确定的增益来校正音频信号,以增强冲击(力量)感。

另外,该设备可以从音频信号提取非单声道音频信号,并且,可以基于非单声道音频信号来确定要应用于音频信号的增益。非单声道信号是通过从立体信号去除单声道信号而获得的信号,并且,可以包括除语音以外的声音,例如,背景声音、声音效果等。当低频带音频信号具有比非单声道信号中包括的背景声音或声音效果小的幅度时,该设备可以根据非单声道信号的幅度放大低频带音频信号,以增强低频带中的背景声音或声音效果。另外,由于与原始音频信号分开的非单声道信号具有比原始音频信号小的幅度,所以在基于非单声道信号的幅度确定增益时,可以减少削波的可能性。

另外,该设备可以比较低频带音频信号的幅度和高频带音频信号的幅度,以校正高频带音频信号的幅度。当特定的低频带的音频信号具有比高频带音频信号更大的幅度时,特定的高频带的音频信号可以通过增强低频带信号由低频带音频信号掩蔽。在发生掩蔽时,在对应的高频带的音频信号不能被适当地听见的同时,可以输出音频信号。因此,该设备可以通过对高频带音频信号应用预定的增益值来进行放大,使得高频带音频信号没有被掩蔽。

图3是示出根据示例性实施例的基于扬声器位置信息处理音频信号的方法的流程图。

参照图3,在步骤S310中,音频信号处理设备可以获取将输出音频信号的扬声器的位置信息。例如,扬声器位置信息可以包括具有收听位置作为原点的坐标信息或者角度和距离信息。当存在将输出音频信号的多个扬声器时,该设备可以获取多个扬声器的位置信息。

在步骤S320中,音频信号处理设备可以基于在步骤S310中获取的位置信息来选择要放大的频带。如上所述,可以容易地识别高频带音频信号的方向感。但是,在要放大的频带窄时,由低频带音频信号的放大产生的效果可能无法适当地发生。因此,该设备可以根据扬声器位置信息选择通过低频带音频信号的放大产生的效果可以优化地发生的频带,并且,可以放大选择的频带的音频信号。

例如,该设备可以基于根据收听位置确定的扬声器和中心轴之间的线性距离来选择意图要放大的音频信号的频带。随着扬声器和中心轴之间的线性距离或者扬声器和中心轴之间的角度增大,作为用于选择频带的标准的截止频率可以降低。该设备可以基于截止频率选择频带。例如,该设备可以选择可放大音频信号的最小频率和截止频率之间的区间作为意图要放大的音频信号的频带。

在步骤S330中,该设备可以从在步骤S320中选择的音频信号的频带确定要增强的区间,并且在步骤S340中可以通过对确定的区间应用增益值来放大选择的频带的音频信号。在步骤S340中应用的增益值可以是预定的值,或者,可以基于音频信号和扬声器性能信息来被确定。

例如,可以根据扬声器性能信息确定每个频带的音频信号的最大幅度。在被应用了增益值的音频信号具有比可以由扬声器输出的音频信号的最大幅度大的幅度时,可以发生削波,从而降低声音质量。因此,该设备可以取决于音频信号的频带不同地确定增益值来防止削波。

另外,可以基于扬声器位置信息来确定增益值。随着基于收听位置确定的扬声器和中心轴之间的线性距离增大,可以确定增益值也增大。

图4是示出根据示例性实施例的扬声器的布置的示例的视图。

参照图4,可以相对于收听者420的位置获取扬声器440的位置信息。多媒体装置410可以位于收听者420的位置的前方。但是,图4所示的多媒体装置410的位置仅仅是一个示例,并且,多媒体装置410可以位于另一个方向上。

音频信号处理设备可以具有用于基于扬声器位置信息放大低频带音频信号的滤波函数。该设备可以通过使用滤波函数来提高音频信号的声音质量。通过滤波函数处理的音频信号可以通过扬声器440被优化和输出。音频信号可以针对每个音频对象由不同的滤波器处理并随后被输出。

音频信号处理设备可以获取扬声器440的位置信息,以便确定滤波函数的参数。扬声器440的位置信息可以被实时地获取或者可以在感测到扬声器440的移动时被改变和获取。无论何时改变扬声器440的位置,该设备可以确定滤波函数的参数,使用滤波函数处理包括确定的参数的音频信号,然后输出处理的音频信号。

扬声器440的位置信息可以包括具有收听位置作为原点的坐标值(即,笛卡尔坐标),或者,包括基于收听者420的位置的扬声器440的角度信息和距离信息(即,极坐标)。例如,扬声器440的位置信息可以包括基于收听者420的位置的关于离扬声器的距离的信息和关于收听者420的方向和扬声器之间的角度的信息。当扬声器440的位置信息是坐标值时,该坐标值可以被转换为关于收听者420的位置的上述的距离信息和角度信息。例如,在扬声器440的坐标值是(xR,yR)时,扬声器440的位置信息可以被转换为θR=π/2-tan-1(yR/xR)的角度值和rR=yR/cosθ的距离值。

音频信号处理设备可以求解用于校正滤波函数的参数并使用基于扬声器440的位置信息的参数来校正滤波函数。

可以使用下式1基于扬声器440的位置信息来获取根据示例性实施例的用于放大低频带音频信号的滤波函数的参数Filterlow(FcR),GLR))。在式1中,AF,BF,A和B是常数值。

[式1]

Fc=AFrR sin(θR)+BF

G(θR)=ArR sin(θR)+B

Fc可以对应于上述的截止频率,并且,G可以对应于增益值。可以基于扬声器和居中于收听者420的位置的中心轴430之间的线性距离来确定Fc和G。可以取决于Fc的最小值和最大值来确定AF和BF。AF可以被确定为负值,从而可以与作为中心轴430和扬声器之间的线性距离的rRsin(θR)成反比地确定Fc。另外,A和B可以取决于G的最小值和最大值来被确定,并且,A可以被确定为正值,从而可以与rRsin(θR)成正比地确定G。

此外,可以基于多媒体装置410的位置来确定增益值和延迟时间,从而输出音频信号。可以确定增益值和延迟时间,使得从扬声器440输出的音频信号可以看起来似乎是音频信号在多媒体装置410的位置处被输出。例如,如下式2一样,增益值可以取决于收听者420的位置和扬声器之间的距离rR被确定。

[式2]

该设备可以确定用于校正从扬声器输出的音频信号的相位差的延迟时间。在移动扬声器时,扬声器和收听者之间的距离可以改变,从而形成通过扬声器输出的声音的相位差。

该设备可以根据收听者420的位置和扬声器之间的距离rR确定延迟时间。例如,如式3中一样,延迟时间可以被确定为声音从扬声器到达收听者的位置所花费的时间之间的差。在式3中,340m/s是指声音的速度,并且,可以取决于传输声音的周围环境不同地确定延迟时间。例如,由于声音的速度取决于声音被传输通过的空气的温度而变化,所以可以取决于空气温度不同地确定延迟时间。

延迟时间不受式3的限制,并且,可以取决于收听者和扬声器之间的距离以不同的方式被确定。

[式3]

Dt=(rC-rR)/340(m/s)

可以对可通过扬声器440输出的音频信号应用根据式2和3确定的增益值和延迟时间。

如下式4中一样,可以对可通过扬声器440输出的音频信号应用滤波函数、增益和延迟时间。

[式4]

作为增益值的G可以被应用于基于Fc选择的频率区间的音频信号,并且,增益Gt和延迟时间Dt也可以被应用于可通过扬声器440输出的音频信号。

根据示例性实施例的音频信号处理设备可以在处理与音频信号对应的图像信号的多媒体装置410的内部,或者,可以是多媒体装置410。但是,本公开的实施例并不局限于此。音频信号处理设备可以包括与通过有线或无线输出音频信号的扬声器440连接的各种设备。

当扬声器具有不同的高度时,基于扬声器的位置信息,可以用与上述的方法相同的方法处理音频信号。当扬声器的高度不同时,收听者和扬声器之间的距离可以不同。因此,基于关于收听者和扬声器之间的距离的信息,该设备可以确定上述的延迟时间和增益值,并且,可以处理音频信号。

图5是示出根据示例性实施例的根据频带放大音频信号的示例的视图。

在图5中,示出频域中的音频信号。该设备可以通过对时域音频信号进行频率变换来获取包括每个频率的音频信号的幅度的音频谱。例如,该设备可以对属于音频信号的一帧的时域音频信号进行频率变换。每个频率的音频信号的幅度可以在音频谱中用分贝(dB)表达。但是,本公开的实施例并不局限于此。每个频率的音频信号的幅度可以用不同的单位表达。音频谱中包括的每个频率的音频信号的幅度可以是指功率、额定值、强度、振幅等。

由于扬声器输出限制530,音频信号的特定频带区域510可能无法通过扬声器输出。由于扬声器输出限制530,某些低频带的音频信号可能无法以与输入的音频信号相同的级别输出。

根据示例性实施例的设备可以通过应用与由于扬声器输出限制530而没有输出的音频信号的能量Elack相等的增益来放大低频带音频信号。放大的音频信号的能量Ereinforcement可以与没有输出的音频信号的能量Elack相似或相等。该设备可以通过放大在与没有输出音频信号510的区域相邻的区域中的音频信号来补充由于扬声器输出限制530而没有输出的音频信号。

例如,使用式5,可以确定具有频率N至M的音频信号的能量值。X(m)是频域音频信号。可以使用下式5来获取上述能量值Ereinforcement和Elack

[式5]

另外,在放大低频带音频信号时,该设备可以根据扬声器位置信息选择可以优化音频信号的放大的效果的频带,并且,可以放大选择的区间的音频信号。可以在考虑扬声器位置信息的情况下进一步确定可被应用于音频信号的增益。例如,随着扬声器移动离开收听者420的前方,可以应用更大的增益。可以基于上述的Elack、扬声器位置信息、扬声器输出限制530等来确定可被应用于音频信号的增益值。

图6是示出根据示例性实施例的多个扬声器的位置信息的示例的视图。

参照图6,可以相对于收听者620的位置获取多个扬声器630和640的位置信息。多媒体装置610可以位于收听者620的位置的前方。但是,图6所示的多媒体装置610的位置仅仅是一个示例,并且,多媒体装置610可以位于另一个方向上。

音频信号处理设备可以具有用于基于扬声器位置信息放大低频带音频信号的滤波函数。可以为音频信号的每个声道提供滤波函数。例如,当音频信号通过左边扬声器和右边扬声器输出时,可以为可通过左边扬声器和右边扬声器输出的每个音频信号提供滤波函数。可以根据多个扬声器630和640的当前位置来应用滤波函数。可以通过滤波函数对每个音频对象处理音频信号,然后,可以输出处理的音频信号。音频信号处理设备可以获取多个扬声器630和640的位置信息,以便确定滤波函数的参数。

音频信号的声像可以针对每个音频对象被定位在不同的位置处。例如,声像可以被定位在显示对应于音频信号的图像信号的多媒体装置610上。可以存在针对每个音频对象的声像,并且,为了提高声音质量,可以对声像的音频信号应用滤波函数。可以对音频信号应用每个声道的不同的滤波函数。由于可以根据扬声器位置信息校正滤波函数,所以可以在不考虑声像被定位的位置的情况下校正滤波函数。

音频信号处理设备可以获取扬声器630和640的位置信息,以便确定用于校正滤波函数的参数。扬声器630和640的位置信息可以被实时地获取或者可以在感测到一个或更多个扬声器的移动时被改变和获取。无论何时扬声器的位置被改变,该设备都可以校正滤波函数并可以用校正的滤波函数处理音频信号,然后输出处理的音频信号。

扬声器630和640的位置信息可以包括具有收听者620的位置作为原点的坐标值(即,笛卡尔坐标),或者,包括基于收听者620的位置的扬声器的角度信息和距离信息(即,极坐标)。例如,基于收听者620的位置,扬声器630和640的位置信息可以包括关于离扬声器的距离的信息和关于收听者620的方向和扬声器之间的角度的信息。当扬声器630和640中的每个的位置信息是坐标值时,该坐标值可以被转换为关于收听者620的位置的上述的距离信息和角度信息。例如,在扬声器的笛卡尔坐标是(x,y)时,扬声器的位置信息可以被转换为极坐标系统中的θ=π/2-tan-1(y/x)的角度值和r=y/cosθ的距离值。可以基于连接收听者620和多媒体装置610的中心轴650来确定扬声器的角度信息。

音频信号处理设备可以求解用于校正滤波函数的参数并使用基于扬声器440的位置信息的参数校正滤波函数。

可以使用上式1基于扬声器630和640的位置信息来获取根据示例性实施例的用于放大低频带音频信号的滤波函数的参数Filterlow(FcR),GLR))或Filterlow(FcL),GLL))。

此外,基于多媒体装置610的位置,可以确定增益值和延迟时间,使得从多个扬声器630和640输出的音频信号可以看起来似乎是音频信号在多媒体装置610的位置处被输出。可以使用上式2和3确定增益值和延迟时间。

另外,由于音频信号通过多个扬声器630和640在不同的方向上输出,所以可以进一步对音频信号应用用于校正输出的音频信号的方向的平移增益。在移动扬声器时,可以相对于收听者来平移通过扬声器输出的声音的方向。因此,可以基于通过扬声器输出的平移的程度来确定平移增益。该设备可以确定平移增益,该平移增益可以根据基于收听者620的位置平移扬声器的角度θL或θR来被确定。可以为每个扬声器确定平移增益。例如,如下式6中一样,可以确定平移增益。

[式6]

如下式7中一样,可以对可通过多个扬声器630和640输出的音频信号应用滤波函数、增益和延迟时间。

[式7]

下面将参照图7和8更详细地描述根据音频信号的能量变化放大音频信号的方法。

图7是示出根据示例性实施例的根据能量变化处理音频信号的方法的流程图。

参照图7,在步骤S710中,音频信号处理设备可以获得时域中的音频信号的能量变化。例如,该设备可以针对每个帧获得音频信号的能量变化。可在图7中处理的音频信号可以是根据图3至图6放大的具有低频带的音频信号。但是,本公开的实施例并不局限于此。可在图7中处理的音频信号可以是用不同的方式处理或者未处理的音频信号。

在帧之间的能量变化被设置为Ediff(t)时,Ediff(t)可以如下式8中一样被确定。

[式8]

Ediff(t)=|E(t)-E(t-1)|

在步骤S720中,该设备可以根据在步骤S710中确定的能量变化确定增益值。在步骤S730中,该设备可以对音频信号应用确定的增益值。例如,可以与能量变化成比例地确定增益值。可以如下式9中一样确定增益值G(t)。

[式9]

G(t)=G(t-1)+Ediff(t)×常数

可以针对每个帧对相应的音频信号应用增益值。随着能量变化增大,被应用于音频信号的增益值可以增大,从而进一步增强冲击感。与对所有的帧应用相同的增益值的情况相比,当根据能量变化对帧应用不同的增益值时,可以保持音频信号的动态范围,也可以进一步增强冲击感。

因此,根据示例性实施例,可以对能量快速地变化的音频信号的瞬态区间应用大的增益值。另外,可以对恒定地保持能量的音频信号的维持区间应用小的增益值。通过对能量变化大的瞬态区域中的音频信号应用更大的增益值来进一步增强冲击感。

图8是示出根据示例性实施例的根据能量变化处理音频信号的示例的示例性视图。

参照图8,附图标记810涉及在根据能量变化处理音频信号之前的时域音频信号的示例,并且,附图标记820是在根据能量变化处理音频信号之后的时域音频信号的示例。

与音频信号810相比,音频信号820可以通过对具有较大的能量变化的区间中的音频信号应用较大的增益值来比其他区间中的音频信号放大得更多。由于可以取决于能量变化对音频信号应用不同的增益值,所以可以增强音频信号的冲击感。

下面将参照图9和图10更详细地描述基于非单声道信号的幅度处理音频信号的方法。根据示例性实施例一方面的音频信号处理设备可以基于比单声道信号小的如背景声音、声音效果等的非单声道信号的幅度来放大低频带音频信号。因此,可以最小化由于低频带音频信号的放大而引起的削波或不连续的信号畸变。

图9是示出根据示例性实施例的基于非单声道信号的幅度处理音频信号的方法的流程图。

在图9的步骤S910中,设备可以从音频信号提取非单声道信号。例如,该设备可以按帧的单位从音频信号提取非单声道信号并可以处理音频信号。非单声道信号可以包括可作为立体信号输出的信号,例如,背景声音、声音效果等。非单声道信号可以包括具有比单声道信号小的幅度的音频信号。

在步骤S920中,该设备可以从音频信号提取低频带音频信号。该设备可以根据上述的扬声器位置信息选择频带,并且,可以获取与选择的频带对应的音频信号。但是,本公开的实施例并不局限于此。该设备可以用不同的方式提取低频带音频信号。

在步骤S930中,该设备可以获取在步骤S910和S920中提取的低频带音频信号和非单声道信号的最大值。换句话说,该设备可以针对每个帧获取非单声道信号的最大值和低频带音频信号的最小值。该设备可以使用如单极估计(one-pole estimation)的方法修改最大值,使得增益值可根据最大值快速地改变。例如,该设备可以如下式10中一样修改最大值X(t)。Y(t-1)是前一帧的修改的最大值,Y(t)和X(t)分别是修改之后的最大值和修改之前的最大值,出现在式10中的常数值仅仅是一个示例,并且可以被设置为另一个值。

[式10]

Y(t)=a×Y(t-1)+(1-a)×x(t),a=0.9995

在步骤S940中,该设备可以基于在步骤S930中获取的最大值来确定增益值。在步骤S950中,该设备可以对低频带音频信号应用确定的增益值。例如,可以使用式11确定增益值。MaxN是从非单声道音频信号获取的修改的最大值,并且,MaxL是从低频带音频信号获取的修改的最大值。

[式11]

Gadap=MaxN/MaxL当Gadap的值小于1时,Gadap的值可以被确定为1。使用式10和式11确定的最大值和增益值仅仅是示例,并且,本公开的实施例并不限于此。可以用不同的方式获取最大值和增益值。

图10是示出根据示例性实施例的基于非单声道信号的幅度处理音频信号的方法的框图。图10所示的处理音频信号的方法可以包括提取非单声道音频信号(1020)和确定增益(1030)。图10所示的处理音频信号的方法可以由上述的音频信号处理设备实现。

参照图10,在步骤1010中,可以从音频信号提取低频带音频信号。可以由低通滤波器提取低频带音频信号。

另外,在步骤1020中,可以从音频信号提取非单声道音频信号。例如,可以基于音频信号的配置信息提取非单声道音频信号。

在步骤1030中,可以基于非单声道音频信号和低频带音频信号的最大值来确定增益值Gadap。可以基于非单声道音频信号和低频带音频信号的最大值之间的比来确定增益值Gadap。因此,被应用了增益值Gadap的低频带音频信号可以被放大至非单声道音频信号的最大值或以下。

低频带音频信号可以通过对低频带音频信号应用增益值Gadap来放大和输出低频带音频信号。

图11是示出根据示例性实施例的在掩蔽的中高频带中放大音频信号的示例的视图。

参照图11,由于增强了低频带音频信号,所以可以在高频带音频信号中发生掩蔽。可以基于频域音频信号的峰值点获取掩蔽阈值。可以在等于或小于掩蔽阈值的音频信号中发生掩蔽。

包括高优先级信息的音频信号可以被放大以防止高频带音频包括如元音、语音等高优先级信息并由此防止被掩蔽。因此,随着低频带音频信号被放大,该设备可以将高频带音频信号放大至掩蔽阈值以上,以最少化包括高优先级信息的高频带音频信号的掩蔽。

图12是示出根据示例性实施例的音频信号处理设备的框图。

根据示例性实施例的音频信号处理设备1200可以是可由用户使用的终端装置。例如,音频信号处理设备1200可以是智能电视(TV)、超高清晰度(UHD)TV、监视器、个人计算机(PC)、笔记本计算机、移动电话、平板PC、导航终端、智能电话、PDA、便携式多媒体播放器(PMP)或数字广播接收器。但是,本公开的实施例并不局限于此。设备1200可以包括各种装置。

参照图12,设备1200可以包括接收器1210、控制器1220和输出单元1230。

接收器1210可以获取音频信号和关于将输出该音频信号的扬声器的位置的信息。接收器1210可以周期性地获取扬声器位置信息。例如,可以从扬声器中包括的被配置为感测扬声器的位置的传感器或者被配置为感测扬声器的位置的外部装置获取扬声器位置信息。但是,本发明的实施例并不局限于此。接收器1210可以用各种方式获取扬声器位置信息。

控制器1220可以基于由接收器1210获取的扬声器位置信息选择频带,并且,可以对对应于选择的频带的音频信号应用增益值来放大音频信号。控制器1220可以在每当扬声器位置信息改变时选择频带,然后,可以放大选择的频带的音频信号。

另外,控制器1220可以分析时域中的音频信号的能量变化,根据能量变化确定增益值,并且,对音频信号应用确定的增益值,由此增强音频信号的冲击感。控制器1220可以按预定的间隔分析能量变化并放大音频信号。

另外,控制器1220可以从音频信号提取非单声道音频信号和低频带音频信号,获取提取的音频信号的最大值,并基于最大值确定增益值。控制器1220可以通过对音频信号应用根据非单声道音频信号的最大值和低频带音频信号的最大值之间的比确定的增益值来放大音频信号,由此在最小化削波的同时放大音频信号。控制器1220可以按预定的间隔确定增益值并放大音频信号。

输出单元1230可以输出由控制器1220处理的音频信号。输出单元1230可以输出音频信号到扬声器。

根据示例性实施例的一方面,通过根据位于任何位置的扬声器的位置信息处理音频信号,可以给收听者提供高质量的音频信号。

根据一些实施例的方法可以被实现为可由各种计算机执行且记录在计算机可读介质上的程序指令。该计算机可读介质也可以包括程序指令、数据文件、数据结构或其组合。该介质中记录的程序指令可以被专门设计和配置用于本发明,或者,可以是计算机软件领域的技术人员所公知和可用的。计算机可读介质的例子包括磁介质(例如,硬盘、软盘和磁带)、光学介质(例如,压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)等)、磁光介质(例如,软光盘)、以及专门被配置为存储和执行程序指令的硬件装置,例如,只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器等。程序指令的例子包括由例如编译器生成的机器代码,以及由使用解释器的计算机可执行的高级语言代码。

以上描述主要关注各种示例性实施例的新的特征。但是,本领域的技术人员应该理解,可以在不脱离本公开的精神和范围的情况下对上述的设备和方法的形式和细节进行各种删除、替换和改变。所附权利要求及其等同物内的所有的改变或修改应该被解释为包括在本公开的范围中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1