用于改进声频信号的感知的设备和方法_2

文档序号:9932720阅读:来源:国知局
供信号分量的声音定位,S卩,收听者能够通过方向和距离识别所检测声音的位置或起源。
[0031]在根据第一方面本身或根据第一方面的以上实施形式中的任一个的设备的第七可能实施形式中,变换器单元包括安排在头戴式耳机中的至少两个扩音器。
[0032]这有利地提供再现立体声效果的可能性,所述立体声效果产生在空间上优于声频信号的自然收听体验。
[0033]在根据第一方面本身或根据第一方面的以上实施形式中的任一个的设备的第八可能实施形式中,空间呈现单元用于使用振幅平移和/或延迟平移以在通过变换器单元输出时在第一虚拟位置处产生至少一个语音分量的听觉效果且在通过变换器单元输出时在第二虚拟位置处产生至少一个噪声分量的听觉效果。
[0034]这有利地构成低复杂性解决方案,所述解决方案提供使用扩音器的各种不同安排来实现噪声和语音信号的感知空间分离的可能性。
[0035]在根据第一方面的第八实施形式的设备的第九可能实施形式中,空间呈现单元用于通过以对应于第一虚拟位置的第一头部相关转移函数过滤至少一个语音分量且以对应于第二虚拟位置的第二头部相关转移函数过滤至少一个噪声分量来产生用于至少两个变换器的立体声信号。
[0036]因此,虚拟位置可以跨越整个三维半球,这有利地提供自然收听体验和增强的分离。
[0037]在根据第一方面本身或根据第一方面的以上实施形式中的任一个的设备的第十可能实施形式中,第一虚拟位置由相对于参考方向的第一方位角范围界定和/或第二虚拟位置由相对于参考方向的第二方位角范围界定。
[0038]在根据第一方面的第十实施形式的设备的第十一可能实施形式中,第二方位角范围由一个整圆界定。
[0039]因此,产生非定位噪声源的感知,这有利地支持人类听觉系统中语音和噪声源的分呙。
[0040]在根据第一方面的第十一实施形式的设备的第十二可能实施形式中,空间呈现单元用于获得第二方位角范围,方法是再现具有使用去相关实现的扩散特征的至少一个噪声分量。
[0041]噪声源的此扩散感知有利地促进人类听觉系统中语音和噪声源的分离。
[0042]根据第二方面,本发明涉及包括根据第一方面的以上实施形式中的任一个的设备和变换器单元的移动装置,其中变换器单元由装置的至少一对扩音器提供。
[0043]根据第三方面,本发明涉及一种用于改进声频信号的感知的方法,所述方法包括以下步骤:例如,借助于分离单元将声频信号分离成至少一个语音分量和至少一个噪声分量;以及例如,借助于空间再现单元在通过变换器单元输出时在相对于用户的第一虚拟位置处产生至少一个语音分量的听觉效果且在通过变换器单元输出时在相对于用户的第二虚拟位置处产生至少一个噪声分量的听觉效果。
[0044]在根据第三方面的方法的第一可能实施形式中,第一虚拟位置和第二虚拟位置间隔开,相对于用户跨越大于20度弧的平面角,优选地跨越大于35度弧的平面角,尤其优选地跨越大于45度弧的平面角。
[0045]本文中描述的方法、系统和装置可以实施为在数字信号处理器(DigitalSignalProcessor,DSP)、微控制器或任何其它端处理器中的软件或实施为专用集成电路(applicat1n specific integrated circuit ,ASIC)内或现场可编程门阵列(field-programmable gate array,FPGA)中的硬件电路,所述现场可编程门阵列是经设计以在制造之后由客户或设计者配置的因此现场可编程的集成电路。
[0046]本发明可以实施于数字电子电路或计算机硬件、固件、软件或其组合中,例如,实施于常规移动装置的可用硬件或专用于处理本文所描述的方法的新硬件中。
【附图说明】
[0047]将相对于以下附图描述本发明的其它实施例,其中:
[0048]图1示出将噪声语音信号分离成语音和噪声信号的常规语音增强方法的示意图;
[0049]图2示出在单信道通信情形中源定位的示意图,其中语音和噪声源位于相同方向上;
[0050]图3示出根据本发明的实施例的用于改进声频信号的感知的方法的示意框图;
[0051]图4示出根据本发明的另一实施例的包括用于改进声频信号的感知的设备的装置的不意图;以及
[0052]图5示出根据本发明的另一实施例的用于改进声频信号的感知的设备的示意图。
【具体实施方式】
[0053]在相关图式中,相同参考符号指代相同或至少等效元件、部件、单元或步骤。另外,应注意并不是所有附图都按比例绘制。
[0054]下文将详细参考本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整的描述。
[0055]显然,所描述的实施例仅是本发明的一些实施例,而不是全部的实施例。基于本发明的所描述的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例都属于本发明保护的范围。
[0056]在详细描述本发明的各种实施例之前,应基于图1和2描述发明人的发现。
[0057]如上文所提及,尽管语音增强是被充分研究的问题,但是当前技术仍无法提供语音/噪声混合物到干净的语音和噪声分量的完全分离。语音信号估计仍含有大部分噪声或部分语音被错误地从所估计语音信号中清除。若干原因引起此不完全分离,例如:
[0058]-来自相同方向的语音与噪声源之间的空间重叠,这通常针对扩散或环境噪声源,例如,街道噪声而发生,以及
[0059]-语音与噪声源之间的频谱重叠,例如,语音中的辅音类似于与所需前景语音重叠的白噪声或不合需要的背景语音。
[0060]使用当前技术的不完全分离的结果是,例如:
[0061]-抑制语音的重要部分,
[0062]-语音可能听起来不自然,质量受伪声影响,
[0063]-噪声仅部分得到抑制;语音信号仍含有大部分噪声和/或
[0064]-余留的噪声可能听起来不自然(例如,“音乐噪声”)。
[0065]由于不完全分离,因此旨在抑制包含于信号中的噪声的当前语音增强算法通常不会引起更佳的用户体验。尽管所得语音信号可以含有较少噪声,即,信噪比较高,但是感知质量可能由于不自然的有声语音和/或噪声而较低。而且,测量可以理解语音的程度的语音清晰度未必增加。
[0066]除了通过语音增强算法引入的问题以外,单信道语音通信存在一个基本问题:所有单信道语音信号传输从所记录的声波场景和容纳于其中的不同声波源中清除空间信息。在自然收听和通信情形下,例如扬声器的声波源以及噪声源位于3D空间中的不同位置处。人类听觉系统通过评估允许分离来自不同方向的声波源的空间线索(例如,耳间时间差和耳间声强差)而采用此空间信息。这些空间线索实际上对于人类听觉系统中声波源的分离十分重要并且在语音通信中扮演重要角色,参看所谓的“鸡尾酒会效应”。
[0067]在常规的单信道通信中,所有语音和噪声源位于相同的方向上,如图2中所说明。因此,人类听觉系统无法评估空间线索以便分离不同源。因此,通过虚线圆所说明的所有语音和噪声源位于相对于具有头戴式耳机作为变换器单元30的用户的参考方向RD的相同的方向上,如图2中所说明。因此,用户的人类听觉系统无法评估空间线索以便分离不同源。这降低了感知质量且具体而言降低了在有噪声环境中的语音清晰度。
[0068]本发明的实施例基于以下发现:所估计语音和噪声的空间分布(而不是抑制)允许改进有噪声的语音信号的感知质量。
[0069]空间分布用于将语音源和噪声源置于不同位置处。用户使语音和噪声源定位成来自不同方向,如将基于图5更详细地阐述。与旨在抑制噪声的常规的语音增强算法相反,此方法具有两个主要优点。第一,为了分离语音和噪声源而,不包含在单信道混合物中的空间信息被添加到允许人类听觉系统采用空间定位线索的信号。第二,感知质量得到增强,这是由于在
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1