用于再现由单声道输入信号产生的双声道输出信号的方法和装置的制作方法

文档序号：7598290阅读：210来源：国知局

专利名称：：用于再现由单声道输入信号产生的双声道输出信号的方法和装置的制作方法
技术领域：
：本发明涉及一种用于再现由单声道输入信号产生的、由第一输出信号和第二输出信号组成的双声道输出信号的方法以及一种用于执行如权利要求1或权利要求8的前序部分所述的方法的装置。
背景技术：
：在现代通信世界中越来越多地采用诸如PC或PDA的针对语音通信的智能数据设备，其中所述数据设备的连接譬如通过VoIP来完成。借助VoIP的基于分组的通信和与此连接的所谓VoIP编译码器的采用引起对语音质量的不期望的影响。譬如在信号传输时应期待中等至较高的运行时间，由此产生可听见的回声。附加地正好在基于分组的通信时必须期待反射，该反射的运行时间经常比在自然环境中的更高而该反射的衰减比在自然环境中的更低。因而优选地通过在数据终端设备中采用回声消除器来规定用于抑制干扰的回声的措施。回声消除器遵循诸如ITU-TG.168(2002)的通用标准，其中此外在传统的电话网中讨论网关-过渡。针对VoIP终端设备替代地可考虑ITU-TG.165(1993)，其中所述关于回声扩散和待达到的抑制的标准比情况是这在传统电话的标准处确定明显更温和的规定。如果将数据终端设备本身作为VoIP终端设备来铺设，那么该数据终端设备相对专用的VoIP终端设备在信号传输和缺少回声消除器时具有较高运行时间的缺点。尤其是基于缺少的回声消除器在基于分组的所述类型的通信处必须采用头戴式耳机(Headset)。但是传统的双声道的耳机产生更不自然的听事件(Hoerereignis)，因为头部的声音和外耳的声音不再被影响。在自然的听时双耳接收所有声源的信号，以致时间延迟、电平差别和音品差别产生空间听感。用于到达的声音的方向感的检查示出，中耳运行时间差别与电平差别只关于头部的水平对称平面是重要的，以致此处可确定到达的声音的方向。如果关于头部垂直对称平面没有出现时间延迟或电平差别，当然此处能通过音品差别确定到达的声音的方向感。三维听对于空间定位、不同声源的分离(比较Blauert，Jens(Junl1997)SpatialHearing，MITPress，Kap.5.3)和反射感觉的抑制(Blauert，Jens(Junl1997)SpatialHearing，MITPress，Kap.5.4)是决定性的。由于声源在应用耳机时直接位于耳朵上，所以禁止所有三维听。即右耳唯一接收右扬声器的信号，而左耳只接收左扬声器的信号。
发明内容因此本发明的任务在于，如下进一步构造用于再现由单声道输入信号产生的输出信号的一种方法和一种装置，由借助头戴式耳机实现的单声道VoIP语音连接来改善质量。所述任务通过如权利要求1所述的方法或通过如权利要求8所述的装置来解决。根据本发明所述任务通过一种方法来解决，在该方法处由单声道输入信号产生的、由第一输出信号和第二输出信号组成的双声道输出信号通过至少一个尤其是针对VoIP应用的双声道的头戴式耳机的一个第一和一个第二扬声器来再现。在这种情况下从单声道输入信号通过相移放大和/或振幅放大来产生用于双声道的模拟的第一输出信号和/或第二输出信号，以获得描述声音事件的主观接收的静态和/或动态位置的听事件。此外所述任务通过一种装置来解决，在该装置处尤其是针对VoIP应用的双声道头戴式耳机具有用于输出由单声道输入信号产生的、由第一输出信号和第二输出信号组成的双声道输出信号的至少一个第一和一个第二扬声器和一个到接收方的数据终端设备的连接。信号处理设备从单声道输入信号通过相移和/或振幅放大产生用于双声道模拟的第一输出信号和/或第二输出信号，以获得描述声音事件的主观接收的静态和/或动态位置的听事件。本发明的重点在于，基于双声道的模拟尽管应用耳机达到一种空间的、尽可能作为自然地接收的听。在此借助相位-、运行时间-、衰减-和/或HRTF(头部相关传递函数)-处理元件模拟声音的自然路径，即自由区域-、外耳-和听管传输、或基于相位差、时间延迟、电平差别和音品差别作用于自然的听。基于所述模仿可能，尽可能地抑制反射的感觉、譬如音质变色或回声，特别是反射的出现被精神控制直至一定程度以及此外依赖于经验和感觉。因而这尤其引起，同时出现的来源于不同声源的声音事件可更容易区分。由此改善听者的能力，集中在一个声源上并相对其他源的声音事件感觉强调其声音事件。为此通过模拟三维听，只要正好听到来自不同方向的多个相干来源的声音，就可使用优先效果，也就是第一波前的定律。此后声音事件似乎只来自单个方向，其中感觉不到回声。这样在第一优选实施方案中规定，单声道输入信号由VoIP应用的发送方和/或接受方的数据终端设备来传送。这尤其有以下优点，除了由发送方的数据终端设备产生的声音事件由接收方的数据终端设备产生的声音事件也引入双声道模拟中。在自然的听时也可听见作为三维声音事件的自己的声音，以致到另一个声源，譬如另一个说者的清楚的界线是可能的。有利地规定，通过第一子函数中的相移模拟由发送方的数据终端设备引起的声音事件的静态位置。为此通过由发送方的数据终端设备传送的输入信号的延迟产生第一输出信号或进行符号反号和将该第一输出信号输送给第一扬声器。除此以外通过没变化的再现输入信号产生第二输出信号并输送给第二扬声器。优选地由发送方的数据终端设备引起的声音事件的静态位置以此“进一步”达到第二扬声器上。基于相移和与此连接的两个输出信号的不同的运行时间此处有利地实施用于产生三维听事件的第一部分。在一个有利的实施方案中在第二子函数中模拟由发送方的数据终端设备引起的声音事件的动态位置。为此首先完成由发送方的数据终端设备传送的输入信号与由接受方的数据终端设备传送的单声道输入信号之间的平均电平比较。紧接着延迟由发送方的数据终端设备传送的输入信号，以通过第一延迟产生第一输出信号。输入信号的第二延迟传送第二输出信号。第一输出信号到达第一扬声器，第二输出信号被输送给第二扬声器。由此由发送方的数据终端设备引起的声音事件的动态位置“进一步”达到各自的扬声器上，相应的输出信号基于不同的运行时间首先达到该扬声器。关于声音事件的动态位置基于相移和与此连接的两个输出信号的不同的运行时间有利地实施用于产生三维听事件的另一个部分。此处利用静态和动态位置从接收方的数据终端设备或接收方的用户角度来说明到达的声音的方向感的模拟。换言之，模拟，所产生的声音事件从一定方向到达。如果模拟静态位置，那么所传送的声音的处理这样完成，通过该声音产生的听事件被“不运动的”发送方的用户接受。运动的发送方的用户的模拟相反说明其动态位置。这样处理该声音，发送方用户的分道叉被模拟。既模拟声音事件的静态位置又模拟声音事件的动态位置因而在音频传输的情况下允许仿做自然的听的听经历。优选地在第三子函数中模拟由接收方的数据终端设备引起的声音事件的静态位置。为此完成由接收方的数据终端设备传送的单声道输入信号的延迟，以将该输入信号作为第一输出信号再现。同时没有变化地转送输入信号，以将该输入信号作为第二输出信号使用。第一输出信号紧接着到达第二扬声器，而第二输出信号被输送给第一扬声器。那就是由此实现静态位置，由接收方的数据终端设备引起的声音事件“进一步”出现在第一扬声器上。期望如此处建议的具有少量延迟的自身的反射并在传统电话中详细地说明。对此参见譬如ITU-TG.131(1996)或ITU-TG.111(1993)附录A，关键词为STMR(侧音掩蔽等级，说者的侧音(SideTongMaskingRating，Talkers’sSidetone))。有利地同时模拟由发送方的数据终端设备引起的声音事件的静态位置和由接收方的数据终端设备引起的声音事件的静态位置。这实质上对应于第一和第三子函数的结合。两个参与语音传输的终端设备的到达的声音因此从不同方向是可感觉的，包括接收方的终端设备的回声。同时达到通过接收方的数据终端设备产生的声音的优先效果的放大。此后在图1中示出根据Blauert的所谓的回声阈值。对此参见针对终端设备中的典型放大的ITU-TG.131的图3.13。明显地能识别TELR(说者回声音量等级(TalkerEchoLoudnessRating))上的“增益”。本发明的解决方案在另一个实施方案中规定，同时模拟由发送方的数据终端设备引起的声音事件的动态位置和由接收方的数据终端设备引起的声音事件的静态位置。这实质上对应于第二和第三子函数的结合。有利地由此从不同方向来感觉由接收方的数据终端设备引起的声音事件、该声音事件的回声和由发送方的数据终端设备引起的声音事件。由此可能，相对从接收方的数据终端设备到达的声音的回声感觉强调从发送方的数据终端设备到达的声音或从接收方的数据终端设备到达的声音。在另一个优选的实施方案中利用一个信号处理设备来构造双声道头戴式耳机，该信号处理设备至少具有一个运行时间元件。此后该运行时间元件产生上面所说明的各自输出信号的相移。替代地或附加地信号处理设备可装设至少一个衰减元件和/或至少一个HRTF(头部相关传递函数)-处理元件。除了相移然后振幅放大和/或音品差别也是可产生的。有利地借助所述元件，利用元件的结合并尤其是利用所有元件的结合在应用双声道的耳机时也可产生实际三维的听，因为通过时间延迟、强度差别和音质变色表征自然听的特征。本发明装置的其他特征和优点从本发明方法的特征和优点得出。下文借助一个根据附图解释的实施例更准确地说明本发明。在这种情况下示出图1对话接受判断的曲线(说者回声容忍曲线TalkerEchoToleranceCurves)，图2本发明的一个实施方案。具体实施例方式图1示出了所谓的“说者回声容忍曲线”，该曲线关于待发现的回声推断语音质量。依此该曲线允许对话的接受判断。在此横坐标为平均的回声传输时间(MeanEchoTransmissionTime)T而纵坐标是说者回声音量等级TELR。曲线K1示出监听阈值(掩蔽的阈值)，曲线K2示出可接受的(Acceptable)。该可接受的等效于曲线，在该曲线处干扰回声以1％的概率出现。曲线K3示出边界情况(Limitingcase)，相反曲线K4示出立体声扬声器以80°的角度布置时的双声道的边界情况(BinauralLimitingCase)。在图2中以功能方框图描述了本发明装置的实施例。在这种情况下发送方的数据终端设备利用参考标记B而接收方的数据终端设备利用参考标记A来标识。接收方的数据终端设备A理想地装备有双声道的耳机，该耳机再次具有第一扬声器L和第二扬声器R。为了相应地控制信号流，信号处理设备1位于各自的终端设备A、B之间。在该实施方案中信号处理设备1具有三个功能块F1、F2、F3和一个电平处理元件PVE。功能块F1、F2和F3分别具有至少一个运行时间元件(未示出)。替代地或补充地功能块F1、F2和F3也可分别利用至少一个衰减元件和/或一个HRTF(头部相关传递函数)处理元件(未示出)来构成。在该实施例中功能块F1和功能块F3相继连接，功能块F2与功能块F1并联。由发送方的数据终端设备B建立到接收方的数据终端设备A的语音连接，其中借助通过VoIP的交换网进行连接。发送方的数据终端设备B在第一功能块F1上的步骤100中传输一个单声道的输入信号。同时发送方的数据终端设备B在第二功能块F2上的步骤101中和在电平比较元件PVE上的步骤102中传输该单声道输入信号。功能块F1延迟所接收的信号并在功能块F3上的步骤200中传输该信号。同时功能块F1让所接收的信号没有变化地通过并在同样在功能块F3上的步骤201中传输该没有变化的信号。因步骤101附在功能块F2上的信号在功能块F2中遭受第一延迟并随着该延迟在功能块F3上的步骤300中被传送。同时因步骤101附在功能块F2上的信号遭受第二延迟并随着该第二延迟在功能块F3上的步骤301中过渡。电平比较元件PVE也在步骤102中接收由发送方的数据终端设备B传送的信号。同时由接收方的数据终端设备A传送的信号附在电平比较元件PVE上，该信号在步骤502中被转送。上面说明的在功能块F2中执行的由发送方的数据终端设备B传送的信号的第一和第二延迟然后依赖于由数据终端设备A、B传送的信号的平均电平比较来完成。现在来源于步骤200和300或步骤201和301的信号附在功能块F3上。同时来源于步骤501的接收方的数据终端设备的信号附在功能块F3上。来源于步骤200和300的信号可在该实施例中无阻碍地通过功能块F3并在步骤400中紧接着被输送给第一扬声器L。由步骤201和301得出的、附在功能块F3上的信号也可没有另外处理地通过最后的功能块F3，但是在步骤401中被输送给第二扬声器R。基于已经首先在功能块F1和F2中执行的信号延迟一方面由发送方的数据终端设备B感应的声音事件的静态位置“进一步”达到第二扬声器R，而另一方面由发送方的数据终端设备B感应的声音事件的动态位置“进一步”达到各自的扬声器，该扬声器分别接收具有少量延迟的信号。功能块F3延迟在步骤501中递交的信号并输送给第二扬声器R。同时在步骤501中传输的信号无阻碍地通过功能块F3并向第一扬声器递交。因此如上所提及的，由接收方的数据终端设备A感应的声音事件的静态位置“进一步”到达第一扬声器L。最后接收方的数据终端设备A在步骤500中将一个信号没有另外处理地直接发送给接收方的数据终端设备B。此处所建议的单声道输入信号的分开及其用于获得运行时间差别的处理使得通过仿做自然听的双声道耳机的三维听成为可能。由于运行时间差别、电平差别和到达的声音的音品变色上的自然的听由于不同的声源产生，所以三维接收的听理想地可由此仿做，既可产生运行时间差别又可产生电平差别和音品变色。上面所说明的实施例将功能块作为信号处理块来说明，其目标是，从一个单声道的输入信号通过其分开产生运行时间差别及因此的相位差。可能替代地是，通过衰减元件取代运行时间元件。在此仿做空间听，该空间听只通过振幅放大或衰减来实现。也可能唯一装设HRTF(头部相关传递函数)处理元件，以模拟头部和耳的状态及因此耳的定向特征。可是功能块F1至F3也可同时接收所有信号处理元件，以达到这样一个关于自然听的模拟的最优结果。替代地，可是未示出的，譬如可能结合功能块F1和F3。这实质上对应于根据图2所描述的实施例，可是不使用在功能块F2上的由发送方的数据终端设备B传送的单声道输入信号。然后该信号在同时处理由接收方的数据终端设备A传送的输入信号的情况下经过功能块F3，以然后输送给扬声器L或R。此外可能，可是同样未示出的，相互结合功能块F2和F3。此处已经说明的图2实质上也可以此为根据，但是排除功能块F1。由发送方的数据终端设备B传送的单声道的输入信号此处唯一传送给功能块F2或传送给电平比较元件PVE，以通过扬声器L或R上的功能块F3转送由此得出的输出信号。在功能块F3中根据子函数F3完成接收方的数据终端设备A的单声道输入信号的处理。两个功能块的结合描述了质量高的并且尽管如此廉价的变形，其中三维模拟的质量分别考虑头戴式耳机的采用范围来调节。借助所述处理元件之一改变单声道信号同样产生一个听事件，该听事件至少再现了自然听的部分。因此在应用所建议的头戴式耳机时可能，定位不同声源并尤其抑制反射的感觉。这通过仿做的自然的听来建立，在该仿做的自然的听处人们已实际学会了反射感觉的抑制。各个功能块唯一用作运行时间元件和/或衰减元件和/或HRTF处理元件已经使得空间听感成为可能，譬如当在通信期间没有背景噪声出现时，那么该听感是足够的。在此位置处指出，所有上述部分单独和在每个结合中，尤其是附图中描述的细节作为发明实质性地来要求。由此的修改对于本领域技术人员是熟悉的。这样用于所处理的信号之一的符号反号的装置可替代上面提及的运行时间-或延迟元件。权利要求1.用于通过一个尤其是针对VoIP应用的双声道头戴式耳机的至少一个第一和一个第二扬声器(L、R)再现一个由一个单声道输入信号产生的、由一个第一输出信号和一个第二输出信号组成的双声道输出信号的方法，其特征在于，从该单声道输入信号通过相移和/或振幅放大或相移和/或振幅减弱产生用于双声道模拟的所述第一输出信号和/或所述第二输出信号，以获得描述一个声音事件的主观接收的静态和/或动态位置的一个听事件。2.如权利要求1所述的方法，其特征在于，所述单声道输入信号由VoIP应用的一个发送-和/或接收方的数据终端设备(B、A)来传送。3.如权利要求1或2所述的方法，其特征在于，通过相移模拟由发送方的数据终端设备(B)引起的声音事件的静态位置，这是通过以下方式实现的所述第一输出信号通过输入信号的延迟而所述第二输出信号通过该输入信号的没有变化的再现来产生并且该第一输出信号被输送给所述第一扬声器(L)而该第二输出信号被输送给所述第二扬声器(R)。4.如前述权利要求之一所述的方法，其特征在于，通过相移模拟由发送方的数据终端设备(B)引起的声音事件的动态位置，这是通过以下方式实现的依赖于由发送方的数据终端设备(B)传送的输入信号与由接收方的数据终端设备(A)传送的输入信号之间的平均电平比较所述第一输出信号通过由发送方的数据终端设备(B)传送的输入信号的第一延迟被产生而所述第二输出信号通过所述输入信号的第二延迟被产生并且该第一输出信号被输送给所述第一扬声器(L)而该第二输出信号被输送给所述第二扬声器(R)。5.如前述权利要求之一所述的方法，其特征在于，通过相移模拟由接收方的数据终端设备(A)引起的声音事件的静态位置，这是通过以下方式实现的所述第一输出信号通过所述输入信号的延迟而所述第二输出信号通过该输入信号的没有变化的再现来产生并且该第一输出信号被输送给所述第二扬声器(R)而该第二输出信号被输送给所述第一扬声器(L)。6.如前述权利要求之一所述的方法，其特征在于，由发送方的数据终端设备(B)引起的声音事件的静态位置和由接收方的数据终端设备(A)引起的声音事件的静态位置同时被模拟。7.如前述权利要求之一所述的方法，其特征在于，由发送方的数据终端设备(B)引起的声音事件的动态位置和由接收方的数据终端设备(A)引起的声音事件的静态位置同时被模拟。8.尤其是针对VoIP应用的双声道头戴式耳机，具有，-至少一个第一和一个第二扬声器(L、R)用于输出一个由一个单声道输入信号产生的、由一个第一输出信号和一个第二输出信号组成的双声道输出信号；以及-一个到一个接收方的数据终端设备(A)的连接；其特征在于，一个信号处理设备(1)，该信号处理设备(1)从该单声道输入信号通过相移和/或振幅放大或相移和/或振幅减弱来产生用于双声道模拟的所述第一输出信号和/或所述第二输出信号，以获得描述一个声音事件的主观接收的静态和/或动态位置的一个听事件。9.如权利要求8所述的双声道头戴式耳机，其特征在于，构造所述信号处理设备(1)，以从接收方的和/或发送方的数据终端设备(A、B)接收所述单声道输入信号。10.如权利要求8或9所述的双声道头戴式耳机，其特征在于，所述信号处理设备(1)具有至少一个用于相位影响、尤其是用于符号反号的元件、或运行时间元件和/或至少一个衰减元件和/或至少一个HRTF(头部相关传递函数)-处理元件，以产生相移和/或振幅放大和/或音品差别。11.如权利要求8至10之一所述的双声道头戴式耳机，其特征在于，构造所述信号处理设备(1)，以通过相移模拟由发送方的数据终端设备(B)引起的声音事件的静态位置，这是通过以下方式实现的所述至少一个运行时间元件在信号路径中通过所述输入信号的一个延迟产生所述第一输出信号而通过所述输入信号的一个没有变化的再现产生所述第二输出信号，并且该第一输出信号被输送给所述第一扬声器(L)而该第二输出信号被输送给所述第二扬声器(R)。12.如权利要求8至11之一所述的双声道头戴式耳机，其特征在于，构造所述信号处理设备(1)，以通过相移模拟由发送方的数据终端设备(B)引起的声音事件的动态位置，这是通过以下方式实现的所述至少一个运行时间元件在信号路径中依赖于由发送方的数据终端设备(B)传送的输入信号与由接收方的数据终端设备(A)传送的输入信号之间的平均电平比较通过所述由发送方的数据终端设备(B)传送的输入信号的第一延迟产生所述第一输出信号而通过所述输入信号的第二延迟产生所述第二输出信号，并且该第一输出信号被输送给所述第一扬声器(L)而该第二输出信号被输送给所述第二扬声器(R)。13.如权利要求8至12之一所述的双声道头戴式耳机，其特征在于，构造所述信号处理设备(1)，以通过相移模拟由接收方的数据终端设备(A)引起的声音事件的静态位置，这是通过以下方式实现的所述至少一个运行时间元件在信号路径中通过所述输入信号的一个延迟产生所述第一输出信号而通过所述输入信号的一个没有变化的再现产生所述第二输出信号，并且该第一输出信号被输送给所述第二扬声器(R)而该第二输出信号被输送给所述第一扬声器(L)。14.如权利要求8至13之一所述的双声道头戴式耳机，其特征在于，构造所述信号处理设备(1)，使得由发送方的数据终端设备(B)引起的声音事件的静态位置和由接收方的数据终端设备(A)引起的声音事件的静态位置同时是可模拟的。15.如权利要求8至14之一所述的双声道头戴式耳机，其特征在于，构造所述信号处理设备(1)，使得由发送方的数据终端设备(B)引起的声音事件的动态位置和由接收方的数据终端设备(A)引起的声音事件的静态位置同时是可模拟的。全文摘要本发明涉及用于通过一个尤其是针对VoIP应用的双声道头戴式耳机的至少一个第一和一个第二扬声器再现一个由一个单声道的输入信号产生的、由一个第一输出信号和一个第二输出信号组成的双声道输出信号的一种方法和一种装置。文档编号H04S5/00GK1604689SQ200410083150公开日2005年4月6日申请日期2004年9月29日优先权日2003年9月29日发明者G·卢茨奥尼申请人:西门子公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：G.卢茨奥尼
技术所有人：西门子公司
我是此专利的发明人

上一篇：执行噪声消除的电子设备和用于该装置的语音输入方法
上一篇：数据管理采集系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。