通信系统中的音频信号处理的制作方法

文档序号:7791531阅读:201来源:国知局
通信系统中的音频信号处理的制作方法
【专利摘要】提供了一种由呼叫中心使用的能够使得在呼叫中心与一个或多个用户设备之间进行通信的通信装置,其中,所述通信装置包括用于处理通过通信网络从所述用户设备接收的音频信号的音频处理电路,其中,所述处理电路被配置为对所接收的音频信号执行声学回波消除和/或噪声抑制和/或去混响处理,以消除声学回波和/或抑制噪声和/或抑制存在于从所述用户设备接收的所述音频信号中的混响。
【专利说明】通信系统中的音频信号处理

【技术领域】
[0001] 本发明涉及一种用于使得用户能够使用移动设备联系呼叫中心的系统,并且尤其 涉及一种用于对从用户设备发送至呼叫中心的音频信号进行处理的方法和装置。

【背景技术】
[0002] 现有的通信网络提供了各种技术的互连,所述技术的范围从地面线路和蜂窝设备 一直到运行于计算机上的基于IP的电话或话音业务。从质量的观点来看,仅仅在网络内部 维持语音和音频通信性能就是一项非常复杂并且困难的任务,其需要数量巨大的资源。由 于在不同的环境中使用的具有不同声学特性的完全数量的通信设备的原因,一般的解决方 案是不可行的。网络最多尝试降低由在网络中的各种通信技术在其处进行对接的装置产生 的噪声和回波的影响。例如,在地面线路网络中放置在被称为混合器的4到2转换器之前 的线路回波消除器去除由这些设备处的阻抗失配导致的回波。
[0003] 因此,即使不是全部,大部分通信设备都含有大量的硬件和信号处理,以去除不想 要的噪声和声学回波。不想要的噪声通常源自于设备正在使用的环境,例如,喧闹的街道或 者处于有风的状况之下,该噪声将被设备的扩音器捕获。声学回波是由设备的播放远端信 号的扬声器和扩音器之间的耦合产生的。根据通信设备中使用的设计和零件,这一耦合的 范围能够从适度的线性耦合到需要不同形式的处理的强烈的高度非线性的耦合,该问题留 给了设备的制造商,以便提供设备的用户可接受的性能标准。通常使用低成本线性自适应 滤波器实施的声学回波消除器尝试对设备扬声器和扩音器之间的耦合进行建模并去除回 波。声学回波消除器在线性回波条件下通常具有令人满意的性能,但是在存在非线性时性 能将劣化。
[0004] 构建到用户设备中的蜂窝模块(例如,GSM、CDMA)既含有回波抑制功能又含有噪 声抑制功能,其中,回波抑制包括回波消除器和由频率相关的增益功能特征的后处理器。将 由这一后处理器处理的噪声抑制功能与回波抑制相组合也是很常见的。图1示出了含有很 多当今可用的系统的示范性语音增强系统2的框图。系统2经由扬声器4输出来自远端用 户的经处理的音频信号,并经由扩音器6接收来自近端用户的音频信号。如已知的,扬声器 4输出的音频信号将被扩音器6拾取,并且将对远端用户产生回波。
[0005] 在为了通过扬声器4再现而进行数模转换和放大之前,数字远端信号充当使用自 适应滤波算法的声学回波消除器AEC8的输入。在移动设备中最常用的算法是归一化最小 均方(NLMS)算法,因为其简单,成本低。这一算法的目标在于估计扬声器4和扩音器6之 间的声学回波路径,并在扩音器6上建立回波信号的复制,以便将其从扩音器信号中去除, 由此得到在理想的情况下仅包含近端用户的语音的无回波剩余信号。
[0006] 由于包括建模不足以及在声学回波路径中存在非线性(其能够由放大器(图1中 未示出)、扬声器4和设备2的机械外壳中的任意或全部生成)的多种因素,回波的一部分 将不可避免地留在剩余信号当中,可调谐后处理器10必须将其去除。后处理框10通常在频 域中操作,其在回波/噪声抑制量和语音失真量之间提供权衡。根据设备的音响效果以及 随后的残余回波贡献的严重程度,能够将所得到的双路音频通信表征为全双工或半双工。 在半双工通信中,在远端(扬声器)信号生效时后处理器10使发送(扩音器)路径静噪, 而在全双工通信中,近端和远端扬声器能够相互打断。有时,为了实现全双工通信,一些残 余回波仍然存在于发送路径上,即,后处理器10以不对残余回波分量进行充分抑制为代价 而不使近端语音发生失真。在半双工模式中,后处理器10起着基本的静噪开关的作用。
[0007] 单扩音器噪声抑制算法通常利用基于统计的噪声估计方法以导出对应的增益函 数。然而,对于随着时间发生变化的非固定噪声信号而言,使用这样的方案难以对噪声统计 数据进行正确地跟踪和估计。因此,很多系统还应用过度减除,因此将导致所得到的语音信 号的不期望的失真。
[0008] 除了旨在抑制来自扩音器信号的不想要的回波和噪声的信号增强系统之外,还存 在根据环境当中的噪声对扬声器信号进行调节和均衡的算法。这些又被称为语音增强算法 的算法提高了扬声器信号的响度,使得其不会被周围的环境噪声所掩盖。还存在针对老年 人的需求定制的语音增强系统。例如,在US 2006/0088154中,提出了一种系统,其对用户 的语音进行分析,以确定其是否是老年人,并相应地调节扬声器信号。这些算法中的大部分 都对存在于扩音器6上的周围噪声进行分析并在再现之前向扬声器信号应用频率相关的 增益值。
[0009] 图2是蜂窝系统20的框图,该系统包括表75用户的移动设备的两个移动终端 (MT-A和MT-B)以及建立并管理两个设备之间的连接的移动交换中心(MSC)或基站。
[0010] 在W0 98/43368中建议将声学回波消除器(AEC)从移动设备移到MSC,以便去除 MT上的电力负担。在图2中,这一点由音频框21表示。然而,将回波消除功能放到MSC处 的代价是利用标准回波消除/抑制算法所取得的回波消除性能更差,因为存在将非线性引 入到回波路径中的语音编码器/解码器(22、24、26、28)。因此,将需要更加复杂的算法。此 夕卜,经由MSC连接的设备的声学特性不是预先已知的。在MT中具有AEC的优点是通常能够 使用线性有限脉冲响应滤波器(FIR)对扬声器30与扩音器32之间的耦合进行建模,并将 在MT中的处理调谐至其具体音响效果(specific acoustics)。在存在由编码器引入的非线 性处理的情况下,声学回波消除的问题变得更加具有挑战性。
[0011] 图2没有示出MSC提供的功能。根据在MT中可用的编码器的类型,MSC具有在MT 之间转换编码方案的任务。其通过对MT信号解码,并之后对该信号重新编码以供第二MT 正确接收而执行这一汇接或代码转换。例如,如果移动终端MT-A使用编码器22Enc-A,并且 移动终端MT-B使用编码器28Enc-B,那么MSC首先使用解码器Dec-A对来自MT-A的输入信 号解码,并之后使用编码器Enc-B对这一信号重新编码,以用于发送至MT-B。
[0012] 现在很多老年人携带个人帮助按钮(PHB)或个人紧急响应系统(PERS),如果他们 需要紧急帮助,例如,在他们跌倒时,他们能够启动个人帮助按钮或个人紧急响应系统。自 动跌倒检测器也可用,其监测用户的移动,并在检测到跌倒的情况下自动触发警报。
[0013] 在这些设备被启动时,这些设备(即,PHB、PERS和跌倒检测器)能够经由位于用 户附近(即,通常处于用户的家中)的基础单元触发对专门呼叫中心的地面线路呼叫,并且 呼叫中心的人员能够与用户对话,并安排发送给处于紧急状况下的用户的救助。由于用户 是PHB/PERS服务的注册用户,因而其家庭地点(发现基站的其他地点)将是已知的,并且 呼叫中心人员能够向该地点派遣紧急救助。
[0014] 然而,现在已经可获得这样的系统了,所述系统利用用户携带的移动电话或其他 能够使能移动通信的设备,从而允许PHB、PERS或跌倒检测设备通过移动电信网触发对呼 叫中心的呼叫。这些设备有时被称为移动PERS(MPERS)设备,并且能够在任何具有蜂窝网 络覆盖的地方使用。由于这些MPERS设备的典型用户是老年人或者具有特定形式的身体或 精神缺陷的人,因而所述设备要尽可能便于操作是很重要的。因此,优选将移动电信功能集 成到用户佩戴的PHB或PER挂件中,所述挂件通常只有单个启动按钮或者数量非常少的人 为控制。在MPERS设备被激活时,自动发出对所述设备中预设的呼叫中心号码的呼叫。
[0015] 在给定了上文讨论的MPERS设备的性质的情况下,期望使其电力消耗最小化,以 便使电池寿命最大化并降低用户必须对电池进行充电或更换的频率。
[0016] 此外,由于这些设备的典型用户可能具有听觉困难,因而期望确保MPERS设备的 音频输出对于用户而言尽可能清晰可听。


【发明内容】

[0017] 已经认识到了,由于这些MPERS设备仅用于发出对预定呼叫中心的呼叫,因而能 够将整个系统设计为将很多通常由移动电信设备完成的音频信号处理转移到存在于呼叫 中心中的通信装置。这一通信装置除了能够执行通常的对输出音频信号(即,从呼叫中 心到MPERS设备的音频信号)的处理之外,还能够执行所要求的对输入音频信号(即,从 MPERS设备到呼叫中心的音频信号)的处理。
[0018] 其提供了很多优点。首先,其减少了 MPERS设备必须执行的处理量,继而降低了 所述设备的电力消耗。其次,对于这些设备而言优化了通常在移动设备上运行的处理算法 (即,它们具有相对较低的复杂性),其限制了这些算法的性能。允许在呼叫中心的装置中 执行所述处理意味着能够使用具有提高的性能的更加复杂的算法。再次,任何给定的通信 中所涉及的设备和具体用户将是已知的,因而能够针对正在使用的MPERS设备、由呼叫中 心的人正在使用的装置、呼叫中心中的人进行操作的环境、用户的具体特性(例如,听觉困 难)、和/或用户和/或呼叫中心里的人的具体偏好来优化对输入和输出音频流中的任一者 或两者的处理。另一优点在于能够随着时间的推移容易地更新或调整对音频信号使用的算 法或其他处理,而不对MPERS设备造成影响。
[0019] 本发明的第一方面提供了由呼叫中心使用的能够使得在所述呼叫中心与一个或 多个用户设备之间进行通信的通信装置,所述通信装置包括用于处理通过通信网络从所述 用户设备接收的音频信号的音频处理电路,其中,所述处理电路被配置为对所接收的音频 信号执行声学回波消除和/或噪声抑制和/或去混响处理,以消除声学回波和/或抑制噪 声和/或抑制存在于从所述用户设备接收的所述音频信号中的混响。
[0020] 在优选实施例中,所述音频处理电路还被配置为向通过通信网络从所述用户设备 接收的所述音频信号应用均衡化和/或增益设置。
[0021] 所述音频处理电路还能够被配置为在将所述呼叫中心中的通信设备处生成的音 频信号通过通信网络发送至所述用户设备之前对所述生成的音频信号进行处理。在这种情 况下,所述音频处理电路还能够被配置为对所述生成的音频信号进行处理,以消除声学回 波和/或抑制噪声和/或抑制存在于所述生成的音频信号中的混响,和/或向所述生成的 音频信号应用均衡化和/或增益设置。
[0022] 在优选实施例中,所述通信装置还包括数据库,所述数据库用于存储有关呼叫中 心环境、一个或多个用户设备、一个或多个呼叫中心设备以及与一个或多个用户设备相关 的用户偏好和/或呼叫中心中的人员的偏好的信息。
[0023] 优选地,一旦所述用户设备之一触发对呼叫中心的呼叫,则所述通信装置被配置 为从数据库检索与所述呼叫相关的信息,并且所述音频处理电路被配置为基于所检到的信 息来调节对所述音频信号的处理。
[0024] 在优选实施例中,所述音频处理电路被配置为根据在检索到的信息中的偏好对所 述音频信号应用所述均衡化和/或增益设置。
[0025] 在另一优选实施例中,从所述数据库检索的信息包括适于用户设备的具有听觉困 难的用户的均衡化设置。
[0026] 在本发明的另一实施例中,所述通信装置还被配置为基于对在用户设备中剩余的 电力的估计来控制所述用户设备,从而停用或激活所述用户设备中包含的音频处理电路的 一个或多个部分,并对应地激活或停用所述通信装置中的音频处理电路的一个或多个部 分。
[0027] 在上述实施例的【具体实施方式】中,所述通信装置还包括数据库,所述数据库存储 有关以下内容中的一项或多项的信息:所述用户设备的音频处理能力、所述用户设备中的 当前激活的音频处理电路、所述用户设备的最大电池容量、自从所述用户设备中的电池的 上一次充电的时间以及所述用户设备消耗电力的速率的模型;并且,所述通信装置被配置 为使用所述数据库中存储的信息估计所述用户设备的电池中剩余的电力。
[0028] 在一些实施例中,所述音频处理电路包括:延迟估计器,所述延迟估计器被配置为 估计通过通信网络将音频信号发送至用户设备与接收在通过通信网络从所述用户设备接 收的音频信号中的该音频信号的声学回波之间的延迟;以及声学回波消除器,所述声学回 波消除器被配置为使用所估计的延迟以及发送至用户设备的音频信号的复制品来去除通 过通信网络发送至用户设备的音频信号的声学回波。
[0029] 根据本发明的第二方面,提供了一种通信系统,其包括上文所述的通信装置以及 被配置为经由通信网络将表示用户的语音的音频信号发送至所述通信装置的一个或多个 用户设备,其中,所述一个或多个通信设备被配置使得在将所述音频信号发送至所述通信 装置之前对所述音频信号不执行或者基本不执行声学回波消除或噪声抑制处理。
[0030] 在所述通信系统中,所述一个或多个用户设备优选被配置使得在将通过通信网络 从所述通信装置接收的音频信号呈现给用户设备的用户之前对所述音频信号不执行或基 本上不执行语音增强处理。
[0031] 根据本发明的第三方面,提供了 一种在包括由呼叫中心使用的通信装置以及一个 或多个用户设备的通信系统中使用的方法,所述方法包括:在所述通信装置处接收来自所 述用户设备之一的音频信号;在所述通信装置中对所接收的音频信号进行处理,以消除声 学回波和/或抑制噪声和/或抑制存在于所述音频信号中的混响;以及将经处理的音频信 号呈现给所述呼叫中心中的用户。
[0032] 根据本发明的第四方面,提供了一种计算机程序产品,所述计算机程序产品包括 体现于其中的计算机可读代码,所述计算机可读代码被配置一旦由适当的计算机或处理器 执行,则所述计算机或处理器执行上文所述的方法。

【专利附图】

【附图说明】
[0033] 现在将参考下述附图仅通过举例方式描述本发明的示范性实施例,在附图中;
[0034] 图1是常规语音增强系统的框图;
[0035] 图2是常规蜂窝系统的框图;
[0036] 图3是根据本发明的实施例的包含通信装置的系统的框图;
[0037] 图4是更详细地示出了图3中的通信装置的部分的框图;并且
[0038] 图5是示出了根据本发明的实施例的方法的流程图。

【具体实施方式】
[0039] 图3示出了根据本发明的实施例的示范性MPERS系统50的框图。系统50包括用 户佩戴或携带的MPERS用户设备52。用户设备52包括适于使得用户能够与呼叫中心54无 线通信的部件。因而,用户设备52包括适于通过无线网络56建立对呼叫中心54的呼叫的 收发电路、用于输出从呼叫中心54接收的音频信号的扬声器以及用于生成发送至呼叫中 心54的音频信号的扩音器。用户设备52由电池或其他便携式电源供电。
[0040] 用户设备52还包括一个或多个用户可启动的控制,例如,按钮58,所述一个或多 个用户可启动的控制允许用户在紧急情况下激活用户设备52,以便联系呼叫中心54。用户 设备52还可以含有一个或多个传感器,所述一个或多个传感器被配置为监视用户的移动, 并确定用户是否遭受了跌倒。在这种情况下,用户设备52能够被配置为自动触发对呼叫中 心54的呼叫(因为用户可能失去意识,且无法激活按钮58)。
[0041] 用户设备52通常还具有相关联的基础单元60,相关联的基础单元60位于用户家 中并连接至诸如公用交换电话网(PSTN)62的固定通信网络以及市电电源。当用户在家并 且处于基础单元60附近(即用户在家)时,能够使用基础单元60触发经由PSTN62对呼叫 中心54的呼叫,而不是使用用户设备52经由无线网络56建立呼叫。在这种情况下,基础 单元60能够包括各自的扬声器和扩音器布置,所述各自的扬声器和扩音器布置允许用户 在不必利用用户设备52的情况下与呼叫中心54通信。或者,当用户设备52处于基础单元 60附近时,用户设备52能够被配置为经由基础单元60与呼叫中心54通信(例如,通过使 用图3中的箭头63指示的用户设备52与基础单元60之间的短程无线通信链路)。任一种 布置都能够有助于在用户在家时降低用户设备52的电力消耗。
[0042] 在呼叫中心54中,提供呼叫处理装置64,呼叫处理装置64对来自一个或多个用户 设备52的呼入进行处理(尤其是对输入和输出音频信号进行处理)。将经处理的输入音 频信号提供给由呼叫中心54中的操作员使用的通信设备66(文中将其称为个人响应助手 PRA)。PRA设备66可以包括允许PRA与用户通信的任何适当的装置。例如,PRA设备66可 以为常规的电话手机的形式,但是其优选为耳机或耳承的形式。
[0043] 根据本发明的方面,呼叫处理装置64执行对音频信号的处理,例如,回波消除和/ 或噪声抑制和/或去混响,并任选执行语音处理,例如,均衡化或语音变体(morphing),其 通常在呼叫的各自终端处执行(即,通过移动设备52和PRA设备66两者内的处理电路执 行)。将通常在用户设备52中的蜂窝基带模块或专用数字信号处理器(DSP)上执行的所有 音频信号增强处理移到呼叫中心装置64上降低了用户设备52的处理负担,由此提高电池 寿命。此外,在呼叫中心装置64中能够使用比用户设备52中能够使用的处理算法更加复 杂且更加耗电的处理算法,从而提高了呼叫中心54与用户设备52之间的通信链路的性能。
[0044] 此外,呼叫处理装置64能够利用呼叫中心54处的数据库68中存储的信息执行音 频信号处理。如下文将更加详细描述的,数据库68中存储的信息能够包括有关呼叫中心环 境(即,PRA周围的声学环境,尤其是所述声学环境对音频信号的处理的影响)的信息、有 关呼叫中心54负责管理的用户设备52的信息(例如,有关这些设备的声学特性的信息,例 如,对扩音器与扬声器之间的回波的易感性和/或所述设备的电力使用模型)、有关一个或 多个PRA设备的信息(例如,与关于用户设备52的信息类似,这些设备66的声学特性)、有 关与用户设备52相关联的用户的偏好的信息(例如,优选的均衡化和/或增益设置、优选 的音频输出音量、用户喜欢与男性PRA还是女性PRA通话等)、有关呼叫中心54中的PRA的 偏好(例如,为PRA提供其优选呼叫体验所需的均衡化和/或增益设置)的信息和/或有 关先前向呼叫中心发出的呼叫的信息(例如,来自特定用户设备的各次呼叫的总时长)中 的任何信息。通过这种方式利用数据库68中存储的信息提高了系统50的灵活性,尤其是 允许针对具体用户和/或PRA对处理进行定制。
[0045] 有关呼叫中心处的环境的信息是指相关PRA(即,将对呼叫做出应答的PRA)的工 作所处的声学环境。能够通过一种方式对所述环境进行配置,以限制PRA设备66中的扩音 器对背景噪声的捕获。例如,混响时间小于250ms的干净(dry)声学环境以及PRA之间的 额外声学隔离能够减少混响和背景噪声。
[0046] 使用具有耳内扬声器的贴近讲话扩音器耳机作为PRA设备66意味着将提高扩音 器上的信噪比,同时扩音器和扬声器之间的声学回波也将显著降低。能够在数据库68中标 注出PRA对这样的设备66的使用或者任何其他类型的设备的使用,并使用其调整对输出音 频信号的处理。
[0047] 呼叫处理装置64能够包括计算机或服务器,所述计算机或服务器运行用于实施 音频信号处理和呼叫处理流程的适当软件,尽管如此应当认识到能够使用专用硬件(例如 DSP)来实施由呼叫处理装置64提供的功能中的一个或多个。
[0048] 还应当认识到,响应于来自用户的呼叫(尤其是在所述呼叫期间),PRA可能必须 联系紧急服务或者寻求其他针对用户的救助。因此,呼叫处理装置64能够被配置为使得其 能够建立与紧急服务的通话,同时保持与用户设备52的通话。
[0049] 在本发明的另一实施例中,呼叫中心中的呼叫处理装置64能够被配置为接受经 由很多不同类型的通信网络(例如,蜂窝、PSTN、IP话音(VoIP)等)发出的呼叫。在这种 情况下,装置64能够基于用于建立呼叫的网络的类型来调节处理。因而,数据库68可以含 有有关应当如何针对不同类型的网络来调节处理的信息。
[0050] 在用户首次预定MPERS服务时,能够在校准期间确定有关用户的偏好的信息(例 如,均衡化和增益设置和/或其偏好与男性PRA还是女性PRA通话)。
[0051] 图4更详细地示出了呼叫处理装置64的部分,其图示了能够如何根据本发明的方 面执行对输入和输出音频信号的处理。在图4中示出了两个处理阶段,处理阶段70用于处 理PRA提供的将发送至用户设备52的音频信号,并且处理阶段72用于处理从所述用户设 备接收52的用于呈现给PRA的音频信号。应当认识到,在常规通信系统中,处理阶段72将 存在于远端设备(用户设备52)中,而不是如本发明中一样存在于呼叫中心54中的呼叫处 理装置64中。
[0052] 发送处理阶段70包括本地声学回波消除器AEC-L74和后处理单元PPsend76。由 于能够对呼叫中心54处的声学环境进行控制,因而AEC-L74即使不能去除全部回波也能 去除大部分回波,因而就保留在回波消除器74的输出上的残余回波抑制而言,在后处理器 PPsend76的部分上几乎不需要回波抑制。然而,PPsend76也能够对所发送的音频信号应用 均衡化处理,并且能够使这一均衡化处理以数据库68中存储的预先存储的用户偏好为基 础,或者使其通过估计噪声水平以来自用户设备52的接收线路78为基础。
[0053] 就标准噪声估计器而言后一种做法可能存在困难,因为包括语音活动检测器的像 自适应多速率(AMR)的编码器可能不会发送仅为噪声的片段。然而,由于在呼叫中心54处 能够比在常规移动设备中应用更加高级的处理,而且由于诸如设备52、66的耦合和灵敏度 的声学信息是已知的,因而能够使用高级噪声估计算法,该算法甚至能够在语音活动期间 估计噪声水平,这样不仅能够应用噪声抑制,还能够增强PRA话音的频率区域,以提高可理 解度。
[0054] 能够使用各种自适应滤波算法,例如,上文所述的NLMS算法来实施回波消除器 AEC-L74。
[0055] 接收处理阶段72必须考虑发送音频信号(在线路80上发送)和接收音频信号 之间的长往返行程延迟,因为这一路径含有语音编码器以及通过汇接而引发的任何额外延 迟。因此,提供了延迟估计器单元82,以计算往返行程延迟并对(远程信号)声学回波消除 器AEC-R84进行补偿(offset)。其有助于限制用于实施声学回波消除器84的自适应滤波 器的长度,其对于提高回波消除器84的对语音编码器产生的非线性进行跟踪的能力是非 常关键的。
[0056] 与AEC-L74相比,将以不同的方式和更高的复杂性实施声学回波消除器AEC-R84 以处理编码非线性。此外,可以根据呼叫中心提供者的PRA的偏好对后处理单元86进行调 谐,以允许PRA话音的一些残余回波(在可容忍的范围内)可被PRA听到。这一回波能够 为PRA充当重要的反馈机制,以使其知道其话音正通往用户。
[0057] 由于本发明提供的对呼叫中心54处的声学环境的控制,因而避免了啸声(将其表 征为不受控制的声学回波的反馈)问题,并且与已知系统相比提高了系统鲁棒性。能够通 过对呼叫中心54中的声学环境的控制以及针对PRA设备66的使用的适当指南来控制和确 保发送信号处理的鲁棒性和性能。
[0058] 在另一实施例中,处理阶段72(其对从用户设备接收52的音频信号进行处理)能 够包括用于对发送/接收路径的信道非线性进行建模的各自处理块,所述各自处理块能够 用于对通信网络中可能遇到的各种编码器/解码器非线性以及与用户设备52(其通常较 小,因此使用较小的扬声器,所述扬声器易于在较高的输出水平上产生非线性)本身相关 的非线性进行建模。
[0059] 图5示出了说明根据本发明的实施例的方法的流程图。在步骤101中,用户设备 52触发对呼叫中心54的呼叫。如上文所指示的,能够通过由用户人工按下用户设备52上 的按钮58或者通过用户设备52自动确定用户需要救助而触发这一呼叫。
[0060] 当在呼叫处理装置64中接收到呼入时,呼叫处理装置64查询数据库68以确定与 该呼叫相关的信息(步骤103)。如上文所述,这一信息可能涉及与发出该呼叫的用户设备 52相关联的用户的偏好、将在呼叫中心54中处理该呼叫的PRA的偏好、PRA使用的设备66 的声学特性的细节、用户设备52的声学特性的细节和/或呼叫中心54中的声学环境的细 节。
[0061] 之后,呼叫处理装置64开始使用在步骤103中从数据库68获得的信息处理该呼 叫(即处理来自用户设备52的输入音频信号以及处理来自PRA设备66的输出音频信号)。
[0062] 每次在用户设备52发起与呼叫中心54的通话时重复图5中的方法。
[0063] 根据本发明的一个具体实施例,由于电力约束,用户设备52被配置为提供非常有 限的(或者不提供)回波抑制,使得高水平的回波被反馈至呼叫中心54。例如,并非采用具 有高计算复杂性的长自适应滤波器,而是用户设备能够含有简单的固定滤波器,所述固定 滤波器对扬声器和扩音器之间的直接路径进行建模,并且能够在生产期间被编程。存储在 与用户设备52相关的数据库68中的信息能够指示这一事实,并且这能够由呼叫处理装置 64使用以调节接收/发送处理的水平,以限制呈现给PRA的回波的量。
[0064] 根据本发明的另一实施例,在特定设备52的用户具有听觉困难的情况下,数据库 68中存储的有关用户偏好的信息能够指示由发送处理器76所使用的适当均衡化设置,以 提高PRA话音的高频部分。
[0065] 根据本发明的另一实施例,如果呼叫中心54中的PRA将在混响环境中使用不用手 的设备或手持设备,那么数据库68中存储的有关PRA设备66和/或PRA环境的信息能够 指示发送处理器76应当在回声消除器74中使用更长的滤波器长度。额外地或备选地,如 果呼叫中心54在一天的特定时间尤其嘈杂,那么数据库68中存储的信息能够指示能够人 工或自动地由发送处理器76应用额外的噪声抑制。
[0066] 根据本发明的另一实施例,能够响应于来自呼叫处理装置64的控制信号有选择 地激活或停用用户设备52的蜂窝模块中的处理框,所述控制信号是基于用户设备52的电 池中的剩余电力而生成的。其允许用户设备52在具有充分的剩余电力时执行对音频信号 的特定或所有处理。呼叫处理装置64对应地激活或停用处理阶段72的部分或全部,以确 保对输入音频信号进行适当地处理。
[0067] 在这一实施例中,呼叫处理装置64能够根据数据库68中存储的信息(例如,所述 信息涉及用户设备52中已经启用的音频处理特征的数量连同它们自从用户设备的部署或 者上一充电周期的操作时间,和/或用户设备52的电力使用的模型)来估计用户设备52 的电池中的剩余电力。由呼叫处理装置64对当前的电池水平进行估计,以确定是否指示用 户设备52停用用户设备52中的特定或全部音频处理并激活呼叫中心54处的处理阶段72 中的对应处理框。在备选实现中,用户设备52能够在触发呼叫时将剩余电池水平的指示发 送至呼叫处理装置64。
[0068] 应当认识到在使用户设备52能够进行数据发送的本发明的实施例中(例如,设备 52包括针对第三代或后继代电信网络的蜂窝模块),存储在如上所述的数据库68中的由 呼叫中心装置64对音频信号进行处理所需的特定或全部信息能够转而存储到用户设备52 中,并在触发呼叫时被发送至呼叫中心。
[0069] 因而,与常规移动通信系统相比所描述的本发明能够在更宽范围的环境中提供改 进的呼叫处理,并且其中,能够使所述处理容易地适应用户的需要或偏好。由于通信系统50 的非对称布置,这样的灵活性是可能的,在所述非对称布置中,呼叫中心54对音频信号处 理具有完全控制,由此减轻了用户设备52的用户以及用户设备52本身的负担(因此提高 了设备52的电池寿命)。
[0070] 尽管已经在附图和前面的描述中详细说明和描述了本发明,但这样的说明和描述 被认为是说明性或示范性的而非限制性的;本发明不限于公开的实施例。
[0071] 通过研究附图、说明书和权利要求书,本领域技术人员在实施请求保护的本发明 时能够理解和实现所公开实施例的其他变型。在权利要求中,"包括"一词不排除其他元件 或步骤,量词"一"或"一个"不排除多个。单个处理器或其他单元可以完成权利要求中记 载的若干项目的功能。在互不相同的从属权利要求中记载特定措施并不指示不能有利地使 用这些措施的组合。计算机程序可以存储和/或分布在适当的介质上,所述介质例如是与 其他硬件一起供应或作为其他硬件一部分供应的光学存储介质或固态介质,但计算机程序 也可以以其他形式分布,例如经由因特网或其他有线或无线的远程通信系统。权利要求中 的任何附图标记不得被解释为对范围的限制。
【权利要求】
1. 一种由呼叫中心使用的能够使得在所述呼叫中心与一个或多个用户设备之间进行 通信的通信装置,所述通信装置包括: 音频处理电路,其用于处理通过通信网络从所述用户设备接收的音频信号,其中,所述 处理电路被配置为对所接收的音频信号执行声学回波消除和/或噪声抑制和/或去混响处 理,以消除声学回波和/或抑制噪声和/或抑制存在于从所述用户设备接收的所述音频信 号中的混响。
2. 根据权利要求1所述的通信装置,其中,所述音频处理电路还被配置为向通过所述 通信网络从所述用户设备接收的所述音频信号应用均衡化和/或增益设置。
3. 根据权利要求1或2所述的通信装置,其中,所述音频处理电路还被配置为在所述呼 叫中心中的通信设备处生成的音频信号通过所述通信网络被发送至所述用户设备之前,对 所述生成的音频信号进行处理。
4. 根据权利要求3所述的通信装置,其中,所述音频处理电路被配置为对所述生成的 音频信号进行处理,以消除声学回波和/或抑制噪声和/或抑制存在于所述生成的音频信 号中的混响,和/或向所述生成的音频信号应用均衡化和/或增益设置。
5. 根据权利要求1、2、3或4所述的通信装置,还包括数据库,所述数据库用于存储有关 呼叫中心环境、一个或多个用户设备、一个或多个呼叫中心设备以及与所述一个或多个用 户设备相关联的用户的偏好、和/或所述呼叫中心中的人员的偏好的信息。
6. 根据权利要求5所述的通信装置,其中,一旦所述用户设备之一触发对所述呼叫中 心的呼叫,则所述通信装置被配置为从所述数据库检索与所述呼叫相关的信息,并且所述 音频处理电路被配置为基于检索到的信息来调节对所述音频信号的所述处理。
7. 根据权利要求6所述的通信装置,当依赖于权利要求2和/或权利要求4时,其中, 所述音频处理电路被配置为根据在所述检索到的信息中的偏好向所述音频信号应用所述 均衡化和/或增益设置。
8. 根据权利要求7所述的通信装置,当依赖于权利要求4时,其中,所述检索到的信息 包括适合于用户设备的具有听觉困难的用户的均衡化设置。
9. 根据前述权利要求中任一项所述的通信装置,其中,所述通信装置还被配置为基于 对所述用户设备中剩余的电力的估计来控制所述用户设备,以停用或激活所述用户设备中 包含的音频处理电路的一个或多个部分,并对应地激活或停用所述通信装置中的所述音频 处理电路的一个或多个部分。
10. 根据权利要求9所述的通信装置,还包括数据库,所述数据库存储有关以下内容中 的一项或多项的信息:所述用户设备的音频处理能力、所述用户设备中当前激活的音频处 理电路、所述用户设备的最大电池容量、自从所述用户设备中的电池的上一次充电的时间、 以及由所述用户设备消耗电力的速率的模型;并且其中,所述通信装置被配置为使用所述 数据库中存储的所述信息来估计所述用户设备的所述电池中剩余的电力。
11. 根据前述权利要求中任一项所述的通信装置,其中,所述音频处理电路包括: 延迟估计器,其被配置为估计通过所述通信网络将音频信号发送至所述用户设备与接 收在通过所述通信网络从所述用户设备接收的所述音频信号中的该音频信号的声学回波 之间的延迟;以及 声学回波消除器,其被配置为使用所估计的延迟以及发送至所述用户设备的所述音频 信号的副本来去除通过所述通信网络发送至所述用户设备的所述音频信号的所述声学回 波。
12. -种通信系统,包括: 根据任意前述权利要求所述的通信装置;以及 一个或多个用户设备,其被配置为经由通信网络将表示用户的语音的音频信号发送至 所述通信装置,其中,所述一个或多个通信设备被配置使得在所述音频信号被发送至所述 通信装置之前对所述音频信号不执行或者基本不执行声学回波消除或噪声抑制处理。
13. 根据权利要求12所述的通信系统,其中,所述一个或多个用户设备还被配置使得 在通过所述通信网络从所述通信装置接收的音频信号被呈现给所述用户设备的用户之前, 对所述音频信号不执行或基本不执行语音增强处理。
14. 一种在包括由呼叫中心使用的通信装置以及一个或多个用户设备的通信系统中使 用的方法,所述方法包括: 在所述通信装置处接收来自所述用户设备之一的音频信号; 在所述通信装置中对所接收的音频信号进行处理,以消除声学回波和/或抑制噪声和 /或抑制存在于所述音频信号中的混响;以及 将经处理的音频信号呈现给所述呼叫中心中的用户。
15. -种计算机程序产品,包括体现于其中的计算机可读代码,所述计算机可读代码被 配置使得一旦由适当的计算机或处理器执行,则所述计算机或处理器执行根据权利要求14 所述的方法。
【文档编号】H04B3/23GK104126297SQ201380009280
【公开日】2014年10月29日 申请日期:2013年1月15日 优先权日:2012年2月14日
【发明者】P·克基基安, C·P·扬瑟 申请人:皇家飞利浦有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1