实现宽带分组语音的基于分组的声学回声消除方法与设备的制造方法_2

文档序号:9376558阅读:来源:国知局
o free LBpacket voice-a 和echo free HB packet voice-a合并,B卩可得到消除声学回声的所述宽带分组语音如echo free wideband packet voice-a (echo free G. 72264Kbit/s),该过程如图 3 所不。
[0044] 在此,本领域技术人员可以理解,通常,编码器/解码器集成了 D/MUX,本发明可确 定使用现有的D/MUX,或者具有其自身的D/MUX。此外,消除HB位流中的声学回声时,可微 调现有的NB PAEC算法或者设计新的算法以适应HB位流的特性。
[0045] 2)首先将所述宽带分组语音分离为低频带位流和高频带位流;然后,对所述低频 带位流进行声学回声消除处理;接着,再将所述高频带位流和经声学回声消除处理后的所 述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
[0046] 例如,还接上例,回声消除装置12可仍首先通过信号分离器(demultiplexer, DMUX)将宽带分组语音如 wideband packet voice-a (G. 72264Kbit/s)分离为 LB 位流如 LB packet voice-a 和 HB 位流如 HB packet voice-a,如 LB packet voice-a 为 48Kbit/s,HB packet voice-a为16Kbit/s ;然后,回声消除装置12采用现有技术中的窄带PAEC(NBPAEC, narrowband PAEC)技术仅消除LB位流如LB packet voice-a中的声学回声,得到消除了声 学回声的LB位流如echo free LB packet voice-a ;接着,回声消除装置12通过多路复用 器(multiplexer,MUX)将消除了声学回声的 LB 位流如 echo free LB packet voice-a 和 HB 位流如HB packet voice-a合并,即可得到消除声学回声的所述宽带分组语音如echo free wideband packet voice-a (echo free G. 72264kbit/s),该过程如图 4 所不。
[0047] 在此,本发明仅聚焦在LB位流上,因为:1)分配给LB位流的带宽远多于分配给HB 位流的带宽,即LB位流是WB分组语音的主要部分;2) LB位流相比于HB位流更多地代表语 音波形,而HB位流相比于LB位流更多地代表语音的清晰度,LB位流在确定语音的含义上起 决定性作用;3)由于HB位流的衰减和干扰,HB位流可能不包含或包含很少的回声。此时, HB位流中的声学回声可被忽略。
[0048] 在此,本领域技术人员应能理解,当回声消除装置12以上述处理方式i)对所述宽 带分组语音进行声学回声消除处理时,所述宽带分组语音的所对应的编解码类型包括但不 限于如G. 722等,上述实施例中的编解码类型G. 722仅为举例,其他现有的或今后可能出现 的编解码类型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包 含于此。
[0049] 再如,当回声消除装置12以上述处理方式ii)对所述宽带分组语音进行声学回声 消除处理时,具体地,回声消除装置12首先基于所述宽带分组语音包含的相关参数,检测 所述宽带分组语音中的第二声学回声;接着,对检测到的所述第二声学回声进行回声消除 处理。优选地,所述相关参数包括但不限于以下至少任一项:
[0050] -所述宽带分组语音包含的低频带参数;
[0051] -所述宽带分组语音包含的通用参数或高频带参数。
[0052] 在此,所述宽带分组语音所对应的编解码类型包括但不限于如EVRC-WB、EVRC-NW 等。本领域技术人员应能理解上述编解码类型仅为举例,其他现有的或今后可能出现的编 解码类型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于 此。
[0053] 在此,需要首先说明的是,若宽带分组语音包含的低频带参数和高频带参数已是 天然分离的,本发明可直接使用相关参数检测和消除/抑制宽带分组语音中的声学回声, 而无需DMUX将宽带分组语音分离为LB位流和HB位流。此时,本发明将重用现有窄带PAEC 算法以处理LB参数,微调现有窄带PAEC算法以处理HB参数并适应HB参数的特性。
[0054] 例如,若获取装置11获取到的宽带分组语音对应的编解码类型为EVRC-WB,则回 声消除装置12可首先基于所述宽带分组语音包含的相关参数,如基于低频带LSP (线谱对, Line-Spectrum pair)参数,检测所述宽带分组语音中的第二声学回声,相关实施例已于下 列专利申请中公开:1)公开号为101933306A、题为"用于在分组网络中检测和抑制回声的 方法和设备"的进入中国国家阶段的PCT申请;2)公开号为101542600、题为"基于分组的 回音取消和抑制"的进入中国国家阶段的PCT申请;3)申请日为2008年9月4日、申请号 为US12/231,646、题为"用于基于通信网络使用帧能量估计检测并抑制分组中的回声的方 法与设备,'(Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation)的美国专利申请,在此通 过合并的方式包含于此;然后回声消除装置12对检测到的所述第二声学回声进行回声消 除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图5所示。
[0055] 对于EVRC-WB编解码类型,其可自适应选择编解码所采用的帧类型,如全速率WB CELP、全速率WB MDCT (改进的离散余弦变换,Modified Discrete Cosine Transform),或者半 速率WB NELP(噪声激励线性预测,Noise Excited Linear Prediction)等等,以上帧类型的 分组格式如以下表1至3所示,其中,表1示出全速率WB CELP帧的分组格式,表2示出全速 率WB MDCT帧的分组格式,表3示出半速率WB NELP帧的分组格式:
[0056]


[0061] 表 3
[0062] 从上述表1至3可以看出,全速率WB CELP、全速率WB MDCT和半速率WB NELP均包 含(LB)LSP 参数(即 LSP_IDX[])和 HB LSP 参数(即 HIGHBAND_LSP_IDX),LSP 参数比较可 被用于检测声学回声。优选地,在声学回声检测过程中HB LSP参数可被忽略,也即HB LSP 参数用于声学回声检测的贡献因子为0。
[0063] 在此,因 LB位流相比于HB位流更多地代表语音波形,且具有较多的含义,本发明 通过使用LB参数来检测声学回声的方法提高了声学回声检测的效率。
[0064] 再如,在具有较少干扰的环境中,HB位流所代表的语音波形和语音能量可用于检 测声学回声,例如,若获取装置11获取到的宽带分组语音所对应的编解码类型为EVRC-WB, 则回声消除装置12可基于所述宽带分组语音包含的相关参数,如基于通用参数或高频带 参数(即非LB参数),检测所述宽带分组语音中的第二声学回声,相关实施例已于下列专 利申请中公开:1)公开号为101933306A、题为"用于在分组网络中检测和抑制回声的方法 和设备"的进入中国国家阶段的PCT申请;2)公开号为101542600、题为"基于分组的回 音取消和抑制"的进入中国国家阶段的PCT申请;3)申请日为2008年9月4日、申请号 为US12/231,646、题为"用于基于通信网络使用帧能量估计检测并抑制分组中的回声的方 法与设备,'(Method and apparatusfor the detection and suppression of echo in packet based communication networks usingframe energy estimation)的美国专利申请,在此通 过合并的方式包含于此;然后对检测到的所述第二声学回声进行回声消除处理,如将检测 到的所述第二声学回声从所述宽带分组语音中减去,该过程如图6所示。
[0065] 还如,本发明还可结合上述相关参数的组合来检测宽带分组语音中的声学回声, 即根据所述宽带分组语音包含的所有参数(即LB参数和非LB参数)来检测宽带分组语音 中的声学回声,从而考虑整体效果并提供便利。不同的编解码或环境可调整各参数的贡献 因子。相应地,本发明在通过修改现有的PAEC算法时可加入贡献因子(即权重)机制,即 不同的参数具有不同的贡献因子。例如,若获取装置11获取到的宽带分组语音对应的编解 码类型为EVRC-WB,则回声消除装置12可基于所述宽带分组语音包含的所有参数,来检测 宽带分组语音中的声学回声,在此,基于所述宽带分组语音包含的所有参数检测所述声学 回声的方式与前述基于LB参数进行声学回声检测的方式相同或基本相同,为简明起见,故 在此不再赘述,并以引用的方式包含于此;然后对检测到的所述第二声学回声进行回声消 除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图7所示。 [0066] 本领域技术人员应能理解上述消除宽带分组语音中的声学回声的方式仅为举例, 其他现有的或今后可能出现的消除宽带分组语音中的声学回声的方式如可适用于本发明, 也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0067] 设备1的各个装置之间是持续不断工作的。具体地,获取装置11持续获取待处理 的宽带分组语音;回声消除装置12持续根据以下任一项处理方式,对所述宽带分组语音进 行声学回声消除处理:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述 低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参 数,对所述宽带分组语音进行声学回声消除处理。在此,本领域技术人员应能理解"持续"是 指设备1的各装置分别不断地进行待处理的宽带分组语音的获取、对宽带分组语音的声学 回声消除处理,直至设备1在较长时间内停止获取待处理的宽带分组语音。
[0068] 优选地,设备1还包括确定装置(未示出)。具体地,确定装置根据所述宽带分组语 音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式; 其中,回声消除装置12根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除 处理;其中,所述处理方式包括以下任一项:_将所述宽带分组语音分离为低频带位流和高 频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分 组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
[0069] 具体地,确定装置根据所述宽带分组语音所对应的语音相关信息,确定对所述宽 带分组语音进行声学回声消除处理的处理方式。在此,所述语音相关信息包括但不限于以 下至少任一项:1)所述宽带分组语音所对应的编解码类型信息;2)所述宽带分组语音所对 应的帧类型信息;3)所述宽带分组语音所对应的分组速率;4)所述宽带分组语音所对应的 能量级别;5)所述宽带分组语音所对应的预配置信息,其包括但不限于如编解码类型的映 射信息等,例如用数字96表示编解码类型EVRC-WB。
[0070] 例如,假设获取装置11获取到的所述宽带分组语音的编解码类型为EVR
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1