基于分组的回音取消和抑制的制作方法

文档序号:2830544阅读:200来源:国知局
专利名称:基于分组的回音取消和抑制的制作方法
技术领域
背景技术
在传统通信系统中,编码器产生表示语音或数据通信量的信息比 特流。这种比特流被进行再分和分组、与各种控制比特级联并包装成 合适格式以供传输。可用才艮据适当通信机制的例如帧、分组、子分组 等的各种格式来传输语音和数据通信量。为清晰起见,本文将使用术 语"传输帧"来描述实际传输通信量所用的传输格式。将使用术语"分 组"来描述话音编码器的输出。话音编码器还被称为语音编码器或"语
音合成器(vocoder)",且在本文中这些术语可互换使用。
语音合成器提取与语音信息(例如人类说话)生成的模型有关的 参数,并使用所提取的参数来压缩语音信息,以供传输。语音合成器 一般包括编码器和解码器。语音合成器将到来的语音信息(例如模拟 语音信号)分割成块,对到来的语音块进行分析以提取某些相关参数, 并将所述参数量化成二进制或比特表示。比特表示纟皮包装成分组,分 组被;f各式化成传输帧,并通过通信信道将传输帧传送到具有解码器的 接收机。在接收机,从传输帧提取分组,且解码器对分组中携带的比 特表示进行非量化(unquantize)以产生编码参数集合。然后,解码器 使用非量化的参数重新合成语音段以及随后的原始语音信息。
通常使用各种压缩技术将不同类型的语音合成器配置在各种现 有的无线及有线通信系统中。此外,由某一特定标准所定义的传输帧 格式和处理可与其它标准的传输帧格式和处理明显不同。例如, CDMA标准支持变速率语音合成器帧在扩频环境中的使用,而GSM 标准支持固定速率语音合成器帧及多速率语音合成器帧的使用。类似地,通用移动远程通信系统(UMTS)标准也支持固定速率和多速率 语音合成器,但不支持变速率语音合成器。为了这些通信系统之间的
兼容性与互操作性,实现在GSM和UMTS之内对变速率语音合成器 帧的支持以及在CDMA系统之内对非变速率语音合成器帧的支持是 合乎需要的。几乎所有通信系统的一个共同事件是回音(echo)的出 现。声回音和电回音是回音的示例类型。
声回音因手持机和/或自动(hand-free)装置的听筒与麦克风之间 低质语音耦合而产生。电回音由PSTN网络内的4-至-2线耦合产生。 语音压缩语音合成器处理包括在手持机内及在无线网络中的回音的 语音,所述回音导致具有高度可变属性的所返回回音信号。所述反射 的信号降低了语音通话质量。
在声回音的一种示例中,需要时,来自扬声器的声音被在近端的
听众收听。但是,这种在近端的相同声音在被反射之后还被麦克风直 接及间接拾取。这种反射的结果是生成了回音,除非将其消除否则回 音将被传回远端并作为回音被在远端的说话者听见。
图1示出了包括用于取消反射的信号的常规回音取消器和/或抑 制器的分组网络上语音示图。
如果将常规回音取消器和/或抑制器100用于分组交换网络,则常 规回音取消器必须对与双向传输的语音信号相关联的语音合成器分 組进行完全解码,以便获得回音取消参数,因为所有常规回音取消操 作与线性非压缩话音配合起作用。即,常规回音取消器和/或抑制器 100必须从传输帧提取分组,对在分组中携带的比特表示非量化以产 生编码参数集合,并在取消回音之前重新合成语音段。然后,常规取 消器和/或抑制器使用重新合成的语音段来取消回音。
因为传输的语音信息在传输之前被编码成参数(例如在参量域 中),且常规回音:f又消器和/或抑制器工作于非线性话音域,分组交换 网络中的常规回音取消和/或抑制变得相对困难、复杂,可由于例如所 涉及的附加串联(tandeming)编码而增加编码和/或解码延迟和/或降低语音质量。

发明内容
示例实施例定位于用于基于分组的回音取消和/或抑制的方法和 装置。 一种示例实施例提供用于抑制和/或取消回音的方法。在该示例 实施例中,基于与多个参考语音分组中每个参考语音分组及目标语音 分组相关联的至少一个编码语音参数,从所述多个参考语音分组选择 参考语音分组。基于所选参考语音分组抑制/取消所述目标语音分组中 的回音。


从下文给出的详细描述以及附图,将可更充分理解本发明,其中, 相同单元用相同参考标号表示,所述附图只以示例方式给出因此不是 对本发明的限制,其中
图1是包括常规回音取消器和/或抑制器的分组网络上语音的示
图2示出依照示例实施例的回音取消器和/或抑制器;
具体实施例方式
依照示例实施例的方法和装置可根据例如分组交换通信系统中 的特定应用执行回音取消和/或抑制。本文将以回音取消和/或抑制、 回音取消器和/或抑制器等描述示例实施例。
此后,出于示例目的,疑为携带了反射的语音信息(例如,在近 端所接收到的且被反射回远端的语音信息)的声音合成器分组将被称 为目标分组,与这些目标分组相关联的编码参数将被称为目标分组参 数。与从远端原始传送的语音信息(例如,可能反射的语音信息)相 关联的、用于确定目标分组是否包含反射的语音信息的语音合成器分 组或参数分组将被称为参考分组。与参考分组相关联的编码参数将被称为参考分组参数。
如上所述,图1示出分组网络上语音的示图,包括常规回音取消 器和/或抑制器。依照示例实施例的方法可在现有回音取消器和/或抑
制器、例如图1中示出的回音取消器和/或抑制器100实现。例如,示 例实施例可在现有数字信号处理器(DSP )、现场可编程门阵列(FPGA) 等上实现。另夕卜,示例实施例可与例如VoIP网络、VoATM网络、TrFo 网络等的任意类型陆地或无线分组交换网络结合使用。
一种用于对语音信息进行编码的示例语音合成器是基于码激励 线性预测(Code Excited Linear Prediction: CELP )的语音合成器。基 于CELP的语音合成器将数字语音信息编码成编码参数的集合。这些 参数包括例如自适应码本(codebook)和固定码本增益、基音(pitch) /自适应码本、线性频谱对(linear spectrum pair: LSP )和固定码本。 这些参数的每个参数可用若干比特来表示。例如,对于作为众所周知 的语音合成器的增强型变速率编解码(Enhanced Variable Rate CODEC: EVRC)语音合成器的全速率分组,LSP用28个比特表示,基音及其 对应△用12个比特表示,自适应码本增益用9个比特表示,而固定 码本增益用15个比特表示。固定码本用120个比特表示。
还参考图1,如果在近端的CELP语音合成器进行语音信息的编 码期间出现了反射的声音信号,则所传输的语音合成器分组的至少一 部分可包括反射的语音信息。所述反射的语音信息可与原始传送的语 音信息相同或类似,因此携带从近端传送到远端的语音信息的语音合 成器分组可与携带从远端到近端的原始已编码语音信息的语音合成 器分组类似或基本类似或相同。即,例如在原始语音合成器分组中的 比特可与携带反射的语音信息的对应语音合成器分组中的比特类似 或基本类似或相同。
依照示例实施例的分组域回音取消器和/或抑制器和/或其方法利 用这种相似性来通过自适应地调整与所传输分组相关联的编码参数 取消和/或抑制所传输信号中的回音。出于示例目的,将针对基于CELP的语音合成器、例如EVRC语 音合成器描述示例实施例。但是,依照示例实施例的方法和/或装置可 结合和/或适合结合任意适合语音合成器使用。
图2示出依照示例实施例的回音取消器和/或抑制器。如图所示, 图2的回音取消器和/或抑制器可将从远端收到的原始语音合成器分 组(参考分组)緩存在参考分组緩沖存储器202中。回音取消器和/ 或抑制器可将来自近端的目标分组緩存在目标分组緩沖存储器204 中。图2的回音取消器和/或抑制器还可包括回音取消和/或抑制模块 206以及存储器208。
回音取消和/或抑制模块206可基于与存储在参考分组緩沖存储 器202中的至少一个参考分组以及存储在目标分组緩存204中的至少 一个目标分组相关联的至少一个已编码语音参数取消和/或抑制来自 信号(例如发送和/或接收信号)的回音。下面更详细地i仑述回音取消 和/或抑制模块206及在其中所执行的方法。
存储器208可存储例如语音分组相似性度量、对应参考语音分组、 目标语音分组等的中间值和/或语音分组。在至少一种示例实施例中, 存储器208可存储各个相似性度量和/或总相似性度量。下面将更详细 地描述存储器208。
回到图2,可基于轨迹(trajectory)搜索/匹配操作的轨迹匹配长 度确定緩冲存储器204的长度,下面对其进行更详细描述。例如,如 果各语音合成器分组携带20ms语音段且轨迹匹配长度为120ms,则 緩冲存储器204可保存6个目标分组。
可基于回音尾部的长度、网络延迟以及轨迹匹配长度确定緩冲存 储器202的长度。例如,如果各语音合成器分组携带20ms语音段, 回音尾部长度等于180ms且轨迹匹配长度为120ms(例如6个分组), 则緩冲存储器202可保存15个参考分组。可用m表示可在用于参考 分组的緩冲器202中存储的分组的最大数目。
尽管图2示出了两个緩沖器202和204,但是这些緩沖器可合并成单个存储器。
在至少 一种实施例中,回音尾部的长度可由回音路径的已知网络 参数确定和/或定义,或者使用实际搜索过程来获得。确定回音尾部的 长度的方法在本领域是众所周知的。在确定了回音尾部的长度之后, 依照至少某些示例实施例的方法可在等于回音尾部长度的时间窗内 执行。时间窗宽度可等于例如一个或几个传输帧的长度、或者一个或 几个分组的长度。出于示例目的,将通过假设回音尾部的长度等于单 个传输帧中所传送的声音信号的长度来描述示例实施例。
通过将存储在緩冲器202中的参考分组与携带反射的语音信息的 目标分组匹配,示例实施例可应用于任意回音尾部长度。通过将目标
分组与存储在緩冲器202中的m个参考分组的每个参考分组进行比 较,确定目标分组是否包含反射的语音信息。
图3是依照示例实施例示出用于回音取消和/或抑制的方法的流 程图。图3中示出的方法可由图2中示出的回音取消和/或抑制模块 206执行。
参考图3,在S302,计数器值j可被初始化到1。在S304,可从 緩沖器202检索参考分组Rj。在S306,回音取消和/或抑制才莫块206 可将计算器值j与阁值m进行比较。如上所述,m可等于存储在緩冲 器202中的参考分组的数量。在该示例中,因为存储在緩冲器202中 的参考分组的数量m等于在单个传输帧中所传送的参考分组的数量, 所以阈值m可等于在单个传输帧中所传送的分组的数量。这种情况 下,值m可从包含在传输帧中的传输帧报头提取,这在本领域是众所 周知的。
在S306,如果计数器值j小于或等于阔值m,则在S308回音取 消和/或抑制模块206从参考分组Rj提取已编码参数。同时,在S308, 回音取消和/或抑制模块206从目标分组T提取已编码编码参数 (encoded coding parameter)。用于提取这些参数的方法在本领域是 众所周知的。因此,为简洁而省略了详细论述。如上所述,本文针对基于CELP的语音合成器描述示例实施例。对于基于CELP的语音合 成器,参考分组参数和目标分组参数可包含固定码本增益Gf、自适应 码本增益Ga、基音P和LSP。
还参考图3,在S309,回音取消和/或抑制模块206可基于从目标 分组T和参考分组Rj所提取的已编码编码参数的部分执行双端通话 (double talk)检测,以便确定双端通话是否存在于参考分組Rj中。 在包括双端通话的语音段期间,不需要执行回音取消和/或抑制,因为 反射的远端语音信息淹没在近端语音信息中,因此在远端是觉察不到 的。
双端通话检测可用于确定参考分组Rj是否包含双端通话。在示例
Rj所提取的已编码参数进4亍比较来检测双端通话。在上述CELP语音 合成器示例中,所述已编码参数可为固定码本增益&和自适应码本增 益G。。
回音取消和/或抑制模块206可根据式(l)中示出的条件确定双端 通话是否存在
'"r-l,如果G汉一Gfr〈Af;
^Z)r二l,如果GaR—GaT<Aa; (1) 、 Z)T-0,否则
才艮据式(l),如果参考分组Rj的固定码本增益GfR与目标分组T的 固定码本增益Gfp之差小于固定码本增益阈值Af ,则在参考分组Rj中 存在双端通话且可将双端通话检测标记DT设置为1 (例如DT-1)。 同样,如果参考分组Rj的自适应码本增益Gw和目标分组T的自适应 码本增益Ga之差小于自适应码本增益阔值Aa ,则在参考分组Rj中存 在双端通话且可将双端通话检测标记DT设置为1 (例如DTO 。否 则,在参考分组Rj中不存在双端通话且不设置双端通话检测标记DT (4列长口DT:0)。
参考图3,如果在S310不设置双端通话检测标记DT(例如DT-0 ),则可在S312执行从目标分组T所提取的已编码参数与从参考分组Rj 所提取的已编码参数之间的相似性估计。该相似性估计可用于确定是 否要基于从目标分组T所提取的已编码参数、从参考分组Rj所提取的 已编码参数以及相似性阈值设置多个相似性标记的每个标记。
相似性标记可被称为相似性指示符。相似性标记或相似性指示符 可包含例如基音相似性标记(或指示符)PM以及多个LSP相似性标 记(或指示符)。多个LSP相似性标记可包括多个带宽相似性标记 BM,.和多个频率相似性匹配标记FM,.。
又参考图3的S312,回音取消和/或抑制模块206可确定是否要 依照式(2)设置参考分组Rj的基音相似性标记PM:
'尸M^1,如果
如式(2)所示,/V为与目标分组相关联的基音,A是与参考分组 Rj相关联的基音且Ap是基音阈值。可基于依照所用特定类型的语音合 成器所获得的试验性数据确定基音阈值Ap。如式(2)所示,如果基音 尸r和基音A之差的绝对值小于或等于阈值Ap,则基音尸r与基音& 相似,且基音相似性标记PM可i殳为1。否则,基音相似性标记PM 可i殳为0。
继续参考图3的S312,与上述基音相似性估计方法类似,LSP相 似性估计可用于确定参考分组Rj与目标分组T是否相似。
通常,CELP语音合成器使用10阶线性可预测编码(Linear Predictive Coding: LPC)可预测滤波器,该滤波器使用矢量量化对10 个LSP值进行编码。另外,各LSP对定义相应语音频谱共振峰 (formant)。共振峰是由任意声音系统的共振频率产生的声频频谱的 峰值。各特定共振峰可用由式(3)给出的带宽A表示
S,ZS尸2广丄5Pn,Z = U,.."5; (3) 且由式(4)给出中心频率Fi:<formula>formula see original document page 12</formula>; (4)
如式(3)和(4)中所示,A是第i个共振峰的带宽,F,.是第i个共振 峰的中心频率,且LSP2,和是第i对LSP值。
在该示例中,对于IO阶LPC可预测滤波器,可生成5对LSP值。
前3个共振峰中的每个共振峰可包括信息语音段的重要或比较重 要的频谱包络信息。所以,可基于所述前3个共振峰片1,2和3执行 LSP相似性估计。
对于各共振峰/ (片1,2,3 ),指示与目标分組T相关联的带宽5".
是否和与参考分组Rj相关联的带宽S;e,相似的带宽相似性标记万M,可
根据式(5)设置
SM,1,如果IBt广BJAbJ;
<formula>formula see original document page 12</formula>
如式(5)中所示,5力是与目标分组T相关联的第i个带宽,5&是 与参考分組Rj相关联的第i个带宽,且ABi是用于确定带宽^r,和
是否相似的第i个带宽阈值。如果SM产1,则第i个带宽5r,和A,均 处于相互的某个范围内,且可被认为相似。否则,在SM产O时,第i 个带宽^77和A,.可被认为不相似。与基音阈值相似,可基于根据所用 的特定类型语音合成器所获得的实验性数据确定各带宽阚值。
继续参考图3的S312,与目标分组T相关联的第i个频率和与参 考分组Rj相关联的对应第i个频率是否相似可通过频率相似性标记 FM,.来指示。可依照式(6)设置频率相似性标记
在式(6)中,Fr,.是与目标分组T相关联的第i个中心频率,&,.是 与参考分组Rj相关联的第i个中心频率,且AFi是第i个中心频率阈值。 第i个中心频率阈值Api可指示第i个目标和参考中心频率尸r,.和 (i=l,2,3)之间的相似性。与基音阔值和带宽阈值相似,可基于根据
/ = 1,2,3. (6)所用的特定类型语音合成器所获得的实验性数据确定频率阈值。
FM,是相应LSP对的第i个带宽的中心频率相似性标记。根据式
(6),尸M尸1表示尸tv和尸化相似,而FM尸O表示尸t7和尸a.不相似。
参考图3,如果在S314确定多个参数相似性标记尸M、和 中每个标记被设置为等于l,则可认为参考分组Rj与目标分组T相似。 换句话说,如果参数相似性指示符PM、 SM'.和FM,中每个指示符这 样指示,则参考分组Rj与目标分组T相似。
接着在S316,回音取消和/或抑制模块206可计算总语音分组相 似性度量。例如,总语音分组相似性度量可为总相似性度量《。总相 似性度量Sj可指示目标分组T与参考分组Rj之间的总相似性。
在至少一种示例实施例中,可基于多个独立语音分组相似性度量 计算与参考分组Rj相关联的总相似性度量Sj。多个独立语音分组相似
性度量可为独立相似性度量。
所述多个独立相似性度量可基于从目标分组T与参考分组Rj所提 取的已编码参数的至少一部分来计算。在该示例实施例中,多个独立 相似性度量可包括基音相似性度量&、带宽相似性度量&,. (/=1,2,3) 以及频率相似性度量^ U=l,2,3)。可同时计算多个独立相似性度量 中的每个相似性度量。
例如,可根据式(7)计算基音相似性度量&:
s -fe^ ry、
可根据式(8)计算i个共振峰中的每个共振峰的带宽相似性度量
& ,,
如式(8)所示及如上所述,^n是目标分组T的第i个共振峰的带宽, 5化是参考分组Rj的第i个共振峰的带宽。
同样,可根据式(9)计算i个共振峰中的每个共振峰的中心频率相<formula>formula see original document page 14</formula>
如式(9)所示及如上所述,尸打是目标分组T的第i个共振峰的中心 频率,i^.是参考分组Rj的第i个共振峰的中心频率。
在获得多个独立相似性度量之后,可根据式(10)计算总相似性匹 配度量&
+ (10)
在式(10)中,各独立相似性度量可由相应权重函数进行称重。如 式所示, 为基音相似性度量&的相似性权重常数,c^p为LSP频i普
相似性度量S&和Spi的总相似性权重常数,A,.为带宽相似性度量SBi 的独立相似性权重常数且&为频率相似性度量SFi的独立相似性权重 常数。
可确定相似性权重常数 和a p以满足下面所示的式(l 1):
同样,可确定独立相似性;f又重常it和&以满足下面所示的式
(12):
<formula>formula see original document page 14</formula>依照至少某些示例实施例,可根据经验数据确定和/或调整权重常
数使得式(11)和(12)满足。
参考图3,在S318,回音取消和/或抑制模块206可将计算出的总
相似性度量S存储在图2的存储器208中。存储器208可为任意众所
周知的存储器,例如緩沖存储器。在S320递增计数器值j: j=j+l,该
方法返回S304。
回到图3的S314,如果没有设置任意参数相似性标记,则回音取 消和/或抑制模块206确定参考分组Rj与目标分组T不相似,因此目标分组T不携带与参考分组Rj所携带的原始语音信息对应的反射的语 音信息。这种情况下,可递增计数器值j (j=j+l),且该方法如上述 那样继续。
回到图3的S310,如果在参考分组Rj中检测到双端通话,则可 在S311丟弃该参考分组Rj,可在S320递增计数器值j: j=j+l,且在 S304回音取消和/或抑制模块206从緩沖器202检索下一参考分组Rj。 在从緩沖器202检索到下一参考分组Rj之后,所述过程可继续到S306 并重复。
回到S306,如果计数器值j大于阈值m,则可在S321执行矢量 轨迹匹配操作。轨迹匹配可用于定位目标分组的固定码本增益与所存 储参考分组的各固定码本增益之间的相关。轨迹匹配还可用于定位目 标分组的自适应码本增益与各参考分组矢量的自适应码本增益之间 的相关。依照至少一种示例实施例,可通过使用最小均方差(Least Mean Square: LMS )或交叉相关(cross-correlation)算法来4丸4亍矢量 轨迹匹配以便确定目标分组与各相似参考分组之间的相关。因为LMS 和交叉相关算法在本领域中是众所周知的,因此为简洁起见,省略了
对其的详细论述。
在至少一种示例实施例中,矢量轨迹匹配可用来检验目标分组与 每个所存储相似参考分组之间的相似性。在至少一种示例实施例中, 在S321可用矢量轨迹匹配来过滤出不满足(fail)相关阈值的相似参 考分组。可将与不满足相关阈值的所存储相似参考分组相关联的总相 似性度量Sj从存储器208中去除。可基于实验性数据确定相关阈值, 这在本领域中众所周知的。
尽管图3的方法在S321示出矢量轨迹匹配步骤,但是可如本领 域技术人员所期望那样省略该步骤。
在S322,可搜索存储器208中余下的所存储总相似性度量》,以配。在示例实施例中,与目标分组匹配的参考分组可为具有最小关联 总相似性度量5)的参考分组。
如果在存储器中通过目标分组T与参考分组Rj对相似性度量Sj
进行索引(用于这样做的方法是众所周知的,因此为了简洁而将其省
略),则总相似性度量可表示为S(T,Rj),其中j=l,2,3...m。
将总相似性度量表示为S(T,Rj),其中j^,2,3…m,可使用式(13) 获得最小总相似性度量S一
=M/Aq^(r,^)j = 0,l,.."m] (13)
又回到图3,在定位匹配参考分组之后,在S324,回音取消和/
消和/或抑制回音。例如,可通过调整(例如衰减)与目标分组T相关 联的增益取消和/或抑制回音。可基于与匹配的参考分组相关联的增 益、与匹配参考分组相关联的总相似性度量以及增益权重常数执行增 益调整。
例如,可通过衰减如式(14)中示出的自适应码本增益和/或如式(15) 中示出的固定码本增益来取消和/或抑制回音
GW . (14)
&=^S*& (15) 如式(14)中所示,为与参考分组相关联的固定码本增益的调节
增益,^为固定码本的增益权重。
如式(15)中所示,(4为与参考分组相关联的自适应码本增益的调
节增益,R为自适应码本的增益权重。起初,『,和R均可等于l。但
是,可根据例如话音特征(例如,有声的或无声的)和/或目标分组中 的回音相对于参考分组的比例自适应地调整这些值。
依照示例实施例,对目标分组的自适应码本增益和固定码本增益 进行衰减。例如,基于参考分组和目标分组的相似性,可调整目标分 组中自适应和固定码本的增益。依照示例实施例,可使用参量域中的所提取参数取消和/或抑制回 音,而不需要对目标语音信号进行解码和重新编码。
尽管上文只论述了图3中示出的方法的单个重复,但是,可对緩
冲器202中所存储的各个参考分組Rj和緩冲器204中所存储的各个目 标分组T执行图3的方法。即,例如,可搜索存储在緩冲器202中的 多个参考分组以查找与緩沖器204中的每个目标分组匹配的参考分 组。
因此,描述了本发明,显而易见可用多种方式改变本发明。此类 改变不应视为本发明的脱离,所有此类改进旨在被包含在本发明的范 围内。
权利要求
1.一种抑制回音的方法,所述方法包括基于与多个参考语音分组中每个参考语音分组和目标语音分组相关联的至少一个已编码语音参数,从所述多个参考语音分组选择参考语音分组;基于所述所选参考语音分组抑制所述目标语音分组中的回音。
2. 如权利要求l所述的方法,其中,通过基于与所述所选参考语 音分组相关联的所述至少一个已编码语音参数调整与所述目标语音 分组相关联的所述至少一个已编码语音参数,抑制所述回音。
3. 如权利要求2所述的方法,其中,通过基于与所述所选参考语 音分组相关联的对应多个已编码语音参数调整与所述目标语音分组 相关联的多个已编码语音参数,抑制所述回音。
4. 如权利要求l所述的方法,其中,通过基于与所述所选参考语 音分组相关联的对应至少一个已编码语音参数调整与所述目标语音 分组相关联的所述至少一个已编码语音参数的增益,抑制所述回音。
5. 如权利要求l所述的方法,其中,所述选择步骤包括 从所述目标分组和所述多个参考语音分组中每个参考语音分组提取至少一个已编码语音参数;对所述多个参考语音分组之中的若干个参考语音分组的每个参 考语音分组,基于从所述参考语音分组和所述目标分组所提取的所述 已编码语音参数计算至少一个语音分组相似性度量;以及基于所述所计算的语音分组相似性度量选择所述参考语音分组。
6. 如权利要求5所述的方法,还包括基于与各个参考语音分组和所述目标语音分组相关联的所述已 编码语音参数,确定所述多个参考语音分组中哪些参考语音分组与所述目标语音分组相似,以^_生成所述若干个参考语音分组,对所述若 干个参考语音分组计算所述至少一个语音分组相似性度量。
7. 如权利要求l所述的方法,其中,所述选择步骤包括基于与所述多个参考语音分组中每个参考语音分组和所述目标 语音分组相关联的所述至少一个已编码语音参数,确定所述多个参考 语音分组中哪些参考语音分组与所述目标语音分组相似,以便生成参考语音分组集合;以及从所述参考语音分组集合选择所述参考语音分组。
8. 如权利要求7所述的方法,其中,所述确定步骤包括 对于每个参考语音分组,基于与所述目标语音分组相关联的所述至少一个已编码语 音参数以及与所述参考语音分组相关联的所述至少一个已编码 语音参数,设置至少一个相似性指示符;以及基于所述相似性指示符确定所述参考语音分组与所述目标 语音分组是否相似。
9. 如权利要求l所述的方法,其中,所述选择步骤包括 从所述目标语音分組和所述参考语音分组中每个参考语音分组提取多个已编码语音参数;对于与每个参考语音分组相关联的各个已编码语音参数,基于所述参考语音分组和所述目标语音分组的所述已编码 语音参数,确定独立相似性度量; 对于每个参考语音分组,基于与所述参考语音分组相关联的所述独立相似性度量确 定总相似性度量;以及基于与每个参考语音分组相关联的所述总相似性度量选择所述 参考语音分组。
10. 如权利要求9所述的方法,其中,所述选择步骤还包括 比较所述总相似性度量以确定最小总相似性度量;以及 选择与所述最小总相似性度量相关联的参考语音分組。
全文摘要
在用于回音抑制或取消的方法中,基于与多个参考语音分组中每个参考语音分组及目标语音分组相关联的至少一个已编码语音参数从所述多个参考语音分组选择参考语音分组。基于所选参考语音分组抑制或取消所述目标语音分组中的回音。
文档编号G10L21/00GK101542600SQ200780034439
公开日2009年9月23日 申请日期2007年9月18日 优先权日2006年9月19日
发明者A·A·塔拉夫, D·J·尤特库斯, D·-S·金, 曹彬石 申请人:卢森特技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1