利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法_3

文档序号:9693330阅读:来源:国知局
3] 根据又一实施例提供的第Ξ技术,不需要脉冲捜索。依据运第Ξ技术,周期部分的 建构与样本的移除或增加相结合,因此与现有技术相比实现较小的复杂度。
[0204] 另外地或可选地,一些实施例对于上述技术W及G.718与G.729.1的技术提供W下 的改变:
[0205] -音调滞后的小数部分,例如,可用于建构具有恒定音调的信号的周期部分。
[0206] -对于帖内的非整数数量的音调周期,例如,可计算隐藏帖中的最后脉冲的预期位 置的偏移。
[0207] -例如,也可在第一脉冲之前W及在最后脉冲之后增加或移除样本。
[0208] -如果仅有一个脉冲,也可例如增加或移除样本。
[0209] -被移除或增加的样本的数量,例如,也可随着音调的预测线性改变而线性地改 变。
【附图说明】
[0210] 下面,将参考附图更详细地描述本发明实施例,其中:
[0211] 图1示出根据实施例的用于确定估计音调滞后的装置,
[0212] 图2a示出根据实施例的用于重建包括语音信号的帖作为重建帖的装置,
[0213] 图化示出包括多个脉冲的语音信号,
[0214] 图2c示出根据实施例的用于重建包括语音信号的帖的系统,
[0215] 图3示出语音信号的建构周期部分,
[0216] 图4示出帖中具有Ξ个脉冲的语音信号,
[0217] 图5示出帖中具有两个脉冲的语音信号,
[0218] 图6示出样本移除前的语音信号,
[0219]图7示出样本移除后的图6的语音信号,
[0220] 图8示出使用四舍五入的音调滞后被再同步化的语音信号的时间-频率表示,
[0221] 图9示出使用具有小数部分的未四舍五入的音调滞后被再同步化的语音信号的时 间-频率表示,
[0222] 图10示出音调滞后示图,其中使用现有技术重建音调滞后,
[0223] 图11示出音调滞后示图,其中根据实施例重建音调滞后,
[0224] 图12示出移除样本前的语音信号,W及
[022引图13示出图12的语音信号,另外示出Δ 0至Δ 3。
【具体实施方式】
[0226] 图1示出根据实施例的用于确定估计音调滞后的装置。该装置包括用于接收多个 原始音调滞后值的输入接口 110, W及用于估计估计音调滞后的音调滞后估计器120。音调 滞后估计器120用于依据多个原始音调滞后值W及依据多个信息值估计估计音调滞后,其 中对于多个原始音调滞后值中的每个原始音调滞后值,多个信息值中的信息值被指定给原 始首调滞后值。
[0227] 根据实施例,音调滞后估计器120,例如,可用于依据多个原始音调滞后值W及依 据作为多个信息值的多个音调增益值估计估计音调滞后,其中对于多个原始音调滞后值中 的每个原始音调滞后值,多个音调增益值中的音调增益值被指定给原始音调滞后值。
[0228] 在特定的实施例中,多个音调增益值中的每个是自适应码本增益。
[0229] 在实施例中,音调滞后估计器120,例如,可用于最小化误差函数而估计估计音调 滞后。
[0230] 根据实施例,音调滞后估计器120,例如,可用于通过最小化下列误差函数而通过 确定两个参数a、bW估计估计音调滞后,
[0231]
[0232] 其中a是实数,其中b是实数,其中k是具有k含2的整数,W及其中P(i)是第i个原始 音调滞后值,其中gp(i)是被指定给第i个音调滞后值P(i)的第i个音调增益值。
[0233] 在实施例中,音调滞后估计器120,例如,可用于通过最小化下列误差函数而通过 确定两个参数a、bW估计估计音调滞后,
[0234]
[0235] 其中a是实数,其中b是实数,其中P(i)是第i个原始音调滞后值,其中gp(i)是被指 定给第i个音调滞后值P(i)的第i个音调增益值。
[0236] 根据实施例,音调滞后估计器120,例如,可用于根据p = a · i+b确定估计音调滞后 P。
[0237] 在实施例中,音调滞后估计器120,例如,可用于依据多个原始音调滞后值W及依 据作为多个信息值的多个时间值估计估计音调滞后,其中对于多个原始音调滞后值中的每 个原始音调滞后值,多个时间值中的时间值被指定给所述原始音调滞后值。
[0238] 根据实施例,音调滞后估计器120,例如,可用于通过最小化误差函数而估计估计 音调滞后。
[0239] 在实施例中,音调滞后估计器120,例如,可用于通过最小化下列误差函数而通过 确定两个参数a、bW估计估计音调滞后,
[0240]
[0241] 其中a是实数,其中b是实数,其中k是具有k含2的整数,并且其中P(i)是第i个原始 音调滞后值,其中timepassed(i)是被指定给第i个音调滞后值P(i)的第i个时间值。
[0242] 根据实施例,音调滞后估计器120,例如,可用于通过最小化下列误差函数而通过 确定两个参数a、bW估计估计音调滞后,
[0243]
[0244] 其中a是实数,其中b是实数,其中P(i)是第i个原始音调滞后值,其中timepassed(i) 是被指定给第i个音调滞后值P(i)的第i个时间值。
[024引在实施例中,音调滞后估计器120用于根据p = a · i+b确定估计音调滞后P。
[0246] 下面,关于公式(20)-(24b)描述提供加权音调预测的实施例。
[0247] 首先,参考公式(20)-(22c)描述采用根据音调增益进行加权的加权音调预测实施 例。根据运些实施例中的一些,为克服现有技术缺点,采用音调增益对音调滞后加权W进行 音调预测。
[024引在一些实施例中,音调增益可W是标准G. 729中定义的自适应码本增益gp(参看 [ITU12],尤其是章节3.7.3,更尤其是公式(43))。在G.729中,根据下式确定自适应码本增 益:
[0249]
W0含拥。.2为界,
[0250] 其中,x(n)是目标信号且通过根据下式对v(n)与Μη)进行卷积而得到y(n):
[0巧 1]
[0252] 其中v(n)是自适应码本向量,其中y (η)是滤波后的自适应码本向量,且其中h(n-i)是加权合成滤波器的脉冲响应,如G. 729(参看[ITU12])中所定义。
[0253] 类似地,在一些实施例中,音调增益可W是标准G.718中定义的自适应码本增益甜 (参看[ITUOSa],尤其是章节6.8.4.1.4.1,更尤其是公式(170))。在G.718中,根据下式确定 自适应码本增益:
[0 巧 4]
[0255] 其中x(n)是目标信号,且yk(n)是延迟k的过去滤波的激励。
[0256] 例如,参看[ITUOSa],章节 6.8.4.1.4.1,公式(171),定义了如何定义71<(11)。
[0257] 类似地,在一些实施例中,音调增益可W是AMR标准中定义的自适应码本增益gp (参看[3GP12b]),其中根据下式定义作为音调增益的自适应增益gp:
[0巧引
^0<前<1.2为界,
[0259] 其中y (η)是滤波后的自适应码本向量。
[0260] 在一些特定的实施例中,例如,可使用音调增益对音调滞后加权,例如,在进行音 调预测之前。
[0261] 为了运个目的,根据实施例,例如,可引入长度8的第二缓冲器保存音调增益,其在 相同的子帖处被采取作为音调滞后。在实施例中,例如,可使用完全相同的规则对缓冲器更 新W作为音调滞后的更新。一个可能的实现是在各个帖的结束处更新两个缓冲器(保存最 后八个子帖的音调滞后与音调增益),不论运个帖是无误差还是容易产生误差。
[0262] 从现有技术已知有两种不同的预测策略,其可被增强W使用加权音调预测:
[0263] 一些实施例提供G. 718标准的预测策略的显著发明的改进。在G. 718中,在包丢失 的情况下,缓冲器可元素的方式彼此相乘,W便如果相关的音调增益是高的则对音调 之后加权高系数,如果相关的音调增益是低的则对它加权低系数。然后,根据G.718,像平常 一样进行音调预测(参看[ITUOSa,部分7.11.1.3],关于G.718的描述)。
[0264] 一些实施例提供G.729.1标准的预测策略的显著发明的改进。根据实施例,对用于 G. 729.1的预测音调的算法(参看[ITU06b],关于G. 729.1的说明)进行修改W便使用加权预 测。
[0265] 根据一些实施例,目标是最小化误差函数:
[0266]
[0267] 其中gp(i)保持过去子帖的音调增益且P(i)保持对应的音调滞后。
[0268] 在发明公式(20)中,gp(i)代表加权系数。在上面的示例中,每个gp(i)代表来自过 去子帖中的一个的音调增益。
[0269] 下面,提供根据实施例的等式,其说明如何推导出系数a与b,其可被用于根据a+ i · b预测音调滞后,其中i是待被预测的子帖的子帖数量。
[0270] 例如,为了基于对最后五个子帖Ρ(0),···,Ρ(4)的预测得到第一预测子帖,预测音 调值Ρ(5)将是:
[0271 ] Ρ(5) =a+5 · b〇
[0272] 为了推导出系数a与b,误差函数,例如,可W被推导(导数)且可W被设定为零:
[0273]
[0274] 现有技术未公开实施例提供的本发明的加权技术。特别地,现有技术未采用加权 系数gp(i)。
[0275] 因此,现有技术中,未采用加权系数gp(i)推导误差函数W及将误差函数的导数设 定为0,将导致:
[0276]
[0277] (参看[ITU06b,7.6.5])。
[0278] 相对地,当使用所提供的实施例的加权预测方法时,例如,具有加权系数gp(i)的 公式(20)的加权预测方法,a与b成为:
[0281] 根据特定的实施例,4,8,(:,0;6^,6记,1,1和1(,例如,可具有^下的值:
[0282]
[0283] 图10及图11示出提出的音调外推的优越性能。
[0284] 其中,图10示出音调滞后示图,其中采用现有技术的概念重建音调滞后。相对地, 图11示出音调滞后示图,其中根据实施例重建音调滞后。
[028引特别地,图10示出现有技术的标准G. 718与G.729.1的性能,而图11示出实施例所 提供的概念的性能。
[0286] 横轴指示子帖数量。实线1010示出编码器音调滞后,其嵌入在比特流中,且其在灰 色段的区域1030中丢失。左纵轴代表音调滞后轴。右纵轴代表音调增益轴。实线1010示出音 调滞后,而虚线1021、1022、1023示出音调增益。
[0287] 灰色矩形1030指示帖丢失。因为发生在灰色段的区域1030中的帖丢失,关于运个 区域中的音调滞后与音调增益的信息在解码器侧无法得到且必须被重建。
[0288] 图10中,通过点虚线部分1011示出使用G.718标准隐藏的音调滞后。通过实线部分 1012示出使用G.729.1标准隐藏的音调滞后。可清楚看出,使用所提供的音调预测(图11,实 线部分1013)基本与丢失的编码器音调滞后相一致,因此优于G.718与G.729.1技术。
[0289] 下面,参考公式(23a)-(24b)说明使用取决于过去时间的加权的实施例。
[0290] 为克服现有技术的缺点,一些实施例在进行音调预测之前对音调滞后应用时间加 权。应用时间加权可通过最小化运个误差函数而实现:
[0291]
[0292] 其中timepassed(i)代表在正确地接收音调滞后之后已经过去的时间量的倒数,P (i)保持相应的首调滞后。
[0293] -些实施例,例如,可对较近的滞后应用高权重,对较久前接受到的滞后应用较小 的权重。
[0294] 根据一些实施例,接着可W利用公式(21a)推导出a与b。
[0295] 为得到第一预测子帖,一些实施例,例如,可基于最后五个子帖Ρ(0),···,Ρ(4)进行 预测。例如,可W根据下式得到预测音调值Ρ(5):
[0296] P(5)=a+5 · b (23b)
[0297] 例如,如果
[029引 timepassed=[l/5 1/4 1/3 1/2 1]
[0299] (根据子帖延迟的时间加权),运将导致:
[0300]
[0302] 下面,描述提供脉冲再同步化的实施例。
[0303] 图2a示出实施例的用于重建包括语音信号的帖作为重建帖的装置。所述重建帖与 一个或多个可用帖相关联,所述一个或多个可用帖是重建帖的一个或多个先前帖W及重建 帖的一个或多个后续帖中的至少一个,其中一个或多个可用帖包括作为一个或多个可用音 调周期的一个或多个音调周期。
[0304] 装置包括确定单元210,其用于确定样本数量差,所述样本数量差 旨示一个或多个可用音调周期中的一个的样本数量与待被重建的第一音调 周期的样本数量之间的差。
[030引此外,装置包括帖重建器,其用于通过依据样本数量差(心;Δι; Δ5+1與及依据一个 或多个可用音调周期中的一个的样本重建待被重建作为第一重建音调周期的第一音调周 期,而重建重建帖。
[0306]帖重建器220用于重建重建帖,W使得重建帖完全地或部分地包括第一重建音调 周期,W使得重建帖完全地或部分地包括第二重建音调周期,W及W使得第一重建音调周 期的样本数量不同于第二重建音调周期的样本数量。
[0307]通过重建应被重建的音调周期的样本中的一些或全部而进行重建音调周期。如果 待被重建的音调周期完全地由丢失帖组成,则音调周期的所有样本,例如,必须被重建。如 果待被重建的音调周期仅部分地由丢失帖组成,且如果音调周期的一些样本是可用的,例 如,由于它们由另一帖组成,则例如,仅重建丢失的帖包括的音调周期的样本对于重建音调 周期是足够的。
[030引图化示出图2a的装置的功能。特别地,图化示出包括脉冲211、212、213、214、215、 216、217的语音信号222。
[0309]语音信号222的第一部分由帖n-1组成。语音信号222的第二部分由帖η组成。语音 信号222的第Ξ部分由帖η+1组成。
[0310]在图化中,帖n-1先于帖η且帖η+1后于帖η。运意味着,帖n-1包括,与帖η的语音信 号的部分相比,时间上较早发生的语音信号的部分;帖η+1包括,与帖η的语音信号的部分相 比,时间上较后发生的语音信号的部分。
[0311] 在图化的示例中,假设帖η丢失或毁坏,因此,仅先前于帖η的帖Γ先前帖")与后续 于帖η的帖Γ后续帖")是可用的Γ可用帖")。
[0312] 例如,可如下定义音调周期:音调周期开始于脉冲211、212、213等中的一个且结束 于语音信号中的紧接着的后续脉冲。例如,脉冲211与212定义音调周期201。脉冲212与213 定义音调周期202。脉冲213与214定义音调周期203,等等。
[0313] 本领域技术人员熟知的例如采用音调周期的其他开始与结束点的音调周期的其 他定义也可W被考虑。
[0314]在图化的示例中,帖η在接收器处是不可用的或损坏的。因此,接收器知道帖n-1的 脉冲211与212W及音调周期201。此外接收器知道帖η+1的脉冲216与217W及音调周期206。 但是,必须重建包括脉冲213、214与215的帖η,其完全地包括音调周期203与204且其部分地 包括音调周期202与205。
[031引根据一些实施例,可W依据可用帖(例如,先前帖n-1或后续帖η+1)的至少一个音 调周期Γ可用音调周期")的样本重建帖η。例如,可周期性地重复复制帖n-1的音调周期201 的样本W重建丢失或损坏的帖的样本。通过周期性地重复复制音调周期的样本,复制音调 周期自身,例如,如果音调周期是C,则
[0316] 样本(x+i.c)=样本(x);i是整数。
[0317] 在实施例中,复制来自帖n-1的结束部分的样本。被复制第n-1帖的部分的长度等 于(或几乎等于)音调周期201的长度。但是来自201与202的样本用于复制。当第n-1帖只有 一个脉冲时运可能需特别仔细考虑。
[0318] 在一些实施例中,复制的样本被修改。
[0319] 本发明还基于运样的发现:通过周期性地重复复制音调周期的样本,当(完全地或 部分地)被丢失帖(η)包括的音调周期(音调周期202、203、204与205)的大小不同于被复制 的可用音调周期(此处:音调周期201)的大小时,丢失帖η的脉冲213、214、215移动至错误位 置。
[0320] 例如,图化中,通过Δι指示音调周期201与音调周期202之间的差,通过Δ 2指示音 调周期201与音调周期203之间的差,通过Δ 3指示音调周期201与音调周期204之间的差,通 过A 4指示音调周期201与音调周期205之间的差。
[0321] 图化中,可看出,帖n-1的音调周期201显著地大于音调周期206。此外,(部分地或 完全地)被帖η包括的音调周期202、203、204与205的每个均小于音调周期201且大于音调周 期206。此外,较接近于大音调周期201的音调周期(例如,音调周期202)大于较接近于小音 调周期206的音调周期(例如,音调周期205)。
[0322] 根据本发明的运些发现,根据实施例,帖重建器220用于重建重建帖,W使得第一 重建音调周期的样本数量不同于被重建帖部分地或完全地包括的第二重建音调周期的样 本数量。
[0323] 例如,根据一些实施例,帖的重建取决于样本数量差,所述样本数量差指示一个或 多个可用音调周期中的一个(例如,音调
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1