帧错误隐藏方法和设备以及音频解码方法和设备的制作方法

文档序号:2825855阅读:104来源:国知局
帧错误隐藏方法和设备以及音频解码方法和设备的制作方法
【专利摘要】提供一种帧错误隐藏方法,所述帧错误隐藏方法包括:通过对从形成错误帧的第一多个频带形成的多个组执行基于组的回归分析来预测参数,和通过使用基于组预测的参数来隐藏错误帧中的错误。
【专利说明】帧错误隐藏方法和设备以及音频解码方法和设备
【技术领域】
[0001]本公开涉及帧错误隐藏,更具体地讲,涉及一种用于在频域中在没有额外延迟的情况下以低复杂度将错误帧准确地恢复为适应于信号特性的帧错误隐藏方法和设备,音频解码方法和设备、以及采用帧错误隐藏方法和设备的多媒体装置。
【背景技术】
[0002]当编码的音频信号通过有线网络或无线网络被发送时,如果某个包由于发送时的错误而被损坏或失真,则在解码的音频信号的某个帧中会发生错误。在此情况下,如果未适当处理发生在帧中的错误,则在发生错误的帧(在下文中,被称为错误帧)的持续时间中,解码的音频信号的声音质量会降低。
[0003]隐藏帧错误的方法的示例是通过减小错误帧中的信号的幅值来削弱错误对输出信号的影响的静噪(muting)方法、通过重复地再现先前好帧(PGF)来重建错误帧的信号的重复方法、通过对PGF和后续好帧(NGF)的参数进行内插来估计错误帧的参数的内插方法、通过对PGF的参数进行外插来获得错误帧的参数的外插方法、以及通过执行PGF的参数的回归分析来获得错误帧的参数的回归分析方法。
[0004]然而,通常,由于通过统一地应用相同的方法而不管输入信号的特性来恢复错误帧,因此不能有效地隐藏帧错误,从而导致声音质量降低。另外,在内插方法中,虽然帧错误可被有效地隐藏,但是需要一个帧的额外延迟,因此不适合在用于通信的延迟敏感的编解码器中使用内插方法。另外,在回归分析方法中,虽然可通过稍微考虑存在的能量来隐藏帧错误,但是当信号的幅值逐渐增加或信号变化剧烈时可能发生效率降低。另外,在回归分析方法中,当在频域中基于频带执行回归分析时,由于每个频带的能量的瞬时变化,可能估计出非预期的信号。

【发明内容】

[0005]技术问题
[0006]一方面提供一种用于在频域中在没有额外延迟的情况下以低复杂度将错误帧准确地恢复为适应于信号特性的帧错误隐藏方法和设备。
[0007]另一方面提供一种用于通过在频域中在没有额外延迟的情况下以低复杂度将错误帧准确地恢复为适应于信号特性来最小化由于帧错误而导致的声音质量的降低的音频解码方法和设备、存储该音频解码方法和设备的记录介质以及采用该音频解码方法和设备的多媒体装置。
[0008]另一方面提供一种存储用于执行帧错误隐藏方法或音频解码方法的计算机可读程序的计算机可读记录介质。
[0009]另一方面提供一种采用帧错误隐藏设备或音频解码设备的多媒体装置。
[0010]解决方案
[0011]根据一个或更多个示例性实施例的一方面,提供一种帧错误隐藏方法,包括:通过对从形成错误帧的第一多个频带形成的多个组执行基于组的回归分析来预测参数;通过使用基于组预测的参数来隐藏错误帧中的错误。
[0012]根据一个或更多个示例性实施例的另一方面,提供一种音频解码方法,包括:通过对好帧进行解码来获取频谱系数;通过对从形成错误帧的第一多个频带形成的多个组执行基于组的回归分析来预测参数,并通过使用基于组预测的参数获取错误帧的频谱系数;将好中贞或错误巾贞的解码的频谱系数变换到时域,并通过执行叠加(overlap-and-add)处理来重建时域中的信号。
[0013]有益效果
[0014]可平滑信号的形状变化,并可在频域中在没有额外延迟的情况下以低复杂度将错误帧准确地恢复为适应于信号特性(具体地讲,瞬态特性)和突发错误持续时间。
【专利附图】

【附图说明】
[0015]图1a和图1b分别是根据示例性实施例的音频编码设备和音频解码设备的框图;
[0016]图2a和图2b分别是根据另一示例性实施例的音频编码设备和音频解码设备的框图;
[0017]图3a和图3b分别是根据另一示例性实施例的音频编码设备和音频解码设备的框图;
[0018]图4a和图4b分别是根据另一示例性实施例的音频编码设备和音频解码设备的框图;
[0019]图5是根据示例性实施例的频域解码设备的框图;
[0020]图6是根据示例性实施例的频谱解码器的框图;
[0021]图7是根据示例性实施例的帧错误隐藏单元的框图;
[0022]图8是根据示例性实施例的存储器更新单元的框图;
[0023]图9示出应用于示例性实施例的频带划分;
[0024]图10示出应用于示例性实施例的线性回归分析和非线性回归分析的概念;
[0025]图11示出根据示例性实施例的被分组以应用回归分析的子频带的结构;
[0026]图12示出被分组以将回归分析应用于最高支持7.6KHz的宽带的子频带的结构;
[0027]图13示出被分组以将回归分析应用于最高支持13.6KHz的超宽带的子频带的结构;
[0028]图14示出被分组以将回归分析应用于最高支持20KHz的全频带的子频带的结构;
[0029]图15a至图15c示出被分组以在使用了带宽扩展(BWE)时将回归分析应用于最高支持16KHz的超宽带的子频带的结构;
[0030]图16a至图16c示出使用后续好帧(NGF)的时域信号的叠加方法。
[0031]图17是根据示例性实施例的多媒体装置的框图;
[0032]图18是根据另一示例性实施例的多媒体装置的框图。
【具体实施方式】
[0033]本发明构思可允许各种类型的改变或修改以及形式上的各种改变,并且特定示例性实施例将在附图中被示出并在说明书中被详细描述。然而,应理解的是,所述特定示例性实施例不将本发明构思限定为特定形式,而是包括本发明构思的精神和技术范围内的每种修改、等同物或替代形式。由于公知功能或结构会以不必要的细节模糊本发明构思,因此在以下描述中,不详细描述公知功能或结构。
[0034]尽管诸如“第一”和“第二”的术语可用于描述各种元素,但是这些元素可不受这些术语限制。所述术语可用于将特定元素与另一元素区分开。
[0035]在本申请中使用的术语仅用于描述特定示例性实施例,而不具有限制本发明构思的任何意图。虽然在考虑本发明构思中的功能时将当前被尽可能广泛使用的一般术语选为本发明构思中使用的术语,但是本发明构思中使用的术语可根据本领域的普通技术人员的意图、司法判例或新技术的出现而变化。另外,在特定情况下,可使用由 申请人:有意选择的术语,并且在此情况下,将在本发明构思的相应描述中公开所述术语的含义。因此,在本公开中使用的术语不应由术语的简单名称来定义,而由术语的含义和本发明构思的内容来定义。
[0036]单数形式的表达包括复数形式的表达,除非它们在上下文中明显彼此不同。在本申请中,应理解,诸如“包括”和“具有”的术语用于指示被实现的特征、数量、步骤、操作、元素、部件或它们的组合的存在,而不预先排除存在或添加一个或更多个其它特征、数量、步骤、操作、元素、部件或它们的组合的可能性。
[0037]现在将参照示出了示例性实施例的附图更加全面地描述本发明构思。在附图中相同的附图标号表示相同的元件,并因此将省略它们的重复描述。
[0038]图1a和图1b分别是根据示例性实施例的音频编码设备110和音频解码设备130的框图。
[0039]图1a中示出的音频编码设备110可包括预处理器112、频域编码器114和参数编码器116。组件可被集成在至少一个模块中,并被实现为至少一个处理器(未示出)。
[0040]参照图la,预处理器112可对输入信号执行滤波或下采样,但不限于此。输入信号可包括语音信号、音乐信号、或混合了语音和音乐的信号。在下文中,为便于描述,将输入信号称为音频信号。
[0041]频域编码器114可对从预处理器112提供的音频信号执行时间-频率变换(time-frequency transform),选择与声道的数量、编码频带和音频信号的比特率相应的编码工具,并通过使用选择的编码工具对音频信号进行编码。可使用改进离散余弦变换(MDCT)或快速傅里叶变换(FFT)来执行时间-频率变换,但不限于此。如果给定的比特数充足,则可将一般的变换编码方法用于所有频带。否则,如果给定的比特数不足,则可将带宽扩展(BWE)方法应用于一些频带。当音频信号是立体声音频信号或多声道音频信号时,如果给定的比特数充足,则可对每个声道执行编码。否则,如果给定的比特数不足,则可应用缩混(down-mixing)方法。频域编码器114可产生编码后的频谱系数。
[0042]参数编码器116可从提供自频域编码器114的编码后的频谱系数提取参数,并对提取的参数进行编码。可基于子频带来提取参数,并且每个子频带可以是对频谱系数进行分组的单位,并可通过反映阈值频带而具有统一或非统一的长度。当每个子频带具有非统一的长度时,存在于低频频带中的子频带与高频频带中的子频带相比可具有相对短的长度。包括在一个帧中的子频带的数量和长度可根据编解码器算法而变化,并可影响编码性能。参数中的每一个可以是例如子频带的范数、缩放因子、功率、或平均能量,但不限于此。作为编码的结果而获得的频谱系数和参数可形成比特流,并可通过信道以包的形式被发送,或存储在存储介质中。
[0043]图1b中示出的音频解码设备130可包括参数解码器132、频域解码器134和后处理器136。频域解码器134可包括帧错误隐藏算法。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0044]参照图lb,参数解码器132可从以包的形式发送的比特流解码出参数,并基于帧检查解码的参数以确定是否发生了错误。可使用各种公知的方法来执行错误检查,并且可将关于当前帧是好帧还是错误帧的信息提供给频域解码器134。
[0045]在当前帧是好帧时,频域解码器134可通过经由一般的变换解码处理对当前帧进行解码来产生合成的频谱系数,在当前帧是错误帧时,频域解码器134可通过经由频域中的帧错误隐藏算法对先前好帧(PGF)的频谱系数进行缩放来产生合成的频谱系数。频域解码器134可通过对合成的频谱系数执行频率-时间变换来产生时域信号。
[0046]后处理器136可对从频域解码器134提供的时域信号执行滤波或上采样,但是不限于此。后处理器136提供重建的音频信号作为输出信号。
[0047]图2a和图2b分别是根据另一示例性实施例的音频编码设备210和音频解码设备230的框图,其中,音频编码设备210和音频解码设备230可具有切换结构。
[0048]图2a中示出的音频编码设备210可包括预处理器212、模式确定器213、频域编码器214、时域编码器215和参数编码器216。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0049]参照图2a,由于预处理器212基本上与图1a的预处理器112相同,因此省略其描述。
[0050]模式确定器213可通过参考输入信号的特性来确定编码模式。根据输入信号的特性,可确定当前帧是处于语音模式还是音乐模式,并且还可确定对于当前帧有效的编码模式是时域模式还是频域模式。可使用帧的短期特性或多个帧的长期特性来获得输入信号的特性,但是获得输入信号的特性的方法不限于此。当输入信号的特性与音乐模式或频域模式相应时,模式确定器213将预处理器212的输出信号提供给频域编码器214,当输入信号的特性与语音模式或时域模式相应时,模式确定器213将预处理器212的输出信号提供给时域编码器215。
[0051]由于频域编码器214基本上与图1a的频域编码器114相同,因此省略其描述。
[0052]时域编码器215可对从预处理器212提供的音频信号执行码激励线性预测(CELP)编码。详细地讲,可使用代数CELP (ACELP),但是CELP编码不限于此。时域编码器215产生编码后的频谱系数。
[0053]参数编码器216可从提供自频域编码器214或时域编码器215的编码后的频谱系数提取参数,并对提取的参数进行编码。由于参数编码器216基本上与图1a的参数编码器116相同,因此省略其描述。作为编码的结果而获得的频谱系数和参数可与编码模式信息一起形成比特流,并通过信道以包的形式被发送,或存储在存储介质中。
[0054]图2b中示出的音频解码设备230可包括参数解码器232、模式确定器233、频域解码器234、时域解码器235和后处理器236。频域解码器234和时域解码器235中的每个可包括相应域中的帧错误隐藏算法。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0055]参照图2b,参数解码器232可从以包的形式发送的比特流解码出参数,并基于帧检查解码后的参数以确定是否发生了错误。可使用各种公知的方法来执行错误检查,并且可将关于当前帧是好帧还是错误帧的信息提供给频域解码器234或时域解码器235。
[0056]模式确定器233可检查包括在比特流中的编码模式信息,并将当前帧提供给频域解码器234或时域解码器235。
[0057]当编码模式是音乐模式或频域模式时,频域解码器234可进行操作,并且如果当前帧是好帧,则频域解码器234可通过经由一般的变换解码处理对当前帧进行解码来产生合成的频谱系数。否则,如果当前帧是错误帧,并且先前帧的编码模式是音乐模式或频域模式,则频域解码器234可通过经由频域中的帧错误隐藏算法对PGF的频谱系数进行缩放来产生合成的频谱系数。频域解码器234可通过对合成的频谱系数执行频率-时间变换来产生时域信号。
[0058]当编码模式是语音模式或时域模式时,时域解码器235可进行操作,并且如果当前帧是好帧,则时域解码器235可通过经由一般的CELP解码处理对当前帧进行解码来产生时域信号。否则,如果当前帧是错误帧,并且先前帧的编码模式是语音模式或时域模式,则时域解码器235可执行时域中的帧错误隐藏算法。
[0059]后处理器236可对从频域解码器234或时域解码器235提供的时域信号执行滤波或上采样,但不限于此。后处理器236提供重建的音频信号作为输出信号。
[0060]图3a和图3b分别是根据另一示例性实施例的音频编码设备310和音频解码设备330的框图,其中,音频编码设备310和音频解码设备330可具有切换结构。
[0061]图3a中示出的音频编码设备310可包括预处理器312、线性预测(LP)分析器313、模式确定器314、频域激励编码器315、时域激励编码器316和参数编码器317。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0062]参照图3a,由于预处理器312基本上与图1a的预处理器112相同,因此省略其描述。
[0063]LP分析器313可通过对输入信号执行LP分析来提取LP系数,并从提取的LP系数产生激励信号。可根据编码模式将激励信号提供给频域激励编码器315和时域激励编码器316中的一个。
[0064]由于模式确定器314基本上与图2a的模式确定器213相同,因此省略其描述。
[0065]当编码模式是音乐模式或频域模式时,频域激励编码器315可进行操作,由于除了输入信号是激励信号之外,频域激励编码器315基本上与图1a的频域编码器114相同,因此省略其描述。
[0066]当编码模式是语音模式或时域模式时,时域激励编码器316可进行操作,由于除了输入信号是激励信号之外,时域激励编码器316基本上与图2a的时域编码器215相同,因此省略其描述。
[0067]参数编码器317可从提供自频域激励编码器315或时域激励编码器316的编码后的频谱系数提取参数,并对提取的参数进行编码。由于参数编码器317基本上与图1a的参数编码器116相同,因此省略其描述。作为编码的结果而获得的频谱系数和参数可与编码模式信息一起形成比特流,并通过信道以包的形式被发送,或被存储在存储介质中。
[0068]图3b中示出的音频解码设备330可包括参数解码器332、模式确定器333、频域激励解码器334、时域激励解码器335、LP合成器336和后处理器337。频域激励解码器334和时域激励解码器335中的每一个可包括相应域中的帧错误隐藏算法。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0069]参照图3b,参数解码器332可从以包的形式发送的比特流解码出参数,并基于帧检查解码的参数以确定是否发生错误。可使用各种公知的方法来执行错误检查,并且可将关于当前帧是好帧还是错误帧的信息提供给频域激励解码器334或时域激励解码器335。
[0070]模式确定器333可检查包括在比特流中的编码模式信息,并将当前帧提供给频域激励解码器334或时域激励解码器335。
[0071]当编码模式是音乐模式或频域模式时,频域激励解码器334可进行操作,并且如果当前帧是好帧,则频域激励解码器334可通过经由一般的变换解码处理对当前帧进行解码来产生合成的频谱系数。否则,如果当前帧是错误帧,并且先前帧的编码模式是音乐模式或频域模式,则频域激励解码器334可通过经由频域中的帧错误隐藏算法对PGF的频谱系数进行缩放来产生合成的频谱系数。频域激励解码器334可通过对合成的频谱系数执行频率-时间变换来产生激励信号,其中,所述激励信号是时域信号。
[0072]当编码模式是语音模式或时域模式时,时域激励解码器335可进行操作,并且如果当前帧是好帧,则时域激励解码器335可通过经由一般的CELP解码处理对当前帧进行解码来产生激励信号,其中,所述激励信号为时域信号。否则,如果当前帧是错误帧,并且先前帧的编码模式是语音模式或时域模式,则时域激励解码器335可执行时域中的帧错误隐藏算法。
[0073]LP合成器336可通过对从频域激励解码器334或时域激励解码器335提供的激励信号执行LP合成来产生时域信号。
[0074]后处理器337可对从LP合成器336提供的时域信号执行滤波或上采样,但是不限于此。后处理器337提供重建的音频信号作为输出信号。
[0075]图4a和图4b分别是根据另一示例性实施例的音频编码设备410和音频解码设备430,其中,音频编码设备410和音频解码设备430可具有切换结构。
[0076]图4a中示出的音频编码设备410可包括预处理器412、模式确定器413、频域编码器414、LP分析器415、频域激励编码器416、时域激励编码器417和参数编码器418。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。由于可通过组合图2a中示出的音频编码设备210和图3a中示出的音频编码设备310来得到图4a中示出的音频编码设备410,因此省略共同部件的操作描述,现在将描述模式确定器413的操作。
[0077]模式确定器413可通过参考输入信号的特性和比特率来确定输入信号的编码模式。模式确定器413可基于根据输入信号的特性当前帧是处于语音模式还是音乐模式以及对于当前帧有效的编码模式是时域模式还是频域模式,来确定CELP模式或另一模式。如果输入信号的特性与语音模式相应,则可确定CELP模式,如果输入信号的特性与语音模式和高比特率相应,则可确定频域模式,如果输入信号的特性与音乐模式和低比特率相应,则可确定音频模式。模式确定器413可在频域模式下将输入信号提供给频域编码器414,在音频模式下经由LP分析器415将输入信号提供给频域激励编码器416,并在CELP模式下经由LP分析器415将输入信号提供给时域激励编码器417。
[0078]频域编码器414可与图1a的音频编码设备110的频域编码器114或图2a的音频编码设备210的频域编码器214相应,并且频域激励编码器416或时域激励编码器417可与图3a的音频编码设备310的频域激励编码器315或时域激励编码器316相应。
[0079]图4b中示出的音频解码设备430可包括参数解码器432、模式确定器433、频域解码器434、频域激励解码器435、时域激励解码器436、LP合成器437和后处理器438。频域解码器434、频域激励解码器435和时域激励解码器436中的每一个可包括相应域中的帧错误隐藏算法。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。由于可通过组合图2b中示出的音频解码设备230和图3b中示出的音频解码设备330来得到图4b中示出的音频解码设备430,因此省略共同部分的操作描述,现在将描述模式确定器433的操作。
[0080]模式确定器433可检查包括在比特流中的编码模式信息,并将当前帧提供给频域解码器434、频域激励解码器435或时域激励解码器436。
[0081]频域解码器434可与图1b的音频解码设备130的频域解码器134或图2b的音频解码设备230的频域解码器234相应,频域激励解码器435或时域激励解码器436可与图3b的音频解码设备330的频域激励解码器334或时域激励解码器335相应。
[0082]图5是根据示例性实施例的频域解码设备的框图,其中,所述频域解码设备可与图2b的音频解码设备230的频域解码器234或图3b的音频解码设备330的频域激励解码器334相应。
[0083]图5中示出的频域解码设备500可包括错误隐藏单元510、频谱解码器530、存储器更新单元550、逆变换器570以及叠加单元590。除了嵌入在存储器更新单元550中的存储器(未示出)之外的组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0084]参照图5,首先,如果从解码的参数确定在当前帧中未发生错误,则可通过经由频谱解码器530、存储器更新单元550、逆变换器570以及叠加单元590对当前帧进行解码来最终产生时域信号。详细地讲,频谱解码器530可通过使用解码的参数对当前帧执行频谱解码来合成频谱系数。对于后续帧,存储器更新单元550可针对作为好帧的当前帧更新合成的频谱系数、解码的参数、使用所述参数获得的信息、直到当前为止的连续的错误帧的数量、在解码器中通过分析合成的信号而获得的先前帧的特性(信号特性,例如瞬态(transient)特性、正常(normal)特性、稳态(stationary)特性)、先前巾贞的类型信息(从编码器发送的信息,例如瞬态帧和正常帧)等等。逆变换器570可通过对合成的频谱系数执行频率-时间变换来产生时域信号。叠加单元590可使用先前帧的时域信号执行叠加处理,并且作为叠加处理的结果最终产生当前帧的时域信号。
[0085]否则,如果从解码的参数确定在当前帧中发生了错误,则可将解码的参数的坏帧指示符(BFI)设置成例如1,其中,I指示在作为坏帧的当前帧中不存在信息。在此情况下,检查先前帧的解码模式,如果先前帧的解码模式是频域模式,则可对当前帧执行频域中的帧错误隐藏算法。
[0086]也就是说,在当前帧是错误帧并且先前帧的解码模式是频域模式时,错误隐藏单元510可进行操作。错误隐藏单元510可通过使用存储在存储器更新单元550中的信息来恢复当前帧的频谱系数。可通过频谱解码器530、存储器更新单元550、逆变换器570以及叠加单元590对恢复的当前帧的频谱系数进行解码,以最终产生当前帧的时域信号。
[0087]如果当前帧是错误帧,先前帧是好帧,并且先前帧的解码模式是频域模式,或者如果当前帧和先前帧是好帧,并且它们的解码模式是频域模式,则叠加单元590可通过使用作为好帧的先前帧的时域信号来执行叠加处理。否则,如果当前帧是好帧,作为连续的错误帧的先前帧的数量为2或大于2,先前帧为错误帧,并且作为最新的好帧的先前帧的解码模式是频域模式,则叠加单元590可通过使用作为好帧的当前帧的时域信号来执行叠加处理,而不是通过使用作为好帧的先前帧的时域信号来执行叠加处理。这些条件可由下文来表不:
[0088]if ((bfi = = 0)&&(st — old_bfi_int>l)&&(st — prev_bfi == l)&&(st — last_core = = FREQ_C0RE)),
[0089]其中,bfi表示当前帧的错误帧指示符,St — old_bfLint表示作为连续的错误帧的先前巾贞的数量,st — prev_bfi表示先前巾贞的BFI信息,st — last_core表示最新PGF的核心的解码模式,例如频域模式FREQ_C0RE或时域模式HME_C0RE。
[0090]图6是根据示例性实施例的频谱解码器600的框图。
[0091]图6中示出的频谱解码器600可包括无损解码器610、参数反量化器620、比特分配器630、频谱反量化器640、噪声填充单元650和频谱整形单元660。可将噪声填充单元650布置在频谱整形单元660之后。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0092]参照图6,无损解码器610可对已经在编码处理中被执行了无损编码的参数(例如,范数值)进行无损解码。
[0093]参数反量化器620可对无损解码的范数值进行反量化。在编码处理中,可使用各种方法(例如,矢量量化(VQ)、标量量化(SQ)、网格编码量化(TRQ)和格型矢量量化(LVQ))中的任何方法对范数值进行量化,并且,可使用相应方法来对被量化的范数值进行反量化。
[0094]比特分配器630可基于被量化的范数值来分配每个频带所需的比特。在此情况下,针对每个频带分配的比特可以与编码处理中所分配的比特相同。
[0095]频谱反量化器640可通过使用针对每个频带分配的比特执行反量化处理来产生归一化的频谱系数。
[0096]噪声填充单元650可针对每个频带在需要噪声填充的部分中填满噪声。
[0097]频谱整形单元660可通过使用反量化的范数值对归一化的频谱系数进行整形。最终,可通过频谱整形处理来获得解码的频谱系数。
[0098]图7是根据示例性实施例的帧错误隐藏单元700的框图。
[0099]图7中示出的帧错误隐藏单元700可包括信号特性确定器710、参数控制器730、回归分析器750、增益计算器770和缩放器790。组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0100]参照图7,信号特性确定器710可通过使用解码的信号来确定信号的特性,并将解码的信号的特性分类为瞬态、正常、平稳等。现在在下面将描述确定瞬态帧的方法。根据示例性实施例,可使用先前帧的帧能量和移动平均能量来确定当前帧是否为瞬态。为此,可使用针对好巾贞获得的移动平均能量Energy_MA和差能量Energy_difT。现在将描述获得Energy_MA 和 Energy_diff 的方法。
[0101]如果假设帧的能量或范数值的总和为Energy_Curr ,则可通过Energy_MA =Energy_MAX0.8+Energy_CurrX0.2 来获得 Energy_MA。在此情况下,可将 Energy_MA 的初始值设置成例如100。
[0102]然后,可通过对Energy_MA和Energy_Curr之差进行归一化来获得Energy_diff,并且可通过 Energy_diff = (Energy_Curr-Energy_MA) /Energy_MA 来表不 Energy_diff ?
[0103]当Energy_diff等于或大于预定阈值ED_THRES(例如,1.0)时,信号特性确定器710可确定当前帧为瞬态。1.0的Energy_diff指示Energy_Curr是Energy_MA的两倍,并可指示与先前帧相比当前帧的能量的变化是非常大的。
[0104]参数控制器730可使用由信号特性确定器710确定的信号特性以及包括在从编码器发送的信息中的帧类型和编码模式来控制用于帧错误隐藏的参数。可使用从编码器发送的信息或由信号特性确定器710获得的瞬态信息来执行瞬态确定。当同时使用所述两种类型的信息时,可使用以下条件:即,如果作为从编码器发送的瞬态信息isjransient是1,或如果作为由解码器获得的信息Energy_diff等于或大于预定阈值ED_THRES(例如,1.0),则这指示当前帧是能量变化剧烈的瞬态帧,并且因此可减小将用于回归分析的PGF的数量num_pgf。否则,确定当前帧不是瞬态帧,并且可增加num_pfg。
[0105]
【权利要求】
1.一种巾贞错误隐藏方法,包括: 通过对从形成错误帧的第一多个频带构成的多个组执行基于组的回归分析来预测参数; 通过使用基于组预测的参数来隐藏错误帧中的错误。
2.如权利要求1所述的帧错误隐藏方法,其中,被预测的参数是包括在每个组中的第二多个频带的平均能量。
3.如权利要求1所述的帧错误隐藏方法,其中,预测参数的步骤包括: 从第一多个频带形成所述多个组; 确定错误帧的信号特性; 根据确定的结果来确定将用于回归分析的先前好帧(PGF)的数量,并使用确定的PGF的数量来执行基于组的回归分析。
4.如权利要求3所述的帧错误隐藏方法,其中,使用从编码器发送的瞬态标志执行信号特性的确定,并且确定信号特性的步骤包括:当先前帧为瞬态时确定错误帧为瞬态。
5.如权利要求3所述的帧错误隐藏方法,其中,使用截止到PGF而获得的移动平均能量以及PGF的能量和所述移动平均能量之间的差能量来执行信号特性的确定,并且确定信号特性的步骤包括:根据对差能量和预定阈值进行比较的结果来确定错误帧为瞬态。
6.如权利要求3所述的帧错误隐藏方法,其中,使用从编码器发送的瞬态标志、截止到PGF而获得的移动平均能量、以及错误帧和PGF之间的差能量来执行信号特性的确定。
7.如权利要求1所述的帧错误隐藏方法,其中,隐藏错误的步骤包括: 获得基于组预测的参数和PGF的相应组的参数之间的增益; 通过使用获得的增益对PGF的每个频带的参数进行缩放以产生错误帧的参数。
8.如权利要求7所述的帧错误隐藏方法,其中,缩放的步骤包括:当错误帧具有突发错误持续时间时,根据错误帧是否为瞬态来将突发错误持续时间的区段缩小固定值。
9.如权利要求7所述的帧错误隐藏方法,其中,缩放的步骤包括:当错误帧具有突发错误持续时间时,根据PGF的信号特性缩小突发错误持续时间的区段。
10.如权利要求7所述的帧错误隐藏方法,其中,缩放的步骤包括:当错误帧具有突发错误持续时间时,根据PGF的信号特性将随机符号应用于突发错误持续时间的区段。
11.一种音频编码方法,包括: 通过对好帧进行解码来获取频谱系数; 通过对从形成错误帧的第一多个频带形成的多个组执行基于组的回归分析来预测参数,并通过使用基于组预测的参数来获取错误帧的频谱系数; 将好帧或错误帧的解码的频谱系数变换到时域,并通过执行叠加处理来重建时域中的信号。
12.如权利要求11所述的音频解码方法,其中,在叠加处理中,在当前帧是好帧,连续先前错误帧的数量为2或大于2,先前帧是错误帧,并且最新的好帧的编码模式是频域模式时,当前帧与后续好帧(NGF)的时域信号重叠。
【文档编号】G10L19/005GK104011793SQ201280063727
【公开日】2014年8月27日 申请日期:2012年10月22日 优先权日:2011年10月21日
【发明者】成昊相 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1