声音信号处理装置、声音信号处理方法和程序的制作方法

文档序号:2832968阅读:242来源:国知局
专利名称:声音信号处理装置、声音信号处理方法和程序的制作方法
技术领域
本发明涉及声音信号处理装置、声音信号处理方法及程序。更具体而言,本发明涉及其中对输入信号执行频带扩展处理的声音信号处理装置、声音信号处理方法及程序。
背景技术
在数据通信和数据记录处理过程中,为了减少数据量,在多数情况下执行压缩处理。但是,当声音信号被压缩并被传送或被记录时,包括在原始声音数据中的频带成分在某些情况下会丢失。
因此,当对被压缩的数据进行解压和再现时,在某些情况下会再现出与原始声音数据不同的声音数据。已经提出了一些其中在上述压缩数据的解压过程中对在压缩过程中丢失的频率部分进行恢复和解压的构造。例如,日本未审查专利公开号No. 2007-17908公开了一种频带扩展处理,其中通过该频带扩展处理来对在压缩处理过程中丢失的高频信号执行生成处理。但是,问题在于,很难利用简单的构造来执行高精度的扩展处理,然而为了实现高精度的扩展,需要增加处理负担、处理时间和装置成本,如在有关技术的带扩展处理过程中出现的问题。

发明内容
期望提供能够利用简单的构造来实现更高精度的频带扩展处理的声音信号处理装置、声音信号处理方法及程序。根据本发明的第一实施例,提供了一种声音信号处理装置,该声音信号处理装置包括频率分析单元,该频率分析单元实施输入声音信号的频率分析;低频包络计算单元,该低频包络计算单元基于该频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息;高频包络信息估计单元,该高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中该学习用声音信号是用于从低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与该输入声音信号相对应的低频包络信息中生成与输入信号相对应的估计高频包络信息;以及频率合成单元,该频率合成单元对与由该高频包络信息估计单元生成的估计高频包络信息相对应的高频带信号和该输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。另外,该被学习数据包括包络增益信息,其中利用该包络增益信息从低频包络增益信息中估计高频包络增益信息,以及包络形状信息,其中利用该包络形状信息从低频包络形状信息中估计高频包络形状信息,并且该高频包络信息估计单元包括高频包络增益估计单元,该高频包络增益估计单元施加包含在该被学习数据中的包络增益信息,并且从与输入声音信号相对应的低频包络增益信息中估计与输入信号相对应的估计高频包络增益信息,以及高频包络形状估计单元,该高频包络形状估计单元施加包含在该被学习数据中的包络形状信息,并且从与输入声音信号相对应的低频包络形状信息中估计与输入信号相对应的估计高频包络形状信息。此外,该高频包络形状估计单元可以输入通过对由该低频包络计算生成的、输入声音信号的低频包络信息执行过滤处理所生成的成形低频包络信息,并且估计与该输入信号相对应的估计高频包络形状信息。此外,该频率分析单元可以对该输入声音信号执行时间频率分析并且生成时间频P曰。
另外,该低频包络计算单元可以输入由该频率分析单元所生成的输入声音信号的时间频谱,并且生成低频倒谱。此外,该高频包络信息估计单元可以包括高频包络增益估计单元,该高频包络增益估计单元施加包含在该被学习数据中的包络增益信息,并且从与该输入声音信号相对应的低频包络增益信息中估计与该输入信号相对应的估计高频包络增益信息,并且该高频包络增益估计单元将包含在该被学习数据中的包络增益信息施加到基于该输入声音信号所生成的低频倒谱信息中,并且从与该输入声音信号相对应的低频包络增益信息中估计与该输入信号相对应的估计高频包络增益信息。此外,该高频包络信息估计单元可以包括高频包络形状估计单元,该高频包络形状估计单元施加包含在该被学习数据中的包络形状信息,并且从与该输入声音信号相对应的低频包络形状信息中估计与该输入信号相对应的估计高频包络形状信息,并且该高频包络形状估计单元基于根据该输入声音信号所生成的成形低频倒谱信息,通过利用包含在该被学习数据中的包络形状信息执行处理来估计与该输入声音信号相对应的高频包络形状信息。另外,该高频包络形状估计单元通过利用GMM(高斯混合模型)执行估计处理来估计与该输入声音信号相对应的高频包络形状信息。此外,该声音信号处理装置还可以包括学习处理单元,该学习处理单元基于该学习用声音信号生成该被学习数据,其中该学习用声音信号包括高频带中的频率,其中该高频带并不包含在该输入声音信号中,并且该高频包络信息估计单元施加由该学习单元所生成的该被学习数据,并且从与该输入声音信号相对应的低频包络形状信息中生成与该输入信号相对应的估计高频包络信息。根据本发明的第二实施例,提供了一种声音信号处理装置,该声音信号处理装置包括从第一信号中计算第一包络信息的功能;通过过滤处理去除第一包络信息在时间方向上的DC成分,以去除环境因素的功能,其中该环境因素包括收集声音的功能和传送功能的至少一者;以及将通过在过滤后对第一包络信息进行线性转换所获得的第二包络信息视作第二信号的包络信息,并且对第二信号和第一信号进行合成的功能。根据本发明的第三实施例,提供了一种声音信号处理装置,该声音信号处理装置包括从低频信号中计算第一包络信息的功能;计算比率的功能,其中在该比率处,该低频包络信息属于通过学习大量数据而提前被分类的多个组;基于被分别分配给该多个组的线性转换等式对该低频包络信息执行线性转换并且生成多个高频包络信息项的功能;以及为了在时间轴上生成光滑的高频包络信息,将在该高频包络信息项属于多个组的比率处通过混合该多个高频包络信息项所得到的高频包络信息视作高频信号的包络信息,并且对该高频信号和该低频信号进行合成的功能。根据本发明的第四实施例,提供了一种声音信号处理方法,其中根据该声音信号处理方法对声音信号处理装置中的输入声音信号执行频带扩展处理,该方法包括由频率分析单元实施输入声音信号的频率分析;由低频包络计算单元基于该频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息;由高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中该学习用声音信号是用于从该低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与该输入声音信号相对应的低频包络信息中生成与输入信号相对应的估计高频包络信息;以及由频率合成单元对与由所述高频包络信息估计单元生成的所述估计高频包络信息相对应的高频带信号和该输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。根据本发明的第五实施例,提供了一种声音信号处理方法,其中根据该声音信号 处理方法对声音信号处理装置中的输入声音信号执行频带扩展处理,该方法包括从第一信号中计算第一包络信息;通过过滤处理去除所述第一包络信息在时间方向上的DC成分,以去除环境因素,其中该环境因素包括收集声音的功能和传送功能的至少一者;以及将通过在过滤后对第一包络信息进行线性转换所获得的第二包络信息视作第二信号的包络信息,并且对第二信号和第一信号进行合成。根据本发明的第六实施例,提供了一种声音信号处理方法,其中根据该声音信号处理方法对声音信号处理装置中的输入声音信号执行频带扩展处理,该方法包括从低频信号中计算第一包络信息;计算比率,其中在该比率处,该低频包络信息属于通过学习大量数据而提前被分类的多个组;基于被分别分配给该多个组的线性转换等式对该低频包络信息执行线性转换并且生成多个高频包络信息项;以及为了在时间轴上生成光滑的高频包络信息,将在该高频包络信息项属于多个组的比率处通过混合该多个高频包络信息项所得到的高频包络信息视作高频信号的包络信息,并且对该高频信号和该低频信号进行合成。根据本发明的第七实施例,提供了一种使声音信号处理装置对输入声音信号执行频带扩展处理的程序,该程序包括使频率分析单元实施输入声音信号的频率分析;使低频包络计算单元基于该频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息;使高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中该学习用声音信号是用于从该低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与该输入声音信号相对应的低频包络信息中生成与输入信号相对应的估计高频包络信息;以及使频率合成单元对与由该高频包络信息估计单元生成的估计高频包络信息相对应的高频带信号和该输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。另外,根据本发明的程序是能够被设置到图像处理装置或计算机系统的程序,其中该计算机系统例如能够通过记录计算机可读形式的介质或通信介质来实施各种程序编码。通过设置上述计算机可读形式的程序,可以根据信息处理装置或计算机系统上的程序来实施处理。将通过下述的本发明实施例和基于附图的更具体描述对本发明的其它目的、特征和优点进行分类。另外,本说明书中的系统是多个装置的逻辑复合构造,并没有将其限制为其中将各个构造安装在同一壳体中的构造。
根据本发明实施例的构造,实现了其中对声音信号高度精确地执行频带扩展的装置和方法。根据本发明实施例的构造,基于输入声音信号的频率分析结果计算了作为低频带的包络信息的低频包络信息。此外,通过施加基于学习用声音信号的被学习信号,从与输入声音信号相对应的低频包络信息中估计并生成了与输入信号相对应的高频包络信息,例如,其中通过被学习信号从低频包络信息中计算出了作为高频带的包络信息的高频包络信息。此外,对在估计处理过程中所生成的、与对应于输入信号的高频包络信息相对应的高频带信号和输入信号进行合成,以产生其中频带被扩展的输出声音信号。通过利用被学习数据来估计高频带的包络增益和包络形状,实现了高度精确的频带扩展。


图I是解释声音信号处理装置的构造示例的视图;图2是解释频率分析处理和包络信息计算处理的视图;图3A与图3B是示出其中包络形状随时间的变化(更精确而言,各个程度的倒谱)因声源而不同的状态视图;图4A与图4B是示出当声音信号的包络形状内包括DC成分和当其中不包括DC成分的包络形状随时间变化的视图;图5是示出包络形状中的DC成分的时间序列数据的视图;图6A与图6B是示出包络形状DC的频域的状态视图;图7A至图7D是解释参考基于Kmeans和GMM的建模数据通过包络形状学习单元对包络形状进行估计处理的视图;图8A与图8B是解释参考基于Kmeans和GMM的建模数据通过高频包络形状学习单元对高频包络形状信息进行估计处理的视图;以及图9A与图9B是解释在使用(a) Kmeans和(b)GMM的任一者的情况下,在超出簇边界的同时,当映射源发生变化时映射数据如何变化的视图。
具体实施例方式下面,将参考附图具体描述根据本发明的声音信号处理装置、声音信号处理方法和程序。将按照以下次序进行描述。I.关于根据本发明的声音信号处理装置的整体构造2.关于信号处理装置中的各个构件的处理2. I关于频率分析单元2. 2关于低频包络计算单元
2. 3关于高频包络计算单元2. 4关于包络信息成形单元2. 5关于包络增益学习单元和包络形状学习单元2. 6关于高频包络形状估计单元2. 7关于高频包络增益估计单元2. 8关于中频包络校正单元
2. 9关于高频包络校正单元2. 10关于频率合成单元[I.关于根据本发明的声音信号处理装置的整体构造]首先,将参考图I对根据本发明实施例的信号处理装置的整体构造进行描述。图I是示出根据本发明实施例的声音信号处理装置100的示例视图。图I所示的声音信号处理装置100包括处于上一 阶段的学习处理单元110和处于下一阶段的分析处理单元120。使被输入到分析处理单元120的输入声音信号81经受频带扩展处理,并且将其作为输出声音信号82输出。在由分析处理单元120实施的频带扩展处理过程中,学习处理单元110使用了基于声音信号51的数据以便进行学习。学习处理单兀110输入学习用声音信号51,对该学习用声音信号51进行分析,并且生成经学习的数据,如频率包络等等。分析处理单元120使用学习处理单元110所生成的学习结果,以对输入声音信号81执行频带扩展处理。如图I所示,学习处理单元110包括频率分析单元111、低频包络计算单元112、高频包络计算单元113、包络信息成形单元114、包络增益学习单元115和包络形状学习单元116。另外,分析处理单元120包括频率分析单元121、低频包络计算单元122、包络信息成形单元123、高频包络增益估计单元124、高频包络形状估计单元125、中频包络校正单元126、高频包络校正单元127和频率合成单元128。由图I所示的学习处理单元110作为学习目标输入的学习用声音信号51的采样频率(fs2)与分析处理单元120的输出信号,即频带扩展处理后的输出声音信号82的采样频率(fs2)相同。这两个信号的采样频率(fs2)的数值是分析处理单元120的输入信号,即作为频带扩展处理目标的输入声音信号81的采样频率(fsl)的数值的两倍。另外,fsl和fs2分别表示采样频率,并且满足(fs2) = 2X (fsl)的对应关系。也就是说,由分析处理单元120输入的输入声音信号81的采样频率(fsl)是其中频带被压缩的信号,并且分析处理单元120实施该输入信号频带的扩展处理,并且生成并输出采样频率(fs2)为双倍的输出声音信号82。在带扩展处理过程中,分析处理单元120从学习处理单元110得到了被学习过的数据,并且使用该被学习过的数据以高精度地实施频带扩展处理,其中该学习过的数据的采样频率(fs2)与输出声音信号82的采样频率(fs2)相同。下面,将具体描述各个构件的处理。[2.关于信号处理装置中各个构件的处理](2. I关于频率分析单元)如图I所示,频率分析单元被设置在学习处理单元110和分析处理单元120的每
一者中。图I所示的学习处理单元110的频率分析单元111输入采样频率为(fs2)的学习用声音信号51,并且对该学习用声音信号51执行频率分析。另外,分析处理单元120的频率分析单元121对作为频带扩展处理目标的输入声音信号81执行时间频率分析。参考图2,将描述由频率分析单兀111和频率分析单兀121所实施的时间频率分析。频率分析单元111和频率分析单元121对输入声音信号执行时间频率分析。假设X表示经由麦克分等输入的输入信号。输入信号X如图2中的最上阶段中所示。横轴表示时间(或采样数目),而纵轴表示振幅。相对于学习处理单元110的频率分析单元111的输入信号X是采样频率为(fs2)的学习用声音信号51。 另外,相对于分析处理单元120的频率分析单元121的输入信号X是采样频率为(fsl)的输入声音信号81,即频带扩展处理过程中的处理目标信号。首先,频率分析单元111和频率分析单元121将帧从输入信号X分割成固定尺寸以得到输入帧信号X (n,I)。这与图2的步骤SlOl中的处理相对应。在图2所示的处理中,进行设定使得帧分割尺寸为N,各帧的偏移量(Sf)为帧尺寸N的50%,并且各个帧相互重叠。此外,输入帧信号X (n,I)乘以预定的窗口函数w得到了窗口函数适用信号wx (n,I)。例如,可适用通过计算Hanning窗口的平方根所得到的窗口函数。窗口函数适用信号wx (n,I)用下列(等式I)来表示。
、 .输入信号、
n:时间指数wx(n, I) = Wana {n) * x(n, I) /帧数目
Wana-.窗口函数
窗口函数适用信号,
((n Vi0.5
w (n) = 0.5-0.5*cos In一 (N中贞尺寸)
_ II N))…(等式I)在(等式I)中,各个符号使用如下X :输入信号;n :时间指数,其中 n = O、.、N_1、1 =()、 、L_1(N 为帧尺寸);I :帧数目,其中I = O、.、L_1(L为帧的总数目);w_ana :窗口函数;以及wx:窗口函数适用信号。尽管通过计算Hanning窗口的平方根所得到的窗口函数适用作上述示例中的窗口函数w_ana,但是另外也可适用诸如正弦函数之类的窗口函数。帧尺寸N例如是与0.02秒相对应的采样数目(N =采样频率fs*0. 02)。但是,也可适用其它尺寸,尽管在图2的示例中进行了设定使得帧偏移量(sf)为帧尺寸(N)的50%,并且各个帧相互重叠,但是也可适用其它偏移量。
基于下列(等式2)对通过(等式I)所得到的窗口函数适用信号wx (n,I)执行时间频率分析,以得到时间频谱Xana (k, I)。
权利要求
1.一种声音信号处理装置,所述声音信号处理装置包括 频率分析单元,所述频率分析单元实施输入声音信号的频率分析; 低频包络计算单元,所述低频包络计算单元基于所述频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息; 高频包络信息估计单元,所述高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中所述学习用声音信号是用于从所述低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与所述输入声音信号相对应的所述低频包络信息中生成与输入信号相对应的估计高频包络信息;以及 频率合成单元,所述频率合成单元对与由所述高频包络信息估计单元生成的所述估计高频包络信息相对应的高频带信号和所述输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。
2.根据权利要求I所述的声音信号处理装置, 其中所述被学习数据包括 包络增益信息,其中利用所述包络增益信息从低频包络增益信息中估计高频包络增益f目息,以及 包络形状信息,其中利用所述包络形状信息从低频包络形状信息中估计高频包络形状信息,并且 其中所述高频包络信息估计单元包括 高频包络增益估计单元,所述高频包络增益估计单元施加包含在所述被学习数据中的所述包络增益信息,并且从与所述输入声音信号相对应的所述低频包络增益信息中估计与所述输入信号相对应的所述估计高频包络增益信息,以及 高频包络形状估计单元,所述高频包络形状估计单元施加包含在所述被学习数据中的所述包络形状信息,并且从与所述输入声音信号相对应的所述低频包络形状信息中估计与所述输入信号相对应的所述估计高频包络形状信息。
3.根据权利要求2所述的声音信号处理装置, 其中所述高频包络形状估计单元输入通过对由所述低频包络计算生成的、所述输入声音信号的所述低频包络信息执行过滤处理所生成的成形低频包络信息,并且估计与所述输入信号相对应的所述估计高频包络形状信息。
4.根据权利要求I所述的声音信号处理装置, 其中所述频率分析单元对所述输入声音信号执行时间频率分析并且生成时间频谱。
5.根据权利要求I所述的声音信号处理装置, 其中所述低频包络计算单元输入由所述频率分析单元所生成的所述输入声音信号的时间频谱,并且生成低频倒谱。
6.根据权利要求I所述的声音信号处理装置, 其中所述高频包络信息估计单元包括 高频包络增益估计单元,所述高频包络增益估计单元施加包含在所述被学习数据中的所述包络增益信息,并且从与所述输入声音信号相对应的所述低频包络增益信息中估计与所述输入信号相对应的所述估计高频包络增益信息,并且 其中所述高频包络增益估计单元将包含在所述被学习数据中的所述包络增益信息施加到基于所述输入声音信号生成的低频倒谱信息中,并且从与所述输入声音信号相对应的所述低频包络增益信息中估计与所述输入信号相对应的所述估计高频包络增益信息。
7.根据权利要求I所述的声音信号处理装置, 其中所述高频包络信息估计单元包括 高频包络形状估计单元,所述高频包络形状估计单元施加包含在所述被学习数据中的所述包络形状信息,并且从与所述输入声音信号相 对应的所述低频包络形状信息中估计与所述输入信号相对应的所述估计高频包络形状信息,并且 其中所述高频包络形状估计单元基于根据所述输入声音信号所生成的成形低频倒谱信息,通过利用包含在所述被学习数据中的所述包络形状信息执行处理来估计与所述输入声音信号相对应的所述高频包络形状信息。
8.根据权利要求7所述的声音信号处理装置, 其中所述高频包络形状估计单元通过利用GMM(高斯混合模型)执行估计处理来估计与所述输入声音信号相对应的所述高频包络形状信息。
9.根据权利要求I所述的声音信号处理装置,还包括 学习处理单元,所述学习处理单元基于所述学习用声音信号生成所述被学习数据,其中所述学习用声音信号包括高频带中的频率,其中所述高频带并不包含在所述输入声音信号中, 其中所述高频包络信息估计单元施加由所述学习单元所生成的所述被学习数据,并且从与所述输入声音信号相对应的所述低频包络形状信息中生成与所述输入信号相对应的所述估计高频包络信息。
10.一种声音信号处理装置,所述声音信号处理装置包括 从第一信号中计算第一包络信息的功能; 通过过滤处理去除所述第一包络信息在时间方向上的DC成分,以去除环境因素的功能,其中所述环境因素包括收集声音的功能和传送功能的至少一者;以及 将通过在过滤后对所述第一包络信息进行线性转换所获得的第二包络信息视作第二信号的包络信息,并且对所述第二信号和所述第一信号进行合成的功能。
11.一种声音信号处理装置,所述声音信号处理装置包括 从低频信号中计算第一包络信息的功能; 计算比率的功能,其中在所述比率处,所述低频包络信息属于通过学习大量数据而提前被分类的多个组; 基于被分别分配给所述多个组的线性转换等式对所述低频包络信息执行线性转换并且生成多个高频包络信息项的功能;以及 为了在时间轴上生成光滑的高频包络信息,将通过将多个高频包络信息与属于多个组的比率混合所得到的高频包络信息视作高频信号的包络信息,并且对所述高频信号和所述低频信号进行合成的功能。
12.—种声音信号处理方法,其中根据所述声音信号处理方法对声音信号处理装置中的输入声音信号执行频带扩展处理,所述方法包括 由频率分析单元实施输入声音信号的频率分析; 由低频包络计算单元基于所述频率分析单元的分析结果,计算作为低频带的包络信息的低频包络 信息; 由高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中所述学习用声音信号是用于从所述低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与所述输入声音信号相对应的所述低频包络信息中生成与输入信号相对应的估计高频包络信息;以及 由频率合成单元对与由所述高频包络信息估计单元生成的所述估计高频包络信息相对应的高频带信号和所述输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。
13.—种声音信号处理方法,其中根据所述声音信号处理方法对声音信号处理装置中的输入声音信号执行频带扩展处理,所述方法包括 从第一信号中计算第一包络信息; 通过过滤处理去除所述第一包络信息在时间方向上的DC成分,以去除环境因素,其中所述环境因素包括收集声音的功能和传送功能的至少一者;以及 将通过在过滤后对所述第一包络信息进行线性转换所获得的第二包络信息视作第二信号的包络信息,并且对所述第二信号和所述第一信号进行合成。
14.一种声音信号处理方法,其中根据所述声音信号处理方法对声音信号处理装置中的输入声音信号执行频带扩展处理,所述方法包括 从低频信号中计算第一包络信息; 计算比率,其中在所述比率处,所述低频包络信息属于通过学习大量数据而提前被分类的多个组; 基于被分别分配给所述多个组的线性转换等式对所述低频包络信息执行线性转换并且生成多个高频包络信息项;以及 为了在时间轴上生成光滑的高频包络信息,将通过将多个高频包络信息与属于多个组的比率混合所得到的高频包络信息视作高频信号的包络信息,并且对所述高频信号和所述低频信号进行合成。
15.一种使声音信号处理装置对输入声音信号执行频带扩展处理的程序,所述程序包括 使频率分析单元实施输入声音信号的频率分析; 使低频包络计算单元基于所述频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息; 使高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中所述学习用声音信号是用于从所述低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与所述输入声音信号相对应的所述低频包络信息中生成与输入信号相对应的估计高频包络信息;以及 使频率合成单元对与由所述高频包络信息估计单元生成的所述估计高频包络信息相对应的高频带信号和所述输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。
全文摘要
本发明涉及声音信号处理装置、声音信号处理方法和程序。该声音信号处理装置包括频率分析单元,其实施输入声音信号的频率分析;低频包络计算单元,其基于该频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息;高频包络信息估计单元,其施加基于学习用声音信号所提前生成的被学习信号,其中该学习用声音信号是用于从该低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与该输入声音信号相对应的该低频包络信息中生成与输入信号相对应的估计高频包络信息;以及频率合成单元,其对与由该高频包络信息估计单元生成的估计高频包络信息相对应的高频带信号和该输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。
文档编号G10L21/02GK102637436SQ20121002744
公开日2012年8月15日 申请日期2012年2月2日 优先权日2011年2月9日
发明者光藤祐基 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1