音频信号合成的制作方法

文档序号：2830112阅读：1053来源：国知局

专利名称：音频信号合成的制作方法
音频信号合成本发明涉及音频信号合成。本发明尤其涉及其中确定所合成信号的相位的音频信号合成装置和方法。本发明进一步涉及修改音频信号频率的装置和方法，该装置包括上面提到的音频信号合成装置或方法。利用诸如频率和相位的信号参数来合成音频信号是众所周知的。该合成可被实施用于在电子乐器或其它诸如移动(蜂窝)电话的消费类装置中生成声音信号。可替换地，该合成可以由解码器实施，对前面编码过的音频信号进行解码。编码方法的例子是参数编码，其中音频信号在每个时间段被分解为正弦分量、噪声分量和可选的其它分量，这些分量每一个都可用适当的参数来表示。在适当的解码器中，这些参数用于充分地重构原始的音频信号。由A. C. den Br inker 、 E. G. P. Schui jers和A. W丄Oomen在Audio Engineering Society Convention Paper 5554， Mun i ch (Germany) ， May 2002上发表的论文"Parametric Coding for High-Quality Audio" 揭示了正弦轨道(track)在参数编码中的应用。利用瞬态对象、正弦对象和噪声对象对音频信号建模。每个时间帧估计一次正弦对象的参数。每一帧估计的频率在帧上链接起来，由此形成正弦轨道。这些轨道指示时间帧的哪些正弦对象继续进入下一时间帧。国际专利申请WO 02/056298 (飞利浦)揭示了参数编码中信号分量的链接。链接单元生成指示连续延伸的信号段分量的链接信息，其中所述连续延伸的信号段可以被链接在一起，形成正弦轨道。尽管这些已知的方法提供了令人满意的结果，但是它们还存在着跨越时间帧边界的正弦曲线链接会带来相位误差的缺点。如果某个时间帧的正弦曲线被链接到下一时间帧的错误的正弦曲线上，则一般会造成相位失配。这种相位失配将会产生所合成音频信号的可听失真。因此本发明的目标是克服现有技术的这些以及其它问题，并且提供一种合成音频信号的装置和方法，其中避免或至少大大地减轻相位的不连续性。因此，本发明提供一种用于合成音频信号的信号合成装置，该装置包括-正弦合成单元，用于利用至少一个表示音频信号频率的频率参数和至少一个表示音频信号相位的相位参数来合成音频信号，以及-参数产生单元，用于利用(至少一个)频率参数和已合成的音频信号来产生(至少一个)相位参数。通过利用已经合成的音频信号来产生相位，使用能够提供基本上连续相位的相位环。更特别地，正弦合成单元中4吏用的相位从已合成的音频信号中导出，因此能够正确地匹配音频信号。结果，相位预测得以极大改善，且相位预测误差的数量因此大大减少。包括在环中的任何时间延迟均优选地被考虑进来。在本发明的装置中，可以删除用于将连续分段的信号分量链接起来的常规的链接单元，由此避免了由于这种链接单元所造成的任何相位失配。在优选实施例中，已合成的音频信号包括时间段，且参数产生单元被安排为利用音频信号的前一时间段来产生当前的相位参数。在这些实施例中，正被合成的段的相位由前面已合成的段的相位导出，优选是紧接着的前一段。以这种方式，可以保持已合成音频信号的相位与正在合成的音频信号的相位之间的紧密关系。进一步优选地，参数产生单元包括,皮安排为确定一組相位/频率对的相位确定单元，其中每个相位/频率对表示音频信号一个频率的相位。在该实施例中，从已合成的音频信号中导出一组相位和它们相关联的频率。有利地，参数产生单元可以进一步包括相位预测单元，该相位预测单元被安排为一将频率参数与该组相位/频率对进行比举交，并选择最接近该频率参数的相位/频率对，并且-利用频率参数和所选择的相位产生相位参数。因此，参数产生单元可以选择与由频率参数所表示的频率最匹配的频率，然后在合成中使用与所选择的频率相关联的相位。这种选择可以实施几次，如果多个频率被用于合成音频信号的话，则优选是每个频率实施一次选择。所合成的音频信号可以具有由频率参数所表示的频率(或多个频率)。然而，还希望能修改该频率(或这些频率)。因此，在一个有利实施例中，参数产生单元包括频率修改单元，用于响应控制参数来修改频率参数。该(频率)控制参数例如可以是乘法因数，等于1的值对应于没有频率变化，小于1的值对应于减小的频率，而大于1的值对应于增大的频率。在其它实施例中，控制参数可以指示频率偏移。尽管本发明可以仅仅利用频率参数(或多个频率参数)和相位参数(或多个相位参数)来实现，但是优选地可以利用附加参数来进一步定义要被合成的音频信号。因此，正弦合成单元可以附加地使用幅度参数。另外，或者可替换地，本发明的装置可以进一步包括乘法单元，用增益参数乘以所合成的音频信号。如果所合成的音频信号由时间段(时间帧)组成，则当该装置进一步包括重叠相加(overlap-and-add)单元是有益的，其中该重叠相加单元将所合成的音频信号的时间段连接起来。其本身公知的这种重叠相加单元用于通过将信号的重叠时间段部分地相加，产生基本连续的音频数据流。如杲提供了分段单元和重叠相加单元，有益地，该分段单元可以由第一重叠参数来控制，而重叠相加单元由第二重叠参数来控制，该装置被安排为通过改变重叠参数来进行时间缩放(scaling)。本发明的装置可以接收频率参数、相位参数和来自于存储介质、解复用器或任意其它适当来源的任意其它参数。当本发明的装置用作对在前面已经利用参数编码器而被编码的音频信号进行解码(也就是合成)的解码器时，将尤其是这种情况。然而，在更加有利的实施例中，本发明的装置可以自己产生参数。因此在这些实施例中，该装置进一步包括正弦分析单元，用于接收输入音频信号及产生频率参数和相位参数。其中音频信号被首先编码(即被分析并用信号参数表示)然后被解码(即使用所述信号参数合成)的装置实施例可用于通过修改参数来修改信号特性，例如频率。因此，本发明还提供一种包括如上定义的信号合成装置的频率修改装置，该频率修改装置包括频率修改单元，用于响应控制参数来修改频率参数，还包括正弦分析单元，用于接收输入音频信号并产生频率参数和相位参数。
当提供有用于接收输入音频信号并产生频率参数和相位参数的正
弦分析单元时，本发明的信号合成装置可以有利地进一步包括 -用于产生合成音频信号的另一个正弦合成单元，和 -用于将所合成的音频信号与输入音频信号进行比较，从而产生
增益参数的比较单元。
在该实施例中，产生增益参数，该参数允许已合成音频信号的增
益被针对由于编码(参数化)过程而导致的任意增益修改调整。
该装置可进一步包括分段单元，用于将音频信号划分为时间段。
然而，某些实施例可安排为用于接收已经被划分为时间段的音频信号，
且因此将不需要分段单元。
本发明还提供一种语音变换装置，包括
-线性预测分析单元，用于响应输入语音信号而产生预测参数和残余信号，
-音调适配(adaptation)单元，用于适配残余4言号的音调，/人而产生音调适配的残余信号，和
-线性预测合成单元，用于响应该音调适配的残余信号而合成输出语音信号。
其中该音调适配单元包括如上定义的用于修改音频信号频率的装置。线性预测合成单元可安排为响应音调适配的残余信号和预测参数而合成输出语音信号。
本发明附加地提供一种包括如上定义的装置的音频系统。本发明的音频系统可以进一步包括语音合成器和/或音乐合成器。本发明的装置可用在例如消费类装置中，诸如移动(蜂窝)电话、MP3或AAC播放器、电子乐器、包括音频(例如立体声或5. 1 )和视频(例如电视机) 以及诸如计算机设备的其它装置的娱乐系统。特别地，本发明可用于通过不对音频信号相位进行编码而实现节省比特和/或比特率的应用中。
本发明还提供一种合成音频信号的方法，该方法包括如下步骤 -利用至少一个表示音频信号频率的频率参数和至少一个表示音频信号相位的相位参数来合成音频信号，并且 -利用频率参数和音频信号来产生相位参数。优选地，所合成的音频信号包括时间段，且相位产生步骤包括利用音频信号的前一时间段来产生当前相位参数的子步骤。
特別优选地，相位预测步骤包括确定一组相位/频率对的子步骤，每个相位/频率对表示音频信号一个频率的相位。
相位预测步骤可以进一步包括如下子步骤
-比较频率参数和该组相位/频率对，并选择最接近该频率参数
的相位/频率对，并且
-利用频率参数和所选择的相位产生相位参数。相位预测步骤可有利地进一步包括响应控制参数而修改频率参数
的子步骤。
本发明还提供一种包括如上定义的正弦合成方法的频率修改方法，它包括响应控制参数而修改频率参数，并接收输入音频信号及产生频率参数和相位参数的子步骤。
本发明进一步提供一种语音变换方法，包括如下步骤 -响应输入语音信号而产生预测参数和残余信号， -适配残余信号的音调，从而产生音调适配的残余信号，并且 -响应音调适配的残余信号而合成输出语音信号，其中该音调适配步骤包括如上定义的频率<多改方法。合成输出语音信号的步骤可涉及音调适配的残余信号和预测参数。其它有利的方法步骤和/或子步骤将根据本发明在下面所提供的说明而变得显而易见。
本发明附加地提供一种计算机程序产品，用于执行如上定义的方法。计算机程序产品可包括一组存储在诸如CD或DVD的数据载体上的计算机可执行指令。允许可编程计算机执行如上定义的方法的该组计算机可执行指令还可用于从远程服务器，例如经由互联网进行下载。
结合附图所示的典型实施例，本发明在下面将得到进一步解释，其中

图1示意性示出了根据本发明的参数音频信号修改系统。
图2示意性示出了根据本发明的音频信号频率修改装置的实施例。
图3示意性地示出了根据本发明的频率修改音频信号编码器/解码器对。图4示意性地示出了由图3的音频信号编码器/解码器对执行的时间缩放的第一个例子。
图5示意性地示出了由图3的音频信号编码器/解码器对执行的时间缩放的第二个例子。
仅通过图1中的非限制性例子所示出的参数音频信号修改系统1 包括线性预测分析(LPA)单元10、音调适配(PA)单元20、线性预测合成(LPS)单元30和修改(Mod)单元40。参数音频信号修改系统 1的结构本身是已知的，然而，在图1所示的系统1中，音调适配单元 20具有新颖的设计，这将在后面结合图2-4进行更详细描述。
图1的系统1接收音频信号X,该音频信号例如可以是话音(语音) 信号或音乐信号，并输出经修改的音频信号Y。信号X输入到线性预测分析单元10中，该线性预测分析单元10将该信号变换为(时变的) 预测参数p和残余信号r的序列。为此，线性预测单元10包括适当的线性预测分析滤波器。单元10产生的预测参数p是滤波参数，在所示包含在线性预测合成单元30中的线性预测合成滤波器的例子中，该滤波参数允许适当的滤波器响应适当的激励信号而充份地再现信号X。残余信号r (或者在任意的音调适配之后，经修改的残余信号r，)在这里用作激励信号。如上所示，线性预测分析滤波器和线性预测合成滤波器对本领域技术人员来说是公知的，不需要进一步解释。
音调适配(PA)单元20允许音频信号X的音调(主频)通过4奮改残余信号r并产生经修改的残佘信号r，而得到修改。信号X的其它参数可以利用其它f多改单元40来修改，该其它修改单元40 ;故安排为用于修改预测参数p并产生经修改的预测参数P，。在本发明中，其它修改单元40不是必需的，其可被省略。当然，预测参数p应馈送到线性预测合成单元30,以便允许够合成信号Y。
用于修改音频信号频率的装置被示意性地示于图2。装置20可有益地用作图1系统中的音调适配单元，也可用在其它系统中。因此，应该明白，装置2 0不仅可以应用在利用线性预测分析和合成的系统中，而且可以用作其中不使用线性预测分析和合成的音频信号修改装置和 /或系统中的独立单元。
图2所示的装置20包括正弦分析(SiA)单元21、参数产生(PaP)单元22和正弦合成(SiS )单元23。注意到，正弦分析单元21和正弦合成单元23与图1所示的系统1的线性预测分析单元10和线性预测合成单元30不同。
正弦分析单元21接收输入音频信号r。该信号可与图1的残余信号r相同，但是不限于此。例如，图2的输入音频信号r可以与图1 的输入音频信号X相同，并且可以是话音(语音)或音乐信号。
正弦分析单元21分析输入信号r,并产生一组信号参数频率参数f和幅度参数A。频率参数f表示输入信号r的正弦分量的频率。在一些实施例中，可以产生多个频率参数f,，f2，f3，…，每个频率参数表示一个频率。幅度参数A不是必需的，且可以省略(例如当正弦合成单元23中使用固定频率时)。然而，在典型实施例中，将使用幅度参数A (或多个幅度参数At， A2, A3，…)。在优选实施例中，正弦分析单元 21被安排为执行快速傅立叶变换(FFT)来产生频率和幅度参数。
参数产生单元22从正弦分析单元21接收频率参数f,并利用(频率)控制参数C调整该频率参数f。参数产生单元22例如可以包括乘法单元，该乘法单元将频率参数f与控制参数C相乘来产生经修改的频率参数f，，其中f^C. f。如果，在该例子中，C等于l,则频率参数不被修改，如果C小于1，则频率参数值减小，如果C大于l,则频率参数值增大。
根据本发明，参数产生单元22还接收合成信号r，并导出该信号的相位，以便产生相位参数(J)，。参数产生单元22将经修改的频率参数f，和相位参数(J)，馈送至正弦合成单元23,该单元也接收(可选的)幅度参数A。利用这些参数，正弦合成单元23合成输出音频信号r，。
在优选实施例中，正弦合成单元23#皮安排用来实施逆快速傅立叶变换(IFFT)或相似操作。后面将结合图3来详细解释参数产生单元 22。
图3示意性地示出了根据本发明的频率修改音频信号编码器/解码器对。编码器4和解码器5被显示为分离的装置，尽管这些装置可以合并为一个装置(图2中的20)。
仅在图3中通过非限制性例子进行说明的音频信号编码器4包括分段(SEG)单元25、正弦分析(SiA)单元21、(第二)正弦合成(SiS，) 单元23，和最小均方误差(MMSE)单元26。注意到，(附加的)正弦合成(SiS，)单元23，和最小均方误差(MMSE)单元26不是必需的，可以省略。进一步注意到，正弦合成(SiS，)单元23，纟皮表示为第二正弦合成单元，以便将该单元与解码器5中的(第一)正弦合成(SiS)单元23区分开来。
仅在图3中通过非限制性例子进行说明的音频信号解码器5包括正弦分析(SiS)单元23、参数产生单元22、增益控制单元24和重叠相加(0LA)和时间缩放(TS)单元25，。基本上对应于图2的参数产生(PaP)单元22的参数产生单元22包括存储器(M)单元29、(第二)正弦分析(SiA，)单元21，、相位预测单元28和(可选的)频率缩放(FS)单元27。注意到在某些实施例中，频率缩放(FS)单元27 可被删除。进一步注意到，正弦分析(SiA，)单元21，一皮表示为第二正弦分析(SiA，)单元21，，以便将该单元与编码器4中的(第一)正弦分析(SiA)单元21区分开来。
编码器4接收(数字)音频信号s，该信号可以是话音(语音)信号、音乐信号或它们的组合。该音频信号s被分段单元25划分为部分重叠的时间段(帧)，以便产生分段的音频信号r。分段单元25接收 (输入)更新间隔参数updin,该参数指示连续时间段的时间间距。分段的音频信号r可以等于图1、 2和3中的信号r,但不限于此。
优选地被安排用于执行快速傅立叶变换(FFT )的正弦分析单元21 产生至少一个频率参数f，并且在所示实施例中，还产生至少一个幅度参数A和至少一个相位参数(l)。频率参数f和幅度参数A由编码器4 输出，而相位参数(J)在内部使用。在所示的实施例中，相位参数cb被馈送至(附加的)正弦分析单元23，，在那里它与参数f和A—起被用于合成信号r"。理想地，除了任意的增益差异之外，该合成的信号r" 基本上与输入音频信号r相同。为了补偿该增益差异，原始(分段的) 输入音频信号r和合成的音频r"被馈送至比较单元，该比较单元在所示实施例中由最小均方误差(MMSE)单元26构成。该单元确定输入音频信号r与合成的音频信号r"之间的最小均方误差，并产生相应的增益信号G来补偿任意的幅度差异。在某些实施例中，该幅度校正信息可被包含在幅度参数A中或者可被忽略，这种情况下，单元23，和26 可以从编码器4中省略，而增益控制单元24可以/人解码器5中省略。
因此可以看出，编码器4接收输入音频信号并将该信号转换为表示该信号的一组参数f和A,以及附加参数G。该组参数利用任意合适的手段或方法而被发送到解码器5,例如经由音频系统导线、互联网连接、无线(例如蓝牙⑧)连接或诸如CD、 DVD或记忆棒的数据载体。在其它实施例中，编码器4和解码器5构成单一的装置(图1、 2和3中的20)，且编码器4和解码器5之间的连接是所述单一装置的内部连接。因此，解码器5接收信号参数f和A,以及附加参数G和C。幅度 A被直接馈送到正弦合成单元23，该单元优选地净皮安排用于实现逆快速傅立叶变换(IFFT),从而产生合成的信号r，-r，(n)。可以利用如下公式进行合成r'(w) 二 sin(2;r. //'" + O ，其中k是信号中频率分量的个数。参数f和C被馈送至参数产生单元22的频率缩放单元27，而增益补偿参数G被馈送至增益控制(在本实施例中乘法)单元24。频率缩放(FS)单元27利用控制参数C来调节(即缩放)频率参数f，例如通过乘以控制参数C和频率参数f。这样得到经调节的(即经缩放的)频率参数f，，该频率参数被馈送至正弦合成单元23和相位预测单元28。正弦合成单元23利用幅度参数A、频率参数f和相位参数(J)，(如上所述，幅度参数A不是必需的，在某些实施例中可以省略)合成输出音频信号r，。该合成的信号r，被馈送至增益控制单元24，该单元利用增益参数G调节信号r，的幅度，并将已增益调节的信号馈送至重叠相加(0LA )和时间缩放(TS )单元25，。该0LA/TS单元25，还接收(输出)更新间隔参数updout，该参数指示输出信号时间段的重叠。利用参数updout,部分重叠时间段的信号值一皮加入，从而产生输出信号s，。根据本发明，由正弦合成单元23产生的合成的信号r，被馈送至存储器(M)或延迟单元29,在其中暂时存储合成信号r，的最新近时间段。该段然后^f皮馈送到(第二)正弦分析(SiA，)单元21，，该单元确定该段的频率加上它们相关联的相位值。也就是说，正弦分析单元21，确定该时间段的频语，例如利用FFT,然后为所有非零频率值确定相位，并最终输出一组相位/频率对，每个对包括频率及其相关联的相位。单元21，因此产生一 (优选的只是非零)频率值的"网格，，，每个(非零) 频率值具有一个相关联的相位值。在某些实施例中，由于它们相关联的相位值由于舍入误差而经常相对地不精确，大于零的阈值可被用于消除小的频率值。由单元21，产生的该组相位/频率对祐:馈送至相位预测单元28,它将频率参数f，与该组中的频率进行比较，并选择与由参数f，表示的频率最匹配的相位/频率对。然后利用如下公式补偿所选择对中的相位当前l殳与先前段之间的时间延迟,二 ^ + 2;r . ./A/ ,其中d)，是已补偿的相位参数，小是所选择的相位/频率对的相位，f，是(可选地经修改的)频率参数，且At是时间延迟。得到的已补偿的相位参数cj)，然后被馈送到正弦合成单元23,以便合成信号r，的下一时间段。因此可以看出，本发明的解码器不使用前面讨论的现有技术中的链接器。正在合成的音频信号的相位由前面合成的音频信号的相位导出，特別是由最后(即最新近)时间段的音频信号导出。将会了解，如果不使用时间段，可以在相位预测单元28中使用其它时间延迟标准，例如基于处理时间的标准。如杲装置5被用作没有频率调节的解码器，则可以省略频移单元 27。如果编码器4和解码器5结合在包括频移单元27的单一装置中，则会带来有益的频率修改装置。图3中所示的编码器装置4和解码器装置5可以是个别地也可以是组合地用于时间缩放。为此，上面提到的更新间隔参数updin和 updout可以被适当地修改。在图4中，输入信号(例如图3中的信号s)表示在时间轴I上，而相对应的输出信号(例如图3中的信号s，)被表示在时间轴II上。该信号在图4中示意性地用窗A和B来表示，为了方便表示为三角形，但是可具有任意适当的形状，例如高斯或余弦形。每个窗捕获到其长度等于参数seglen的信号时间段。在分段过程中，在分段单元(图3 的25)中，窗A的间距由参数updin确定。相似地，在OLA单元(图 3中的25，)中的重叠相加过程中，窗B的间距由参数updout确定。通过选择updout大于updin,信号s被扩展，如图4所示。在图5中，情况相反，参数updout被选择为小于updin,造成信号的压缩(即时间压缩)。因此可以看出，通过适当的修改参数updin 和updout,可以实现时间缩方文。本发明是基于这样的见识，即当合成音频信号时，要被合成的信号的相位可以有益地从已经被合成的音频信号，即新近的(或优选最近的)被合成的信号中导出。这样得到基本上没有不连续性的相位。本发明得益于进一步的见识，即由所合成的音频信号中导出的相位可以利用要被合成的信号的频率来调节，并且，调节该频率可以实现一种提供受频率调节的信号的方便的方法。范围。特別地，词语"包括"、和口"包含"、;意味着排除没有特别提到的任何元素。单一 (电路)元件可以用多个(电路)元件或它们的等价物来代替。本领域技术人员将会明白，本发明不限制在上述实施例中，在不脱离后附权利要求中所定义的本发明保护范围的情况下，可以作出很多》务改和添加。
权利要求
1、一种用于合成音频信号(r’)的信号合成装置(20)，该装置包括-正弦合成单元(23)，用于利用至少一个表示音频信号频率的频率参数(f’)和至少一个表示音频信号相位的相位参数(φ’)来合成音频信号(r’)，以及-参数产生单元(22)，用于利用频率参数(f)和音频信号(r’)来产生相位参数(φ’)。
2、根据权利要求1所述的装置，其中所合成的音频信号(r，)包括时间段，并且其中参数产生单元(22 )被安排用于利用音频信号(r，) 的先前时间段来产生当前的相位参数(c|)，)。
3、根据权利要求1所述的装置，其中参数产生单元(22)包括相位确定单元(21，)，该相位确定单元被安排用于确定一组相位/频率对，每个相位/频率对表示音频信号(r，) 一个频率的相位。
4、根据权利要求3所述的装置，其中参数产生单元(22)进一步包括相位预测单元(28),该相位预测单元一皮安排用于一将频率参数(f，f，)与该组相位/频率对进行比较，并选择最接近该频率参数(f，)的相位/频率对，并且- 利用频率参数(f，)和所选择的相位产生相位参数((J)，)。
5、根据权利要求1所述的装置，其中参数产生单元(22)包括频率修改单元(27),该频率修改单元用于响应控制参数(C)而修改频率参数(f )。
6、根据权利要求l所述的装置，其中正弦合成单元(23)附加地利用幅度参数(A)。
7、根据权利要求1所述的装置，进一步包括增益控制单元(24), 用于将所合成的音频信号(r，)乘以增益参数(G)。
8、根据权利要求1所述的装置，进一步包括正弦分析单元(21 ), 该正弦分析单元用于接收输入音频信号(r)，并产生频率参数(f，) 和相位参数(cj)，)。
9、根据权利要求8所述的装置，进一步包括- 用于产生所合成的音频信号的另一个正弦合成单元(23，)，和- 用于将所合成的音频信号与输入音频信号进行比较，从而产生增益参数(G)的比较单元(26)。
10、根据权利要求2所述的装置，进一步包括分段单元(25), 该分段单元用于将音频信号(r)划分为时间段。
11、根据权利要求2所述的装置，进一步包括重叠相加单元(25，)，该重叠相加单元将所合成的音频信号(r，)的时间段连接起来。
12、根据权利要求10或11所述的装置，其中分段单元(25)由第一重叠参数(叩din)控制，而其中重叠相加单元(25，)由第二重叠参数(updout)控制，并且其中该装置被安排为通过改变重叠参数(updin, updout )进行时间缩放。
13、一种语音变换装置(])，包括- 线性预测分析单元(10),用于响应输入语音信号(x)而产生预测参数(P)和残余信号(r),- 音调适配单元(20)，用于适配残余信号(r)的音调，从而产生音调适配的残余信号(r，)，和- 线性预测合成单元(30),用于响应该音调适配的残余信号(r，) 而合成输出语音信号(y ),其中该音调适配单元(20)包括根据权利要求5所述的装置。
14、根据权利要求13所述的语音变换装置，进一步包括用于修改预测参数的修改单元(40)。
15、一种音频系统，包括根据权利要求1所述的装置。
16、一种音频信号解码器(5),包括- 正弦合成单元(23),用于利用至少一个表示音频信号频率的频率参数(f，)和至少一个表示音频信号相位的相位参数(Cj)，)来合成音频信号(r，)，以及- 参数产生单元(22),用于利用频率参数(f)和音频信号(r，) 来产生相位参数(小，)。
17、一种合成音频信号(r，)的方法，该方法包括如下步骤- 利用至少一个表示音频信号频率的频率参数(f， f，)和至少一个表示音频信号相位的相位参数(d)，)来合成音频信号(r，)，以及- 利用频率参数(f,f，)和音频信号(r，)来产生相位参数(小，)。
18、根据权利要求17所述的方法，其中所合成的音频信号(r，) 包括时间段，并且其中参数产生单元(22)被安排用于利用音频信号(r，)的先前时间段来产生当前的相位参数(cb，)。
19、根据权利要求17所述的方法，其中相位预测步骤包括确定一组相位/频率对的子步骤，每个相位/频率对表示音频信号(r，) 一个频率的相位。
20、根据权利要求17所述的方法，其中相位预测步骤进一步包括如下子步骤一将频率参数(f，)与该组相位/频率对进4于比4交，并选择最接近该频率参数(f，)的相位/频率对，并且- 利用频率参数(f，)和所选择的相位产生相位参数(d)，)。
21、根据权利要求17所述的方法，其中相位预测步骤包括响应控制参数(C)而修改频率参数(f，)的子步骤。
22、一种语音变换方法，包括如下步骤- 响应输入语音信号(x)而产生预测参数(p)和残余信号(r),- 适配残余信号(r)的音调，从而产生音调适配的残余信号(r，)，和- 响应该音调适配的残余信号(r，)而合成输出语音信号(y), 其中音调适配步骤包括根据权利要求21改变音频信号频率的子步骤。
23、根据权利要求17或22的方法，进一步包括时间缩放的步骤。
24、一种计算机程序产品，用于执行根据权利要求l7或22所述的方法。
全文摘要
一种改变诸如语音信号的音频信号(r)音调的装置(2)，包括正弦分析单元(21)，用于确定音频信号(r)的正弦参数；参数产生单元(22)，用于预测正弦分量的相位；以及正弦合成单元(23)，用于合成参数来产生重建的信号(r’)。参数产生单元(22)为音频信号的每个时间段接收先前时间段的相位，以便预测当前时间段的相位。
文档编号G10L21/00GK101223581SQ200680025590
公开日2008年7月16日申请日期2006年7月6日优先权日2005年7月14日
发明者A·C·登布林克, R·J·斯卢伊特申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：A.C.登布林克;R.J.斯卢伊特
技术所有人：皇家飞利浦电子股份有限公司
我是此专利的发明人