基音估计的制作方法

文档序号:2824804阅读:199来源:国知局
专利名称:基音估计的制作方法
技术领域
本发明涉及对信号的基音周期的估计,具体地,涉及用于这种估计的目标候选。本发明可具体应用于丢包隐藏方法中使用的对声音信号的基音周期的估计。
背景技术
无线和网络语音协议(VoIP)通信经受由不利连接条件所引起的数据包的频繁劣化。劣化的数据包会丢失或被破坏(包括不可接受的高出错率)。这种劣化的数据包导致在连接的接收端处在输出声音信号中存在喀哒声和爆裂声或者其他杂音。这劣化了接收端处感知到的语音质量,并且如果数据包劣化率足够高则会使得语音不可识别。广义地说,采用两种方法来解决劣化数据包的问题。第一种方法为使用基于发射机的恢复技术。这种技术包括重新发射劣化数据包;使多个数据包的内容交织,以分散数据包劣化的影响,并且向所发射的数据包添加纠错编码位使得可以在接收机处重构劣化数据包。为了限制这些技术所固有的增加的带宽需求和延迟,通常使用这些技术以使得如果数据包劣化率较低则可以恢复劣化数据包,但是如果数据包劣化率较高则不能恢复所有的劣化数据包。此外,一些发射机可能不具有实施基于发射机的恢复技术的能力。所采用的解决劣化数据包问题的第二种方法为使用基于接收机的隐藏技术。除基于发射机的恢复技术之外,通常使用这种技术以隐藏在已经采用基于发射机的恢复技术之后留下的任何剩余劣化。此外,如果发射机不能够实施基于发射机的恢复技术,则可以单独地使用这些技术。使用低复杂性的基于接收机的隐藏技术,诸如用静音、噪声或先前数据包的重复填充劣化数据包,但是结果导致质量差的输出声音信号。诸如基于模型的恢复(其中,劣化数据包任一侧的语音被建模,以生成用于劣化数据包的语音)的基于再生的方案产生质量非常高的输出声音信号,但是复杂性大、耗能高并且实施昂贵。在实际情况中,优选使用基于内插的技术。这些技术通过在劣化数据包的一侧或两侧内插来自数据包的参数来生成替换数据包。这些技术实施起来相对简单,并且产生适当高质量的输出声音信号。基于基音(pitch)的波形替换是优选的基于内插的数据包劣化恢复技术。当在短时间间隔上看时,声音信号看起来由重复的片段组成。该片段以被称为基音周期的时间周期而周期性地重复。在基于基音的波形替换中,对劣化数据包的一侧或两侧的声音数据包的基音周期进行估计。然后,将估计基音周期或多个估计基音周期的波形用作(或者重复并用作)劣化数据包的替换。该技术是有效的,因为劣化声音数据包的基音周期通常与劣化数据包任一侧上的声音数据包的基音周期基本上相同。在基于基音的波形替换技术中,替换数据包和剩余信号之间的边界处的不连续经常被检测到为输出声音信号中的杂音。使用了重叠相加功能的边界任一侧上的信号的同时淡入淡出被用于减小这种不连续。还提出了图样匹配方法。使用许多方法来估计声音信号的基音周期。对于这些方法中的典型一种,估计基音周期所涉及的计算占用了基于基音的波形替换技术中的算法复杂度的90%以上。尽管计算的复杂等级较低,但其对于诸如蓝牙的低功率平台来说很显著。为了正确地确定声音信号的基音周期,基音周期值的宽预定范围被分析,例如从2. 5ms (对于具有高声音的人)到 16ms (对于具有低声音的人)。对于大多数基音周期确定算法,使用的基音周期范围越宽, 计算复杂度越高。减小计算复杂度的一种方式是减少算法所计算的计算次数。ITU-T建议G. 711附录I “一种利用G. 711的用于包丢失隐藏的高质量低复杂度算法”(ITU-T Recommendation G. 711 Appendix I, “A high quality low-complexity algorithm for packet loss concealment with G. 711”)通过使用基音周期估计的两阶段方法来减少计算次数。在第一阶段中,在基音周期的整个预定范围上执行粗略搜索,以确定基音周期的粗略估计。在第二阶段中,在包括基音周期的粗略估计基音周期的精确范围上执行精确搜索。因此,可以确定基音周期的更加精确的精确估计。因此,与在基音周期的整个预定范围上执行精确搜索相比,减少了算法所计算的计算次数。美国专利申请第11/734824号提出了一种基音周期估计的两阶段方法,其进一步减少了算法所计算的计算次数。在该申请中,在基音周期的整个预定范围上,对抽选的信号执行粗略搜索。在识别了基音周期的初始最佳候选时,以初始最佳候选为中心计算基音周期的精确范围。分析初始最佳候选与精确范围的端点之间的中点处的基音周期。如果初始最佳候选是优选的,则这些中点基音周期中的一个被看作基音周期的精确最佳候选。可以执行进一步的平分搜索,以产生更多的基音周期的精确估计。因此,与在基音周期的整个精确范围上执行精细搜索的算法相比,减少了算法所计算的计算次数。尽管这些方法减少了算法所计算的计算次数,但与基音周期的估计相关联的计算复杂度还存在问题,尤其是诸如蓝牙的低功率平台。此外,基音周期确定算法通常涉及对以落后值分离的信号的部分进行比较。算法选择与最类似部分相关的落后值作为基音周期的估计。然而,以基音周期的倍数分离的信号部分也非常相似。基音周期检测算法的共同问题在于,基音周期的倍数被选择作为基音周期的估计。Chu,Wai C.,语音编码算法标准化编码器的建立和演化,Wiley出版社, 2003 (Chu, Wai C.Speech coding algorithms !foundation and evolution of standardized coders (Wiley, 2003))公开了一种一旦使用自相关算法确定了基音周期的估计就检查基音周期的倍数的方法。通过一个或多个整数来分割基音周期估计以形成检查点。如果检查点产生足够高的自相关值,则其被用作基音周期的精确估计。期望使用诸如上面所述的倍数检查算法的倍数检查算法,以增加基音周期估计的精度。然而,这种检查算法增加了与基音周期的估计相关联的计算复杂度。因此,需要一种估计信号的基音周期的改进方法,其通过减小估计为“真”基音周期的倍数的可能性来增加估计的精度,并且还减小与估计相关的计算复杂度。

发明内容
根据本公开的第一方面,提供了一种估计信号的基音周期的方法,包括通过仅在潜在基音周期的第一范围内执行搜索来识别第一候选基音周期;通过将第一候选基音周期除以整数来确定第二候选基音周期,第二候选基音周期在潜在基音周期的第一范围之外; 以及选择候选基音周期中的较小者作为信号的基音周期的估计,该候选基音周期中的较小者使得以该候选基音周期分离的信号的部分被良好相关。适当地,潜在基音周期的第一范围的上界为最大潜在基音周期。适当地,潜在基音周期的第一范围的下界为最大潜在基音周期的一半。适当地,整数为使得第二候选基音周期大于最小潜在基音周期的整数。适当地,该方法包括使用基音周期检测算法来识别第一候选基音周期。适当地,基音周期检测算法为归一化互相关算法。适当地,信号被采样,第一候选基音周期为第一数量的采样,第二候选基音周期为第二数量的采样,其中,通过以下处理确定第二数量的采样将第一数量的采样除以整数; 以及选择与除法结果最接近的整数(whole number)作为第二数量的采样。适当地,该方法还包括使通过第一候选基音周期分离的信号的部分相关,以形成第一相关值,以及使通过第二候选基音周期分离的信号的部分相关,以形成第二相关值。适当地,该方法包括如果第二相关值大于第一相关值的预定比例,则选择第二候选基音周期作为信号的基音周期的估计。适当地,该方法包括如果第二相关值小于第一相关值的预定比例,则选择第一候选基音周期作为信号的基音周期的估计。适当地,该方法包括选择与较大相关值相关联的候选基音周期作为信号的基音周期的估计。适当地,该方法还包括在识别第一候选基音周期之前抽选信号。根据本公开的第二方面,提供了一种生成替换部分以替换信号的劣化部分的方法,包括以估计基音周期的倍数,来选择劣化部分之前或之后的信号的采样;以及从所选择的采样和在所选择的采样后面的采样形成替换部分;其中,根据本公开的第一方面来确定该估计基音周期。适当地,倍数为I个或者大于I的整数。适当地,该方法还包括在用替换部分替换劣化部分时,向替换部分和与替换部分相邻的信号部分之间的边界应用重叠相加算法。适当地,该方法还包括通过以下处理来使信号的基音周期的估计精确化对于包括估计基音周期和接近该估计基音周期的另一些候选基音周期的候选基音周期集合中的每一个候选基音周期,确定以该候选基音周期分离的信号的部分之间的几何距离;以及选择候选基音周期集合中的具有最小相关几何距离的候选基音周期作为信号的基音周期的精确估计。根据本公开的第三方面,提供了一种生成替换部分以替换信号的劣化部分的方法,包括以精确化的估计基音周期的倍数,来选择劣化部分之前或之后的信号的采样;以及从所选择的采样和所选择的采样之后的采样形成替换部分;其中,根据上述方法来确定该精确化的估计基首周期。适当地,该方法包括对于候选基音周期集合中的每一个候选基音周期,确定信号的第一部分和信号的第二部分之间的几何距离,其中,第一部分接近劣化部分并在劣化部分之前或之后,而第二部分与第一部分的分离距离为该候选基音周期。适当地,该方法包括对于候选基音周期集合中的每一个候选基音周期,通过确定信号的第一部分和信号的第二部分之间的第一几何距离来确定几何距离,其中,第一部分
6接近劣化部分并在劣化部分之前,而第二部分以该候选基音周期与第一部分分离;确定信号的第三部分和信号的第四部分之间的第二几何距离,其中,第三部分接近劣化部分并在劣化部分之后,而第四部分以该候选基音周期与第三部分分离;以及选择第一几何距离和第二几何距离的平均作为几何距离。适当地,该方法包括使用基音周期检测算法来识别第一候选基音周期,该算法比较信号的多个部分,每一个部分都由N个采样组成;以及对于候选基音周期集合中的每一个候选基音周期,确定每一个都由L个采样组成的信号部分之间的几何距离,其中,L小于
N0适当地,该方法还包括在用替换部分替换劣化部分时,向替换部分和与替换部分相邻的信号的部分之间的边界应用重叠相加算法。根据本公开的第四方面,提供了一种基音周期估计装置,包括候选基音周期识别模块,被配置为通过仅在潜在基音周期的第一范围上执行搜索来识别信号的第一候选基音周期;处理模块,被配置为通过将第一候选基音周期除以整数来确定信号的第二候选基音周期,第二候选基音周期在潜在基音周期的第一范围之外;以及选择模块,被配置为选择候选基音周期中的较小者作为信号的基音周期的估计,该候选基音周期中的较小者使得以该候选基音周期分离的信号部分被良好相关。


现在,将参照附图通过实例的方式来描述本公开。在附图中图1是根据本公开的信号处理装置的示意图;图2是示出通过图1的装置处理信号的方法的流程图;图3是用于估计信号的基音周期的方法的流程图;图4是示出互相关方法的典型声音信号的示图;图5是包括劣化部分的典型声音信号的示图;以及图6是适合于包括图1的信号处理装置的收发机的示意图。
具体实施例方式图1示出了信号处理装置的一般配置的示意图。在图1中,在模块处终止的实线箭头表示控制信号。其他箭头表示模块之间信号的传播方向。在线101上,数据流被输入至信号处理装置100。线101连接至劣化检测器102的输入端。劣化检测器102的第一控制输出端连接至开关104的输入端。线101连接至开关104的另一个输入端。开关104的输出端连接至重叠相加模块105的输入端。在线106上,重叠相加模块105的第一输出端连接至信号处理装置100的输出端。信号处理装置还包括劣化隐藏模块107。在线108上,劣化检测器102的第二控制输出端连接至劣化隐藏模块107的控制输入端。劣化隐藏模块107包括数据缓冲器109、基音周期估计模块110和替换模块111。重叠相加模块105的第二输出端连接至数据缓冲器109的输入端。数据缓冲器109的第一输出端连接至基音周期估计模块110的输入端。数据缓冲器109的第二输出端连接至替换模块111的第一输入端。基音周期估计模块110的输出端连接至替换模块111的第二输入端。替换模块111的输出端连接至开关104的第三输入端。
在操作中,通过图I的信号处理装置以多个离散的时间上的部分来处理信号。以下描述是指对数据的数据包的处理,然而,描述等效地应用于对数据的帧或者数据的任何其他适当部分的处理。数据的这些部分的长度通常为几毫秒的级别。将参照图2的流程图描述对输入至装置100的数据流进行处理的方法。在图2的步骤201中,在线101上,声音信号的每一个数据包被顺序输入至信号处理装置100。在步骤202中,每个数据包被输入至劣化检测器102。对于每一个数据包,劣化检测器102确定数据包是否被劣化。在线108上,劣化检测器102向劣化隐藏模块107发送表明数据包是否被劣化的控制信号。如果确定数据包被劣化,则信号处理装置丢弃该数据包,并使用劣化隐藏模块107生成替换数据包。本文所描述的方法和装置适合于蓝牙设备中的实施。蓝牙数据包包括在有效载荷部分之前的报头部分。对数据包的报头部分执行报头差错校验(HEC)。HEC为8位循环冗余校验(CRC)。如果HEC失败,则劣化检测器102确定数据包被劣化。如果数据包没有劣化,则劣化检测器102向开关104输出控制信号,其控制开关 104将数据包传送到重叠相加模块105的输入端。在步骤203中,如果数据包为劣化数据包之后的第一个好数据包,则重叠相加模块105在级联点(用于劣化数据包的替换数据包的结尾部分和好数据包的开始部分)处应用重叠相加算法,以减少替换数据包和好数据包之间边界处的任何不连续性。如果数据包不是劣化数据包之后的第一个好数据包,则该数据包没有改变地从重叠相加模块105输出。在步骤207中,从重叠相加模块105输出的数据包被存储在数据缓冲器109中。在线106上,从重叠相加模块105输出的数据包还从信号处理装置100输出。如果数据包被劣化,则劣化检测器102在线108上向劣化隐藏模块107输出控制信号,控制劣化隐藏模块107生成替换数据包。如果数据包被劣化,则劣化检测器102不控制开关104来将劣化数据包连接至重叠相加模块105。在这种情况下,劣化检测器102控制开关104,以在线106上将劣化隐藏模块107的输出连接至信号处理装置100的输出。线108上被发送至劣化隐藏模块107的控制信号控制劣化隐藏模块107来执行以下操作。数据缓冲器109被使能以向基音周期估计模块110输出一个数据包或多个数据包。由数据缓冲器109输出的一个数据包或多个数据包接近劣化数据包。适当地,由数据缓冲器输出的一个数据包或多个数据包是最近被解码或者最近由数据包隐藏操作生成的那些数据包。可选地,数据缓冲器可以在数据包被解码之前存储并输出来自数据流的数据包。由数据缓冲器输出的一个数据包或多个数据包可以在数据流中的劣化数据包之前或者在数据流中的劣化数据包之后。在步骤204中,基音周期估计模块110估计其接收的一个数据包或多个数据包的基音周期。该估计被用作劣化数据包的基音周期的估计。基音周期估计模块110向替换模块111输出估计基音周期。在步骤205中,替换模块111根据估计基音周期选择来自数据缓冲器109的数据。所选择的数据被用作劣化数据包的替换。适当地,替换模块111执行基于基音的波形替换。适当地,这涉及在由基音周期估计模块111估计的基音周期中生成波形。波形被重复作为用于劣化数据包的替换。如果劣化数据包短于估计基音周期,则所生成的波形是估计基音周期长度的一部分。适当地,生成的波形稍微长于劣化数据包,使其在劣化数据包的任一侧上与数据包重叠。重叠相加模块105有利地使用重叠来将劣化数据包的生成波形在任一侧上渐渐融入所接收的信号中,从而实现平滑的级联。替换模块111使用顺序存储在数据缓冲器109中的数据生成波形。该数据包括好(未劣化)数据和由劣化隐藏模块107生成的替换数据。有利地,数据缓冲器109具有为最大基音周期(在采样中测量)的两倍的较长长度(存储更多的采样)。替换模块从数据缓冲器中最近接收的采样开始顺序地向后计数,计数量为等于估计基音周期的采样数。替换模块向后计数所到达的一个采样被看作是所生成波形的第一个采样。替换模块111得到达到劣化数据包中的采样数的顺序采样。所得到的所选采样的集合被看作是生成的波形。例如,如果数据缓冲器具有200个采样的长度、估计基音周期被确定为具有50个采样的长度且劣化数据包具有30个采样的长度,则替换模块111生成包含数据缓冲器的采样151到180的波形。如果劣化数据包长于估计基音周期,则选择等于估计基音周期长度的采样的集合(在上面的实例中,可以为采样151至200)。该采样的集合被重复并被用作生成的波形来替换劣化数据包。可选地,从数据缓冲器109中选择等于劣化数据包长度的采样的集合。这通过在数据缓冲器中从最近接收的采样开始向后顺序计数(计数量为等于估计基音周期的倍数的采样数)来实现。选择该倍数,使得向后计数的采样数长于或等于(不短于)劣化数据包的长度。例如,倍数可以为1。典型地,倍数可以为估计基音周期的2或3倍。替换模块向后计数所到达的一个采样被看作所生成波形的第一个采样。替换模块111得到达到劣化数据包中的采样数的顺序采样。所得到的所选采样的集合被看作所生成的波形。例如,如果数据缓冲器具有200个采样的长度、估计基音周期被确定为具有50个采样的长度且劣化数据包具有60个采样的长度,则替换模块111生成包含数据缓冲器的采样101到160的波形。对采样集合进行太多次重复可能导致在输出信号中存在显而易见的杂音。例如,输出信号可能听起来是人造的或机器的。比较起来,使用等于信号的劣化部分的长度的采样集合引入了一些自然变化到输出信号中。然而,如果劣化部分较长,则使用等于信号的劣化部分长度的采样集合会在与剩余信号的边界处导致更大的不连续性。这是因为,仅当在较短时间间隔上看时,声音信号才可以认为具有恒定的基音周期。在较长时间间隔上,基音周期发生变化。因此,如果缓冲数据的长片段被用于替换劣化部分,则会在与剩余信号的边界处存在显著的失配。重复采样集合的第一方法和从数据缓冲器中选择较长采样集合的第二方法之间的优选选择依赖于所讨论的具体信号的形式。因此,可以使用混合方法,其动态地选择这两种方法中的最佳方法。例如,可以选择在与剩余信号的边界处具有更低级联损失的最佳方法。如果劣化部分非常长,其可以认为是较短劣化部分的序列,每一个较短的劣化部分如本文所描述的进行评定。可选地,替换模块111可以使用利用估计基音周期的其他已知的基于基音的波形替换技术。替换模块111向开关104输出所生成的波形作为替换数据包。在劣化检测器102的控制下,开关104被使能以向重叠相加模块105输出替换数据包。在步骤206中,重叠相加模块105向级联点处应用重叠相加算法,以使替换数据包与其任一侧上的数据包之间的边界处的不连续性最小化。在步骤207中,替换数据包从重叠相加模块105中输出并存储在数据缓冲器109 中。在步骤208中,从重叠相加模块105输出的替换数据包还在线106上从信号处理装置 100输出。在步骤204中,使用两阶段方法估计基音周期。在步骤205中,该方法可包括可选的第三阶段,以使基音周期估计精确化。现在,通过这三个阶段的详细实例的实施来描述该三个阶段的概述。在第一阶段中,基音周期检测算法用于在潜在基音周期的窄范围上进行搜索。 潜在基音周期是通常在人声音信号中获得的基音周期。选择潜在基音周期的窄范围,使其覆盖通常可从人语音获得的基音周期范围的高端。典型地,人语音范围的基音周期在 2. 5ms (对于具有高声音的人)至16ms (对于具有低声音的人)之间。这对应于400Hz至 62.5Hz的基音频率范围。因此,针对第一阶段选择的潜在基音周期的窄范围的适当上界为 16ms。潜在基音周期的窄范围的下界小于或等于上界的一半。这使得在该第一范围上搜索的潜在基音周期的窄范围中存在第二阶段(参见下一段落)中确定的候选基音周期的至少一个倍数。适当地,下界为上界的一半。在该实例中,适当的下界由此为8ms。基音周期检测算法从搜索的潜在基音周期的窄范围中选择信号的基音周期的最可能的候选。该候选基音周期在下文被称为第一候选基音周期。在第二阶段中,使用在第一阶段中识别的第一候选基音周期确定另一些候选基音周期。由于在第一阶段中仅搜索潜在基音周期的总范围(2. 5ms至16ms)的一部分(在以上实例中为8ms至16ms),所以在第一阶段中识别的候选基音周期可能为信号的“真”基音周期的倍数。第二阶段从覆盖期望用于人语音的基音周期范围的低端的潜在基音周期范围中确定另一些候选基音周期。针对第二阶段选择的潜在基音周期范围的适当下界由此为
2.5ms。适当地,针对第二阶段选择的潜在基音周期的范围排除针对第一阶段选择的窄范围,但包括人语音的其他典型基音周期。因此,针对第二阶段选择的潜在基音周期范围的适当上界为针对第一阶段选择的窄范围的下界。在给出的实例中,针对第二阶段选择的潜在基音周期范围的适当上界由此为8ms。在第二阶段中确定的另一些候选基音周期为使得这些另一些候选基音周期的倍数给出了第一候选基音周期。使用基音周期检测算法分析在第一阶段中识别的第一候选基音周期以及在第二阶段中识别的另一些候选基音周期中的一个或多个。由基音周期检测算法识别的可能为信号的基音周期的最小候选基音周期被选择作为信号的基音周期的估计。在步骤205中,基音周期估计方法可以包括可选的第三阶段。第三阶段使基音周期估计精确化,以减小在使用基音周期估计而选择的替换数据包与替换数据包任一侧上的信号的数据包之间的级联边界处的失真。选择包含第二阶段中所估计的基音周期的潜在基音周期的窄范围。使用距离度量执行潜在基音周期的该窄范围上的精细搜索,以确定精确的基音周期估计。该距离度量使紧接在劣化部分之前(或之后)接收的信号的第一小部分与以特定时间间隔与第一小部分分离的信号部分相匹配。选择这些时间间隔作为潜在基音周期的窄范围(包含第二阶段中的基音周期估计)中的候选基音周期。与最佳匹配部分 (即,使距离度量最小的部分)相关联的候选基音周期被选择作为信号的基音周期的精确估计。现在,将参照图3的流程图描述实施这三个阶段的示例性方法。第一阶段在图3的步骤301中,从潜在基音周期的第一范围识别第一候选基音周期。基音周期检测算法被用于在该范围内进行搜索。存在许多本领域通用的可用于该方法的第一阶段的已知基音周期检测算法。这些算法使用的度量实例为归一化交叉相关(NCC)、平方差的和(SSD)和平均幅值差分函数(AMDF)。利用这些度量的算法提供了类似的基音周期检测性能。一种算法相对于另一种的选择可以依赖于算法的效率,这又可以依赖于所使用的硬件平台。为了示出本文所描述的方法,可以使用归一化正交相关(NCC)度量。这种方法可以以数学方式表示为
权利要求
1.一种估计信号的基音周期的方法,包括通过仅在潜在基音周期的第一范围上执行搜索来识别第一候选基音周期;通过将所述第一候选基音周期除以一整数来确定第二候选基音周期,所述第二候选基音周期在所述潜在基音周期的第一范围之外;以及选择候选基音周期中的较小者作为信号的基音周期的估计,所述候选基音周期中的较小者使得以此候选基音周期分离的所述信号的部分被良好相关。
2.根据权利要求I所述的方法,其中,所述潜在基音周期的第一范围的上界为最大潜在基音周期。
3.根据权利要求I所述的方法,其中,所述潜在基音周期的第一范围的下界为最大潜在基音周期的一半。
4.根据权利要求I所述的方法,其中,所述整数为使得所述第二候选基音周期大于最小潜在基音周期的整数。
5.根据权利要求I所述的方法,包括使用基音周期检测算法来识别第一候选基音周期。
6.根据权利要求5所述的方法,其中,所述基音周期检测算法为归一化互相关算法。
7.根据权利要求I所述的方法,其中,所述信号被采样,所述第一候选基音周期为第一数量的采样,并且所述第二候选基音周期为第二数量的采样,其中,通过以下处理确定所述第二数量的采样将所述第一数量的采样除以一整数;以及选择与除法结果最接近的整数作为所述第二数量的采样。
8.根据权利要求I所述的方法,还包括使得以所述第一候选基音周期分离的所述信号的部分相关,以形成第一相关值,并且使得以所述第二候选基音周期分离的所述信号的部分相关,以形成第二相关值。
9.根据权利要求8所述的方法,包括如果所述第二相关值大于所述第一相关值的预定比例,则选择所述第二候选基音周期作为所述信号的基音周期的估计。
10.根据权利要求8所述的方法,包括如果所述第二相关值小于所述第一相关值的预定比例,则选择所述第一候选基音周期作为所述信号的基音周期的估计。
11.根据权利要求8所述的方法,包括选择与相关值中的较大者相关的候选基音周期作为所述信号的基音周期的估计。
12.根据权利要求I所述的方法,还包括在识别所述第一候选基音周期之前抽选所述信号。
13.—种生成替换部分以替换信号的劣化部分的方法,包括以估计基音周期的倍数,选择所述劣化部分之前或之后的信号的采样;以及根据所选择的采样和所选择的采样后面的采样来形成所述替换部分,其中,根据权利要求I所述的方法确定所述估计基音周期。
14.根据权利要求13所述的方法,其中,所述倍数为I或者大于I的整数。
15.根据权利要求13所述的方法,还包括在用所述替换部分替换所述劣化部分时,对所述替换部分和与所述替换部分相邻的信号部分之间的边界应用重叠相加算法。
16.根据权利要求I所述的方法,还包括通过以下处理使得所述信号的基音周期的估计精确化对于包括估计基音周期和接近所述估计基音周期的另一些候选基音周期的候选基音周期集合中的每一个候选基音周期,确定以该候选基音周期分离的所述信号的部分之间的几何距离;以及选择所述候选基音周期集合中的具有最小相关几何距离的候选基音周期作为所述信号的基音周期的精确估计。
17.—种生成替换部分以替换信号的劣化部分的方法,包括以精确化的估计基音周期的倍数,选择所述劣化部分之前或之后的信号的采样;以及根据所选择的采样和所选择的采样之后的采样来形成所述替换部分,其中,根据权利要求16所述的方法来确定所述精确化的估计基音周期。
18.根据权利要求17所述的方法,包括对于所述候选基音周期集合中的每一个候选基音周期,确定所述信号的第一部分和所述信号的第二部分之间的几何距离,其中,所述第一部分接近所述劣化部分并在所述劣化部分之前或之后,并且所述第二部分以该候选基音周期而与所述第一部分分离。
19.根据权利要求17所述的方法,包括对于所述候选基音周期集合中的每一个候选基音周期,通过以下处理确定几何距离确定所述信号的第一部分和所述信号的第二部分之间的第一几何距离,其中,所述第一部分接近所述劣化部分并在所述劣化部分之前,并且所述第二部分以该候选基音周期而与所述第一部分分离;确定所述信号的第三部分和所述信号的第四部分之间的第二几何距离,其中,所述第三部分接近所述劣化部分并在所述劣化部分之后,并且所述第四部分以该候选基音周期而与所述第三部分分离;以及选择所述第一几何距离和所述第二几何距离的平均,作为所述几何距离。
20.根据权利要求16所述的方法,包括使用基音周期检测算法来识别第一候选基音周期,所述基音周期检测算法比较所述信号的多个部分,每一个部分均由N个采样组成;以及对于所述候选基音周期集合中的每一个候选基音周期,确定每一个都由L个采样组成的信号部分之间的几何距离,其中,L小于N。
21.根据权利要求17所述的方法,还包括在用所述替换部分替换所述劣化部分时,对所述替换部分和与所述替换部分相邻的信号部分之间的边界应用重叠相加算法。
22.—种基音周期估计装置,包括候选基音周期识别模块,被配置为通过仅在潜在基音周期的第一范围上执行搜索来识别所述信号的第一候选基音周期;处理模块,被配置为通过将所述第一候选基音周期除以一整数来确定所述信号的第二候选基音周期,所述第二候选基音周期在所述潜在基音周期的第一范围之外;以及选择模块,被配置为选择候选基音周期中的较小者作为所述信号的基音周期的估计, 所述候选基音周期中的较小者使得以该候选基音周期分离的所述信号的部分被良好相关。
全文摘要
一种用于估计信号的基音周期的方法和装置。该方法包括通过仅在潜在基音周期的第一范围上执行搜索来识别第一候选基音周期。该方法还包括通过将第一候选基音周期除以整数来确定第二候选基音周期,其中,第二候选基音周期在潜在基音周期的第一范围之外。该方法还包括选择候选基音周期中的较小者作为信号的基音周期的估计,该候选基音周期中的较小者使得以此候选基音周期分离的信号部分被良好相关。
文档编号G10L19/00GK102598119SQ201080021855
公开日2012年7月18日 申请日期2010年4月7日 优先权日2009年4月21日
发明者萨默尔·加德尔 申请人:剑桥硅无线电有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1