估计信号模式的方法和设备的制作方法

文档序号:2832876阅读:217来源:国知局
专利名称:估计信号模式的方法和设备的制作方法
技术领域
本发明涉及一种用于估计模式,更具体地说,估计具有周期分量、准周期分量或实际周期分量的信号中的基音(pitch)和/或基频的方法、对应的设备以及对应的计算机程序。
背景技术
基音检测可用于诸如声音改变、文本到语音转换、语音编码、音乐信息检索、音乐演奏系统、生物识别测量、天体物理测量等之类的不同的应用。对于基音检测,时域和频域方法是众所周知的。时域方法的实现成本低且简单,其实现方式例如包括测量过零率(如 C.H.Chen 所著的 “Signal Processing Handbook, Dekker,纽约,1988 年,第 531 页”中描述的那样)或利用后续基音周期的相似度的自相关变差(如R.Bracewell所著的“The Autocorrelation Function, in The Fourier Transform and Its Applications,MacGraw-Hill,纽约,1965年,第40-45页”中描述的那样)。频域方法通常更为复杂并包括以下步骤:将时域信号变换为频域信号的快速傅里叶变换(FFT),仅通过考虑频率分量的功率来消除相位影响,压缩值以降低频谱包络的影响,通过基础谐波的关联(例如分谐波求和)和选择最高峰值来查找候选产生基音候选。这些方法在D.J.Hermes所著的“Measurement of pitch by subharmonic summation,发表于 Journal of the AcousticSociety of America,第83卷,1988年,第257-264页”中进行描述。另一可能获取基音候选的方法是通过傅里叶反变换(IFFT)将频域信号变换回时域。例如,在“B.E.Bongart 等人所著的 “The Frequency Analysis of Time Series for Echos: Cepstrum,Pseudoautocovariants, Cross-Cepstrum and Saphe Cracking,发表于 Proceedings ofthe Symposium on Time Series Analysis, Wiley,纽约,1963 年,第 15 章,第 209-243 页)”中已知的基音检测算法基于频谱分析并使用对数函数进行压缩。如果将幅度(magnitude)用作压缩运算,则最终的反向变换结果为零相位信号。在此方面可使用自相关,前提是不对功率谱应用任何压缩。
诸如对数函数之类的强压缩放大了噪声影响并形成错误的基因候选。诸如幅度运算之类的小型压缩太低,而不能抑制频谱包络的影响,因此,从较高谐波产生错误候选。一种折衷的方式是对R.Taori 等人所著的“Harmony-1: A Versatile Low Bit Rate SpeechCoding System, Nat.Lab.Technical Note 157/97”中已知的协调语音编码器中使用的幅度执行平方根运算。提供基音检测方法是为了从多个候选中判定正确的候选,但是,如果候选相互接近,则可能选择错误候选。进一步地,如果突出表示较高和/或较低的音高八度,则现有技术中已知的基音检测方法有可能选择错误候选。发明内容
本发明的目标是提供一种改进的用于估计模式,具体是指更可靠地估计信号中的基音和/或基频的方法、设备和计算机程序。
在本发明的第一方面,用于估计模式,具体地说,估计具有周期分量、准周期分量或实际周期分量的信号中的基音和/或基频的方法包括: -将所述信号从时域变换为频域以获取信号的频谱, -处理所述频谱以获取所述信号的零相位频谱, -将所述信号的所述零相位频谱变换为所述时域以获取相关信号, -将所述频谱和所述相关信号组合为组合频谱,以及 -根据所述组合频谱估计所述模式。
在本发明的进一步的方面,提供对应的设备,例如包括用于执行上述方法的步骤的处理单元。
在本发明的进一步的方面,提供对应计算机程序,其中包括当所述计算机程序在计算机上执行时,用于执行所述方法的步骤的程序代码构件。
本发明的优选实施例在从属权利要求中定义。应该理解,所声明的设备和所声明的计算机程序具有与所声明的方法类似和/或相同的优选实施例并且所述优选实施例在从属权利要求中定义。
本发明基于这样一种理念:即在附加步骤中,所述频域频谱与其时域变换相结合,以便形成的频谱在基音位置具有明显的峰值,在较高和较低的八度上具有明显衰减。此方法可用于估计信号的基音和/或基频。由于所形成的频谱在基音位置和/或所述基频上具有明显的峰值,因此可非常可靠地轻松检测基音和/或基频。
根据优选实施例,将信号从时域变换为频域的步骤包括傅里叶变换,具体指快速傅里叶变换。这提供以低付出实现从时域到频域变换的可能性。
根据进一步的实施例,通过DC陷波滤波器处理所述信号。所述DC陷波滤波器消除低频信号以防止错误检测。
所述DC滤波信号优选地与窗函数相乘。该加窗运算将频谱限于包含至少两个基音周期的区域。
根据进一步的实施例,处理所述信号的频谱以获取所述信号的幅度谱(magnitudespectrum)。所述信号幅度的计算提供了压缩运算,此运算可轻松实现并在反向变换之后形成零相位信号。
根据进一步的实施例,将所述信号的所述频谱压缩为压缩频谱,具体指通过平方根运算。可替换地,一般而言,压缩函数可以是使用例如0.6作为指数的根一函数。该运算强调基音的谐波并且减弱频谱包络的影响。
根据进一步的实施例,通过窗函数对所述信号的所述频谱进行加窗处理,具体指使用汉宁窗口的右半部分或具有类似作用的其他窗函数。该加窗运算减弱嘈杂的高频分量。
根据进一步的实施例,所述零相位频谱,具体是所述信号的压缩幅度谱,变换为时域包括傅里叶反变换。由于所述频谱,具体是压缩频谱的相位为零,因此只需计算所述频谱实部的正轴。这提供获取在多个基音周期上具有峰值的相关信号的可能性。
根据进一步的优选实施例,所述相关信号通过窗函数进行衰减。该加窗运算减弱所述频谱包络对所述相关信号的影响。
根据优选实施例,所述频谱和所述相关信号的组合包括重新采样所述频谱或所述相关信号中的至少一项。所述重新采样提供组合具有反比例轴的所述相关信号和所述频谱的可能性。具体而言,优选地使用对数尺。这提供组合在不同域的高低频分辨率方面具有巨大差别的频谱和信号的可能性。
根据优选实施例,所述估计所述模式包括搜索所述组合信号的绝对最大值。这提供查找所述信号的所述基音和/或所述基频的可靠、简单的可能性。
根据优选实施例,具体通过全波整流函数对所述信号进行整流。这提供当所述基频丢失时,在不降低非滤波信号性能的情况下判定信号的所述基音和/或所述基频的可能性。
根据优选实施例,所述整流信号的所述零相位频谱与所述非整流信号的所述零相位频谱进行比较,其中选择这些信号的最大值并将其与所述相关信号进行组合以形成所述组合信号。采取最大频谱是因为在纯正弦信号的情况下,所述整流消除了所述基频并且仅产生较高谐波。为降低失真,所述整流和所述非整流的频谱通过选择这些频谱中的最大值进行组合。


本发明的这些和其他方面通过下面描述的(多个)实施例将变得显而易见,并参考这些实施例进行阐述。在下面的附图中: 图1示出根据本发明的基音检测方法的示意性流程图, 图2示出待处理的源信号以及基音检测方法根据所述源信号导出的压缩频谱、相关信号、组合频谱和测量基音的图表, 图3示出根据本发明执行基音检测的设备的示意图, 图4示出基音检测方法的实施例的流程图, 图5示出基音检测方法的进一步实施例的流程图, 图6示出执行根据图4的方法的处理单元的示意性框图, 图7示出执行根据图5的方法的处理单元的示意性框图,以及 图8示出执行根据图1的方法的处理单元的示意性框图。
具体实施方式
图1示出一般由10表示的检测具有周期分量、准周期分量或实际周期分量的信号中的基音和/或基频的方法的流程图。这些信号的实例包括浊语音记录、乐器的乐音、诸如心跳之类的身体信号、来自 星球的无线电信号、活动监视信号。在步骤SI将输入信号g诸如语音信号之类的准周期或实际周期信号)从时域信号变换为频域频谱。所述变换优选地包括快速傅里叶变换(FFT)。步骤SI提供信号s的频谱S。频谱S在步骤S2进行处理以消除频谱的相位信息来获取零相位频谱(Sm)。所述处理包括计算频谱S的幅度,并且选择性地对频谱S进行频谱压缩,例如通过平方根运算。所述处理和压缩步骤S2强调基音的谐波并减弱频谱包络的影响。步骤S2提供零相位频谱匕。
零相位频谱Sn在步骤S3优选地使用傅里叶反变换从频域变换为时域。所述变换步骤S3提供相关信号£,该信号在多个基音周期上包括峰值。
零相位频谱S11和相关信号£在步骤S4被组合为组合频谱h。组合频谱h在基音上包括明显的峰值,其中频谱和多个基音周期中的较高谐波被衰减,留下基音和/或基频作为主要峰值。所述组合S4通过用零相位频谱乘以相关信号£来执行。
根据组合频谱b执行峰值检测S5以估计信号中的基音和/或基频。峰值检测S5包括搜索组合频谱h的最大值并提供输出信号P,该输出信号对应于源信号S中的基音和/或基频。
组合零相位频谱S11与其时域变换£的步骤S4导致组合频谱h,该频谱在基音位置和/或基频上具有明显的峰值,在较高和较低的八度上具有明显衰减。因此,峰值检测是可靠的,因为基音位置和/或基频对应于组合频谱h中的最高峰值。
图2示出五个图表图2A-E,这五个图表示出源信号s的振幅、压缩频谱S。的频率、相关信号£的频率、组合频谱h的频率,以及输出信号,源信号S的基音P对时间。
图2A所不的源信号互是英文语句“do they take the car when they go aboard”的时域。通过所述变换步骤SI和所述处理和压缩步骤S2从源信号s导出的压缩信号S。在图2B中示出。
通过所述变换步骤S3从压缩频谱S。导出的相关信号£的频率在图2C中示出。
通过步骤S4从压缩频谱S。和相关信号£的组合导出的组合频谱h的频率在图2D中示出。
通过步骤S5的峰值检测从组合频谱h导出的基音P对时间在图2E中示出。
因此,图2示出特定方法步骤SI至S5提供的信号或频谱对时间。
图3示出一般由20表示的执行基音检测的装置的示意性框图。
装置20包括信号输入端22和信号输出端24,分别用于接收源信号s以及提供输出信号P。装置20包括处理单元26,用于处理输入信号s以及估计输入信号s中的基音和/或基频。处理单元26将输出信号p提供给装置20的输出端24。处理单元26包括存储器28,用于存储导致处理单元26执行方法步骤来处理输入信号这的程序代码。
处理单元26可以通过集成电路或计算机实现,也可以通过执行必要处理步骤的离散元件和/或设备实现。
图4示出一般由30表示的基音检测方法的流程图以及特定方法步骤提供的对应信号或频谱。
源信号这在第一步骤S6优选地通过DC陷波滤波器进行滤波。输入信号S的低频率可能导致基音检测过程失真,这是因为在执行从时域到频域的傅里叶变换之前,执行加窗步骤。该加窗处理步骤将主要DC信号的能量加到较高频率,并且可以强调源信号s的弱低频。为了防止错误检测,需要在下面的加窗处理过程之前消除源信号S的低频。步骤S6的DC陷波滤波器用于消除源信号s的低频。根据S6的DC陷波滤波器包括转换函数: 其中
权利要求
1.用于估计模式,具体地说,估计具有周期分量、准周期分量或实际周期分量的信号Cs)中的基音和/或基频的方法(10 ;30 ;50),包括以下步骤: -将所述信号(S)从时域变换(SI ;S8)为频域以获取信号(S)的频谱(幻, -处理(S2 ;S9)所述频谱(S)以获取所述信号(S)的零相位频谱(^), -将所述信号(S)的所述零相位频谱(S11)变换(S3 ;S12)为所述时域以获取相关信号(c), -将所述频谱(S)和所述相关信号(£)组合(S4 ;S14)为组合频谱(h),以及 -根据所述组合频谱(h)估计(S5 ;S15)所述模式。
2.根据权利要求1的方法,其中所述将信号G)从时域变换(SI;S8)为频域的步骤包括傅里叶变换(S8),具体指快速傅里叶变换。
3.根据权利要求1或2的方法,其中所述信号通过DC陷波滤波器(54)进行处理(S6)。
4.根据权利要求3的方法,其中所述DC滤波信号(Sf)与窗函数(32)进行相乘(S7)。
5.根据权利要求1的方法,其中处理(S9)所述信号的频谱(S)以获取所述信号(S)的幅度谱(^)。
6.根据权利要求1的方法,其中将所述信号(互)的频谱(S)压缩(SlO)为压缩频谱(S。),具体指通过平方根运算。
7.根据权利要求1的方法,其中通过窗函数(34),具体指使用汉宁窗的右半部分对信号(互)的频谱(S)执行加窗处理(SI I)。
8.根据权利要求1的方法,其中将所述信号(S)的所述零相位频谱(S11)变换(S13;S12)为所述时域包括傅里叶反变换(S12)。
9.根据权利要求1的方法,其中所述相关信号(£)通过窗函数(36)进行衰减(S13)。
10.根据权利要求1的方法,其中所述组合(S4;S14)所述频谱(S)和所述相关信号(C)包括重新采样所述频谱(S)或所述相关信号(£)中的至少一项。
11.根据权利要求1的方法,其中所述估计(S5;S15)所述模式包括搜索所述组合信号(b)的绝对最大值。
12.根据权利 要求1的方法,其中所述信号具体通过全波整流函数进行整流(S16)。
13.根据权利要求12的方法,其中所述整流信号(I)的所述零相位频谱(Em)与所述非整流信号(S)的所述零相位频谱(Sn)进行比较,并且其中这些信号的最大值与所述相关信号(£)进行组合以形成所述组合信号(h)。
14.用于估计模式,具体地说,估计具有周期分量、准周期分量或实际周期分量的信号Cs)中的基音和/或基频的设备(26),包括: -第一变换构件(80),用于将信号(W从时域变换为频域以获取信号(W的频谱(S), -处理构件(82),用于处理所述频谱(S)以获取所述信号(S)的零相位频谱(匕), -第二变换构件(84),用于将所述信号(W的所述频谱(S)变换为所述时域以获取相关信号(£), -组合构件(86),用于将所述频谱(S)和所述相关信号(£)组合为组合频谱(h),以及 -估计构件(88),用于根据所述组合频谱(h)估计所述模式。
15.计算机程序,包括当所述计算机程序在计算机上执行时,用于导致所述计算机执行根据权利要求1至13中任一项的方法步骤的程序代码构件。
全文摘要
本发明涉及一种用于估计模式,具体地说,估计具有周期分量、准周期分量或实际周期分量的信号中的基音和/或基频的方法,其中所述信号从时域变换为频域以获取所述信号的频谱,对所述频谱进行处理以获取所述信号的零相位频谱,所述信号的频谱被变换为所述时域以获取相关信号,所述频谱和所述相关信号被组合为组合频谱,以及根据所述组合频谱估计所述模式。
文档编号G10L25/90GK103189916SQ201180054354
公开日2013年7月3日 申请日期2011年11月7日 优先权日2010年11月10日
发明者E.F.奇奇 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1