发动机声音合成的制作方法

文档序号:2826079阅读:264来源:国知局
发动机声音合成的制作方法
【专利摘要】本发明描述一种用于分析声音的方法。根据本发明的一个实例,所述方法包括:提供将要分析的输入声音信号且从所述输入信号或从至少一个引导信号确定所述输入信号的基频。此外,确定具有所述基频的高次谐波的频率,因此确定谐波模型参数。基于所述谐波模型参数合成谐波信号,且通过从所述输入信号减去所述谐波信号来估计残留信号。基于所述残留信号估计残留模型参数。此外,描述一种用于合成声音信号的对应方法。
【专利说明】发动机声音合成
【技术领域】
[0001]各种实施方案涉及声音合成的领域,特别地涉及合成内燃发动机的声音。
【背景技术】
[0002]混合动力和电动汽车的日益增长的普及导致城市环境中新的安全问题,因为与(内燃)发动机噪声相关的许多听觉线索可能丢失。解决方案是智能地使车辆更嘈杂。事实上,好几个国家已经建立了要求汽车发出最小级别的声音以便向其它交通参与者警告驶来的汽车的法规。
[0003]在该领域中已进行分析且合成声音信号的一些研究(尤其在语音处理的背景中)。然而,已知方法和算法通常需要强大的数字信号处理器,其不适用于如汽车工业中所要求的低成本应用。因此,需要一种用于合成声音(尤其是内燃发动机的声音)的有效方法。

【发明内容】

[0004]描述一种用于分析声音的方法。根据本发明的一个实例,所述方法包括:提供将要分析的输入声音信号且从所述输入信号或从至少一个引导信号确定所述输入信号的基频。此外,确定具有所述基频的高次谐波的频率,因此确定谐波模型参数。基于所述谐波模型参数合成谐波信号,且通过从所述输入信号减去所述谐波信号来估计残留信号。基于所述残留信号估计残留模型参数。
[0005]此外,描述一种用于合成声音信号的方法。所述合成是基于可(例如)根据上文描述的分析方法确定的谐波模型参数和残留模型参数的。根据一个实例,所述方法包括:接收至少一个引导信号,且基于所述至少一个引导信号计算多个高次谐波的基频和频率。此外,提供与所计算频率相关的残留模型参数和谐波模型参数。使用用于高次谐波的所计算基频和频率的谐波模型参数来合成谐波信号。另外,使用残留模型参数合成残留信号。通过叠加合成的谐波信号与残留信号来计算总声音信号。
【专利附图】

【附图说明】
[0006]参看以下附图和说明书可更好地理解本发明。图中的组件未必按比例绘制,而是将重点放在图示本发明的原理上。此外,在图中,相同标号指定对应零件。在图中:
[0007]图1是图示基于正弦曲线信号模型来分析发动机声音的一般实例的框图;
[0008]图2是图示基于如下模型来分析发动机声音的一个实例的框图,此模型利用外部引导信号来估计在输入信号中呈现的谐波正弦曲线信号内容;
[0009]图3是使用谐波正弦曲线信号内容的自适应引导式估计来分析发动机声音的另一个实例的框图;
[0010]图4是图示图3的实例中的谐波正弦曲线信号分量的适配的框图;以及
[0011]图5是图示使用信号模型的发动机声音的合成的框图,信号模型是通过根据图1到图3的实例中的一者的信号分析获得的。【具体实施方式】[0012]下面在发动机或电机声音合成的背景中描述一个或多个实施方案。然而,本文中呈现的用于分析和合成声音的方法也可应用于汽车领域外的领域,而且可应用于其它目的。如上所述,可能需要电动或混合动力汽车发出最小级别的声音来允许人(尤其是行人和听力减退的人)听到驶来的汽车。在汽车内部,内燃发动机的典型声音也可为所需的,以向司机提供关于汽车的操作状态(关于油门控制或其类似者)的声学反馈。从汽车外部能感知到的声音是由高达30km每小时到40km每小时的行驶速度的发动机声音支配的。因此,尤其在行驶速度较低的城市区域中,发动机声音是向其它交通参与者警告驶来的汽车的主要“报警信号”。
[0013]在许多应用中,所关注信号由被宽频带噪声恶化的多个正弦曲线信号分量构成。为了分析且模型化此类信号,正弦曲线或“谐波”模型是适当的。另外,主要由正弦曲线分量组成的信号能在不同应用中找到,例如,语音处理中的共振峰频率。正弦曲线模型化也可成功地应用于分析且合成由乐器产生的声音,这是因为这些乐器通常产生具有相对缓慢变化的正弦曲线分量的谐波或接近谐波信号。正弦曲线模型化提供可听到信号分量的参数表示,使得原始信号可由合成(即,通过(谐波与残留)分量的加法(即,叠加))恢复。
[0014]旋转机械系统(诸如汽车的内燃发动机)具有高谐波含量加宽频带噪声信号,且因此“正弦曲线加残留”模型良好地适用于分析且合成由真实世界内燃发动机产生的声音。出于此目的,由内燃发动机产生的声音可使用安置在汽车外部的一个或多个麦克风记录,同时汽车位于(例如)滚筒式底盘测功器中且在不同负载条件下以及在各种旋转发动机转速下操作。可分析得出的音频数据以从可稍后使用(例如,在电动汽车中)的音频数据“提取”模型参数,以通过使用适当合成器以容易方式再生电机声音。模型参数通常不是恒定的,但可尤其地取决于旋转发动机转速而变化。
[0015]图1图示用于在频域中分析音频信号以提取提到的模型参数的系统。时间离散(具有时间索引η)输入信号χ[η]是如上文讨论通过测量获得的音频数据。在图1中,测量通常通过提供输入信号x[n]的输入信号源10用符号表现。信号x[n]可使用数字短时傅里叶变换(STFT)算法(例如,快速傅里叶变换(FFT)算法)变换到频域。在图1中,使用参考符号20标记执行用于产生频域中的输入信号X(e>)的STFT的功能块。从频域中的输入信号X(e>)开始,所有随后信号分析在频域中进行。然而,信号处理不限于频域。信号处理可部分地或甚至排外地在时域中执行。然而,当使用频域信号处理时,谐波正弦曲线的数目仅仅由所使用的FFT长度限制。
[0016]根据图1中图示的系统,将输入信号X(e>)供应到执行正弦曲线信号分量的估计的功能块30。在本实例中,将此功能划分成两个部分,即基频&的估计(功能块31)和具有频率fl、f2、…、个谐波正弦曲线的估计(功能块32)。在该领域中已知用于完成此任务的许多方法,且在此处不进一步详细讨论。然而,所有方法是基于可如下表达的信号模型的:
[0017]x[n] = Ao-sin(coon+fo) + Arsin(?in+cpi) +...+ AN-sin(coNii+(pN) +
[0018]r[n](l)[0019]即,将输入信号x[n]模型化为以下各者的叠加:具有基频& (对应于角频率Otl)的正弦曲线信号、具有频率到& (分别对应于角频率O1到ωΝ)的N个谐波正弦曲线,和宽频带非周期性残留信号r[n]。正弦曲线信号估计(区块30)的结果是包括以下各者的三个对应向量:估计的频率fMf^,f1;…,fN),以及对应量值A= (Atl, A1,…,An),和相位值φ = (φο.φι,..., (Ρν),其中基频的相位(Po可设置为零。可针对各种不同基频(例如,对应于发动机的转速900rpm、1000rpm、I IOOrpm等等)确定含有频率、量值和相位值的这些向量f、A、C|^另外,可针对不同发动机负载或针对表示发动机的操作模式的其它非声学参数(齿轮数、反向齿轮激活等等)来确定向量f、A、f?
[0020]为了估计残留信号r[n](其也可取决于一个或多个非声学参数(齿轮数、反向齿轮激活等等)),使用估计的模型参数(即向量f、A、《P)以通过个别正弦曲线的叠加来合成输入信号的总(估计的)谐波含量。此通过图1中的区块40实现,且将输入信号的得出的估计的谐波部分在频域中表示为H(e>)且在时域中表示为h[n]。可从输入信号X(e>)减去合成的信号H(eju)(参看区块50)以获得残留信号R(e>),其是如上所述的时域信号r[n]的频域等效者。残留信号可经受滤波(例如,非线性平滑滤波器60)。此滤波器应被配置来平滑化残留信号,即,抑制估计的残留信号R(e>)中的瞬态产物、尖峰脉冲或其类似者。将已滤波的残留信号R’ (eJW)供应给区块70,区块70表示经执行以获得特征化残留信号的模型参数的信号分析。此信号分析可包括(例如)线性预测性编码(LPC)或简单地残留信号的功率谱的计算。举例来说,残留信号的功率谱可在不同频谱区域(根据在心理声学方面激发的频率尺度的频带,参看(例如)Fasti, Hugo; Zwicker, Eberhard; Psychoacoustics (3rd.edition), Springer, 2007)中计算,其可被选择以考虑心理声学方面关键的频带限制。使用心理声学方面激发的频率尺度(诸如Bark或Mel尺度)将允许计算时间和内存使用的大量减少。
[0021]在因此已获得用于不同基频的“谐波”信号模型参数以及用于不同非声学参数(例如,发动机的转速值、齿轮数、发动机负载等等)的残留信号模型参数的情况下,可稍后使用这些模型参数来合成现实发动机声音,其对应于根据图1分析的由发动机产生的声音。
[0022]图2图示信号分析的另一个实例,其可看作是根据图1的信号分析的替代。图2的信号分析的结构对应于图1的结构,除了正弦曲线信号估计30的功能原理。图2的框图的剩余部分与图1的实例相同。在本实例中,执行引导式谐波正弦曲线估计,其中将(例如)rpm信号rpm[n]用作引导信号。在此背景中,rpm信号通常是表示发动机的转速的信号,其可(例如)通过发动机控制单元(也被称为动力传动系统控制模块,其在许多汽车中常常可通过CAN总线来访问,CAN=控制器区域网络)提供。当使用引导式正弦曲线估计时,基频不是从输入信号X(e>)估计的,而是直接从引导信号(其在本实例中是正测试的发动机的rpm信号rpm[n])获得的。举例来说,针对六缸内燃发动机,每分钟1200转数的发动机速度得到120Hz的基频。
[0023]针对引导式正弦曲线信号估计,可使用如下信号模型。因此,将输入信号x[n]模型化为
[0024]
【权利要求】
1.一种用于分析声音的方法,其包括: 提供输入信号; 使用所述输入信号或至少一个引导信号来确定所述输入信号的基频,且确定所述基频的高次谐波的频率,由此确定与所确定的频率相关的谐波模型参数; 基于所述谐波模型参数合成谐波信号; 通过从所述输入信号减去所述谐波信号确定残留信号; 基于所述残留信号计算残留模型参数。
2.如权利要求1所述的方法,其中所述输入信号变换到频域,由此在进一步处理之前提供频域输入信号。
3.如权利要求2所述的方法,其中所述频域输入信号的处理完全在所述频域中执行,且由此在所述频域中计算所述谐波信号和所述残留信号。
4.如权利要求1、2或3所述的方法,其中从所述至少一个引导信号导出所述高次谐波的所述基频和所述频率。
5.如权利要求4所述的方法,其中确定所述谐波模型参数包括: 微调从所述至少一个引导信号获得的所述高次谐波的所述基频和所述频率。
6.如权利要求5所述的方法,其中所述微调包括: 迭代地修改高次谐波的所确定的频率和它们的对应振幅和相位值,使得所述残留信号的范数得以最小化。
7.如权利要求4至6中任一项所述的方法,其中所述谐波模型参数包括所述高次谐波的所述基频和所述频率的频率向量、对应量值向量和对应相位向量。
8.如权利要求1至7中任一项所述的方法,其进一步包括: 在估计所述残留模型参数之前对所述残留信号进行滤波以平滑化所述残留信号。
9.如权利要求1至8中任一项所述的方法,其中确定所述残留模型参数包括 计算所述残留信号的功率谱。
10.如权利要求1至8中任一项所述的方法,其中确定谐波模型参数包括估计与高次谐波的所述基频和所述频率相关的相位值和振幅值。
11.一种用于基于特别地根据如权利要求1所述的方法确定的谐波模型参数和残留模型参数来合成声音信号的方法,所述方法包括: 接收至少一个引导信号; 基于所述至少一个引导信号计算多个高次谐波的所述基频和频率; 提供与所计算频率相关的所述残留模型参数和所述谐波模型参数; 使用用于高次谐波的所计算基频和频率的所述谐波模型参数来合成谐波信号; 使用所述残留模型参数合成残留信号; 通过叠加所述合成的谐波信号与所述残留信号来计算总声音信号。
12.如权利要求11所述的方法,其进一步包括: 将已预滤波的白噪声添加到所述总声音信号。
13.如权利要求12所述的方法,其中所述预滤波包括将所述白噪声的振幅值映射到O到2 π的相位范围中,由此产生将要添加到所述总声音信号的相位信号。
14.如权利要求11至13中任一项所述的方法,其中合成所述残留信号包括:产生具有功率谱密度的噪声信号,所述功率谱密度对应于由所述残留模型参数表示的功率谱密度。
15.如权利要求9或14所述的方法,其中在根据在心理声学方面激发的频率尺度的不同频带中计算所述功率谱密度,以便考虑在心理声学方面关键的频带限制。
【文档编号】G10K15/02GK103544949SQ201310289860
【公开日】2014年1月29日 申请日期:2013年7月11日 优先权日:2012年7月12日
【发明者】M.克里斯托夫 申请人:哈曼贝克自动系统股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1