语音修正装置的制作方法

文档序号：7593308阅读：139来源：国知局

专利名称：语音修正装置的制作方法
技术领域：
本发明涉及根据周围的噪音等修正车载用导向装置输出的导向语音等的信号级的语音修正装置。
背景技术：
通常，车载导向装置输出的导向语音会因汽车音响装置输出的声音或发动机噪音等声压级的干扰往往难以听取。虽然可以采取在导向语音输出时将音响装置的输出音量关小而使导向语音的内容容易听取的方法，但是，当频繁输出导向语音时，每次都要关小音响装置的输出音量会感到不舒服。并且，对于发动机噪音等不可控制的声源，不能采用这样的对策。因此，如果不用降低音响装置的输出音量就能够听取导向语音的内容，就便利了。根据这样的要求，使用了基于听觉理论的响度补偿技术的语音修正装置之前已为我们所知(例如参照专利文献1)。这样的语音修正装置中，在听取位置设置送话器，根据该听取位置的噪音等级对输出语音进行增益修正，即使噪音等级变化使用者也总能清楚地听取语音的内容。
专利文献1日本专利特开平11-166835号公报(第3～7页，图1～10)但是，上述专利文献1所公开的语音修正装置，分别检测导向装置的导向语音和音响装置的输出声音等周围噪音的声压级，来决定放大导向语音的增益，但实际的声压级的检测，是在规定时间内将即将决定增益之前的导向语音与周围噪音的功率进行平均来进行的。因此，在导向语音的开头部分，导向语音的声压级在规定时间内被平均化，被误检测成比实际的声压级小的值，所以存在过大修正了该开头部分的声压级的问题。
图15A和15B是过大修正了语音开头部分的例子的示意图。图15A表示成为修正对象的导向语音的波形。并且，图15B表示使用专利文献1所公开的现有的语音修正装置进行增益修正后的导向语音的波形。这样，在导向语音的开头部分进行过大修正，呈现脉冲状的波形。
而且，上述专利文献1所公开的语音修正装置，使用自适应滤波器进行送话器位置处的导向语音的推定。通常，自适应滤波器的各滤波系数在电源刚投入之后的初始状态通常设定为0，此后更新该值。在该初始状态或紧随其后的期间，用该自适应滤波器推定的导向语音的功率比实际小很多，存在过大修正了与初始状态的滤波系数相对应的开头部分的声压级的问题。

发明内容
本发明就是鉴于这样的问题而提出的，其目的是提供一种能够防止对对象语音的开头部分进行过大修正的语音修正装置。
为了解决上述问题，本发明的语音修正装置包括扬声器，输出修正对象语音；送话器，设置在听取位置上；信号分离单元，分离与听取位置相对应的修正对象语音和周围噪音；语音修正单元，根据由信号分离单元分离出的修正对象语音的平均功率的值和周围噪音的平均功率的值，修正从扬声器输出的修正对象语音的声压级；语音开头部分修正单元，对与修正对象语音从无音状态变化到有音状态时的语音开头部分相对应的修正对象语音的平均功率的值进行修正。通过调整与修正对象语音的开头部分相对应而算出的平均功率的值，能够防止直接使用调整前的平均功率的计算值时产生的修正对象语音的开头部分的过大修正。
此外，最好，计算上述修正对象语音的平均功率的值的时间长度Ls，比计算上述周围噪音的平均功率的值的时间长度Ln长。当具有这样的关系时，修正对象语音的开头部分的功率包括无音部分被平均化，被评价成比实际值小的现象变得显著。因此，当具有这样的关系时，通过调整平均功率的值，能够更有效地防止修正对象语音的开头部分的过大修正。
另外，最好，对于与上述语音开头部分相对应刚刚从无音状态变化到有音状态后的时间Ln，上述语音开头部分修正单元使上述修正对象语音的平均功率的值成为Ls/Ln倍。由此能够修正由成为修正对象语音和周围噪音分的各自平均功率计算的对象的期间之差产生的误差量。
再者，最好，将与上述语音开头部分相对应、从无音状态变化到有音状态的时刻作为基准，在从经过时间Ln开始到经过时间Ls为止的期间内，上述语音开头部分修正单元使上述修正对象语音的平均功率的值的修正量连续地减少。由此能够回避在修正对象语音的平均功率有无修正的边界处的修正对象语音的不自然的联系。
此外，本发明的语音修正装置包括扬声器，输出修正对象语音；送话器，设置在听取位置上；信号分离单元，分离与听取位置相对应的修正对象语音和周围噪音；语音修正单元，根据由信号分离单元分离出的修正对象语音的平均功率的值和周围噪音的平均功率的值，修正从扬声器输出的修正对象语音的声压级；语音开头部分修正单元，停止与修正对象语音从无音状态变化到有音状态时的语音开头部分相对应、由语音修正单元进行的声压级的修正处理。通过停止对修正对象语音的开头部分进行的声压级的修正，还能防止在该开头部分产生的修正对象语音的过大修正。
另外，最好，计算上述修正对象语音的平均功率的值的时间长度Ls，比计算上述周围噪音的平均功率的值的时间长度Ln长。当具有这样的关系时，修正对象语音的开头部分的功率包括无音部分被平均化，被评价成比实际值小的现象变得显著。因此，当具有这样的关系时，通过不进行修正对象语音的开头部分的修正，能够更有效地防止该开头部分的过大修正。
再者，最好，上述信号分离单元包括滤波器，具有作为从上述扬声器到上述送话器的音响系统的脉冲响应的音响特性；以及运算单元，从上述扬声器输出上述修正对象语音的时候由上述送话器输出的信号中，减去将与上述修正对象语音相对应输入到上述扬声器中的信号通过上述滤波器后的信号；从上述滤波器输出相当于上述修正对象语音的信号，从上述运算单元输出相当于上述周围噪音的信号。由此，能够分别算出修正对象语音和周围噪音的平均功率的值，能够使用响度补偿技术进行修正对象语音的声压级的修正。
此外，最好还包括识别上述滤波器的音响特性的识别单元。由此，当扬声器的设置位置或修正对象语音的听取位置改变时，能够识别与该变更后的状态最相适应的音响特性，进行滤波器的设定。
另外，最好，上述识别单元是更新上述滤波器的滤波系数、以使从上述运算单元输出的信号的功率成为最小的系数更新单元；还包括滤波器初始设定单元，将由上述系数更新单元更新的上述滤波系数的初始值设定为0以外的值。由此，在滤波的初始状态下滤波系数从0开始慢慢更新，直到其值达到一定大小，由于在此期间不存在修正对象语音的平均功率被过小评价的情况，因此能够防止对修正对象语音的开头部分的过大修正。
再者，本发明的语音修正装置包括扬声器，输出修正对象语音；送话器，设置在听取位置上；信号分离单元，其包括滤波器，具有作为从上述扬声器到上述送话器的音响系统的脉冲响应的音响特性；和运算单元，从扬声器输出上述修正对象语音的时候由上述送话器输出的信号中，减去将与上述修正对象语音相对应输入到上述扬声器中的信号通过上述滤波器后的信号；并且，从上述滤波器输出相当于上述修正对象语音的信号，并且从上述运算单元输出相当于上述周围噪音的信号，以此分离与听取位置相对应的修正对象语音和周围噪音；系数更新单元，更新滤波器的滤波系数，以使从上述运算单元输出的信号的功率成为最小；滤波器初始设定单元，将由上述系数更新单元更新的上述滤波系数的初始值设定为0以外的值；语音修正单元，根据由信号分离单元分离出的修正对象语音的平均功率的值和周围噪音的平均功率的值，修正从扬声器输出的修正对象语音的声压级。通过使用0以外的值作为滤波系数的初始值，从滤波器输出的信号的平均功率从初期状态开始就具有比0大的规定值，因此能够防止修正对象语音的平均功率的计算结果从0开始慢慢变大，能够防止对与初始状态相对应的修正对象语音开头部分的声压级的过大修正。
此外，最好，上述滤波器初始设定单元设定的初始值，是与根据车辆的统计销售台数设定的代表车型相对应的滤波系数。由此能够提高将初始值设定为接近理想的滤波系数值的可能性。
另外，最好，上述滤波器初始设定单元设定的初始值，是从分别与典型的多个车型相对应的滤波系数值中选择的滤波系数值。或者，上述滤波器初始设定单元设定的初始值，是与从自身装置外的单元取得的搭载车型相对应的滤波系数。由此，能够容易地将初始值设定为接近理想的滤波系数值。
再者，最好，上述语音修正单元对被分割成多个频带的每一个进行上述声压级的修正。由此能够进行与每个频带相适应的语音修正，还能够更清晰地听取输出语音的内容。
而且，最好，上述语音修正单元具有增益表，该增益表与上述多个分割后的频带分别相对应，且在指定了周围噪音的声压级和从上述扬声器输出的声音的听觉上的期望声压级时取得对应的修正增益；通过参照该增益表进行声压级的修正。由此，容易进行计算每个频带的声压级的修正值的处理。

图1是表示第1实施方式的语音修正装置的整体结构的图。
图2是表示物理的声压级与人听到该声音时感觉到的声音的大小(响度)的对应关系(响度曲线)的图。
图3是表示为了在噪音下感觉到与寂静时同样大小的声音、需要对寂静时的声压级施加多大增益的图。
图4是表示由语音开头部分修正部对导向语音的开头部分的平均功率计算值进行修正的动作过程的流程图。
图5是导向语音的开头部分的说明图。
图6是表示利用本实施方式的语音修正装置进行导向语音的修正的结果的图。
图7是表示响度补偿增益计算部的结构的图。
图8是表示响度补偿增益计算部的变形例子的结构的图。
图9是表示使用了滤波器组和可变增益部的语音修正用滤波器的具体结构例子的10是表示使用了频率取样滤波器的语音修正滤波器的其他结构例子的图。
图11是表示使用了频率区域滤波器的语音修正滤波器的其他结构例子的图。
图12是表示不进行与导向语音的开头部分对应的增益加法运算的语音开头部分修正部的动作过程的流程图。
图13是表示第2实施方式的语音修正装置的整体结构的图。
图14是表示第3实施方式的语音修正装置的整体结构的图。
图15A和15B是表示过大地补偿了语音开头部分的例子的图。
具体实施例方式
下面参照附图详细地说明使用了本发明的一个实施方式的语音修正装置。
(第1实施方式)
图1是表示第1实施方式的语音修正装置的整体结构的图。如图1所示，本实施方式的语音修正装置100由语音修正滤波器20、响度补偿增益计算部30、自适应滤波器(ADF)40、运算部50、放大器60、扬声器62、送话器64和语音开头部分修正部90构成。该语音修正装置100搭载在车辆上，输入从导向装置(图中未表示)输出的导向语音信号，进行增益修正后的导向语音从扬声器62输出。
语音修正滤波器20对输入的导向语音信号进行增益调整。响度补偿增益计算部30设定语音修正滤波器20的增益，使从扬声器62输出而被导向装置的利用者听取的导向语音的清晰度与周围的噪音无关，大致恒定。通过使用本实施方式的语音修正装置100，利用者能够在听取位置以听觉上相同的清晰度听取导向语音。
自适应滤波器40是设定了与从识别的扬声器62到送话器64的音响系统的脉冲响应相对应的音响特性C1的滤波器。将输入到扬声器62中的语音信号通过该自适应滤波器40，由此能够再现从扬声器62输出后到达送话器64的语音的脉冲响应。
放大器60放大语音修正滤波器20输出的语音信号，并驱动扬声器62。送话器64设定在导向语音的听取位置，例如将车辆的驾驶员认为是利用者时设定在驾驶员的头部附近，收集从扬声器62输出到车室内的导向语音或周围的噪音。
自适应滤波器40包括音响特性设定部41和系数更新部42。自适应滤波器40是识别从扬声器62到送话器64的音响特性C1的元件。音响特性设定部41的滤波系数在系数更新部42中用例如LMS(LeastMean Square，最小均方值)算法决定。
运算部50输出从送话器64输出的信号中减去通过自适应滤波器40后的信号的误差。语音修正滤波器20输出的导向语音信号输入到自适应滤波器40中，并且，在通过放大器60后从扬声器62输出，到达送话器64。因此，通过由系数更新部42决定(更新)自适应滤波器40的滤波系数C1，使运算部50输出的误差的功率为最小，由此，能够使该滤波系数C1与从扬声器62到送话器64的音响系统的脉冲响应一致。
语音开头部分修正部90在算出导向语音的功率时利用规定的修正系数α对开头部分进行修正。通过进行这样的修正，能够防止功率的计算结果比实际值小。
音响特性设定部41、运算部50对应于信号分离单元，语音修正滤波器20、响度补偿增益计算部30对应于语音修正单元，语音开头部分修正部90对应于语音开头部分修正单元，运算部50对应于运算单元，自适应滤波器40对应于识别单元、系数更新单元。
本实施方式的语音修正装置具有这样的结构，下面说明其动作。
(1)语音修正的原理首先，说明在本实施方式中对导向装置的导向语音的增益进行修正的原理。
图2是表示物理的声压级与人听到该声音时感觉的语音的大小(响度)的对应关系(响度曲线)的图。在图2中，横轴为声压级(单位dB-SPL)，纵轴为表示人感觉到的声音的大小的响度(单位sone，宋)，曲线A为寂静时的响度曲线，曲线B为噪音时的响度曲线。但是，曲线B是随噪音等级而变化的。
在图2中，如果响度值相同，则人感觉声音的大小相同。因此，例如人感觉大小为0.1sone的声音，在寂静时是声压级为12dB-SPL的声音，在曲线B的噪音下是声压级为约37dB-SPL的声音。换言之，为了在曲线B的噪音下感觉到与寂静时以约12dB-SPL输出的声音相同大小的声音，需要输出约37dB-SPL的声音。即，在曲线B的噪音下需要约25dB的增益。此外，人感觉大小为1sone的声音，在寂静时是声压级为42dB-SPL的声音，但在曲线B的噪音下是声压级为约49dB-SPL的声音，因此在噪音下需要约7dB的增益。因此，即使在相同的噪音下，也需要根据输出的声音的声压级改变增益。
图2是表示为了在噪音下感觉到与寂静时相同大小的声音、需要在寂静时的声压级上施加多大增益的图。在该图中，横轴是寂静时输出的声音的声压级，纵轴是在噪音下为了感觉与寂静时相同大小的声音需要施加的增益值。例如，寂静时以声压级20dB输出的声音，在噪音下通过施加约19dB的增益，人感觉与寂静时相同大小的声音。
响度补偿增益计算部30预先将各种噪音等级的图3所示那样的导向语音的声压级与施加的增益之间的关系(以下称之为“增益表”)存储在内部存储器中，根据运算部50输出的噪音信号选择最合适的增益表，根据选中的增益表和音响特性设定部41输出的语音信号计算出最合适的增益。响度补偿增益计算部30设定语音修正用滤波器20的滤波系数，以便成为计算出的增益。
但是，导向语音一般具有各种频率成份，各频率成份的声压级不同。因此，听取导向语音的难易程度也会产生因导向语音信号及噪音信号的各频率成份的声压级不同而异的不均衡。并且，由于噪音信号的各频率成份的钝化效果会波及那些高频成份的导向语音信号，因此这种情况也需要考虑。
因此，最好是对导向语音信号的各种频率成份分别设定最合适的增益。即，最好是将导向语音信号和噪音信号分别分割成规定的频率带宽，在各频率带宽根据噪音信号的频率成份选择最适合的增益表，再根据选中的增益表和导向语音信号的频率成份计算出最合适的增益。
(2)语音修正装置的动作导向装置输出的导向语音信号通过语音修正滤波器20输入到放大器60中，再从扬声器62输出。送话器64收集该导向语音和从音响装置(图中没有示出)输出的音频声音或发动机噪音等的周围噪音，将这些声音合成的声音信号输出给运算部50。运算部50中输入从送话器64输出的语音信号之外，还输入经由设定有从扬声器62到送话器64的音响特性C1的音响特性设定部41的导向语音信号，抽出作为它们差分的周围噪音信号后，输入到响度补偿增益计算部30中。并且，从该音响特性设定部41输出的导向语音信号，通过语音开头部分修正部90输入到响度补偿增益计算部30中。
响度补偿增益计算部30根据从运算部50输入的周围噪音信号的声压级来设定语音修正滤波器20的增益，使在听取位置(设置送话器64的位置)听到的、从音响特性设定部41输入的导向语音信号的声压级为规定值。
(3)语音开头部分修正部的动作下面就语音开头部分修正部90对导向语音的开头部分的声压级进行修正的动作进行说明。
图4是表示语音开头部分修正部90对导向语音的开头部分的平均功率计算值进行修正的动作过程的流程图。首先，语音开头部分修正部90计算出导向语音的平均功率(步骤100)。该计算处理是以规定的取样间隔对音响特性设定部41输出的每个导向语音信号进行，但为了削减计算量，也可以按比取样间隔长的规定时间间隔进行。并且，该平均功率的计算用规定的窗口长度(时间长)Ls进行。即，通过对在相当于规定的窗口长度Ls的时间内获得的导向语音信号的功率进行平均，计算出导向语音的平均功率。
接着，语音开头部分修正部90根据在那之前的导向语音的平均功率计算值，判断导向语音直到刚才是否持续了无音状态(步骤101)。如果直到刚才一直为无音状态，则进行肯定判断，初始化计数器和修正系数α(步骤102)。这里，计数器是在检测到导向语音的开头部分(从无音部分变化到有音部分)后、对用于计算导向语音的平均功率的窗口长度Ls所经过的时间进行累计的单元，在步骤102中，计数器的计数值被初始化为0。并且，修正系数α是用来补偿计算出的导向语音的平均功率比实际值小这一情况的系数，与计数器的计数值相对应，其值被改变。
在计数器和修正系数α的初始化结束以后，或者刚才的导向语音的平均功率不为0的情况，即在步骤101的判断中进行否定判断的情况下，语音开头部分修正部90判断计数器的计数值是否到达与导向语音的窗口长度Ls相当的值(步骤103)。如果没有达到，则进行否定判断，将导向语音的平均功率计算值扩大α倍(步骤104)之后，更新计数器的计数值和修正系数α的值(步骤105)。
例如，假设计数值为k，计算噪音的平均功率时的窗口长度(时间长度)为Ln时，修正系数α的值的更新和计数值k的更新用以下的公式进行。
α＝Ls/Ln(k≤Ln)＝-k/Ln+(Ln+Ls)/Ln (Ln＜k≤Ls)＝1(Ls＜k)k＝k+1接着，在用修正系数α修正导向语音的平均功率的计算值后，响度补偿增益计算部30使用该修正后的值计算出语音修正滤波器20的增益值(步骤106)。将这样计算出的增益值加到导向语音中，输出修正后的导向语音(步骤107)。
另外，当计数器的计数值达到与导向语音的窗口长度Ls相当的值时，在步骤103的判断中进行肯定判断，不进行导向语音的平均功率的修正处理，而是由响度补偿增益计算部30进行增益值的计算(步骤106)。
这样，当只有导向语音的开头部分被包含在平均功率的算出的窗口长度Ls中时，在只用该开头部分计算出的平均功率的计算值上乘以修正系数α，进行修正，因此导向语音的平均功率计算值不会比实际值过于小，所以能够防止过大地修正导向语音的开头部分。
图5是修正导向语音的开头部分的说明图。在图5中，横轴为时间轴，假定从时刻t0起导向语音开始，此前发生的是规定声压级(平均功率)的周围噪音。
由于在时刻t0之前，导向语音为无声状态，所以在步骤101的判断中进行肯定判断，计数器的计数值和修正系数α的值同时被初始化为0。
到达时刻t0后，在经过与周围噪音的平均功率计算的窗口长度相当的时间(到达时刻t1之前)之前，修正系数α被设定为Ls/Ln。例如，在图4所示的例子中设定Ls/Ln＝2，修正系数α设定为2。因此，这期间进行将导向语音的平均功率计算值修正为2倍的处理，该修正后的平均功率被传送给响度补偿增益计算部30。
到达时刻t1后，从时刻t0开始经过与导向语音的平均功率计算的窗口长度Ls相当的时间之前(到达时刻t2之前)，修正系数α的值被设定为用(-k/Ln+(Ln+Ls)/Ln)计算出的值，即设定为随着从时刻t1向时刻t2的前进、从-2到-1以线性插补直线地减小的值。
在达到时刻t2后，修正系数α设定为1。因此，不进行利用修正系数α的修正的导向语音信号直接输入到响度补偿增益计算部30中。
图6是表示用本实施方式的语音修正装置100进行导向语音的修正后的结果的图。表示对图15A所示波形的导向语音进行修正后的结果。
同图15A所示的修正前的导向语音和图15B所示的用以往方法修正后的导向语音相比较可知，通过使用本实施方式的语音修正装置100能够大幅度地改善导向语音的开头部分的过大修正。
(4)其他的结构下面就响度补偿增益计算部30和语音修正滤波器20的一般结构进行说明。
(4-1)响度补偿增益计算部30的详细结构图7是表示响度补偿增益计算部30的结构的图。如图7所示，响度补偿增益计算部30包括频带电平求平均值部31、响度计算部34、频带增益表选择部35、频带电平求平均值部36和增益表39。
频带电平求平均值部31在每个规定的时间块内对从运算部50输出的周围噪音信号进行周知的FFT(Fast Fourier Transform，快速傅氏变换)运算，在每个规定的频带内计算声压级的平均值。考虑到例如人的听觉能够区分出大约每1/3倍频程的声音大小的不同，所以周围噪音等按每1/3倍频程进行频率分割。
响度计算部34用众所周知的Zwicker的响度计算方法(ISO532B)或Stevens的响度计算方法(ISO532A)调整从频带电平求平均值部31按每个频带输出的周围噪音信号的声压级。具体地说，进行如下的调整。即，当存在某种频率成份的周围噪音时，该周围噪音不仅影响听取相同频率成份的导向语音信号的难易程度，而且还影响听取上述的与高频侧相邻的频率成份的导向语音信号的难易程度。响度计算部34考虑这些因素，根据与低频侧相邻的周围噪音的频率成份的声压级大小，来调整周围噪音的各频率成份的声压级。即，当邻接的低频成份的声压级大时，将与高频侧相邻的频率成份的声压级修正成较高。通过进行这样的调整，在选择各频带的增益表时，只注意对应的各频带的周围噪音的声压级就可以，不必进行考虑与低频侧相邻的频带的周围噪音的、繁杂的处理。
频带增益表选择部35根据从响度计算部34输出的调整后的每个频带的周围噪音的声压级，选择每个频带最适合的增益表39。
频带电平求平均值部36在每个短时间块内对从音响特性设定部41输出的导向语音信号进行众所周知的FFT运算，按每个规定的频带计算声压级的平均。导向语音信号被分割成与周围噪音相同的频带。从频带电平求平均值部36输出的、按每个频带分割的导向语音信号，输入到频带增益表选择部35选中的增益表39中，按各频带计算出合适的增益。
这样，将周围噪音信号和导向语音信号分割成规定的频带，由此能够按每个频带选择增益表，将最适合的增益加到导向语音信号中。
在上述响度补偿增益计算部30中，虽然用频带电平求平均值部31或36求出导向语音信号或周围噪音信号的每个频带的声压级的平均值，但也可以用滤波器组或块平均部取代这些频带电平求平均值部，求出各频带的声压级的平均值。
图8是表示响度补偿增益计算部的变形例的结构的图。图8所示的响度补偿增益计算部30A包括滤波器组32、块平均部33、响度计算部34、频带增益表选择部35、滤波器组37、块平均部38和增益表39。
滤波器组32是具有规定频带的带通滤波器组，这些带通滤波器组将运算部50输出的周围噪音信号按规定频带分割。块平均部33在安规定的时间块对从平均滤波器组32输出且按各频带分割的周围噪音的声压级进行平均，输出给响度计算部34。
滤波器组37是与滤波器组32同样地具有规定的频带宽度的带通滤波器组，这些带通滤波器组将音响特性设定部41输出的导向语音信号按规定的各频带进行分割。块平均部38按规定的时间块对从滤波器组37输出且按各频带分割的导向语音信号的声压级进行平均，将平均的声压级输出给增益表39。
这样，即使使用滤波器组和块平均部，也能够将周围噪音信号和导向语音信号分割成规定的频带，按各频带选择增益表，从而将最适合的增益加到导向语音信号中。
(4-2)语音修正滤波器的详细结构语音修正滤波器20只要是能够修正(增益的加算)用上述响度补偿增益计算部30计算出的增益特性就可以，因此可以考虑采用各种结构。
图9是表示使用滤波器组和可变增益部的语音修正用滤波器的具体结构例子的图。图9所示的语音修正滤波器20包括滤波器组21、可变增益部22和加法器23。
滤波器组21是具有规定频带宽度的带通滤波器组，用这些带通滤波器组按频带分割导向语音信号。可变增益部22将由响度补偿增益计算部30计算出的各频带的增益，提供给由滤波器组21输出的、按各频带分割的导向语音信号的声压级，进行增益调整。加法器23将按各频带进行增益调整的导向语音信号加起来输出，实现期望的增益修正。如果采用这样的结构，能够用模拟电路低价地构成语音修正滤波器20。
图10是表示使用了频率取样滤波器的语音修正滤波器的其他结构例子的图。图10所示的语音修正滤波器20A包括样条(spline)函数插值部24、IFFT运算部25、FIR滤波器26。
样条函数插值部24将由响度补偿增益计算部30计算出的各频带的增益分别作为各频带的中心频率的增益，用周知的样条函数对各增益值之间进行插值，由此获得频带中圆滑的增益特性。IFFT运算部25用周知的IFFT(Inverse Fast Fourier Transform，快速傅里叶逆变换)运算将样条函数插值部24输出的增益特性从频率区域变换成时间区域，并设定FIR滤波器26的抽头系数的值。FIR滤波器26对导向语音信号进行时间轴上的滤波处理，实现期望的增益补偿。如果采用该结构，能够实现直线相位滤波器，对导向语音信号的修正，能够不按频带进行，而是按频率成份进行。
图11是表示使用了频率区域滤波器的语音修正滤波器的其他结构例子的图。图11所示的语音修正滤波器20B包括样条函数插值部27、FFT运算部28、频带滤波部29和IFFT运算部43。
样条函数插值部27将由响度补偿增益计算部30计算出的各频带的增益分别作为各频带的中心频率的增益，用周知的样条函数对各增益值之间进行插值，由此获得频带中圆滑的增益特性。FFT运算部28对导向语音信号进行FFT运算，从时间区域变换成频率区域。频带滤波部29利用从样条函数插值部27输出的圆滑的增益特性，对从FFT运算部28输出的频带区域内的导向语音信号进行滤波，IFFT运算部43对从频带滤波部29输出的频率区域内的导向语音信号进行IFFT运算，从频率区域变换到时间区域，实现期望的增益补偿。在IFFT运算过程中，为了实现线性滤波，使用周知的重叠加算方法(overlap-addmethod)或重叠保留方法(overlap-savemethod)就可以。通过采用这种结构，即使在滤波器的抽头数多的情况下也能使运算量比较少。
另外，在上述3种语音修正滤波器20、20A、20B中，无论是哪种，如果增益急剧变化，输出波形都变得不连续，因此最好用如下关系式慢慢更新增益特性。
G(n)＝αG(n-1)+βGm其中，G(n)为时间n的增益特性，G(n-1)为时间n-1的增益特性，Gm为响度补偿增益计算部30等或样条函数插值部24、27计算出的增益特性。α、β为系数，具有α+β＝1的关系。
这样，通过使用本实施方式的语音修正装置100，调整与成为修正对象的导向语音的开头部分相对应地计算出的平均功率的值，由此能够防止过直接使用调整前的平均功率的算出值时产生的导向语音的开头部分的过大修正。
特别是，当计算导向语音的平均功率值的窗口长度(时间长度)Ls比计算周围噪音的平均功率值的窗口长度(时间长度)Ln长时，导向语音的开头部分的过大修正变得显著，但本实施方式中，即使在这样的情况下也能更有效地防止导向语音的开头部分的过大修正。
此外，对于与语音开头部分对应从无音状态变化到有音状态后的随后的时间Ln，语音开头部分修正部90使导向语音的平均功率值成为Ls/Ln倍，能够修正由成为导向语音和周围噪音的各自平均功率计算的对象的期间之差产生的误差量。
另外，将与语音开头部分相对应地从无音状态变化到有音状态的时刻作为基准，在从经过时间Ln开始到经过时间Ls的期间内，语音开头部分修正部90连续地减少导向语音的平均功率值的修正量，能够在导向语音的平均功率有无修正的边界部分，避免导向语音的不自然的联系。
另外，本发明不局限于上述实施方式，在本发明的要点范围内可以做各种变形实施。虽然上述实施方式中，从导向语音的开头部分开始到经过与该导向语音的平均功率计算的窗口长度Ls相当的时间的期间内，将修正系数α设定为比1大的值，将单纯地计算出的导向语音的平均功率补偿到较大值，但也可以在这期间(或者比该时间短的时间内)完全停止用响度补偿技术进行的声压级的修正处理，不进行增益加算。
图12是表示不进行与导向语音的开头部分对应的增益加算的语音开头部分修正部90的动作过程的流程图。与图4所示的流程图相比，不同点是步骤106的位置不同，以及将步骤102、104和105分别替换成102A、104A和105A。
语音开头部分修正部90像从前一样求出增益值(步骤106)后，如果直到刚才导向语音为无音状态，则初始化计数器的计数值(步骤102A)。并且，在计数器的计数值k没有达到相当于导向语音的窗口长度Ls的情况下，在步骤103的判断中进行否定判断，接着，语音开头部分修正部90在将由响度补偿增益计算部30决定的增益值设定为0(dB)(步骤104A)后，更新计数器的计数值k(步骤105A)。由于在这样将增益值设定为0的期间，不进行修正导向语音的增益的处理，因此能够防止产生导向语音的开头部分的过大修正。
此外，虽然上述实施方式在从到达导向语音的开头部分开始到经过与导向语音的平均功率计算的窗口长度Ls相当的时间为止的期间内，分2阶段设定修正系数α，但也可以一律将大于等于1的固定值，例如1.5或2作为修正系数α的值来使用。由此，不仅能够防止导向语音的开头部分的过大修正，而且可以简化设定修正值α的过程。
另外，虽然上述实施方式中说明的是修正从车载导向装置输出的导向语音的增益的情况，但在修正从车辆内输出的其它声音的增益的情况下，或者在修正在车辆以外的室内输出的电视设备的播放节目的声音的增益等情况下，也能使用本发明。
再者，虽然上述实施方式以及以下说明的第2实施方式、第3实施方式中，作为修正对象语音考虑的是导向语音，但本说明书中使用的“修正对象语音”，除了人发出的声音外，还广泛地包含在与其相同或比其稍宽一些的可听范围内的频带中所包含的声音(例如音频声音)。因此，通过用音频声音取代导向语音作为修正对象语音输入到语音修正装置100中，即使周围噪音的程度变化也能清晰地听取音频声音的内容(第2实施方式)但是，构成上述自适应滤波器40的音响特性设定部41使用了FIR滤波器，该FIR滤波器的各滤波系数(抽头系数)，在电源刚投入后的初始状态它们的值被设定为0。然后，在最初的导向语音信号被输入后，这些滤波系数的值从0开始依次更新为0以外的值。因此，在从该初始状态到各滤波系数的值被更新为一定大小为止的期间内，由自适应滤波器40输出的、在送话器位置推定的导向语音的声压级逐渐变大，直到接近实际的导向语音的声压级。因此，输入到处于初始状态的自适应滤波器40内的导向语音的开头部分被过大修正。第2实施方式的语音修正装置可防止由于这样的原因而发生的导向语音的开头部分的过大地修正。
图13是表示第2实施方式的语音修正装置的整体结构的图。如图13所示，本实施方式的语音修正装置100A包括语音修正滤波器20、响度补偿增益计算部30、自适应滤波器40、运算部50、放大器60、扬声器62、送话器64、滤波器初始设定部70和语音开头部分修正部90。
该语音修正装置100A同图1所示的语音修正装置100相比的不同点是，追加了滤波器初始设定部70，而且不通过语音修正滤波器20而直接将导向语音信号输入到自适应滤波器40中。但是，通过改变自适应滤波器40的连接，由系数更新部42更新的音响特性设定部41的滤波系数只是变更为考虑了语音修正滤波器20的滤波特性的值，由自适应滤波器40推定送话器所处位置的导向语音的动作实质上是相同的。
在刚投入电源之后(或者在之后对自适应滤波器40内的音响特性设定部41的各滤波系数进行初始化的复位电路(图中没有示出)中刚刚进行复位动作之后)，滤波器初始设定部70进行将构成自适应滤波器40内的音响特性设定部41的FIR滤波器的各滤波系数设定为0以外的初始值的处理。滤波器初始设定部70与滤波器初始设定单元相对应。
作为各滤波系数的初始值，如果与从扬声器62到送话器64的音响系统的脉冲响应对应的音响特性C1已知的话，最好设定该值，但该音响特性C1随搭载语音修正装置100A的车辆的形状、扬声器62的设定位置或坐席、以及其它搭载物的材料或形状等的变化，并不固定。因此，在本实施方式中，滤波器初始设定部70采用以下(1)～(3)中的任一值作为电源刚投入之后的初始值。
(1)作为初始值，使用与根据车辆的统计销售台数设定的代表车型相对应的滤波系数值。该代表车型除了表示例如最近统计的销售数量最多的车型外，有时也表示处于前几位的多种车型。在多种车型的情况下，使用预先实测这些车型而求得的滤波系数的平均值。由此能够提高可初始化设定成接近理想的滤波系数的可能性。
(2)作为初始值，可以使用从与典型的多种车型分别相对应的滤波系数中选择的滤波系数。例如，在滤波器初始设定部70的内部或外部保存预先分别实测多种车型而求得的滤波系数的值，在指定搭载该语音修正装置100A的车辆的车型的情况下，使用从滤波器初始设定部70读出的指定车型的滤波系数。作为指定车型的方法可以考虑几种情况。例如，在发动机控制装置等其他装置保存有车型信息的情况下，通过获取该车型信息来指定车型。而且，在备有设定车型用的双列直插式开关(或者具有相同功能的开关类)的情况下，使用者自己操作该双列直插式开关指定小轿车、小型货车等车型。或者，不进行这样的机械操作，而是用滤波器初始设定部70(或其他的控制部)作成规定的车型设定画面显示在显示装置上，使用者看着该画面操作操作部，由此指定车型。
(3)作为初始值，可以使用与从自身装置外部取得的搭载车型相对应的滤波系数值。在能够从自身装置(语音修正装置100A)的外部取得与搭载了语音修正装置100A的车辆的车型相适应的典型滤波系数的值的情况下，使用该滤波系数的值。例如，安装可装卸的存储卡等记录媒体，用滤波器初始设定部70读出存储在其中的滤波系数的值，由此获取最合适的滤波系数的值。并且，通过因特网等通信媒体与规定的服务器进行通信，用滤波器初始设定部70获取最合适的滤波系数的值。通过用(2)、(3)所描述的方法设定初始值，能够容易地将初始值设定为接近理想的滤波系数值。
(第3实施方式)图14是表示第3实施方式的语音修正装置的整体结构的图。如图14所示，本实施方式的语音修正装置100B包括语音修正滤波器20、响度补偿增益计算部30A、自适应滤波器40、运算部50、放大器60、扬声器62、送话器64和滤波器初始设定部70。
图13所示的语音修正装置100A与图1所示的语音修正装置100一样，为了降低因计算噪音的平均功率的窗口长度Ln比计算导向语音的平均功率的窗口长度Ls短而造成的影响，设置了语音开头部分修正部90，但本实施方式的语音修正装置100B中，用响度补偿增益计算部30A将计算各平均功率的窗口长度Ls、Ln设定为相等，由此省略了语音开头部分修正部90。
由上述滤波器初始设定部70进行的滤波系数的初始值设定所引起的效果，是与语音开头部分修正部90的是否存在无关而有效的，在刚投入电源后的初始状态能够抑制导向语音信号输入到自适应滤波器40时产生的过大修正。
权利要求
1.一种语音修正装置，包括扬声器，输出修正对象语音；送话器，设置在听取位置上；信号分离单元，分离与上述听取位置相对应的上述修正对象语音和周围噪音；以及语音修正单元，根据由上述信号分离单元分离出的上述修正对象语音的平均功率的值和上述周围噪音的平均功率的值，修正从上述扬声器输出的上述修正对象语音的声压级，其特征在于，还包括语音开头部分修正单元，对与上述修正对象语音从无音状态变化到有音状态时的语音开头部分相对应的上述修正对象语音的平均功率的值进行修正。
2.如权利要求1所述的语音修正装置，其特征在于，计算上述修正对象语音的平均功率的值的时间长度Ls，比计算上述周围噪音的平均功率的值的时间长度Ln长。
3.如权利要求2所述的语音修正装置，其特征在于，对于与上述语音开头部分相对应刚刚从无音状态变化到有音状态后的时间Ln，上述语音开头部分修正单元使上述修正对象语音的平均功率的值成为Ls/Ln倍。
4.如权利要求3所述的语音修正装置，其特征在于，将与上述语音开头部分相对应、从无音状态变化到有音状态的时刻作为基准，在从经过时间Ln开始到经过时间Ls为止的期间内，上述语音开头部分修正单元使上述修正对象语音的平均功率的值的修正量连续地减少。
5.如权利要求1所述的语音修正装置，其特征在于，上述语音开头部分修正单元可停止与上述修正对象语音从无音状态变化到有音状态的语音开头部分相对应进行的、由上述语音修正单元进行的声压级的修正处理。
6.如权利要求1～5中的任一项所述的语音修正装置，其特征在于，上述信号分离单元包括滤波器，具有作为从上述扬声器到上述送话器的音响系统的脉冲响应的音响特性；以及运算单元，从上述扬声器输出上述修正对象语音的时候由上述送话器输出的信号中，减去将与上述修正对象语音相对应输入到上述扬声器中的信号通过上述滤波器后的信号；从上述滤波器输出相当于上述修正对象语音的信号，从上述运算单元输出相当于上述周围噪音的信号。
7.如权利要求6所述的语音修正装置，其特征在于，还包括识别单元，识别上述滤波器的音响特性。
8.如权利要求7所述的语音修正装置，其特征在于，上述识别单元是更新上述滤波器的滤波系数、以使从上述运算单元输出的信号的功率成为最小的系数更新单元；还包括滤波器初始设定单元，将由上述系数更新单元更新的上述滤波系数的初始值设定为0以外的值。
9.如权利要求8所述的语音修正装置，其特征在于，上述滤波器初始设定单元设定的初始值，是与根据车辆的统计销售台数设定的代表车型相对应的滤波系数。
10.如权利要求8所述的语音修正装置，其特征在于，上述滤波器初始设定单元设定的初始值，是从分别与典型的多个车型相对应的滤波系数值中选择的滤波系数值。
11.如权利要求8所述的语音修正装置，其特征在于，上述滤波器初始设定单元设定的初始值，是与从自身装置外的单元取得的搭载车型相对应的滤波系数。
12.如权利要求1～11中的任一项所述的语音修正装置，其特征在于，上述语音修正单元对被分割成多个频带的每一个进行上述声压级的修正。
13.如权利要求12所述的语音修正装置，其特征在于，上述语音修正单元具有增益表，该增益表与上述多个分割后的频带分别相对应，且在指定了周围噪音的声压级和从上述扬声器输出的声音的听觉上的期望声压级时取得对应的修正增益；通过参照该增益表进行声压级的修正。
全文摘要
本发明提供一种能够防止修正对象语音的开头部分的过大修正的语音修正装置。语音修正装置(100)包括输出导向语音的扬声器(62)；听取位置上设置的送话器(64)；分离与听取位置相对应的导向语音和周围噪音的音响特性设定部(41)；运算部(50)；根据分离出的导向语音的平均功率的值和周围噪音的平均功率的值、修正从扬声器(62)输出的导向语音的声压级的语音修正滤波器(20)；响度补偿增益计算部(30)；对与导向语音从无音状态变化到有音状态时的语音开头部分相对应的导向语音的平均功率的值进行修正的语音开头部分修正部(90)。
文档编号H04R3/00GK1573930SQ200410049029
公开日2005年2月2日申请日期2004年6月11日优先权日2003年6月12日
发明者丸本彻申请人:阿尔派株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丸本彻
技术所有人：阿尔派株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。