掩蔽声音输出装置和掩蔽声音输出方法

文档序号：2832848阅读：398来源：国知局

专利名称：掩蔽声音输出装置和掩蔽声音输出方法
技术领域：
本发明涉及一种输出掩蔽声音以掩盖声音的掩蔽声音输出装置,并且还涉及一种用于该掩蔽声音输出装置的掩蔽声音输出方法。
背景技术：
已知一种掩蔽技术，其中，为了在工地等中形成令人舒服的环境空间，拾取听者感到不舒服的声音，并且输出具有类似于该声音的声学特性(例如频率特性)的另一种声音，由此使不舒服的声音几乎听不见。例如，专利文献I公开了一种技术，其中，对在听者周边所拾取的声音的频率成分进行分析，并且产生、然后输出当与环境声音混合时变成另一种声音的声音。专利文献I的技术能够给予听者不同于不舒服声音的舒服声音，而不会减小不舒服的声音，并且能够提供使听者舒服的环境空间。
现有技术参考
专利文献
专利文献I JP-A-2009-118062发明内容
本发明将要解决的问题
然而，在专利文献I中，对听者周边的所有声音进行掩盖，因此即使并未使听者感到不舒服或者是必要的声音也被掩盖了。因此，存在执行不必要处理以及听者不能听见必要信息的问题。
因此,本发明的目的是提供一种可以选择将要掩蔽的声音或定时的掩蔽声音输出装置，并且还提供一种用于该掩蔽声音输出装置的掩蔽声音输出方法。
解决该问题的手段
为了实现该目的，本发明提供一种掩蔽声音输出装置，其包括:输入单元，其适于输入与拾取的声音相关的拾音信号；提取单元，其适于提取拾音信号的声学特征量；指令接收单元，其适于接收用于开始输出掩蔽声音的指令；以及输出单元，其适于在指令接收单元接收到用于开始输出的指令时输出与由提取单元所提取的声学特征量相对应的掩蔽声曰
优选地，掩蔽声音输出装置还包括:对应表，其指不声学特征量和掩蔽声音之间的对应关系；以及掩蔽声音选择单元，其适于通过利用由提取单元所提取的声学特征量来查阅对应表，以选择与由提取单元所提取的声学特征量相对应的掩蔽声音，并且其中，输出单兀输出由掩蔽声音选择单兀选定的掩蔽声音。
优选地,使多个掩蔽声音与声学特征量相对应，并且掩蔽声音选择单兀根据预定条件从对应表中的与声学特征量相对应的多个掩蔽声音中选择掩蔽声音。
优选地，掩蔽声音输出装置还包括掩蔽声音数据存储单元，其配置用于存储与掩蔽声音相关的声音数据，当指令接收单元接收到用于开始输出的指令并且确定由提取单元所提取的声学特征量未存储在对应表中时，掩蔽声音选择单兀将由提取单兀所提取的声学特征量与有关掩蔽声音的存储在掩蔽声音数据存储单元中的声音数据的声学特征量进行比较，并且从掩蔽声音数据存储单元读出具有与由提取单元所提取的声学特征量相似的声学特征量的声音数据，并且输出单兀输出与该声音数据相对应的掩蔽声音。
优选地,在所述掩蔽声音输出装置中，掩蔽声音选择单兀在对应表中存储由提取单元所提取的声学特征量、和从掩蔽声音数据存储单元读出的有关掩蔽声音的声音数据，同时重新产生其间的对应数据。
优选地，掩蔽声音输出装置还包括:通用掩蔽声音存储单元，其配置用于存储与通用掩蔽声音相关的声音数据；以及干扰声音产生单元，其适于根据由提取单元所提取的声学特征量来处理有关通用掩蔽声音的存储在通用掩蔽声音存储单元中的声音数据，以产生对将要掩蔽的声音进行干扰的干扰声音，并且从输出单元输出的掩蔽声音包含由干扰声音产生单元所产生的干扰声音。
优选地，掩蔽声音输出装置还包括干扰声音产生单元，干扰声音产生单元适于根据由提取单元所提取的声学特征量对拾音信号进行处理，以产生对将要掩蔽的声音进行干扰的干扰声音，并且从输出单元输出的掩蔽声音包含由干扰声音产生单元所产生的干扰声音优选地，掩蔽声音包含通过合成连续和间歇的声音而获得的声音。
优选地,根据输出掩蔽声音的时间来改变对包含在掩蔽声音中的连续和间歇的声音进行组合的组合方式。
优选地，当由提取单元所提取的声学特征量与存储在对应表中的声学特征量一致或相似时，掩蔽声音选择单兀选择与一致的或相似的声学特征量相对应的掩蔽声音，并且输出单兀自动地输出由掩蔽声音选择单兀选定的掩蔽声音。
此外，本发明提供一种掩蔽声音输出方法，其包括:输入步骤，输入与拾取的声音相关的拾音信号；提取步骤，提取拾音信号的声学特征量；指令接收步骤，接收用于开始输出掩蔽声音的指令；以及输出步骤，当在指令接收步骤中接收到用于开始输出的指令时输出与在提取步骤中所提取的声学特征量相对应的掩蔽声音。
优选地,掩蔽声音输出方法还包括掩蔽声音选择步骤，用于查阅表明声学特征量与掩蔽声音之间的对应关系的对应表以选择与在提取步骤中所提取的声学特征量相对应的掩蔽声音，并且在输出步骤中输出在掩蔽声音选择步骤中选定的掩蔽声音。
优选地，多个掩蔽声音与声学特征量相对应；并且在掩蔽声音选择步骤中，根据预定条件从对应表中的与声学特征量相对应的多个掩蔽声音中选择掩蔽声音。
优选地,提供了存储与掩蔽声音相关的声音数据的掩蔽声音数据存储单兀，并且在掩蔽声音选择步骤中，当在指令接收步骤中接收到用于开始输出的指令并且确定在提取步骤中所提取的声学特征量未存储在对应表中时，将在提取步骤中所提取的声学特征量与有关掩蔽声音的存储在掩蔽声音数据存储单元中的声音数据的声学特征量进行比较，从掩蔽声音数据存储单元读出具有与在提取步骤中所提取的声学特征量相似的声学特征量的声音数据，并且在输出步骤中输出与该声音数据相对应的掩蔽声音。
优选地，在掩蔽声音选择步骤中，将在提取步骤中所提取的声学特征量、和从掩蔽声音数据存储单元读出的有关掩蔽声音的声音数据存储在对应表中，同时使其间重新对应。
优选地，提供了存储与通用掩蔽声音相关的声音数据的通用掩蔽声音存储单元，并且掩蔽声音输出方法还包括:干扰声音产生步骤，用于根据在提取步骤中所提取的声学特征量来处理有关通用掩蔽声音的存储在通用掩蔽声音存储单元中的声音数据以产生对将要掩蔽的声音进行干扰的干扰声音，并且在输出步骤中输出的掩蔽声音包含由干扰声音产生步骤所产生的干扰声音。
优选地，该方法还包括干扰声音产生步骤，用于根据在提取步骤中所提取的声学特征量对拾音信号进行处理以产生对将要掩蔽的声音进行干扰的干扰声音，并且在输出步骤中输出的掩蔽声音包含由干扰声音产生步骤所产生的干扰声音。
优选地，掩蔽声音包含通过合成连续和间歇的声音而获得的声音。
优选地,根据输出掩蔽声音的时间来改变对包含在掩蔽声音中的连续和间歇的声音进行组合的组合方式。
优选地，在掩蔽声音选择步骤中，当在提取步骤中所提取的声学特征量与存储在对应表中的声学特征量一致或相似时，选择与一致的或相似的声学特征量相对应的掩蔽声音，并且在输出步骤中，自动输出在掩蔽声音选择步骤中选定的掩蔽声音。
本发明的有益效果
根据本发明，选择将要掩蔽的声音，并因此可以避免必要声音被掩蔽和必要信息听不见、或执行了产生非必要掩蔽声音的处理的情形。

图1是以图解方式示出实施例的掩蔽声音输出装置的构造的框图。
图2是以图解方式示出掩蔽声音输出装置的信号处理部和存储部的构造的框图。
图3是以图解方式不出掩蔽声音选择表的不图。
图4是以图解方式示出在存储的声音数据被处理的情况下信号处理部的功能的框图。
图5是以图解方式示出在拾音信号在频率轴上被修改的情况下信号处理部的功能的框图。
图6是示出掩蔽声音输出装置中执行的处理的过程的流程图。
图7是不出在自动开始输出掩蔽声音的情况下掩蔽声音输出装置中执行的处理的过程的流程图。
具体实施方式
在下文中，将参照附图来描述本发明的掩蔽声音输出装置的优选实施例。在该实施例的掩蔽声音输出装置中，当使用者(听者)执行诸如打开开关的操作时，对由麦克风所拾取的声音进行分析，并且输出根据分析结果的充足的掩蔽声音。在该实施例中，即，当听者选择将要掩蔽的声音或定时时，可以形成舒服的环境空间，其中听者不希望听见的声音(包括空调设备的噪声、来自房间外部的噪声等)被掩蔽。在下文中，将在不希望听见说话者语音的听者是掩蔽声音输出装置的使用者的假设下进行描述。可替换地，不希望他/她自己的谈话内容被听者听见的说话者也可以是掩蔽声音输出装置的使用者。
图1是以图解方式示出该实施例的掩蔽声音输出装置的构造的框图。掩蔽声音输出装置I包括控制部2、存储部3、操作部4、声音输入部5、信号处理部6、以及声音输出部7。控制部2通过例如CPU (中央处理单元)配置，并且控制掩蔽声音输出装置I的操作。存储部3通过ROM (只读存储器)、RAM (随机存取存储器)等配置，并且存储将被控制部2、信号处理部6等读出的必要程序、数据等。操作部4接收使用者的操作。例如，操作部4通过用于掩蔽声音输出装置I的电源开关、用于当使用者感到不舒服时指示开始输出掩蔽声音的开关等配置。
声音输入部5具有图中未示出的A/D转换器，并且连接至麦克风5A。在声音输入部5中，从麦克风5A提供的拾音信号被A/D转换器进行A/D转换，并且转换的信号被输出至信号处理部6。将要由麦克风5A拾取的声音包括说话者的语音、空调设备的噪声、来自房间外部的噪声等。
信号处理部6通过例如DSP (数字信号处理器)配置，对拾音信号进行信号处理，并且提取声学特征量。声学特征量是表明声音特征的物理值，并且指示例如频谱(频率水平)、频谱包络中的峰值频率(基本频率、共振峰等)。图2是以图解方式示出控制部2、信号处理部6、以及存储部3的构造的框图。信号处理部6包括FFT (快速傅里叶变换)61和特征量提取部62。控制部2包括掩蔽声音选择部21。FFT61对从声音输入部5供给的拾音信号执行傅里叶变换以将时域信号转换成频域信号。
特征量提取部62提取由FFT61进行了傅里叶变换的拾音信号的特征量(频谱)。具体地，特征量提取部62针对每个频率计算信号强度，提取计算出的信号强度等于或大于阈值的频谱，并且提取声学特征量(下文中常常简称为特征量)。特征量是表明声音特征的物理值，并且表明频谱(频率水平)本身、频谱包络的峰值频率(中心频率和每个峰值的水平)等。特征量提取部62可以将信号强度等于或小于阈值的频谱确定为不必要成分，并且将该频谱设定为“O”。阈值是与至少听者能够从含有诸如噪声之类的各种声音的输入声音中感知到的水平相对应的值。阈值可以提前设定，或者通过操作部4输入。
掩蔽声音选择部21从存储部3选择与掩蔽声音(与由特征量提取部62提取的特征量相对应)相关的声音数据，并且将该声音数据输出至声音输出部7 (下文中这样的声音数据被称为掩蔽声音数据)。存储部3包括掩蔽声音存储部31和掩蔽声音选择表32。掩蔽声音存储部31存储多个时基波形的掩蔽声音数据。掩蔽声音数据可以提前(例如，在工厂出货时)存储在掩蔽声音存储部31中，或者在每种情况下经由网络等从外部获得、然后存储在掩蔽声音存储部31中。掩蔽声音选择表32是数据表，在该数据表中使拾音信号的特征量与存储在掩蔽声音存储部31中的掩蔽声音数据相对应。
图3是以图解方式示出掩蔽声音选择表32的示图。掩蔽声音选择表32具有特征量栏、时区栏和掩蔽声音栏，并且各栏的信息彼此相对应。由特征量提取部62提取的拾取的声音的特征量存储在特征量栏中。与存储在特征量栏中的特征量相对应的掩蔽声音被存储在掩蔽声音栏中。具体地，掩蔽声音栏通过干扰声音栏、背景声音栏和突发性声音(dramatic sound)栏配置，并且掩蔽声音存储部31中的存储数据的地址被存储在各栏中。适于输出相应的掩蔽声音的时区被存储在时区栏中。
其中每一个均主要构成掩蔽效应的干扰声音被存储在干扰声音栏中。干扰声音的示例是通过对说话者的语音进行处理而获得的并且产生的内容不能被理解的常规声音(没有词汇意义的声音)。掩蔽声音数据包含干扰声音中的至少一个。稳定的(连续的)背景声音被存储在背景声音栏中。背景声音的示例是BGM、小溪的潺潺声、树的沙沙声等。不稳定地(间歇地)生成的并且具有高渲染效果的诸如钢琴声、门铃声和钟声之类的声音(突发性声音)被存储在突发性声音栏中。背景声音被重复再现和输出。突发性声音随机地输出或者在重复再现和输出背景声音的重复开始时输出。突发性声音的输出定时可以由数据表确定。因为干扰声音在词汇方面没有意义，因此可能会不时地产生奇怪的感觉。因此，通过背景声音增加背景噪声水平，并且使诸如上述干扰声音之类的声音不引人注意，由此减小由干扰声音造成的听觉奇怪性。此外，听者的注意力被引向突发性声音，并且以听觉心理学方式使由于干扰声音造成的奇怪性不弓I人注意。
在与图3所示的特征量A相对应的掩蔽声音数据中，BGM的背景声音以及诸如钢琴声或门铃声之类的突发性声音与干扰声音A合成。BGM是慢节奏舒缓的音乐曲子、快节奏的音乐曲子等，并且适于输出掩蔽声音的时区的声音与干扰声音A合成。如图3所不,例如，在从IOAM至12AM的时区中慢节奏的BGMl与干扰声音A合成，并且在从14PM至15PM的时区(下午)中快节奏的BGM2与干扰声音A合成。作为适于输出掩蔽声音的时区的突发性声音，例如，门铃声在早晨与干扰声音A合成，并且钢琴声在下午与干扰声音A合成。而且，小溪潺潺声的背景声音以及钟声的突发性声音与干扰声音B (例如，说话者的语音)合成的掩蔽声音数据与特征量B相对应。
掩蔽声音选择部21查阅与从掩蔽声音选择表32选择的掩蔽声音相关的地址,并且从掩蔽声音存储部31获得掩蔽声音数据。例如，掩蔽声音选择部21在由特征量提取部62提取的特征量与存储在特征量栏中的特征量之间进行匹配(使用交叉相关性等进行比较)，并且搜索一致的特征量或在能够确定达到近似一致的程度上相似的特征量。例如，在搜索结果为由特征量提取部62提取的特征量与特征量A近似一致并且当前时间为11时的情况下，掩蔽声音选择部21查阅掩蔽声音选择表32以选择与特征量A以及当前时间(11时)相对应的掩蔽声音“干扰声音A+BGM1+门铃声”。在当前时间与表的时区栏不对应的情况下，例如，在当前时间是16时的情况下，掩蔽声音选择部21从表中选择时区栏为空白的掩蔽声音“干扰声音A+树沙沙声”。结果，当输出由掩蔽声音选择部21选择的掩蔽声音时，能够通过背景声音和突发性声音防止给予听者在干扰期间可能发生的不舒服感，同时目标声音被干扰且几乎听不见(使内容几乎不能理解)。在多个掩蔽声音对应于一个特征量的情况下，使用者可以通过操作部4手动地选择期望的掩蔽声音。
在图3所不的掩蔽声音选择表32中，通过掩蔽声音选择部21记录各种类型的信息。具体地，在使用者在操作部4上执行开始输出掩蔽声音的操作的情况下，掩蔽声音选择部21确定由特征量提取部62提取的特征量是否存储在掩蔽声音选择表32中。如果确定由特征量提取部62提取的特征量未存储在掩蔽声音选择表32中，那么掩蔽声音选择部21从掩蔽声音存储部31选择适于该特征量的掩蔽声音数据。例如，掩蔽声音选择部21计算由特征量提取部62提取的特征量与存储在掩蔽声音存储部31中的掩蔽声音数据当中的多个掩蔽声音数据之间的交叉相关性，并且选择具有最高相关性的掩蔽声音数据。可替换地，掩蔽声音选择部21可以按照相关性递减的顺序选择多个掩蔽声音数据。此时，存储在掩蔽声音存储部31中的掩蔽声音数据具有时基波形。因此，掩蔽声音选择部21可以将掩蔽声音数据提供至信号处理部6，并且每次信号处理部6都可以转换至频域信号并且提取特征量。可替换地，指示掩蔽声音数据的特征量的信息(例如，频谱的峰值)可以作为头部增加至存储在掩蔽声音存储部31中的掩蔽声音数据。在这种情况下，仅需要掩蔽声音选择部21获得由特征量提取部62提取的特征量与存储在掩蔽声音存储部31中的掩蔽声音数据的头部(指示特征量的信息)之间的相关性，并且可以缩短由掩蔽声音选择部21执行来从掩蔽声音存储部31选择掩蔽声音数据的处理。
掩蔽声音选择部21选择与如上所述由特征量提取部62提取的特征量具有高相关性的掩蔽声音数据，并且对存储所选择掩蔽声音数据的地址以及掩蔽声音选择表32中的提取特征量进行重新存储(记录)，同时使它们彼此相对应。此时，在掩蔽声音选择表32中存储特征量等的时间和季节可以被存储在时区栏中，或者可以存储针对所选择掩蔽声音数据而预先设定的时区和季节。在针对一个特征量选择多个掩蔽声音数据的情况下，可以允许使用者通过操作部4设定掩蔽声音数据输出的时区或季节。
此外，在对由特征量提取部62提取的特征量最适宜的掩蔽声音数据(具有高相关性的掩蔽声音数据)未存储在掩蔽声音存储部31中的情况下，掩蔽声音选择部21可以从外部设备获得具有高相关性的掩蔽声音数据。例如，外部设备可以是连接至掩蔽声音输出装置的个人计算机、或经由网络连接的服务器设备。
如上所述，在特征量曾经存储(记录)在掩蔽声音选择表32中的情况下，当之后拾取相同特征量的声音时，掩蔽声音选择部21能够自动选择适于所提取的特征量的掩蔽声音数据。如果所提取的特征量未记录在掩蔽声音选择表32中，那么掩蔽声音选择部21必须执行这样的处理(与多个掩蔽声音数据的交叉相关性的计算等):针对每次掩蔽声音的输出从掩蔽声音存储部31选择适于所提取的特征量的掩蔽声音数据。该处理需要长期的时间。相比之下，当特征量曾经记录在掩蔽声音选择表32中时,仅需要读出相应的掩蔽声音数据。因此，能够缩短在掩蔽声音输出之前流逝的时间，并且能够更快速地形成掩蔽了说话者的语音的舒服的环境空间。当多个掩蔽声音数据与一个特征量相对应并且随机变化时，即使在拾取相同声音的情况下，也不总是输出相同的掩蔽声音，并且因此能够抑制鸡尾酒会效应且能够总是适当地进行掩蔽。此外，当适于诸如早晨、中午和晚上等各个时区的掩蔽声音数据的对应能够实现时，能够形成更舒服的环境空间。
可替换地，信号处理部6可以获得存储在存储部3中的声音数据，并且对该声音数据进行处理。图4是以图解方式示出在存储的声音数据被处理的情况下控制部2和信号处理部6的功能的框图。除图2所示的信号处理部6的构造之外，图4所示的信号处理部6还包括掩蔽声音处理部64。在存储部3中，通用掩蔽声音存储部33、背景声音存储部34以及突发性声音存储部35得以存储，通用掩蔽声音存储部33存储通用掩蔽声音(例如，不能理解的多个男人和女人的语音)的数据，背景声音存储部34存储背景声音数据(BGM等)，以及突发性声音存储部35存储突发性声音数据(间歇地生成的曲调等)。
如图4所示，掩蔽声音选择部21从通用掩蔽声音存储部33获得通用掩蔽声音数据，并且将该数据输出至掩蔽声音处理部64。掩蔽声音处理部64将输入的掩蔽声音数据转换成频域信号，并且根据从掩蔽声音选择部21供给的拾音信号的特征量对掩蔽声音数据的频率特性进行处理。例如，使通用掩蔽声音的共振峰与拾音信号的共振峰一致，将处理了的掩蔽声音数据转换成时域信号，并且将转换了的信号输出至掩蔽声音选择部21。结果，在拾音信号为说话者语音的情况下，特别地，使输出的通用掩蔽声音更接近说话者的语音的特征。然后，掩蔽声音选择部21任意地或者根据使用者的指令从背景声音存储部34和突发性声音存储部35选择BGM、钢琴声等，将该声音与处理了的通用掩蔽声音进行合成，随后将合成的声音输出至声音输出部7。因此,能够防止给予听者在通过背景声音和突发性声音进行掩蔽期间可能出现的不舒服感，同时通过接近于说话者语音的通用掩蔽声音而干扰说话者的语音并且使其几乎听不见。同样在这种情况下，可以使曾经提取的拾音信号的特征量和从存储部3获得的数据彼此相对应，并且将其存储在如图3所示的表中。根据该配置，其后，不需要指示选择背景声音和突发性声音的处理。
此外，在该实施例中，信号处理部6可以对拾音信号进行处理，并且在处理了的信号包括在掩蔽声音数据中的同时对其进行输出。在这种情况下，信号处理部6在时间轴或频率轴上对拾音信号进行修改，并且将该信号转换成不能理解的语音。图5是以图解方式示出在拾音信号在频率轴上被修改的情况下控制部2和信号处理部6的功能的框图。除图2所示的信号处理部6的构造之外，信号处理部6还包括掩蔽声音处理部65和IFFT (FFT逆变换)66。例如，掩蔽声音处理部65在由特征量提取部62提取的特征量中提取来自拾音信号的共振峰频率，并且执行高阶共振峰频率的倒置以打破语音结构，由此产生干扰声音。IFFT66将经由掩蔽声音处理部65处理了的频域信号转换成时域信号。控制部2的掩蔽声音选择部21根据时区、季节或使用者的指令获得存储在存储部3的背景声音存储部34和突发性声音存储部35中的背景声音、突发性声音等。然后，控制部2将通过IFFT66转换成时域信号的干扰声音与通过掩蔽声音选择部获得的背景声音和突发性声音进行合成，并且将合成的声音输出至声音输出部7。根据该配置,在掩蔽声音输出装置的使用者被设定为听者的情况下，可以将听者不希望听见的说话者的谈话内容转换成无意义的语音。此外，能够防止给予听者在通过背景声音和突发性声音进行掩蔽期间可能发生的不舒服感，并因此能够形成使听者舒服的环境空间。同样在这种情况下，如参照图4所述，可以使曾经提取的拾音信号的特征量与从存储部3获得的数据彼此相对应，并且将其存储在如图3所示的表中。
在图5的配置中，掩蔽声音输出装置I包括回声消除部8，回声消除部8去除来自从声音输入部5供给的拾音信号的回声。在图5的掩蔽声音输出装置I中，在掩蔽声音是从扬声器7A输出的情况下,麦克风5A拾取掩蔽声音的回馈成分，由此造成拾音信号含有回声。因此，回声消除部8包括适应性滤波器，接收来自声音输出部7的掩蔽声音(时域信号)，并且对该声音进行滤波处理，由此产生伪循环(pseudo recurrent)声音信号，该伪循环声音信号是从扬声器7A输出的掩蔽声音的伪信号成分并且环绕麦克风5A。当从拾音信号减去伪循环声音信号时，回声被去除。因此，后续级中的信号处理部6能够从拾音信号去除环绕麦克风5A的掩蔽声音，并且正确地提取说话者的语音。同样在图1和图2所示的配置中，回声消除部8可以布置在声音输入部5的后续级中。
在图2、图4和图5的示例中，已对信号处理部6提取特征量并且处理声音数据的示例进行了描述。可替换地，控制部2可以执行存储在存储部3中的程序，由此实现信号处理部6的功能。
声音输出部7具有图中未示出的D/A转换器和放大器，并且连接至扬声器7A。在声音输出部7中，与信号处理部6中所确定的掩蔽声音数据相关的信号由D/A转换器进行D/A转换，振幅(音量)被放大器调节至最佳值，然后从扬声器7A输出放大的信号作为掩蔽声音。
接下来，将对掩蔽声音输出装置I的操作进行描述。图6是示出掩蔽声音输出装置I中执行的处理的过程的流程图。图6所示的处理由控制部2和信号处理部6执行。
控制部2 (或信号处理部6)确定是否从声音输入部5输入了可以确定声音存在的级别的拾音信号(SI)。如果没有输入这样的拾音信号(S1:否)，那么结束图6的操作。如果输入了这样的拾音信号(S1:是)，那么信号处理部6在FFT61中执行傅里叶变换，然后提取拾音信号的特征量(S2)。接下来，控制部2确定是否通过操作部4接收到用于开始输出掩蔽声音的指令(S3)。如果未接收到输出开始指令(S3:否)，那么结束图6的操作。
如果接收到输出开始指令(S3:是)，那么控制部2从掩蔽声音选择表32搜索在S2中所提取的特征量(S4)。控制部2确定在S2中所提取的特征量是否存储在掩蔽声音选择表32中(S5)。如果该特征量未存储在掩蔽声音选择表32中(S5:否)，即，如果将要对并非掩蔽目标的语音进行掩蔽，那么控制部2从掩蔽声音存储部31选择适于所提取的特征量的掩蔽声音数据(S6)。控制部2可以选择最类似于所提取的特征量的掩蔽声音数据，或者选择多个掩蔽声音数据。此外，控制部2可以选择由使用者选定的掩蔽声音数据。
控制部2将存储所提取的特征量和所选择的掩蔽声音数据的地址存储在掩蔽声音选择表32中以更新掩蔽声音选择表32(S7)。接下来，控制部2从掩蔽声音存储部31获得与所提取的特征量相对应的掩蔽声音数据(S8)。具体地，控制部2查阅掩蔽声音选择表32,选择与所提取的特征量相对应的掩蔽声音,获得存储所选择的掩蔽声音的掩蔽声音数据的地址，并且获得在该地址处存储的数据(掩蔽声音数据)。控制部2将获得的掩蔽声音数据输出至声音输出部7 (S9),并且从扬声器7A输出该声音数据作为掩蔽声音。
相比之下，如果在S2中所提取的特征量存储在掩蔽声音选择表32中(S5:是)，即，如果将要对是掩蔽目标的语音进行掩蔽，那么控制部2从掩蔽声音存储部31获得与在S2中所提取的特征量相对应的掩蔽声音数据(S8)。在这种情况下,不对掩蔽声音选择表32进行更新。其后，控制部2将获得的掩蔽声音数据输出至声音输出部7 (S9)，并且从扬声器7A输出该声音数据作为掩蔽声音。
在图6中的S3中，响应于使用者的开始指令，控制部2手动地开始掩蔽声音的输出。可替换地，在S2中所提取的特征量与存储在掩蔽声音选择表32中的特征量一致的情况下，可以自动地输出掩蔽声音。图7是示出在自动开始输出掩蔽声音的情况下掩蔽声音输出装置I中执行的处理的过程的流程图。
控制部2确定是否从声音输入部5输入了可以确定声音存在的级别的拾音信号(Sll)0如果没有输入这样的拾音信号(Sll:否)，那么结束图7的操作。如果输入了这样的拾音信号(Sll:是)，控制部2确定是否设定自动开始输出掩蔽声音(S12)。优选的是将控制部配置成使得使用者能够通过操作部4选择是否自动地开始掩蔽声音的输出。如果未设定掩蔽声音输出的自动开始(S12:否)，那么结束图7的操作。如果设定了掩蔽声音输出的自动开始(S12:是)，那么信号处理部6提取拾音信号的特征量(S13)。
接下来，控制部2从掩蔽声音选择表32搜索由信号处理部6提取的特征量，并且确定所提取的特征量是否存储在掩蔽声音选择表32中(与所提取的特征量一致的特征量是否存储在掩蔽声音选择表32中)(S14)。如果未存储该特征量(S14:否)，那么结束图7的操作。如果已存储(S14:是)，那么控制部2从掩蔽声音存储部31获得与在S13中所提取的特征量相对应的掩蔽声音数据(S15)。控制部2将获得的掩蔽声音数据输出至声音输出部7(S16),并且从扬声器7A输出该声音数据作为掩蔽声音。该处理结束。如上所述，即使在没有从使用者接收到用于开始输出掩蔽声音的指令的情况下，当从麦克风5A输入了具有已经记录在掩蔽声音选择表32中的特征量的声音时，掩蔽声音输出装置I能够自动地开始输出掩蔽声音。
在图7中的S14中特征量未存储在掩蔽声音选择表32中的情况下，该处理结束。可替换地，类似于图6中的S6和S7，适于所提取的特征量的掩蔽声音数据可以选自掩蔽声音存储部31，并且可以将存储所提取的特征量和所选择的掩蔽声音数据的地址存储在掩蔽声音选择表32中以更新掩蔽声音选择表32。在图7的处理期间，在开始指令是由使用者发出的情况下，可以使图7的处理中止，并且可以执行图6所示的S4之后的处理以输出掩蔽声音。
根据该实施例，在接收到听者的开始输出掩蔽声音的指令的情况下，如上所述，输出用于拾取的声音的掩蔽声音。即，听者能够选择将要掩蔽的声音或定时。结果，虽然感到不舒服的声音根据使用者而不同，但可以仅仅掩蔽使每个使用者都感到不舒服的声音，并且能够实现最适宜每个使用者的环境空间。此外，可以避免当掩蔽所有声音时听者不能听见必要信息的可能性。此外，能够减少针对不需要掩蔽的声音产生掩蔽声音的非必要处理。由于能够根据时间改变将要输出的掩蔽声音，因此可以向听者提供更舒服的环境空间。
尽管已描述了优选实施例，但在设计方面可以适当地改变掩蔽声音输出装置I的具体构造等。上面实施例中描述的功能和效果仅仅列出了本发明产生的最有利的功能和效果。本发明的功能和效果并不局限于上面实施例中所述的那些。
在该实施例中，例如，使每次将要输出的掩蔽声音相对应。可替换地，可以使将要针对每个季节输出的掩蔽声音相对应。上述实施例被配置成使得即使在没有通过操作部4接收到开始输出掩蔽声音的指令的情况下，也自动地输出掩蔽声音。可替换地，它可以被配置成使得在没有接收到开始输出掩蔽声音的指令的情况下，则不输出掩蔽声音。在这种情况下，为了减少浪费性的处理，仅当接收到开始输出掩蔽声音的指令时，特征量提取部62才会提取特征量。
上述实施例被配置成使得掩蔽声音输出装置I获得存储在掩蔽声音输出装置自身中的掩蔽声音数据。可替换地，它可以被配置成获得存储在外部装置中的掩蔽声音数据。例如，掩蔽声音输出装置I可以被配置成其可连接至个人计算机，并且获得存储在个人计算机中的掩蔽声音数据，并且将其累积存储在存储部3中。掩蔽声音输出装置I可以具有麦克风5A和扬声器7A未一体布置的构造,并且可连接通用麦克风和通用扬声器。掩蔽声音输出装置I被配置作为用于生成掩蔽声音的专用设备。可替换地，掩蔽声音输出装置可以是便携式电话、PDA (个人数字助理)、个人计算机等。
在下文中，将详细描述本发明的概要。
本发明的掩蔽声音输出装置包括输入单元、提取单元、指令接收单元和输出单元。输入单元接收与拾取的声音相关的拾音信号。提取单元提取拾音信号的声学特征量。声学特征量是表明声音的特征的物理值，并且指示例如频谱(频率水平)、频谱包络中的峰值频率(基本频率、共振峰等)。指令接收单元接收开始输出掩蔽声音的指令。在指令接收单元接收到开始输出的指令的情况下，输出单元输出与由提取单元所提取的声学特征量相对应的掩蔽声音。
根据该配置，从拾音信号提取与拾音信号相关的声学特征量，并且在使用者指示开始输出掩蔽声音的情况下，或者在通过自动设置而开始输出掩蔽声音的情况下，输出与所提取的声学特征量相对应的掩蔽声音。根据该配置，当使用者听见该使用者不希望听见的声音时，例如，使用者执行对开始输出掩蔽声音做出指示的操作，由此可以仅掩蔽使用者不希望听见的声音。结果，使用者能够选择将要掩蔽的声音，并因此可以避免不需要掩蔽的声音却被掩蔽的情形、以及不能听见必要信息的问题。此外，能够减少针对不需要掩蔽的声音产生掩蔽声音的非必要处理。
在本发明的掩蔽声音输出装置中，以下模式是可能的，该模式中掩蔽声音输出装置还包括:表明声学特征量与掩蔽声音之间的对应关系的对应表；以及掩蔽声音选择单元，掩蔽声音选择单元通过利用由提取单元所提取的声学特征量来查阅对应表，以选择与声学特征量相对应的掩蔽声音。在这种情况下，输出单兀输出由掩蔽声音选择单兀选择的掩蔽声音。
根据该配置，对表明有关拾取声音的声学特征量和将要输出的掩蔽声音之间的对应关系的表进行查阅，由此自动地输出与拾取的声音相对应的掩蔽声音。
这样的模式是可能的:其中使多个掩蔽声音与声学特征量相对应，并且掩蔽声音选择单兀根据预定条件从对应表中的相对应的多个掩蔽声音中选择掩蔽声音。
根据该配置，即使在将要掩蔽相同声音的情况下，也可以根据条件输出不同的掩蔽声音。在早晨时区中，例如，输出适于早晨的清新声音，以及在夜晚时区中，输出适于夜晚的放松声音。其后，输出根据使用者的使用状态的合适的掩蔽声音。
在本发明的掩蔽声音输出装置中，这样的模式是可能的:其中掩蔽声音输出装置还包括存储与掩蔽声音相关的声音数据的掩蔽声音数据存储单元。在指令接收单元接收到用于开始输出的指令并且确定由提取单元所提取的声学特征量未在对应表中描述的情况下，掩蔽声音选择单元将由提取单元所提取的声学特征量与存储在掩蔽声音数据存储单元中的有关掩蔽声音的声音数据的声学特征量进行比较，从掩蔽声音数据存储单元读出与对应于声学特征量的掩蔽声音有关的数据，并且将对应于该声音数据的掩蔽声音输出至输出单元。
根据该配置，与掩蔽声音相关的声音数据存储在掩蔽声音数据存储单元中，并且即使在与拾取的声音相对应的掩蔽声音不存在的情况下，也能够自动地输出适于所提取的声学特征量的掩蔽声音(例如，具有类似声学特征量的声音)。
优选地，掩蔽声音选择单元在对应表中存储由提取单元所提取的声学特征量、和与所读出的掩蔽声音相关的声音数据，同时使它们相对应。
因此，当随后拾取具有相同声学特征量的掩蔽声音时，能够自动地输出与先前输出的掩蔽声音相同的掩蔽声音。
优选地，掩蔽声音输出装置还包括存储与通用掩蔽声音相关的声音数据的通用掩蔽声音存储单元，并且包括干扰声音产生单元，该干扰声音产生单元根据由提取单元所提取的声学特征量对与通用掩蔽声音相关的声音数据(存储在通用掩蔽声音存储单元中)进行处理，以产生干扰将要掩蔽的声音的干扰声音，并且从输出单元输出的掩蔽声音包含有由干扰声音产生单元产生的干扰声音。
根据该配置，根据拾音信号的声学特征量对存储在通用掩蔽声音存储单元中的通用掩蔽声音进行处理，并且产生干扰声音。例如，通过不能理解的多个男人和女人的语音(没有实质词汇含义的声音)来配置通用掩蔽声音。干扰声音是其中通用掩蔽声音的特征量接近于所拾取的声音的特征量的声音。类似于通用掩蔽声音，干扰声音是没有词汇含义并且具有接近于将要掩蔽的声音的声音品质(语音品质)和音高的声音。因此，可以达到高掩蔽效果。
在本发明的掩蔽声音输出装置中，这样的模式是可能的:其中根据由提取单元所提取的声学特征量对拾音信号进行处理以产生干扰将要掩蔽的声音的干扰声音。在这种情况下，从输出单兀输出的掩蔽声音包含有由干扰声音产生单兀产生的干扰声音。
根据该配置，对所拾取的声音进行处理，并且产生干扰声音。例如，干扰声音通过对拾音信号的频率特性进行修改并且打破语音结构而产生。在这种情况下，干扰声音是具有与实际将要掩蔽的声音基本相同的声音品质(语音品质)和音高的声音。因此，可以达到高掩蔽效果。
优选地,本发明中的掩蔽声音包含有通过合成连续的和间歇的声音而获得的声曰
例如,连续的声音包含如上所述的干扰声音、例如小溪潺潺声或树的沙沙声等的背景声音(稳定的自然声音)。如上所述，通过打破语音结构来产生干扰声音，并因此有时可能会产生奇怪感。因此，通过借助背景声音来增加背景噪声水平而减小干扰声音中的奇怪感，以使诸如上述干扰声音之类的声音不引人注意。例如，间歇的声音是间歇地生成并且具有高渲染效果的声音(突发性声音)，诸如美妙的音乐声音等。将听者的注意力引向突发性声音，并且以听觉心理学方式使由于干扰声音造成的奇怪性不弓I人注意。
优选地,根据输出掩蔽声音的时间而改变对包含在掩蔽声音中的连续和间歇的声音进行组合的组合方式。
当根据输出掩蔽声音的时间周期或定时(季节)来改变掩蔽声音的组合方式时，能够输出更舒服的掩蔽声音。在早晨时区中，例如，输出含有鸟鸣的背景声音以能够容易醒来，并且在夜晚时区中，消除突发性声音以达到放松状态。
该申请基于2010年9月28日提交的日本专利申请第2010-216283号和2011年3月16日提交的日本专利申请第2011-057365号，并且通过参引的方式将它们的公开内容合并到本文中。
工业适用性
根据本发明的掩蔽声音输出装置和掩蔽声音输出方法，当使用者听见该使用者不希望听见的声音时，该使用者执行对开始输出掩蔽声音进行指示的操作，由此能够仅掩蔽该使用者不希望听见的声音。结果，使用者能够选择将要掩蔽的声音，并因此可以避免不需要掩蔽的声音却被掩蔽的情形、以及不能听见必要信息的问题。此外，能够减少针对不需要掩蔽的声音产生掩蔽声音的非必要处理。
参考数字和标记的说明
I掩蔽声音输出装置
2控制部
3存储部(掩蔽声音数据存储单元)
4操作部(指令接收单元)
5声音输入部(声音拾取单元)
6信号处理部
7声音输出部(输出单元)
31掩蔽声音存储部
32掩蔽声音选择表
62特征量提取部(提取单元)
63掩蔽声音选择部(掩蔽声音选择单元)
权利要求
1.一种掩蔽声音输出装置,其包括: 输入单兀，其适于输入与拾取的声音相关的拾音信号；提取单元，其适于提取所述拾音信号的声学特征量；指令接收单元，其适于接收用于开始输出掩蔽声音的指令；以及输出单元，其适于在所述指令接收单元接收到用于开始输出的指令时输出与由所述提取单元所提取的声学特征量相对应的掩蔽声音。
2.根据权利要求1所述的掩蔽声音输出装置，其还包括: 对应表，其指示所述声学特征量和所述掩蔽声音之间的对应关系；以及掩蔽声音选择单元，其适于通过利用由所述提取单元所提取的声学特征量来查阅所述对应表，以选择与由所述提取单元所提取的声学特征量相对应的掩蔽声音，并且其中，所述输出单兀输出由所述掩蔽声音选择单兀选定的掩蔽声音。
3.根据权利要求2所述的掩蔽声音输出装置,其中，使多个掩蔽声音与所述声学特征量相对应；并且其中，所述掩蔽声音选择单元根据预定条件从所述对应表中的与所述声学特征量相对应的所述多个掩蔽声音中选择掩蔽声音。
4.根据权利要求2或3所述的掩蔽声音输出装置，其还包括: 掩蔽声音数据存储单兀，其配置成存储与掩蔽声音相关的声音数据，并且其中，当所述指令接收单元接收到用于开始输出的指令并且确定由所述提取单元所提取的声学特征量未存储在所述对应表中时，所述掩蔽声音选择单元将由所述提取单元所提取的声学特征量与有关掩蔽声音的存储在所述掩蔽声音数据存储单元中的声音数据的声学特征量进行比较，并且从所述掩蔽声音数据存储单元读出具有与由所述提取单元所提取的声学特征量相似的声学特征量的声音数据，并且所述输出单元输出与该声音数据相对应的掩蔽声音。
5.根据权利要求4所述的掩蔽声音输出装置，其中，所述掩蔽声音选择单元在所述对应表中存储由所述提取单元所提取的声学特征量、和从所述掩蔽声音数据存储单元读出的有关所述掩蔽声音的声音数据，同时重新产生其间的对应数据。
6.根据权利要求1至5中任一项所述的掩蔽声音输出装置,其还包括: 通用掩蔽声音存储单元，其配置成存储与通用掩蔽声音相关的声音数据；以及干扰声音产生单元，其适于根据由所述提取单元所提取的声学特征量来处理有关通用掩蔽声音的存储在所述通用掩蔽声音存储单元中的声音数据，以产生对将要掩蔽的声音进行干扰的干扰声音，其中，从所述输出单元输出的掩蔽声音包含由所述干扰声音产生单元所产生的干扰声曰
7.根据权利要求1至5中任一项所述的掩蔽声音输出装置，其还包括: 干扰声音产生单元，其适于根据由所述提取单元所提取的声学特征量对所述拾音信号进行处理，以产生对将要掩蔽的声音进行干扰的干扰声音，其中，从所述输出单元输出的掩蔽声音包含由所述干扰声音产生单元所产生的干扰声曰
8.根据权利要求1至7中任一项所述的掩蔽声音输出装置,其中,所述掩蔽声音包含通过合成连续和间歇的声音而获得的声音。
9.根据权利要求8所述的掩蔽声音输出装置,其中，根据输出所述掩蔽声音的时间而改变对包含在所述掩蔽声音中的连续和间歇的声音进行组合的组合方式。
10.根据权利要求2至9中任一项所述的掩蔽声音输出装置，其中，当由所述提取单元所提取的声学特征量与存储在所述对应表中的声学特征量一致或相似时，所述掩蔽声音选择单元选择与一致的或相似的声学特征量相对应的掩蔽声音,并且其中，所述输出单兀自动地输出由所述掩蔽声音选择单兀选定的掩蔽声音。
11.一种掩蔽声音输出方法，其包括: 输入步骤，输入与拾取的声音相关的拾音信号；提取步骤，提取所述拾音信号的声学特征量；指令接收步骤，接收用于开始输出掩蔽声音的指令；以及输出步骤，当在所述指令接收步骤中接收到用于开始输出的指令时输出与在所述提取步骤中所提取的声学特征量相对应的掩蔽声音。
12.根据权利要求11所述的掩蔽声音输出方法，其还包括: 掩蔽声音选择步骤，用于查阅表明所述声学特征量与掩蔽声音之间的对应关系的对应表以选择与在所述提取步骤中所提取的声学特征量相对应的掩蔽声音，并且其中，在所述输出步骤中输出在掩蔽声音选择步骤中选定的掩蔽声音。
13.根据权利要求12所述的掩蔽声音输出方法,其中多个掩蔽声音与所述声学特征量相对应；并且其中，在所述掩蔽声音选择步骤中，根据预定条件从所述对应表中的与所述声学特征量相对应的所述多个掩蔽声音中选择掩蔽声音。
14.根据权利要求12或13所述的掩蔽声音输出方法，其中，提供了存储与掩蔽声音相关的声音数据的掩蔽声音数据存储单元，并且其中，在所述掩蔽声音选择步骤中，当在所述指令接收步骤中接收到用于开始输出的指令并且确定在所述提取步骤中所提取的声学特征量未存储在所述对应表中时，将在所述提取步骤中所提取的声学特征量与有关掩蔽声音的存储在所述掩蔽声音数据存储单元中的声音数据的声学特征量进行比较，从所述掩蔽声音数据存储单元读出具有与在所述提取步骤中所提取的声学特征量相似的声学特征量的声音数据，并且在所述输出步骤中输出与该声音数据相对应的掩蔽声音。
15.根据权利要求14所述的掩蔽声音输出方法，其中，在所述掩蔽声音选择步骤中，将在所述提取步骤中所提取的声学特征量、和从所述掩蔽声音数据存储单元读出的有关所述掩蔽声音的声音数据存储在所述对应表中，同时使其间重新对应。
16.根据权利要求11至15中任一项所述的掩蔽声音输出方法,其中,提供了存储与通用掩蔽声音相关的声音数据的通用掩蔽声音存储单元；并且其中，所述掩蔽声音输出方法，其还包括: 干扰声音产生步骤，用于根据在所述提取步骤中所提取的声学特征量来处理有关通用掩蔽声音的存储在所述通用掩蔽声音存储单元中的声音数据以产生对将要掩蔽的声音进行干扰的干扰声音，并且其中，在所述输出步骤中输出的掩蔽声音包含通过所述干扰声音产生步骤产生的干扰声音。
17.根据权利要求11至15中任一项所述的掩蔽声音输出方法,其还包括: 干扰声音产生步骤，用于根据在所述提取步骤中所提取的声学特征量来处理所述拾音信号以产生对将要掩蔽的声音进行干扰的干扰声音，其中，在所述输出步骤中输出的掩蔽声音包含通过所述干扰声音产生步骤产生的干扰声音。
18.根据权利要求11至17中任一项所述的掩蔽声音输出方法,其中,所述掩蔽声音包含通过合成连续和间歇的声音而获得的声音。
19.根据权利要求18所述的掩蔽声音输出方法,其中，根据输出所述掩蔽声音的时间而改变对包含在所述掩蔽声音中的连续和间歇的声音进行组合的组合方式。
20.根据权利要求12至19中任一项所述的掩蔽声音输出方法,其中,在所述掩蔽声音选择步骤中，当在所述提取步骤中所提取的声学特征量与存储在所述对应表中的声学特征量一致或相似时，选择与一致的或相似的声学特征量相对应的掩蔽声音，并且其中，在所述输出步骤中，自动输出在所述掩蔽声音选择步骤中选定的掩蔽声音。
全文摘要
一种掩蔽声音输出装置包括输入单元，用于输入作为拾取的声音的拾音信号；提取单元，用于提取拾音信号的声学特征量；指令接收单元，用于接收开始输出掩蔽声音的指令；以及输出单元，用于在指令接收单元接收到开始输出的指令时输出与由提取单元所提取的声学特征量相对应的掩蔽声音。
文档编号G10K11/178GK103109317SQ20118004483
公开日2013年5月15日申请日期2011年9月27日优先权日2010年9月28日
发明者古贺宏明, 小林咏子申请人:雅马哈株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古贺宏明;小林咏子;
技术所有人：雅马哈株式会社;
我是此专利的发明人