信号处理装置、信号处理方法和存储介质的制作方法

文档序号:2827317研发日期:2014年阅读:179来源:国知局
技术简介:
本专利提出一种信号处理装置,通过生成与用户语音同步的掩蔽语音信号并利用反相信号抵消回声,有效隐藏用户语音内容,提升隐私保护。装置包括话音拾取单元、信号处理单元及多扬声器系统,通过特定转移函数去除掩蔽信号干扰,解决语音泄露问题。
关键词:语音掩蔽,声学抵消,隐私保护
信号处理装置、信号处理方法和存储介质的制作方法
【专利摘要】本发明提供了信号处理装置、信号处理方法和存储介质,该信号处理装置包括:话音拾取单元,拾取用户的话音并生成音频信号;信号处理单元,根据音频信号生成用于掩蔽用户的话音的掩蔽话音信号;以及第一扬声器,再现掩蔽话音信号。
【专利说明】信号处理装置、信号处理方法和存储介质
[0001]相关申请的交叉引用
[0002]本申请要求2013年3月7日提交的日本优先权专利申请JP2013-045230的权益,其全部内容通过引用结合于此。
【技术领域】
[0003]本公开涉及信号处理装置、信号处理方法和存储介质。
【背景技术】
[0004]近年来,随着诸如智能电话或平板式终端的便携式终端得到广泛使用,用户通过电话呼叫讲话的机会增加。此外,随着基于用户的说话内容控制便携式终端的话音识别功能得到广泛使用,用户讲话的机会进一步增加。鉴于用户讲话以及在噪声环境下便携式终端的使用的机会的增加而提出了许多用于从所拾取的用户话音抑制外来噪声的噪声降低技术。
[0005]另一方面,便携式终端通常用在附近的其他人可以听见的状况下,因而,附近的其他人听见用户的话音的可能性高。在一些情况下,从安全性的观点来看,用户可能不愿意其他人听见其说话内容并且可能考虑防止其他人听见其说话内容。因此,需要阻碍附近的其他人听见说话内容的掩蔽技术。
[0006]例如,为了在便携式终端中使用掩蔽技术,JP2012-119785A公开了一种用于通过从服务器下载掩蔽话音信号并再现掩蔽话音信号来阻碍附近的其他人听见用户的说话内容的技术。

【发明内容】

[0007]然而,在上述的JP2012-119785A中,由于需要专用装置来生成掩蔽话音信号,因此该掩蔽技术可能无法仅与便携式终端一起使用。
[0008]期望提供一种能够根据用户的话音生成并再现掩蔽话音信号的新颖且改进的信号处理装置、新颖且改进的信号处理方法以及新颖且改进的存储介质。
[0009]根据本公开的一个实施例,提供了一种信号处理装置,包括:话音拾取单元,拾取用户的话音并生成音频信号;信号处理单元,根据音频信号生成用于掩蔽用户的话音的掩蔽话音信号;以及第一扬声器,再现该掩蔽话音信号。
[0010]根据本公开的一个实施例,提供了一种信号处理方法,包括:拾取用户的话音并生成音频信号;根据音频信号生成用于掩蔽用户的话音的掩蔽话音信号;以及再现掩蔽话音信号。
[0011]根据本公开的一个实施例,提供了一种其中存储有程序的非暂态计算机可读存储介质,该程序使得计算机执行以下操作:拾取用户的话音并生成音频信号;根据音频信号生成用于掩蔽用户的话音的掩蔽话音信号;以及再现掩蔽话音信号。
[0012]如上所述,根据本公开的实施例,可以根据用户的话音生成并再现掩蔽话音信号。【专利附图】

【附图说明】
[0013]图1是示出根据本公开的实施例的信号处理装置的介绍的说明图;
[0014]图2是示出根据比较示例的智能电话的配置的框图;
[0015]图3是示出根据第一实施例的智能电话的配置的框图;
[0016]图4A是示出根据第一实施例的信号处理单元生成的掩蔽话音信号的示例的说明图;
[0017]图4B是示出根据第一实施例的信号处理单元生成的掩蔽话音信号的示例的说明图;
[0018]图5是示出根据第一实施例的信号处理单元的配置的示例的说明图;
[0019]图6是示出根据第一实施例的信号处理单元的配置的示例的说明图;
[0020]图7是示出根据第一实施例的智能电话的操作的流程图;
[0021]图8是示出根据第一变型示例的智能电话的配置的框图;
[0022]图9是示出根据第二实施例的智能电话的配置的框图;
[0023]图10是示出根据第三实施例的智能电话的配置的框图;
[0024]图11 (A)和图11 (B)是示出根据第三实施例的智能电话中的抵消区域的说明图;以及
[0025]图12是示出根据第三变型示例的耳机的说明图。
【具体实施方式】
[0026]下文中,将参照附图详细描述本公开的优选实施例。应注意,在该说明书和附图中,具有基本上相同的功能和结构的结构元件用相同的附图标记表示,并且省略对这些结构元件的重复说明。
[0027]将按以下顺序进行描述。
[0028]1.根据本公开的实施例的信号处理装置的介绍
[0029]2.实施例
[0030]2-1.第一实施例
[0031](2-1-1.智能电话的配置)
[0032](2-1-2.操作处理)
[0033](2-1-3.第一变型示例)
[0034]2-2.第二实施例
[0035]2-3.第三实施例
[0036](2-3-1.基本形式)
[0037](2-3-2.第二变型示例)
[0038](2-3-3.第三变型示例)
[0039]3.结论
[0040]《1.根据本公开的实施例的信号处理装置的介绍》
[0041]将参照图1描述根据本公开的实施例的信号处理装置的介绍。图1是示出根据本公开的实施例的信号处理装置的介绍的说明图。如图1所示,根据实施例的信号处理装置由例如智能电话I实现。
[0042]智能电话I包括电话扬声器2、麦克风3 (下文中称为麦克3)以及掩蔽扬声器4。用户8用电话扬声器2和麦克3打电话,或者通过经由麦克3说出控制信息、通过话音识别来控制智能电话I。
[0043]这里,将参照图2描述根据比较示例的智能电话的总体配置。图2是示出根据比较示例的智能电话100的配置的框图。图2所示的每个块均包括在智能电话100内。如图2所示,智能电话100包括电话扬声器2、麦克3、控制单元11、麦克放大器21、功率放大器23、话筒单元31和听筒单元32。当用户8用智能电话100打电话时,听筒单元32接收到的电话对方的话音经功率放大器23放大并由电话扬声器2再现。用户8说出的话音由麦克3拾取,由麦克放大器21放大,并由话筒单元31传送到电话呼叫对方的终端。此外,控制单元11通过对用户8说出的话音执行话音识别来控制智能电话100。
[0044]附近的其他人可以听见用户8通过智能电话100说出的话音。然而,在一些情况下,用户可能不愿意其他人听见说话内容或者可能从安全性的观点考虑防止其他人听见说话内容。然而,由于根据比较示例的智能电话100未被配置成使得其他人听不见用户8说出的话音,因此这可能很困难。
[0045]因此,鉴于上述状况而完成了根据本公开的实施例的信号处理装置。根据本公开的实施例的信号处理装置可以通过再现掩蔽话音信号来防止附近的其他人听见用户8说出的话音。由于根据本实施例的智能电话I如图1所不包括掩蔽扬声器4并从掩蔽扬声器4再现掩蔽话音信号,因此阻碍了附近的其他人9听见用户8的说话内容。
[0046]然而,掩蔽扬声器4再现简单噪声比如白噪声作为掩蔽话音信号,并且存在其他人9容易将用户8说出的话音与掩蔽话音信号区分开并听见用户8的说话内容的可能性。因此,根据本实施例的智能电话I通过麦克3拾取用户8说出的话音,并根据所拾取的用户的话音生成并再现掩蔽话音信号,使得阻碍其他人听见说话内容。
[0047]以上描述了根据本公开的实施例的信号处理装置的介绍。接下来,将详细描述根据本公开的实施例的信号处理装置。
[0048]在图1所示的示例中,已将智能电话I用作信号处理装置的示例,但根据本公开的实施例的信息处理装置不限于此。例如,信号处理装置可以是头戴式显示器(HMD)、耳机、数字摄像装置、数码摄像机、个人数字助理(PDA)、个人计算机(PC)、笔记本型PC、平板式终端、便携式电话终端、便携式音乐再现装置、便携式视频处理装置或便携式游戏装置。《2.实施例》
[0049]<2-1-1.第一实施例 >
[0050][2-1-1.智能电话的配置]
[0051]首先,将参照图3描述根据实施例的智能电话1-1的配置。图3是示出根据第一实施例的智能电话1-1的配置的框图。图3所示的每个块包括在智能电话1-1中。如图3所不,智能电话1-1包括电话扬声器2、麦克3、掩蔽扬声器4、控制单兀11、信号处理单兀12、麦克放大器21、功率放大器22、功率放大器23、话筒单元31、听筒单元32和掩蔽声音源41。下文中,将详细描述智能电话1-1的每个组成元件。
[0052](听筒单元32)
[0053]听筒单元32具有从外部接收音频信号的通信单元的功能。具体地,听筒单元32从电话呼叫对方的终端接收表示电话对方的话音的音频信号。听筒单元32将所接收到的音频信号输出到功率放大器23。
[0054](功率放大器23)
[0055]功率放大器23具有对从听筒单元32输出的音频信号进行放大的功能。功率放大器23将放大后的音频信号输出到电话扬声器2。
[0056](电话扬声器2)
[0057]电话扬声器2是再现从功率放大器23输出的音频信号的输出装置。在该实施例中,假设用户8将电话扬声器2放在他的或她的耳部来使用智能电话1-1。
[0058](麦克3)
[0059]麦克3具有拾取用户的话音并生成音频信号的话音拾取单元的功能。更具体地,麦克3拾取用户8说出的话音并生成音频信号。此时,麦克3还可以连同用户8的话音一起拾取以下将要描述的掩蔽扬声器4生成的掩蔽话音信号,并生成音频信号。即,麦克3生成的音频信号可以包括用户的话音和掩蔽话音信号。下文中,还将麦克3生成的音频信号称为话音拾取信号。麦克3将所生成的话音拾取信号输出到麦克放大器21。
[0060](麦克放大器21)
[0061]麦克放大器21具有对从麦克3输出的话音拾取信号进行放大的功能。麦克放大器21将放大后的话音拾取信号输出到控制单元11、话筒单元31和信号处理单元12。
[0062](控制单元11)
[0063]控制单元11用作算术处理装置和控制装置,并且根据各种程序控制智能电话1-1的总体操作。控制单元11由例如中央处理单元(CPU)或微处理器实现。此外,控制单元11可包括存储程序和要使用的算术参数等的只读存储器(ROM)以及暂时存储适当改变的参数等的随机存取存储器(RAM)。
[0064]控制单元11具有控制信息识别单元的功能,该控制信息识别单元从话音拾取信号中所包括的用户的话音来识别控制信息。更具体地,控制单元11根据从麦克放大器21输出的话音拾取信号识别用户的话音中所包括的控制信息。例如,控制单元11基于用户的说话内容来识别用于打电话、消息的传送、检索等的控制信息。控制单元11具有基于识别的控制信息来控制智能电话1-1的功能。例如,控制单元11基于用于打电话、消息的传送、检索等的控制信息来控制智能电话1-1,并且实际执行打电话、消息的传送、检索等。此外,控制单元11具有识别麦克3拾取的用户的话音的语言的语言识别单元的功能。例如,控制单元11识别出用户8说的语言是日语、英语、汉语等。此外,控制单元11可根据用户8的发音、语调等识别用户8的母语或籍贯。
[0065](话筒单元31)
[0066]话筒单元31具有将话音拾取信号传送到外部的通信单元的功能。更具体地,话筒单兀31将从麦克放大器21输出的话音拾取信号传送到电话呼叫对方的终端。
[0067](功率放大器22)
[0068]功率放大器22具有对从以下要描述的信号处理单元12输出的掩蔽话音信号进行放大的功能。功率放大器22将放大后的话音拾取信号输出到掩蔽扬声器4。此外,功率放大器22放大音量以使得附近的其他人9可听见掩蔽扬声器4再现的掩蔽话音信号并且附近的其他人9听不见用户8的说话内容。[0069](掩蔽扬声器4)
[0070]掩蔽扬声器4是再现掩蔽话音信号的输出装置(第一扬声器)。更具体地,掩蔽扬声器4再现从功率放大器22输出的掩蔽话音信号。
[0071](掩蔽声音源41)
[0072]掩蔽声音源41具有记录作为用于生成掩蔽话音信号的来源的声音源的记录单元的功能。例如,掩蔽声音源41记录各种噪声比如300Hz至3kHz的话音频带的频带噪声、无意义字符串的话音信号、包括男人和女人的多个人的话音声音、白噪声和有色噪声来作为声音源。另外,掩蔽声音源41可记录麦克3拾取的用户的话音作为声音源。以下要描述的信号处理单兀12基于记录在掩蔽声音源41中的声音源来生成掩蔽话音信号。
[0073](信号处理单元12)
[0074]信号处理单元12根据话音拾取信号来生成用于掩蔽用户的话音的掩蔽话音信号。更具体地,信号处理单元12基于从麦克放大器21输出的话音拾取信号、使用记录在掩蔽声音源41中的声音源来生成掩蔽话音信号。这里,用户的话音的掩蔽意味着,用户8的说话嵌入在掩蔽扬声器4再现的掩蔽话音信号中从而被隐藏,以使得其他人9听不见。可以考虑用于掩蔽用户的话音的各种掩蔽话音信号。
[0075]例如,信号处理单元12 —般使用300Hz至3kHz的话音频带的频带噪声、无意义字符串的话音信号、包括男人和女人的多个人的话音声音来生成掩蔽话音信号。在这种情况下,由于掩蔽话音信号表示频带与用户8的话音相同的噪声或话音,因此其他人9可能将掩蔽话音信号误认为用户8的说话,从而可以掩蔽用户8的说话。此外,信号处理单元12可基于掩蔽声音源41记录的用户8他自身或她自身的话音来生成掩蔽话音信号。由于更容易将基于用户8他自身或她自身的过去话音的掩蔽话音信号误认为用户8当前说出的话音,因此可以更强地掩蔽用户8的说话。
[0076]另外,信号处理单元12可生成具有对于其他人9有意义的内容的掩蔽话音信号。当掩蔽话音信号具有对于其他人9有意义的内容时,掩蔽话音信号使其他人9的注意力从用户8的说话内容转移,从而可以掩蔽用户8的说话。
[0077]例如,信号处理单元12可根据控制单元11识别的用户8的语言来生成掩蔽话音信号。具体地,信号处理单12可基于与用户8使用的语言相同或不同的语言来生成掩蔽话音信号。此时,当掩蔽话音信号的语言与其他人9使用的语言相同时,其他人9可以理解由掩蔽话音信号表示的内容,从而将其他人9的注意力吸引到掩蔽话音信号。另一方面,当掩蔽话音信号的语言不同于其他人9使用的语言时,其他人9对稀有外语或方言感兴趣,从而同样将其他人9的注意力吸引到掩蔽话音信号。由于这样的掩蔽话音信号使其他人9的注意力从用户8的说话内容转移,因此掩蔽话音信号阻碍了其他人9听见用户8的说话内容。此外,信号处理单元12可通过基于控制单元11识别的用户8的母语、籍贯等假设用户在本国或家乡来估计附近的其他人9使用的语言,并且可根据附近的人9的语言生成掩蔽话音信号。此外,当掩蔽话音信号的语言与用户8使用的语言相同时,掩蔽话音信号具有与用户8的说话相同的频带,从而还可以使得其他人9对用户8的说话感到困惑。另外,可想到的对其他人9有意义且吸引其他人9的掩蔽话音信号的示例包括基于名人或有名的人的讲话话音生成的信号。
[0078]智能电话1-1可通过使得所产生的掩蔽话音信号的音量大于用户8的说话来掩蔽用户8的说话。
[0079]另外,信号处理单元12可仅在用户的话音包括在话音拾取信号中的时间区间内生成掩蔽话音信号。在这种情况下,由于没有不变地再现掩蔽话音信号,因此,防止了其他人9变得对掩蔽话音信号熟悉。此外,由于与用户8的说话同时地再现掩蔽话音信号,因此可以使得其他人9很少会识别具有掩蔽话音信号的用户8的说话。下文中,将通过将连续地生成掩蔽话音信号的示例与仅在用户的话音包括在话音拾取信号中的时间区间内生成掩蔽话音信号的示例进行对比来参照图4A和图4B进行描述。
[0080]图4A和图4B是示出根据第一实施例的信号处理单元12生成的掩蔽话音信号的示例的说明图。图4A和图4B示出了从智能电话1-1切换至执行电话呼叫或话音识别的操作模式的切换时间到该操作模式的结束,表示话音拾取信号和掩蔽话音信号的话音信号示例 120-1和 120-2。
[0081]话音信号示例120-1表示当信号处理单元12在没有基于话音拾取信号的情况下生成连续掩蔽话音信号时的波形。如话音信号示例120-1中所示,由于以恒定音量和恒定频带再现掩蔽话音信号,因此其他人9熟悉掩蔽话音信号。
[0082]话音信号示例120-2表示当在用户8说话期间,即仅在用户的话音包括在话音拾取信号中的时间区间内,信号处理单元12生成掩蔽话音信号时的波形。如话音信号示例120-2中所示,由于在用户8没有讲话的时间区间内中断了掩蔽话音信号的再现,因此可以防止其他人9变得对掩蔽话音信号熟悉。因此,将参照图5和图6描述信号处理单元12的配置的具体示例,该信号处理单元12被配置为仅在用户的话音包括在话音拾取信号中的时间区间内生成掩蔽话音信号。
[0083]图5是示出根据第一实施例的信号处理单元12的配置的示例的说明图。如图5所示,信号处理单元12-1包括分析带通滤波器(BPF)群121、可变增益块群122、合成BPF群123和加法器124。信号处理单元12-1具有使用BPF组分析说话话音并根据构成用户的话音的每个频率分量的数据量生成掩蔽话音信号的功能。下文中,将详细描述信号处理单元12-1的每个构成元件。
[0084]分析BPF群121是由多个BPF阵列构成的滤波器组。分析BPF群121基于数据量比如构成用户的话音的每个频带分量的振幅来计算对应系数。例如,分析BPF群121中所包括的分析BPF使每个预定频带通过并通过以预定时间宽度求数据的平方和来计算对应系数。这里,对应系数表示构成用户的话音的每个频带分量的构成比率以及信号处理单元12-1生成的掩蔽话音信号的每个频带分量的分配比率。分析BPF群121中所包括的分析BPF将所算出的对应系数输出到可变增益块群122中所包括的对应的可变增益块。
[0085]可变增益块群122
[0086]可变增益块群122具有对从掩蔽声音源41获取的话音信号进行放大的功能。可变增益块群122中所包括的可变增益块基于从对应的分析BPF输出的对应系数来对从掩蔽声音源41获取的话音信号进行放大,并将放大后的话音信号输出到合成BPF群123中所包括的对应的合成BPF。
[0087]合成BPF 群 123
[0088]合成BPF群123是由多个BPF阵列构成的滤波器组。合成BPF群123中所包括的合成BPF根据从对应的可变增益块输出的话音信号使与对应的分析BPF相同的频带分量通过,并且生成合成话音信号。合成BPF群123将所生成的话音信号输出到加法器124。
[0089]加法器124
[0090]加法器124通过对从合成BPF群123输出的话音信号进行合成来生成掩蔽话音信号。
[0091]因而,利用对应系数来调整分析BPF群121中所包括的每个BPF的响应量与可变增益块群122中所包括的每个可变增益块的可变增益量之间的对应关系。相应地,信号处理单元12-1可以根据话音拾取信号的每个频带分量的数据量来生成掩蔽话音信号。即,信号处理单元12-1可以仅在用户的话音包括在话音拾取信号中的时间区间内生成掩蔽话音信号。此外,信号处理单元12-1可以生成频带分量的分配比率与用户的话音相同、即与用户8的说话话音类似的掩蔽话音信号。为此,信号处理单元12-1生成的掩蔽话音信号可以使得其他人9将掩蔽话音信号误认为用户8的说话,从而可以更强地掩蔽用户8的说话。
[0092]以上描述了使用BPF组分析来生成掩蔽话音信号的信号处理单元12的配置的示例。接下来,将参照图6描述信号处理单元12的另一个配置示例。
[0093]图6是示出根据第一实施例的信号处理单元12的配置示例的说明图。如图6所示,信号处理单元12-2包括话音活动检测(VAD) 125和开关126。将详细描述信号处理单元12-2的每个构成元件。
[0094]VAD125
[0095]VAD125具有从输入的话音拾取信号检测发出话音的话音区间和除了话音区间外的噪声区间的功能。VAD125根据时间区间是话音区间或者噪声区间来控制开关126。
[0096]开关126
[0097]开关126在VAD125的控制下使从掩蔽声音源41获取的话音信号通过或不通过,并且输出话音信号作为掩蔽话音信号。更具体地,开关126在与话音拾取信号的话音区间相对应的时间区间内使从掩蔽声音源41获取的话音信号通过,而在与噪声区间相对应的时间区间内使话音信号不通过。
[0098]因而,信号处理单元12-2可以通过根据时间区间是话音区间或者噪声区间控制从掩蔽声音源41获取的话音信号的通过/不通过,仅在用户的话音包括在话音拾取信号中的时间区间内生成掩蔽话音信号。
[0099]描述了基于VAD的方法生成掩蔽话音信号的信号处理单元12的配置示例。
[0100](补充)
[0101]智能电话1-1可包括模数转换器(ADC)或数模转换器(DAC)。ADC是将模拟信号转换为数字信号的电子电路,以及DAC是将数字信号转换为模拟信号的电子电路。例如,ADC可安装在麦克放大器21的后级中。此外,DAC可安装在功率放大器22和功率放大器23的前级中。
[0102]以上描述了智能电话1-1的配置。
[0103][2-1-2.操作处理]
[0104]接下来,将参照图7描述智能电话1-1的操作处理。图7是示出根据第一实施例的智能电话1-1的操作的流程图。根据其他实施例的操作与智能电话1-1的操作相同。如图7所示,在步骤Sll中,麦克3首先拾取用户的话音并生成话音拾取信号。
[0105]随后,在步骤S12中,信号处理单元12根据麦克3生成的话音拾取信号生成掩蔽话音信号。更具体地,信号处理单元12根据BPF组分析或VAD的方法来生成掩蔽用户的话音的掩蔽话音信号,如以上参照图5和图6所述。
[0106]然后,在步骤S13中,掩蔽扬声器4再现信号处理单元12生成的掩蔽话音信号。智能电话1-1在再现掩蔽话音信号的同时,通过话筒单元31和听筒单元32执行电话呼叫或者通过控制单元11执行基于从话音识别的控制信息的操作。
[0107]以上描述了第一实施例。接下来,将描述第一实施例的变型示例。
[0108][2-1-3.第一变型示例]
[0109]在变型示例中,电话扬声器2连同电话呼叫对方的话音一起再现掩蔽话音信号。下文中,将参照图8描述根据变型示例的智能电话1-2。
[0110]图8是示出根据第一变型示例的智能电话1-2的配置的框图。图8所示的每个块包括在智能电话1-2中。如图8所示,根据变型示例的智能电话1-2具有从以上参照图3所述的根据第一实施例的智能电话1-1中排除掩蔽扬声器4和功率放大器22并添加了加法器13的配置。
[0111]信号处理单元12生成的掩蔽话音信号输出到加法器13。加法器13具有对输入信号进行合成以及将从信号处理单元12输出的掩蔽话音信号与从听筒单元32输出的电话对方的音频信号进行合成的功能。经加法器13合成的掩蔽话音信号和电话对方的音频信号由功率放大器23放大并由电话扬声器2输出。即,电话扬声器2再现电话呼叫对方的话音和掩蔽话音信号。
[0112]根据变型示例的智能电话1-2可以通过使用电话扬声器2作为掩蔽扬声器4,来在不使用多个扬声器的情况下再现掩蔽话音信号并掩蔽用户的话音。此外,在变型示例中,假设用户8以免提电话方式或话音识别输入方式使用智能电话1-2,而未将电话扬声器2放在他的或她的耳部。与用户将耳部放到电话扬声器2、即嘴唇靠近麦克3来使用智能电话的第一实施例相比,用户8可以大声地讲话。因此,与第一实施例相比,功率放大器23更强地放大掩蔽话音信号。
[0113]以上描述了第一变型示例。
[0114]〈2-2.第二实施例〉
[0115]在本文的实施例中,当麦克3拾取掩蔽扬声器4再现的掩蔽话音信号时,从话音拾取信号中电子移除掩蔽话音信号分量。可根据麦克3掩蔽扬声器4之间的位置关系、其方向、再现音量、话音拾取灵敏度等,掩蔽扬声器4再现的掩蔽话音信号可能被麦克3拾取,从而可能打扰电话呼叫或话音识别。从该观点来看,在本实施例中,可以通过从话音拾取信号中去除掩蔽话音信号分量来实现降低噪声的高质量电话呼叫或话音识别。下文中,将参照图9描述根据该实施例的智能电话1-3。
[0116]图9是示出根据第二实施例的智能电话1-3的配置的框图。图9所示的每个块均包括在智能电话1-3中。如图9所示,根据该实施例的智能电话1-3具有回波抵消器14和加法器15被添加到以上在第一实施例中参照图3所示的智能电话1-1中的配置。下文中,将描述回波抵消器14和加法器15的功能。
[0117](回波抵消器14)
[0118]回波抵消器14具有去除单元的功能,该去除单元在麦克3拾取从掩蔽扬声器4再现的掩蔽话音信号时从话音拾取信号去除掩蔽话音信号。此外,可将以下要描述的回波抵消器14和加法器15理解为用作去除单元。
[0119]回波抵消器14基于特定的转移函数和信号处理单元12生成的掩蔽话音信号来生成话音拾取信号中所包括的掩蔽话音信号。回波抵消器14基于信号处理单元12生成的掩蔽话音信号以及麦克3和掩蔽扬声器4的特性,估计麦克3与掩蔽扬声器4之间的空间的转移函数。回波抵消器14可根据智能电话1-3与用户8之间的位置关系来频繁地更新转移函数。此外,可将回波抵消器14实现为数字滤波器。还可以基于信号处理单元12生成的掩蔽话音信号与麦克3拾取的掩蔽话音信号之间的对应关系来理解转移函数。
[0120]回波抵消器14将所生成的话音拾取信号中所包括的掩蔽话音信号输出到加法器15。
[0121](加法器15)
[0122]加法器15具有从话音拾取信号减去回波抵消器14生成的掩蔽话音信号的功能。为此,从话音拾取信号中去除掩蔽扬声器4再现且由麦克3拾取的掩蔽话音信号。加法器15将从中去除了掩蔽话音信号的话音拾取信号输出到控制单元11、话筒单元31和信号处理单元12。
[0123]因而,在该实施例中,由于回波抵消器14和加法器15可以从话音拾取信号中去除掩蔽话音信号分量,因此可以实现降低噪声的高质量电话呼叫或话音识别。此外,由于从输入至信号处理单元12的接收信号中降低了噪声,因此信号处理单元12可以生成更适合于用户8的话音的掩蔽话音信号。
[0124]以上描述了第二实施例。
[0125]〈2-3.第三实施例〉
[0126][2-3-1.基本形式]
[0127]在本文的实施例中,设置了多个再现掩蔽话音信号的扬声器以对彼此进行抵消,使得在空间中在听觉上从话音拾取信号中去除掩蔽话音信号。下文中,将参照图10描述根据实施例的智能电话1-4。下文中,将描述设置了两个再现掩蔽话音信号的扬声器的示例,但也可设置三个或更多个扬声器。
[0128]图10是示出根据第三实施例的智能电话1-4的配置的框图。图10所示的每个块均包括在智能电话1-4中。如图10所示,根据实施例的智能电话1-4具有反相信号生成单元16、功率放大器24和掩蔽扬声器4-2被添加到以上参照图9所述的根据第二实施例的智能电话1-2中的配置。根据第二实施例的掩蔽扬声器4被称为该实施例的掩蔽扬声器4-1。下文中,将描述反相信号生成单兀16、功率放大器24和掩蔽扬声器4-2的功能。(反相信号生成单元16)
[0129]反相信号生成单元16具有生成从信号处理单元12输出的掩蔽话音信号的反相信号的功能。反相信号生成单元16将所生成的反相信号输出到功率放大器24。
[0130](功率放大器24)
[0131]功率放大器24具有放大从反相信号生成单元16输出的反相信号的功能。功率放大器24可与功率放大器22相同程度地放大信号。功率放大器24将放大后的反相信号输出到掩蔽扬声器4-2。
[0132](掩蔽扬声器4-2)
[0133]掩蔽扬声器4-2是再现掩蔽话音信号的反相信号的输出装置(第二扬声器)。具体地,掩蔽扬声器4-2与掩蔽扬声器4-1再现掩蔽话音信号同时地再现从功率放大器24输出的反相信号。掩蔽扬声器4-2被安装成使得在麦克3拾取话音的空间内抵消从掩蔽扬声器4-1再现的掩蔽话音信号和从掩蔽扬声器4-2再现的反相信号。掩蔽扬声器4-2具有与掩蔽扬声器4-1相同的扬声器特性。如图10所不,掩蔽扬声器4-2和4-1安装在以麦克3的位置为中心的几何对称位置处。
[0134]在冲突区域内抵消从掩蔽扬声器4-1再现的掩蔽话音信号和从掩蔽扬声器4-2再现的反相信号。以下也将这样的区域称为抵消区域。将参照图11 (A)和图11 (B)描述智能电话1-4中的抵消区域。
[0135]图11 (A)和图11 (B)是示出根据第三实施例的抵消区域的说明图。图11 (A)中所示的每个块包括在智能电话1-4中。如图11 (A)所示,由于同时再现掩蔽话音信号和反相信号,因此智能电话1-4中的抵消区域5-1基本上形成在掩蔽扬声器4-1和4-2的中间区域中。由于抵消区域5-1覆盖麦克3,因此在麦克3拾取话音的空间内抵消掩蔽话音信号。以该方式,智能电话1-4可以在空间内在听觉上从话音拾取信号中去除掩蔽话音信号分量。此外,抵消区域5-1位于麦克3拾取话音的空间内,S卩,在用户8的嘴唇处,因而,用户8可以讲话而不被掩蔽话音信号打扰。
[0136]通常,反相信号的不利影响在较低频带处更高。为此,由于掩蔽话音信号具有低频区,因此更强地抵消了掩蔽话音信号和反相信号,从而麦克3可以更清楚地拾取用户8的话音。具有低频带的掩蔽话音信号的示例包括元音是主要分量的话音信号。此外,由于掩蔽扬声器4-2在空间内在听觉上去除了具有低频带的掩蔽话音信号,因此回波抵消器14可电气地去除尤其在中频区和高频区中的掩蔽话音信号。智能电话1-4可以通过将掩蔽扬声器4-2和回波抵消器14结合来去除全音域内的掩蔽话音信号。
[0137]以上描述了第三实施例。接下来,将描述第三实施例的变型示例。
[0138][2-3-2.第二变型示例]
[0139]在本文的变型示例中,掩蔽扬声器4-2再现延迟的反相信号以使得在除了掩蔽扬声器4-1和掩蔽扬声器4-2的中间区域外的区域内形成抵消区域。下文中,将参照图1l(B)描述根据该实施例的智能电话1-5。
[0140]在根据变型示例的智能电话1-5中,如图11 (B)所示,掩蔽扬声器4-1和4-2未安装在以麦克3的位置为中心的几何对称位置处。智能电话1-5具有与以上参照图10所述的智能电话1-4相同的内部配置。然而,智能电话1-5还包括延迟器17,如图11 (B)所示。下文中,将描述延迟器17的功能。
[0141]延迟器17具有延迟并输出输入话音信号的功能。在变型示例中,延迟器17用作延迟反相信号生成单元16生成的反相信号的延迟单元。更具体地,延迟器17延迟反相信号,以使得在麦克3拾取话音的空间内抵消从掩蔽扬声器4-1再现的掩蔽话音信号和从掩蔽扬声器402再现的反相信号。延迟器17将延迟后的反相信号输出到功率放大器24。此夕卜,延迟器17可具有特定滤波器格式。
[0142]经延迟器17延迟的反相信号由功率放大器24放大并由掩蔽扬声器4-2再现。然后,在更靠近掩蔽扬声器4-2的位置处将从掩蔽扬声器4-2再现的反相信号和从掩蔽扬声器4-1输出的掩蔽话音信号抵消达到延迟器17延迟反相信号的程度。S卩,如图11 (B)所示,抵消区域5-2形成在更靠近掩蔽扬声器4-2的位置处,并覆盖相比于掩蔽扬声器4-1安装在更靠近掩蔽扬声器4-2的位置处的麦克3。
[0143]为此,即使掩蔽扬声器4-1和4-2未安装在以麦克3的位置为中心的几何对称位置处,智能电话1-5也可以从话音拾取信号中去除掩蔽话音信号分量。此外,掩蔽扬声器4-2和4-2可具有不同的扬声器特性。因此,在智能电话1-5中,从延迟器17获得的延迟效果使得能够减轻与扬声器特性和安装有掩蔽扬声器4-2的位置相关的限制。为此,在智能电话1-5中,可以自由地实现掩蔽扬声器4-2和4-1的大小、位置关系、总体设计等。
[0144]以上描述了第二变型示例。接下来,将描述了第三实施例的另一变型示例。
[0145][2-3-3.第三变型示例]
[0146]在这里的变型示例中,根据本公开的实施例的信号处理装置由耳机6实现。下文中,将参照图12描述根据该变型示例的耳机6。
[0147]图12是示出根据第三变型示例的耳机6的说明图。如图12所示,耳机6包括掩蔽扬声器4-1、掩蔽扬声器4-2和麦克3,并且安装在用户8的头部上。耳机6具有与以上参照图11 (B)所述的智能电话1-5相同的配置。如图12所示,麦克3安装在更靠近掩蔽扬声器4-2的位置处。因此,由于耳机6从掩蔽扬声器4-2再现了经延迟器17延迟的反相信号,因此麦克3被抵消区域覆盖。因此,在耳机6中,可以在空间内在听觉上从声音拾取信号中去除掩蔽话音信号分量。
[0148]以上描述了第三变型示例。
[0149]《3.结论》
[0150]如上所述,由于根据本公开的实施例的智能电话I根据用户的话音生成并再现掩蔽话音信号,因此可以防止用户8的说话内容被听见。更具体地,由于智能电话I生成并再现掩蔽话音信号以使其他人9迷惑或分心,因此用户8的说话可以嵌入在掩蔽话音信号中,从而可以阻碍说话内容被听见。此外,智能电话I仅在用户的话音包括在声音拾取信号中的时间区间内再现掩蔽话音信号,使得可以防止其他人9变得对掩蔽话音信号熟悉。
[0151]由于智能电话I从声音拾取信号中电气地去除掩蔽话音信号分量,因此可以实现降低噪声的高质量电话呼叫或话音识别。此外,由于智能电话I包括多个再现掩蔽话音信号的扬声器以实现相互抵消,因此可以在空间内在听觉上从话音拾取信号中去除掩蔽话音信号分量。
[0152]已参照附图详细地描述了本技术的优选实施例,但是本技术的技术范围不限于这些示例。本领域的技术人员应该理解,在所附权利要求或其等同物的范围内,可根据设计要求和其他因素进行各种变型、组合、子组合和变更。
[0153]例如,在上述实施例中,已经描述了当用户8执行电话呼叫或话音识别输入时生成并再现掩蔽话音信号的示例,但本公开的实施例不限于此。例如,本公开的实施例可应用于防止其他人听见用户8的梦话、自言自语或抱怨的噪声装置。
[0154]还可以生成计算机程序以使得包括在信息处理装置中的硬件比如CPU、R0M和RAM执行上述智能电话I的每个配置的相同功能。此外,提供了存储该计算机程序的存储介质。
[0155]另外,还可以如下配置本技术。
[0156](I) 一种信号处理装置,包括:
[0157]话音拾取单元,拾取用户的话音并生成音频信号;
[0158]信号处理单元,根据所述音频信号生成用于掩蔽所述用户的话音的掩蔽话音信号;以及
[0159]第一扬声器,再现所述掩蔽话音信号。
[0160](2)根据(I)所述的信号处理装置,其中,所述信号处理单元仅在所述用户的话音包括在所述音频信号中的时间区间内生成所述掩蔽话音信号。
[0161]( 3 )根据(I)或(2 )所述的信号处理装置,还包括:
[0162]去除单元;
[0163]其中,当所述话音拾取单元连同所述用户的话音一起拾取从所述第一扬声器再现的所述掩蔽话音信号并生成所述音频信号时,所述去除单元基于特定转移函数和所述信号处理单元生成的所述掩蔽话音信号来从所述话音拾取单元生成的所述音频信号中去除所述掩蔽话音信号。
[0164]( 4)根据(I)至(3 )中的任意一项所述的信号处理装置,还包括:
[0165]第二扬声器,再现所述掩蔽话音信号的反相信号,
[0166]其中,所述第二扬声器是以在所述话音拾取单元拾取所述用户的话音的空间内从所述第一扬声器再现的所述掩蔽话音信号和从所述第二扬声器再现的所述反相信号抵消的方式安装的。
[0167](5)根据(4)所述的信号处理装置,还包括:
[0168]延迟单元,延迟所述反相信号,
[0169]其中,所述第二扬声器再现经所述延迟单元延迟的所述反相信号。
[0170](6)根据(I)至(5)中的任意一项所述的信号处理装置,其中,所述信号处理单元根据构成所述用户的话音的每个频率分量的数据量来生成所述掩蔽话音信号。
[0171](7)根据(I)至(6)中的任意一项所述的信号处理装置,其中,所述掩蔽话音信号是话音频带的频带噪声。
[0172](8)根据(I )至(6)中的任意一项所述的信号处理装置,其中,所述掩蔽话音信号是元音为主要成分的话音信号。
[0173](9)根据(I)至(8)中的任意一项所述的信号处理装置,还包括:
[0174]记录单元,记录所述话音拾取单元拾取的所述用户的话音,
[0175]其中,所述信号处理单元基于记录在所述记录单元中的所述用户的话音生成所述掩蔽话音信号。
[0176]( 10)根据(I)至(9)中的任意一项所述的信号处理装置,还包括:
[0177]语言识别单元,识别所述话音拾取单元拾取的所述用户的话音的语言,
[0178]其中,所述信号处理单元根据所述语言识别单元识别的所述语言来生成所述掩蔽
话音信号。
[0179](11)根据(10)所述的信号处理装置,其中,所述信号处理单元基于与所述语言识别单元识别的所述语言相同的语言来生成所述掩蔽话音信号。
[0180]( 12)根据(10)所述的信号处理装置,其中,所述信号处理单元基于与所述语言识别单元识别的所述语言不同的语言来生成所述掩蔽话音信号。
[0181](13 )根据(I)至(12 )中的任意一项所述的信号处理装置,还包括:
[0182]通信单元,将所述音频信号传送到外部并接收来自外部的音频信号。
[0183]( 14)根据(I)至(13)中的任意一项所述的信号处理装置,还包括:[0184]控制信息识别单元,从所述音频信号中识别控制信息;以及
[0185]控制单元,基于所述控制信息识别单元识别出的所述控制信息来控制所述信号处
理装置。
[0186](15) 一种信号处理方法,包括:
[0187]拾取用户的话音并生成音频信号;
[0188]根据所述音频信号生成用于掩蔽所述用户的话音的掩蔽话音信号;以及
[0189]再现所述掩蔽话音信号。
[0190](16) —种其中存储有程序的非暂态计算机可读存储介质,所述程序使得计算机执行:
[0191]拾取用户的话音并生成音频信号;
[0192]根据所述音频信号生成用于掩蔽所述用户的话音的掩蔽话音信号;以及
[0193]再现所述掩蔽话音信号。
【权利要求】
1.一种信号处理装置,包括:话音拾取单元,拾取用户的话音并生成音频信号;信号处理单元,根据所述音频信号生成用于掩蔽所述用户的话音的掩蔽话音信号;以及第一扬声器,再现所述掩蔽话音信号。
2.根据权利要求1所述的信号处理装置,其中,所述信号处理单元仅在所述用户的话音包括在所述音频信号中的时间区间内生成所述掩蔽话音信号。
3.根据权利要求1所述的信号处理装置,还包括:去除单兀;其中,当所述话音拾取单元连同所述用户的话音一起拾取从所述第一扬声器再现的所述掩蔽话音信号并生成所述音频信号时,所述去除单元基于特定转移函数和所述信号处理单元生成的所述掩蔽话音信号来从所述话音拾取单元生成的所述音频信号中去除所述掩蔽话音信号。
4.根据权利要求1所述的信号处理装置,还包括:第二扬声器,再现所 述掩蔽话音信号的反相信号,其中,所述第二扬声器是以在所述话音拾取单元拾取所述用户的话音的空间内从所述第一扬声器再现的所述掩蔽话音信号和从所述第二扬声器再现的所述反相信号抵消的方式安装的。
5.根据权利要求4所述的信号处理装置,还包括:延迟单元,延迟所述反相信号,其中,所述第二扬声器再现经所述延迟单元延迟的所述反相信号。
6.根据权利要求1所述的信号处理装置,其中,所述信号处理单元根据构成所述用户的话音的每个频率分量的数据量来生成所述掩蔽话音信号。
7.根据权利要求1所述的信号处理装置,其中,所述掩蔽话音信号是话音频带的频带噪声。
8.根据权利要求1所述的信号处理装置,其中,所述掩蔽话音信号是元音为主要成分的话音信号。
9.根据权利要求1所述的信号处理装置,还包括:记录单元,记录所述话音拾取单元拾取的所述用户的话音,其中,所述信号处理单元基于记录在所述记录单元中的所述用户的话音生成所述掩蔽话音信号。
10.根据权利要求1所述的信号处理装置,还包括:语言识别单元,识别所述话音拾取单元拾取的所述用户的话音的语言,其中,所述信号处理单元根据所述语言识别单元识别的所述语言来生成所述掩蔽话音信号。
11.根据权利要求10所述的信号处理装置,其中,所述信号处理单元基于与所述语言识别单元识别的所述语言相同的语言来生成所述掩蔽话音信号。
12.根据权利要求10所述的信号处理装置,其中,所述信号处理单元基于与所述语言识别单元识别的所述语言不同的语言来生成所述掩蔽话音信号。
13.根据权利要求1所述的信号处理装置,还包括:通信单元,将所述音频信号传送到外部并接收来自外部的音频信号。
14.根据权利要求1所述的信号处理装置,还包括:控制信息识别单元,从所述音频信号中识别控制信息;以及控制单元,基于所述控制信息识别单元识别出的所述控制信息来控制所述信号处理装置。
15.—种信号处理方法,包括:拾取用户的话音并生成音频信号;根据所述音频信号生成用于掩蔽所述用户的话音的掩蔽话音信号;以及再现所述掩蔽话音信号。
16.—种其中存储有程序的非暂态计算机可读存储介质,所述程序使得计算机执行:拾取用户的话音并生成音频信号;根据所述音频信号生成用于掩蔽所述用户的话音的掩蔽话音信号;以及再现所述掩蔽话音信号。
【文档编号】G10K11/178GK104036771SQ201410073433
【公开日】2014年9月10日 申请日期:2014年2月28日 优先权日:2013年3月7日
【发明者】浅田宏平, 佐古曜一郎, 迫田和之, 竹原充, 中村隆俊, 丹下明, 花谷博幸, 甲贺有希, 大沼智也 申请人:索尼公司
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1