语音会议装置的制作方法

文档序号：7677177阅读：166来源：国知局

专利名称：语音会议装置的制作方法
技术领域：
本发明涉及一种在多个场所通过网络等举行的语音会议中使用的语音会议装置，并且尤其涉及一种通过检测讲话者方向来对从讲话者方向发出的声音进行收集的语音会议装置。
背景技术：
在现有技术中，通常采用这样的方法作为在远程地点之间举行语音会议的方法，g卩，向将要举行语音会议的每个场所分别提供语音会议单元，然后通过网络对这些语音会议装置进行连接来发送/接收声音信号。同样，己经发明出在这样的语音会议中使用的各种语音会议装置。
在专利文献1的语音会议装置中，根据通过网络输入的声音信号，从布置在天花板上的扬声器中发出声音，由配置在各个侧面以分别指向多个不同方向的麦克风收集声音，并且通过网络将来自麦克风的声音信号向外发出。
同样，在专利文献2的语音会议装置中，通过对麦克风阵列中的各个麦克风所收集的信号进行延迟处理来检测讲话者的方向，并且降低从讲话者附近的扬声器发出的声音的音量。
专利文献l: JP-A-8-298696
专利文献2: JP-A-11-5578
发明内容
本发明要解决的问题
然而，在专利文献1的语音会议装置中，麦克风和扬声器相互布置得很近，从而在各个麦克风所收集的信号中包含了在扬声器周围环绕的许多声音。因此，当根据各个麦克风所收集的信号来指定讲话
3者的方向并随后选择与该方向相对应的所收集的声音信号时，会由于存在环绕的声音而错误地检测出讲话者的方向。
同样，在专利文献2的语音会议装置中，通过对包含环绕声音的所收集的信号进行延迟处理来检测讲话者的方向。因此，就像专利文献1 一样，不能去除环绕的声音的影响，从而会在一些情况下错误地检测出讲话者的方向。
同样，除专利文献1和专利文献2中的语音会议装置之外，还
有如图6所示的配置了麦克风阵列的长条形语音会议装置。
图6是示出现有技术中的长条形语音会议装置的主要构造的侧视图。
图6中所示的语音会议装置r是个很长的单元，并在一侧表面上配置了麦克风阵列，其中麦克风MIC101到MIC116以等间距D0排列在长度方向上。虽然没示出，但在与该侧面相对的侧面上也布置了麦克风阵列。语音会议装置1'对麦克风MIC101到MIC116的收集信号进行延迟处理以产生分别在不同方向上具有明确指向性的收集声
束信号。然后，语音会议装置r通过选择信号强度最大的收集声束
信号来检测讲话者的方向，随后将所选的收集声束信号发送到目标语
音会议装置。在现有技术中的这种语音会议装置r中，根据必要的讲话者检测范围及外壳的大小来设置布置的麦克风的数量和麦克风
间距D0。这时，在成本方面期望所布置的麦克风数量应当减到越少越好，因此麦克风间距D0必然加宽。
图7A是示出当麦克风间距D0超过一定程度时收集声束信号的指向性的示图，图7B示出当采用具有如图7A所示的指向性的收集声束信号时讲话者方向的示例。在图7A中，"方向"代表当把声束前向视为0°方向时的方向(度)。
当麦克风间距DO很宽，如图7A所示，低频范围(fL0W)内的声音信号可以得到在声束前向附近较宽的方向范围内的足够增益。在这种情况下，除了在声束前向(0°方向)上之外，高频范围(fHI) 内的声音信号在大约45。方向以及大约70。方向上都可得到超过一定程度的增益。即，在高频范围(fHI)内出现了旁瓣。由于这个原因，如图7B所示，不仅在将讲话者50实际所处方向设置为前向的情况下所拾取的收集声束信号MBa获得了足够的信号强度，而且收集声束信号MBb (其旁瓣也分别指示讲话者50的实际所处方向)也获得了足够的信号强度。然后，当收集声束信号MBb 的信号强度大于收集声束信号MBa时，如图7B所示，会判定讲话者 50 (讲话者50')位于收集声束信号MBb的前向。因此，就有错误地检测出讲话者方向的可能。另外，相应地不能以足够水平收集从讲话者50实际所处的收集声束信号MBa的方向发出的声音。
因此本发明的一个目的是提供能够准确检测讲话者方向并且以较高的信号S/N比来收集从该方向发出的声音的语音会议装置。
解决问题的手段
本发明的语音会议装置包括
麦克风阵列，其具有直线排列的多个麦克风，其中排列在多个麦克风中部的麦克风之间的麦克风间距比排列在多个麦克风两端部分的麦克风之间的麦克风间距小；
第一收集声束产生部分，其对从排列在所述麦克风阵列中部的麦克风得到的声音收集信号进行延迟处理以产生分别在不同方向上具有指向性的多个检测收集声束信号；
检测部分，其通过对多个检测收集声束信号进行比较来检测讲
话者的方向；和
第二收集声束产生部分，其通过对从所述麦克风阵列的所有麦克风得到的收集声音信号进行预定延迟处理来产生在所检测到的讲话者方向上具有指向性的收集声束信号。
在该配置中，所述麦克风阵列中的多个麦克风是直线布置的。布置这些麦克风以使得排列在麦克风组中部的预定数量的麦克风之间的间距比排列在两端部分以将中部的麦克风置于它们之间的麦克风之间的间距小。由第一收集声束产生部分产生的收集声束信号仅通过由排列在中部的麦克风得到的声音收集信号所产生。因此，如图 5A所示，在低频范围和高频范围中均不会产生大的旁瓣。因此，可以确保增强了在声束信号前向上的信号强度。即，当讲话者位于声束前向时信号强度可以得到增强。
检测部分对所产生的多个检测收集声束信号的信号强度进行比较，提取信号强度最大的检测收集声束信号，并获得相关的方位。该检测部分将检测到的方位供给第二收集声束产生部分。然后，第二收集声束产生部分根据所有麦克风的声音收集信号来产生在所检测到的方向上具有最强指向性的收集声束信号，并输出该收集声束信号。当所有麦克风都采用这个方式时，如图5B所示，产生了旁瓣，但产生了在声束前向上具有更明确指向性的收集声束信号。这时，由于在除前向之外的旁侧区域中几乎不产生声音，因此可以产生只对讲话者发出的声音进行高增益拾取的收集声束信号，而不会受到旁瓣的影响。
而且，在本发明的语音会议装置中，第一收集声束产生部分具有带通滤波器，该带通滤波器把根据讲话者声音确定的特定频带作为通带。第一收集声束产生部分通过使用被所述带通滤波器进行了带通处理的声音收集信号来产生多个检测收集声束信号。
在该配置中，除讲话者的声音之外的噪声分量被带通滤波器消除。因此，仅包括讲话者所发出声音的声音被输入第一收集声束产生部分。结果，检测收集声束信号的信号强度基本上仅取决于讲话者的声音，并且可以更精确地检测到讲话者的方向。
本发明的优点
根据本发明，可以实现一种能够准确无误地检测讲话者方向并从而以较高水平收集从相关方向发出的声音的语音会议装置。

图1A到图1C是根据本实施例的语音会议装置1的三个视图。
图2是根据本实施例的语音会议装置1的功能块框图。
图3是收集声束产生部分181的功能块框图。
图4是示出收集声束信号的指向性方向的概念图。
图5A和图5B是示出收集声束信号的指向性特征的示图。
图6是示出现有技术中的长条形语音会议装置的主要构造的侧
6视图。
图7A是示出当麦克风间距D0宽过了一定程度时收集声束信号的指向性的示图，以及图7B示出当采用了具有如图7A所示的指向性的收集声束信号时的讲话者检测的示例。
参考数字和符号的描述
1语音会议装置、2外壳、11输入/输出连接器、12输入/输出I/F、 13发出声音指向性控制部分、14 D/A转换器、15发声放大器、16声音收集放大器、17 A/D转换器、181， 182收集声束产生部分、810BPF、 811检测声束产生部分、812输出声束产生部分、 813输出声束选择部分、19收集声束选择部分、20回声消除部分、 211自适应滤波器、212后处理器、SP1到SP16扬声器、MIC101到 MIC116麦克风、MIC201到MIC216麦克风
具体实施例方式
下面将参照附图来说明根据本发明实施例的语音会议装置。图1A到图1C是根据本实施例的语音会议装置1的三个视图，
其中图1A和1C分别是侧视图，图IB是仰视图。
图2是根据本实施例的语音会议装置1的功能块框图。通过对外壳2配置多个扬声器SP1到SP16、多个麦克风MIC101
到MIC116、 MIC201到MIC216、以及图2中示出的功能部分来构造本
实施例的语音会议装置1。
外壳2是在一个方向上较长的近似长方体。在外壳2的长侧(表
面)的两端部分分别配备了预定高度的支承部分3，支承部分3使外
壳2的底面与安装表面之间保持预定间隔。这里，在下面的说明中，
将外壳2的四个侧面中长度较长的表面称为长表面，将长度较短的表
面称为短表面。
向外壳2的底面配备了分别形成为相同形状的非指向性的单体扬声器SP1到SP16。这些单体扬声器SP1到SP16沿长度方向以预定间距直线布置。
在外壳2的一个长表面上沿长度方向直线排列了分别具有相同
7规格的麦克风MIC101到MIC116。一个麦克风阵列由以此方式排列的一组麦克风组成。沿排列方向(长度方向)，将麦克风阵列中部的麦克风MIC104到MIC113的麦克风间距设置为Dl (<00(现有技术中的麦克风间距))，而将两端部分的麦克风MIC101到麦克风MIC104以及麦克风MIC113到麦克风MIC116的麦克风间距设置为D2(>D0>D1)。即，排列方向上的中部的十个麦克风排列得紧密，而排列方向上的两端的三个麦克风排列得稀疏。
在外壳2的另一长表面上的与麦克风MIC101到MIC116相对的位置上排列了分别具有相同规格的麦克风MIC201到MIC216。具体地说，沿排列方向(长度方向)将麦克风阵列中部的麦克风MIC204到 MIC213的麦克风间距设置为Dl (〈DO(现有技术中的麦克风间距))，而将两端部分的麦克风MIC201到麦克风MIC204以及麦克风MIC213 到麦克风MIC216的麦克风间距设置为D2 (〉D0>D1)。
这里，在本实施例中，每个麦克风阵列中的麦克风数目分别设置为16个。但麦克风的数目不局限于该数目，可以根据规格来适当设置麦克风的数目。
接下来，如图2所示，本实施例的语音会议装置1包括输入/输出连接器ll、输入/输出I/F12、发出声音指向性控制部分13、 D/A 转换器14、发声放大器15、上述扬声器阵列SPA(扬声器SP1到SP16)、上述麦克风阵列MA10和MA20 (麦克风MIC101到MIC116、 MIC201到 MIC216)、声音收集放大器16、 A/D转换器17、收集声束产生部分 181和182、收集声束选择部分19以及回声消除部分20。
输入/输出I/F 12将通过输入/输出连接器11从其它发声装置输入的输入声音信号从与网络兼容的数据格式(协议)转换成预定的声音数据格式，然后将转换后的声音信号经由回声消除部分20发送到发出声音指向性控制部分13。同样，输入/输出I/F 12将回声消除部分20产生的输出声音信号转换成与网络兼容的数据格式(协议)，并将转换后的声音信号通过输入/输出连接器11发送到网络。
发出声音指向性控制部分13根据发出声音的指定指向性特别针对扬声器阵列的扬声器SP1到SP16来对输入声音信号进行延迟处理、幅度处理等，从而产生各个发出声音信号。发出声音指向性控制部分
13将这些各个发出声音信号输出到分别为扬声器SP1到SP16配备的 D/A转换器14。各个D/A转换器14将各个发出声音信号转换为模拟形式，并将转换后的声音信号输出到发声放大器15。各个发声放大器15对各个发出声音信号进行放大，并将放大后的声音信号送入扬声器SP1到SP16。
扬声器SP1到SP16将送入的各个发出声音信号转换成各个声音，并把这些声音分别发向外部。这时，扬声器SP1到SP16是安装在外壳2的底面上的。因此，发出的声音从放置该语音会议装置1 的桌子的上表面发生反射，然后绕过当前与会者就座处的语音会议装置斜向上传播。
麦克风阵列中的各个麦克风MIC101到MIC116、MIC201到MIC216 可以是非指向性的，也可以是指向性的。但期望这些麦克风具有指向性。各个麦克风从语音会议装置1的外部拾取声音，将声音转换成电信号，并将声音收集信号输出到声音收集放大器16。声音收集放大器16将声音收集信号分别进行放大，并将放大后的信号送入A/D转换器17。 A/D转换器17将声音收集信号转换成数字信号，并将数字信号输出到收集声束产生部分181、 182。
由安装在一个长表面上的麦克风阵列MA10的麦克风MIC101到 MIC116分别拾取的声音收集信号被输入到收集声束产生部分181。由安装在另一个长表面上的麦克风阵列MA20的麦克风MIC201到 MIC216分别拾取的声音收集信号被输入到收集声束产生部分182。
收集声束产生部分181、 182分别具有相同的构造。图3是收集声束产生部分181的功能块框图。这里，由于收集声束产生部分181、 182是以类似的方式构造的，因此下面仅具体说明收集声束产生部分 181的构造。
收集声束产生部分181具有带通滤波器(BPF) 810、检测声束产生部分811、输出声束产生部分812和输出声束选择部分813。
带通滤波器810仅让麦克风MIC104到MIC113拾取的声音收集信号SS104到SS113中的预定频率分量通过，并将之输出到检测声束产生部分811。这里，预定频率分量被设置为人声音中的特定频率分量。在本实施例中，将能量相对较小的高频范围(2kHz到3kHz)设
置为通带。
检测声束产生部分811对由中间的麦克风MIC104到MIC113拾取的并通过了带通滤波器810的声音收集信号SS104到SS113进行延迟和的控制(delay-sum control)。因此，如图4所示，检测声束产生部分811产生了分别在不同方向上具有明确指向性的收集声束信号MB101到MB114。图4是示出收集声束信号指向性方向的概念图。将收集声束信号MB101至ljMB114设置成使得所述明确指向性的方向沿着语音会议装置1的长度方向顺次变化。所产生的收集声束信号 MB101到MB114被输出到收集声束选择部分19。
输出声束产生部分812对声音收集信号SS101到SS116进行延迟和的控制。因此，输出声束产生部分812产生了在分别与收集声束信号MB101到MB114相同的方向上具有明确指向性的收集声束信号 MBIOI，至U MB114，。
当从收集声束选择部分19 (下文将对其进行描述)输入方向数据MS时，输出声束选择部分813从收集声束信号MB101'到MB114' 中检测出与相关方向相对应的收集声束信号，然后将该相关收集声束信号作为输出收集声束信号MB100输出到收集声束选择部分19。
收集声束产生部分182具有与收集声束产生部分181相同的构造。收集声束产生部分182根据从麦克风MIC201到MIC216送入的声音收集信号SS210到SS216 (未示出)产生收集声束信号MB201到 MB214，并随后将这些收集声束信号输出到收集声束选择部分19。并且，收集声束产生部分182根据来自收集声束选择部分19的方向数据MS来向收集声束选择部分19输出一个输出收集声束信号MB200。
收集声束选择部分19对收集声束信号MB101到MB114与MB201 到MB214之间的信号强度进行比较，检测出声音信号最强的收集声束信号。收集声束选择部分19将与所检测出的收集声束信号相对应的方向数据MS送入收集声束产生部分181、 182。
然后，收集声束选择部分19将来自收集声束产生部分181的输
10出收集声束信号腿100和来自收集声束产生部分182的输出收集声束信号MB200作为输出收集声束信号MB输出给回声消除部分20。根据该构造，本实施例的语音会议装置1具有如下优点。图5A和图5B是示出收集声束信号的指向性特征的示图，其中图5A示出仅由处于麦克风排列得很密集的中部的那些麦克风产生收集声束信号的情况，图5B示出由所有麦克风产生收集声束信号的情况。
如图5A所示，当仅由中部的麦克风产生收集声束信号时，在高频范围和低频范围中均得到高增益，加宽了声束前向周围的主瓣(方向角范围)的宽度，并几乎不产生旁瓣。因此，各个收集声束信号的信号强度不会被旁瓣影响，而仅取决于主瓣。从而，仅当讲话者位于该声束的前向上时，收集声束信号才分别具有髙的信号强度。结果，当选择了高信号强度的收集声束信号时，可以在某个方向角范围内精确检测出讲话者的方向。而且，与现有技术不同的是，可以避免将完全不同的方向错误识别成讲话者的方向。
那么，如图5B所示，当由所有的麦克风产生收集声束信号时，主瓣宽度变窄。因此，可在更窄的方向上拾取讲话者的声音。这时，在高频范围内产生旁瓣。然而，由于讲话者的声音仅在所选收集声束信号的前向到达，因此该讲话者的声音根本不会受到旁瓣影响。
如此，按照本实施例的配置，可以精确检测到讲话者的方向，并且能以指向性明确的声束来收集讲话者的声音。
回声消除部分20配备了各自独立且被串联连接的回声消除器 21到23。 BP，来自收集声束选择部分19的输出收集声束信号MB被输入到回声消除器21，回声消除器21的输出被输入到回声消除器22。然后回声消除器22的输出被输入到回声消除器23，回声消除器23 的输出被输入到输入/输出I/F 12。
回声消除器21配备了自适应滤波器211和后处理器212。同样，虽然未示出，但以与回声消除器21相同的配置来构造回声消除器22、 23，并分别配置自适应滤波器221、 231和后处理器222、 232。
回声消除器21的自适应滤波器211响应于输入声音信号Sl来产生伪衰退声音信号 (pseudo regression sound signal)，该伪衰退声音信号基于将要设置的发出声音的指向性和将要选择的特定收集声束信号MB的所收集声音的指向性。后处理器212从收集声束选择部分19正被输出的特定收集声束信号中减去与该输入声音信号S1 相对应的伪衰退声音信号，并将所得信号输出到回声消除器22的后处理器222。
回声消除器22的自适应滤波器221响应于输入声音信号S2来产生伪衰退声音信号，该伪衰退声音信号基于将要设置的发出声音的指向性和将要选择的特定收集声束信号MB的所收集声音的指向性。后处理器222从回声消除器21的后处理器212正被输出的第一差信号中减去与该输入声音信号S2相对应的伪衰退声音信号，并将所得信号输出到回声消除器23的后处理器232。
回声消除器23的自适应滤波器231响应于输入声音信号S3来产生伪衰退声音信号，该伪衰退声音信号基于将要设置的发出声音的指向性和将要选择的特定收集声束信号MB的所收集声音的指向性。后处理器232从回声消除器22的后处理器222正被输出的第二差信号中减去与该输入声音信号S3相对应的伪衰退声音信号，并将所得信号作为输出声音信号输出到输入/输出I/F 12。这里，在输入了一个输入声音信号时，回声消除器21到23中的任意一个开始操作，在输入了两个输入声音信号时，回声消除器21到23中的任意两个开始操作。
通过执行这样的回声消除处理，可以进行适当的回声消除，并且可以仅将用户自己的语音会议装置的讲话者声音作为输出声音信号发送到网络中。
如上所述，按照本实施例的配置，可以构造出能够精确检测讲话者方向并以高S/N比仅输出讲话者声音的语音会议装置。
在这种情况下，上述说明中描述了分别产生十四个收集声束信号的例子。但是还可以根据规格来适当地设置声束的数目。
另外，在上述说明中描述了提供带通滤波器的例子。但还可以采用不提供带通滤波器的配置。另外，在上述说明中，说明了同时产生检测收集声束信号MB101 到MB114以及输出收集声束信号MB101，到MB114，并随后选择相关收集声束信号的方法。但还可以根据检测收集声束信号MB101到 MB114的结果来由所有声音收集信号SS101到SS116产生相关输出收集声束信号。
另外，收集声束选择部分19可以根据收集声束信号的幅度来选择一个收集声束。或者，收集声束选择部分19还可以根据收集声束信号的时间平均能量等来选择一个收集声束。
另外，麦克风MIC104到MIC113之间的间距被设置为常数Dl，麦克风MIC101到MIC104以及MIC113到MIC116之间的间距被设置为常数D2。在这种情况下，如果在所检测到的频带中检测声束的旁瓣不影响这种布置，则例如可以使所有麦克风间距不相同。
参照特定实施例详细说明了本发明。但对于所属领域的技术人员显而易见的是，可以在不脱离本发明精神和范围或者预期界限的情况下作出各种变化和修改。
本发明基于2006年5月25日提交的日本专利申请(专利申请 No. 2006-145697);通过引用将该申请的内容并入本文。
权利要求
1. 一种语音会议装置，包括麦克风阵列，其具有直线排列的多个麦克风，其中排列在所述多个麦克风中部的麦克风之间的麦克风间距比排列在所述多个麦克风两端部分的麦克风之间的麦克风间距小；第一收集声束产生部分，其对从排列在所述麦克风阵列中部的麦克风得到的声音收集信号进行延迟处理，以产生分别在不同方向上具有指向性的多个检测收集声束信号；检测部分，其通过对多个检测收集声束信号进行比较来检测讲话者的方向；和第二收集声束产生部分，其通过对从所述麦克风阵列的所有麦克风得到的声音收集信号进行预定延迟处理来产生在所检测到的讲话者的方向上具有指向性的收集声束信号。
2. 如权利要求1所述的语音会议装置，其中所述第一收集声束产生部分具有带通滤波器，所述带通滤波器把根据讲话者声音确定的特定频带作为通带；并且其中所述第一收集声束产生部分通过使用被所述带通滤波器进行了带通处理的声音收集信号来产生多个检测收集声束信号。
全文摘要
一种语音会议装置，其具备精确检测讲话者方向并以高S/N比从该方向收集声音的功能。检测声束产生单元(811)通过使用被密集布置在布置方向上的中部的多个麦克风(MIC104-MIC113)的声音收集信号(SS104-SS113)来执行延迟和的处理，以产生用于检测的收集声束信号(MB101-MB114)。输出声束产生单元(812)通过使用布置在布置方向上的所有麦克风(MIC101-MIC116)的声音收集信号(SS101-SS116)来执行延迟和的处理，以产生输出收集声束信号(MB101’-MB114’)。收集声束选择单元(19)在用于检测的收集声束信号(MB101-MB114)中检测出与最大信号强度相对应的方向数据(MS)，并将其供给输出声束选择单元(813)。输出声束选择单元(813)选择与该方向数据(MS)相对应的收集声音信号。
文档编号H04R3/00GK101455093SQ200780019170
公开日2009年6月10日申请日期2007年5月17日优先权日2006年5月25日
发明者田中良, 石桥利晃, 铃木智, 鹈饲训史申请人:雅马哈株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：石桥利晃;铃木智;田中良;鹈饲训史
技术所有人：雅马哈株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。