语音会议装置的制作方法

文档序号:7677177阅读:166来源:国知局
专利名称:语音会议装置的制作方法
技术领域
本发明涉及一种在多个场所通过网络等举行的语音会议中使用 的语音会议装置,并且尤其涉及一种通过检测讲话者方向来对从讲话 者方向发出的声音进行收集的语音会议装置。
背景技术
在现有技术中,通常采用这样的方法作为在远程地点之间举行 语音会议的方法,g卩,向将要举行语音会议的每个场所分别提供语音 会议单元,然后通过网络对这些语音会议装置进行连接来发送/接收 声音信号。同样,己经发明出在这样的语音会议中使用的各种语音会 议装置。
在专利文献1的语音会议装置中,根据通过网络输入的声音信 号,从布置在天花板上的扬声器中发出声音,由配置在各个侧面以分 别指向多个不同方向的麦克风收集声音,并且通过网络将来自麦克风 的声音信号向外发出。
同样,在专利文献2的语音会议装置中,通过对麦克风阵列中 的各个麦克风所收集的信号进行延迟处理来检测讲话者的方向,并且 降低从讲话者附近的扬声器发出的声音的音量。
专利文献l: JP-A-8-298696
专利文献2: JP-A-11-5578
发明内容
本发明要解决的问题
然而,在专利文献1的语音会议装置中,麦克风和扬声器相互 布置得很近,从而在各个麦克风所收集的信号中包含了在扬声器周围 环绕的许多声音。因此,当根据各个麦克风所收集的信号来指定讲话
3者的方向并随后选择与该方向相对应的所收集的声音信号时,会由于 存在环绕的声音而错误地检测出讲话者的方向。
同样,在专利文献2的语音会议装置中,通过对包含环绕声音 的所收集的信号进行延迟处理来检测讲话者的方向。因此,就像专利 文献1 一样,不能去除环绕的声音的影响,从而会在一些情况下错误 地检测出讲话者的方向。
同样,除专利文献1和专利文献2中的语音会议装置之外,还
有如图6所示的配置了麦克风阵列的长条形语音会议装置。
图6是示出现有技术中的长条形语音会议装置的主要构造的侧视图。
图6中所示的语音会议装置r是个很长的单元,并在一侧表面 上配置了麦克风阵列,其中麦克风MIC101到MIC116以等间距D0排 列在长度方向上。虽然没示出,但在与该侧面相对的侧面上也布置了 麦克风阵列。语音会议装置1'对麦克风MIC101到MIC116的收集信 号进行延迟处理以产生分别在不同方向上具有明确指向性的收集声
束信号。然后,语音会议装置r通过选择信号强度最大的收集声束
信号来检测讲话者的方向,随后将所选的收集声束信号发送到目标语
音会议装置。在现有技术中的这种语音会议装置r中,根据必要的 讲话者检测范围及外壳的大小来设置布置的麦克风的数量和麦克风
间距D0。这时,在成本方面期望所布置的麦克风数量应当减到越少 越好,因此麦克风间距D0必然加宽。
图7A是示出当麦克风间距D0超过一定程度时收集声束信号的 指向性的示图,图7B示出当采用具有如图7A所示的指向性的收集声 束信号时讲话者方向的示例。在图7A中,"方向"代表当把声束前 向视为0°方向时的方向(度)。
当麦克风间距DO很宽,如图7A所示,低频范围(fL0W)内的 声音信号可以得到在声束前向附近较宽的方向范围内的足够增益。在 这种情况下,除了在声束前向(0°方向)上之外,高频范围(fHI) 内的声音信号在大约45。方向以及大约70。方向上都可得到超过一 定程度的增益。即,在高频范围(fHI)内出现了旁瓣。由于这个原因,如图7B所示,不仅在将讲话者50实际所处方 向设置为前向的情况下所拾取的收集声束信号MBa获得了足够的信 号强度,而且收集声束信号MBb (其旁瓣也分别指示讲话者50的实 际所处方向)也获得了足够的信号强度。然后,当收集声束信号MBb 的信号强度大于收集声束信号MBa时,如图7B所示,会判定讲话者 50 (讲话者50')位于收集声束信号MBb的前向。因此,就有错误 地检测出讲话者方向的可能。另外,相应地不能以足够水平收集从讲 话者50实际所处的收集声束信号MBa的方向发出的声音。
因此本发明的一个目的是提供能够准确检测讲话者方向并且以 较高的信号S/N比来收集从该方向发出的声音的语音会议装置。
解决问题的手段
本发明的语音会议装置包括
麦克风阵列,其具有直线排列的多个麦克风,其中排列在多个 麦克风中部的麦克风之间的麦克风间距比排列在多个麦克风两端部 分的麦克风之间的麦克风间距小;
第一收集声束产生部分,其对从排列在所述麦克风阵列中部的 麦克风得到的声音收集信号进行延迟处理以产生分别在不同方向上 具有指向性的多个检测收集声束信号;
检测部分,其通过对多个检测收集声束信号进行比较来检测讲
话者的方向;和
第二收集声束产生部分,其通过对从所述麦克风阵列的所有麦 克风得到的收集声音信号进行预定延迟处理来产生在所检测到的讲 话者方向上具有指向性的收集声束信号。
在该配置中,所述麦克风阵列中的多个麦克风是直线布置的。 布置这些麦克风以使得排列在麦克风组中部的预定数量的麦克风之 间的间距比排列在两端部分以将中部的麦克风置于它们之间的麦克 风之间的间距小。由第一收集声束产生部分产生的收集声束信号仅通 过由排列在中部的麦克风得到的声音收集信号所产生。因此,如图 5A所示,在低频范围和高频范围中均不会产生大的旁瓣。因此,可 以确保增强了在声束信号前向上的信号强度。即,当讲话者位于声束前向时信号强度可以得到增强。
检测部分对所产生的多个检测收集声束信号的信号强度进行比 较,提取信号强度最大的检测收集声束信号,并获得相关的方位。该 检测部分将检测到的方位供给第二收集声束产生部分。然后,第二收 集声束产生部分根据所有麦克风的声音收集信号来产生在所检测到 的方向上具有最强指向性的收集声束信号,并输出该收集声束信号。 当所有麦克风都采用这个方式时,如图5B所示,产生了旁瓣,但产 生了在声束前向上具有更明确指向性的收集声束信号。这时,由于在 除前向之外的旁侧区域中几乎不产生声音,因此可以产生只对讲话者 发出的声音进行高增益拾取的收集声束信号,而不会受到旁瓣的影 响。
而且,在本发明的语音会议装置中,第一收集声束产生部分具 有带通滤波器,该带通滤波器把根据讲话者声音确定的特定频带作为 通带。第一收集声束产生部分通过使用被所述带通滤波器进行了带通 处理的声音收集信号来产生多个检测收集声束信号。
在该配置中,除讲话者的声音之外的噪声分量被带通滤波器消 除。因此,仅包括讲话者所发出声音的声音被输入第一收集声束产生 部分。结果,检测收集声束信号的信号强度基本上仅取决于讲话者的 声音,并且可以更精确地检测到讲话者的方向。
本发明的优点
根据本发明,可以实现一种能够准确无误地检测讲话者方向并 从而以较高水平收集从相关方向发出的声音的语音会议装置。


图1A到图1C是根据本实施例的语音会议装置1的三个视图。
图2是根据本实施例的语音会议装置1的功能块框图。
图3是收集声束产生部分181的功能块框图。
图4是示出收集声束信号的指向性方向的概念图。
图5A和图5B是示出收集声束信号的指向性特征的示图。
图6是示出现有技术中的长条形语音会议装置的主要构造的侧
6视图。
图7A是示出当麦克风间距D0宽过了一定程度时收集声束信号 的指向性的示图,以及图7B示出当采用了具有如图7A所示的指向性 的收集声束信号时的讲话者检测的示例。
参考数字和符号的描述
1语音会议装置、2外壳、11输入/输出连接器、12输入/输 出I/F、 13发出声音指向性控制部分、14 D/A转换器、15发声放 大器、16声音收集放大器、17 A/D转换器、181, 182收集声束产 生部分、810BPF、 811检测声束产生部分、812输出声束产生部分、 813输出声束选择部分、19收集声束选择部分、20回声消除部分、 211自适应滤波器、212后处理器、SP1到SP16扬声器、MIC101到 MIC116麦克风、MIC201到MIC216麦克风
具体实施例方式
下面将参照附图来说明根据本发明实施例的语音会议装置。 图1A到图1C是根据本实施例的语音会议装置1的三个视图,
其中图1A和1C分别是侧视图,图IB是仰视图。
图2是根据本实施例的语音会议装置1的功能块框图。 通过对外壳2配置多个扬声器SP1到SP16、多个麦克风MIC101
到MIC116、 MIC201到MIC216、以及图2中示出的功能部分来构造本
实施例的语音会议装置1。
外壳2是在一个方向上较长的近似长方体。在外壳2的长侧(表
面)的两端部分分别配备了预定高度的支承部分3,支承部分3使外
壳2的底面与安装表面之间保持预定间隔。这里,在下面的说明中,
将外壳2的四个侧面中长度较长的表面称为长表面,将长度较短的表
面称为短表面。
向外壳2的底面配备了分别形成为相同形状的非指向性的单体 扬声器SP1到SP16。这些单体扬声器SP1到SP16沿长度方向以预定 间距直线布置。
在外壳2的一个长表面上沿长度方向直线排列了分别具有相同
7规格的麦克风MIC101到MIC116。 一个麦克风阵列由以此方式排列的 一组麦克风组成。沿排列方向(长度方向),将麦克风阵列中部的麦 克风MIC104到MIC113的麦克风间距设置为Dl (<00(现有技术中的 麦克风间距)),而将两端部分的麦克风MIC101到麦克风MIC104以 及麦克风MIC113到麦克风MIC116的麦克风间距设置为D2(>D0>D1)。 即,排列方向上的中部的十个麦克风排列得紧密,而排列方向上的两 端的三个麦克风排列得稀疏。
在外壳2的另一长表面上的与麦克风MIC101到MIC116相对的 位置上排列了分别具有相同规格的麦克风MIC201到MIC216。具体地 说,沿排列方向(长度方向)将麦克风阵列中部的麦克风MIC204到 MIC213的麦克风间距设置为Dl (〈DO(现有技术中的麦克风间距)), 而将两端部分的麦克风MIC201到麦克风MIC204以及麦克风MIC213 到麦克风MIC216的麦克风间距设置为D2 (〉D0>D1)。
这里,在本实施例中,每个麦克风阵列中的麦克风数目分别设 置为16个。但麦克风的数目不局限于该数目,可以根据规格来适当 设置麦克风的数目。
接下来,如图2所示,本实施例的语音会议装置1包括输入/输 出连接器ll、输入/输出I/F12、发出声音指向性控制部分13、 D/A 转换器14、发声放大器15、上述扬声器阵列SPA(扬声器SP1到SP16)、 上述麦克风阵列MA10和MA20 (麦克风MIC101到MIC116、 MIC201到 MIC216)、声音收集放大器16、 A/D转换器17、收集声束产生部分 181和182、收集声束选择部分19以及回声消除部分20。
输入/输出I/F 12将通过输入/输出连接器11从其它发声装置 输入的输入声音信号从与网络兼容的数据格式(协议)转换成预定的 声音数据格式,然后将转换后的声音信号经由回声消除部分20发送 到发出声音指向性控制部分13。同样,输入/输出I/F 12将回声消 除部分20产生的输出声音信号转换成与网络兼容的数据格式(协 议),并将转换后的声音信号通过输入/输出连接器11发送到网络。
发出声音指向性控制部分13根据发出声音的指定指向性特别针 对扬声器阵列的扬声器SP1到SP16来对输入声音信号进行延迟处理、幅度处理等,从而产生各个发出声音信号。发出声音指向性控制部分
13将这些各个发出声音信号输出到分别为扬声器SP1到SP16配备的 D/A转换器14。各个D/A转换器14将各个发出声音信号转换为模拟 形式,并将转换后的声音信号输出到发声放大器15。各个发声放大 器15对各个发出声音信号进行放大,并将放大后的声音信号送入扬 声器SP1到SP16。
扬声器SP1到SP16将送入的各个发出声音信号转换成各个声 音,并把这些声音分别发向外部。这时,扬声器SP1到SP16是安装 在外壳2的底面上的。因此,发出的声音从放置该语音会议装置1 的桌子的上表面发生反射,然后绕过当前与会者就座处的语音会议装 置斜向上传播。
麦克风阵列中的各个麦克风MIC101到MIC116、MIC201到MIC216 可以是非指向性的,也可以是指向性的。但期望这些麦克风具有指向 性。各个麦克风从语音会议装置1的外部拾取声音,将声音转换成电 信号,并将声音收集信号输出到声音收集放大器16。声音收集放大 器16将声音收集信号分别进行放大,并将放大后的信号送入A/D转 换器17。 A/D转换器17将声音收集信号转换成数字信号,并将数字 信号输出到收集声束产生部分181、 182。
由安装在一个长表面上的麦克风阵列MA10的麦克风MIC101到 MIC116分别拾取的声音收集信号被输入到收集声束产生部分181。由 安装在另一个长表面上的麦克风阵列MA20的麦克风MIC201到 MIC216分别拾取的声音收集信号被输入到收集声束产生部分182。
收集声束产生部分181、 182分别具有相同的构造。图3是收集 声束产生部分181的功能块框图。这里,由于收集声束产生部分181、 182是以类似的方式构造的,因此下面仅具体说明收集声束产生部分 181的构造。
收集声束产生部分181具有带通滤波器(BPF) 810、检测声束 产生部分811、输出声束产生部分812和输出声束选择部分813。
带通滤波器810仅让麦克风MIC104到MIC113拾取的声音收集 信号SS104到SS113中的预定频率分量通过,并将之输出到检测声束产生部分811。这里,预定频率分量被设置为人声音中的特定频率分 量。在本实施例中,将能量相对较小的高频范围(2kHz到3kHz)设
置为通带。
检测声束产生部分811对由中间的麦克风MIC104到MIC113拾 取的并通过了带通滤波器810的声音收集信号SS104到SS113进行延 迟和的控制(delay-sum control)。因此,如图4所示,检测声束 产生部分811产生了分别在不同方向上具有明确指向性的收集声束 信号MB101到MB114。图4是示出收集声束信号指向性方向的概念图。 将收集声束信号MB101至ljMB114设置成使得所述明确指向性的方向沿 着语音会议装置1的长度方向顺次变化。所产生的收集声束信号 MB101到MB114被输出到收集声束选择部分19。
输出声束产生部分812对声音收集信号SS101到SS116进行延 迟和的控制。因此,输出声束产生部分812产生了在分别与收集声束 信号MB101到MB114相同的方向上具有明确指向性的收集声束信号 MBIOI,至U MB114,。
当从收集声束选择部分19 (下文将对其进行描述)输入方向数 据MS时,输出声束选择部分813从收集声束信号MB101'到MB114' 中检测出与相关方向相对应的收集声束信号,然后将该相关收集声束 信号作为输出收集声束信号MB100输出到收集声束选择部分19。
收集声束产生部分182具有与收集声束产生部分181相同的构 造。收集声束产生部分182根据从麦克风MIC201到MIC216送入的声 音收集信号SS210到SS216 (未示出)产生收集声束信号MB201到 MB214,并随后将这些收集声束信号输出到收集声束选择部分19。并 且,收集声束产生部分182根据来自收集声束选择部分19的方向数 据MS来向收集声束选择部分19输出一个输出收集声束信号MB200。
收集声束选择部分19对收集声束信号MB101到MB114与MB201 到MB214之间的信号强度进行比较,检测出声音信号最强的收集声束 信号。收集声束选择部分19将与所检测出的收集声束信号相对应的 方向数据MS送入收集声束产生部分181、 182。
然后,收集声束选择部分19将来自收集声束产生部分181的输
10出收集声束信号腿100和来自收集声束产生部分182的输出收集声束 信号MB200作为输出收集声束信号MB输出给回声消除部分20。 根据该构造,本实施例的语音会议装置1具有如下优点。 图5A和图5B是示出收集声束信号的指向性特征的示图,其中 图5A示出仅由处于麦克风排列得很密集的中部的那些麦克风产生收 集声束信号的情况,图5B示出由所有麦克风产生收集声束信号的情 况。
如图5A所示,当仅由中部的麦克风产生收集声束信号时,在高 频范围和低频范围中均得到高增益,加宽了声束前向周围的主瓣(方 向角范围)的宽度,并几乎不产生旁瓣。因此,各个收集声束信号的 信号强度不会被旁瓣影响,而仅取决于主瓣。从而,仅当讲话者位于 该声束的前向上时,收集声束信号才分别具有髙的信号强度。结果, 当选择了高信号强度的收集声束信号时,可以在某个方向角范围内精 确检测出讲话者的方向。而且,与现有技术不同的是,可以避免将完 全不同的方向错误识别成讲话者的方向。
那么,如图5B所示,当由所有的麦克风产生收集声束信号时, 主瓣宽度变窄。因此,可在更窄的方向上拾取讲话者的声音。这时, 在高频范围内产生旁瓣。然而,由于讲话者的声音仅在所选收集声束 信号的前向到达,因此该讲话者的声音根本不会受到旁瓣影响。
如此,按照本实施例的配置,可以精确检测到讲话者的方向, 并且能以指向性明确的声束来收集讲话者的声音。
回声消除部分20配备了各自独立且被串联连接的回声消除器 21到23。 BP,来自收集声束选择部分19的输出收集声束信号MB被 输入到回声消除器21,回声消除器21的输出被输入到回声消除器22。 然后回声消除器22的输出被输入到回声消除器23,回声消除器23 的输出被输入到输入/输出I/F 12。
回声消除器21配备了自适应滤波器211和后处理器212。同样, 虽然未示出,但以与回声消除器21相同的配置来构造回声消除器22、 23,并分别配置自适应滤波器221、 231和后处理器222、 232。
回声消除器21的自适应滤波器211响应于输入声音信号Sl来产生伪衰退声音信号 (pseudo regression sound signal), 该伪衰 退声音信号基于将要设置的发出声音的指向性和将要选择的特定收 集声束信号MB的所收集声音的指向性。后处理器212从收集声束选 择部分19正被输出的特定收集声束信号中减去与该输入声音信号S1 相对应的伪衰退声音信号,并将所得信号输出到回声消除器22的后 处理器222。
回声消除器22的自适应滤波器221响应于输入声音信号S2来 产生伪衰退声音信号,该伪衰退声音信号基于将要设置的发出声音的 指向性和将要选择的特定收集声束信号MB的所收集声音的指向性。 后处理器222从回声消除器21的后处理器212正被输出的第一差信 号中减去与该输入声音信号S2相对应的伪衰退声音信号,并将所得 信号输出到回声消除器23的后处理器232。
回声消除器23的自适应滤波器231响应于输入声音信号S3来 产生伪衰退声音信号,该伪衰退声音信号基于将要设置的发出声音的 指向性和将要选择的特定收集声束信号MB的所收集声音的指向性。 后处理器232从回声消除器22的后处理器222正被输出的第二差信 号中减去与该输入声音信号S3相对应的伪衰退声音信号,并将所得 信号作为输出声音信号输出到输入/输出I/F 12。这里,在输入了一 个输入声音信号时,回声消除器21到23中的任意一个开始操作,在 输入了两个输入声音信号时,回声消除器21到23中的任意两个开始 操作。
通过执行这样的回声消除处理,可以进行适当的回声消除,并 且可以仅将用户自己的语音会议装置的讲话者声音作为输出声音信 号发送到网络中。
如上所述,按照本实施例的配置,可以构造出能够精确检测讲 话者方向并以高S/N比仅输出讲话者声音的语音会议装置。
在这种情况下,上述说明中描述了分别产生十四个收集声束信 号的例子。但是还可以根据规格来适当地设置声束的数目。
另外,在上述说明中描述了提供带通滤波器的例子。但还可以 采用不提供带通滤波器的配置。另外,在上述说明中,说明了同时产生检测收集声束信号MB101 到MB114以及输出收集声束信号MB101,到MB114,并随后选择相关 收集声束信号的方法。但还可以根据检测收集声束信号MB101到 MB114的结果来由所有声音收集信号SS101到SS116产生相关输出收 集声束信号。
另外,收集声束选择部分19可以根据收集声束信号的幅度来选 择一个收集声束。或者,收集声束选择部分19还可以根据收集声束 信号的时间平均能量等来选择一个收集声束。
另外,麦克风MIC104到MIC113之间的间距被设置为常数Dl, 麦克风MIC101到MIC104以及MIC113到MIC116之间的间距被设置为 常数D2。在这种情况下,如果在所检测到的频带中检测声束的旁瓣 不影响这种布置,则例如可以使所有麦克风间距不相同。
参照特定实施例详细说明了本发明。但对于所属领域的技术人 员显而易见的是,可以在不脱离本发明精神和范围或者预期界限的情 况下作出各种变化和修改。
本发明基于2006年5月25日提交的日本专利申请(专利申请 No. 2006-145697);通过引用将该申请的内容并入本文。
权利要求
1. 一种语音会议装置,包括麦克风阵列,其具有直线排列的多个麦克风,其中排列在所述多个麦克风中部的麦克风之间的麦克风间距比排列在所述多个麦克风两端部分的麦克风之间的麦克风间距小;第一收集声束产生部分,其对从排列在所述麦克风阵列中部的麦克风得到的声音收集信号进行延迟处理,以产生分别在不同方向上具有指向性的多个检测收集声束信号;检测部分,其通过对多个检测收集声束信号进行比较来检测讲话者的方向;和第二收集声束产生部分,其通过对从所述麦克风阵列的所有麦克风得到的声音收集信号进行预定延迟处理来产生在所检测到的讲话者的方向上具有指向性的收集声束信号。
2. 如权利要求1所述的语音会议装置,其中所述第一收集声束 产生部分具有带通滤波器,所述带通滤波器把根据讲话者声音确定的 特定频带作为通带;并且其中所述第一收集声束产生部分通过使用被所述带通滤波器进 行了带通处理的声音收集信号来产生多个检测收集声束信号。
全文摘要
一种语音会议装置,其具备精确检测讲话者方向并以高S/N比从该方向收集声音的功能。检测声束产生单元(811)通过使用被密集布置在布置方向上的中部的多个麦克风(MIC104-MIC113)的声音收集信号(SS104-SS113)来执行延迟和的处理,以产生用于检测的收集声束信号(MB101-MB114)。输出声束产生单元(812)通过使用布置在布置方向上的所有麦克风(MIC101-MIC116)的声音收集信号(SS101-SS116)来执行延迟和的处理,以产生输出收集声束信号(MB101’-MB114’)。收集声束选择单元(19)在用于检测的收集声束信号(MB101-MB114)中检测出与最大信号强度相对应的方向数据(MS),并将其供给输出声束选择单元(813)。输出声束选择单元(813)选择与该方向数据(MS)相对应的收集声音信号。
文档编号H04R3/00GK101455093SQ200780019170
公开日2009年6月10日 申请日期2007年5月17日 优先权日2006年5月25日
发明者田中良, 石桥利晃, 铃木智, 鹈饲训史 申请人:雅马哈株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1