声音拾取设备和声音拾取方法

文档序号:7667179阅读:588来源:国知局
专利名称:声音拾取设备和声音拾取方法
技术领域
本发明涉及声音拾取设备和声音拾取方法。
技术背景近年来,使用多通道声音系统记录的声音信号通过家庭中的多个扬声器 电影院中现在通常使用多通道声音系统再现声音信号。因此,准备用于多通道再现的产品和广播技术现在商业地从多个领域引入。尽管5.1通道环绕系 统是目前最普遍的环绕系统,但是准备用于6.1通道环绕系统、7.1通道环绕 系统等的产品也投入商业生产,以便提高环绕效果。首先,将参考图18描述使用5.1通道环绕系统执行声音拾取处理的示例。 5.1通道环绕系统作为多通道环绕系统广泛地可用。术语"5.1通道"指示包 括前方(方向才莫式1)、左前方(方向4莫式2)、右前方(方向才莫式3)、左后 方(方向模式4 )和右后方(方向模式5 )的5个通道、以及包括全方向(方 向模式6)的0.1通道。参照拍摄者和/或观众确定上述方向。方向模式1到6的每个具有在每个方向上的幅度(声音拾取水平(level ))。 因此,在下文中上述定向的方向按照该顺序被称为前(RFT)矢量、左前(FL) 矢量、右前(FR)矢量、左后(RL)矢量、右后(RR)矢量、以及低频(LF) 标量。这里,提供了 LF标量以获得在大约100 Hz或更低频率产生的低音的 厚重感。因为定向模式6的波长长,所以定向模式6几乎无方向并仅能够通 过其幅度测量。因此,定向模式6被有意当作标量。图19中显示了提供来再现从上述各方向获取的声音信号的示例环绕声 音再现设备。即,通过使用已知的能够环绕的系统拍摄的视频信号和声音信 号被同时再现,由此能够获得环绕声场。在上述环绕声场中执行的声音拾取 处理和/或声源产生处理,能够根据产生目的和/或制造者的技术秘诀 (know-how)以各种方式执行。然而,已经引入国际电信联盟(ITU) -R标 准作为5.1通道声场再现标准,使得再现扬声器以下述方式安排。即,最好
中心(RFT)方向被确定为0°、左前(FL)方向被确定为30。、右前(FR)方 向被确定为30°、左后(RL)方向被确定为从100°到120°、以及右后(RR)方 向被确定为从100。到120。。随后,对于上述再现声场,上述声音拾取处理和/ 或声源产生处理被经常执行。曰本未审查专利申请公开No. 2000-299842提出了 一种摄像机,其配置为 使用多个麦克风拾取从声场空间中的指定方向传输的声音信号,并使用多通 道声音系统记录和再现该声音信号。尤其是近年来,数字通用盘(DVD)使 能的设备已经变得广泛的可用,并且在5.1通道环绕声场等中再现声音信号 变得比以前更容易。因此,日本未审查专利申请公开No. 2000-299842中公开 的摄像机的市场份额增长,其中提供摄像机以允许用户通过使用多通道声音 系统记录和/或再现声音信号。然而,用户享受的多数通常的环绕声场与视频(如电影) 一起产生。因 此,在日本未审查专利申请公开No. 2006-25034中公开的创作处理通常由生 产者执行,以便根据视频有意插入有效的声音。因此,习惯于上述环绕声音 的用户不会对仅记录和/或再现从声场方向简单获得的多通道信号的摄像机 吃惊。发明内容然而,在日本未审查专利申请公开No. 2000-299842、以及日本未审查专 利申请公开No. 2006-25034中公开的技术具有下述问题。1. 因为每个通道的声音拾取方向在所有时间固定,所以从声音拾取方向 拾取的声音信号不是经常满足视频拍摄时的声场条件。例如,在被摄体是在 拍摄者前面的儿童、并且该儿童产生的语音(voice)是主要声源的情况下的 声场条件,与至少两个声源分布在宽的区域的情况(如主题公园的情况)下 的声场条件不同。在这种情况下,最好优化每个声音拾取方向。2. 由于基于例如使用摄像机等拾取声音的方向和/或通道的数量确定的记 录条件、与基于例如在再现时安排多个扬声器设备的位置决定的再现条件之 间的不同,出现声场不一致。3. 为普通放映的电影和/或DVD软件再现的环绕声效果,根据产生的视频 经受有效的创作编辑。即,为电影和/或DVD软件再现的大部分声音不在视 频拍摄地点获取。因此,在许多情况下,习惯于上述环绕声音效果的用户,
将不会满足于通过再现使用多个扬声器、通过多通道声音系统记录的声音信 号而简单获得的声音效果。因此,根据本发明的实施例,当在声音拾取操作中产生多通道信号用于获得上述环绕声音效果时,声音拾取处理被执行大于在对应于从1度到360度的圓周方向上的再现通道数量的次数,并且根据视频拍摄时的声场状态和 图像,根据意愿编辑拾取的声音上的数据。随后,能够获得有效的环绕声场。根据本发明的实施例的一种声音拾取设备包括输入单元,其配置为输 入多个声音信号;声音方向性(directivity)产生单元,其配置为从声音信号 产生圓周方向上多个声音定向的信号;扫描单元,其配置为以定向性方向的 顺序扫描并输出声音定向信号;以及矢量合成单元,其配置为选择至少一个 从扫描单元传输的特定放方向信号并合成特定方向,其中从矢量合成单元输 出的至少一个信号被处理为多个声音输出通道。根据本发明的另一实施例的声音拾取设备包括输入单元,其配置输入 与拍摄的视频信号有关的多个声音信号;声音方向性产生单元,其配置为从 各声音信号产生所有的圓周方向上多个声音定向信号;扫描单元,其配置为 以定向性方向的顺序扫描和输出声音定向信号;以及矢量合成单元,其配置 为选择至少一个从扫描单元传输的特定定向信号并合成特定方向,其中从矢 量合成单元输出的至少 一个信号被处理成为多个声音输出通道。根据本发明的另一实施例的声音拾取设备包括再现单元,其配置为再 现多个声音定向信号;扫描单元,其配置为以定向性方向顺序扫描和输出声 音定向信号;以及矢量合成单元,其配置为选择至少一个从扫描单元传输的 特定定向信号并合成特定方向,其中从矢量合成单元输出的至少一个信号被 处理成为多个声音输出通道。根据本发明的实施例,当在声音拾取操作中产生多通道信号以获得上述 环绕声音效果时,声音拾取处理被执行大于在对应于从1度到360度的圓周 方向上的再现通道数量的次数,并且根据拍摄时间的声场状态和图像,按照 预期编辑拾取的声音上的数据。随后,能够获得有效的环绕声场。本发明的实施例能够应用于声音信号与视频数据一起由摄像机等拾取并 记录的情况。本发明的实施例不仅能够在声音拾取操作和/或声音记录操作中执行,还 能够在其中从记录和再现设备中再现声音数据的操作中执行。在该情况中,
声音数据能够以对于再现条件最合适的方式再现。即,例如声音数据能够根 据扬声器安排方向再现。


图1显示根据本发明实施例的声音拾取设备的配置;图2A图示根据本发明实施例的声音定向特性;图2B图示根据本发明实施例的另一声音定向特性;图2C图示根据本发明实施例的另一声音定向特性;图2D图示根据本发明实施例的另一声音定向特性;图2E图示根据本发明的实施例的另一声音定向特性;图3A显示根据本发明实施例的麦克风安排的示例;图3B显示根据本发明实施例的麦克风安排的另 一示例;图3C显示根据本发明的实施例的麦克风安排的另一示例;图4A显示示例方向性产生设备;图4B是描述图4A中所示的方向性产生设备的图;图4C是描述图4A中所示的方向性产生设备的另一图;图5是描述本发明实施例的图;图6A显示另一示例方向性产生设备;图6B是描述图6A中所示方向性产生设备的图;图6C是描述图6A中所示方向性产生设备的另一图;图7显示示例定向流信号;图8是描述本发明实施例的图;图9是描述本发明实施例的图;图IO显示示例设备的配置,该设备配置为执行方向性产生处理和上采样 (up-sampling)处理;图11显示示例矢量合成部分的配置;图12是描述本发明实施例的图;图13A和图13B是描述本发明实施例的图;图14显示另一示例矢量合成部分的配置;图15是描述本发明实施例的图;图16显示另一示例矢量合成部分的配置; 图17是描述本发明实施例的图;图18显示图示示例环绕声音拾取处理的图;图19是显示示例环绕声音再现系统的图。
具体实施方式
在下文中,将参考附图描述根据本发明实施例的声音拾取设备和声音拾 取方法。为了描述图1中所示的上述声音拾取设备,在图2A、 2B、 2C、 2D以及 2E中显示和图示了在各种类型的麦克风单元中产生的极性(polar)模式。极 性模式是每个麦克风单元在所有圆周方向上的灵敏度水平,根据极性坐标显 示方法显示了灵敏度水平。在图2A、 2B、 2C、 2D和2E的每个中,摄像机 的拍摄方向被确定为0°,径向上的灵敏度水平被相对地确定,并且中心点被 确定为零灵敏度点。图2A显示在所有方向上具有相同水平的灵4丈度特性的非定向性(全方 向)。图2B显示经常使用以便在单个方向上提供方向性的一阶(first order) (单个)方向性。在该情况下,方向性被提供在0。方向上。图2C显示具有比一阶方向性的方向选择特性大的方向选择特性的二阶方向性。图2D和2E中的每个显示在预定方向和其相反方向具有最大灵每文度的双 向性(bidirectivity),并且显示了在卯。方向上的零灵敏度。图2D中显示的双 向性垂直于图2E中显示的双向性。此外,"+"特性与"-"特性相反,并且 "+"特性的信号相位和"-"特性的信号相位相互移动180。。然后,通过使 用单个麦克风单元和/或组合小量麦克风单元,能够产生上述方向特性。这里,将参考图3描述麦克风的示例安排。在该情况下,上述麦克风的 每个能够被内部地和/或外部地增加到包括摄像机、数字相机等的小设备,使 得实现麦克风安排。在图3A、 3B和3C中,非定向麦克风由符号O指示,双 向麦克风由符号。指示,其中双向麦克风具有在经度方向上的方向性,并且 单向麦克风由符号A指示,其中单向麦克风具有在锐角方向上的方向性。上 述麦克风安装在摄像机等的上表面上。在图3A、 3B和3C中,上述麦克风从 上方观察。首先,图3A显示非定向麦克风1以及双向麦克风1和2。图4A图示使 用非定向麦克风1和双向麦克风1和2的示例方向性产生设备1。对应于图 2A中所示的非定向性的非定向信号从输入端IO输入,其中非定向性信号由 非定向性麦克风1产生,对应于图2D中所示的双向性的双向-1信号从输入 端11输入,其中双向-1信号由双向麦克风1产生,并且对应于图2E中所示 的双向性的双向-2信号从输入端12输入,其中双向-2信号由双向麦克风2 产生。然后,双向-1信号经由水平可变部分14输入到加法平均合成部分16, 双向-2信号与双向-l信号的情况相同,经由水平可变部分15输入到加法平均 合成部分16,并且双向-l信号和双向-2信号都经过加法平均处理。在那时, 双向-1信号和双向-2信号中的每个在每个水平可变部分14和15乘以从输入 端13传输的旋转系数,其中旋转系数将在后面描述。随后,合成的双向信号 的方向轴能够在对应于从1度到360度的任意方向上旋转。图5显示产生的旋转系数的示例。这里,水平轴显示旋转角度伊并且垂 直轴显示系数值。图5中所示的实线指示正弦(Sin)系数Ks,双向-1信号 在水平可变部分14中乘以该系数,并且图5中所示的虚线指示余弦(Cos) 系数Kc ,双向-2信号在水平可变部分15中乘以该系数。当旋转角度伊是0°时, 系数是Ks = 0以及Kc = 1 ,使得只有双向-2信号输入到加法平均合成部分16。 当旋转角度^是45°时,水平比率是Ks = 0.7对Kc = 0.7,使得双向-1信号和 双向-2信号在加法平均合成部分16中相互相加并输出,如图4B中所示的双 向模式A。此外,当旋转角度是卯°时,只有双向-l信号输入到加法平均合成 部分16。此外,当旋转角度^是从卯。到1S0。时,余弦系数Kc变成负系数,双向-2 信号乘以该负系数。随后,双向-2信号被合成并且其正/负极性反转。当旋转 角度^是从180°到270°时,正弦系数Ks和余弦系数Kc变成负系数,双向-1 信号和双向-2信号乘以该负系数。随后,双向-1信号和双向-2信号被合成并 且其正/负极性反转。当旋转角度^是从270°到0°时,正弦系数Ks变成变成负 系数,双向-1信号乘以该负系数。随后,双向-1信号被合成并且其正/负极性 反转。随后,当图5中所示的旋转系数被连续和重复地传输时,双向模式连续 地旋转。此外,例如当从输入端IO输入的双向信号和非定向信号在加法平均 合成部分16中经受加法平均处理时,获得了下面的结果。即,根据图4B中 所示的双向模式A,由虚线指示的相位相反部分被抵消,由实线指示的相位
相同部分保留,并且产生了图4C中所示的单向模式。随后,与双向模式的旋转同步的单向信号从输出端17输出。在那时产生的方向性的运算表达式显示为等式(1 )。在等式(l)中,l表示图2A中所示的无方向性的特性,S/W表示图2D 中所示的双向性1的特性,以及Co^表示图2E中所示的双向性2的特性。如图3B中所示的情况,即使使用非定向麦克风l、 2、 3和4,方向性也 能够改变。即,当通过从非定向麦克风3减去非定向麦克风1调整频率幅度 特性时,产生了双向-l信号。当通过从非定向麦克风4减去非定向麦克风2 调整频率幅度特性时,产生了双向-2信号。此外,当单独使用非定向麦克风 1到4的任一和/或至少两个非定向麦克风1到4相互相加时,产生了非定向 信号。因此,如图4中的情况,方向性能够连续地改变。图6A图示示例方向性产生设备2,其使用单向麦克风1和2、以及图3C 中所示的双向麦克风l。首先,对应于图6B中所示的一阶定向模式F的一阶 定向F信号从输入端20输入, 一阶定向F信号由单向麦克风1产生。然后对 应于图6B中所示的一阶定向模式R的一阶定向R信号从输入端21输入,一 阶定向R信号由单向麦克风2产生。这里, 一阶定向模式F具有与图2B中所示的一阶(单个)方向性的特性相同的特性,而一阶定向模式R是具有面向1S0。方向的主轴的一阶定向模式。此外,图2D中所示的双向-1信号从输入端22输入,双向-l信号由双向麦克风1产生。然后,输入信号输入到水平可变部分24、 25和26,并且由于从输入端23输入的上述旋转系数Kc和Ks,水平可变部分24到26被控制到预定水平。此外,来自水平可变部分24到26的输出在加法和平均合成部分27中被合成,并从输出端28输出。在那时产生的方向性的运算表达显示为等式(2)。((l + Ic).(l + Ow60/2 + (l-尺c)-(1-Co,/2 + i:",/2 (2)在等式(2)中,(1 + 。,/2表示图6B中所示的一阶定向特性F,(1-c°^)/2 表示图6B中所示的一阶定向特性R,并且&^表示图6B所示的双向-1特性。即,当旋转角度^是0°时,系数是Ks-O对Kc: 1,使得只有一阶定向F 信号从水平可变部分24中输出并从输出端28输出。当旋转角度^是45°时, 水平比率是Ks = 0.7对Kc = 0.7,使得各信号由加法平均合成部分27相加, 并且在45°方向上产生单向性,如图6C中的实线所示。相似地,当旋转角度是卯°时,从一阶定向F信号和一阶定向R信号产生非定向信号。此外,当对 产生的非定向信号和双向信号执行加法和平均处理时,在卯°方向上产生单向性。此外,当旋转角度伊是从90°到180°时,通过作为负系数的余弦系数Kc执行合成,当旋转角度^是从1S0。到"0。时,通过作为负系数的正弦系数Ks和余弦系数Kc执行合成,并且当旋转角度^是从270°到0°时,通过作为负系数的正弦系数Ks执行合成。附带地,当旋转角度^是135°时,在135。方向上产生单向性,如图6C中的实线所示。因此,用旋转角度^合成的单向信号从输出端28输出。这里,在等式(2)中,(1 + 。^)/2表示单向麦克风1信号,以 及(1-C。W)/1表示单向麦克风2信号。此外,根据上述实施例使用了单向性,如图4A、 4B、 4C、 6A、 6B、和6C中所示。然而,方向性能够根据图2C中所示的二阶方向性改变。上述方向性的示例运算表达式示出为等式(3):<formula>formula see original document page 14</formula> ( 3 )在等式(3)中,1表示图2A中所示的非定向性的特性,S/W表示图2D 中所示的双向性1的特性,以及Co^表示图2E中所示的双向性2的特性。在该情况下,由于方向性的角度能够变窄,在稍后将描述的方向性扫描 处理期间每个定向信号的选择性增加。此外,由于图3A到3C的每个中所示的麦克风安排是示例,所以麦克风 安排能够改变而不脱离上述实施例的范围,只要各麦克风相对靠近。从所有圓周方向传输的多个定向信号可以逐个方向处理,各定向信号以 上述方式产生。然而,在该情况下,由于要处理的通道的数量增加,该处理 趋于变大和复杂。因此,根据本发明的实施例,定向信号中的每个被处理为 单个通道和/或少量通道的流信号。这里,将参考图7中所示的矩阵表描述定向流信号。首先,在水平轴上 显示的D—1、 D—2、 D_3、 D—4、 D_5、 D—6、 D—7、 D—8、 D—9、 D—a、 D一b、 以及D—c表示用打分割圓周获得的定向通道。此外,沿着图7中所示的矩阵 表的垂直轴所示的Ts—0、 Ts—1、 Ts—2、 Ts—3、 Ts—4、 Ts—5、 Ts_6等的每个, 是示例音频采样段(period )(1/Fs)。然后,当任意选择采样段Ts—0时,声音 信号以升序采样。即,D—1方向、D—2方向、D—3方向等显示为SigOl、 Sig02、 Sig03、 Sig04、 Sig05、 Sig06、 Sig07、 Sig08、 Sig09、 SigOa、 SigOb、和SigOc。 此外,当选择了下一采样段Ts—1时,声音信号显示为Sigll、 Sigl2、 Sigl3、 Sigl4、 Sigl5、 Sigl6、 Sigl7、 Sigl8、 Sigl9、 Sigla、 Siglb、和Siglc。此外,从上述方向传输的采样信号以Z字形方式扫描,当选择上述采样 段时获得釆样梧号,由此产生单声音流信号,如虚线指示的流信号A所示。 声音信号包括时基(time base)和具有方向的矢量分量的水平。上述配置由 图8中所示的提取的矢量数量显示。即,以上述方式产生的定向模式能够被 认为是在方向性中心方向上具有最大强度的矢量数量集合。如图7中所示, 当矢量数量集合在其主轴方向上被扫描时,对应于声音拾取水平的矢量数量 能够参考每个主轴方向获得。例如,如图8中所示,上述矢量数量能够在每 个音频采样段获得。根据上述实施例,但不限于上述扫描方法,各定向分量可以分成2组并 且以Z字形方式扫描,使得产生两个流信号,如同由实线指示的流信号B和 C的情况。此外,各定向分量可以分成至少3组。通常,当通过对音频釆样频率Fs执行扫描在1到m方向上产生定向信 号时,必需的流信号的采样段显示为1/ (m'Fs),如图9中所示。接下来,将描述根据上述实施例的声音拾取设备,该声音拾取设备在图 l中示出。例如,麦克风30、 31、 32和33是图3B中所示的非定向麦克风1 到4。从麦克风30到33传输的输出信号经由放大器(AMP) 34、 35、 36和 37,输入到图4A、 4B、 4C、 6A、 6B、和6C中所示的声音方向性产生部分 40,并且由于从系数产生部分39传输的旋转系数,产生了一组定向的方向上 的信号。然后,通过扫描处理产生定向流信号,该扫描处理在图7中示出并 由扫描处理部分41执行,并且该定向流信号输入到矢量合成部分42。此外,根据从时序产生部分38传输的上述采样段信息,系数产生部分 39、声音方向性产生部分40、扫描处理部分41以及矢量合成部分42相互同 步执行预定的处理,并且矢量合成部分42对定向流信号执行稍后将描述的处 理。随后,矢量方向上的数据,即,图18中所示的FRT矢量、FL矢量、FR 矢量、RL矢量、RR矢量以及LF标量上的数据,输入到在下一级中提供的 编码器处理部分43,作为FRT信号、FL信号、FR信号、RL信号、RR信号 以及LF信号。FL信号、FR信号、RL信号、RR信号以及LF信号经过符合 已知环绕系统的编码处理,并由记录和再现部分44 (如-见频盘)记录,作为
记录流信号。根据图1中所示的配置,从麦克风传输的音频信号和视频信号可以同时 记录。然而,因为视频信号记录并不直接涉及上述实施例的要点,所以将不 显示和描述视频信号记录。图10显示了声音方向性产生部分40的补充信息。根据上述实施例,执行上采样处理以便在单个音频采样段在多个方向上产生定向信号。执行上采样处理以增加采样速率。例如,上釆样处理可以在模拟到数字转换器(ADC) (未显示)中执行。然而,上述信号被上釆样到例如频率(m*Fs)。首先,在音频采样频率Fs采样的麦克风-l信号、麦克风-2信号、麦克风 3-信号以及麦克风-4信号,由上采样部分50再次采样到必须的采样频率 (m*Fs)。那时,产生了不必要的宽带分量并由在下一级中提供的内插滤波 器51移除,由此麦克风-l信号、麦克风-2信号、麦克风-3信号以及麦克风-4 信号被上采样,并且通过包括图4A中所示的方向性产生设备1、图6A中所 示的方向性产生设备2等的方向性产生处理部分52,产生了多个方向上的定 向信号。此外,图11图示图1中所示的矢量合成部分42。定向方向提取处理部 分60根据与分开输入的采样频率(m*Fs)同步的时序信号,从自前级中的 扫描处理部分41传输的定向流信号中,提取在后级中执行矢量合成处理必需 的定向信号。然后,提取的定向信号输入到方向性特定水平检测部分61和矢 量合成处理部分62,使得在预定的方向上产生矢量。这里,图12、 13A和13B的每个图示了图11中所示的矢量合成处理部 分62。根据上述实施例,能够在所有圓周方向上获得多个定向信号。因此, 根据声音拾取环境、产生被拾取的声音的被摄体、以及再现条件等,优化声 音拾取方向和声音拾取水平变为可能。上述技术与现有技术的不同在于能够 优化声音拾取方向和声音拾取水平而不固定声音拾取方向。首先,图11中所示的定向方向提取处理部分60,能够根据要求从多个 定向方向中提取任何单个方向。然而,根据上述实施例,矢量在来自多个定 向方向的预定方向上,皮合成。之前,如图18中所示,声音已经在固定方向上 拾取。在图12中,然而,矢量合成在涂黑的(blacked out)范围内、并在上 述FRT方向、FL方向、FR方向、RL方向以及RR方向的每个上执行。从定 向方向提取处理部分60中提取的多个定向信号的每个的水平,由方向性特定 水平检测部分61检测。矢量合成处理部分62例如基于对应于两个方向的定 向信号A和B,合成如图13A中所示的目标矢量(由实线显示),并基于对 应于3个方向的定向信号A、 B和C,合成如图13B中所示的另一目标矢量 (由实线显示)。此外,上述目标矢量表示例如在环绕再现期间使用的各通道的方向,并 且示例性地提供了图12中所示的提取方向和/或范围。例如,从相对大的范 围中提取了FRT信号,以便清楚地拾取包括小孩等的目标被摄体的语音。此 外,为了增加主题公园等的真实性,由FL方向和FR方向形成的角度被做的 更宽,使得每个方向上的提取范围增加。此外,在图11中,下采样(down-sampling)部分64通过将采样速率乘 以l/m,下采样产生的目标矢量信号,这是上采样处理的反转,使得再次获 得原始的采样频率Fs。那时,抽取滤波器63移除了不必要的伪分量。接下来,将参考图14描述与图11中所示的矢量合成部分42不同的第二 示例矢量合成部分。图14中与图11中相同的部分用相同的标号指示,并且 将不再提供其详细描述。即使不必对图11中所示的矢量合成部分42执行根 据上述实施例的扫描处理,也对例如图14中所示的第二示例矢量合成部分执 行扫描处理。如图11的情况,输入的定向流信号由定向方向提取处理部分60、方向 性特定水平检测部分61、以及矢量可变/合成处理部分72处理。这里,上述 部分60、 61和72具有与图11中所示部分的功能相同的功能。然而,定向流 信号输入到扫描信号水平检测部分73,这与图11中所述的情况不同。这里, 当以上述方式在旋转方向上扫描的定向流信号、与如以过去的方式从对每个 通道固定的方向拾取的多通道声音信号比较时,定向流信号的信息量比多通 道声音信号的信息量大,因为定向流信号包括扫描方向水平分量。然后,连续地估计上述流信号的水平值,由此能够获得如下前所未有的 效果。
1. 图8中所示的、对应于所有圓周方向的水平能够被检测和显示。
2. 通过计算微分值(梯度)能够获得关于水平改变率、水平最大方向、 水平最小方向等的信息,并且根据梯度和声源方向的改变能够掌握声源的移动。
3. 基于积分值(全部功率)和上述微分值能够估计周围的声场环境。例
如,变得可以估计全部功率相对大并且水平最大方向随机地存在于主题公 园中,全部功率小并且水平最小方向随机地存在于相对安静的环境中等。这里,将参考图15描述上述扫描信号水平检测部分73以及波形分析处 理部分74。水平轴指示离散的时基,并且根据上述实施例的扫描信号按逐个 方向顺序输入。垂直轴指示通过水平检测获得的绝对值水平( )。因此,扫 描信号水平检测部分73连续地;险测扫描信号水平,例如如图15中显示的虚 线所示。然后,在后级中提供的波形分析处理单元74中,水平值输出到水平显示 单元,使得对应于所有圓周方向的水平被显示,如同上述第一条。此外,当 水平值S (n)和S (n+l )被检测时,在任何给定时间,如等式(4)所示计在任何给定时间,上述AS接近由虚线所示的连续水平曲线的切线的梯 度,并且对应于在上述第二条中描述的微分值。因此,通过连续的评估AS能 够确定AS的值。即,当AS的值如所示的由+ 40 —-变化时,确定达到A5的 最大值。当AS的值如所示的由-~>0 — +变化时,确定达到AS的最小值。因此,立即确定对应于最大水平的最大值的方向和相反方向(即对应于最小水平的 最小值的方向)成为可能。此外,当对应于所有圓周方向的水平的值被相加 并且其积分值大时,能够确定环境的声音水平相对高,而当积分值小时,能 够确定环境安静。不同于AS值的评估值可以是最大值的波峰和最小值的波谷的大小和陡 度、在预定时间段内波峰和波谷的出现频率等。此外,关于最大值的波峰和 最小值的波谷的大小和陡度、在预定时间段内波峰和波谷的出现频率的信息, 从波形分析处理部分74输出到水平显示单元,以便检测和显示各水平,如上 述第一条中所述。在接收上述信息时,波形分析处理部分74输出关于可变系数的数据,该 可变系数由在后级中提供的矢量可变/合成处理部分72使用,以便执行矢量 可变处理。然后,执行例如下述矢量可变处理。l.图8中所示的所有圓周方向的图形显示图像中显示的中心声音拾取位 置(拍摄者位置),能够任意移动(panpod功能),并且水平平衡来回以及从 一侧到另一侧地调整。随后,声音拾取处理和拍摄能够用最优的水平平衡执 行。2. 当最大水平方向经常出现在拍摄方向上并且总体声音水平相对高时,能够确定拍摄者前面的被摄体产生声音。因此,拾取FRT信号、FL信号和 FR信号的水平增加,以便使得声音更加强。3. 当最大水平方向不出现在固定方向上时,即当最大水平方向随机存在 时,能够确定对分布在包括风景(landscape )、主题公园等的宽广区域中的被 摄体执行拍摄。因此,考虑到传播和连接的自然感觉增加了矢量合成区域, 使得声音在所有方向上均匀地拾取。用户可以通过在拍摄时选择模式任意地执行上述处理。然而,从波形分 析处理部分74传输的可变系数数据可以根据需要自动地产生,使得矢量可变 /合成处理部分72被控制。此外,上述实施例不仅能够用于上述环绕输出,还能用于已知的立体声 -2通道输出,如图16中显示的第三示例矢量合成部分中所示。图16中显示 的与图11和14中显示的那些相同的部分被指定相同的标号,并且将不提供 其详细描述。即,如图14的情况,定向方向提取处理部分60从传输的定向流信号中, 提取对应于所有圆周方向的信号,并且方向性特定水平检测部分61检测每个 定向信号的绝对值水平。此外,在下行混合处理部分82中,根据需要合成例 如包括在图17中所示的左通道侧矢量合成范围(涂黑的)、以及右通道侧矢 量合成范围(涂黑的)中的多个定向信号,如同图13A和13B中所示的示例 矢量合成的情形一样合成。那时,包括在合成范围中的所有信号可以被合成, 使得各矢量被恒定地合成并输出。然而,图14中所示的扫描信号水平检测部 分73和波形分析处理部分74可以评估定向流信号,并且后面的处理过程可 以基于评估结果执行,使得上述矢量合成的水平能够被改变。1 .对应于最大水平方向的信号在所有时间输出而不固定这样的方向,在 该方向上矢量在左通道侧矢量合成范围和右通道侧矢量合成范围的每个内合 成,或者增加对应于最大水平方向的信号的水平,使得各矢量被合成。2.如果总体(general)声音功率低,则增加矢量合成范围使得声音拾取范 围增加。相反,当声音功率高时,降低矢量合成范围使得声音拾取水平被均 衡。随后,如果声音功率高和/或最大水平方向能够清楚地识别,则只强调声
音。如果声音功率低和/或最大水平方向不存在,则能够在宽范围上执行矢量 合成。因此,声音清晰度和真实感都能够获得。此外,上述实施例不仅可以在声音拾取操作和/或记录操作中执行,还可 以在上述定向流信号和时序信号被记录到记录和再现设备上、并被再现的操 作中执行。根据上述实施例,当在声音拾取操作中为上述环绕输出产生多通道信号时,将声音拾取处理执行比在对应于从1度到360度的所有圓周方向上的再 现通道的数量大的次数,并且根据拍摄时的声场状态和图像,根据意愿编辑 关于拾取的声音的数据。随后,能够获得有效的环绕声场。根据上述实施例,减少数量的麦克风能够紧密地安排。因此,麦克风能 够安装在小的设备上。根据上述实施例,由于给定的旋转系数,从被安排和固定的麦克风输出 的信号连续地产生对应于所有圓周方向的定向信号变得容易。根据上述实施例,在旋转方向上沿着整个圓周重复地执行扫描。随后, 如同雷达检测器所做的,获得关于声音的环境成为可能,并且声音拾取条件 能够根据关于环境的数据被最优化。根据上述实施例,在预定范围上、在用于环绕系统的各再现通道的方向 上重复地执行扫描,并且基于关于扫描结果的信息合成矢量。因此,在声音 拾取操作中的声场和在再现时的声场之间的不一致,变得没有按照以往的方 式、从固定方向拾取声音时出现的不一致显著。根据上述实施例,从多个方向获得的声音拾取信号被合成为需要的声音 通道方向上的矢量,以基于声音拾取方向和声音拾取水平实现环绕再现系统。 即,在上述实施例中所用的声音拾取方法,与从单个方向拾取声音的已知现场(spot)声音拾取方法不同。因此根据上述实施例的声音拾取系统几乎不受在数据再现时安排扬声器的方式影响。根据上述实施例,基于通过在所有圓周方向上执行的扫描处理获得的水 平改变信息,根据环境的改变能够优化矢量合成的细节。关于环境中的上述改变的细节可以是声源(如人)位于拍摄者前面,声源分布在宽的区域内 如主题公园的情况,由拍摄者产生的声音(叙述声)来自后面等。根据上述实施例,计算通过在所有圓周方向上执行扫描处理获得的水平 改变的微分值(梯度和变化率)、以及积分值(面积和功率),使得能够确定 声源存在的方向、声源的移动以及声音功率。根据上述实施例,方向性被合成为基于微分值和积分值确定的声源方向 上的矢量。随后,由声源产生的声音能够被清楚地拾取。上述实施例能够用于声音信号被拾取、并与摄像机等捕获的视频数据一 起记录的情况。上述实施例不仅能够在声音拾取操作中和/或声音记录时执行,还能够在 从记录和再现设备(没有显示)中再现声音数据时使用。在该情况下,声音 数据能够对于再现条件以最合适的方式再现。即,声音数据能够根据扬声器 安排方向再现。本领域的技术人员应该理解的是,依赖于设计要求和其他因素,可以出 现各种修改、组合、子组合和替换,只要它们在权利要求及其等效的范围内。 相关申请的交叉引用本发明包括涉及2006年8月21日向日本专利局提交的日本专利申请JP 2006-224526的主题,在此通过引用并入其全部内容。
权利要求
1、一种声音拾取设备,包括输入装置,其配置为输入多个声音信号;声音方向性产生装置,其配置为从所述声音信号产生所有圆周方向上的多个声音定向信号;扫描装置,其配置为以方向性方向的顺序扫描并输出所述声音定向信号;以及矢量合成装置,其配置为选择从所述扫描装置传输的至少一个指定方向信号,并合成指定方向,其中从所述矢量合成装置输出的至少一个信号被处理成为多个声音输出通道。
2、 如权利要求1所述的声音拾取设备,其中所述输入装置包括 在预定方向上具有双向方向性的第一双向麦克风; 在垂直于预定方向的方向上具有另一双向方向性的第二双向麦克风;以及不具有方向性的非定向麦克风。
3、 如权利要求1所述的声音拾取设备,其中所述输入装置包括4个不具有方向性的非定向麦克风,所述非定向麦克风提供在四边形的各顶点上,其 中在相互相对的两个顶点之间建立链接的直线,垂直于在另两个顶点之间建 立链接的直线。
4、 如权利要求1所述的声音拾取设备,其中所述输入装置包括 在预定方向上具有方向性的第一定向麦克风; 在与所述预定方向相反的方向上具有另一方向性的第二定向麦克风;以及在垂直于所述预定方向的方向上具有双向方向性的双向麦克风。
5、 如权利要求l所述的声音拾取设备,其中所述声音方向性产生装置包括加法和合成单元,其配置为相加并合成从第一双向麦克风、第二双向麦 克风以及非定向麦克风传输的输出信号,输出信号从根据权利要求2的所述 输入装置传输;以及加法和合成单元水平调整装置,其配置为根据声音方向性产生方向调整 和输出所述加法和合成单元的水平。
6、 如权利要求1所述的声音拾取设备,其中所述声音方向性产生装置包括加法装置,其配置为通过相加4个非定向麦克风的输出信号中的至少两个任意输出信号产生非定向信号,所述输出信号从根据权利要求3的所述输 入装置传输;减法装置,其配置为通过在4个非定向麦克风的输出信号中的相互相对的输出信号之间执行减法,产生两个双向信号;加法和合成单元,其配置为相加并合成非定向信号和双向信号;以及 加法和合成单元水平调整装置,其配置为根据声音方向性产生方向调整并输出加法和合成单元的水平。
7、 如权利要求1所述的声音拾取设备,其中声音方向性产生装置包括 加法和合成单元,其配置为相加并合成第一和第二定向麦克风、以及双向麦克风的输出信号,所述输出信号从根据权利要求4的输入装置传输;以 及加法和合成单元水平调整装置,其配置为根据声音方向性产生方向调整 并输出加法和合成单元的水平。
8、 如权利要求1所述的声音拾取设备,其中所述扫描装置通过在预定的 旋转方向上连续地旋转执行扫描。
9、 如权利要求1所述的声音拾取设备,其中所述扫描装置对于每个声音 输出通道在预定方向范围上连续地执行扫描。
10、 如权利要求1所述的声音拾取设备,其中所述矢量合成装置包括方 向性方向水平检测装置,其配置为检测每个方向性方向的水平值,并为每个 声音输出通道,在每个声音输出通道的目标方向上,基于从方向性方向水平 检测装置传输的水平信息和方向性中心方向,在预定方向范围上合成矢量。
11、 如权利要求1所述的声音拾取设备,其中矢量合成装置包括 方向性方向水平检测装置,其配置为检测对应于每个方向性方向的水平值;扫描方向水平检测装置,其配置为连续地检测对应于扫描方向的水平值; 分析装置,其配置为分析关于水平变化的数据,所述水平变化数据从扫 描方向水平检测装置传输;以及参数可变装置,其被提供来在矢量合成时间期间改变参数,其中所述矢量合成装置为每个声音输出通道,在每个声音输出通道的目标方向上,基于从方向性方向水平检测装置传输的水平信息和方向性中心方向,在使用参数可变装置改变参数时合成矢量。
12、 如权利要求11所述的声音拾取设备,其中所述分析装置分析时间到 水平函数的微分值和/或积分值。
13、 如权利要求11所述的声音拾取设备,其中所述参数可变装置改变作为参数的矢量提取方向范围和/或每个矢量水平。
14、 一种声音拾取设备,包括输入装置,其配置为输入多个与拍摄的视频信号有关的声音信号; 声音方向性产生装置,其配置为从所述声音信号产生所有圆周方向上的 多个声音定向信号;扫描装置,其配置为以方向性方向的顺序扫描并输出所述声音定向信号;以及矢量合成装置,其配置为选择从所述扫描装置传输的至少一个指定方向 信号,并合成指定方向,其中从所述矢量合成装置输出的至少 一个信号被处理成为多个声音输出 通道。
15、 一种声音拾取设备,包括 再现装置,其配置为再现多个声音定向信号; 扫描装置,其配置为以方向性方向的顺序扫描并输出所述声音定向信号;以及矢量合成装置,其配置为选择从所述扫描装置传输的至少一个指定方向 信号,并合成指定方向,其中从所述矢量合成装置输出的至少一个信号被处理成为多个声音输出 通道。
16、 一种声音拾取方法,包括以下步骤输入多个声音信号;从所述声音信号产生所有圆周方向上的多个声音定向信号; 以方向性方向的顺序扫描并输出所述声音定向信号;以及 选择通过所述扫描步骤获得的至少一个指定方向信号,并合成多个指定 方向作为各矢量,其中通过所述矢量合成步骤获得的至少一个输出信号被处理成为多个声 音输出通道。
17、 一种声音拾取方法,包括以下步骤 输入多个与拍摄的视频信号有关的声音信号;从所述声音信号产生所有圓周方向上的多个声音定向信号; 以方向性方向的顺序扫描并输出所述声音定向信号;以及 选择通过所述扫描步骤获得的至少一个指定方向信号,并合成指定方向 作为矢量,其中通过所述矢量合成步骤获得的至少一个输出信号被处理成为多个声 音输出通道。
18、 一种声音拾取方法,包括以下步骤 再现多个声音定向信号;以方向性方向的顺序扫描并输出所述声音定向信号;以及 选择通过扫描步骤获得的至少一个指定方向信号,并合成指定方向作为 各矢量,其中通过所述矢量合成步骤获得的至少一个信号被处理成为多个声音输出通道。
19、 一种声音拾取设备,包括 输入单元,其配置为输入多个声音信号;声音方向性产生单元,其配置为从所述声音信号产生所有圓周方向上的 多个声音定向信号;扫描单元,其配置为以方向性方向的顺序扫描并输出所述声音定向信号;以及矢量合成单元,其配置为选择从所述扫描单元传输的至少一个指定方向 定向信号,并合成指定方向,其中从所述矢量合成单元输出的至少 一个输出信号被处理成为多个声音 输出通道。
20、 一种声音拾取设备,包括输入单元,其配置为输入多个与拍摄的视频信号有关的声音信号; 声音方向性产生单元,其配置为从所述声音信号中产生所有圓周方向上的多个声音定向信号;扫描单元,其配置为以方向性方向的顺序扫描并输出所述声音定向信号;以及矢量合成单元,其配置为选择从所述扫描单元传输的至少一个指定方向 信号,并合成指定方向,其中所述矢量合成单元输出的.至少一个信号被处理为多个声音输出通道。
21、 一种声音拾取设备,包括再现单元,其配置为再现多个声音定向信号;扫描单元,其配置为以方向性方向顺序扫描并输出声音定向信号;以及 矢量合成单元,其配置为选择从所述扫描单元传输的至少一个指定方向信号,并合成指定方向,其中从所述矢量合成单元输出的至少一个信号被处理成为多个声音输出通道。
全文摘要
一种声音拾取设备,包括输入单元,其配置为输入多个声音信号;声音方向性产生单元,其配置为从所述声音信号产生所有圆周方向上的多个声音定向信号;扫描单元,其配置为以方向性方向的顺序扫描并输出所述声音定向信号;以及矢量合成单元,其配置为选择从所述扫描单元传输的至少一个指定方向定向信号,并合成指定方向。从所述矢量合成单元输出的至少一个信号被处理成为多个声音输出通道。
文档编号H04N5/225GK101163204SQ20071019299
公开日2008年4月16日 申请日期2007年8月21日 优先权日2006年8月21日
发明者小泽一彦 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1