声响监视系统及声音集音系统的制作方法

文档序号:7761197阅读:192来源:国知局
专利名称:声响监视系统及声音集音系统的制作方法
技术领域
本发明涉及声响监视系统,特别涉及在多个机器动作的环境中、在声响上识别机 器的异常动作的声响监视、声音集音技术。
背景技术
到目前为止,以工厂内的机械的异响监视、室内的异常监视为目的,使用基于照相 机图像及声响信息的监视系统。在该系统中,预先设定监视对象,仅能够监视该监视对象 (例如参照专利文献1)。但是,今后对于安心-安全的社会需求正在提高,要求更有包罗性 的声响监视系统、声音集音系统。
[专利文献1]特开2005-3^410号公报
在以往的监视系统中,对监视对象的波谱构造的变化进行监视等来判断是否异 常,但在存在许多监视对象以外的音源的环境中,有因为噪声的问题而监视精度劣化的问 题。此外,在工厂等许多机器动作的环境中,需要能够简单地进行初期设定的监视系统。发明内容
本发明的目的是提供一种在工厂等的多个机器动作的环境中、能够在声响上识别 该机器的异常动作的声响监视系统、声音集音系统。
为了达到上述目的,在本发明中,提供一种声响监视系统,是具备具有多个麦克风 的麦克风阵列和处理部的声响监视系统,处理部根据来自麦克风阵列的输入信号检测音源 方向的直方图的时间变化,基于该变化检测结果判断在音场中是否发生了异常。
此外,为了达到上述目的,在本发明中,提供一种声响监视系统,是具备具有多个 麦克风的麦克风阵列、处理部和存储部的声响监视系统,存储部存储关于麦克风的数据;处 理部基于关于麦克风的数据,搜索存在于监视对象的音源附近的麦克风阵列;基于搜索到 的麦克风阵列的关于麦克风的数据,选择监视对象的音源的音场监视功能。
进而,为了达到上述目的,在本发明中,提供一种声音集音系统,是具备具有多个 麦克风的麦克风阵列和处理部的声音集音系统,处理部根据来自麦克风阵列的输入信号生 成各音源的直方图,基于生成的直方图的离差进行音源的朝向检测。
即,在本发明中,通过音源方向的直方图的变化检测功能,在存在多个音源的环境 中能够高精度地提取声响的变化。进而,通过按照监视对象、使用最近的麦克风阵列、根据 麦克风阵列的指向特性及麦克风配置的信息自动地选择适当的音场监视功能,能够高效率 地处理声响信息。
根据本发明的结构,能够提供一种即使是存在多个音源的环境也能够进行监视的 维护监视系统。此外,在大规模的工厂设施中,能够自动地选择音场监视功能,作业效率提高。


图1是表示有关第1实施例的声响监视系统的硬件整体的结构的图。
图2是表示有关第1实施例的系统的各据点的硬件结构的图。
图3是表示有关第1实施例的、工厂内的硬件配置例的图。
图4是表示第1实施例的中央服务器中的软件功能块结构的图。
图5是表示第1实施例的中央服务器中的异响监视处理的软件块结构的图。
图6是表示第1实施例的异响监视功能的选择处理流程的图。
图7是表示第1实施例的异响监视功能的处理流程的图。
图8是示意地表示第1实施例的、通过音源方向直方图的变化提取进行的异常判 断例的图。
图9是表示有关第1实施例的、具有音源方向推测处理的异响检测的块结构的图。
图10是表示有关第1实施例的、不具有音源方向推测处理的异响检测的块结构的 图。
图11是表示有关第1实施例的作为麦克风数据库的麦克风属性信息表的一结构 的图。
图12是表示有关第1实施例的作为AD变换装置数据库的AD变换装置属性信息 表的一结构的图。
图13是表示有关第1实施例的、异常发现画面的⑶I的一结构例的图。
图14是表示有关第1实施例的、基于音源直方图的熵的异常变化提取的块结构的 图。
图15是表示有关第1实施例的、各音源直方图生成的块结构的图。
图16是表示有关第1实施例的、阵列横截特征量提取的块结构的图。
图17是表示有关第1实施例的、变化检测的块结构的图。
图18是表示有关第1实施例的、音源朝向检测的块结构的图。
图19是表示有关第1实施例的、音源方向检测、音源朝向检测的处理流程的一例 的图。
图20是用来说明有关第2实施例的、将音源朝向检测用在视频会议系统中的情况 的图。
图21是用来说明有关第3实施例的、将音源朝向检测用在会议声音录音中的情况 的图。
图22是表示有关第2实施例的、将音源朝向检测用在视频会议系统中的硬件结构 的一例的图。
图23是表示有关第2实施例的、将音源朝向检测用在视频会议系统中的使用顺序 的示意图。
具体实施方式
以下,安装

本发明的具体的实施方式。另外,在本说明书中,有将“机构” 称作“功能”、“部”或“程序”的情况。例如,将“音场监视机构”表现为“音场监视功能”、“音 场监视部”或“音场监视程序”。
[实施例1]
在图1中表示有关第1实施例的维护-监视系统的整体结构。作为通过由植入在工厂等的环境内的N个具有多个麦克风元件的麦克风阵列101-1 N构成的输入部取入的 输入信号的声响信息被作为信号处理部的计算装置102-1 N实施数字信号处理,提取异 常信息。将提取出的异常信息发送给中央服务器103,在中央服务器103中将各麦克风阵 列101-1 N提取的异常信息综合地处理(异常信息提取处理)之后,对各监视员阅览的 作为显示部的监视画面104-1 S (S是监视画面的数量)发送信息。在计算装置102-1 N中,将由各据点的麦克风阵列101-1 N取入的模拟的声压值变换为数字信号之后,实施 数字信号处理。
在图2中将计算装置102-1 N及中央服务器103的具体的硬件结构表示为201、 206。它们基本上具有与具备作为通常的处理部的中央运算装置(Central Processing Unit =CPU)和作为存储部的存储器的计算机同样的结构。在各计算装置201中,将输入的 多个通道的模拟的声压值用多通道AD变换机202变换为多通道的数字声音波形。中央运 算装置203将变换后的数字声音波形发送给中央服务器206。也可以将在中央服务器206 中进行的上述异常信息提取处理由作为计算装置201的处理部的中央运算装置203进行。 所以,需要注意在本说明书中有将计算装置102-1 N及中央服务器103的中央运算装置 (CPU)统称作处理部的情况。
中央运算装置203执行的各种程序存储在非易失性存储器205中,在执行时被读 出、展开到易失性存储器204中。在程序执行时,在易失性存储器204上确保需要的工作存 储器。此外,在中央服务器206中,也由作为处理部的中央运算装置207执行各种程序。中 央运算装置207执行的各种程序存储在非易失性存储器209中,在执行时被读出、展开到易 失性存储器208。,在易失性存储器204上确保需要的工作存储器。中央服务器206的中央 运算装置207或计算装置201的中央运算装置203进行的信号处理根据收录有处理的模拟 声压值的麦克风阵列设在进行维护-监视的环境内的哪里、以及根据该收录信息维护-监 视哪个机器的哪个范围而处理不同。
图1及图2为1个计算装置与1个麦克风阵列一一对应的结构,但并不需要限定 为一一对应,也可以采取将两个以上的麦克风阵列的信息用一个计算装置处理的结构。进 而,通过一个AD变换装置处理两个以上的麦克风阵列的信息,能够将这些麦克风阵列的信 息同步处理。因为这样,所以也可以采取一个AD变换装置处理两个以上的麦克风阵列的信 息的结构。此外,也可以通过采取将1个麦克风阵列的信息用多个计算装置处理的结构、来 应对处理量不能用一个计算装置处理完的情况。
在图3中表示在本实施例中、麦克风阵列的具体的设置例以及根据与机器设备 的相对的位置关系而由中央运算装置进行的处理不同的例子。对应于图1的麦克风阵列 101-1 N的麦克风阵列301-1 8散布配置在环境内的各种各样的位置上,监视机器设备 302-1 4的动作。这里,在监视机器设备302-1的目的下,使用麦克风阵列301-7或麦克 风阵列301-4并不能说是适当的。这是因为,机器设备302-3及机器设备302-4发出的声 响信息混入到这些作为声响信息输入部的麦克风阵列中,难以将机器设备302-1的声音用 较高的SNR(Signal Noise Ratio 想要听到的声音与噪声的比率)收录。在此情况下,考 虑使用麦克风阵列301-1、麦克风阵列301-2、或麦克风阵列301-6是适当的。既可以将这 些麦克风阵列全部用于机器设备302-1的声响监视,也可以将这些麦克风阵列中的最近的 麦克风阵列用于机器设备302-1的声响监视。此外,在想要监视机器设备302-1的某个特定的部位的声响信息的情况下,也可以采取在连结机器设备302-1与麦克风阵列的直线上 存在遮蔽物(例如机器设备302-1自身)的情况下、即使这样的麦克风阵列是最近麦克风 阵列也不使用的结构。
图4是表示在本实施例的中央服务器206内的处理部中执行的、按照监视对象机 器选择监视方法的程序的软件块结构的图。监视对象选择部401提供监视员或监视据点的 监视负责人选择监视对象的机器设备的机构。例如,既可以采取使用一般的计算机的图形 用户接口(GUI)将监视据点的俯视图显示在作为显示部的显示器上、使用户通过鼠标点击 等的操作指定监视对象机器设备的结构,也可以采取从将监视对象的机器设备列表化的列 表框之中选择监视对象的机器设备的结构。监视对象选择部401进行动作,以使其根据这 些通过使用GUI的方法选择的监视对象的机器设备得到作为监视对象地点的、监视环境内 的监视对象的相对的坐标。
麦克风阵列选择部402将由监视对象选择部401得到的监视对象的相对的坐标 (监视对象地点)与事前登录的麦克风阵列数据库比较,进行动作以选择用于监视的麦克 风阵列。监视方法选择部403基于所选择的麦克风阵列的配置场所及指向特性等进行动作 以选择适当的音场监视功能。
并且,既可以采取在从各麦克风阵列302-1 8对中央服务器206发送了声响信 息之后将所选择的音场监视机构在中央服务器206内执行的结构,也可以是基于所选择的 音场监视机构、对处理各麦克风阵列的数据的计算装置201发送关于音场监视机构的信 息、在各计算装置上的处理部中能够执行音场监视机构。在此情况下,需要仅在各计算装置 使用的麦克风阵列中能够执行在该计算装置上展开的音场监视机构。即,在需要利用其他 计算装置具有的麦克风阵列的信息的情况下,该音场监视机构优选的是通过中央服务器的 处理部执行。另一方面,在音场监视机构仅使用特定的计算装置处理的麦克风阵列数据监 视的情况下,通过采取在该计算装置内执行音场监视机构、仅将监视结果发送给中央服务 器的结构,能够减少对中央服务器发送信息时的网络代价,所以是优选的。
事前登录的麦克风阵列数据库假设至少记录有用来唯一识别该麦克风阵列的麦 克风识别码(ID)及监视对象的监视环境内的相对的坐标值、构成麦克风阵列的麦克风的 指向性的有无、以及麦克风阵列连接的作为操控台的AD变换装置的识别码(ID)、以及在该 AD变换装置中连接着麦克风阵列的通道号码的属性。另外,该表记录在构成中央服务器 206的存储部的易失性存储器208或非易失性存储器209上。
在图11中表示本实施例的麦克风阵列数据库(DB)、即麦克风属性信息表的一例。 1101 1105分别表示上述麦克风ID、坐标值、指向性、AD变换装置、通道列。在麦克风阵列 由单体的麦克风构成的情况下,在“通道”列1105中记录该麦克风连接的AD变换装置202 的通道号码。此外,在麦克风阵列由多个麦克风构成的情况下,在“通道”列1105中记录这 些麦克风阵列连接的通道号码列。此外,各个麦克风阵列连接的AD变换装置并不一定需要 是相同的AD变换装置。
同样,假设预先将各个AD变换装置的特性存储在数据库(DB)中。假设AD变换装 置的数据库至少具有用来唯一识别该AD变换装置的AD变换装置ID、该AD变换装置连接的 PC的IP地址、以及表示该AD变换装置的各通道是否时间同步的“同步”的3个属性。此 外,也可以为了取得该AD变换装置的数据而将程序的端口号码作为属性保持。
在图12中表示作为该AD变换装置的数据库的AD变换装置属性信息表的一例。在 该图中,1201 1203分别表示上述AD变换装置ID、该AD变换装置连接的PC的IP地址、 以及表示该AD变换装置的各通道是否时间同步的“同步”的3个属性。关于是否时间同步, 只要通道间的同步偏差和AD变换机的采样周期的比率是预先设定的阈值以下就可以。另 外,该表也存储在中央服务器206的存储部中。
图5是表示在第1实施例中、由各据点的计算装置进行各音场监视机构的声音取 入、在中央服务器内处理经由网络发送给中央服务器的声音数据时的软件块的图。由对应 于麦克风阵列101-1 N的麦克风阵列501-1 N取入的各麦克风阵列的声压值被在各计 算装置内(各据点)中动作的波形取入部502-1 N处理,经由网络503被发送给对应于 103,206的中央服务器。在中央服务器中,作为该中央运算装置207的程序执行的各据点异 响监视部504将按照据点取入的波形处理,进行异常状态的检测处理。然后,将监视结果朝 向对应于104-1 S的各监视画面发送。
图6是表示作为由中央服务器执行的程序的、图4所示的麦克风阵列选择部402 及监视方法选择部403中的具体的处理流程的图。如上所述,监视对象选择部401根据给 出的监视对象设备确定监视对象地点。这里,假设监视对象地点用该监视环境内的局部坐 标系表示为(XI,Yl, Z1)。在附近麦克风搜索601中,按照N个麦克风阵列,计算与监视对 象地点的距离。这里,假设(Xi,Yi,Zi) (i是用来识别麦克风阵列的索引)是各麦克风阵列 的中心坐标系。它是能够根据上述麦克风阵列数据库的坐标值1102取得的信息。
距离计算基于3维欧几里得距离di = (Χ1-Χυ~2+(Υ1-Υ Γ2+(Ζ1-Ζυ~2进行。既 可以将di为最小那样的麦克风阵列选择为近傍麦克风阵列,也可以选择多个di为预先设 定的阈值以下那样的麦克风阵列。这里,表示将di为最小那样的麦克风阵列作为附近麦克 风阵列的情况下的处理流程。关于使用多个麦克风阵列的情况下的音场监视机构在后面叙 述。此外,假设构成麦克风阵列的麦克风数为两个元件。对于3个元件以上的情况在后面 叙述。
进行图6的AD同步检查的AD同步检查602在参照图12所示的AD变换装置数据 库之后,确认用来收录所选择的麦克风阵列的AD变换装置在通道间是否能取得同步。在通 道间能取得同步的情况下,能够进行基于相位差的高解析度的音源方向推测。此外,在不能 取得同步的情况下,不能执行基于相位差的音源方向推测。在此情况下,确认构成麦克风阵 列的麦克风的音量比率是否是预先已知的,在音量比率是已知的情况下,执行使用振幅比 率等的低解析度的音源方向推测。在音量比率是未知的情况下,选择不进行音源方向推测 的音场监视机构。
所以,将麦克风间的音量比率在DB搜索603中搜索两个麦克风间的感度比率是否 记录在DB内。在预先测量了两个麦克风间的感度比率的情况下,将其数据库化并保存到中 央服务器206的非易失性存储器209中。在检查是否存在于DB内604中,在麦克风间的音 量比率已储存在DB内的情况下,选择音场监视机构,以使其进行基于该音量比率的音源定 位(613)。
以下对基于该音量比率的音源定位进行说明。设相同声压水平的信号被输入到构 成麦克风阵列的麦克风1、2中时的、麦克风1的声压水平为Pl [dB]、麦克风2的声压水平为 P2[dB]。设输入信号的麦克风1的声压水平为Xl[dB]、设麦克风2的声压水平为X2[dB]。此时,Nl = Xl-PU N2 = X2-P2分别是标准化后的声压水平。在该标准化后的声压水平的 差(m-N2)是预先设定的阈值Thl以上的情况下,将此时的音源位置判断为接近于麦克风 1的位置。反之,在差(m-N2)是预先设定的阈值Th2以下的情况下,将该音源位置判断为 接近于麦克风2的位置。关于这以外的情形,将音源位置判断为麦克风1与麦克风2的中 间。另外,也可以对输入信号实施基于一般的傅里叶变换的短时间频率分解,按照时间-频 率成分进行这样的判断。根据各判断结果,按照“判断为接近于麦克风1的情形”、“判断为 接近于麦克风2的情形”、“判断为麦克风1与麦克风2的中间的情形”的3个情形生成直方 图。基于该直方图进行异响发生的监视。
另一方面,在是否存在于DB内604中,在麦克风间的音量比率没有储存在DB内的 情况下,选择不进行制作直方图的操作的音场监视机构(614)。关于该情况下的音场监视机 构在后面叙述。。
在图6的AD同步检查602中,在判断为AD变换装置同步的情况下,通过指向性有 无的确认605判断构成使用的麦克风阵列的麦克风是指向性还是无指向性。这可以通过参 照图11的麦克风阵列数据库的指向性1103来执行。在判断为指向性的情况下,接着确认 该麦克风阵列的各虚拟音源方向的导向矢量是否已预先得到(导向矢量搜索607)。在将麦 克风阵列的脉冲应答预先收录等、预先能够得到各音源方向(例如,从麦克风阵列观察为 正面、侧方、后方等)的麦克风间相位差的情况下,只要根据得到的信息生成导向矢量、储 存到中央服务器206内的非易失性存储器209中就可以。导向矢量搜索607中的是否存在 于DB内的检查608通过导向矢量是否存在于存储器中而将处理分支。在存在于DB内的情 况下(yes),进行使用导向矢量的音源方向推测(609)。这里,将xm(f,τ)假设为第m个麦 克风的频率f、帧τ的信号。它通过对第m个麦克风信号实施短时间傅里叶变换而能够取 得。将在要素中具有各麦克风的信号的矢量用式1定义。
式 1
x(f, τ) = [Xl (f, x)x2(f, τ)]Τ ......式 1
此外,将音源方向ρ的导向矢量用式2定义。
式2
ap(f) = [ai(f)exp(jTpa(f)) a2(f)exp(jTPj2(f))]T ......式 2
这里,设Tp、m(f)为声音从音源传递到麦克风m时的延迟时间,am(f)为声音从 音源传递到麦克风m时的衰减率。延迟时间及衰减率可以通过预先测量来自各音源方向的 脉冲应答来求出。此外,将导向矢量a(f)标准化为a(f) =a(f)/|a(f)以使其大小成为 1来使用。
使用导向矢量的各时间-频率的音源方向的推测基于式3进行。
式3
Pmin = arS max Iap(f)*x(f, τ) \ 2……式 3P
设Riiin为表示推测出的音源方向的索引。输入信号与导向矢量的内积最大的方 向为该时间-频率的音源方向。在使用导向矢量的音场监视机构中,按照时间频率计算求 出的音源方向Riiin的直方图。根据直方图的变化判断是否发生了异常。另一方面,在导向 矢量搜索607中,在导向矢量没有存在于DB内的情况下,选择不使用音源方向直方图的、不伴随着方向推测的音场监视机构并结束(610)。
在指向性有无的确认605中,在判断为没有指向性的情况下(no),接着确认麦克 风的间隔是否是预先设定的D[m]以下(确认间隔是否是Dm以下606)。在是D[m]以下的情 况下,选择使用基于麦克风间的相位差的音源方向推测方式的音场监视机构(611)。这里, 在基于相位差的音源方向推测方式中,根据输入信号X(f,τ)用式4求出音源方向θ (f, τ)。
式 4γ π ZWr 、1Αxi(f, τ) X2 (f. Γ)…0068 0(f, Γ) = ――-~rarctan ~‘―-----~~—......式 42 丌 fdc_1x2 (f, τ ) χ-, (f, τ)
在上述式中,设d为麦克风间隔。设c为声速。根据计算了求出的音源方向θ (f, τ)的直方图的直方图的变化进行是否发生了异常的判断。此外,音源方向推测也可以按照 时间帧、通过GCC-PHAT(Generalized Cross Correlation with Phase Transform)法等的 使用全频率的音源方向推测法求出各时间帧的音源方向θ (τ)。
这里,也可以将音源方向以适当的间隔离散化来制作直方图。在确认间隔是否是 Dm以下606中的判断的结果是麦克风的间隔为预先设定的D[m]以上的情况下(no),认为 基于相位差的音源方向推测是困难的,选择执行基于麦克风间的音量比率的音源方向推测 的音场监视机构(612)。按照各频率,在麦克风1的输入信号与麦克风2的声压比率r[dB] 比预先设定的阈值Tl [dB]大的情况下,判断该频率成分为接近于麦克风1的音源的成分, 在比T2[dB]小的情况下,判断该频率成分为接近于麦克风2的音源的成分。在除此以外的 情况下,认为该频率成分为存在于麦克风1与麦克风2的中间的成分。在按照各时间频率 进行了这样的判断之后,根据各判断结果,按照“判断为接近于麦克风1的情形”、“判断为接 近于麦克风2的情形”、“判断为麦克风1与麦克风2的中间的情形”的3个情形生成直方 图。基于该直方图,进行异响发生的监视。通过以上说明的图6的处理流程的流程,决定了 各监视对象地点的音场监视机构。
接着,在构成麦克风阵列的麦克风的元件数是3以上的情况下进行说明。在通过 麦克风间的音量比率求出音源方向的情况下,提取音量较大的前两个麦克风,在该麦克风 间的音量比率超过了预先设定的阈值Tl [dB]的情况下,判断为在接近于所提取的麦克风1 的方向上有音源。此外,在音量比率低于T2[dB]的情况下,判断为在接近于所提取的麦克 风2的方向上有音源。在除此以外的情况下,判断为在接近于所提取的麦克风1与所提取 的麦克风2的方向上有音源。能够按照各时间频率得到是接近于麦克风i、还是麦克风i及 麦克风j的中间的音源方向推测结果。根据该推测结果计算直方图,用于声响监视。在使 用导向矢量的音源方向推测的情况下,进行要素数是3以上的导向矢量与要素数是3以上 的输入信号的内积计算,进行方向推测。
在使用相位差的音源方向推测的情况下,使用SRP-PHAT法(Steered Response Power-Phase Alignment Transform)、 SPIRE 法(Stepwise Phase Difference Restoration 法,例如,参 M Μ. Togami and Y. Obuchi, "Stepwise Phase Difference Restoration Method for DOA Estimation of Multiple Sources,,,IEICE Trans, on Fundamentals, vol. E91-A,no. 11,2008)等进行音源方向推测。
图7是表示本实施例的中央服务器206的处理部中的所有据点的声响监视的按照帧的处理流程的图。在变量初始化701中,首先将处理的据点的索引(i)初始化为0。 在判断702中,判断是否处理完了所有的据点。这里,N是据点数。在处理完的情况下结 束。在除此以外的情况下,接着进行该据点的音场监视机构是否音源方向推测功能的判断 703。在判断为具有音源方向推测的情况下,进行音源方向推测704。这里,音源方向推测 基于由音场监视机构选择选择的方法(使用相位差的方法、基于音量比率的方法、使用导 向矢量的方法)来进行。按照频率推测音源方向之后,根据推测结果,进行直方图或输入信 号的波谱的变化提取705。此外,在不具有音源方向推测功能的情况下,进行导向矢量的时 间变化、输入信号波谱的变化提取707。在是否有变化的确认706中,判断是否有直方图或 输入信号的波谱的显著的时间变化。在判断为有时间变化的情况下,将有变化的音源方向 的成分进行音源分离710。音源分离710使用最小分散波束形成法(例如参照M. Togami, Y.Obuchi, and A. Amano,“Automatic Speech Recognition of Human-Symbiotic Robot EMIEW,,,in“Human-Robot Interaction”,pp. 395-404,I-tech Education and Publishing, 2007)等执行。音源分离提取判断为有变化的前后数秒的数据。并且,在将提取成分对各监 视地点发送708之后,将处理转移到下个据点(709)。在判断为没有变化的情况下,什么都 不进行,将处理转移到下个据点(709)。
图8是表示本实施例的音源方向直方图的变化提取的图像的图。通过从该图上段 右方所示的变化后的方向直方图802减去该图上段左方所示的变化前的直方图801,能够 如该图下段所示那样知道有变化的音源方向803。
图9是表示图7的处理流程中的、具有音源方向推测功能时的直方图、波谱的变化 提取705的更详细的处理流程的图。在根据推测得到的音源方向直方图进行直方图距离的 计算902中,使用储存在存储器中的过去的音源方向簇901的信息,进行过去的簇与得到的 音源方向直方图的距离计算。距离计算基于式5进行。
权利要求
1.一种声响监视系统,具备具有多个麦克风的麦克风阵列和处理部,其特征在于,上述处理部根据来自上述麦克风阵列的输入信号检测音源方向的直方图的时间变化, 基于该检测结果判断在音场中是否发生了异常。
2.如权利要求1所述的声响监视系统,其特征在于, 还具备显示部;上述处理部在判断在音场中发生了异常的情况下,将异常的发生显示在上述显示部上。
3.—种声响监视系统,具备具有多个麦克风的麦克风阵列、处理部和存储部,其特征在于,上述存储部存储关于上述麦克风的数据; 上述处理部基于关于上述麦克风的数据,搜索存在于监视对象的音源附近的上述麦克风阵列; 基于搜索到的上述麦克风阵列的关于上述麦克风的数据,选择上述监视对象的音源的 音场监视功能。
4.如权利要求3所述的声响监视系统,其特征在于, 关于上述麦克风的数据包括上述麦克风阵列的配置数据; 上述处理部基于上述配置数据搜索上述麦克风阵列。
5.如权利要求3所述的声响监视系统,其特征在于, 还具备连接在上述麦克风上的AD变换装置;关于上述麦克风的数据包括连接上述麦克风的上述AD变换装置的AD同步数据; 上述处理部基于上述AD同步数据选定上述音场监视功能。
6.如权利要求5所述的声响监视系统,其特征在于,存储在上述存储部中的关于上述麦克风的数据包括上述麦克风的指向性数据; 上述处理部当搜索到的上述麦克风阵列的上述AD同步数据表示同步时,基于上述指 向性数据选定上述音场显示功能。
7.如权利要求6所述的声响监视系统,其特征在于, 关于上述麦克风的数据包括上述麦克风的间隔数据;上述处理部在搜索到的上述麦克风阵列的上述指向性数据是无指向性的情况下,基于 上述间隔数据选定上述音场监视功能。
8.如权利要求7所述的声响监视系统,其特征在于,上述处理部在搜索到的上述麦克风阵列的上述间隔数据是规定值以下的情况下,作为 上述音场监视功能而选择具备通过相位差的方向推测功能的音场监视功能。
9.如权利要求7所述的声响监视系统,其特征在于,上述处理部在搜索到的上述麦克风阵列的上述间隔数据不是规定值以下的情况下,作 为上述音场监视功能而选择通过上述麦克风间的音量比率的音场监视功能。
10.一种声音集音系统,具备具有多个麦克风的麦克风阵列和处理部,其特征在于,上述处理部根据上述麦克风阵列的输入信号生成各音源的直方图,基于生成的上述直 方图的离差进行上述音源的朝向检测。
11.如权利要求10所述的声音集音系统,其特征在于,上述处理部基于所生成的各音源的上述直方图计算麦克风阵列的横截面特征量,通过 计算出的上述麦克风阵列的横截特征量检测上述音源朝向。
12.如权利要求11所述的声音集音系统,其特征在于,上述处理部通过根据各音源的上述直方图计算方向直方图熵,计算上述麦克风阵列的 横截特征量。
13.如权利要求10所述的声音集音系统,其特征在于, 还具备多个显示部;上述处理部确定存在于所检测到的上述音源朝向的方向的上述显示部,进行控制以将 图像显示在已确定的上述显示部。
14.如权利要求10所述的声音集音系统,其特征在于,上述处理部基于检测到的上述音源朝向,确定上述音源所朝向的上述麦克风阵列,进 行控制以将已确定的上述麦克风阵列的输入信号录音。
全文摘要
本发明涉及声响监视系统及声音集音系统。在存在许多监视对象以外的音源的环境中、在因噪声的问题而监视精度劣化、或者许多机器动作的环境中,需要简单地进行初期设定。一种具备具有多个麦克风的麦克风阵列和处理部的各据点异响监视部的声响监视系统,各据点异响监视部根据经由波形取入部、网络输入的麦克风阵列的输入信号,检测音源方向的直方图的时间变化,基于该变化检测结果,判断在音场中是否发生了异常,输出监视结果。此外,处理部搜索存在于监视对象的音源附近的麦克风阵列,基于搜索到的麦克风阵列的关于麦克风的各种数据,选择监视对象的音源的音场监视功能。
文档编号H04R29/00GK102036158SQ20101029809
公开日2011年4月27日 申请日期2010年9月28日 优先权日2009年10月7日
发明者川口洋平, 户上真人 申请人:株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1