一种视频定位的长距离拾音装置的制作方法

文档序号:5107333阅读:215来源:国知局
专利名称:一种视频定位的长距离拾音装置的制作方法
技术领域
本发明涉及一种声音拾取装置,尤其涉及一种用于长距离视频监控中目标语音的声音拾取装置。
背景技术
在监控画面语音拾取方法中,传统做法是将多个麦克风以阵列方式相连,并处理由这些麦克风接收的音源信号,从而获得指向音源信号,以提升信噪比,增强特定方向的信号并抑制其他方向的噪声。该方法的缺点是只能寻找最大音源上的信号,然而监控画面指定的音源却不一定是最大音源。公告日为2009年12月16日、公告号为CN100571451C的专利提出根据视频或其他方法获知音源方向与距离,根据阵列麦克风等距排列而产生语音信号固定延时叠加来得到目标声音强化的方法。该方法所需麦克风较多、安装要求严格,需要做相关性等运算,计算过程复杂。

发明内容
本发明的目的在于提供一种可以有效增强视频监控画面指定目标音源品质,抑制近场音源干扰与噪音,简化后期降噪处理过程,安装使用方便的视频定位长距离拾音装置。本发明针对现有技术问题主要是通过下述技术方案得以解决的,一种视频定位的长距离拾音装置,包括指向性麦克风、全向麦克风,还包括多个喇叭形桶体、主信号累加单元、噪声累加单元、后期信号处理单元,在每个喇叭形桶体内底端安装一个指向性麦克风、 该指向性麦克风旁边安装一个全向麦克风,每个指向性麦克风都连接到主信号累加单元, 每个全向麦克风都连接到噪声累加单元,主信号累加单元连接后期信号处理单元,噪声累加单元连接后期信号处理单元;后期信号处理单元对主信号累加单元输出信号与噪声累加单元输出信号进行减法处理得到目标语音信号;喇叭形桶体的开口面向目标声源平齐安装在以摄像头为中心的圆周上。现代摄像机一般都具有人脸目标自动对焦功能,利用这一功能可以轻易地找到发声目标。本发明中视频定位的长距离拾音意为拾取摄像机监控画面中的目标语音。在监控画面中的目标一边讲话一边移动时,随着目标移动语音信号路径发生改变,采用传统拾音方法将无法获得目标语音,本发明提供的装置,将拾音麦克风做成桶体, 使指向性麦克风只收集与摄像头同方向的语音,同时桶体末端设计为具有一个声学放大结构体,如锥形喇叭结构、抛物面形喇叭结构等,用于加强目标语音信号。桶体侧壁上安装全向麦克风收集桶体附近噪音和目标语音,从而得到精确的环境噪音变量。由于多个桶体中的指向性麦克风均勻平齐的分布在以摄像头为中心的同一圆周上,而监控语音目标位于摄像头图像中心,由此可以得知指向性麦克风与监控语音目标等距,目标发出的语音可以认为同时到达这些指向性麦克风,而非目标方向上的语音不可能同时到达这些指向性麦克风,因此,将这些指向性麦克风所获得的语音信号简单相加就可以得到加强的目标语音信号。从而避免了复杂数学运算,简化了处理过程,提高了系统响应速度。全向麦克风用来拾取环境噪音。由于全向麦克风拾取目标语音信号能力较指向性麦克风弱很多,尤其对于远距离音源更是如此,因此,将全向麦克风信号简化为只含噪音信号,通过后期信号处理单元得到噪音样本。后期处理单元包括至少两个带通滤波器,得到指向性麦克风信号中噪音与全向麦克风噪音信号强度斜率比,在后期信号处理单元做减法处理得到目标语音信号。由于指向性麦克风位于桶体最里端,不可避免会产生海潮音,即在嘈杂周围环境中,这些噪音使桶体的空气振动,在桶体末端产生新的噪音,全向麦克风的安装位置要与指向性麦克风非常接近,可以拾取海潮音,同时也拾取与指向性麦克风最接近环境噪音,以便后期信号处理单元得到正确的噪音信号,避免出现噪音取样失真的情况出现。作为优选,主信号累加单元为加法器,对来自指向性麦克风的信号进行加法运算。作为优选,噪声累加单元为加法器,对来自全向麦克风的信号进行加法运算。作为优选,全向麦克风安装在指向性麦克风旁边、喇叭形桶体的内壁上,该全向麦克风的拾音口面向内壁。这样安装有利于拾取最接近指向性麦克风所在环境的噪声信号。作为优选,在以摄像头为中心的圆周上至少安装2个所述喇叭形桶体,该桶体内安装一个指向性麦克风、安装一个全向麦克风。安装2个以上这样的桶体麦克风使得目标语音信号增强,拾音效果更好。作为优选,后期信号处理单元为模拟电路。模拟电路结构简单,参数随时可调,可得到较好的目标语音效果。作为优选,后期信号处理单元为数字电路。处理过程数字化,量化准确,噪声处理效果好。本发明带来的有益效果是,可以增强视频监控画面中特定目标音源信号,有效抑制近场干扰噪声,后期降噪处理过程简化,信噪比高,设备结构简单。


图1是本发明的一种四个锥形喇叭桶体及麦克风安装示意图; 图2是本发明的一种四个锥形喇叭桶体安装侧视图; 图3是本发明的原理框图4是本发明的一种抛物面形喇叭桶体及麦克风安装示意图; 图5是本发明的一种采用模拟电路的原理框图; 图6是本发明的一种采用数字电路的原理框图。图中:1100是喇叭形桶体,1101是指向性麦克风,1102是全向麦克风,1103是消声孔,1104是锥形底,1105是抛物面底,3000是摄像头;4000是后期信号处理单元;200是主信号加法电路,201是噪声加法电路,300是增益控制电路,401是斜坡放大器,402反馈电路,501是取样带通滤波器1,502是取样带通滤波器2,600是发送电路;220是抗混淆电路, 320是A/D转换电路,4200是DSP处理器。
具体实施例方式下面通过实施例,并结合附图,对本发明的技术方案作进一步具体说明。实施例如图1、图2、图3所示,本发明是一种视频定位的长距离拾音装置,包括指向性麦克风1101、全向麦克风1102,喇叭形桶体1100、主信号累加单元200、噪声累加单元201、后期信号处理单元4000,喇叭形桶体1100内底端安装一个指向性麦克风1101,在靠近指向性麦克风1101处安装一个全向麦克风1102,每个指向性麦克风1101都连接到主信号累加单元200,每个全向麦克风1102都连接到噪声累加单元201,主信号累加单元200的输出、噪声累加单元201的输出连接到后期信号处理单元4000 ;喇叭形桶体1100的开口面向目标声源平齐安装在以摄像头3000为中心的圆周上。为增加降噪效果在桶体1100上开有若干个消声孔1103。后期信号处理单元4000对主信号累加单元200输出信号与噪声累加单元201输出信号进行减法处理得到目标语音信号。在图1中,喇叭形桶体1100的底部1104是个锥形,具有较好的人声收集效果。如图4所示,喇叭形桶体1100的一端开口,另一端为抛物面底1105,该抛物面的焦点安装指向性麦克风1101 ;抛物面具有只聚焦桶体所指方向信号的优点,但其仍然无法去除近场的语音信号,所以在桶体1100末端侧壁安装噪音取样麦克风1102 ;为增加降噪效果桶体1100上开若干消声孔1103,用来消除非桶体所指方向上语音与噪音信号。后期信号处理单元4000的电路实现为模拟电路、数字电路两种方式。如图5所示,采用模拟电路实现的后期信号处理单元4000,由增益控制电路300、 斜坡放大器401、反馈电路402、取样带通滤波器501、取样带通滤波器502组成。ZMKUZMKN 是指向性麦克风,CMKU CMKN是对应全向麦克风,这些麦克风经过各自的前置电路Z101、 Z10N、ClOU C10N,分别经过加法电路200、201相加合成主信号、噪音信号,300是可变增益放大器,300内部包含总增益控制电路、频率均衡控制电路。噪音信号经过增益控制电路 300、第一带通滤波器501、第二带通滤波器502及反馈电路402调整后与主信号中噪音信号相等但相位相差180度,经过斜坡放大器401相加得到较佳听觉效果的信号。斜坡放大器 401根据声音在空气中衰减特性设定为低频增益较小,高频增益较大,同时针对语音信号, 优化为带宽300Hz-4KHz。发送电路600为远程传输作相应处理。如图6所示,是本发明运用DSP技术的实施例,ZMKU ZMKN为指向性麦克风,经过各自的前置电路Z101、Z10N,经过主信号加法电路200 ;注意主信号加法电路200终止频率必须为DSP能够处理带宽的二分之一,经过320模数转换送入DSP处理器4200。CMKl、CMKN为全向麦克风,经过各自的前置电路ClOl、C10N,经过噪声加法电路 201 ;同样噪声加法电路201终止频率也必须为DSP能够处理带宽的二分之一,经过320模数转换送入DSP处理器4200。抗混淆电路220的作用是主信号和噪声信号(模拟信号)进行数字化处理之前阻止带外噪声混淆错误的发生,并防止模拟信号出现叠加性高频噪声,以免影响信号的后期处理。在DSP处理器4200中,噪音样本信号与主信号加权相加运算,得到合成信号。权重计算方法将噪音信号与主信号都进行谱运算,抽取300HZ以下与4KHZ以上进行谱能量比较确定两信号相加权重比,相加后300HZ以下与4KHZ以上进行噪音分析,使得能量最小化,如果不是最小则修正下一单元权重。噪音样本信号与主信号的加权合成信号经过自适应滤波后送入数模转换电路,转化为模拟信号即目标语音信号,输出到发送电路600。所以本发明具有增强视频监控画面中特定目标音源信号、有效抑制近场干扰噪声、简化后期降噪处理过程、简化设备结构等特征。
权利要求
1.一种视频定位的长距离拾音装置,包括指向性麦克风、全向麦克风,其特征在于还包括多个喇叭形桶体、主信号累加单元、噪声累加单元、后期信号处理单元,在每个所述喇叭形桶体内底端安装一个所述指向性麦克风、该指向性麦克风旁边安装一个所述全向麦克风,每个所述指向性麦克风都连接到所述主信号累加单元,每个所述全向麦克风都连接到所述噪声累加单元,主信号累加单元连接后期信号处理单元,噪声累加单元连接后期信号处理单元;所述后期信号处理单元对主信号累加单元输出信号与噪声累加单元输出信号进行减法处理得到目标语音信号;所述喇叭形桶体的开口面向目标声源平齐安装在以摄像头为中心的圆周上。
2.根据权利要求1所述一种视频定位的长距离拾音装置,其特征是所述主信号累加单元为加法器,对来自指向性麦克风的信号进行加法运算。
3.根据权利要求1所述一种视频定位的长距离拾音装置,其特征是所述噪声累加单元为加法器,对来自全向麦克风的信号进行加法运算。
4.根据权利要求1或2或3所述一种视频定位的长距离拾音装置,其特征是所述全向麦克风安装在指向性麦克风旁边、喇叭形桶体的内壁上,该全向麦克风的拾音口面向内壁。
5.根据权利要求1所述一种视频定位的长距离拾音装置,其特征是在以摄像头为中心的圆周上至少安装2个所述喇叭形桶体,该桶体内安装一个指向性麦克风、安装一个全向麦克风。
6.根据权利要求1所述一种视频定位的长距离拾音装置,其特征是所述后期信号处理单元为模拟电路。
7.根据权利要求1所述一种视频定位的长距离拾音装置,其特征是所述后期信号处理单元为数字电路。
全文摘要
本发明公开了一种视频定位的长距离拾音装置,目的在于提供一种可以有效增强视频监控画面指定目标音源品质,抑制近场音源干扰与噪音,简化后期降噪处理过程,安装使用方便的视频定位长距离拾音装置,包括指向性麦克风、全向麦克风,喇叭形桶体、主信号累加单元、噪声累加单元、后期信号处理单元,在每个喇叭形桶体内底端安装一个指向性麦克风、一个全向麦克风;后期信号处理单元对主信号与噪声信号进行减法处理得到目标语音信号;喇叭形桶体的开口面向目标声源平齐安装在以摄像头为中心的圆周上。
文档编号H04R3/00GK102196333SQ201010591158
公开日2011年9月21日 申请日期2010年12月16日 优先权日2010年12月16日
发明者俞杰, 徐洪明, 朱云海, 李刚 申请人:宁波三维技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1