技术总结
公开了一种音频信号处理设备、方法和电子设备。该音频信号处理设备包括:麦克风阵列,包括具有不同拾音区的多个指向麦克风;音频定位器件,用于识别第一组声源并确定每个声源在音频坐标系下的位置;摄像头,用于捕捉当前场景的场景图像,该当前场景至少覆盖该多个指向麦克风的拾音区;图像定位器件,用于识别第二组声源并确定每个声源在图像坐标系下的位置;以及声源分类器,用于根据音频与图像坐标系之间的配准关系、每个声源在该音频坐标系下的位置、和每个声源在该图像坐标系下的位置来对该第一和第二组声源中的每个声源进行分类。因此,可以利用指向麦克风和摄像头的双重定位来实现声源的精确分类。
技术研发人员:徐荣强
受保护的技术使用者:北京地平线信息技术有限公司
文档号码:201710030744
技术研发日:2017.01.17
技术公布日:2017.05.10