一种基于声源位置的视频采集方法与流程

文档序号:14359251阅读:403来源:国知局

本发明涉及物联网控制技术领域,尤其涉及一种基于声源位置的视频采集方法。



背景技术:

随着科技的发展和人们生活水平的提高,人们对生活、工作、居住环境方便快捷的要求也越来越高,智能工作系统应运而生。智能工作系统是现代电子技术、通讯技术及自动化技术相结合的产物,其能够实现对工作中各设备的自动控制和管理,从而能够为办公中的用户提供智能化、自动化、高效便利的办公环境。

目前,用户在办公室开会且需要视频摄像时,一种拍摄方式是工作人员长时间跟踪拍摄,另一种拍摄方式是由固定的摄像头固定拍摄;第一种拍摄方式在拍摄时会有拍摄死角,另外长时间的人工拍摄会浪费人力且拍摄效果也不尽如人意;第一种拍摄方式虽然能长时间的实时拍摄,但一旦启动拍摄,则中间无法中断,比较浪费资源。



技术实现要素:

基于背景技术存在的技术问题,本发明提出了一种基于声源位置的视频采集方法;

本发明提出的一种基于声源位置的视频采集方法,包括:

s1、获取各预设区域的实时音频分贝,记为d1、d2…dn;

s2、将d1、d2…dn与预设的分贝阈值d0进行比较,将d1、d2…dn中大于d0的实时音频分贝对应的预设区域作为第一目标区域;

s3、获取第一目标区域的实时音频数据,记为v1、v2…vi,其中,i≤n;

s4、检测v1、v2…vi中是否包含人声,将v1、v2…vi中包含人声的实时音频数据对应的第一目标区域作为第二目标区域;

s5、对第二目标区域进行视频采集。

优选地,步骤s1,具体包括:通过在各预设区域内预设分贝检测装置获取各预设区域的实时音频分贝。

优选地,步骤s1中,所述预设区域可由用户编辑,且各预设区域之间不互相重叠。

优选地,步骤s3,具体包括:通过在各预设区域内预设音频采集装置获取第一目标区域的实时音频数据。

优选地,步骤s4中,所述检测v1、v2…vi中是否包含人声,具体包括;将v1、v2…vi与预设的人声音频数据样本进行比较,检测v1、v2…vi中是否包含人声。

优选地,步骤s5,具体包括:通过在每个预设区域内预设至少一个视频采集装置对第二目标区域进行视频采集。

优选地,步骤s5,还包括:每次对第二目标区域进行视频采集的时间不少于预设时间。

本发明通过获取各预设区域的实时音频分贝,将各预设区域的实时音频分贝与预设的分贝阈值进行比较,将大于分贝阈值的实时音频分贝对应的预设区域作为第一目标区域,获取第一目标区域的实时音频数据,检测第一目标区域的实时音频数据中是否包含人声,将第一目标区域的实时音频数据中包含人声的实时音频数据对应的第一目标区域作为第二目标区域,对第二目标区域进行视频采集。如此,在节省人力的情况下,实现无死角实时视频采集,在用户开会时,能自动高效的对说话的用户进行视频采集,不漏掉一点会议内容,增加用户体验。

附图说明

图1为本发明提出的一种基于声源位置的视频采集方法的流程示意图。

具体实施方式

参照图1,本发明提出的一种基于声源位置的视频采集方法,包括:

步骤s1,获取各预设区域的实时音频分贝,记为d1、d2…dn,具体包括:通过在各预设区域内预设分贝检测装置获取各预设区域的实时音频分贝,所述预设区域可由用户编辑,且各预设区域之间不互相重叠。

在具体方案中,在用户设定的几个预设区域设置分贝检测装置,通过分贝检测装置获取各预设区域的实时音频分贝。

步骤s2,将d1、d2…dn与预设的分贝阈值d0进行比较,将d1、d2…dn中大于d0的实时音频分贝对应的预设区域作为第一目标区域。

在具体方案中,将各预设区域的实时音频分贝与预设的分贝阈值进行比较,从而判断各预设区域内是否有声音发出并去除一些细小的噪音的干扰。

步骤s3,获取第一目标区域的实时音频数据,记为v1、v2…vi,其中,i≤n,具体包括:通过在各预设区域内预设音频采集装置获取第一目标区域的实时音频数据。

在具体方案中,在用户设定的几个预设区域设置音频采集装置,通过音频采集装置获取预设区域的实时音频数据。

步骤s4,将v1、v2…vi与预设的人声音频数据样本进行比较,检测v1、v2…vi中是否包含人声,将v1、v2…vi中包含人声的实时音频数据对应的第一目标区域作为第二目标区域。

在具体方案中,将第一目标区域的实时音频数据与预设的人声音频数据样本进行比较,从而检测第一目标区域的实时音频数据中是否有人声,如此,去除非人声的干扰。

步骤s5,对第二目标区域进行视频采集,具体包括:通过在每个预设区域内预设至少一个视频采集装置对第二目标区域进行视频采集,且每次对第二目标区域进行视频采集的时间不少于预设时间。

在具体方案中,在用户设定的几个预设区域设置视频采集装置,通过视频采集装置对第二目标区域进行视频采集,实现无死角实时视频采集。

本实施方式通过获取各预设区域的实时音频分贝,将各预设区域的实时音频分贝与预设的分贝阈值进行比较,将大于分贝阈值的实时音频分贝对应的预设区域作为第一目标区域,获取第一目标区域的实时音频数据,检测第一目标区域的实时音频数据中是否包含人声,将第一目标区域的实时音频数据中包含人声的实时音频数据对应的第一目标区域作为第二目标区域,对第二目标区域进行视频采集。如此,在节省人力的情况下,实现无死角实时视频采集,在用户开会时,能自动高效的对说话的用户进行视频采集,不漏掉一点会议内容,增加用户体验。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。



技术特征:

技术总结
本发明公开了一种基于声源位置的视频采集方法,包括:获取各预设区域的实时音频分贝,记为D1、D2…Dn;将D1、D2…Dn与预设的分贝阈值D0进行比较,将D1、D2…Dn中大于D0的实时音频分贝对应的预设区域作为第一目标区域;获取第一目标区域的实时音频数据,记为V1、V2…Vi,其中,i≤n;检测V1、V2…Vi中是否包含人声,将V1、V2…Vi中包含人声的实时音频数据对应的第一目标区域作为第二目标区域;对第二目标区域进行视频采集。

技术研发人员:杨倩倩
受保护的技术使用者:蒙城县望槐信息科技有限责任公司
技术研发日:2017.12.22
技术公布日:2018.05.08
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1