一种音视频监控服务端、系统及方法与流程

文档序号：14873536发布日期：2018-07-07 02:59阅读：200来源：国知局

本发明主要涉及视频监控技术领域，具体涉及一种音视频监控服务端、系统及方法。

背景技术：

目前，视频监控的应用无论是在生产中还是生活中都起着至关重要的作用，安保人员通过监控视频，能够实时、直观、真实地观看监控区域的具体情况。当发生异常情况时，需要将所有视频调出，进行视频播放一帧一帧的查找异常情况画面，十分耗费时间。因此，需要一种能够代替人力查找异常情况的技术。

技术实现要素：

本发明要解决的技术问题是针对现有技术的不足，提供一种音视频监控服务端、系统及方法。

本发明解决上述技术问题的技术方案如下：一种监控方法，包括：

获取音视频监控数据；

从所述音视频监控数据中获取视频图像，并分离视频图像的前景和背景，从所述前景中确定运动目标；

根据均值漂移迭代算法对所述运动目标进行跟踪检测，得到跟踪结果。

本发明的有益效果是：从监控音视频数据中获取视频图像，并分离前后背景，根据视频帧的运行在前景中确定运动目标，并能够跟踪运动目标，得到跟踪结果，目标跟踪的准确率高，能够代替人力查找异常情况，快速发现异常情况，提高了监控效率。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述分离视频图像的前景和背景，从所述前景中确定运动目标，具体包括：

根据cam-shift运动物体跟踪算法分离视频图像的前景和背景，再从所述前景中提取运动物体轮廓，并将所述运动物体轮廓进行反向投影，得到运动目标。

采用上述进一步方案的有益效果是：能够提取出视频中的运动物体轮廓，并进行反向投影，能够更清楚的确定运动目标。

进一步，所述根据均值漂移迭代算法对所述运动目标进行跟踪检测，得到跟踪结果，具体包括：

根据均值漂移迭代算法和视频帧顺序将当前视频帧计算得到的运动目标的跟踪数据作为下一视频帧计算运动目标跟踪数据的初始值，计算下一视频帧的跟踪数据，直至将所有视频帧中运动目标的跟踪数据计算完成，得到跟踪结果。

采用上述进一步方案的有益效果是：通过均值漂移迭代算法不断计算，实现对运动目标的跟踪和识别。

进一步，所述将当前视频帧计算得到的运动目标的跟踪数据作为下一视频帧计算运动目标跟踪数据的初始值，计算下一视频帧的跟踪数据，直至将所有视频帧中运动目标的跟踪数据计算完成，具体包括：

根据核密度算法计算当前视频帧中所述运动目标的特征值概率密度；

根据mean-shift均值漂移算法计算当前视频帧中运动目标的聚类中心数据值；

对当前视频帧的运动目标的轮廓进行检测，并根据所述轮廓确定运动目标的外接矩形框，将所述外接矩形框作为搜索窗口，并根据搜索窗口得到搜索窗口数值；

将当前视频帧的特征值概率密度、聚类中心数据值和搜索窗口数值作为下一视频帧计算运动目标的跟踪数据的初始值，计算下一视频帧的跟踪数据，直至将所有视频帧中运动目标的跟踪数据计算完成。

采用上述进一步方案的有益效果是：搜索窗口沿着概率密度方向增大的方向移动，得到运动目标的运动轨迹；有效的解决目标变形和遮挡的问题，在运动目标跟踪的过程中能调节搜索目标尺寸的大小，可准确定位，达到跟踪运动目标的目的。

进一步，还包括步骤：从所述音视频监控数据中获取音频数据，将所述音频数据进行播放。

本发明解决上述技术问题的另一技术方案如下：一种音视频监控服务端，包括：

音视频获取模块，用于获取音视频监控数据；

音视频处理模块，用于从所述音视频监控数据中获取视频图像，并分离视频图像的前景和背景，从所述前景中确定运动目标，并根据均值漂移迭代算法对所述运动目标进行跟踪检测，得到跟踪结果。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述音视频处理模块具体用于：

根据cam-shift运动物体跟踪算法分离视频图像的前景和背景，再从所述前景中提取运动物体轮廓，并将所述运动物体轮廓进行反向投影，得到运动目标。

进一步，所述音视频处理模块还具体用于：

根据核密度算法计算所述当前视频帧中所述运动目标的特征值概率密度；

根据mean-shift均值漂移算法计算当前视频帧中运动目标的聚类中心数据值；

本发明解决上述技术问题的另一技术方案如下：一种音视频监控系统，包括音视频采集前端和所述的视频监控服务端；

所述音视频采集前端，用于采集监控区域的音视频监控数据，并根据所述音视频监控服务端的获取信号将所述音视频监控数据发送至音视频监控服务端中。

附图说明

图1为本发明一实施例提供的监控方法的方法流程图；

图2为本发明一实施例提供的音视频监控服务端的模块框图；

图3为本发明一实施例提供的音视频监控系统的模块框图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

图1为本发明一实施例提供的监控方法的方法流程图；

如图1所示，一种监控方法，包括：

获取音视频监控数据；

从所述音视频监控数据中获取视频图像，并分离视频图像的前景和背景，从所述前景中确定运动目标；

根据均值漂移迭代算法对所述运动目标进行跟踪检测，得到跟踪结果。

上述实施例中，从监控音视频数据中获取视频图像，并分离前后背景，根据视频帧的运行在前景中确定运动目标，并能够跟踪运动目标，得到跟踪结果，目标跟踪的准确率高，能够代替人力查找异常情况，快速发现异常情况，提高了监控效率。

可选的，作为本发明的一个实施例，所述分离视频图像的前景和背景，从所述前景中确定运动目标，具体包括：

根据cam-shift运动物体跟踪算法分离视频图像的前景和背景，再从所述前景中提取运动物体轮廓，并将所述运动物体轮廓进行反向投影，得到运动目标。

上述实施例中，能够提取出视频中的运动物体轮廓，并进行反向投影，能够更清楚的确定运动目标。

可选的，作为本发明的一个实施例，所述根据均值漂移迭代算法对所述运动目标进行跟踪检测，得到跟踪结果，具体包括：

上述实施例中，通过均值漂移迭代算法不断计算，实现对运动目标的跟踪和识别。

可选的，作为本发明的一个实施例，所述将当前视频帧计算得到的运动目标的跟踪数据作为下一视频帧计算运动目标跟踪数据的输入值，并根据输入值计算下一视频帧的跟踪数据，具体包括：

根据核密度算法计算当前视频帧中所述运动目标的特征值概率密度；具体的，用输入图像(先求出颜色特征直方图)的某一位置上像素值(多维或灰度)对应在直方图的一个bin上的值来代替该像素值，bin上的值越大就代表着这个像素值出现的概率越大；

根据mean-shift均值漂移算法计算当前视频帧中运动目标的聚类中心数据值；

能够得到目标当前位置，实现对运动目标的跟踪和识别，当目标大小发生变化时能自适应的调整搜索目标区域，继续跟踪。

获取搜索窗口时还包括，根据mean-shift均值漂移算法对所述运动目标进行初始化，并对初始化后的运动目标的轮廓进行检测，得到运动目标轮廓的外接矩形框。

上述实施例中，搜索窗口沿着概率密度方向增大的方向移动，得到运动目标的运动轨迹；有效的解决目标变形和遮挡的问题，在运动目标跟踪的过程中能调节搜索目标尺寸的大小，可准确定位，达到跟踪运动目标的目的。

可选的，作为本发明的一个实施例，还包括步骤：从所述音视频监控数据中获取音频数据，将所述音频数据进行播放。

图2为本发明一实施例提供的音视频监控服务端的模块框图；

可选的，作为本发明的另一个实施例，如图2所示，一种音视频监控服务端，包括：

音视频获取模块，用于获取音视频监控数据；

可选的，作为本发明的一个实施例，还包括显示模块，用于显示所述跟踪结果。

可选的，作为本发明的一个实施例，所述音视频处理模块具体用于：

根据cam-shift运动物体跟踪算法分离视频图像的前景和背景，再从所述前景中提取运动物体轮廓，并将所述运动物体轮廓进行反向投影，得到运动目标。

可选的，作为本发明的一个实施例，所述音视频处理模块还具体用于：

根据核密度算法计算所述当前视频帧中所述运动目标的特征值概率密度；

根据mean-shift均值漂移算法计算当前视频帧中运动目标的聚类中心数据值；

图3为本发明一实施例提供的音视频监控系统的模块框图；

可选的，作为本发明的一个实施例，如图3所示，一种音视频监控系统，包括音视频采集前端和所述的音视频监控服务端；

所述音视频采集前端，用于采集监控区域的音视频数据，并根据所述音视频监控服务端的获取信号将所述音视频数据发送至音视频监控服务端中。

具体的，所述视频采集前端包括：

音频采集模块，用于通过声音采集设备采集监控区域的音频数据；具体的，声音采集设备为雅视威的yes-800g，多媒体台式小音箱hiraliyh7；

视频采集模块，用于通过摄像采集设备采集监控区域的视频数据；具体的，摄像采集设备为500万像素、焦距3.6mm的广角高清摄像头；

核心处理模块，用于将采集的音频数据和视频数据进行编码处理，得到音视频数据；

存储模块，用于保存编码后的所述音视频数据；具体的，存储模块为单层单元闪存slcnand；

第一通信模块，用于与所述音视频监控服务端建立无线连接，并将所述音视频数据发送至所述音视频监控服务端中；具体的，其包括wifi模块和4g通信模块；

电源模块，用于向音视频采集前端的各模块提供电力；

以太网模块，用于将音视频采集前端中各模块进行组网连接；以太网模块中包括以太网接口，可实现网络接口数据的接收和发送，支持10/100/1000mbit/s工作模式；

第一语音对讲模块，用于与所述音视频监控服务端建立语音连接。

具体的，核心处理模块包括h.265压缩处理芯片，且内核是cortexa7的处理芯片，型号为hi3516a，支持多路实时编码，视频数据采用h.265标准进行编码，根据h.265视频编码标准将视频流进行编码压缩，得到h.265视频数据，视频编码器vedu能支持h.265视频标准，cpu占用率低，总线带宽占用率小，支持图像分辨率最大可达到2592*2592，支持cbr/vbr/fixqp三种码率控制模式，输出码率范围在2kbps～40mbps之间；音频数据采用音频协议进行编码，根据得到的音频数据按音频协议编码得到音频码流，音频输入输出接口aio接口用于与audiocodec对接，完成声音的录制和播放，音频处理可采用海思芯片内部集成的1个aio(包含1个aip和1个aop)，其中aip支持多路音频接收，音频信号处理模块支持8khz采样率，支持g711，g726，adpcm格式的音频编解码，支持录制和播放lpcm格式的音频；可根据不同环境选择不同的标准，保证视频监控的稳定和连续性。

具体的，在图2实施例的基础上，所述音视频监控服务端包括：

音视频获取模块，还用于向音视频采集前端发送获取信号；

第二通信模块，用于根据所述获取信号与所述音视频监控服务端建立无线连接，并将所述获取信号发送至所述音视频监控服务端，并接收所述音视频监控服务端发送的音视频数据，将所述音视频数据传输至解码模块中；具体的，其包括wifi模块和4g通信模块；

解码模块，用于将所述音视频数据进行解码处理，并将解码得到的音视频数据发送至所述音视频获取模块；

视频存储模块，用于保存解码后的所述音视频数据；

第二语音对讲模块，用于与所述音视频采集前端建立语音连接。

所述音视频监控服务端还包括音视频回放模块，用于将所述音视频数据进行回放。

音视频采集前端和音视频监控服务端通过无线网络连接，音视频监控服务端可以是移动终端，监控方便，便于处理紧急事件。

具体的，所述音视频监控服务端的音视频处理模块包括处理芯片海思hi3516a。

本发明音视频监控服务端可以是任何的移动终端，内安装本监控程序，与音视频采集前端通过无线网络连接时，可实时观看监控视频和语音对讲，方便监控工作人员和音视频采集前端人员对话，可广泛运用于安防，铁路交通，校园等领域；

可自动从监控音视频数据中获取视频图像，并分离前后背景，根据视频帧的运行在前景中确定运动目标，并能够跟踪运动目标，得到跟踪结果，目标跟踪的准确率高，能够代替人力查找异常情况，快速发现异常情况，提高了监控效率。

读者应理解，在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋树祥;肖逸群
技术所有人：广西师范大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。