视频分析方法、视频分析的管理方法及相关设备与流程

文档序号:26585931发布日期:2021-09-10 19:13阅读:122来源:国知局
视频分析方法、视频分析的管理方法及相关设备与流程
视频分析方法、视频分析的管理方法及相关设备
1.本技术要求于2020年03月09日提交中国国家知识产权局、申请号为202010159116.5、申请名称为“分布式视觉分析方法和系统”的中国专利申请的优先权,其全部内容通过引用结合在本技术中。
技术领域
2.本技术涉及视频分析领域,尤其涉及一种视频分析方法、视频分析的管理方法以及相关装置、设备、计算机可读存储介质、计算机程序产品。


背景技术:

3.视频监控是安全防范的重要手段。传统的视频监控系统包括前端摄像机、传输线缆和视频监控平台,监控人员可以在监控室中通过视频监控平台查看由前端摄像机拍摄的监控区域的视频,解决了现场盯防的人力成本问题。
4.随着摄像头数量的增加以及视频监控任务的复杂度增加,人工查看视频的成本也越来越高。为此,业界引入了人工智能(artificial intelligence,ai)技术辅助进行视频分析。具体地,一些应用需要执行目标搜索与目标跟踪等任务时,先在后台对各个摄像头拍摄的视频流进行特征提取,得到各个摄像头拍摄的视频流对应的特征向量,然后存储上述特征向量。当应用触发任务时,根据任务对存储的特征向量进行搜索和计算,从而实现目标搜索与目标跟踪。
5.然而,应用触发任务时,根据任务对存储的特征向量进行搜索和计算造成爆发式的资源消耗,由此导致爆发式的资源需求。并且,该方案需要进行大量的计算,效率比较低下。


技术实现要素:

6.本技术提供了一种视频分析方法,该方法通过在视频分析任务的执行阶段就结合其他视频分析任务得出的交互数据进行分析,如此当应用触发任务时,可以直接基于视频分析任务的执行阶段存储的数据进行响应,而不必大量的特征值进行搜索和计算,避免了爆发式的资源消耗,进而避免了爆发式的资源需求,而且减少了计算量,提高了响应效率。本技术还提供了视频分析的管理方法以及上述方法对应的装置、设备、计算机可读存储介质、计算机程序产品。
7.第一方面,本技术提供了一种视频分析方法。当摄像头包括具有分析功能的智能摄像头时,该视频分析方法可以由智能摄像头执行。当摄像头为不具有分析功能的非智能摄像头(也称作普通摄像头)时,该视频分析方法也可以由后台的视频监控平台(例如是视频监控平台中的视频分析装置)执行。
8.摄像头或视频分析装置可以获取该摄像头拍摄的视频(例如为第一视频),以及获取其他摄像头拍摄的视频(例如为第二视频)的交互数据,其中,交互数据通过对视频执行视频分析任务获得,然后摄像头或视频分析装置基于该第二视频的交互数据,对第一视频
执行第一视频分析任务,获得第一视频的分析结果。
9.该方法通过在视频分析任务的执行阶段,就结合其他视频分析任务得出的交互数据进行分析。如此,当应用触发目标搜索与目标跟踪等任务时,可以直接根据视频分析任务的执行阶段存储的数据(例如是对第一视频执行第一视频分析任务所得的、与第二视频的交互数据相关联的数据)进行分析,而不必对大量的特征值进行搜索和计算。一方面避免了爆发式的资源消耗,从而避免了爆发式的资源需求,无需配置高性能计算集群以及大容量资源即可满足需求,提高了资源利用率,降低了成本;另一方面,基于第二视频的交互数据对第一视频进行分析,实现了协同分析,缩小了分析范围,降低了计算量,提高了分析效率。
10.在一些可能的实现方式中,摄像头或者视频分析装置还可以获取动作逻辑。其中,所述动作逻辑包括以下参数中的一种或多种:执行所述第一视频分析任务的任务类型参数、执行所述第一视频分析任务的时间参数、执行所述第一视频分析任务的条件参数。
11.任务类型参数用于描述视频分析任务的类型。任务类型可以包括人脸监测(监测指定人脸)、人体监测(监测指定人体)、车辆车牌监测(监测指定车牌)、车辆特征监测(通过特征值监测指定车辆)、人群计数统计、车辆计数统计或者特定行为检测。其中,特定行为可以根据需求而设置,例如,特定行为可以是未佩戴口罩的行为、打架斗殴的行为、占道经营的行为、驾驶车辆时打电话的行为等行为中的任意一种或多种。
12.时间参数用于描述视频分析任务的执行时间。该执行时间可以包括执行开始时间,进一步地,执行时间还可以包括执行持续时间或者执行结束时间。执行开始时间可以根据摄像头之间的距离确定。进一步地,执行开始时间还可以根据目标的速度确定。
13.条件参数可以包括相似度阈值。该相似度阈值可以用于判断第一视频中的目标与第二视频中的待跟踪目标是否为同一目标。其中,相似度阈值可以根据经验值设置,例如可以设置为0.93。
14.其中,动作逻辑也可以用于指示对摄像头的调整逻辑。该调整逻辑包括调整摄像头的方向和/或焦距。例如,在特定行为检测与报警场景中,动作逻辑可以包括调整摄像头的方向和焦距,以便能够聚集目标进行行为检测。
15.摄像头或视频分析装置基于所述动作逻辑和所述第二视频的交互数据,对所述第一视频执行第一视频分析任务,一方面可以实现基于关联区域的视频进行协同分析,另一方面通过动作逻辑执行视频分析任务,可以实现针对性地分析,例如针对人脸进行分析,或者针对人体进行分析,如此可以提高分析效率,进而提高响应效率。
16.在一些可能的实现方式中,摄像头或视频分析装置可以接收由管理装置发送的所述动作逻辑。其中,动作逻辑用于指示对视频的分析逻辑。该动作逻辑可以由管理人员根据所述管理装置提供的编程接口编写。该管理人员可以是具备动作逻辑编写能力的专业人员。
17.在一些可能的实现方式中,所述第一视频的分析结果中包括与所述第二视频的交互数据相关联的数据。如此,摄像头或视频分析装置可以基于与第二视频的交互数据相关联的数据进行分析,而不必对大量的特征值进行搜索和计算即可对目标检测与目标跟踪等任务进行快速响应。由此避免了爆发式的资源消耗,从而避免了爆发式的资源需求,并且提高了响应效率。
18.在一些可能的实现方式中,所述第二视频的交互数据包括出现在所述第二视频中
的待跟踪目标的信息。待跟踪目标的信息可以包括待跟踪目标的属性、特征值或目标图像中的任意一种或多种。考虑到交互数据的传输开销,还可以将目标图像进行存储,然后采用目标图像的存储地址代替交互数据中的目标图像进行传输,如此可以大幅减少传输数据量,降低传输开销。
19.相应地,摄像头或视频分析装置可以对所述第一视频中的目标进行识别,获得所述目标的信息,然后根据所述目标的信息以及所述第二视频中的待跟踪目标的信息,获得所述第一视频的分析结果。所述分析结果包括与所述第二视频中的待跟踪目标的信息相似度满足预设条件的目标的信息。
20.如此可以实现在视频分析阶段,即通过关联区域的视频对目标进行跟踪,避免了目标检测与目标跟踪任务触发时,通过大量的特征值比对和搜索进行目标检测和目标跟踪,避免了爆发式的资源消耗,从而避免了爆发式的资源需求,而且直接根据视频分析阶段的数据对目标检测和目标跟踪任务进行响应,提高了响应效率。
21.在一些可能的实现方式中,摄像头或者视频分析装置可以根据预训练的人工智能模型,例如是人体检测模、人脸检测模型、人群计数模型或者是车辆计数模型,对所述第一视频中的目标进行识别,获得所述目标的信息。
22.利用人工智能模型对第一视频中的目标进行识别,可以实现自动化的视频监控,一方面可以降低人力成本,另一方面可以避免人工盯防导致的失误,由此可以提高视频监控的全面性和准确性。
23.在一些可能的实现方式中,所述第一摄像头与所述第二摄像头之间存在订阅关系。其中,摄像头之间的订阅关系对应着摄像头拍摄的视频的交互数据的订阅关系。例如,第一摄像头订阅第二摄像头,则对第一摄像头拍摄的第一视频进行分析的第一视频分析任务订阅第二摄像头拍摄的第二视频的交互数据。
24.所述订阅关系由管理装置预先构建。具体地,管理装置可以通过不同模式建立摄像头之间的订阅关系,如此,在进行视频分析时,管理装置可以基于订阅关系,向摄像头或者视频分析装置,发送该摄像头订阅的其他摄像头拍摄的视频的交互数据,以便于摄像头或者视频分析装置,基于该交互数据实现协同分析,提高分析效率。
25.在一些可能的实现方式中,上述视频分析方法可以由所述第一摄像头执行。其中,该第一摄像头可以是智能摄像头。类似地,所述第二视频的交互数据可以由所述第二摄像头对所述第二视频执行第二视频分析任务获得。其中,该第二摄像头可以是智能摄像头。
26.在一些可能的实现方式中,所述第一摄像头从所述第二摄像头获取所述第二视频的交互数据,例如摄像头之间通过点对点连接时,摄像头之间可以直接基于订阅关系进行交互数据的收发,而不需要通过管理装置中转。如此,可以提高交互数据的收发效率,而且避免了通过管理装置进行中转导致的资源占用。
27.在一些可能的实现方式中,第一摄像头也可以从管理装置获取第二视频的交互数据。具体地,管理装置可以用于基于订阅关系转发交互数据,摄像头或视频分析装置对第二视频执行第二分析任务,获得第二视频的交互数据,可以将该交互数据上报至管理装置,如此管理装置可以根据订阅关系向第一摄像头下发第二视频的交互数据。如此可以简化摄像头的处理逻辑,降低摄像头的门槛。
28.在一些可能的实现方式中,摄像头或者视频分析装置可以根据所述第一视频的分
析结果生成所述第一视频的交互数据,例如可以将第一视频的分析结果中的部分信息或者全部信息,作为第一视频的交互数据,然后发送所述第一视频的交互数据至管理装置或者第三摄像头。其中,所述第三摄像头与所述第一摄像头之间存在订阅关系。如此,可以实现持续分析,例如实现对目标的持续跟踪。
29.在一些可能的实现方式中,所述方法由视频分析装置执行,所述视频分析装置与所述第一摄像头和所述第二摄像头建立有通信连接。
30.在一些可能的实现方式中,本技术的视频分析方法应用于安防监控。其中,所述第一视频分析任务包括以下任务中的一种或多种:人物检测与跟踪、车辆检测与跟踪、人群计数统计、车辆计数统计、特定行为检测与报警。
31.第二方面,本技术提供了一种视频分析的管理方法。该方法可以由管理装置执行。所述管理装置与多个摄像头通信连接。该管理装置可以是软件装置,该软件装置可以部署在通用的设备,如服务器上。该管理装置也可以是具有管理功能的硬件装置。为了便于描述,本技术以管理装置为软件装置进行示例说明。
32.具体地,所述管理装置接收第二视频的交互数据,其中,所述第二视频由所述第二摄像头拍摄获得,然后所述管理装置将所述第二视频的交互数据发送至所述第一摄像头或者视频分析装置,以使得所述第一摄像头或者所述视频分析装置基于所述第二视频的交互数据对第一视频执行第一视频分析任务。其中,所述第一摄像头和所述第二摄像头之间有订阅关系,且所述第一视频由所述第一摄像头拍摄获得。
33.该方法通过在视频分析任务的执行阶段,就结合其他视频分析任务得出的交互数据进行分析。如此,当应用触发目标搜索与目标跟踪等任务时,可以直接根据视频分析任务的执行阶段存储的数据进行分析,而不必对大量的特征值进行搜索和计算。由此避免了爆发式的资源消耗,从而避免了爆发式的资源需求,而且缩小了分析范围,降低了计算量,提高了分析效率。
34.在一些可能的实现方式中,在所述管理装置接收第二视频的交互数据之前,所述管理装置还可以建立所述至少一个摄像头中的所述第一摄像头与所述第二摄像头的订阅关系。其中,管理装置可以执行一次建立订阅关系的步骤,在对后续任务进行响应时,可以直接基于已建立的订阅关系进行响应,由此避免了不必要的资源浪费,而且提高了响应效率。
35.在一些可能的实现方式中,所述管理装置可以通过预配置模式建立所述至少一个摄像头中的所述第一摄像头与所述第二摄像头的订阅关系。具体地,所述管理装置接收所述第一摄像头发送的订阅指令,其中,所述订阅指令包括订阅参数,该订阅参数例如可以为距离参数,所述管理装置根据所述订阅参数查询满足所述订阅参数的所述第二摄像头,并建立所述第一摄像头与所述第二摄像头的订阅关系。
36.在一些可能的实现方式中,所述管理装置可以通过被动执行模式建立所述至少一个摄像头中的所述第一摄像头与所述第二摄像头的订阅关系。具体地,所述管理装置接收管理人员发送的订阅指令,该订阅指令可以包括待建立订阅关系的摄像头的标识,然后所述管理装置根据所述订阅指令建立所述第一摄像头与所述第二摄像头的订阅关系。
37.如此,管理装置可以通过上述预配置模式或者被动执行模式,在不同阶段建立订阅关系,例如是启动视频分析任务时,或者执行视频分析任务过程中,并基于该订阅关系实
现协同分析,满足了个性化的分析需求。
38.在一些可能的实现方式中,所述管理装置还可以发送动作逻辑至所述第一摄像头或者所述视频分析装置,以使得所述第一摄像头或者所述视频分析装置基于所述第二视频的交互数据和所述动作逻辑对所述第一视频执行所述第一视频分析任务。如此,可以实现基于动作逻辑进行针对性地视频分析,提高分析效率。
39.在一些可能的实现方式中,所述管理装置发送动作逻辑至所述第一摄像头或者所述视频分析装置之前,所述管理装置还可以获取管理人员通过所述管理装置的可编程接口编写的动作逻辑。在一些实施例中,所述管理装置也可以获取用户通过视频分析应用配置的动作逻辑。
40.第三方面,本技术提供了一种视频分析装置。所述装置包括:
41.通信单元,用于获取第一摄像头拍摄的第一视频,以及获取第二视频的交互数据,其中,所述第二视频由第二摄像头拍摄获得;
42.分析单元,用于基于所述第二视频的交互数据,对所述第一视频执行第一视频分析任务,获得所述第一视频的分析结果,其中,所述第二视频的交互数据由对所述第二视频执行第二视频分析任务获得。
43.在一些可能的实现方式中,所述通信单元,还用于:
44.获取动作逻辑,其中,所述动作逻辑包括以下参数中的一种或多种:执行所述第一视频分析任务的任务类型参数、执行所述第一视频分析任务的时间参数、执行所述第一视频分析任务的条件参数;
45.所述分析单元具体用于:
46.基于所述动作逻辑和所述第二视频的交互数据,对所述第一视频执行第一视频分析任务。
47.在一些可能的实现方式中,所述通信单元具体用于:
48.接收由管理装置发送的所述动作逻辑,其中,所述动作逻辑由管理人员根据所述管理装置提供的编程接口编写。
49.在一些可能的实现方式中,所述第一视频的分析结果中包括与所述第二视频的交互数据相关联的数据。
50.在一些可能的实现方式中,所述第二视频的交互数据包括出现在所述第二视频中的待跟踪目标的信息;
51.所述分析单元具体用于:
52.对所述第一视频中的目标进行识别,获得所述目标的信息;
53.根据所述目标的信息以及所述第二视频中的待跟踪目标的信息,获得所述第一视频的分析结果,所述分析结果包括与所述第二视频中的待跟踪目标的信息相似度满足预设条件的目标的信息。
54.在一些可能的实现方式中,所述分析单元具体用于:
55.根据预训练的人工智能模型,对所述第一视频中的目标进行识别,获得所述目标的信息。
56.在一些可能的实现方式中,所述第一摄像头与所述第二摄像头之间存在订阅关系,所述订阅关系由管理装置预先构建。
57.在一些可能的实现方式中,所述分析单元还用于:
58.根据所述第一视频的分析结果生成所述第一视频的交互数据;
59.所述通信单元还用于:
60.发送所述第一视频的交互数据至管理装置或者第三摄像头,其中,所述第三摄像头与所述第一摄像头之间存在订阅关系。
61.第四方面,本技术提供了一种管理装置。所述管理装置与多个摄像头通信连接,所述管理装置包括:
62.通信单元,用于接收第二视频的交互数据,其中,所述第二视频由所述第二摄像头拍摄获得;将所述第二视频的交互数据发送至所述第一摄像头或者视频分析装置,以使得所述第一摄像头或者所述视频分析装置基于所述第二视频的交互数据对第一视频执行第一视频分析任务,其中,所述第一摄像头和所述第二摄像头之间有订阅关系,且所述第一视频由所述第一摄像头拍摄获得。
63.在一些可能的实现方式中,所述装置还包括:
64.订阅单元,用于建立所述至少一个摄像头中的所述第一摄像头与所述第二摄像头的订阅关系。
65.在一些可能的实现方式中,所述订阅单元具体用于:
66.接收所述第一摄像头发送的订阅指令,其中,所述订阅指令包括订阅参数;
67.根据所述订阅参数查询满足所述订阅参数的所述第二摄像头,并建立所述第一摄像头与所述第二摄像头的订阅关系。
68.在一些可能的实现方式中,所述订阅单元具体用于:
69.接收管理人员发送的订阅指令;
70.根据所述订阅指令建立所述第一摄像头与所述第二摄像头的订阅关系。
71.在一些可能的实现方式中,所述通信单元还用于:
72.发送动作逻辑至所述第一摄像头或者所述视频分析装置,以使得所述第一摄像头或者所述视频分析装置基于所述第二视频的交互数据和所述动作逻辑对所述第一视频执行所述第一视频分析任务。
73.在一些可能的实现方式中,所述通信单元还用于:
74.获取管理人员通过所述管理装置的可编程接口编写的动作逻辑,或者,获取用户通过视频分析应用配置的动作逻辑。
75.第五方面,本技术提供一种设备,所述设备包括处理器和存储器。所述处理器、所述存储器进行相互的通信。所述存储器存储可执行的程序代码,所述处理器读取所述存储器存储的所述可执行的程序代码实现本技术第三方面的任一种实现方式所述的视频分析装置的功能,或者实现本技术第四方面的任一种实现方式所述的管理装置的功能。
76.第六方面,本技术提供了一种摄像头。所述摄像头包括处理器、存储器和图像传感器,所述图像传感器用于采集第一视频,所述存储器存储有可执行的程序代码,所述处理器读取所述可执行的程序代码实现本技术第三方面所述的视频分析装置的功能。
77.第七方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,所述指令运行在设备中,该设备实现本技术第三方面的任一种实现方式所述的视频分析装置的功能,或者实现本技术第四方面的任一种实现方式所述的管理装置的功
能。
78.第八方面,本技术提供了一种包含指令的计算机程序产品,当该计算机程序产品中的指令由设备执行时,该设备实现本技术第三方面的任一种实现方式所述的视频分析装置的功能,或者实现本技术第四方面的任一种实现方式所述的管理装置的功能。
79.本技术在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
附图说明
80.为了更清楚地说明本技术实施例的技术方法,下面将对实施例中所需使用的附图作以简单地介绍。
81.图1为本技术实施例提供的一种视频分析方法的应用场景图;
82.图2a为本技术实施例提供的一种应用中触发目标检测或轨迹搜索的界面示意图;
83.图2b为本技术实施例提供的一种轨迹搜索的流程示意图;
84.图3为本技术实施例提供的一种目标的轨迹图;
85.图4为本技术实施例提供的一种视频分析方法的应用场景图;
86.图5为本技术实施例提供的一种视频分析方法的应用场景图;
87.图6为本技术实施例提供的一种视频分析方法的流程图;
88.图7为本技术实施例提供的一种摄像头的位置关系图;
89.图8为本技术实施例提供的一种视频分析的管理方法的流程图;
90.图9为本技术实施例提供的一种视频分析方法的交互流程图;
91.图10为本技术实施例提供的一种视频分析方法的交互流程图;
92.图11为本技术实施例提供的一种视频分析装置的结构示意图;
93.图12为本技术实施例提供的一种管理装置的结构示意图;
94.图13为本技术实施例提供的一种设备的结构示意图;
95.图14为本技术实施例提供的一种设备的结构示意图;
96.图15为本技术实施例提供的一种摄像头的结构示意图。
具体实施方式
97.本技术实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
98.首先对本技术实施例中所涉及到的一些技术术语进行介绍。
99.视频监控是指利用记录地理区域现场状况的视频监控设备(也称为摄像头,摄像头可以是固定设置于某一位置的摄像设备,也可以是无人机中的摄像头、巡视车中的摄像头等)对地理区域进行监控的方法。视频监控从技术上解决了人工盯防(监控人员到现场巡查)的人力成本问题,因而在很多场合得以广泛应用。例如,视频监控可以应用于社区管理、企业管理、道路交通管理等场合,以保障社区居民的人身财产安全、企业资产安全以及交通顺畅。
100.传统的视频监控虽然解决了人工盯防问题,但是仍需要人工查看视频以实现视频
监控。随着视频监控摄像头部署数量的增加,人工查看视频的工作量也随之增加,进而导致人力成本的增加。基于此,业界引入了人工智能(artificial intelligence,ai)技术辅助分析视频,减少人工查看视频的工作量,降低人力成本。
101.人工智能是通过计算机上运行的计算机程序模拟人的思维过程和/或智能行为(如学习、推理、思考、规划等)。作为人工智能的一个分支,深度学习(deep learning,dl)在图像识别等任务中取得了较大的进展。因此,业界主要采用深度学习辅助分析视频,实现视频监控。
102.深度学习通过对数据进行特征提取,以发现数据的深层特征表示,进而对数据进行分类、回归、预测等。深度学习主要应用于人工智能领域的感知、决策等场景,例如图像识别、语音识别、自然语言翻译、计算机博弈等。
103.基于ai的视频监控场景中,视频监控平台先对各个摄像头(例如是安装在不同地理区域的摄像头)拍摄的视频进行解码,得到每个视频对应的图像,接着利用深度学习模型从图像中提取特征向量,并存储该特征向量。该特征向量可以通过一个二进制数据表征,这个二进制数据也称为特征值。当应用触发任务时,例如触发目标搜索与目标跟踪任务时,视频监控平台可以根据任务对存储的特征值进行搜索和计算,例如根据搜索条件对存储的特征值进行搜索,然后分别计算搜索得到的特征值和预设的特征值的相似度,以获得目标的运行轨迹,实现目标搜索和跟踪。
104.然而,视频监控平台在应用触发任务时,根据任务对存储的特征值进行搜索和计算造成爆发式的资源消耗,如此导致爆发式的资源需求。例如,视频监控平台配置高性能计算集群以支持特征值搜索,配置大容量内存以支持特征值比对。这些资源(例如计算资源、内存资源)在特征值搜索、比对以外的其他时间段可能被闲置,导致资源利用率较低。此外,当应用触发任务时,视频监控平台需要进行大量的计算才能得出应用所需的结果(例如:目标的轨迹),导致应用的响应效率比较低下。
105.有鉴于此,本技术实施例提供了一种视频分析方法。当摄像头包括具有分析功能的智能摄像头时,该视频分析方法可以由智能摄像头执行。当摄像头为不具有分析功能的非智能摄像头(也称作普通摄像头)时,该视频分析方法也可以由后台的视频监控平台(例如是视频监控平台中的视频分析装置)执行。
106.具体地,摄像头或视频分析装置可以获取该摄像头拍摄的视频(为了便于描述,本技术实施例称为第一视频),以及获取其他摄像头拍摄的视频(为了便于描述,本技术实施例称为第二视频)的交互数据,其中,交互数据通过对视频执行视频分析任务获得,然后摄像头或视频分析装置基于该第二视频的交互数据,对第一视频执行第一视频分析任务,获得第一视频的分析结果。
107.该方法通过在视频分析任务的执行阶段,就结合其他视频分析任务得出的交互数据进行分析。如此,当应用触发目标搜索与目标跟踪等任务时,可以直接根据视频分析任务的执行阶段存储的数据(例如是对第一视频执行第一视频分析任务所得的、与第二视频的交互数据相关联的数据)进行分析,而不必对大量的特征值进行搜索和计算。一方面避免了爆发式的资源消耗,从而避免了爆发式的资源需求,无需配置高性能计算集群以及大容量资源即可满足需求,提高了资源利用率,降低了成本;另一方面,基于第二视频的交互数据对第一视频进行分析,实现了协同分析,缩小了分析范围,降低了计算量,提高了分析效率。
108.例如:在目标的搜索与跟踪任务的场景中,在对摄像头拍摄的第一视频进行分析时,获取其他摄像头拍摄到的第二视频的交互数据,交互数据中可以包括需要被跟踪的目标的类型、颜色、以及特征值。将交互数据应用于第一视频的分析时,可以将第一视频拍摄到的所有目标进行检测与特征提取,进而分别与交互数据中被跟踪的目标的类型、颜色、以及特征值进行比较,确定第一视频中与被跟踪的目标相似度满足预设条件的目标的信息,获得分析结果。进而第一视频的分析结果可以上报给管理装置,或者继续基于分析结果生成第一视频的交互数据用于其他视频的分析任务。
109.需要说明的是,该方法并非针对特定业务开发的视频分析方法,可以广泛应用于各种视频监控场景。例如可以应用于刑侦场景对犯罪嫌疑人进行跟踪,或者应用于治安管理场景对违反治安管理条例的事件(如打架斗殴)进行监控,或者应用于交通管理场景对肇事车辆进行监控,或者是应用于商场管理场景对重要顾客(very important person,vip)进行识别,以及对密集人流进行疏散,从而实现人流优化。
110.为了使得本技术的技术方案更加清楚、易于理解,下面结合附图对本技术的应用场景进行介绍。
111.参见图1所示的视频分析方法的应用场景示意图,该场景中包括多个摄像头100以及视频监控平台200、应用300,多个摄像头100分别与视频监控平台200建立有通信连接,视频监控平台200与应用300建立有通信连接。
112.其中,应用300可以是视频分析应用,该视频分析应用可以提供轨迹搜索、目标检测、目标跟踪、目标计数、特定行为检测与报警等功能中的任意一种或多种。其中,目标可以是人、车辆、动物等实体,特定行为是指预先设定的可检测行为,如打架斗殴、佩戴口罩等行为。基于视频监控平台200,视频分析应用可以提供人物检测与跟踪、车辆检测与跟踪、人群计数统计、车辆、特定行为检测与报警等功能。在本实施例中,应用300可以是用于实现轨迹搜索或者目标检测等功能的专用客户端,也可以是用于提供轨迹搜索服务、目标检测服务的浏览器。
113.应用300可以提供交互界面。该交互界面可以是图形用户界面(graphical user interface,gui)或者命令用户界面(command user interface,cui)。为了便于理解,下面以交互界面为gui进行示例说明。
114.如图2a所示,应用300通过gui向用户呈现多个摄像头100拍摄的视频,如摄像头1至摄像头n拍摄的视频1至n。gui中还承载有目标检测控件、轨迹搜索控件。用户(具体是使用应用300的人员,如安保人员、侦查人员)可以通过目标检测控件、轨迹搜索控件触发目标检测操作、轨迹搜索操作。以用户触发轨迹搜索操作为例,用户可以触发轨迹搜索控件,输入待搜索的目标的图像,从而触发对该目标的轨迹搜索操作,应用300可以响应于对目标的轨迹搜索操作,向视频监控平台200发送轨迹搜索请求。
115.视频监控平台200包括管理装置202和存储与搜索装置204。当与视频监控平台200连接的多个摄像头100包括普通摄像头(即不能进行视频的分析和处理的摄像头)时,视频监控平台200还可以包括视频分析装置206。视频分析装置206用于对视频头100拍摄的视频执行视频分析任务。当与视频监控平台200连接的多个摄像头100均为智能摄像头(即能够进行视频的分析和处理的摄像头)时,视频分析装置206的功能也可以由智能摄像头执行。
116.管理装置202用于建立多个摄像头100中各个摄像头之间的订阅关系。例如:第一
摄像头和第二摄像头为不同地理位置的摄像头,管理装置202可以接收第一摄像头发送的订阅指令,该订阅指令包括订阅参数,管理装置202可以根据订阅参数查询满足该订阅参数的第二摄像头,建立第一摄像头与第二摄像头的订阅关系。
117.第一摄像头拍摄第一视频,第二摄像头拍摄第二视频。第二摄像头或者视频分析装置206可以对第二视频执行第二视频分析任务,获得第二视频的交互数据。其中,交互数据用于在视频分析任务之间交互,或者用于在摄像头之间交互。具体地,管理装置202还用于接收第二视频的交互数据,根据第一摄像头和第二摄像头的订阅关系,向第一摄像头或者视频分析装置206发送第二视频的交互数据。如此,第一摄像头或者视频分析装置206可以基于该第二视频的交互数据,对第一视频执行第一视频分析任务,得到第一视频的分析结果。第一视频的分析结果中包括与所述第二视频的交互数据相关联的数据。
118.在一些可能的实现方式中,管理装置202还包括编程接口单元,用于获取管理人员通过可编程接口编写的动作逻辑。管理装置202用于发送动作逻辑至各个摄像头或视频分析装置206。其中,动作逻辑用于指示对视频的分析逻辑。动作逻辑可以包括执行视频分析任务的任务类型参数、执行视频分析任务的时间参数和执行视频分析任务的条件参数中的任意一种或多种。例如,第一摄像头或视频分析装置206可以根据针对第一视频分析任务的动作逻辑和第二视频的交互数据,对第一视频执行第一视频分析任务,从而获得与第二视频的交互数据相关联的数据。
119.存储与搜索装置204用于存储对各个视频分析后的分析结果,例如:第二视频的分析结果,以及第一视频的分析结果。其中,不同视频的分析结果存在关联关系。例如:第一视频的分析结果是与第二视频的交互数据存在关联的分析结果,则在存储于搜索装置204中第一视频的分析结果与第二视频的分析结果存在关联关系,该关联关系可以通过共同拥有一个关联标识来体现,或者通过关系表的方式体现,本技术不对此作限定。另外,第一视频的分析结果还可以用于生成第一视频的交互数据,该第一视频的交互数据可以被发送至管理装置202或者与第一摄像头存在订阅关系的其他摄像头(例如第三摄像头),用于对第三摄像头拍摄的第三视频进行分析。相应地,第三摄像头拍摄的第三视频的分析结果是与第一视频的交互数据存在关联的分析结果,也即第三视频的分析结果与第一视频的分析结果也存在关联关系。
120.存储与搜索装置204还可以提供搜索接口,通过该搜索接口可以接收搜索条件,进而根据搜索条件搜索出满足上述搜索条件的数据。例如,存储与搜索装置204支持通过时间、地理位置(例如摄像头所在位置)、摄像头标识、属性、特征值、图像等进行搜索。需要说明的是,当存储与搜索装置204基于图像进行搜索时,可以先将图像转换为特征值,然后再进行搜索。
121.存储与搜索装置204还用于响应于轨迹搜索请求,根据第二视频的交互数据以及与第二视频的交互数据相关联的数据生成目标的轨迹。例如,参见图2b,用户需要获取一个被跟踪的目标的轨迹时,第一摄像头、第二摄像头和第三摄像头由于互相进行了订阅,当第二摄像头发现了被跟踪的目标时,发送第二视频的交互数据至第一摄像头,第一摄像头基于第二视频的交互数据对第一视频进行分析,也发现被跟踪的目标,然后发送该第一视频的交互数据至第三摄像头,第三摄像头基于第一视频的交互数据对第三视频进行分析,发现被跟踪的目标。其中,第二视频的分析结果、第一视频的分析结果以及第三视频的分析结
果可以通过关系表的方式存储在存储与搜索装置204,上述分析结果相互关联。基于上述相互关联的分析结果,当需要搜寻被跟踪目标的轨迹时,可以更方便地获得被跟踪的目标的轨迹,而不需要进行大量的特征值搜索和比对操作,避免了爆发式的资源消耗,避免了爆发式的资源需求,提高了资源利用率,而且无需进行大量的计算,提高了分析效率。
122.进一步地,存储与搜索装置204还可以向应用300返回目标的轨迹,以便应用300通过用户界面如gui向用户呈现目标的轨迹。具体可以参见图3所示的目标的轨迹的界面示意图,应用300可以获取多个摄像头100的地理位置,基于多个摄像头100的地理位置生成摄像头100的分布示意图,然后在摄像头100的分布示意图上显示目标的轨迹。如图3所示,摄像头100通过圆圈表征。当某个摄像头检测出目标后,则在分布示意图中与该摄像头的对应位置显示人像,用于表征目标在该位置出现。应用300可以按照检测到目标出现的时间顺序,在分布示意图中通过有向箭头依次连接对应的目标,基于多个有向箭头形成的路径呈现目标的轨迹。
123.在另一些可能的实现方式中,视频监控平台200中管理装置202的功能也可以由应用300实现。参见图4所示的视频分析方法的应用场景示意图,该场景中包括多个摄像头100以及视频监控平台200和应用300。其中,视频监控平台200包括存储与搜索管理装置204,进一步地,视频监控平台200还包括视频分析装置206。存储与搜索管理装置204以及视频分析装置206的功能参见图1所示实施例相关内容描述。应用300还用于实现图1所示实施例中管理装置202的功能。
124.具体地,应用300包括管理装置302。管理装置302可以是应用300的一个功能模块、插件、小程序等等。管理装置302用于接收管理人员发送的订阅指令,根据该订阅指令建立所述第一摄像头与所述第二摄像头的订阅关系。如此,管理装置302可以根据订阅关系,向第一摄像头或者视频分析装置206发送第二视频的交互数据。其中,管理装置由应用300实现时,可以是应用300的用户充当管理人员的身份,也可以是应用300的用户在使用应用300的功能之前,由专业的管理人员对应用300进行配置。管理装置独立于应用300时,管理人员通常不是应用300的用户,而是用于建立订阅关系、配置动作逻辑的专业人员。
125.在一些可能的实现方式中,管理装置302还用于获取管理人员或者用户通过应用300配置的动作逻辑,向第一摄像头或视频分析装置206发送动作逻辑。相应地,第一摄像头或视频分析装置206可以根据动作逻辑,以及第二视频的交互数据,对第一视频执行第一视频分析任务,从而获得第一视频的分析结果。在图1所示场景中,摄像头100可以是枪机、球机,也可以是是闸机或门禁系统上的摄像头。进一步地,摄像头100可以是安装在固定位置的摄像头,也可以是附属在移动工具的摄像头,例如无人机上的摄像头、车载设备上的摄像头。
126.应用300可以部署在终端中。终端包括但不限于台式机、笔记本电脑、平板电脑、智能手机或者智能穿戴设备。其中,智能穿戴设备可以包括智能手表、智能手环、智能眼镜等。
127.视频监控平台200可以部署在云环境,也可以部署在本地数据中心。其中,云环境指示云服务提供商拥有的,用于提供计算、存储、通信资源的云计算集群。云计算集群可以包括中心云和边缘云,中心云包括至少一个中心计算设备(例如中心服务器),边缘云包括至少一个边缘计算设备(例如边缘服务器)。本地数据中心是指用户所属的数据中心。本地数据中心包括至少一个本地计算设备,例如包括至少一个本地服务器。
128.视频监控平台200的各个部分可以集中式地部署在云环境或本地数据中心,也可以分布式地部署在云环境或本地数据中心。本技术实施例以视频监控平台200分布式地部署在云环境进行示例说明。
129.参见图5所示的视频分析方法的系统架构示意图,视频监控平台200的视频分析装置206部署在边缘云中,视频监控平台200的管理装置202和存储与搜索装置204部署在中心云中。云环境中的视频监控平台200可以对摄像头100拍摄的视频进行协同分析。应用300部署在终端。终端可以运行应用300,与云环境中的视频监控平台200交互,从而实现视频监控。
130.当视频监控平台200部署在云环境,视频分析方法可以以云服务的方式提供给用户使用。具体地,云环境中运行视频监控平台200的实例,应用300可以响应于用户触发的应用操作,例如:轨迹搜索操作,与视频监控平台200的实例交互,从而实现应用的功能。
131.当视频监控平台200部署在本地数据中心,具体地,用户可以在本地服务器中安装视频监控平台200的软件包,然后运行已安装好的视频监控平台200,从而实现本技术实施例的视频分析方法。在一些实施例中,上述软件包也可以是免安装软件包,用户可以直接在服务器中运行上述免安装软件包,从而实现本技术实施例的视频分析方法。
132.接下来,以视频监控场景中,与视频监控平台200相关联的摄像头为普通摄像头,因此由视频监控平台206对各个摄像头拍摄的视频执行视频分析任务为例,对本技术实施例提供的视频分析方法进行详细说明。
133.参见图6所示的视频分析方法的流程图,该方法包括:
134.s602:视频分析装置206获取第一摄像头拍摄的第一视频。
135.第一摄像头具体是监控区域部署的多个摄像头中的任意一个或多个摄像头。监控区域是摄像头所覆盖的地理区域。在一些实施例中,监控区域可以包括商场、小区、公司、道路等地理区域中的任意一种或多种。第一摄像头拍摄的视频称作第一视频。
136.视频分析装置206可以实时获取第一摄像头拍摄的第一视频,也可以接收第一摄像头主动上报的第一视频,或者是周期性地从第一摄像头获取第一视频。另外考虑到传输效率,第一摄像头可以对第一视频进行压缩,得到第一压缩视频,视频分析装置206可以获取第一压缩视频,然后对该第一压缩视频进行解压缩,从而得到第一视频。
137.s604:视频分析装置206获取第二视频的交互数据。
138.第二视频由第二摄像头拍摄获得。第二摄像头是监控区域部署的多个摄像头中的一个或多个摄像头。第二摄像头和第一摄像头是不同地理位置的摄像头。交互数据是用于描述视频内容的信息,具体是描述视频中出现的目标的信息。其中,目标是指物理世界中客观存在的物体,例如目标可以是人、动物等可移动的生物体或者车辆等可移动的非生物体。
139.第二视频的交互数据可以通过对第二视频执行第二视频分析任务获得。根据视频分析任务不同,交互数据类型可以是不同的。下面结合不同视频分析任务,对交互数据进行示例说明。
140.例如,视频分析任务为目标检测、目标跟踪时,交互数据可以是目标的属性、特征值或目标图像中的任意一种或多种。考虑到交互数据的传输开销,视频分析装置206还可以将目标图像进行存储,然后采用目标图像的存储地址代替交互数据中的目标图像进行传输,如此可以大幅减少传输数据量,降低传输开销。其中,存储地址可以通过二进制、编码值
(如base64编码值)或者统一资源定位符(uniform resource locator,url)表征。
141.目标的属性是对目标的抽象方面的刻画。例如,目标为人时,目标的属性可以包括目标的类型为人、人的性别、人的身高以及人的衣着(例如包括衣服、鞋子、帽子和/或眼镜的类型、颜色)中的任意一种或多种。又例如,目标为车辆时,目标的属性可以包括目标的类型为车辆、车牌号、车辆类型、车辆颜色等。
142.特征值是指表达目标特征的值。特征值可以是对图像进行特征提取所得的特征向量,或者是张量,或者是基于上述特征向量所得的二进制值。为了提高精度、减少计算量,视频分析装置206可以对图像中目标的特定部位进行特征提取得到特征值。例如,目标的类型为人时,视频分析装置206可以对人脸进行特征提取得到特征值。
143.目标图像是指视频流中包括目标的图像帧。在一些可能的实现方式中,目标图像还可以是目标的图像帧中目标的特定部位的图像。例如,目标为人时,目标图像可以包括人脸图像、人体图像等等。
144.又例如,视频分析任务为目标计数统计(例如人群计数统计、车辆计数统计)时,交互数据还可以包括目标的数量、密集度等中的任意一种或多种。其中,密集度用于衡量目标的密集程度,通常可以通过单位面积的区域内目标的数量表征。视频分析任务为特定行为检测与报警时,交互数据还可以包括目标的行为等。
145.在火车站、地铁站、广场等地理区域,视频分析装置206还可以通过ai模型对上述地理区域中的人数进行检测,当人数超过设定的第一阈值时,可以进行风险提示,如提醒踩踏风险较高等等。又例如,在道路、停车场等地理区域,视频分析装置206还可以通过ai模型对上述地理区域中车辆的数量进行检测,当车辆的数量超过设定的第二阈值时,可以提示用户绕路行驶或者到其他地理区域停车。其中,第一阈值和第二阈值可以根据经验值设置,本技术实施例对此不作限定。
146.为了便于理解,本技术实施例还提供了交互数据的一个示例。如下所示:
[0147][0148][0149]
在上述示例中,交互数据包括目标的属性(例如包括类型为人、人的性别、上衣颜色)、人脸特征值和人脸图像的编码值。交互数据中还包括数据标识,数据标识用于唯一地标识该交互数据。
[0150]
在目标跟踪场景下,第二视频的交互数据包括第二视频中出现的待跟踪目标的信息。在一些实施例中,视频分析装置206可以在第二视频中出现的目标与预设的监测目标匹
配时,确定该第二视频中出现的目标为待跟踪目标。其中,视频分析装置206可以对第二视频中出现的目标进行特征提取,以及对监测目标的图像进行特征提取,然后计算特征值的距离,基于该距离确定第二视频中出现的目标是否与监测目标匹配。在另一些实施例中,视频分析装置206可以响应于用户对第二视频中出现的目标的指定操作,将该目标确定为待跟踪目标。例如:应用300可以向用户呈现第二视频,用户可以指定第二视频中出现的某个目标,应用300可以将向视频分析装置206上报用户触发的对目标的指定操作。视频分析装置206可以响应于用户触发的对目标的指定操作,将用户指定的目标确定为待跟踪目标。
[0151]
在一些可能的实现方式中,第一摄像头和第二摄像头之间存在订阅关系。对应地,第一摄像头拍摄的第一视频的交互数据和第二摄像头拍摄的第二视频的交互数据存在订阅关系。视频分析装置206可以接收管理装置202基于上述订阅关系发送的第二视频的交互数据。
[0152]
该订阅关系可以由管理装置202预先构建。其中,管理装置202可以通过多种模式建立订阅关系。下面对不同模式分别进行详细说明。
[0153]
一种模式为预配置模式。具体地,管理装置202接收所述第一摄像头发送的订阅指令,其中,所述订阅指令包括订阅参数,然后管理装置202根据所述订阅参数查询满足所述订阅参数的所述第二摄像头,并建立所述第一摄像头与所述第二摄像头的订阅关系。
[0154]
其中,订阅参数可以包括距离参数。当视频分析装置206启动第一视频分析任务时,第一摄像头可以向管理装置202发送订阅指令,该订阅指令包括如下订阅参数:周边距离小于等于n千米(kilometer,km)。该订阅参数为距离参数,其中,n大于0。n可以根据经验值设置,例如可以取值为2,对应地,该订阅参数可以表示为listener.add(nearby<2km,face_data)。如此,管理装置202可以根据摄像头100之间的位置关系以及上述距离参数,确定满足订阅参数的第二摄像头,从而建立第一摄像头和第二摄像头的订阅关系。
[0155]
进一步地,管理装置202还可以在距离基础上,结合历史平均车速和/或步行时间更精准地确定与第一摄像头具有订阅关系的第二摄像头。例如,在肇事车辆跟踪场景中,可以基于距离和历史平均车速将未来1小时内可能发现该车辆的摄像头与第一摄像头建立订阅关系。又例如,在人物跟踪场景中,可以基于距离和步行时间将未来1小时内可能发现该行人的摄像头与第一摄像头建立订阅关系。
[0156]
其中,摄像头100之间的距离、历史平均车速和步行时间等可以以图的方式进行存储,具体是存储在图数据库中。图7提供了摄像头100的位置关系图的一个示例,如图7所示,每个摄像头100作为图的节点,摄像头100之间的距离以及两个摄像头100之间的历史平均车速可以作为图的边进行存储。
[0157]
另一种模式为被动执行模式。具体地,管理装置202接收管理人员发送的订阅指令,管理装置202根据所述订阅指令建立所述第一摄像头与所述第二摄像头的订阅关系。在一些场景中,管理人员可以通过可编程接口生成订阅指令,该订阅指令可以包括待建立订阅关系的摄像头100的标识,然后向管理装置202发送订阅指令,如此管理装置202可以基于上述订阅指令直接建立第一摄像头和第二摄像头的订阅关系。视频分析装置206在进行视频分析时,可以被动接收其他视频分析任务的交互数据,例如是第二视频的交互数据。进一步地,视频分析装置206还可以接收动作逻辑,按照该动作逻辑对第一视频执行第一视频分析任务。例如,视频分析装置206可以按照动作逻辑对第一视频进行人脸监测、人体监测等。
[0158]
在一些可能的实现方式中,订阅关系也可以是摄像头100通过交流模式建立。具体地,摄像头100之间可以相互通信,如此,摄像头100之间也可以基于距离等信息建立订阅关系。例如,第一摄像头可以向其他摄像头广播订阅请求消息,该广播订阅请求消息用于请求与第一摄像头距离在2km以内的摄像头建立订阅关系,接收到该订阅请求消息的摄像头可以确定是否在2km以内,若是,则返回订阅响应消息。如此,第一摄像头建立与第二摄像头的订阅关系。然后第一摄像头还可以向管理装置202向上报建立的订阅关系。
[0159]
考虑到安全性,在建立订阅关系之前,管理装置202还可以对订阅权限进行认证。当订阅权限认证通过时,管理装置202允许建立订阅关系,当订阅权限认证不通过时,管理装置202拒绝建立订阅关系。其中,订阅关系由摄像头100之间通过交流模式建立时,则可以由摄像头100进行订阅权限认证。其中,订阅权限认证可以通过基于公私钥对的签名验证机制实现。
[0160]
需要说明的是,上述s602、s604可以并行执行,也可以按照设定顺序先后执行,例如视频分析装置206可以先执行s602再执行s604,或者是先执行s604再执行s602,本技术实施例仅以先执行s602再执行s604进行示例说明。
[0161]
s606:视频分析装置206基于第二视频的交互数据,对第一视频执行第一视频分析任务,获得第一视频的分析结果。
[0162]
第二视频的交互数据包括出现在第二视频中的目标的相关数据,例如包括目标的属性、目标的特征值、目标图像、目标的数量或者目标的密集度等。视频分析装置206可以基于交互数据,通过ai模型对第一视频执行第一视频分析任务,获得第一视频的分析结果,第一视频的分析结果中包括与第二视频的交互数据相关联的数据。
[0163]
具体地,视频分析装置206可以对第一视频中的目标进行识别,例如可以通过预训练的ai模型对第一视频中的目标进行识别,获得目标的信息。预训练的ai模型可以包括人脸检测模型、人体检测模型、人群计数模型、车辆计数模型等。然后视频分析装置206根据目标的信以及第二视频中的待跟踪目标的信息,获得第一视频的分析结果。其中,分析结果包括与所述第二视频中的待跟踪目标的信息相似度满足预设条件的目标的信息。相似度满足预设条件可以是相似度达到预设的相似度阈值,或者是相似度达到最大等。下面以人物检测与追踪场景进行示例说明。具体地,视频分析装置206可以对第一视频中的人物进行识别,获得第一视频中至少一个人物的信息。其中,人物的信息可以包括性别、上衣颜色、人脸特征值和人脸图像中的至少一个。视频分析装置206将第一视频中至少一个人物的信息分别与第二视频中的待跟踪人物的信息进行比对,例如可以分别计算人脸特征值的相似度,当相似度达到预设的相似度阈值(例如是0.95)时,确定第一视频中的该人物为待跟踪人物,视频分析装置206可以根据该人物的信息获得第一视频的分析结果。
[0164]
在一些可能的实现方式中,视频分析装置206还可以获取动作逻辑,例如是接收管理装置202下发的动作逻辑,该动作逻辑可以是管理人员根据管理装置202提供的编程接口编写,然后视频分析装置206基于动作逻辑和第二视频的交互数据,对第一视频执行第一视频分析任务,得到第一视频的分析结果。
[0165]
其中,动作逻辑用于指示对视频的分析逻辑。动作逻辑可以包括以下参数中的一种或多种:执行视频分析任务的任务类型参数、执行视频分析任务的时间参数、执行视频分析任务的条件参数。
[0166]
任务类型参数用于描述视频分析任务的类型。任务类型可以包括人脸监测(监测指定人脸)、人体监测(监测指定人体)、车辆车牌监测(监测指定车牌)、车辆特征监测(通过特征值监测指定车辆)、人群计数统计、车辆计数统计或者特定行为检测。其中,特定行为可以根据需求而设置,例如,特定行为可以是未佩戴口罩的行为、打架斗殴的行为、占道经营的行为、驾驶车辆时打电话的行为等行为中的任意一种或多种。
[0167]
时间参数用于描述视频分析任务的执行时间。该执行时间可以包括执行开始时间,进一步地,执行时间还可以包括执行持续时间或者执行结束时间。执行开始时间可以根据摄像头100之间的距离确定,例如摄像头之间的距离为2km时,可以基于距离和速度确定在100秒(second)后开始执行上述视频分析任务。
[0168]
条件参数可以包括相似度阈值。该相似度阈值可以用于判断第一视频中的目标与第二视频中的待跟踪目标是否为同一目标。例如,目标和待跟踪目标的相似度大于上述相似度阈值时,则确定为同一目标,否则为不同目标。其中,相似度阈值可以根据经验值设置,例如可以设置为0.93。
[0169]
在另一些可能的实现方式中,动作逻辑也可以用于指示对摄像头100的调整逻辑。该调整逻辑包括调整摄像头100的方向和/或焦距。例如,在特定行为检测与报警场景中,动作逻辑可以包括调整摄像头100的方向和焦距,以便能够聚集目标进行行为检测。
[0170]
下面以目标跟踪场景对视频分析装置206基于动作逻辑和第二视频的交互数据,对第一视频执行第一视频分析任务进行示例说明。
[0171]
具体地,视频分析装置206接收管理装置202下发的动作逻辑如下所示:
[0172][0173][0174]
视频分析装置206可以根据上述动作逻辑在100s之后检测第一视频中的目标,获得目标的属性、目标的特征值、目标图像等信息。视频分析装置206通过比较第一视频中的目标的信息(属性、特征值或目标图像)和第二视频中待跟踪目标的信息,确定第一视频中的目标与第二视频中的待跟踪目标的相似度,将该相似度与相似度阈值进行比较,从而确定是否为同一目标。当第二视频中出现的目标与第一视频中出现的目标为同一目标时,视频分析装置206可以根据视频源位置(具体是摄像头100的位置)生成目标的轨迹,由此实现目标检测与跟踪。
[0175]
在一些可能的实现方式中,第三摄像头与第一摄像头之间存在订阅关系。该订阅
关系的建立过程可以参见上文相关内容描述。视频分析装置206还可以根据第一视频的分析结果生成所述第一视频的交互数据。第一视频的交互数据可以包括出现在第一视频中的目标的信息。该交互数据可以包括目标的属性、目标的特征值或者目标图像中的任意一种或多种。然后视频分析装置206可以发送所述第一视频的交互数据至管理装置202。如此,管理装置202在对第三摄像头拍摄的第三视频进行分析时,可以结合上述第一视频的交互数据对第三视频执行第三视频分析任务。
[0176]
基于上述内容描述,本技术实施例提供的视频分析方法通过在视频分析任务的执行阶段,就结合其他视频分析任务得出的交互数据进行分析,获得与上述交互数据相关联的数据,如此,当应用触发目标搜索与目标跟踪等任务时,可以直接根据视频分析任务的执行阶段存储的相关联的数据进行视频分析,而不必对大量的特征值进行搜索和计算。一方面避免了爆发式的资源消耗,从而避免了爆发式的资源需求,无需配置高性能计算集群以及大容量资源即可满足需求,提高了资源利用率,降低了成本;另一方面,基于第二视频的交互数据对第一视频进行分析,实现了协同分析,缩小了分析范围,降低了计算量,提高了分析效率。
[0177]
图6所示实施例是从视频分析装置206的角度进行对视频分析方法进行介绍,当摄像头为智能摄像头时,上述视频分析方法也可以由各个摄像头自身(例如是第一摄像头)执行。具体地,第一摄像头获取第一视频,然后获取第二视频的交互数据,接着第一摄像头基于第二视频的交互数据,对第一视频执行第一视频分析任务。在一些实施例中,视频分析方法也可以由摄像头和视频分析装置206协同执行。
[0178]
其中,第一摄像头可以从管理装置202获取第二视频的交互数据,例如是接收管理装置202基于第一摄像头和第二摄像头的订阅关系发送的第二视频的交互数据。在一些实施例中,第二摄像头可以为智能摄像头,第二摄像头可以对第二视频执行第二视频分析任务,获得第二视频的交互数据。对应地,第一摄像头也可以从第二摄像头获取第二视频的交互数据。
[0179]
在一些可能的实现方式中,第一摄像头还可以获取动作逻辑,例如是接收管理装置202发送的动作逻辑,然后基于所述动作逻辑和所述第二视频的交互数据,对所述第一视频执行第一视频分析任务,得到第一视频的分析结果。
[0180]
其中,第一摄像头在接收到管理装置202发送的动作逻辑时,还可以检测是否具备该动作逻辑对应的功能。若具备,则第一摄像头可以基于动作逻辑和所述第二视频的交互数据,对所述第一视频执行第一视频分析任务;若不具备,则第一摄像头可以将动作逻辑转发至视频分析装置206,由视频分析装置206基于动作逻辑和所述第二视频的交互数据,对所述第一视频执行第一视频分析任务。
[0181]
进一步地,第三摄像头与第一摄像头之间存在订阅关系。第一摄像头还可以根据第一视频的分析结果生成第一视频的交互数据,然后发送第一视频的交互数据至第三摄像头。如此,第三摄像头在对该第三摄像头拍摄的第三视频进行分析时,可以结合第一视频的交互数据进行协同分析。如此可以实现对目标的持续跟踪。
[0182]
还需要说明的是,图6所示实施例中订阅关系的建立以及动作逻辑的下发是以管理装置202实现进行示例说明。当摄像头100之间为点对点(peer to peer,p2p)连接时,摄像头100之间可以直接进行交互数据的订阅以及动作逻辑的下发。
[0183]
在一些可能的实现方式中,订阅关系的建立以及动作逻辑的下发也可以由视频分析应用(例如图1中的应用300)实现。视频分析应用可以提供动作逻辑配置界面,该界面可以是gui或者是cui,用户可以通过该动作逻辑配置界面配置动作逻辑。如此,视频分析应用可以获取动作逻辑,然后下发至对应的摄像头,或者是下发至视频分析装置206。类似地,视频分析应用可以采用预配置模式或被动执行模式建立摄像头100之间的订阅关系。
[0184]
以上对视频分析方法进行了详细介绍,接下来从管理装置(例如是管理装置202)的角度对视频分析的管理方法进行介绍。
[0185]
参见图8所示的视频分析的管理方法的流程图,该方法包括:
[0186]
s802:管理装置202建立多个摄像头中的第一摄像头与第二摄像头的订阅关系。
[0187]
管理装置202可以通过多种模式建立第一摄像头与第二摄像头的订阅关系,例如可以通过预配置模式和/或被动执行模式建立第一摄像头和第二摄像头的订阅关系。下面对预配置模式和被动执行模式分别进行详细说明。
[0188]
预配置模式下,管理装置202接收所述第一摄像头发送的订阅指令,其中,所述订阅指令包括订阅参数,然后管理装置202根据所述订阅参数查询满足所述订阅参数的所述第二摄像头,并建立所述第一摄像头与所述第二摄像头的订阅关系。其中,订阅参数可以包括距离参数。
[0189]
具体地,当第一摄像头或视频分析装置206启动第一视频分析任务时,第一摄像头可以向管理装置202发送订阅指令。该订阅指令包括订阅参数,例如包括表征与第一摄像头的距离小于设定距离的距离参数。如此,管理装置202可以根据摄像头100之间的位置关系以及上述距离参数,确定满足订阅参数的第二摄像头,从而建立第一摄像头和第二摄像头的订阅关系。
[0190]
进一步地,管理装置202还可以在距离基础上,结合历史平均车速和/或步行时间更精准地确定与第一摄像头具有订阅关系的第二摄像头。
[0191]
被动执行模式下,管理装置202接收管理人员发送的订阅指令,根据所述订阅指令建立所述第一摄像头与所述第二摄像头的订阅关系。在一些场景中,管理人员可以通过可编程接口生成订阅指令,该订阅指令可以包括待建立订阅关系的摄像头100的标识,然后向管理装置202发送订阅指令,如此管理装置202可以基于上述订阅指令直接建立第一摄像头和第二摄像头的订阅关系。
[0192]
需要说明的是,执行本技术实施例的视频分析管理方法也可以不执行上述s802。例如,在建立第一摄像头和第二摄像头的订阅关系之后,管理装置202可以基于该订阅关系执行后续的任务,而不必针对每个任务均建立订阅关系。
[0193]
s804:管理装置202接收第二视频的交互数据。
[0194]
第二视频是第二摄像头拍摄的视频。第二视频的交互数据可以是第二摄像头或者视频分析装置206对第二视频执行第二视频分析任务获得。管理装置202可以从第二摄像头或者视频分析装置206获取第二视频的交互数据。
[0195]
第二视频的交互数据可以包括出现在第二视频中的待跟踪目标的信息。其中,待跟踪目标可以是指定的目标,也可以是第二摄像头或者视频分析装置206将第二视频中出现的目标与监测目标进行匹配,确定的目标。
[0196]
根据视频分析任务不同,交互数据类型可以是不同的。下面结合不同视频分析任
务,对交互数据进行示例说明。
[0197]
例如,第二视频分析任务为目标检测与目标跟踪(人物检测与跟踪、车辆检测与跟踪等)时,第二视频的交互数据可以是待跟踪目标的属性、特征值、图像等信息中的任意一种或多种。又例如,第二视频分析任务为目标计数统计(人群计数统计、车辆计数统计等)时,第二视频的交互数据可以是目标的数量或者目标的密集度等信息中的一种或多种。
[0198]
上述s802、s804可以并行执行,也可以按照设定顺序先后执行,例如视频分析装置206可以先执行s802再执行s804,或者是先执行s804再执行s802,本技术实施例仅以先执行s802再执行s804进行示例说明。
[0199]
s806:管理装置202根据所述订阅关系,将所述第二视频的交互数据发送至所述第一摄像头或者视频分析装置206。
[0200]
当第一摄像头为普通摄像头(不具有视频分析功能)时,管理装置202基于第一摄像头和第二摄像头的订阅关系,将第二视频的交互数据发送至视频分析装置206。如此,视频分析装置206可以基于第二视频的交互数据对第一视频执行第一视频分析任务。
[0201]
当第一摄像头为智能摄像头(具有视频分析功能)时,管理装置202基于第一摄像头和第二摄像头的订阅关系,将第二视频的交互数据发送至第一摄像头。在一些实施例中,管理装置202也可以将第二视频的交互数据发送至视频分析装置206。如此,第一摄像头或者视频分析装置206可以基于第二视频的交互数据对第一视频执行第一视频分析任务。
[0202]
在一些可能的实现方式中,管理装置202还可以发送动作逻辑至所述第一摄像头或者视频分析装置,以使得所述第一摄像头或者所述视频分析装置基于所述第二视频的交互数据和所述动作逻辑对第一视频执行第一视频分析任务。
[0203]
在管理装置202发送动作逻辑至所述第一摄像头或者视频分析装置之前,所述管理装置202可以获取管理人员通过可编程接口编写的动作逻辑。在一些实施例中,动作逻辑也可以是由视频分析应用配置。
[0204]
为了使得本技术的技术方案更加清楚、易于理解,下面将结合具体应用场景,从交互的角度对本技术实施例的视频分析方法进行介绍。
[0205]
参见图9所示的视频分析方法的流程图,该方法应用于基于人脸的轨迹搜索场景,包括如下步骤:
[0206]
s902:摄像头a向管理装置202发送订阅指令。
[0207]
该订阅指令包括订阅参数。该订阅参数可以是距离参数。例如距离参数可以为周边2km以内,则订阅指令用于指示管理装置202将摄像头a与摄像头a周边距离2km以内的摄像头建立订阅关系。
[0208]
s904:管理装置202查询满足订阅参数的摄像头。
[0209]
管理装置202可以根据摄像头的地理位置关系,确定满足订阅参数的摄像头。其中,管理装置202本地存储有摄像头的地理位置关系时,管理装置202可以在本地查找满足订阅参数的摄像头。管理装置202本地未存储摄像头的地理位置关系时,管理装置202可以向位置装置发送查询请求,位置装置可以响应于该查询请求,向管理装置202返回查询响应。该查询响应中携带满足订阅参数的摄像头。
[0210]
s906:管理装置202完成订阅关系记录。
[0211]
该实施例中,假定摄像头b为满足订阅参数的摄像头,例如摄像头b为距离摄像头
a2km以内的摄像头。对应地,管理装置202可以记录摄像头a与摄像头b的对应关系,以建立摄像头a和摄像头b的订阅关系。
[0212]
需要说明的是,s902至s906仅仅是建立订阅关系的一种实现方式,具体是通过预配置模式建立订阅关系。在本技术实施例其他可能的实现方式中,管理装置202也可以通过其他方式,如通过被动执行模式建立订阅关系。
[0213]
s908:摄像头b对摄像头b拍摄的视频进行分析,获得视频的分析结果。
[0214]
摄像头b为智能摄像头,可以对摄像头b拍摄的视频执行视频分析任务,从而实现对该视频的分析,得到摄像头b拍摄的视频的分析结果。
[0215]
s909:摄像头b向管理装置202上报摄像头b拍摄的视频的分析结果。
[0216]
该分析结果包括人脸f的信息。例如:分析结果包括人脸f的特征值、人脸f的图像。在一些可能的实现方式中,该分析结果还可以包括人体f的信息,如性别、上衣颜色等穿着信息。
[0217]
s910:管理装置202向存储与搜索装置204发送摄像头b拍摄的视频的分析结果,以存储该分析结果。
[0218]
s911:管理装置202向摄像头a下发动作逻辑。
[0219]
具体地,管理装置202可以接收管理人员通过管理装置202提供的可编程接口编写的动作逻辑。当管理装置202检测到人脸f与监控的人脸的相似度达到预设阈值时,可以发送动作逻辑至与摄像头b建立有订阅关系的摄像头,例如是摄像头a。在一些实施例中,管理装置202也可以基于摄像头b的指示,向摄像头a下发动作逻辑。
[0220]
需要说明的是,管理装置202可以根据实际需求下发相应的动作逻辑。例如:摄像头a具有较好的人脸抓拍能力时,管理装置202可以下发用于指示人脸监控的动作逻辑;摄像头a具有较好的人体抓拍能力时,管理装置202可以下发用于指示人体监控的动作逻辑。
[0221]
s912:管理装置202向摄像头a下发包括人脸f的信息的交互数据。
[0222]
具体地,管理装置202基于摄像头a与摄像头b的订阅关系,向摄像头a下发摄像头b拍摄的视频的交互数据。其中,管理装置202可以根据摄像头b拍摄的视频的分析结果中的部分或全部信息,获得摄像头b拍摄的视频的交互数据。在一些实施例中,该交互数据包括人脸f的信息。
[0223]
其中,s911和s912可以并行执行,也可以按照设定顺序先后执行。例如:管理装置202可以先下发动作逻辑,然后下发交互数据;或者管理装置202可以先下发交互数据,然后下发动作逻辑。
[0224]
s914:摄像头a缓存动作逻辑以及包括人脸f信息的交互数据。
[0225]
摄像头a缓存上述动作逻辑以及交互数据,以便后续比较时使用。其中,摄像头a可以基于一定的策略如时效性策略使用缓存的动作逻辑以及交互数据。在一些可能的实现方式中,摄像头a可以在设置的启动时间后使用缓存的动作逻辑以及交互数据,在设置的删除时间到达时删除上述动作逻辑以及交互数据。例如,启动时间为10分钟,删除时间为10小时,则摄像头a可以在缓存时间达到10分钟后使用上述动作逻辑以及交互数据,在缓存时间达到10小时后删除上述动作逻辑以及交互数据。
[0226]
s916:摄像头a根据动作逻辑对对摄像头a拍摄的视频进行分析,获得摄像头a中人物的信息。
[0227]
摄像头a为智能摄像头,可以基于管理装置202下发的动作逻辑对摄像头a拍摄的视频执行视频分析任务,从而实现对该视频的分析,获得摄像头a中人物的信息。其中,人物的信息可以包括人脸信息。例如:摄像头a中人物的信息可以包括人脸g的特征值、人脸g的图像。在一些可能的实现方式中,摄像头a中人物的信息还可以包括人体g的信息,如性别、上衣颜色等穿着信息。
[0228]
具体地,动作逻辑包括执行视频分析任务的任务类型参数、时间参数、条件参数中的至少一种。该示例中假定任务类型为人脸监控,启动分析的时间为100s后,相似度阈值为0.95(条件参数)。摄像头a基于任务类型以及启动分析的时间,调用人脸检测模型对摄像头a拍摄的视频中的人脸进行识别,得到人脸信息。该人脸信息包括人脸g的信息,如人脸g的特征值、人脸g的图像。
[0229]
s918:摄像头a根据人脸f和人脸g的相似度,确定人脸f和人脸g对应同一人。
[0230]
具体地,摄像头a可以计算人脸f的特征值和人脸g的特征值的距离,从而确定人脸f和人脸g的相似度,将该相似度与相似度阈值进行比较,当相似度大于或等于相似度阈值时,则确定人脸f和人脸g属于同一人。
[0231]
s920:摄像头a向管理装置202上报摄像头a拍摄的视频的分析结果。
[0232]
其中,摄像头a拍摄的视频的分析结果包括人脸g的信息。例如:摄像头a拍摄的视频的分析结果包括人脸g的特征值、人脸g的图像。其中,分析结果还包括人脸f和人脸g的关联关系。
[0233]
s922:管理装置202向存储与搜索装置204发送摄像头a拍摄的视频的分析结果,以使存储与搜索装置204存储分析结果。
[0234]
其中,分析结果携带有人脸f和人脸g的关联关系。本技术实施例中假定人脸f和人脸g对应同一人。
[0235]
s924:应用300向存储与搜索装置204发送轨迹搜索请求。
[0236]
具体地,应用300可以响应于用户触发的轨迹搜索操作,生成轨迹搜索请求,该轨迹搜索请求可以携带监测目标如嫌疑人的人脸图像,然后应用300向存储与搜索装置204发送上述轨迹搜索请求。
[0237]
s926:存储与搜索装置204基于摄像头a拍摄的视频的分析结果和摄像头b拍摄的视频的分析结果生成轨迹。
[0238]
具体地,存储与搜索装置204可以基于轨迹搜索请求中携带的人脸图像,进行搜索。当该人脸图像与人脸f的图像匹配时,存储与搜索装置204可以根据人脸f和人脸g的关联关系,将摄像头a和摄像b所在地理位置连接,形成轨迹。
[0239]
s928:存储与搜索装置204向应用300发送轨迹。
[0240]
s930:应用300向用户呈现轨迹。
[0241]
在一些可能的实现方式中,摄像头可以内置动作逻辑。例如:摄像头a可以内置动作逻辑,如此,执行本技术实施例的视频分析方法也可以不执行上述s911。摄像头a可以基于内置的动作逻辑,对摄像头a拍摄的视频执行视频分析任务。
[0242]
在一些可能的实现方式中,摄像头也可以在为了完成自身的一些逻辑处理过程中发出动作逻辑给其他摄像头来配合完成某些任务。例如:摄像头b发现某监控的人脸后,将获取到当时此人的人脸与人体图像,通知给周边摄像头如摄像头a,以协同对该人员进行跟
踪。具体地,摄像头b发送交互数据以及动作逻辑给摄像头a。当符合人脸抓拍的摄像头相对比较少(或者一些条件下无法抓取到符合要求的人脸),而可监控人体的摄像头更多,通过利用可监控人体的摄像头进行协同分析可以更好地对该人员进行跟踪。
[0243]
基于上述内容描述,可知本技术实施例通过建立订阅关系,实现定制关联区域,通过对关联区域的视频进行协同分析,构建联网的轨迹跟踪。一方面避免了海量的特征值搜索与特征值比对操作,避免了爆发式的资源消耗,进而避免了爆发式的资源需求,另一方面,通过减少计算量,提高了分析效率。
[0244]
接下来,参见图10所示的视频分析方法的流程图,该方法应用于特定行为检测与报警场景,其中,特定行为可以是未佩戴口罩的行为,该方法具体包括如下步骤:
[0245]
s1002:管理装置202接收管理人员通过编程接口编写的动作逻辑。
[0246]
管理装置202提供有编程接口。管理人员可以基于该编程接口,通过编程语言编写动作逻辑。其中,动作逻辑具体可以是特定行为检测以及报警的逻辑。该特定行为具体可以是未佩戴口罩行为。管理装置202可以接收管理人员通过上述编程接口编写的动作逻辑。在一些实施例中,管理装置202也可以接收管理人员通过配置方式配置的动作逻辑。
[0247]
s1004:管理装置202根据摄像头位置信息,确定与摄像头a对应的摄像头。
[0248]
具体地,管理装置202可以根据摄像头位置信息确定用于人群计数统计的摄像头以及用于检测口罩佩戴行为的摄像头,以便建立摄像头之间的订阅关系。其中,用于人群计数统计的摄像头可以是高点摄像头,该摄像头的观察区域较广,但是画面中的细节可能不清出,用于检测口罩佩戴行为的摄像头则能够清楚显示画面中的细节。
[0249]
本技术实施例中假定监控区域内的摄像头包括摄像头a和摄像头b。摄像头a为区域内的高点摄像头,用于人群计数统计,摄像头b用于检测口罩佩戴行为。
[0250]
s1006:管理装置202完成订阅关系记录。
[0251]
具体地,管理装置202可以记录摄像头a与摄像头b的对应关系,以建立摄像头a和摄像头b的订阅关系。如此,管理装置202可以基于订阅关系,转发交互数据,从而实现摄像头a和摄像头b之间的数据交互。
[0252]
s1008:摄像头a对摄像头a拍摄的视频进行分析,获得视频的分析结果。
[0253]
摄像头a为智能摄像头,可以对摄像头a拍摄的视频执行视频分析任务,从而实现对该视频的分析,获得视频的分析结果。该分析结果包括视频中人数。
[0254]
s1010:摄像头a向管理装置202上报摄像头a拍摄的视频的分析结果。
[0255]
s1011:管理装置202向摄像头b下发动作逻辑。
[0256]
具体地,管理装置202可以接收管理人员通过管理装置202提供的可编程接口编写的动作逻辑。其中,动作逻辑包括执行视频分析任务的任务类型参数、时间参数、条件参数中的至少一种。该示例中假定任务类型为特定行为检测,例如是口罩佩戴行为检测。条件参数包括任务的触发条件。该示例中假定触发条件为视频中人数大于第一阈值。
[0257]
s1012:管理装置202向摄像头b下发摄像头a拍摄的视频的交互数据。
[0258]
其中,摄像头a拍摄的视频的交互数据来自于摄像头a拍摄的视频的分析结果。该交互数据可以是摄像头a拍摄的视频的分析结果中的部分或全部信息。在一些实施例中,摄像头a拍摄的视频的交互数据可以包括视频中人数。
[0259]
s1014:摄像头b基于动作逻辑,判断视频中人数是否大于第一阈值。若是,则执行
s1016。
[0260]
s1016:摄像头b基于动作逻辑,对摄像头b拍摄的视频进行分析,以检测未佩戴口罩人员。
[0261]
摄像头b为智能摄像头,可以对摄像头b拍摄的视频执行视频分析任务,从而实现对该视频的分析,获得摄像头b拍摄的视频的分析结果。该分析结果包括未佩戴口罩人员信息。其中,未佩戴口罩人员信息可以包括未佩戴口罩人员的属性、特征值、人脸图像中的任意一种或多种。
[0262]
s1018:摄像头b向管理装置202上报包括未佩戴口罩人员信息的分析结果。
[0263]
s1020:管理装置202向应用300发送包括未佩戴口罩人员信息的分析结果。
[0264]
s1022:应用300根据未佩戴口罩人员信息进行报警提示。
[0265]
具体地,应用300可以根据未佩戴口罩人员信息生成报警消息,通常呈现报警信息进行提示。在一些实施例中,应用300也可以根据未佩戴口罩人员信息进行广播,从而实现报警提示。
[0266]
该实施例以管理装置202实现交互数据转发以及动作逻辑下发进行示例说明。在本技术实施例其他可能的实现方式中,摄像头a也可以直接将动作逻辑以及包括视频中人数在内的交互数据发送至摄像头b,摄像头b基于动作逻辑,执行判断视频中人数是否大于第一阈值的步骤,从而确定是否触发口罩佩戴行为检测。
[0267]
在一些可能的实现方式中,摄像头a上报视频的分析结果至管理装置202后,管理装置202可以先执行判断视频中人数是否大于第一阈值的步骤,若是,则管理装置202向摄像头b下发动作逻辑。摄像头b基于该动作逻辑,对摄像头b拍摄的视频进行口罩佩戴行为检测。
[0268]
需要说明的是,如果视频中人数在一定时间小于第一阈值,摄像头b可以停止视频分析,例如停止对口罩佩戴行为的检测,以释放资源。具体地,摄像头a或者管理装置202可以通过发送动作逻辑指示摄像头b停止检测口罩佩戴行为。
[0269]
需要说明的是,图9、图10所示实施例均以摄像头a、摄像头b为智能摄像头进行示例说明,在一些可能的实现方式中,摄像头a、摄像头b也可以为普通摄像头,如此,对摄像头a拍摄的视频进行分析、对摄像头拍摄的视频进行分析也可以由视频分析装置206执行。视频分析装置206可以基于动作逻辑,对相应的视频执行视频分析任务,从而实现视频分析。
[0270]
上文结合图1至图10对本技术实施例提供的视频分析方法、视频分析的管理方法进行了详细介绍,下面将结合附图对本技术实施例提供的装置、设备进行介绍。
[0271]
参见图11所示的视频分析装置206的结构示意图,该装置206包括:
[0272]
通信单元2062,用于获取第一摄像头拍摄的第一视频;
[0273]
所述通信单元2062,还用于获取第二视频的交互数据,其中,所述第二视频由第二摄像头拍摄获得;
[0274]
分析单元2064,用于基于所述第二视频的交互数据,对所述第一视频执行第一视频分析任务,获得所述第一视频的分析结果,其中,所述第二视频的交互数据由对所述第二视频执行第二视频分析任务获得。
[0275]
在一些可能的实现方式中,所述通信单元2062还用于:
[0276]
获取动作逻辑,其中,所述动作逻辑包括以下参数中的一种或多种:执行所述第一
视频分析任务的任务类型参数、执行所述第一视频分析任务的时间参数、执行所述第一视频分析任务的条件参数;
[0277]
所述分析单元2064具体用于:
[0278]
基于所述动作逻辑和所述第二视频的交互数据,对所述第一视频执行第一视频分析任务。
[0279]
在一些可能的实现方式中,所述通信单元2062具体用于:
[0280]
接收由管理装置202发送的所述动作逻辑,其中,所述动作逻辑由管理人员根据所述管理装置202提供的编程接口编写。
[0281]
在一些可能的实现方式中,所述第一视频的分析结果中包括与所述第二视频的交互数据相关联的数据。
[0282]
在一些可能的实现方式中,所述第二视频的交互数据包括出现在所述第二视频中的待跟踪目标的信息;
[0283]
所述分析单元2064具体用于:
[0284]
对所述第一视频中的目标进行识别,获得所述目标的信息;
[0285]
根据所述目标的信息以及所述第二视频中的待跟踪目标的信息,获得所述第一视频的分析结果,所述分析结果包括与所述第二视频中的待跟踪目标的信息相似度满足预设条件的目标的信息。
[0286]
在一些可能的实现方式中,所述分析单元2064具体用于:
[0287]
根据预训练的ai模型,对所述第一视频中的目标进行识别,获得所述目标的信息。
[0288]
在一些可能的实现方式中,所述第一摄像头与所述第二摄像头之间存在订阅关系,所述订阅关系由管理装置202预先构建。
[0289]
在一些可能的实现方式中,所述分析单元2064还用于:
[0290]
根据所述第一视频的分析结果生成所述第一视频的交互数据;
[0291]
所述通信单元2062还用于:
[0292]
发送所述第一视频的交互数据至管理装置202或者第三摄像头,其中,所述第三摄像头与所述第一摄像头之间存在订阅关系。
[0293]
在一些可能的实现方式中,所述视频分析装置206与所述第一摄像头和所述第二摄像头建立有通信连接。
[0294]
在一些可能的实现方式中,所述视频分析装置206应用于安防监控,所述第一视频分析任务包括以下任务中的一种或多种:人物检测与跟踪、车辆检测与跟踪、人群计数统计、车辆计数统计、特定行为检测与报警。
[0295]
根据本技术实施例的视频分析装置206可对应于执行本技术实施例中描述的方法,并且视频分析装置206的各个模块/单元的上述和其它操作和/或功能分别为了实现图6所示实施例中的各个方法的相应流程,为了简洁,在此不再赘述。
[0296]
接着参见图12所示的管理装置202的结构示意图,管理装置202与多个摄像头通信连接,该装置202包括:
[0297]
通信单元2024,用于接收第二视频的交互数据,其中,所述第二视频由所述第二摄像头拍摄获得;
[0298]
所述通信单元2024,还用于将所述第二视频的交互数据发送至所述第一摄像头或
者视频分析装置,以使得所述第一摄像头或者所述视频分析装置基于所述第二视频的交互数据对第一视频执行第一视频分析任务,其中,所述第一摄像头和所述第二摄像头之间有订阅关系,且所述第一视频由所述第一摄像头拍摄获得。
[0299]
在一些可能的实现方式中,所述装置202还包括:
[0300]
订阅单元2022,用于建立所述至少一个摄像头中的所述第一摄像头与所述第二摄像头的订阅关系。
[0301]
在一些可能的实现方式中,所述订阅单元2022具体用于:
[0302]
接收所述第一摄像头发送的订阅指令,其中,所述订阅指令包括订阅参数;
[0303]
根据所述订阅参数查询满足所述订阅参数的所述第二摄像头,并建立所述第一摄像头与所述第二摄像头的订阅关系。
[0304]
在一些可能的实现方式中,所述订阅单元2022具体用于:
[0305]
接收管理人员发送的订阅指令;
[0306]
根据所述订阅指令建立所述第一摄像头与所述第二摄像头的订阅关系。
[0307]
在一些可能的实现方式中,所述通信单元2024还用于:
[0308]
发送动作逻辑至所述第一摄像头或者视频分析装置206,以使得所述第一摄像头或者所述视频分析装置206基于所述第二视频的交互数据和所述动作逻辑对第一视频执行第一视频分析任务。
[0309]
在一些可能的实现方式中,所述通信单元2024还用于:
[0310]
发送动作逻辑至所述第一摄像头或者视频分析装置之前,获取管理人员通过可编程接口编写的动作逻辑,或者,获取用户通过视频分析应用配置的动作逻辑。
[0311]
根据本技术实施例的管理装置202可对应于执行本技术实施例中描述的方法,并且管理装置202的各个模块/单元的上述和其它操作和/或功能分别为了实现图8所示实施例中的各个方法的相应流程,为了简洁,在此不再赘述。
[0312]
本技术实施例还提供了一种设备1300。该设备1300可以是云环境中的服务器或服务器集群,或者是本地数据中心中的服务器或者服务器集群。该设备1300具体用于实现如图11所示实施例中视频分析装置206的功能。
[0313]
图13提供了一种设备1300的结构示意图,如图13所示,设备1300包括总线1301、处理器1302、通信接口1303和存储器1304。处理器1302、存储器1304和通信接口1303之间通过总线1301通信。
[0314]
总线1301可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0315]
处理器1302可以为中央处理器(central processing unit,cpu)、图形处理器(graphics processing unit,gpu)、微处理器(micro processor,mp)或者数字信号处理器(digital signal processor,dsp)等处理器中的任意一种或多种。
[0316]
通信接口1303用于与外部通信。例如,通信接口1303用于获取第一摄像头拍摄的第一视频,以及获取第二视频的交互数据,或者是接收由管理装置202发送的动作逻辑,发送第一视频的交互数据至管理装置202等等。
[0317]
存储器1304可以包括易失性存储器(volatile memory),例如随机存取存储器(random access memory,ram)。存储器1304还可以包括非易失性存储器(non

volatile memory),例如只读存储器(read

only memory,rom),快闪存储器,硬盘驱动器(hard disk drive,hdd)或固态驱动器(solid state drive,ssd)。
[0318]
存储器1304中存储有可执行代码,处理器1302执行该可执行代码以执行前述视频分析方法。
[0319]
具体地,在实现图11所示实施例的情况下,且图11实施例中所描述的视频分析装置206的各单元为通过软件实现的情况下,执行图11中的通信单元2062、分析单元2064功能所需的软件或程序代码可以部分或全部存储在存储器1304中。处理器1302执行存储器1304中存储的各单元对应的程序代码,执行视频分析方法。
[0320]
本技术实施例还提供了一种设备1400。该设备1400可以是云环境中的服务器或服务器集群,或者是本地数据中心中的服务器或者服务器集群。该设备1400具体用于实现如图12所示实施例中管理装置202的功能。
[0321]
图14提供了一种设备1400的结构示意图,如图14所示,设备1400包括总线1401、处理器1402、通信接口1403和存储器1404。处理器1402、存储器1404和通信接口1403之间通过总线1401通信。
[0322]
其中,总线1401、处理器1402、通信接口1403和存储器1404的具体实现可以参见图13所示实施例相关内容描述。具体地,在实现图12所示实施例的情况下,且图12实施例中所描述的管理装置202的各模块或单元为通过软件实现的情况下,执行图12中的订阅单元2022、通信单元2024功能所需的软件或程序代码可以部分或全部存储在存储器1404中。处理器1402执行存储器1404中存储的各单元对应的程序代码,执行视频分析的管理方法。
[0323]
本技术实施例还提供了一种摄像头100,摄像头100可以为智能摄像头。该摄像头100具体用于实现本技术实施例提供的视频分析方法。
[0324]
图15提供了一种摄像头100的结构示意图,如图15所示,摄像头100包括总线1501、处理器1502、通信接口1503、存储器1504和图像传感器1505。处理器1502、存储器1504和通信接口1503、图像传感器1505之间通过总线1501通信。
[0325]
其中,总线1501、处理器1502、通信接口1503和存储器1504的具体实现可以参见图13所示实施例相关内容描述。图像传感器1505是一种感光元件,用于将感光面上的光像转换为与光像成相应比例关系的电信号,从而实现视频采集。图像传感器1505可以包括电荷耦合元件(charge

coupled device,ccd)、互补金属氧化物半导体(complementary metal oxide semiconductor,cmos)等不同类型传感器。
[0326]
具体地,图像传感器1505用于采集第一视频,处理器1502可以通过总线1501获取图像传感器1505采集的第一视频,通信接口1503用于获取第二视频的交互数据,其中,所述第二视频由第二摄像头拍摄获得,通信接口1503通过总线1501将第二视频的交互数据传输至处理器1502,处理器1502执行存储器1504中的程序代码,执行基于所述第二视频的交互数据,对所述第一视频执行第一视频分析任务,获得所述第一视频的分析结果的步骤。
[0327]
本技术实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质可以是计算设备能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如dvd)、或者
半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令,所述指令指示设备1300执行上述应用于视频分析装置206的视频分析方法,或者是设备1400执行上述应用于管理装置202的视频分析的管理方法,或者是摄像头100执行视频分析方法。
[0328]
本技术实施例还提供了一种计算机程序产品,所述计算机程序产品包括一个或多个计算机指令。在计算设备上加载和执行所述计算机指令时,全部或部分地产生按照本技术实施例所述的流程或功能。
[0329]
所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。
[0330]
所述计算机程序产品被计算机执行时,所述计算机执行前述视频分析方法或者视频分析的管理方法的任一方法。该计算机程序产品可以为一个软件安装包,在需要使用前述视频分析方法或者视频分析的管理方法的任一方法的情况下,可以下载该计算机程序产品并在计算机上执行该计算机程序产品。
[0331]
上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,可以参见其他流程或结构的相关描述。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1