视频目标检测方法、装置、设备及可读存储介质与流程

文档序号:28592556发布日期:2022-01-22 09:08阅读:62来源:国知局
视频目标检测方法、装置、设备及可读存储介质与流程

1.本技术涉及图像处理技术领域,尤其涉及一种视频目标检测方法、装置、设备及可读存储介质。


背景技术:

2.随着通信技术的不断发展,多媒体终端被应用得越来越频繁,多媒体终端接收到服务器传输的视频后,通常需要通过对视频目标进行检测,以便保证视频呈现的质量和效率,目前,通常情况下依据关键备注信息来进行视频目标检测,但是,由于关键备注信息无法准确反映待检测视频的视频信息,导致依据关键备注信息进行视频目标检测存在不准确的技术缺陷,时常出现因关键备注信息的不完整而对视频误删或漏删,进而导致视频目标检测的准确率不高。


技术实现要素:

3.本技术的主要目的在于提供一种视频目标检测方法、装置、设备及可读存储介质,旨在解决现有技术中视频目标检测准确率低的技术问题。
4.为实现上述目的,本技术提供一种视频目标检测方法,所述视频目标检测包括:
5.获取待检测视频,并在所述待检测视频中提取待检测画面帧;
6.获取待检测目标的关键信息,并为所述关键信息匹配具备所述待检测目标的标准画面图像;
7.通过对所述待检测画面帧和所述标准画面图像进行图像识别,判断所述待检测画面帧中是否存在所述待检测目标,得到视频目标检测结果。
8.本技术还提供一种视频目标检测装置,所述视频目标检测装置为虚拟装置,且所述视频目标检测装置应用于视频目标检测设备,所述视频目标检测装置包括:
9.提取模块,用于获取待检测视频,并在所述待检测视频中提取待检测画面帧;
10.匹配模块,用于获取待检测目标的关键信息,并为所述关键信息匹配对应的所述待检测目标对应的画面图像;
11.检测模块,用于通过对所述待检测画面帧和所述画面图像进行图像识别,判断所述待检测画面帧中是否存在所述画面图像,得到视频目标检测结果。
12.本技术还提供一种视频目标检测设备,所述视频目标检测设备为实体设备,所述视频目标检测设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述视频目标检测方法的程序,所述视频目标检测方法的程序被处理器执行时可实现如上述的视频目标检测方法的步骤。
13.本技术还提供一种可读存储介质,所述可读存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现视频目标检测方法的程序,所述视频目标检测方法的程序被处理器执行时实现如上述的视频目标检测方法的步骤。
14.本技术提供了一种视频目标检测方法、装置、设备及可读存储介质及计算机程序
产品,相比于现有技术中采用的依据关键备注信息进行视频目标检测的技术手段,本技术首先获取待检测视频,并在所述待检测视频中提取待检测画面帧,进而获取待检测目标的关键信息,并为所述关键信息匹配具备所述待检测目标的标准画面图像,实现了同时获取可能存在待检测目标的视频画面帧以及确定存在待检测目标的标准画面图像的目的,进而通过对所述待检测画面帧和所述标准画面图像进行图像识别,可利用标准画面图像的图像信息,来确定待检测画面帧中是否存在待检测目标,也即判断所述待检测画面帧中是否存在所述待检测目标,进而得到视频目标检测结果,实现了利用视频本身的图像信息来进行视频目标检测,而非依据关键备注信息来进行视频目标检测,而由于视频本身的图像信息可准确反应待检测视频的视频信息,所以克服了现有技术中由于关键备注信息无法准确反应待检测视频的视频信息,而导致依据关键备注信息进行视频目标检测不准确的技术缺陷,提升了视频目标检测的准确性。
附图说明
15.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
16.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
17.图1为本技术视频目标检测方法中第一实施例的流程示意图;
18.图2为本技术视频目标检测方法中第二实施例的流程示意图;
19.图3为本技术视频目标检测方法中第三实施例的流程示意图;
20.图4为本技术实施例方案涉及的硬件运行环境的设备结构示意图。
21.本技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
22.应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
23.首先,应当理解的是,在依据关键备注信息对视频目标进行检测,以判别视频是否应该删除时,通常是依据视频中主要呈现的内容或方向,进而对视频进行信息备注,所以,依据关键备注信息进行视频目标检测时,此时可能会忽略了待检测视频中的待检测目标,进而导致出现待检测视频的漏删或误删等情况,无法保证视频呈现的质量和效率。
24.本技术实施例提供一种视频目标检测方法,在本技术视频目标检测方法的第一实施例中,参照图1,所述视频目标检测方法包括:
25.步骤s10,获取待检测视频,并在所述待检测视频中提取待检测画面帧;
26.在本实施例中,需要说明的是,所述待检测视频为等待进行安全检测的视频,具体可以为多个gop(group of pictures,画面组)序列构成的视频,例如ibbpbbpbbpbbpbbibbpbbpbbpbbpbb,其中,所述gop序列包括内部编码帧(i帧)、双向参考帧(b帧)以及前向参考帧(p帧),例如ibbpbbpbbpbbpbb等,所述待检测画面帧可以为由至少一个所述gop序列组成的内部编码帧,其中,所述安全检测用于判断视频是否可以播放。
27.示例性的,步骤s10包括:获取待检测视频,周期性提取待检测视频的gop序列,获
得所述待检测画面帧,其中,周期性提取的时间周期可设置为2分钟、1分钟或者30秒等。
28.步骤s20,获取待检测目标的关键信息,并为所述关键信息匹配具备所述待检测目标的标准画面图像;
29.在本实施例中,需要说明的是,所述待检测目标可以为人或物等,所述关键信息用于标识待检测目标的目标特征的信息,例如待检测目标为人,则关键信息可以包括名字、出生日期、性别以及籍贯等目标特征,若待检测目标为物体,则关键信息可以为物体的轮廓、颜色以及纹理等目标特征,所述标准画面图像为具有待检测目标的画像图片,具体可以为权威机构的画像数据或者超清照等。
30.示例性的,步骤s20包括:接收服务器下发的描述符,对所述描述符进行解析,得到待检测目标的关键信息;根据所述关键信息向服务器申请调用与所述关键信息相对应的标准画面图像,进而实现了将所述关键信息与所述标准画面图像进行匹配的目的,其中,所述描述符为描述所述关键信息的代码程序,用于描述所述待检测目标的关键信息,所述服务器用于视频目标检测设备发出查询待检测目标的指令。
31.步骤s30,通过对所述待检测画面帧和所述标准画面图像进行图像识别,判断所述待检测画面帧中是否存在所述待检测目标,得到视频目标检测结果。
32.示例性的,步骤s30包括:对所述待检测画面帧进行图像分类,得到第一图像分类标签,以及对所述标准画面图像进行图像分类,得到第二图像分类标签,若所述第一图像分类标签与所述第二图像分类标签一致,则所述待检测画面帧中存在所述待检测视频,若所述第一图像分类标签与所述第二图像分类标签不一致,则所述待检测画面帧中不存在所述待检测目标,进而得到视频目标检测结果,实现了判断所述待检测画面帧中是否存在所述待检测目标的目的,其中,第一图像分类标签和第二图像分类标签可以为图像分类标签,该图像分类标签用于标识图像的类别,例如标签为1,则标识有待检测目标的一类图像,标签为0,则标识没有待检测目标的一类图像。
33.进一步地,在步骤s30中,所述通过对所述待检测画面帧和所述标准画面图像进行图像识别,判断所述待检测画面帧中是否存在所述待检测目标,得到视频目标检测结果的步骤包括:
34.步骤s31,基于第一图像特征提取模型,对所述待检测画面帧进行图像特征提取,得到所述待检测画面帧对应的至少一个第一图像特征;
35.基于第一图像特征提取模型,对所述待检测画面帧进行图像特征提取,得到所述待检测画面帧对应的至少一个第一图像特征,具体地,通过将所述待检测画面帧输入所述第一图像特征提取模型,分别对所述待检测画面帧的不同图像区域进行图像特征提取,得到所述待检测画面帧对应的至少一个第一图像特征,其中,在一种可实施的方式中,将所述待检测画面帧均等划分为n个区域后,得到不同图像区域一一对应的各第一图像特征,其中,n可设置为2、3、4等自然数。
36.步骤s32,基于第二图像特征提取模型,对所述标准画面图像进行图像特征提取,得到所述标准画面图像对应的第二图像特征;
37.步骤s33,依据所述至少一个第一图像特征和所述第二图像特征,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果;
38.在本实施例中,需要说明的是,所述视频目标检测结果为所述待检测画面帧中存
在或者不存在所述待检测目标。
39.具体地,通过将所述标准画面图像输入所述第二特征提取模型,对整个标准画面图像进行特征提取,得到所述标准画面图像对应的第二图像特征,进而分别将各所述第一图像特征与所述第二图像特征进行相似度比对,得到各所述第一图像特征对应的相似度比对结果,进而依据相似度比对结果,判断所述待检测画面帧中是否存在待检测目标,得到所述视频目标检测结果。
40.其中,所述依据相似度比对结果,判断所述待检测画面帧中是否存在待检测目标,得到所述视频目标检测结果的步骤包括:
41.依据各所述比对结果,判断各所述第一图像特征中是否存在与所述第二图像特征相似度大于预设相似度阈值的图像特征,若存在,则所述视频目标检测结果为所述待检测画面帧中存在所述待检测目标,若不存在,则所述视频目标检测结果为所述待检测画面帧中不存在所述待检测目标。
42.当待检测画面帧中存在待检测目标时,可能会因为待检测目标在待检测画面帧中的图像占比较小,在特征提取过程中出现待检测目标的图像信息丢失的情况,进而依据特征提取结果进行图像识别,将造成视频目标检测的准确度变低,而本技术实施例中分别对所述待检测画面帧的不同图像区域进行图像特征提取,则待检测目标在待检测画面帧中所处的图像区域中的占比明显更大,进而在特征提取过程中不容易出现待检测目标的图像信息丢失的情况,进而依据特征提取结果进行图像识别,可提升视频目标检测的准确性。
43.示例性的,在步骤s33中,所述依据所述至少一个第一图像特征和所述第二图像特征,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果的步骤包括:
44.步骤s331,分别计算各所述第一图像特征和所述第二图像特征之间的特征相似度;
45.在本实施例中,需要说明的是,所述特征相似度为两张画面图像的相似程度,具体可以使用特征之间的距离表示,特征的距离可以为欧几里得距离(eucledian distance)、曼哈顿距离(manhattan distance)以及明可夫斯基距离(minkowski distance)等。
46.步骤s332,依据各所述特征相似度,判断所述待检测画面帧是否存在所述待检测目标,得到视频目标检测结果。
47.示例性的,步骤s332包括:将各所述特征相似度与预设特征相似度阈值进行比对,若各所述特征相似度存在至少一个特征相似度大于预设特征相似度阈值,则判定所述待检测画面帧存在所述待检测目标,若各所述特征相似度均不大于预设特征相似度阈值,则判定所述待检测画面帧中不存在所述待检测目标。
48.进一步地,所述依据所述特征相似度,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果的步骤之后,所述视频目标检测方法还包括:
49.步骤a10,若所述视频目标检测结果为存在所述待检测目标,则停止播放所述待检测视频;
50.步骤a20,若所述视频目标检测结果为不存在所述待检测目标,则继续播放所述待检测视频。
51.在本实施例中,需要说明的是,所述停止播放可以为提醒用户所述待检测视频不
能播放或者停止播放待检测视频。
52.具体的说,若所述待检测画面帧中存在待检测目标,则停止播放所述待检测视频,弹出提示框提醒用户不可以播放所述待检测视频,若所述待检测画面中不存在待检测目标,继续播放待检测视频,同时返回执行步骤:在所述待检测视频中提取待检测画面帧。
53.本技术实施例提供了一种视频目标检测方法、装置、设备及可读存储介质及计算机程序产品,相比于现有技术中采用的依据关键备注信息进行视频目标检测的技术手段,本技术首先获取待检测视频,并在所述待检测视频中提取待检测画面帧,进而获取待检测目标的关键信息,并为所述关键信息匹配具备所述待检测目标的标准画面图像,实现了同时获取可能存在待检测目标的视频画面帧以及确定存在待检测目标的标准画面图像的目的,进而通过对所述待检测画面帧和所述标准画面图像进行图像识别,可利用标准画面图像的图像信息,来确定待检测画面帧中是否存在待检测目标,也即判断所述待检测画面帧中是否存在所述待检测目标,进而得到视频目标检测结果,实现了利用视频本身的图像信息来进行视频目标检测,而非依据关键备注信息来进行视频目标检测,而由于视频本身的图像信息可准确反应待检测视频的视频信息,所以克服了现有技术中由于关键备注信息无法准确反应待检测视频的视频信息,而导致依据关键备注信息进行视频目标检测不准确的技术缺陷,提升了视频目标检测的准确性。
54.进一步地,参照图2,基于本技术的第一实施例,在本技术的另一实施例中,所述基于第一图像特征提取模型,对所述待检测画面帧进行图像特征提取,得到所述待检测画面帧对应的至少一个图像特征的步骤包括:
55.步骤c10,基于所述第一图像特征提取模型,对所述待检测画面帧进行多层次特征提取,得到所述待检测画面帧对应的至少一个第一图像特征。
56.在本实施例中,需要说明的是,所述多层次特征提取用于提取待检测画面帧不同深度的图像特征,例如,第一图像特征提取模型有3个卷积层,则提取各卷积层的输出图像特征作为各第一图像特征。
57.具体地,通过将所述待检测画面帧输入所述第一图像特征提取模型,提取待检测画面帧对应的不同卷积深度的图像特征,并将不同卷积深度的图像特征的尺寸大小转换为预设尺寸大小,获得所述待检测画面帧对应的至少一个第一图像特征。
58.其中,所述依据所述至少一个第一图像特征和所述第二图像特征,判断所述待检测画面帧中是否存在所述待检测目标的步骤包括:
59.步骤z10,分别将各所述第一图像特征和所述第二图像特征进行拼接,得到各所述第一图像特征对应的目标图像特征;
60.具体地,将所述第二图像特征与每一所述第一图像特征分别进行两两拼接,获得各目标图像特征。
61.步骤z20,分别对所述目标图像特征进行二分类,得到各二分类结果;
62.步骤z30,依据各所述二分类结果,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果。
63.在本实施例中,示例性的,分别对所述目标图像特征进行二分类,得到各所述目标图像特征对应的二分类标签,也即为二分类结果,进而若存在所述二分类标签为预设目标二分类标签,则判定所述待检测画面帧中存在所述待检测目标,所述视频目标检测结果为
存在待检测目标,若不存在所述二分类标签为预设目标二分类标签,则判定所述待检测画面帧中不存在所述待检测目标,所述视频目标检测结果为不存在待检测目标,其中,所述二分类标签包括正样本标签和负样本标签,例如可设置1为正样本标签,0为负样本标签,所述预设目标二分类标签可设置为正样本标签或者负样本标签中的一者。
64.本技术实施例提供了一种进行二分类的视频目标检测方法,也即,基于所述第一图像特征提取模型,对所述待检测画面帧进行多层次特征提取,得到所述待检测画面帧对应的至少一个第一图像特征,也即收集待检测画面帧对应的不同卷积深度的图像特征,而由于图像在特征提取过程中,随着卷积深度的增加,语义信息将增多,而位置信息将减少,进而本技术实施例通过多层次特征提取,可提取蕴含不同程度的位置信息以及语义信息的图像特征,可防止待检测目标在特征提取过程中丢失关键信息(位置信息或者语义信息),进而基于第二图像特征提取第二图像特征,将各所述第一图像特征和所述第二图像特征拼接后,得到不同卷积深度第一图像特征对应的目标图像特征,进而对各所述目标图像特征分别进行二分类,得到各二分类结果,即可实现依据不同卷积深度的目标图像特征分别进行二分类而进行视频目标检测的目的,也即,实现了分别依据不同卷积深度的第一图像特征与第二图像特征,对待检测画面帧进行视频目标检测的目的,进而只需存在某一卷积深度的第一图像特征的图像信息比较完整,即可准确地进行二分类,进而准确地进行视频目标检测,所以,提升了视频目标检测的准确度。
65.进一步地,参照图3,基于本技术的第一实施例,在本技术的另一实施例中,在所述基于第一图像特征提取模型,对所述待检测画面帧进行图像特征提取,得到所述待检测画面帧对应的至少一个第一图像特征的步骤之前,所述视频目标检测方法还包括:
66.步骤b10,获取训练图像样本对应的正例图像样本和对应的至少一个负例图像样本;
67.在本实施例中,需要说明的是,所述正例图像样本为与训练图像样本属于同一图像类别的图像样本,所述负例图像样本为不与训练图像样本属于同一图像类别的图像样本,其中,具备相同的检测目标的图像划分为一图像类别,其余图像划分为另一图像类别,例如,图像a与图像b均具备人物a,图像c和图像d不具备人物a,则图像a与图像b划分为一图像类别,图像c与图像d划分为一图像类别。
68.步骤b20,基于所述第二图像特征提取模型,对所述正例图像样本进行特征提取,得到正例图像特征;
69.在本实施例中,需要说明的是,所述第二图像特征提取模型为已训练的神经网络提取模型,所述正例图像特征为标准画面图像特征。
70.基于所述第二图像特征提取模型,对所述正例图像样本进行特征提取,得到正例图像特征,具体地,通过将所述正例图像样本输入所述第二图像特征提取模型,对正例图像样本进行特征提取,以将正例图像样本映射至预设特征维度,获得所述正例图像样本对应的正例图像特征。
71.步骤b30,基于待训练第一图像特征提取模型,对所述训练图像样本以及各所述负例图像样本进行特征提取,获得所述训练图像样本对应的训练图像特征和各所述负例图像样本对应的负例图像特征;
72.在本实施例中,需要说明的是,待训练第一图像特征提取模型为未训练好的第一
图像特征提取模型。
73.基于待训练第一图像特征提取模型,对所述训练图像样本以及各所述负例图像样本进行特征提取,获得所述训练图像样本对应的训练图像特征和各所述负例图像样本对应的负例图像特征,具体地,通过将所述训练图像样本输入待训练第一图像特征提取模型,以将训练图像样本映射至预设特征维度,对所述训练图像样本进行特征提取,获得所述训练图像样本对应的训练图像特征,相同,通过将各所述负例图像样本输入待训练第一图像特征提取模型,以将各所述负例图像样本至预设特征维度,对所述负例图像样本进行特征提取,获得所述负例图像样本对应的负例图像特征。
74.步骤b40,基于所述训练图像特征和所述正例图像特征之间的差异度以及所述训练图像特征与各所述负例图像特征之间的差异度,构建对比学习损失;
75.在本实施例中,基于所述训练图像特征与所述正例图像特征之间的差异度以及所述训练图像特征与各所述负例图像特征之间的差异度,通过预设对比学习损失计算公式构建对比学习损失,其中,所述预设对比损失计算公式具体如下:
[0076][0077]
其中,l为所述对比学习损失,ua为所述训练图像样本特征,ub为所述正例图像特征,为所述负例图像特征,m为负例图像特征的数量,进而当正例图像特征与训练图像样本特征之间的距离足够小,而各负例图像特征与训练图像样本特征的距离足够大时,所述对比学习损失即可收敛,进而基于对比学习损失更新得到的第一图像特征提取模型即可具备拉近第一图像特征与作为正例的正例图像特征的距离,以及拉远第一图像特征与作为负例的负例图像特征的距离的能力,进而第一图像特征提取模型可基于不同样本类型(正例还是负例)的样本,生成不同的图像特征,使得生成的图像特征具备样本类别信息,提升了特征提取生成的图像信息所包含的信息量,进而可为进行视频目标检测提供更多的决策依据,提升了视频目标检测的准确性,且同时也可以促进待训练第一图像特征提取模型学习第二图像特征提取模型的知识,使得待训练第一图像特征提取的模型在训练过程中更快地收敛,提升特征提取模型的训练效率。
[0078]
步骤b50,基于所述对比学习损失,迭代优化所述待训练特征第一图像特征提取模型,获得所述第一图像特征提取模型。
[0079]
在本实施例中,基于所述对比学习损失,迭代优化所述待训练特征第一图像特征提取模型,获得所述第一图像特征提取模型,具体地,所述对比学习损失是否收敛,若所述对比学习损失收敛,则将所述待训练第一图像特征提取模型作为第一图像特征提取模型,若所述对比学习损失未收敛,则基于所述对比学习损失计算得到的模型梯度,通过预设模型更新方法,更新所述待训练第一图像特征提取模型,并返回执行获取训练图像样本对应的正例图像样本和对应的至少一个负例图像样本的步骤,其中,所述预设模型更新方法包括梯度上升法和梯度下降法。
[0080]
本技术实施例提供了一种图像特征提取模型的训练方法,也即获取训练图像样本对应的正例图像样本和对应的至少一个负例图像样本,进而基于所述第二图像特征提取模型,对所述正例图像样本进行特征提取,得到正例图像特征,进而基于待训练第一图像特征
提取模型,对所述训练图像样本以及各所述负例图像样本进行特征提取,获得所述训练图像样本对应的训练图像特征和各所述负例图像样本对应的负例图像特征,进而基于所述训练图像特征和所述正例图像特征之间的差异度以及所述训练图像特征与各所述负例图像特征之间的差异度,构建对比学习损失,进而基于所述对比学习损失,迭代优化所述待训练特征第一图像特征提取模型,获得所述第一图像特征提取模型,实现了通过对比学习构建第一图像特征提取模型的目的,使得第一图像特征提取模型具备拉近第一图像特征与作为正例的正例图像特征的距离,以及拉远第一图像特征与作为负例的负例图像特征的距离的能力,提升了第一图像特征提取模型的特征提取的准确度,可对于属于同一类的图像可生成类似的图像特征,对于不同类的图像可生成相似度较低的图像特征,所以,依据所述第一图像特征提取模型可更加准确的进行视频目标检测,为提升视频目标检测的准确度奠定了基础。
[0081]
参照图4,图4是本技术实施例方案涉及的硬件运行环境的设备结构示意图。
[0082]
如图4所示,该视频目标检测设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
[0083]
可选地,该视频目标检测设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency,射频)电路,传感器、硬盘电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
[0084]
本领域技术人员可以理解,图4中示出的视频目标检测设备结构并不构成对视频目标检测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0085]
如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及视频目标检测程序。操作系统是管理和控制视频目标盘检测设备硬件和软件资源的程序,支持视频目标检测程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与视频目标检测系统中其它硬件和软件之间通信。
[0086]
在图4所示的视频目标检测设备中,处理器1001用于执行存储器1005中存储的视频目标检测程序,实现上述任一项所述的视频目标检测方法的步骤。
[0087]
本技术视频目标检测设备具体实施方式与上述视频目标检测方法各实施例基本相同,在此不再赘述。
[0088]
本技术实施例还提供一种视频目标检测装置,所述视频目标检测装置应用于视频目标检测设备,所述视频目标检测装置包括:
[0089]
提取模块,用于获取待检测视频,并在所述待检测视频中提取待检测画面帧;
[0090]
匹配模块,用于获取待检测目标的关键信息,并为所述关键信息匹配对应的所述待检测目标对应的画面图像;
[0091]
检测模块,用于通过对所述待检测画面帧和所述画面图像进行图像识别,判断所述待检测画面帧中是否存在所述画面图像,得到视频目标检测结果。
[0092]
可选地,所述硬盘状态预测模型包括健康状态预测模型和退役状态预测模型,所述检测模块还用于:
[0093]
基于第一图像特征提取模型,对所述待检测画面帧进行图像特征提取,得到所述待检测画面帧对应的至少一个第一图像特征;
[0094]
基于第二图像特征提取模型,对所述标准画面图像进行图像特征提取,得到所述标准画面图像对应的第二图像特征;
[0095]
依据所述至少一个第一图像特征和所述第二图像特征,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果;
[0096]
可选地,所述检测模块还用于:
[0097]
基于所述第一图像特征提取模型,对所述待检测画面帧进行多层次特征提取,得到所述待检测画面帧对应的至少一个第一图像特征;和/或
[0098]
基于所述第一图像特征提取模型,对所述待检测画面帧进行多区域特征提取,得到所述待检测画面帧对应的至少一个第一图像特征。
[0099]
可选地,所述检测模块还用于:
[0100]
分别计算各所述第一图像特征和所述第二图像特征之间的特征相似度;
[0101]
依据所述特征相似度,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果。
[0102]
可选地,所述检测模块还用于:
[0103]
分别将各所述第一图像特征和所述第二图像特征进行拼接,得到各所述第一图像特征对应的目标图像特征;
[0104]
分别对所述目标图像特征进行二分类,得到各二分类结果;
[0105]
依据各所述二分类结果,判断所述待检测画面帧中是否存在所述待检测目标,得到所述视频目标检测结果。
[0106]
可选地,所述检测模块还用于:
[0107]
获取训练图像样本对应的正例图像样本和对应的至少一个负例图像样本;
[0108]
基于待训练第一图像特征提取模型,对所述训练图像样本以及各所述负例图像样本进行特征提取,获得所述训练图像样本对应的训练图像特征和各所述负例图像样本对应的负例图像特征;
[0109]
基于所述训练图像特征和所述正例图像特征之间的差异度以及所述训练图像特征与各所述负例图像特征之间的差异度,构建对比学习损失;
[0110]
基于所述对比学习损失,迭代优化所述待训练特征第一图像特征提取模型,获得所述第一图像特征提取模型。
[0111]
本技术视频目标检测装置的具体实施方式与上述视频目标检测方法各实施例基本相同,在此不再赘述。
[0112]
本技术实施例提供了一种可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的视频检测方法的步骤。
[0113]
本技术可读存储介质具体实施方式与上述视频目标检测方法各实施例基本相同,在此不再赘述。
[0114]
本技术实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的视频目标检测方法的步骤。
[0115]
本技术计算机程序产品具体实施方式与上述视频目标检测方法各实施例基本相同,在此不再赘述。
[0116]
以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利处理范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1