一种基于双向点乘残差结构的打架视频检测方法与流程

文档序号：32438599发布日期：2022-12-06 20:25阅读：来源：国知局

技术特征：
1.一种基于双向点乘残差结构的打架视频检测方法，其特征在于：包括如下步骤：步骤s10、获取大量的监控视频，对各所述监控视频进行差值强化的预处理；步骤s20、对预处理后的各所述监控视频分别进行切割并打标签，进而构建视频数据集；步骤s30、创建一打架视频检测模型，利用所述视频数据集对打架视频检测模型进行训练；步骤s40、将待检测的监控视频输入训练后的所述打架视频检测模型进行打架事件的自动检测。2.如权利要求1所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述步骤s10具体包括：步骤s11、获取大量的包括打架视频和非打架视频的监控视频；步骤s12、将各所述监控视频分别分解成若干帧的图像帧，分别计算相邻各所述图像帧对应的像素点的rgb差值；步骤s13、构建一信号增强函数，基于所述信号增强函数以及rgb差值对各图像帧进行rgb值的差值强化；步骤s14、对差值强化后的各所述图像帧按原始顺序合并回监控视频，完成所述监控视频的预处理。3.如权利要求2所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述步骤s13中，所述信号增强函数的公式为：其中，x表示rgb差值；α表示无穷大；e表示自然常数。4.如权利要求1所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述步骤s20具体包括：步骤s21、将预处理后的各所述监控视频划分为打架视频和非打架视频，并设定切割次数阈值a和b；所述a和b均为正整数，且a＞b；步骤s22、分别定位各所述打架视频中，打架事件的时间范围，以所述时间范围为中心，随机对各所述打架视频进行a次的切割，得到a个打架子视频，并分别为各所述打架子视频设定一类型为软标签的打架标签，为所述打架视频设定一类型为硬标签的打架标签；步骤s23、随机对各所述非打架视频进行b次的切割，得到b个非打架子视频，并分别为各所述非打架子视频设定一类型为软标签的非打架标签；步骤s24、基于各所述打架视频、打架子视频以及非打架子视频构建视频数据集。5.如权利要求4所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述打架标签以及非打架标签均为数值标签；所述类型为软标签的打架标签的取值范围为(0.8,1)；所述类型为硬标签的打架标签的取值为1；所述类型为软标签的非打架标签的取值范围为(0,0.3)。6.如权利要求1所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：
所述步骤s30具体为：创建一打架视频检测模型，将所述视频数据集按预设比例划分为训练集和验证集，并设定一收敛条件以及一检测精度阈值；利用所述训练集对打架视频检测模型进行训练，直至满足所述收敛条件；利用所述验证集对训练后的打架视频检测模型进行验证，判断检测精度是否大于所述检测精度阈值，若是，则完成所述打架视频检测模型的训练；若否，则扩充所述视频数据集继续训练。7.如权利要求1所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述步骤s30还包括：设定一损失下降阈值，在所述打架视频检测模型训练的过程中，监测所述打架视频检测模型的损失函数的损失值下降程度是否大于损失下降阈值，若是，则进入步骤s20，对相应的所述监控视频进行重新分割；若否，则继续训练。8.如权利要求1所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述步骤s30中，所述打架视频检测模型包括一第一卷积模块、一第二卷积模块、一第一sm-gather模块、一第二sm-gather模块以及一第三sm-gather模块；所述第一卷积模块、第一sm-gather模块、一第二sm-gather模块、第二卷积模块以及第三sm-gather模块依次连接；所述第一卷积模块包括3*3的卷积层；所述第二卷积模块包括1*1的卷积层。9.如权利要求8所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述第一sm-gather模块、第二sm-gather模块以及第三sm-gather模块均用于执行如下步骤：步骤a、对输入的特征图1进行3*3的卷积得到特征图2，让所述特征图2的形状以及通道数与特征图1保持一致；通过sigmoid函数将所述特征图2的rgb值映射到0～1之间，作为所述特征图1的第一权重；将所述第一权重与特征图1进行点乘得到输出1；步骤b、通过sigmoid函数将所述特征图1的rgb值映射到0～1之间，作为所述特征图2的第二权重；将所述第二权重与特征图2进行点乘得到输出2；步骤c、对所述输出1和输出2进行张量相加得到残差结果值，对所述输出1和输出2进行通道拼接得到拼接值；步骤d、对所述拼接值进行1*1的卷积，以使所述拼接值与残差结果值的通道保持一致；步骤e、通过sigmoid函数将所述残差结果值转换为第三权重，将所述第三权重与卷积后的所述拼接值进行点乘作为最终的输出。10.如权利要求1所述的一种基于双向点乘残差结构的打架视频检测方法，其特征在于：所述打架视频检测模型的损失函数为：loss
whole
＝0.1*loss
soft
+0.8*loss
binary
+0.1*loss
rate
；
其中，loss
whole
表示损失函数的总损失值；loss
soft
表示软标签损失；loss
binary
表示交叉熵损失；loss
rate
表示视频切割占比损失；表示软标签；表示软标签的预测值；y
i
表示真实标签；表示真实标签的预测值；δ表示sigmoid函数，用于将值映射到0～1之间。

技术总结
本发明提供了视频检测技术领域的一种基于双向点乘残差结构的打架视频检测方法，包括如下步骤：步骤S10、获取大量的监控视频，对各所述监控视频进行差值强化的预处理；步骤S20、对预处理后的各所述监控视频分别进行切割并打标签，进而构建视频数据集；步骤S30、创建一打架视频检测模型，利用所述视频数据集对打架视频检测模型进行训练；步骤S40、将待检测的监控视频输入训练后的所述打架视频检测模型进行打架事件的自动检测。本发明的优点在于：极大的提升了打架事件识别的准确率以及泛化性能。能。能。

技术研发人员：张西朱坚王雷陆向东
受保护的技术使用者：福建新大陆软件工程有限公司
技术研发日：2022.08.08
技术公布日：2022/12/5

完整全部详细技术资料下载

当前第2页1 2