一种视频分析方法与流程

文档序号：20841291发布日期：2020-05-22 17:32阅读：538来源：国知局

本发明涉及视频分析技术领域，特别涉及一种视频分析方法。

背景技术：

视频分析是计算机视觉领域的一个重要方向，近几年，神经网络在图像分析领域取得了重大突破，然而相对图像而言，视频增加了时间维度信息，因此让机器理解不同视频帧在时间维度上的联系变得尤为重要。在传统的方法中，通常利用光流等手工特征来描述视频的时间信息，往往只考虑不同的单帧图像的分析结果，无法准确区分视频中整体动作中的某部分关键动作，导致视频的识别结果不准确。

因此，发明一种视频分析方法来解决上述问题很有必要。

技术实现要素：

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种视频分析方法，解决了现有无法准确区分视频中整体动作中的某部分关键动作，导致视频的识别结果不准确问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：一种视频分析方法，包括以下步骤：

a：视频输入：将待识别视频输入单帧识别模型，得到待识别视频中单帧图像的单帧特征；

b：视频剪切：对视频进行镜头分割，得到视频的各个分镜片段，分别进行识别；

c：视频块分选：根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；

d：语音识别：对于任意一个分镜片段，对分镜片段的音频进行语音识别，得到音频的文字内容；

e：视频分析：分析任意一个分镜片段中异常行为，对分镜片段的视频帧进行目标识别，得到分镜片段的目标识别结果；

f：确定分镜片段：根据音频的文字内容，目标识别结果，确定分镜片段的标签。

可选的，所述步骤f中在多个连续的分镜片段的标签相匹配的情况下，将多个连续的分镜片段合并为组合分镜片段。

可选的，所述步骤e中对分镜片段的关键帧进行目标识别，得到分镜片段的目标识别结果，目标识别包括物体识别和人脸识别中的一种或两种。

可选的，所述步骤c中将初始注意力矩阵和第一个视频块的特征流矩阵，输入长短期记忆模型进行处理，得到第一个视频块的注意力矩阵，将第二个视频块及其后续的视频块作为当前视频块，依次将上一个视频块的注意力矩阵和当前视频块的特征流矩阵，输入长短期记忆模型进行处理，得到当前视频块的注意力矩阵。

可选的，所述步骤d中通过语音识别模块，用于对于任意一个分镜片段，对分镜片段的音频进行语音识别，得到所述音频的文字内容。

可选的，所述步骤b中通过视频块划分模块，用于根据帧长度、起始帧和识别步长，将待识别视频划分为各视频块。

可选的，所述步骤a中通过单帧特征确定模块，用于将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征。

(三)有益效果

本发明提供了一种视频分析方法，具备以下有益效果：

(1)、本发明通过单帧识别模型可以通过不同的单帧图像的进行分析，通过对视频剪切进行对视频进行分别分析，提高分析的准确度，通过视频块分选通过视频块的特征流矩阵进行进一步的分析，通过语音识别可以通过语音和文字再一次确认分析，然后分析视频中是否存在异常行为，提高视频的分析结构准确度，通过分镜片段的标签的设置可以快速查找异常行为的片段，结束了查找时间。

(2)、本发明工艺简单，设备要求低，可操作性强，具有良好的社会推广应用。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种视频分析方法，包括以下步骤：

a：视频输入：将待识别视频输入单帧识别模型，得到待识别视频中单帧图像的单帧特征；

b：视频剪切：对视频进行镜头分割，得到视频的各个分镜片段，分别进行识别；

c：视频块分选：根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；

d：语音识别：对于任意一个分镜片段，对分镜片段的音频进行语音识别，得到音频的文字内容；

e：视频分析：分析任意一个分镜片段中异常行为，对分镜片段的视频帧进行目标识别，得到分镜片段的目标识别结果；

f：确定分镜片段：根据音频的文字内容，目标识别结果，确定分镜片段的标签。

作为本发明的一种可选技术方案：

步骤f中在多个连续的分镜片段的标签相匹配的情况下，将多个连续的分镜片段合并为组合分镜片段。

作为本发明的一种可选技术方案：

步骤e中对分镜片段的关键帧进行目标识别，得到分镜片段的目标识别结果，目标识别包括物体识别和人脸识别中的一种或两种。

作为本发明的一种可选技术方案：

步骤c中将初始注意力矩阵和第一个视频块的特征流矩阵，输入长短期记忆模型进行处理，得到第一个视频块的注意力矩阵，将第二个视频块及其后续的视频块作为当前视频块，依次将上一个视频块的注意力矩阵和当前视频块的特征流矩阵，输入长短期记忆模型进行处理，得到当前视频块的注意力矩阵。

作为本发明的一种可选技术方案：

步骤d中通过语音识别模块，用于对于任意一个分镜片段，对分镜片段的音频进行语音识别，得到所述音频的文字内容。

作为本发明的一种可选技术方案：

步骤b中通过视频块划分模块，用于根据帧长度、起始帧和识别步长，将待识别视频划分为各视频块。

作为本发明的一种可选技术方案：

步骤a中通过单帧特征确定模块，用于将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征。

需要说明的是，在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

技术特征：

1.一种视频分析方法，其特征在于，包括以下步骤：

a：视频输入：将待识别视频输入单帧识别模型，得到待识别视频中单帧图像的单帧特征；

b：视频剪切：对视频进行镜头分割，得到视频的各个分镜片段，分别进行识别；

c：视频块分选：根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；

d：语音识别：对于任意一个分镜片段，对分镜片段的音频进行语音识别，得到音频的文字内容；

e：视频分析：分析任意一个分镜片段中异常行为，对分镜片段的视频帧进行目标识别，得到分镜片段的目标识别结果；

f：确定分镜片段：根据音频的文字内容，目标识别结果，确定分镜片段的标签。

2.根据权利要求1所述的一种视频分析方法，其特征在于：

所述步骤f中在多个连续的分镜片段的标签相匹配的情况下，将多个连续的分镜片段合并为组合分镜片段。

3.根据权利要求1所述的一种视频分析方法，其特征在于：

所述步骤e中对分镜片段的关键帧进行目标识别，得到分镜片段的目标识别结果，目标识别包括物体识别和人脸识别中的一种或两种。

4.根据权利要求1所述的一种视频分析方法，其特征在于：

所述步骤c中将初始注意力矩阵和第一个视频块的特征流矩阵，输入长短期记忆模型进行处理，得到第一个视频块的注意力矩阵，将第二个视频块及其后续的视频块作为当前视频块，依次将上一个视频块的注意力矩阵和当前视频块的特征流矩阵，输入长短期记忆模型进行处理，得到当前视频块的注意力矩阵。

5.根据权利要求1所述的一种视频分析方法，其特征在于：

所述步骤d中通过语音识别模块，用于对于任意一个分镜片段，对分镜片段的音频进行语音识别，得到所述音频的文字内容。

6.根据权利要求1所述的一种视频分析方法，其特征在于：

所述步骤b中通过视频块划分模块，用于根据帧长度、起始帧和识别步长，将待识别视频划分为各视频块。

7.根据权利要求1所述的一种视频分析方法，其特征在于：

所述步骤a中通过单帧特征确定模块，用于将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征。

技术总结
本发明公开了一种视频分析方法，涉及视频分析技术领域，包括以下步骤：A：视频输入：将待识别视频输入单帧识别模型，得到待识别视频中单帧图像的单帧特征，B：视频剪切，C：视频块分选，D：语音识别，E：视频分析，F：确定分镜片段。本发明通过单帧识别模型可以通过不同的单帧图像的进行分析，通过对视频剪切进行对视频进行分别分析，提高分析的准确度，通过视频块分选通过视频块的特征流矩阵进行进一步的分析，通过语音识别可以通过语音和文字再一次确认分析，然后分析视频中是否存在异常行为，提高视频的分析结构准确度，通过分镜片段的标签的设置可以快速查找异常行为的片段，结束了查找时间。

技术研发人员：倪出尘
受保护的技术使用者：中译语通文娱科技(青岛)有限公司
技术研发日：2019.12.19
技术公布日：2020.05.22

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：倪出尘
技术所有人：中译语通文娱科技(青岛)有限公司
我是此专利的发明人

上一篇：绷带、尤其压迫绷带的制作方法
上一篇：一种应用于同步轮的串联油缸系统及其修正方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。