一种视频目标检索方法与流程

文档序号：14519230阅读：151来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及视频检索技术领域，尤其涉及一种视频目标检索方法。

背景技术：

目前，视频监控系统在维护社会治安、加强社会管理及安全保障方面发挥重要作用，面对日益增长的摄像头数量，从这些海量的视频监控中寻找感兴趣的目标将耗费大量人力物力。因此视频目标自动检测、存储及检索，能够有效提高海量视频监控效率。

然而现有的视频目标检索系统在对运动目标进行提取、存储的过程中，只对运动目标进行截取，并未对目标按照类别划分进行标识，目标特征选取单一，面对从大量的视频数据中检索出特定类别目标时，局限性较大，不能有效保障检索的效率。

技术实现要素：

本发明所解决的技术问题在于提供一种视频目标检索方法，以解决上述背景技术中的缺点。

本发明所解决的技术问题采用以下技术方案来实现：

一种视频目标检索方法，具体步骤如下：

1）对实时视频流/本地视频文件进行硬解码、图像转换，以获取视频流，得到可进行计算的图像数据；

2）在ubuntu系统下配置caffe环境，对caffe中ssd算法模型的c++实现进行重新编译；

3）将步骤1）中解码后的图像数据输入至ssd算法模型中，以获得图像中的各类目标位置框信息，在根据检索需求从中选取主要检索目标，获取目标在图像中的位置框信息；

4）将步骤3）中获取的目标位置框信息输入至基于卡尔曼滤波的目标跟踪算法中，使得ubuntu系统能够在当前场景下对目标进行区分与跟踪；

5）对步骤4）中每个跟踪目标分别进行截图，按照时间分段截取多张目标图片，并提取目标图片的rgb颜色直方图特征、面积特征、目标类别，存入数据库中，并在数据库中建立主键对每个目标进行标识；

6）输入待检索目标，首先按照目标类别对步骤5）中建立的数据库进行筛选，然后提取待检索目标的颜色、面积特征，基于欧几里德距离计算与数据库数据的相似度，得到与待检索目标的相似度；

7）按照相似度由高到低排序，得目标检索结果。

在本发明中，步骤1）中，利用ffmpeg或cuda工具对实时视频流/本地视频文件进行硬解码、图像转换，以获取视频流，得到可进行计算的图像数据。

在本发明中，步骤1）中，利用opencv的函数读取视频流及本地视频文件。

在本发明中，步骤5）中，按照时间分段截取5张目标图片，5张目标图片都是对同一目标不同时间段的描述。

在本发明中，步骤5）中，对存入数据库中目标图片的rgb颜色直方图特征、面积特征，按照0.4～0.8：0.1～0.2的权重比进行分配。

有益效果：本发明采用基于多特征融合的视频目标检索，将多目标识别、多目标跟踪及目标特征提取进行并行有效集成，有效提高识别效率，同时将目标类别信息进行存储，针对用户对特定类别目标检索的需求，自动快速检索出符合要求的目标，速度快、效率高，可广泛应用于实战中，具有一定的经济效益和使用价值。

附图说明

图1为本发明的较佳实施例的流程示意图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体图示，进一步阐述本发明。

参见图1的一种视频目标检索方法，具体步骤如下：

1）利用ffmpeg工具、cuda工具对实时视频流/本地视频文件进行硬解码、图像转换，以获取视频流，得到可进行计算的图像数据，也可利用opencv的函数进行视频流及本地视频文件读取；

2）在ubuntu系统下配置caffe环境，对caffe中ssd算法模型的c++实现进行重新编译；

3）将步骤1）中解码后的图像数据输入至ssd算法模型中，以获得图像中的各类目标位置框信息（其中目标类别包括：人、自行车、小车、大巴车、摩托车、猫、狗等，目标种类可通过重新训练算法进行更改），在根据检索需求从中选取主要检索目标，获取其位置框信息（目标在图像中的位置）；

4）将步骤3）中获取的目标位置框信息输入至基于卡尔曼滤波的目标跟踪算法中，使得ubuntu系统能够在当前场景下对目标进行区分与跟踪；

5）对步骤4）中每个跟踪目标分别进行截图，按照时间分段截取5张目标图片（5张目标图片都是对同一目标不同时间段的描述），并提取rgb颜色直方图特征、目标图片的面积特征、目标的类别，存入数据库中（对于颜色及面积特征，按照一定权重比进行分配，权重根据实际应用场景进行调整（例如0.8:0.2）），并在数据库中建立主键对每个目标进行标识；

6）输入待检索目标，首先按照目标类别对步骤5）中建立的数据库进行筛选，然后提取待检索目标的颜色、面积特征，基于欧几里德距离计算与数据库数据的相似度（对颜色特征与面积特征计算结果首先进行标准化处理，使得量纲统一，然后分别乘上步骤5）中的对应权重，再相加），得到与待检索目标的相似度；

7）按照相似度由高到低排序，得目标检索结果。

在本实施例中，系统环境需求：显卡gtx1080；系统：ubuntu；软件：cuda、ffmpeg、caffe、opencv。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

技术特征：

技术总结
一种视频目标检索方法，首先对实时视频流/本地视频文件进行硬解码、图像转换以获取视频流，在将解码后的图像数据输入至SSD算法模型，获得图像中的各类目标位置框信息，在将目标位置框信息输入基于卡尔曼滤波的目标跟踪算法对目标进行区分与跟踪，并对每个跟踪目标分别进行截图，并提取目标图片的RGB颜色直方图特征、面积特征、目标类别存入数据库中，同时在数据库中建立主键对每个目标进行标识；输入待检索目标，首先对数据库进行筛选，然后提取颜色、面积特征，基于欧几里德距离计算与数据库数据的相似度，按照相似度由高到低排序，得目标检索结果，自动快速检索出符合要求的目标，速度快、效率高，可广泛应用于实战中。

技术研发人员：贠周会;吴斌;谢吉朋
受保护的技术使用者：江西洪都航空工业集团有限责任公司
技术研发日：2017.11.30
技术公布日：2018.05.25

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贠周会;吴斌;谢吉朋
技术所有人：江西洪都航空工业集团有限责任公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。