一种视频检索方法和系统与流程

文档序号:18834164发布日期:2019-10-09 04:32阅读:1191来源:国知局
一种视频检索方法和系统与流程

本申请涉及视频查找技术领域,具体涉及一种视频检索方法和系统。



背景技术:

目前在安防、交通管理、商场、生产、机器视觉、仓储等场所大量使用视频系统,存在海量的视频数据。视频信息的分析、处理运用已成为智慧城市建设的重要部分。

现视频检索主要依赖人工处理,相同时间的视频要用相同时间回放视频来寻找视频中的目标场景,效率低下而且容易遗漏。还有一种视频检索方法是将视频上传到商家提供的云端服务器,通过云端服务器的强力算力以及神经网络算法对视频信息进行分析,上传视频同样也花费较长时间,存在效率低下的问题。



技术实现要素:

为克服现有技术的上述缺陷,本申请提供一种高效的视频检索方法和系统。

根据第一方面,一种实施例中提供一种视频检索方法,包括以下步骤:拍摄视频时,同步提取拍摄视频时拍摄的帧图片;调用神经网络模型对帧图片进行识别,并将识别的目标物以及对应帧图片的拍摄时间存储在标签文件夹中;在标签文件夹中检索第一目标物,显示该标签文件夹中的与第一目标物匹配的帧图片的拍摄时间。

优选地,神经网络模型对帧图片进行识别后,还将被识别的帧图片存储到标签文件夹中,输入第二目标物并调用专用神经网络模型对第一目标物匹配的帧图片进行二次识别,显示二次识别中与第二目标物匹配的帧图片的拍摄时间。

优选地,还包括输入图片,调用神经网络模型对该图片的目标物进行识别,将识别出的目标物作为检索条件查找标签文件夹中与之匹配的帧图片和/或帧图片的拍摄时间。

优选地,当设定的目标物出现并被神经网络模型识别时,发出报警。

优选地,被识别的目标物以及对应帧图片的拍摄时间以电子标签形式存储在标签文件夹中,当多张帧图片被识别且其中的目标物相同时,保存其中的一张或数张帧图片及该帧图片对应的电子标签。

优选地,设定的时间点或者存储空间不足时,删除未识别的帧图片和/或对应未识别帧图片的视频。

根据第二方面,一种实施例中提供一种视频检索系统,包括帧图片提取单元、帧图片识别单元、存储单元、输入单元、检索单元以及显示单元;所述图片提取单元用于在拍摄视频时,同步提取拍摄视频时拍摄的帧图片;帧图片识别单元用于调用神经网络模型对帧图片进行识别,并将识别的目标物以及对应帧图片的拍摄时间存储在标签文件夹中;存储单元用于存储视频、标签文件夹;输入单元用于输入待检索的目标物;检索单元,用于根据待检索的目标物查找标签文件夹中与之相匹配的帧图片和/或帧图片的拍摄时间;显示单元,用于显示帧图片的拍摄时间和/或对应的帧图片。

优选地,所述显示单元和输入单元集成在触控显示屏上。

依据上述实施例的视频检索方法和系统,由于在拍摄视频时,即通过神经网络模型对帧图片进行目标物识别,并将识别的目标物和帧图片拍摄的时间在标签文件夹中保存,需要查找特定目标物时,直接在标签文件夹中查找与特定目标物匹配的目标物,进而得到特定目标物出现的时间,然后按时间回放视频即可对特定目标物进行观察,采用此方法来查找目标,不用现场来对视频进行识别分析,而被识别的目标物以及拍摄的时间的存储容量仅为几个字节,如此极大提高了查找目标的效率。进一步,本申请直接采用帧图片作为识别分析对象,相对于以往以拍摄好的视频作为分析对象,避免了视频图片编码和解码的步骤,也提高了图片识别的效率。再进一步,调用专用神经网络模型通过专业对帧图片进行二次识别,可以做到精准识别,再次提高检索效率。

附图说明

图1为本申请一实施例流程图;

图2为本申请另一实施例流程图;

图3为本申请一实施例系统框图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。

实施例一

请参考图1,视频检索方法,包括以下步骤:

101、拍摄视频时,同步提取拍摄视频时拍摄的帧图片;

102、调用训练好的神经网络模型对帧图片进行识别,并将识别的目标物的名称或者目标物的代码和对应帧图片的拍摄时间制作成电子标签标签存储在标签文件夹中。

训练是指用神经网络模型对大量目标物样本图片进行学习训练,并记忆其特征,例如给出目标物“货车”,通过神经网络学习算法,让算法模型能够从帧图片中找出具有货车的图片。

103、输入第一目标物名称或代码对标签文件夹进行检索,显示与第一目标物匹配的帧图片的拍摄时间。

目标物、帧图片的拍摄时间以及对应的帧图片可以以电子标签的形式存储,电子标签可以是二维码、条形码等。例如一个电子标签中,含有目标物“汽车”、“骑行人”、对应的帧图片以及该帧图片的拍摄时间信息。与第一目标物匹配的帧图片是指第一目标物被识别且出现在该帧图片中。例如,检索时输入第一目标物“汽车”或者“汽车”的代码01,当电子标签中含有“汽车”或者代码01时,则该电子标签对应的帧图片与第一目标物匹配。

提取出的帧图片经识别后存储在标签文件夹中,并对该帧图片做好标记,例如帧图片的拍摄时间,图片中所具有的目标物。其中的目标物可以是货车、大客车、轿车、行人、骑车人、交通标识牌、色块、纹理、场景、人脸等类别信息,如仅有行人则标注时间、及“行人(或代码)”,如有行人、轿车则标注时间、“轿车(或代码)”和“行人(或代码)”,以此类推。识别的目标物可以分类根据运用场景不同来进行设置。

进行检索时,仅需对标签文件夹进行检索即可,如要寻找有轿车出现的视频片段,则输入“轿车(或代码)”即可,输出含有目标物“轿车”的所有帧图片的拍摄的时间,最好同时显示含有目标物“轿车”的所有帧图片,人们按拍摄的时间回放即可观察当时的场景。

调用的神经网络模型可以为一个或者多个。例如调用的神经网络模型可以是一个大模型,也可以是数个不同类别的小模型的串联。

实施例二

请参考图2,视频检索方法,包括以下步骤:

201、拍摄视频时,同步提取拍摄视频时拍摄的帧图片;

202、调用训练好的神经网络模型对帧图片进行识别,并将识别的目标物、对应帧图片、以及对应帧图片的拍摄时间存储在标签文件夹中。

203、在标签文件夹中检索第一目标物,获得该标签文件夹中的与第一目标物匹配的帧图片。

204、输入第二目标物并调用专用神经网络模型对第一目标物匹配的帧图片进行二次识别,显示二次识别中与第二目标物匹配的帧图片的拍摄时间。

本实施例是在实施例一的基础上进行二次检索,当初次检索出现的帧图片较多,不能快速找出需要查找的目标目标物时,可以进行第二次的精准识别检索。如要寻找某车牌号的轿车,首先检索出含有“轿车”的帧图片,然后调用车牌识别模型对含有“轿车”的帧图片进行二次识别,找出与目标“车牌”匹配的帧图片或目标“车牌”匹配的帧图片的拍摄时间,如此大幅提高查找效率。

在一优选实施例中,还可以输入图片,调用神经网络模型对该图片的目标物进行识别,将识别出的目标物作为检索条件查找标签文件夹中与之匹配的帧图片。即以图搜图,如输入一张戴厨师帽的厨师的照片,则在监控视频中找出具有“厨师帽”和“人”的帧图片,提高搜索准确度。

在一优选实施例中,当设定的目标物出现并被神经网络模型识别时,发出报警。例如当某罪犯的人脸目标物被识别时,发出报警,此功能实用性非常强,能够极大提高民警的破案效率。同时,此功能也可以应用在其它场合,例如安装在行车记录仪内,摄像头捕捉到驾驶员“闭眼”目标物持续三秒时,则启动声音警报,唤醒驾驶员。

请参考图3,本申请还提供一种视频检索系统,包括帧图片提取单元、帧图片识别单元1、存储单元2、输入单元、检索单元、摄像单元3、显示单元;其中,显示单元和输入单元集成在触控显示屏4上,输入单元用于输入需检索的目标物,显示单元用于显示帧图片的拍摄时间和/或对应的帧图片。摄像单元3用于拍摄视频,摄像单元可以是独立的摄像头装置。图片提取单元用于在拍摄视频时,同步提取拍摄视频时拍摄的帧图片,图片提取单元可以设于cpu5中;帧图片识别单元用于调用神经网络模型对帧图片进行识别,并根据识别的目标物将帧图片分类存储在各个标签文件夹中,一同存储的还包括帧图片的拍摄时间,帧图片识别单元1可以采用美国硅谷gti公司的2801s或2803s或5801神经网络处理npu芯片,同时也可采用深圳云朵数据科技有限公司的系列芯片。神经网络处理npu芯片调用算法模型后可以对图片中的目标物进行识别;存储单元用于存储视频、各个标签文件夹以及帧图片的拍摄时间,存储单元2可以是pc机硬盘、硬盘录像机等存储设备;检索单元,用于根据输入的目标物查找标签文件夹中与之相匹配的帧图片,检索单元也同样可以设于cpu5中,由cpu来执行检索任务。另外,cpu5与其它各模块连接,起指挥、下达指令、调度等作用。

由摄像单元拍摄的帧图片经cpu5调度后同步被分成两路,一路编码成视频文件后存储到存储单元,另一路同步传输到帧图片识别单元,每秒提取的帧图片数按照npu芯片的处理能力顶格确定,一般不能少于每秒5帧。同时,帧图片识别单元调用已加载的识别模型同步对每一帧图片进行目标物识别,识别后的帧图片附上其具有的目标物以及拍摄的时间存储在存储单元的标签文件夹中。进行视频检索时,仅需对标签文件夹进行检索即可,输出目标物匹配的帧图片及帧图片的拍摄时间,然后按时间回放。

以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1