一种相似视频的检测方法、设备、系统及存储介质与流程

文档序号:16146778发布日期:2018-12-05 16:33阅读:216来源:国知局
一种相似视频的检测方法、设备、系统及存储介质与流程
本发明涉及视频处理
技术领域
,特别是涉及一种相似视频的检测方法、设备、系统及存储介质。
背景技术
近几年固网与移动网络带宽都迅猛发展,视频业务也随之突飞猛进,而互联网及iptv环境的视频数量也呈现爆炸式增长。然而目前在海量的视频中寻找到内容匹配的视频时,只能是通过匹配视频名字来实现,用户无法直接查找视频内容,导致视频之间的相关性仅能通过用户的点击来建立联系,而无法从视频本身的内容来匹配。因此,如何从视频本身的内容来匹配视频的相关性,是目前视频处理
技术领域
所面临的一个重要问题。技术实现要素:本发明提供一种相似视频的检测方法、设备、系统及存储介质,用以解决现有技术中视频的相关性无法从视频本身的内容来匹配的问题。为实现上述发明目的,本发明采用下述的技术方案:依据本发明的一个方面,提供一种相似视频的检测方法,包括:对待检测视频进行识别,获取所述待检测视频中所包含的人物信息;比较视频库中的目标视频与所述待检测视频中所包含的人物信息是否一致,当一致时,则判定所述目标视频与所述待检测视频为相似视频。可选的,所述获取两个待检测视频中所包含的人物信息,包括:根据预设时间周期从所述待检测视频中提取视频帧;对所述视频帧进行解码,将解码后的视频帧转换为图片;根据预设的识别规则获取所述图片所包含的人物信息。可选的,所述根据预设的识别规则获取所述图片所包含的人物信息,包括:将所述图片发送至图片处理服务器中;接收所述图片处理服务器发送的所述图片中所包含的人物信息。可选的,所述人物信息为人物姓名和人物出现的频率;所述比较视频库中的目标视频与所述待检测视频中所包含的人物信息是否一致,当一致时,则判定所述目标视频与所述待检测视频为相似视频,包括:判断所述视频库中的目标视频与所述待检测视频中出现的频率最高的人物姓名是否相同,当相同时,则判定所述目标视频与所述待检测视频为相似视频。可选的,所述人物信息为人物姓名;所述比较视频库中的目标视频与所述待检测视频中所包含的人物信息是否一致,当一致时,则判定所述目标视频与所述待检测视频为相似视频,包括:判断所述视频库中的目标视频与所述待检测视频中是否有相同的人物姓名,当有相同时,则判定所述目标视频与所述待检测视频为相似视频。依据本发明的一个方面,提供一种相似视频的检测系统,包括:客户端,用于对待检测视频进行识别,获取所述待检测视频中所包含的人物信息;服务端,用于比较视频库中的目标视频与所述待检测视频中所包含的人物信息是否一致,当一致时,则判定视频库中的目标视频与所述待检测视频为相似视频。可选的,所述客户端具体用于:根据预设时间周期从所述待检测视频中提取视频帧;对所述视频帧进行解码,将解码后的视频帧转换为图片;根据预设的识别规则获取所述图片所包含的人物信息。可选的,所述客户端具体用于:将所述图片发送至图片处理服务器中;接收所述图片处理服务器发送的所述图片中所包含的人物信息。可选的,所述人物信息为人物姓名和人物出现的频率;所述服务端,具体用于:判断所述视频库中的目标视频与所述待检测视频中出现的频率最高的人物姓名是否相同,当相同时,则判定所述目标视频与所述待检测视频为相似视频。可选的,所述人物信息为人物姓名;所述服务端,具体用于:判断所述视频库中的目标视频与所述待检测视频中是否有相同的人物姓名,当有相同时,则判定所述目标视频与所述待检测视频为相似视频。依据本发明的一个方面,提供一种相似视频的检测设备,其特征在于,包括处理器和存储器,其中所述存储器中存储有相似视频的检测程序;所述处理器用于执行所述存储器中存储的所述程序,用以实现上述所述的相似视频的检测方法。依据本发明的一个方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有相似视频的检测程序,所述相似视频的检测程序被处理器执行时用以实现上述所述的相似视频的检测方法。本发明有益效果如下:本发明实施例通过检测视频中所包含的人物信息,根据人物信息来确定视频之间是否相似,能够将真正内容相似的视频推送给用户,或者允许用户搜索到与关键人物名字关联度高的视频,对于新闻、娱乐、历史等出现人物较多的片源,有较高的识别度,有效提高用户的使用体验。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明为了更清楚地说明本发明实施例或现有中的方案,下面将对实施例或现有描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例所提供的相似视频的检测方法的流程图;图2为本发明一实施例中服务器中相似视频的检测方法的流程示意图;图3为本发明实施例所提供的相似视频的检测设备的原理框图;图4为本发明实施例所提供的相似视频的检测系统的原理框图。具体实施方式以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。方法实施例本发明实施例所提供相似视频的检测方法,如图1所示,具体包括如下步骤:步骤101,对待检测视频进行识别,获取待检测视频中所包含的人物信息。这里的人物信息为人物的姓名,或者人物的姓名以及根据人物姓名获取的频率。根据人物信息则进一步判断视频是否相似,在步骤102中具体进行说明。其中,步骤101中的处理过程可在客户端进行,也可在服务端进行,后续进行说明。可选的,在对待检测视频进行识别,获取待检测视频中所包含的人物信息;包括:根据预设时间周期从待检测视频中提取视频帧;对所视频帧进行解码,将解码后的视频帧转换为图片;根据预设的识别规则获取图片所包含的人物信息。这里,待检测视频可以为直播的视频码流,也可以为存储于视频库中的目标视频。其中,对于直播的视频码流,在发送时,从发送的码流中,视频pts(显示时间戳)每间隔一定时间,提取一视频帧,对视频帧进行解码,解码后的数据再进行编码压缩成图片格式数据;例如压缩成jpg或者其他图片格式的文件。对于视频库中存储的视频文件,则在后台实施提取工作,对于具体的提取过程这里不再进行说明。其中,在根据预设的识别规则获取图片所包含的人物信息时,这里的预设的识别规则根据预先设置在本地的图片识别算法,也可以为利用特定的服务端的图像识别服务进行人物信息的识别获取。这里的图片识别算法,预先在本地设置人物姓名以及人物的人脸特征的映射信息。在识别图片时,对图片的人脸特征进行提取,待提取完成后,根据预设映射信息判断人脸特征信息是否存在,当存在时,则可以获取对应的人物的姓名。由于映射信息需要不断进行更新及维护,识别准确度且处理速度得不到保证,因此,可选地,利用图像识别服务进行人物信息的识别获取,具体包括:将图片发送至图片处理服务器中;接收图片处理服务器发送的图片中所包含的人物信息,将人物信息保存至本地。由于图片处理服务器实时更新人物的信息,且不占用本地的处理资源,因此识别准确度和处理速度都可以保证。例如,待在视频中提取完成图片后,将压缩好图片上传至互联网上的图片识别服务,例如,百度识图等,识别完成后,获取返回的图片上所包含的人物信息。步骤102,比较视频库中的目标视频与待检测视频中所包含的人物信息是否一致,当一致时,则判定目标视频与待检测视频为相似视频。在步骤101中,提到人物信息可以仅包括人物的姓名,还可以为人物的姓名以及根据人物姓名统计出的人物的出现频率。因此,这里分情况进行说明。可选的,人物信息为人物姓名和人物出现的频率;在判定视频库中的目标视频与待检测视频中是否为相似视频,包括:判断视频库中的目标视频与待检测视频中人物出现的频率最高的人物姓名是否相同,当相同时,则判定目标视频与待检测视频为相似视频。这里,只根据出现频率最高的人物最为视频的代表人物,根据该代表人物可以建立两个视频之间的相似关系。进一步地,该方法还可以包括:对目标视频与待检测视频中人物出现的频率的高低对人物进行排序;根据目标视频与待检测视频中相同排序的人物的数量来确定相似视频的相似度。在确定相似度时,可根据相同人物的数量与人物的总数量来确定。举例说明,对一视频中人物出现的频率高低进行排序,依序为a、b、c、。当另一视频中人物出现的频率高低进行排序,依序为a、b、c、,则相似度为100%;当另一视频中人物出现的频率高低进行排序,依序为a、c,则相似度为67%;当另一视频中人物出现的频率高低进行排序,依序为a、b、d、e,则相似度为40%。这里,通过对视频的相似度进行计算,在向用户推送视频或者向用户发送检索结果时,可以按照相似度进行排序,将相似度较高的视频优先向用户展示,以便用户第一时间获取结果信息,提高用户的使用体验。当然,可选的,人物信息为人物的姓名,在判定视频库中的目标视频与待检测视频中是否为相似视频,包括:判断视频库中的目标视频与待检测视频中是否有相同的人物姓名,当有相同时,则判定目标视频与待检测视频为相似视频。进一步,可以根据相同人物的数量来确定两个视频的相似程度,这里不再进行说明。基于上述可知,本发明实施例通过检测视频中所包含的人物信息,根据人物信息来确定视频之间相似程度,能够将真正内容相似的视频推送给用户,或者允许用户搜索到与关键人物名字关联度高的视频,对于新闻、娱乐、历史等出现人物较多的片源,有较高的识别度,有效提高用户的使用体验。下面结合附图和具体实施例对本发明的技术内容进行详细说明。实施例1在该实施例中,以一个模唱娱乐节目的视频为例进行说明。如图2所示,在服务器端,每间隔100帧就选取一帧,通过解码器对选取的视频帧进行解码,解码完成后,通过编码器将解码后的数据编码为一张jpg图片。这里,对节目视频提供提取35张图片。这些图片能够反映该视频典型的人物和场景。如附图2。将这35张图片上传到http://image.baidu.com/,逐个进行识别。其中11张图片被识别出人物。识别结果如下:f100:郭子渝。f200:无结果。f300:无结果。f400:无结果。f500:张靓颖。f600:无结果。f700:无结果。f800:无结果。f900:无结果。f1000:无结果。f1100:无结果。f1200:无结果。f1300:紫罗兰,错误。f1400:张靓颖。f1500:叶梓萱。f1600:无结果。f1700:无结果。f1800:谢依霖。f1900:无结果。f2000:无结果。f2100:无结果。f2200:无结果。f2300:无结果。f2400:无结果。f2500:阎奕格。f2600:无结果。f2700:无结果。f2800:无结果。f2900:阎奕格。f3000:张靓颖。f3100:张靓颖。f3200:张靓颖。f3300:劲爆热舞,非人物。f3400:无结果。f3500:张靓颖。根据识别结果获取每个人物出现的频度和概率如表1所示:人物频度概率郭子渝19%张靓颖654%叶梓萱19%谢依霖19%阎奕格218%表1基于上表可知,本视频的主要人物为张靓颖,出现的频率最高,超过50%。其他几个人物的频率较低,非视频主要人物。这个视频的内容是一个模仿演唱的娱乐节目,其中有一位原唱,本片即为张靓颖,以及四位不太知名的模仿者,谢依霖、阎奕格、主持人郭子渝,观众叶梓萱。从视频内容来看,主要人物也是张靓颖,因此识别结果是符合视频本身内容的。根据上述的方法,将服务器中片源库的每一个视频进行识别,得到一张人物及出现概率的表,那么就可以根据人物的出现概率来比对,将相同人物高概率的视频标识为相似视频,进行相关联。例如,两个视频出现人物概率最高的都是张靓颖,则认为这两个视频为相似视频。当人物概率次高的人物都是阎奕格,则进一步认为两个视频的相似度极高。或者两个视频中出现的人物有较多时相同的,也可以认为两个视频的关联度较高。在该实施例中,通过将相似的视频进行相关联,在实现具体业务时,可以根据这种关联关系来推送相似视频。当用户基于某一人物对视频进行检索时,本发明可以快速确定相关联的视频信息,并进行推送。实施例2上述实施例中,主要是服务器进行识别处理的操作。可选的,识别处理操作在用户端进行,在用户端,用户可以在视频播放的任意时刻选择识别。具体如下:当用户端的上层软件下达识别指令时,解码器的yuvbuffer中的图片数据被提取并编码为jpeg图片;将图片上传至http://image.baidu.com/进行识别,待识别信息返回至用户端后,可通过浏览器显示人物信息,并同时将人物信息上传到iptv服务器;iptv服务器获取到信息后,通过比对片源库中的人物信息,来匹配相同人物的视频,并将这些视频反馈到用户端浏览器,由此来推荐相似视频。基于上述可知,在该实施例中,用户可以实时对视频中的人物进行识别,将识别信息发送至服务器后,服务器可以推送与用户端视频相似的视频,提高用户的使用体验。设备实施例本发明实施例还提供了一种相似视频的检测设备,用以实现上述的方法,如图3所示,该设备包括处理器32以及存储有处理器32可执行指令的存储器31。其中,处理器32可以是通用处理器,例如中央处理器(centralprocessingunit,cpu),还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic),或者是被配置成实施本发明实施例的一个或多个集成电路。存储器31,用于存储程序代码,并将该程序代码传输给cpu。存储器31可以包括易失性存储器(volatilememory),例如随机存取存储器(randomaccessmemory,ram);存储器31也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-onlymemory,rom)、快闪存储器(flashmemory)、硬盘(harddiskdrive,hdd)或固态硬盘(solid-statedrive,ssd);存储器31还可以包括上述种类的存储器的组合。本发明实施例所提供的应用服务器,包括存储器31和处理器;其中,存储器31中存储有计算机可执行的相似视频的检测程序,处理器32用于执行相似视频的检测程序以实现如下步骤:对待检测视频进行识别,获取待检测视频中所包含的人物信息;比较视频库中的目标视频与待检测视频中所包含的人物信息是否一致,当一致时,则判定目标视频与待检测视频为相似视频。可选的,处理器32用于执行相似视频的检测程序以实现如下步骤:根据预设时间周期从两个待检测视频中提取视频帧;对视频帧进行解码,将解码后的视频帧转换为图片;根据预设的识别规则获取图片所包含的人物信息。可选的,处理器32用于执行相似视频的检测程序以实现如下步骤:将图片发送至图片处理服务器中;接收图片处理服务器发送的图片中所包含的人物信息。可选的,人物信息为人物姓名和人物出现的频率;可选的,处理器32用于执行相似视频的检测程序以实现如下步骤:判断视频库中的目标视频与待检测视频中出现的频率最高的人物姓名是否相同,当相同时,则判定目标视频与待检测视频为相似视频。可选的,人物信息为人物姓名;处理器32用于执行相似视频的检测程序以实现如下步骤:判断视频库中的目标视频与待检测视频中是否有相同的人物姓名,当有相同时,则判定目标视频与待检测视频为相似视频。系统实施例本发明实施例还提供了一种相似视频的检测系统,用以实现上述的方法,如图4所示,具体包括:客户端,用于对待检测视频进行识别,获取待检测视频中所包含的人物信息;服务端,用于比较视频库中的目标视频与待检测视频中所包含的人物信息是否一致,当一致时,则判定目标视频与待检测视频为相似视频。可选的,该客户端,具体用于:根据预设时间周期从待检测视频中提取视频帧;对视频帧进行解码,将解码后的视频帧转换为图片;根据预设的识别规则获取图片所包含的人物信息。可选的,该客户端,具体用于:将图片发送至图片处理服务器中;接收图片处理服务器发送的图片中所包含的人物信息。可选的,人物信息为人物姓名和人物出现的频率;该服务端,具体用于:判断视频库中的目标视频与待检测视频中出现的频率最高的人物姓名是否相同,当相同时,则判定目标视频与待检测视频为相似视频。可选的,人物信息为人物姓名;该服务端,具体用于:判断视频库中的目标视频与待检测视频中是否有相同的人物姓名,当有相同时,则判定的目标视频与待检测视频为相似视频。存储介质实施例本发明实施例还提供了一种计算机可读存储介质。这里的计算机可读存储介质存储有一个或者多个程序。其中,计算机可读存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。当计算机可读存储介质中所述一个或者多个程序可被一个或者多个处理器执行,以实现方法实施例中所提供的相似视频的检测方法。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。虽然通过实施例描述了本申请,本领域的技术人员知道,本申请有许多变形和变化而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1