一种相似视频和盗版视频的检测方法及装置的制造方法_3

文档序号:9915008阅读:来源:国知局
视频和第二视频,分别对应第一图片库和第二图片库,第一图片库中包含3张图片A、B、C,第二图片库中包含两张图片D和E,预设第一阈值为0.8,预设第二阈值为50%。则相似视频的检测过程具体如下,将第一图片库中的图片分别与第二图片库中的每张图片对比,则对比数量总量为6,即共有图片A与图片D、图片A与图片E、图片B与图片D、图片B与图片E、图片C与图片D、图片C与图片E六组图片需要对比,确定六组对比图片之间的SS頂值分别为0.85,0.9,0.7,0.92,0.8,0.83;将得到的SS頂值分别与预设第一阈值对比,根据步骤S103可知,共有图片A与图片D、图片A与图片E、图片B与图片E、图片C与图片E四组图片为相似图片,第一图片库和第二图片库中相似图片的组数与所述对比数量总量的比值为4/6,该比值大于预设第二阈值,因此可以确定第一视频和第二视频为相似视频。
[0094]应用本发明实施例提供的技术方案,在进行相似视频检测时,根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;将所述第一图片库中每张图片和第二图片库中每张图片进行对比,确定每两张对比图片之间的SSIM值;针对每个SS頂值,判断所述SSIM值是否大于预设第一阈值,如果是,确定对应该SSIM值的两张对比图片为一组相似图片;统计所述相似图片的组数,并判断所述相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断两个待检测视频是否为相似视频,因此,提高了相似视频的检测效率。
[0095]基于上述实施例,在本发明的一个实施例中,确定所述两张对比图片之间的SSIM值,包括:
[0096]将所述两张对比图片的大小变换为预设大小;
[0097]按照预设窗口的循环对称高斯加权函数,将变换后的两张对比图片划分为多个图片块,并对每个图片块进行循环高斯滤波;
[0098]计算所述两张对比图片中对应图片块之间的SSIM值;
[0099]将多个所述对应图片块之间的SSIM值的均值,确定为所述两张对比图片之间的SS頂值。
[0100]由于计算两张对比图片之间的SSIM值时需要保证两张对比图片的大小相等,因此,将两张对比图片的大小变换为预设大小,具体的,预设大小的值可以根据经验值进行设定,当该预设大小的值小于图片的实际大小时,可以减少计算的数据量,提高相似视频的检测效率。
[0101]具体的,传统计算SSIM值过程中,仅使用预设大小的移动窗口对两张对比图片进行分块处理,在本发明实施例中,按照预设窗口的循环对称高斯加权函数,将变换后的两张对比图片划分为多个图片块,并对每个图片块进行循环高斯滤波,可以有效避免使用移动窗口对两张对比图片进行分块处理带来的局部块效应,提高了计算SSIM值的准确性。在本发明实施例中,根据经验值选择按照11 X 11的窗口对每个图片块进行循环高斯滤波,使得计算的两张对比图片之间的SS頂值更加准确。
[0102]基于上述实施例,在本发明的一个实施例中,所述根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库,包括:根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
[0103]具体的,预先设置一个时间间隔值,例如5ms,当然也可以是2ms或者1ms,该时间间隔可以根据需要进行设置。针对两个待检测视频,每隔5ms从视频中提取出一张特征图片,这样可以提取出多张特征图片,可以确定第一图片库和第二图片库。
[0104]在本发明实施例中,确定所述两个待检测视频为相似视频后,为了进一步提高检测的准确性,还可以采用以下方式,进一步对两个待检测视频进行检测。
[0105]根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第三阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
[0106]在本发明的一个实施例中,计算的两张对比图片之间的SSM值主要能够有效识别图片的亮度、结构化及像素之间的关联性,而加速健壮特征SURF算法考虑了图片之间的多个稳定的极值点,基于这些极值点可以更准确地检测图片之间的相似度,而且不受图片旋转的影响,因此,可以进一步提高相似视频检测的准确性。
[0107]在本发明实施例中,所述根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库之前,所述方法还包括:
[0108]根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用散列函数hash算法确定所述第一图片库和第二图片库中每张图片的hash特征值;根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,根据每个汉明距离,判断对应该汉明距离的所述第一图片库和第二图片库中的图片是否为一组相似图片;判断所述相似图片的组数与对比数量总量的比值是否大于预设第四阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积;或
[0109]根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘ffjijLBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第五阈值,如果是,确定所述两个待检测视频为相似视频。
[0110]采用散列函数hash算法计算的每张图片的hash特征值主要能够反映图片的结构特征;通过局部二值模式LBP算法获得的关于LBP值及与其对应的像素点数量的LBP值直方图在一定程度上能够有效表征图片本身的内容信息;而本发明实施例中所述的结构相似性SS頂算法能够识别图片像素点之间的亮度、对比度以及结构相似度,相对于采用散列函数hash算法和局部二值模式LBP算法中任意一种算法更加精确。因此,可以进一步提高相似视频检测的准确性。
[0111]图2为本发明实施例提供的一种盗版视频的检测方法的流程示意图,所述方法包括以下步骤:
[0112]步骤S201:获取待检测视频。
[0113]在实际应用中,可以采用网络爬虫技术获得被监控网站的一个或多个视频作为待检测视频。
[0114]步骤S202:根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库。
[0115]第二图片库是通过根据第一预设规则从待检测视频中提取多张特征图片确定的,第一预设规则可以有多种,例如可以通过分析待检测视频的关键帧,将待检测视频的所有关键帧对应的图片作为第二图片库,也可以是从待检测视频中随机选取多张特征图片作为第二图片库。
[0116]步骤S203:将所述第一图片库中每张图片和第二图片库中每张图片进行对比,确定每两张对比图片之间的SS頂值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的。
[0117]第一图片库和第二图片库中图片的对比规则可以有多种,例如将第一图片库和第二图片库中对应的图片作为对比图片,或者选择第一图片库和第二图片库中指定部分图片进行对比。在本发明实施例中,将所述第一图片库中的每张图片和第二图片库中的每张图片进行对比,提高了相似图片的检测精度。确定两张对比图片之间的SSIM值在下面进行具体说明。
[0118]在本发明实施例中,从正版视频中提取多张特征图片组成的第一图片库已提前保存,则第一图片库中的图片数量已经确定,从正版视频中提取图片的规则也是确定的。获取第二图片库中每张图片的规则可以与获取第一图片库中每张图片的规则相同,也可以不同。
[0119]步骤S204:针对每个SSIM值,判断所述SSIM值是否大于预设第一阈值,如果是,确定对应该SS頂值的两张对比图片为一组相似图片。
[0120]具体的,当两张对比的图片之间的SSIM值大于预设第一阈值时,确定这两张对比的图片是一组相似图片;当两张对比的图片之间的SSIM值小于或者等于预设第一阈值时,确定这两张对比的图片不是一组相似图片。其中,预设第一阈值可以根据需要预先设定。
[0121]步骤S205:统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
[0122]本发明实施例中,通过统计所述第一图片库和第二图片库中相似图片的组数,计算第一图片库和第二图片库中相似图片的组数与对比数量总量的比值,可以确定第一图片库和第二图片库中相似图片在对比图片的总量中占的比例,将此比例与预设阈值的比较,可以判断待检测视频是否为盗版视频。具体的,当第一图片库和第二图片库中相似图片的组数与对比数量总量的比值大于第二阈值时,确定所述待检测视频为盗版视频;当第一图片库和第二图片库中相似图片的组数与对比数量总量的比值小于或者等于第二阈值时,确定所述待检测视频不是盗版视频。其中,预设第二阈值可以根据需要预先设定。
[0123]假设第一图片库中包含3张图片A、B、C,第二图片库中包含两张图片D和E,预设第一阈值为0.8,预设第二阈值为50%,则盗版视频的检测过程具体如下,将第二图片库中的图片分别与第一图片库中的每张图片比对,则对比数量总量为6,即共有图片D与图片A、图片D与图片B、图片D与图片C、图片E与图片A、图片E与图片B、图片E与图片C六组图片需要对比,确定六组对比图片之间的SSIM值分别为0.85,0.9,0.7,0.92,0.8,0.83;将得到的六个SSM值分别与预设第一阈值对比,根据步骤S204可知,共有图片D与图片A、图片D与图片B、图片E与图片A、图片E与图片C四组图片为相似图片,第一图片库和第二图片库中相似图片的组数与所述对比数量总量的比值为4/6,该比值大于预设第二阈值,因此可以
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1