一种识别重复照片的方法及其实现系统的制作方法_2

文档序号:9911699阅读:来源:国知局
in范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;这样将所有照片比较过后,即可排除一部分在时间上孤立的照片,此类照片间不太可能存在重复照片;
[0053]识别指纹模块,用于将相似判断模块中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
[0054]所述PHash算法运算操作具体为:
[0055]将所有照片都缩放到8*8像素的尺寸,这样就可以摒弃不同尺寸、比例带来的照片差异;
[0056]将8*8的照片转换成灰度图像,这样可以摒弃了色彩带来的差异;
[0057]将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
[0058]计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为I,小于平均值的像素标志为O;
[0059]将比较结果逐一组合一起,就构成了一个64位的01整数串,这就是该照片的“指纹”。
[0060]重复判断模块,用于将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,这样可以更精准地帅选出可能重复的照片,若是,则判断为重复的照片,若否,则判断为不重复的照片。
[0061]—种识别重复照片的方法,所述方法包括以下步骤:
[0062]S301:将移动终端中相机保存路径下所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设的5min范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;这样将所有照片比较过后,即可排除一部分在时间上孤立的照片,此类照片间不太可能存在重复照片;
[0063]S302:将步骤S301中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
[0064]所述步骤S302的PHash算法运算操作具体为:
[0065]S401:将所有照片都缩放到8*8像素的尺寸,这样就可以摒弃不同尺寸、比例带来的照片差异;
[0066]S402:将8*8的照片转换成灰度图像,这样可以摒弃了色彩带来的差异;
[0067]S403:将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
[0068]S404:计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为I,小于平均值的像素标志为O;
[0069]S405:将比较结果逐一组合一起,就构成了一个64位的01整数串,这就是该照片的“指纹”。
[0070]S303:将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,这样可以更精准地帅选出可能重复的照片,若是,则判断为重复的照片,若否,则判断为不重复的照片。
[0071]本实施例所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
[0072]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1.一种识别重复照片的方法,其特征在于,所述方法包括以下步骤: 51、将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别; 52、将步骤SI中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹; 53、将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。2.根据权利要求1所述的识别重复照片的方法,其特征在于,所述步骤S2的PHash算法运算操作具体为: 将所有照片都缩放到预设像素大小的尺寸; 将缩放后的照片转换成灰度图像; 将灰度图像进行离散余弦变换降低频率,得出结果矩阵; 计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为I,小于平均值的像素标志为O; 将比较结果逐一组合一起,就构成了一串数字。3.一种实现识别重复照片的系统,其特征在于,所述系统包括: 相似判断模块,用于将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别; 识别指纹模块,用于将相似判断模块中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹; 重复判断模块,用于将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。4.根据权利要求3所述的实现识别重复照片的系统,其特征在于,所述PHash算法运算操作具体为: 将所有照片都缩放到预设像素大小的尺寸; 将缩放后的照片转换成灰度图像; 将灰度图像进行离散余弦变换降低频率,得出结果矩阵; 计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为I,小于平均值的像素标志为O; 将比较结果逐一组合一起,就构成了一串数字。
【专利摘要】本发明公开一种识别重复照片的方法,包括:将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;将判断为时间相似的照片进行PHash算法运算,每个照片拥有自己独有的一串数字,作为照片的识别指纹;将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。本发明还公开了一种实现识别重复照片的系统。
【IPC分类】G06K9/62
【公开号】CN105678334
【申请号】CN201610010333
【发明人】邓裕强, 张惠钧, 磨剑波
【申请人】广州市久邦数码科技有限公司, 久邦计算机技术(广州)有限公司
【公开日】2016年6月15日
【申请日】2016年1月5日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1