图片识别方法和装置的制造方法_3

文档序号:9646564阅读:来源:国知局
种子图片进行比较;
[0072]丢弃单元70用于在所述图片库中存在与所述待识别图片相同的所述种子图片时,丢弃所述待识别图片;
[0073]第一存储单元90用于在所述图片库中不存在与所述待识别图片相同的所述种子图片、但存在与所述待识别图片的相似度大于第一预定阈值的所述种子图片时,将所述待识别图片作为需要删除的图片的种子图片存储在所述图片库中。
[0074]在本实施例中,通过接收客户端指示的待识别图片,并根据待识别图片与图片库中存储的种子图片进行比较,当待识别图片与种子图片的相似度大于第一预定阈值时,将待识别图片存储在图片库中。由于待识别图片由客户端发送,客户端又分布在互联网的各个地方,因此通过接收客户端的待识别图片来收集种子图片的速度远远大于人工巡检发现种子图片的速度,提高了收集种子图片的效率。另外,在将待识别图片存储在图片库中之前先进行去重处理,也就是先判断图片库中是否已经存储由该待识别图片,如果图片库中已经存在与该待识别图片相同的种子图片,则不再将该待识别图片存储在图片库中,如果图片库中没有,并且该待识别图片与图片库中的种子图片的相似度大于第一预定阈值,则将该待识别图片存储在图片库中。
[0075]具体地,接收单元10包括:接收子单元,用于接收来自电脑网页、移动终端网页、电脑上的应用程序和移动终端上的应用程序中的任意一个或者多个客户端的待识别图片的网址;查找子单元,用于按照网址从服务器中查找待识别图片。通过网络在客户端中传播的图片都会具有一个对应到服务器的网址,将该网址发送给服务器后,服务器会根据网址查找待识别图片,客户端向服务器传输网址而不是图片本身能够节省网络资源,另外,由于待识别图片就存储在服务器中,服务器按照网址查找即可,避免接收客户端发送的图片再存储在服务器中,造成同一图片的重复存储,从而避免服务器的缓存空间被过多占用。
[0076]具体地,图片库可以存储在服务器102中,客户端可以提供发送待识别图片的入口,通过该入口客户端将待识别图片发送给服务器102,以便于服务器判断是否将该待识别图片存储在图片库中。该入口可以发送多种图片,并不是所有的图片都需要存储在图片库中,通过标识可以判断是否需要对该待识别图片进行识别,并进一步判断是否将该待识别图片存储在图片库中。如果图片库中不存在于该待识别图片相同的种子图片,但是存在与该待识别图片的相似度大于第一预定阈值的种子图片,说明该待识别图片为可以存储在图片库中的图片,则将该待识别图片存储在图片库中。在计算待识别图片与种子图片的相似度时,可以通过对比两张图片的像素来进行相似度的判断,当然,本实施例还可以采用其他方式进行相似度的判断,本实施例并不限于上述相似度判断的方式。
[0077]客户端在展示图片时,通常具有举报、点赞、评论等功能作为发送图片的入口,客户端可以将举报、点赞、评论等信息都发送给服务器,为了使得服务器从这些信息中区分哪些是可以被识别并存储在图片库中的图片。对客户端发送给服务器的信息设置标识,如被举报的信息的标识为R,被评论的信息的标识为C,被点赞的信息的标识为P。当服务器102接收到图片和标识“R”之后,即确定该接收到的图片为被举报的图片,也即接收到了对接收到的图片进行识别的指示。
[0078]例如,图片库中存储了色情暴力图片的种子图片,客户端展示的图片为图片a,该图片a被客户端举报给服务器102,服务器102从接收到的信息中接收到图片a和标识“R”,服务器102将图片a与图片库中的种子图片进行比较。如果图片库中有一张图片与图片a相同,为了不重复存储相同的图片,将图片a丢弃;如果图片库中没有与图片a相同的图片,但是图片a与图片库中的一张种子图片的相似度大于90%,则确定该图片a为色情暴力图片,并将图片a存储在图片库中作为色情暴力图片的种子图片。需要说明的是,如果服务器具有删除图片a的权限,当确定图片a与图片库中的一张图片相同时,可以将图片a删除,使图片a不再通过网络传播。
[0079]具体地,客户端向服务器举报图片a时可以显示如图3所示的界面,在该界面上展示有被举报的图片a的图片类型,如色情暴力、骚扰谩骂、广告欺诈、病毒木马、反动政治和其他。在服务器中可以有一个图片库存储有多种不同类型的图片,也可以将不同类型的图片分别存储在不同的图片库中。客户端向服务器举报图片a时,可以选择不同的图片类型,便于服务器在图片库中查找相应的种子图片,提高查找并对比种子图片与待识别图片的相似度的效率。
[0080]可选地,将接收到的待识别图片与图片库中的种子图片比较后,如果图片库中没有与待识别图片相同的种子图片,也不存在与待识别的图片的相似度大于第一预定阈值的种子图片,则第二判断单元判断接收到的存储指令是否指示将待识别图片作为需要删除的图片的种子图片存储在图片库中;第二存储单元,用于在判断出存储指令指示将待识别图片作为需要删除的图片的种子图片存储在图片库时,将待识别图片作为需要删除的种子图片存储在图片库。
[0081]图片库中没有与待识别图片相同的种子图片,也不存在与待识别的图片的相似度大于第一预定阈值的种子图片,并不能确定该待识别图片不能作为种子图片,为了保证不遗漏图片,在初步判断出图片库中没有与待识别图片的相似度大于第一预定阈值的种子图片后,判断接收到的存储指令是否指示存储该待识别图片。在存储指令指示存储该待识别图片后,将该待识别图片存储在图片库中。
[0082]例如,在图片库中没有与图片a的相似度大于第一预定阈值的种子图片,不能直接确定图片a不是色情暴力等非法图片。接收到的存储指令可以是通过人工判断得到的指令,在服务器没有将图片a判断为非法图片时,如果人工判断图片a为非法图片,服务器102接收到的存储指令指示将图片a存储在图片库,则服务器102将图片a存储在图片库中。
[0083]通过对存储指令的判断实现了对待识别图片的二次判断,第一次判断为将待识别图片与图片库中的种子图片的相似度的判断,第二次判断为对存储指令的判断,在第一次判断没有把待识别图片存储在图片库中作为种子图片后,增加了第二次判断来确定是否将待识别图片存储在图片库中,以避免待识别图片可以作为种子图片存储时却无法存储在图片库中,提高了将待识别图片作为种子图片的准确性。
[0084]如图7所示,比较单元50包括:执行子单元,用于执行以下步骤直至判断出图片库中存在与待识别图片相同的种子图片,或者,判断出存在与待识别图片的相似度大于第一预定阈值的种子图片,或者,遍历完图片库中的每个种子图片,包括:
[0085]选择模块5021用于从图片库中选择一个尚未与待识别图片执行比较操作的种子图片作为当前种子图片;
[0086]第一判断模块5022用于判断待识别图片是否与当前种子图片相同;
[0087]第一确定模块5023用于在待识别图片与当前种子图片相同时,判断出图片库中存在与待识别图片相同的种子图片;
[0088]第二判断模块5024用于在待识别图片与当前种子图片不同时,判断待识别图片与当前种子图片的相似度是否大于第一预定阈值;
[0089]第二确定模块5025用于在判断待识别图片与当前种子图片的相似度大于第一预定阈值时,判断出存在与待识别图片的相似度大于第一预定阈值的种子图片;
[0090]标记模块5026用于在判断待识别图片与当前种子图片的相似度小于等于第一预定阈值时,将当前种子图片标记为已与待识别图片执行比较操作的种子图片。
[0091]在将待识别图片与图片库中记录的需要删除图片的种子图片进行比较的过程中,将待识别图片依次与图片库中记录的种子图片进行比较,直到遍历图片库中的所有种子图片,或者判断出图片库中存在与待识别图片相同的种子图片,或者判断出存在与待识别图片的相似度大于第一预定阈值的种子图片。如果判断出图片库中存在与待识别图片相同的种子图片,为了避免重复存储,丢弃该待识别图片,或者将该待识别图片删除,比较结束;如果判断出存在与待识别图片的相似度大于第一预定阈值的种子图片,则将该待识别图片存储在图片库中作为种子图片,则比较结束;如果既没有找到与待识别图片相同的种子图片,也没有与该待识别图片的相似度大于第一预定阈值的种子图片,并且已经遍历完图片库中的所有种子图片,则比较结束。
[0092]可选地,第二判断模块5024包括:接收子模块,用于接收表征待识别图片与当前种子图片的相似度的多个维度值;计算子模块,用于依次计算每个维度和与维度对应的比重的乘积,得到多个维度的乘积;确定子模块,用于将多个维度的乘积之和作为待识别图片与当前种子图片的相似度。
[0093]表征待识别图片与当前图片的相似度的多个维度值,多个维度值所对应的比重之和为1,也就是通过占有不同比重的多个维度来计算待识别图片与当前种子图片的相似度。例如,多个维度包括图片a被举报的次数、接收到的图片a的非法值、服务器初步识别出的图片a与种子图片的相似度等,上述几个维度所对应的维度值分别为diml、dim2、dim3,每个维度对应的比重为pl、p2、p3,其中,pl、p2和p3之和为1,则待识别图片与当前种子图片的相似度为diml*pl+dim2*p2+dim3*p3。需要说明的是,在本实施例中仅以三个维度为例进行说明,应该理解的是,本实施例还可以采用多个维度计算待识别图片与当前种子图片的相似度,并且每个维度所占的比重可以根据不同类型的图片进行适应性的调整。通过多个维度来衡量待识别图片与当前种子图片的相似度,在判断待识别图片是否能够被存储在图片库中时更加准确。
[0094]可选地,在通过上述实施例得到图片库之后,可以利用该图片库对互联网中传播的图片进行处理,例如删除和标记。下面以删除为例对本实施例进行说明,本实施例中所提供的装置还包括:执行单元,用于在将待识别图片作为需要删除的图片的种子图片存储在图片库中之后,执行以下步骤直至遍历完服务器上的所有图片:从服务器中选择一张没有与待识别图片进行比较的图片作为当前待删除图片;判断待识别图片与当前待删除图片的相似度是否大于第二预定阈值;如果待识别图片与当前待删除图片的相似度大于第二预定阈值,则删除当前待删除图片;如果待识别图片与当前待删除图片的相似度小于等于第二预定阈值,则将当前待删除图片标记为已经与待识别图片进行比较的图片。
[0095]在得到上述图片库之后,可以用图片库中的种子图片与在互联网上传播的图片进行比较,以判断出哪些是与这些种子图片相似的图片,并将这些与种子图片相似的图片从服务器中删除,以遏制这些图片的传播。具体地,将服务器中的待删除图片与待识别图片进行对比,判断待删除图片与待识别图片的相似度是否大于第二预定阈值,如果待删除图片与待识别图片的相似度大于第二预定阈值,则确定当前待删除图片为非法图片,将该当前待删除图片从服务器中删除;如果待删除图片与待识别图片的相似度小于等于第二预定阈值,则将待删除图片标记为已经与待识别图片进行比较的图片。
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1