图片审核过滤系统及方法

文档序号:6482993阅读:247来源:国知局
专利名称:图片审核过滤系统及方法
技术领域
本发明涉及图片检测领域,特别是涉及一种图片审核过滤系统及方法。
背景技术
互联网极大地融合了全球信息,丰富了人们获取信息的途径,扩展了人们搜索信 息的范围,然而其承载的信息中不良信息量也急剧增加,鉴于该类信息包含的内容可能涉 及国家安全、社会风气以及影响青少年的身心健康,有必要对此类信息予以审查,目前普遍的做法有采用人工审核,但是人工审核会导致同样的图片会进行反复审 核,工作量大、效率低、成本高。另外现有技术中,有专门的软件来对一些敏感图片进行处理,如根据皮肤颜色和 姿态来检测色情图片,然而,由于人体肤色和姿态存在差异,从而影响其检测的结果。还有一种现有技术中的图片检测系统及方法将图片的特征码和黑名单中的敏感 图片的特征码进行比较从而检测敏感图片,然后这种检测技术仅仅对图像的特征码进行比 较,范围局限,会造成部分敏感图片遗漏。

发明内容
本发明的目的是提供一种图片审核过滤系统及方法,从文字和图像上能有效的对 敏感图片进行检测,并且能通过人工动态的更新敏感库以应对新的敏感图片,防止了重复 劳动,提高的敏感图片审核过滤的效率。为了达到上述目的,本发明的技术方案是一种图片审核过滤系统,包括敏感库、 图片匹配模块、图片审核模块、过滤模块;所述的图片匹配模块与外部的原始图片和敏感库 连接,接收原始图片,并将原始图片的信息与敏感库中的信息相匹配;所述的图片审核模块 分别与图片匹配模块以及过滤模块连接,接收图片匹配模块的图片的信息,并将通过审核 的图片发送至过滤模块,其中,所述的敏感库还包括图片特征码库和文件特征码库,图片特 征码库和文件特征码库分别与图片匹配模块连接,分别用于图片特征码和文件特征码的匹 配。上述的图片审核过滤系统,其中,所述的图片匹配模块还包括文件特征码提取组 件、图片特征码提取组件、文件特征码查询组件以及图片特征码查询组件;所述的文件特征码提取组件与原始图片连接,接收原始图片中的文件特征码;所述的图片特征码提取组件与文件特征码查询组件连接,接收未通过文件特征码 查询组件匹配的图片;所述的文件特征码查询组件分别与文件特征码提取组件和文件特征码库连接,接 收来自文件特征码提取组件的文件特征码,并将该文件特征码与文件特征码库中的文件特 征码匹配;所述的图片特征码查询组件分别与图片特征码提取组件以及图片特征码库连接, 接收来自图片特征码提取组件的图片特征码,并将该图片特征码与图片特征码库中的图片特征码进行匹配。上述的图片审核过滤系统,其中,图片审核模块还包括文件特征码审核模块和图 片特征码审核模块;所述的文件特征码审核模块分别与文件特征码查询组件和过滤模块连接,接收文 件特征码查询组件传送的文件特征码,并将通过审核的图片传送至过滤模块;所述的图片特征码审核分别与图片特征码查询组件和过滤模块连接,接收图片特 征码查询组件传送的图片特征码,并将通过审核的图片传送至过滤模块。上述的图片审核过滤系统,其中,所述的图片特征码库和文件特征码库分别按不 同类别分类。一种图片审核过滤的方法,其中,包括如下步骤步骤1.生成敏感库1;步骤2.文件特征码提取组件21提取原始图片的文件特征码;步骤3.文件特征码查询组件22在文件特征码库12中查询是否存在与原始图片 匹配的文件特征码;步骤4.文件特征码库12中存在与原始图片匹配的文件特征码,文件特征码审核 模块31对原始图片的文件特征码进行审核;步骤5.通过审核的图片为敏感图片,由过滤模块4过滤;步骤6.文件特征码库12中不存在与原始图片匹配的文件特征码,图片特征码提 取组件32对该原始图片进行图片特征码提取;步骤7.图片特征码查询组件24在图片特征码库11中查询是否存在与原始图片 匹配的图片特征码;步骤8.图片特征码库11中存在与原始图片匹配的图片特征码,图片特征码审核 模块32对原始图片的图片特征码进行审核;步骤9.通过审核的图片为敏感图片,由过滤模块4过滤。上述的一种图片审核过滤方法,其中,所述的步骤1还包括以下步骤步骤1. 1.从删除标记的图片库中得到一张图片地址;步骤1. 2.判断图片文件是否存在且正常,图片文件存在且正常,提取图片的文件 特征码,图片文件不存在或者不正常,重新开始;步骤1. 3.提取文件特征码;步骤1. 4.建立文件特征码库;步骤1. 5将提取的文件特征码纳入文件特征码库并判断文件特征码库内是否已 经存在与提取的文件特征码相同的文件特征码,存在相同的文件特征码,文件特征码库值 计数加1,并回到步骤1.1重新开始,不存在相同的文件特征码,更新文件特征码库,并执行 下一步;步骤1. 6.提取图片特征码;步骤1. 7.建立图片特征码库;步骤1. 8.将提取的图片特征码纳入图片特征码库并判断图片特征码库内是否存 在提取的图片特征码,不存在,更新当前图片特征码库;存在,图片特征码库的计数值加1, 操作之后回到开始处重新开始,以完成对所有图片特征码的提取。
上述的一种图片审核过滤方法,其中,所述的步骤6图片特征码的提取还包括以 下步骤步骤6. 1.将图片等分成N*N块;步骤6. 2.除去图片周边块;步骤6. 3.按从左到右,从上到下遍历取每个块中间一点的颜色值;步骤6. 4.颜色值的前两位除以10,小数部分四舍五入后,取其整数;步骤6. 5.将得到的整数值按顺序拼接成一个长度为N*N的字符串;步骤6. 6.所有块都处理完之后,对字符串进行MD5,得到的值即为图片特征码。本发明由于采用上述技术方案,使之与现有技术相比,具有以下优点和积极效 果1、本发明图片审核过滤系统及方法由于从文字信息和图片颜色信息两个方面审 核及删除敏感图片,扩大了敏感图片的审核及删除范围,提高了敏感图片审核及删除的准 确率,同时由于从两方面检测,一方面通过审核即可判定为敏感图片,节约了审核时间,提 高了审核的效率。2、本发明图片审核过滤系统及方法所依据的敏感库可人工动态的更新,使图片审 核过滤系统与时俱进,科学得当。


图1是本发明图片审核过滤系统整体结构示意图。图2是本发明图片审核过滤系统内部结构示意图。图3是本发明图片审核过滤方法的流程图。图4是本发明图片审核过滤系统中的敏感库建立的流程图。图5是本发明图片审核过滤方法中图片特征码提取的流程图。图6是本发明图片审核过滤方法的实施例图。
具体实施例方式请参见附图1,为本发明的图片审核过滤系统整体结构示意图,包括敏感库1、图 片匹配模块2、图片审核模块3、过滤模块4,图片特征码库11以及文件特征码库12。其中,敏感库1内设有图片特征码库11和文件特征码库12,图片特征码库11和 文件特征码库12分别按不同类别分类。如政治类敏感图片、暴力色情类敏感图片等,对库 做上述类别记号,以实现针对不同的需求检测出不同类别的敏感图片。图片匹配模块2分 别与外部的原始图片以及敏感库1内的图片特征码库11和文件特征码库12连接,接收原 始图片,并将原始图片的特征码分别与图片特征码库11以及文件特征码库12中的特征码 相匹配;图片审核模块3分别与图片匹配模块2以及过滤模块4连接,接收图片匹配模块2 的图片的信息,并将通过审核的图片发送至过滤模块4。请参见附图2,为图片审核过滤系统内部结构示意图,图片匹配模块2包括文件特 征码提取组件21、图片特征码提取组件23、文件特征码查询组件22以及图片特征码查询组 件24,图片审核模块3包括文件特征码审核模块31和图片特征码审核模块32。其中,文件特征码提取组件21与原始图片连接,接收原始图片中的文件特征码。
6图片特征码提取组件23与文件特征码查询组件22连接,接收未通过文件特征码查询组件 22匹配的图片。文件特征码查询组件22分别与文件特征码提取组件21和文件特征码库 12连接,接收来自文件特征码提取组件21的文件特征码,并将该文件特征码与文件特征码 库12中的文件特征码匹配。图片特征码查询组件24分别与图片特征码提取组件23以及 图片特征码库11连接,接收来自图片特征码提取组件23的图片特征码,并将该图片特征码 与图片特征码库11中的图片特征码进行匹配。文件特征码审核模块31分别与文件特征码 查询组件22和过滤模块4连接,接收文件特征码查询组件22传送的文件特征码,并将通过 审核的图片传送至过滤模块4 ;图片特征码审核32分别与图片特征码查询组件24和过滤 模块4连接,接收图片特征码查询组件24传送的图片特征码,并将通过审核的图片传送至 过滤模块4。请参见附图3,为图片审核过滤方法的流程图,包括如下步骤生成敏感库1 ;文件特征码提取组件21提取原始图片的文件特征码,该文件特征 码为根据文件内容得到的md5值,md5值相同表示文件也相同;文件特征码查询组件22在 文件特征码库12中查询是否存在与原始图片匹配的文件特征码;如果文件特征码库12中 存在与原始图片匹配的文件特征码,文件特征码审核模块31对原始图片的文件特征码进 行审核,审核文件特征码计数是否大于设定值,大于设定值即为审核通过;通过审核的图片 为敏感图片,由过滤模块4过滤;如果文件特征码库12中不存在与原始图片匹配的文件特 征码,图片特征码提取组件32对该原始图片进行图片特征码提取,图片特征码的提取是根 据像素颜色、位置信息抽象出来的数值,该数值可用来对应唯一的一张图片;图片特征码查 询组件24在图片特征码库11中查询是否存在与原始图片匹配的图片特征码;如果图片特 征码库11中存在与原始图片匹配的图片特征码,图片特征码审核模块32对原始图片的图 片特征码进行审核,审核图片特征码计数是否大于设定值;通过审核的图片为敏感图片,由 过滤模块4过滤。请配合参见图4,生成敏感库1包括以下步骤从删除标记的图片库中得到一张图片地址;判断图片文件是否存在且正常,如果 图片文件存在且正常,提取图片的文件特征码,如果图片文件不存在或者不正常,重新开 始;当图片文件存在且正常,提取文件特征码;建立文件特征码库;将提取的文件特征码纳 入文件特征码库并判断文件特征码库内是否已经存在与提取的文件特征码相同的文件特 征码,如果存在相同的文件特征码,文件特征码库值计数加1,并回到步骤1.1重新开始,不 存在相同的文件特征码,更新文件特征码库,并执行下一步;提取图片特征码;建立图片特 征码库;将提取的图片特征码纳入图片特征码库并判断图片特征码库内是否存在提取的图 片特征码,如果不存在,更新当前图片特征码库;如果存在,图片特征码库的计数值加1,操 作之后回到开始处重新开始,以完成对所有图片特征码的提取。本发明以人工加程序的审 核方式建立敏感库,动态的更新敏感库,不断完善敏感库中的信息,确保审核及删除敏感信 息的全面。请配合参见图5,图片特征码的提取还包括以下步骤将图片等分成N*N块;除去图片周边块;按从左到右,从上到下遍历取每个块中间 一点的颜色值,该颜色值指图像上某点的颜色索引值,代表当前的颜色信息,是以整数返回 该点的RGB值;颜色值的前两位除以10,小数部分四舍五入后,取其整数;将得到的整数值按顺序拼接成一个长度为N*N的字符串;所有块都处理完之后,对字符串进行MD5,得到的 值即为图片特征码。通过图片上颜色信息的分布可以判定两张图片是否类似,因此图片特 征码可以有效的用来进行图片的审核。 如图6所示,为本发明的一个具体应用的实例,图片匹配模块2提取该图的文件特 征码,将该文件特征码与已生成的敏感库1中的文件特征码匹配,匹配成功,文件特征码审 核模块31对该文件特征码进行审核,如果文件特征码计数大于设定值,说明敏感库1中有 与该图相同的文件特征码存在,即该图为敏感图片,因而送至过滤模块4过滤;如果文件特 征码匹配不成功,图片匹配模块2提取该图的图片特征码,将图片等分成N*N块,除去图片 周边块,按从左到右,从上到下遍历取每个块中间一点的颜色值,该颜色值指图像上某点的 颜色索引值,代表当前的颜色信息,是以整数返回该点的RGB值,通过图片上颜色信息的分 布可判定图片是否类似,因此图片匹配模块2将该图的图片特征码与敏感库1中图片特征 码匹配,如果匹配成功,经图片特征码审核模块32进行审核,如图片特征码计数大于设定 值,说明敏感库中存在与该图相同的图片特征码,也即该图为敏感图片,送至过滤模块4过 滤,本发明图片审核过滤系统及方法的敏感库可以通过人工加程序的方式随时更新,确保 了图片审核的科学性,另外本发明从文件特征码审核和图片特征码审核两方面双保险的方 式进行审核,确保了图片审核的准确性。
权利要求
一种图片审核过滤系统,包括敏感库(1)、图片匹配模块(2)、图片审核模块(3)、过滤模块(4);所述的图片匹配模块(2)与外部的原始图片和敏感库(1)连接,接收原始图片,并将原始图片的信息与敏感库(1)中的信息相匹配;所述的图片审核模块(3)分别与图片匹配模块(2)以及过滤模块(4)连接,接收图片匹配模块(2)的图片的信息,并将通过审核的图片发送至过滤模块(4),其特征在于所述的敏感库(1)还包括图片特征码库(11)和文件特征码库(12),图片特征码库(11)和文件特征码库(12)分别与图片匹配模块(2)连接,分别用于图片特征码和文件特征码的匹配。
2.如权利要求1所述的图片审核过滤系统,其特征在于,所述的图片匹配模块(2)还包 括文件特征码提取组件(21)、图片特征码提取组件(23)、文件特征码查询组件(22)以及图 片特征码查询组件(24);所述的文件特征码提取组件(21)与原始图片连接,接收原始图片中的文件特征码;所述的图片特征码提取组件(23)与文件特征码查询组件(22)连接,接收未通过文件 特征码查询组件(22)匹配的图片;所述的文件特征码查询组件(22)分别与文件特征码提取组件(21)和文件特征码库 (12)连接,接收来自文件特征码提取组件(21)的文件特征码,并将该文件特征码与文件特 征码库(12)中的文件特征码匹配;所述的图片特征码查询组件(24)分别与图片特征码提取组件(23)以及图片特征码库 (11)连接,接收来自图片特征码提取组件(23)的图片特征码,并将该图片特征码与图片特 征码库(11)中的图片特征码进行匹配。
3.如权利要求1所述的图片审核过滤系统,其特征在于,图片审核模块(3)还包括文件 特征码审核模块(31)和图片特征码审核模块(32);所述的文件特征码审核模块(31)分别与文件特征码查询组件(22)和过滤模块(4)连 接,接收文件特征码查询组件(22)传送的文件特征码,并将通过审核的图片传送至过滤模 块⑷;所述的图片特征码审核(32)分别与图片特征码查询组件(24)和过滤模块(4)连接,接收图片特征码查询组件(24)传送的图片特征码,并将通过审核的图片传送至过滤模块 ⑷。
4.如权利要求1所述的图片审核过滤系统,其特征在于,所述的图片特征码库(11)和 文件特征码库(12)分别按不同类别分类,该分类包括政治类敏感图片、暴力色情类敏感图 片,对库做上述类别记号。
5.一种用于图片审核过滤系统的图片审核过滤的方法,其特征在于,包括如下步骤步骤1.生成敏感库⑴;步骤2.文件特征码提取组件(21)提取原始图片的文件特征码;步骤3.文件特征码查询组件(22)在文件特征码库(12)中查询是否存在与原始图片 匹配的文件特征码;步骤4.如果文件特征码库(12)中存在与原始图片匹配的文件特征码,文件特征码审 核模块(31)对原始图片的文件特征码进行审核;步骤5.通过审核的图片为敏感图片,由过滤模块(4)过滤;步骤6.如果文件特征码库(12)中不存在与原始图片匹配的文件特征码,图片特征码提取组件(32)对该原始图片进行图片特征码提取;步骤7.图片特征码查询组件(24)在图片特征码库(11)中查询是否存在与原始图片 匹配的图片特征码;步骤8.如果图片特征码库(11)中存在与原始图片匹配的图片特征码,图片特征码审 核模块(32)对原始图片的图片特征码进行审核;步骤9.通过审核的图片为敏感图片,由过滤模块(4)过滤。
6.如权利要求5所述的一种图片审核过滤方法,其特征在于,所述的步骤1还包括以下 步骤步骤1. 1.从删除标记的图片库中得到一张图片地址;步骤1. 2.判断图片文件是否存在且正常,图片文件存在且正常,提取图片的文件特征 码,图片文件不存在或者不正常,重新开始; 步骤1. 3.提取文件特征码; 步骤1. 4.建立文件特征码库;步骤1. 5将提取的文件特征码纳入文件特征码库,并判断文件特征码库内是否已经存 在与提取的文件特征码相同的文件特征码,如果存在相同的文件特征码,文件特征码库值 计数加1,并回到步骤1. 1重新开始,如果不存在相同的文件特征码,更新文件特征码库,并 执行下一步;步骤1.6.提取图片特征码; 步骤1. 7.建立图片特征码库;步骤1. 8.将提取的图片特征码纳入图片特征码库并判断图片特征码库内是否存在提 取的图片特征码,不存在,更新当前图片特征码库;存在,图片特征码库的计数值加1,操作 之后回到开始处重新开始,以完成对所有图片特征码的提取。
7.如权利要求5所述的一种图片审核过滤方法,其特征在于,所述的步骤6图片特征码 的提取还包括以下步骤步骤6.1.将图片等分成N*N块; 步骤6. 2.除去图片周边块;步骤6. 3.按从左到右,从上到下遍历取每个块中间一点的颜色值; 步骤6. 4.颜色值的前两位除以10,小数部分四舍五入后,取其整数; 步骤6. 5.将得到的整数值按顺序拼接成一个长度为N*N的字符串; 步骤6. 6.所有块都处理完之后,对字符串进行MD5,得到的值即为图片特征码。
全文摘要
本发明涉及一种图片审核过滤系统及方法,图片审核过滤系统包括敏感库、图片匹配模块、图片审核模块、过滤模块;图片匹配模块与外部的原始图片以及敏感库相连接,图片审核模块与图片匹配模块以及过滤模块连接,其中,敏感库还包括图片特征码库和文件特征码库,图片特征码库和文件特征码库分别与图片匹配模块相连接。该图片审核过滤系统的审核过滤方法包括,生成敏感库,提取原始图片信息与敏感库中的图片信息匹配、审核,过滤图片。本发明从文字和图像上有效的对敏感图片进行检测,能动态的更新敏感库,防止了重复劳动,提高的敏感图片审核过滤的效率。
文档编号G06F17/30GK101996180SQ20091005629
公开日2011年3月30日 申请日期2009年8月12日 优先权日2009年8月12日
发明者王卫军 申请人:升东网络科技发展(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1