一种网页中不良图片信息的处理方法和装置的制作方法

文档序号:6372632阅读:226来源:国知局
专利名称:一种网页中不良图片信息的处理方法和装置的制作方法
技术领域
本发明涉及浏览器技术领域,特别是涉及一种网页中不良图片信息的处理方法和
>J-U装直。
背景技术
随着互联网的普及,互联网提供给人们越来 越多的便捷,也为人们提供各种各样的信息,用户可以通过浏览器浏览网络中各种各样的信息,也可通过网络与其他用户进行信息交互,比如微博。随着网络信息的爆炸式发展,不止是成年人从网络上获取信息,青少年也可从网络中获取信息,但网络中充斥了大量不良的信息,比如色情信息,非常影响青少年的身心健康。现有技术中,对于色情信息的处理其一为由对色情网站的网址建立黑名单机制,将其进行在网络层进行屏蔽;其二为由服务器对网站自身的色情信息进行处理,比如将遍历服务器的图片库中的图片,将色情图片进行屏蔽。但是现有技术中,对于网址建立黑名单的机制,只是对于非法网站有效,无法屏蔽正常网站,然而正常网站中可能存在类色情信息,即打色情擦边球的信息,比如依着暴露的图片等等,这对于成年人来说可能属于正常范围,但是对于青少年来说依然属于色情信息,而存在这种类色情信息的正常网站(比如,腾讯网站)则无法屏蔽。另外,对于服务器对网站自身色情信息进行处理的机制,该种处理方式是针对所有用户端的,基于实际原因,而网站方一般也不会将上述类色情信息进行处理。因此,上述两种情况均无法针对青少年将网页内容中的不良图片信息进行针对性处理后再针对青少年投放,即现有技术则无法有效处理上述的不良图片信息,避免网络中的不良图片信息对青少年的误导。

发明内容
本发明所要解决的技术问题是提供一种网页中不良图片信息的处理方法和装置,以解决现有技术中无法针对青少年将网页内容中的不良图片信息进行针对性处理后再针对青少年投放,无法有效处理不良图片信息的问题。为了解决上述问题,本发明公开了一种网页中不良图片信息的处理方法,包括发送网页请求至服务器,并从所述服务器获取网页信息;解析所述网页信息对应的文档对象模型树;查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;依据所述位置信息将所述不良图片信息进行替换或者覆盖处理;将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。优选的,依据所述位置信息将所述不良图片信息进行覆盖处理包括依据所述位置信息生成块级元素覆盖所述不良图片信息;
则进一步所述将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示包括对所述生成的块级元素和所述文档对象模型树进行渲染和显示。优选的,依据所述位置信息将所述不良图片信息进行替换处理包括依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容。优选的,所述不良图片信息包括色情图片、暴力图片中的至少一种。优选的,所述查找所述文档对象模型树中各节点的不良图片信息的步骤包括
从文档对象模型的根节点开始,遍历文档对象模型的各节点;获取各节点中图片信息,分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。优选的,所述确定所述不良图片信息在文档对象模型树中的位置信息的步骤包括依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID ;依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。优选的,所述依据所述位置信息生成块级元素覆盖所述不良图片信息的步骤包括生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素;该块级元素覆盖所述不良图片信息内容中连续指定像素的区域。优选的,所述生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,该块级元素覆盖所述不良图片信息内容中连续指定像素的区域的步骤包括获取所述不良图片信息的像素尺寸;获取所述不良图片信息中至少一连续指定像素区域的尺寸;根据指定像素区域的尺寸和不良图片信息的像素尺寸确定所述指定像素区域的相对于不良图片信息的相对位置信息;依据所述相对位置信息,生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,其高、宽参数为所述连续指定像素区域对应的高、宽参数。优选的,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括判断所述图片信息的内容中连续指定像素的分布比例是否大于阈值;如果大于,则判断所述图片信息为不良图片信息。优选的,所述指定像素为肉色类、血色类像素中的至少一种;或所述指定像素为用户配置的。优选的,所述阈值为用户配置的。优选的,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括获取当前图片信息的特征值;将所述特征值发送至云端服务器,并与云端服务器存储的不良图片信息的特征值进行匹配比较;当匹配上时,则判断当前图片信息为不良图片信息。优选的,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括根据所述图片信息的内容,获取该图片信息的特征值;将所述特征值与浏览器侧储的不良图片信息的特征值进行匹配比较;当匹配上时,则判断当前图片信息为不良图片信息。相应的,本发明还公开了一种网页中不良图片信息的处理装置,包括网页信息获取模块,适于发送网页请求至服务器,并从所述服务器获取网页信 息;解析模块,适于解析所述网页信息对应的文档对象模型树;不良图片信息分析模块,适于查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;不良图片信息处理模块,适于依据所述位置信息将所述不良图片信息进行替换或者覆盖处理;渲染模块,适于将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。优选的,所述不良图片信息处理模块包括块级元素生成模块,适于依据所述位置信息生成块级元素覆盖所述不良图片信息;则进一步所述渲染模块包括第一渲染模块,适于对所述生成的块级元素和所述文档对象模型树进行渲染和显
/Jn o优选的,所述不良图片信息处理模块包括替换模块,适于依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容。优选的,所述不良图片信息包括色情图片、暴力图片中的至少一种。优选的,所述不良图片信息分析模块包括遍历模块,适于从文档对象模型的根节点开始,遍历文档对象模型的各节点;获取分析模块,适于获取各节点中图片信息,分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。优选的,所述不良图片信息分析模块包括ID确定模块,适于依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID ;节点确定模块,适于依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。优选的,所述块级元素生成模块包括第一块级元素生成模块,适于生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素;
该块级元素覆盖所述不良图片信息内容中连续指定像素的区域。优选的,所述第一块级元素生成模块包括第一尺寸获取模块,适于获取所述不良图片信息的像素尺寸;第二尺寸获取模块,适于获取所述不良图片信息中至少一连续指定像素区域的尺寸;相对位置信息确定模块,适于根据指定像素区域的尺寸和不良图片信息的像素尺寸确定所述指定像素区域的相对于不良图片信息的相对位置信息;第三块级元素生成模块,适于依据所述相对位置信息,生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,其高、宽参数为所述连续指定像素区域对应的高、宽参数。 优选的,所述不良图片信息分析模块包括第一判断模块,适于判断所述图片信息的内容中连续指定像素的分布比例是否大于阈值;如果大于,则判断所述图片信息为不良图片信息。优选的,所述指定像素为肉色类、血色类像素中的至少一种;或
所述指定像素为用户配置的。优选的,所述阈值为用户配置的。优选的,所述不良图片信息分析模块包括第一特征值获取模块,适于获取当前图片信息的特征值;特征值发送模块,适于将所述特征值发送至云端服务器,并与云端服务器存储的不良图片信息的特征值进行匹配比较;第二判断模块,适于当匹配上时,则判断当前图片信息为不良图片信息。优选的,所述不良图片信息分析模块包括第二特征值获取模块,适于根据所述图片信息的内容,获取该图片信息的特征值;第二特征值比较模块,适于将所述特征值与浏览器侧或者服务器侧存储的不良图片信息的特征值进行匹配比较;第三判断模块,当匹配上时,则判断当前图片信息为不良图片信息。与现有技术相比,本发明包括以下优点本发明通过对DOM树的中的图片进行分析,获取DOM树中不良图片信息及其位置信息,然后根据所述位置信息将不良图片信息进行替换或者覆盖处理,然后将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。可在浏览器侧有效对不良图片进行处理,尤其可针对服务器侧无法统一进行处理的,而对于某一特定人群(比如青少年)属于不良图片的图片,可针对该特定人群进行针对性处理,避免网络中的这些图片信息对该特定人群的误导和不健康影响。


图I是本发明一种网页中不良图片信息的处理方法实施例一的流程示意图;图2是本发明优选的一种网页中不良图片信息的处理方法实施例二的流程示意图;图3是本发明优选的一种网页中不良图片信息的处理方法实施例三的流程示意图;图4是本发明一种网页中不良图片信息的处理装置实施例一的结构示意图;图5是本发明优选的一种不良图片信息分析模块实施例一的结构示意图;图6是本发明优选的一种不良图片信息分析模块实施例二的结构示意图;图7是本发明优选的一种不良图片信息分析模块实施例三的结构示意图;图8是本发明优选的一种不良图片信息分析模块实施例四的结构示意图;图9是本发明优选的一种不良图片信息分析模块实施例五的结构示意图;图10是本发明优选的一种网页中不良图片信息的处理装置实施例二的结构示意图;图11是本发明优选的块级元素生成模块实施例一的结构示意图;图12是本发明优选的第一块级元素生成模块实施例一的结构示意图;图13是本发明优选的一种网页中不良图片信息的处理装置实施例三的结构示意图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明作进一步详细的说明。下面通过实施例详细介绍本发明所述一种。参照图1,示出了本发明一种网页中不良图片信息的处理方法实施例一的流程示意图,具体可以包括步骤110,发送网页请求至服务器,并从所述服务器获取网页信息;浏览器的主要功能是将用户选择的web资源(即网页信息)呈现出来,它需要从服务器请求资源,并将其显示在浏览器窗口中,资源的格式通常是HTML (超文本标记语言,Hypertext Markup Language)。用户用 URI (Uniform Resource Identifier 统一资源标识符)来指定所请求资源的位置。即用户在浏览器地址栏输入URL,浏览器则基于所述URL生成网页请求,发送至URL对应的服务器,下载资源,即下载请求的网页信息。步骤120,解析所述网页信息对应的文档对象模型树;在浏览器下载得到网页信息后,则解析所述网页信息对应的DOM树,在实际中,DOM树把HTML文档等网页信息呈现为带有元素、属性和文本的树结构(节点树)。DOM是一种与平台和语言无关的接口,它允许程序和脚本动态访问和修改文档的内容、结构和类型。它定义了一系列的对象和方法对DOM树的节点进行各种随机操作 Document对象作为树的最高节点,Document对象是对整个文档进行操作的入□。
Element和Attr对象这些节点对象都是网页文档某一部分的映射,节点的定级层次恰好反映了文档的结构。
Text对象作为Element和Attr对象的子节点,Text对象表达了元素或属性的文本内容。Text节点不再包含任何子节点。
DOM树中的所有节点都是从节点对象继承而来的,节点对象定义了一些最基本的属性和方法,利用这些方法可以实现对树的遍历,同时,根据属性还可以得知节点的名称、取值并判断其类型。那么本发明则基于DOM树的解析规则将网页信息,实际中网页信息为源代码,解析为DOM树。步骤130,查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;在本发明中所述不良图片信息包括色情图片、暴力图片中的至少一种。在前述步骤得到DOM树后,从DOM树中查找图片信息,并判断图片信息是否为不良
图像信息。 优选的所述查找所述文档对象模型树中各节点的不良图片信息的步骤包括步骤Sll,从文档对象模型的根节点开始,遍历文档对象模型的各节点;步骤S12,获取各节点中图片信息,分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。DOM树是树状结构,为了不重不漏的查找DOM树所有图片信息,可从DOM树的根节点开始,进行递归遍历,获取各节点中图片信息;然后分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。其中,DOM树的递归遍历方法比如DOM树存在根节点A,根节点A存在子节点Al,A2 ;节点Al存在子节点A11,A12 ;节点All存在子节点A111,A112。遍历时,对于一个节点的各子节点,一般可从左至右子节点进行遍历,比如选择了根节点A的子节点A2,遍历完A2发现A2不存在子节点,那么返回根节点A,根据根节点A的与子节点的对应关系遍历子节点Al ;然后遍历节点Al的子节点A12,发现A12没有子节点,返回Al,从Al处遍历子节点All,以此类推。优选的,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括步骤S121,判断所述图片信息的内容中连续指定像素的分布比例是否大于阈值;其中比如RGB (RGB色彩模式是工业界的一种颜色标准,红(R)、绿(G)、蓝⑶三个颜色通道)为人体皮肤颜色范围内的像素,判断图片信息的内容中人体皮肤的像素分布比例是否大于阈值。其中,所述指定像素为肉色类、血色类像素中的至少一种;或所述指定像素为用户配置的。即所述指定像素可以为人体皮肤类像素,血的颜色类像素,或者由用户配置的像素。步骤S122,如果大于,则判断所述图片信息为不良图片信息。如果前述人体皮肤像素分布比例大于阈值,则判断所述图片信息为不良图片信
肩、O其中,所述阈值为用户配置的。即所述阈值可由用户配置。优选的,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括
步骤S21,获取当前图片信息的特征值;在本发明中,可将各用户端发现的不良图片信息或其特征值上传至云端服务器,在云端服务器存储不良图片信息的特征值。初始情况下,在用户发现不良图片信息的过程可由步骤S121和步骤S122判断图片信息是否为不良图片信息,如果是则将其特征值上传至云端服务器,以便后续其他用户使用时直接使用特征值进行判断,减少图片像素分析的时间。云端服务器存储的不良图片信息也可由云端服务器本身对不良图片信息进行搜集和分析获得。优选的情况是,云端服务器结合各用户端实施更新云端服务器中的特征信息库,对用户端新出现而云端未存储的不良图片信息的特征值上传至云端服务器进行存储。那么,本步骤可获取当前图片信息的特征值,比如MD5值等。步骤S22,将所述特征值发送至云端服务器,并与云端服务器存储的不良图片信息的特征值进行匹配比较;在获取到当前图片信息的特征值后,将特征值发送至云端服务器,与通过前述过 程获得并存储至云端的特征值进行匹配比较。步骤S23,当匹配上时,则判断当前图片信息为不良图片信息。当匹配上时,说明当前图片信息为不良图片信息,则可进入替换或者覆盖过程。当未匹配上时,则继续通过其他方式判断当前图片信息是否为不良图片信息,t匕如通过步骤S121和步骤S122。优选的,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括步骤S31,根据所述图片信息的内容,获取该图片信息的特征值;步骤S32,将所述特征值与浏览器侧储的不良图片信息的特征值进行匹配比较;步骤S33,当匹配上时,则判断当前图片信息为不良图片信息。本优选的所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤中,可将云端服务器存储的不良图片信息的特征值同步至浏览器侧,然后对于浏览器侧获取的图片信息,则将其特征值与本地的特征信息进行匹配比较,当匹配上时,则判断当前图片信息为不良图片信息;当未匹配上时,也可通过步骤S121和步骤S122判断当前图片信息是否为不良图片信息。优选的,所述确定所述不良图片信息在文档对象模型树中的位置信息的步骤包括步骤S41,依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID ;步骤S42,依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。在本发明实施例中,可将DOM树中的各不良图片信息提取出来后,再判断其是否为不良图片信息,那么在提取时,则可为该图片分配其相应在DOM树中相应位置的ID,该ID与DOM树的节点进行对应。那么当判断某个图片为不良图片信息时,则依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID,再依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。步骤140,依据所述位置信息将所述不良图片信息进行替换或者覆盖处理;在确定DOM树中不良图片信息及其位置信息后,可依据所述位置信息将所述不良图片信息进行替换或者覆盖处理。
步骤150,将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。然后即可将所述替换或者覆盖处理后的DOM树进行渲染和显示。参照图2,其示出了本发明优选的一种网页中不良图片信息的处理方法实施例二的流程示意图,具体可以包括步骤210,发送网页请求至服务器,并从所述服务器获取网页信息;步骤220,解析所述网页信息对应的文档对象模型树;步骤230,查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;步骤240,依据所述位置信息生成块级元素覆盖所述不良图片信息;
步骤250,对所述生成的块级元素和所述文档对象模型树进行渲染和显示。其中步骤210至步骤230与图I中步骤110与步骤130类似,在此不加详述。对于步骤240,依据所述位置信息生成块级元素覆盖所述不良图片信息;本步骤在知道不良图片信息在DOM树中的位置后,可在相应位置生成块级元素覆盖所述不良图片信息。比如生成一个覆盖于DOM树对应BODY结构的遮罩层,在遮罩层对应不良图片信息的节点位置生成至少一相块级元素,比如多相块级元素组成的马赛克,覆盖于所述不良图片信息之上,则所述不良图片信息则被屏蔽了。优选的,所述依据所述位置信息生成块级元素覆盖所述不良图片信息的步骤包括步骤S51,生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素;步骤S52,该块级元素覆盖所述不良图片信息内容中连续指定像素的区域。比如如果生成白色相的块级元素,那么可采用多个白色块级元素覆盖所述不良图片信息内容中连续指定像素的区域,即不良图片信息中不良像素存在的区域被白色块级元素覆盖,其覆盖完的效果为被覆盖区域为白色。当使用多相块级元素时,其覆盖完的效果可为马赛克效果。优选的,所述生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,该块级元素覆盖所述不良图片信息内容中连续指定像素的区域的步骤包括步骤S61,获取所述不良图片信息的像素尺寸;首先获取DOM树中不良图片信息对应展示结构中的像素尺寸,即整个图片在显示页面的显示位置和宽高。步骤S62,获取所述不良图片信息中至少一连续指定像素区域的尺寸;然后可从图片左上角开始,获取所述不良图片信息中至少一连续指定像素区域的尺寸。比如指定5*5尺寸的像素区域的像素。步骤S63,根据指定像素区域的尺寸和不良图片信息的像素尺寸确定所述指定像素区域的相对于不良图片信息的相对位置信息;然后根据源不良图片的尺寸,和指定像素区域的尺寸和其所选择时的位置,确定所述指定像素区域的相对于不良图片信息的相对位置信息;比如以原不良图片左下角为原点,从原点出发向上的为纵坐标正向,从原点出发向右为横坐标正向,每个像素对应一个点,那么可根据获取所述不良图片信息中至少一连续指定像素区域的尺寸时,获取指定像素区域的位置和尺寸确定寸确定所述指定像素区域的相对于不良图片信息的相对位置信
肩、O步骤S64,依据所述相对位置信息,生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,其高、宽参数为所述连续指定像素区域对应的高、宽参数。再根据每个指定像素区域的相对位置信息,生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,比如马 赛克形式的块级元素,覆盖于所述指定像素区域之上,即可避免不良像素被显示出来。其中块级元素,其高、宽参数为所述连续指定像素区域对应的高、宽参数。步骤S61至步骤S64可针对不良图片信息中的不良像素进行覆盖,不覆盖正常像素部分,比如覆盖血腥部分。 对于步骤250,对所述生成的块级元素和所述文档对象模型树进行渲染和显示。其对应图I的步骤150。因为生成了前述的块级元素覆盖在所述不良图片信息之上,那么可对所述生成的块级元素和所述文档对象模型树进行渲染,渲染后再进行显示。参照图3,其示出了本发明优选的一种网页中不良图片信息的处理方法实施例三的流程示意图,具体可以包括步骤310,发送网页请求至服务器,并从所述服务器获取网页信息;步骤320,解析所述网页信息对应的文档对象模型树;步骤330,查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;步骤340,依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容;步骤350,将所述替换处理后的文档对象模型树进行渲染和显示。其中步骤310至步骤330与图I中步骤110与步骤130类似在此不加详述。对于步骤340,依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容;本步骤则是将不良图片信息在DOM树中替换为用户设置的健康的图片。本步骤可根据用户需求替换为用户个性化内容,比如将不良图片信息替换为飞机图片。优选的,包括步骤D11,获取所述不良图片信息在原文档对象模型树中对应展示结构中的字体尺寸;原DOM树中各节点均存在的相应属性还包括其对应展示结构中的尺寸,比如所在显示界面中的位置、宽、高等尺寸,那么为了不改变原网页信息的显示结构,那么需要将替换的个性化内容(比片)调整为与原不良图片信息尺寸相同的尺寸,以在渲染时不改变DOM树的渲染结果。在实际中DOM树对应展示结构由相应的CSS样式结构体控制,那么本实施例可从目标文字信息所在节点对应的CSS样式结构体中的位置,提取相应的不良图片信息尺寸。步骤D12,将所述个性化内容的尺寸调整为所述不良图片信息的字体尺寸。对于步骤350,将所述替换处理后的文档对象模型树进行渲染和显示。其对应图I的步骤150。
根据前述所获得的不良图片信息的尺寸,将所述个性化内容的尺寸调整为所述不良图片信息的字体尺寸。可保证渲染得到的结果与原DOM树渲染得到的结果相同,即不改变原网页信息的显示结构。参照图4,其示出了本发明一种网页中不良图片信息的处理装置实施例一的结构示意图,包括网页信息获取模块410,适于发送网页请求至服务器,并从所述服务器获取网页信息;解析模块420,适于解析所述网页信息对应的文档对象模型树;不良图片信息分析模块430,适于查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;
不良图片信息处理模块440,适于依据所述位置信息将所述不良图片信息进行替换或者覆盖处理;渲染模块450,适于将所述替换或者覆盖处理后的文档对象模型树进行渲染和显
/Jn o其中,优选的,参照图5,所述不良图片信息分析模块包括遍历模块S411,适于从文档对象模型的根节点开始,遍历文档对象模型的各节占.获取分析模块S412,适于获取各节点中图片信息,分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。优选的,参照图6,所述不良图片信息分析模块包括ID确定模块S421,适于依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID ;节点确定模块S422,适于依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。优选的,参照图7,所述不良图片信息分析模块包括第一判断模块S431,适于判断所述图片信息的内容中连续指定像素的分布比例是否大于阈值;如果大于,则判断所述图片信息为不良图片信息。优选的,参照图8,所述不良图片信息分析模块包括第一特征值获取模块S441,适于获取当前图片信息的特征值;特征值发送模块S442,适于将所述特征值发送至云端服务器,并与云端服务器存储的不良图片信息的特征值进行匹配比较;第二判断模块S443,适于当匹配上时,则判断当前图片信息为不良图片信息。优选的,参照图9,所述不良图片信息分析模块包括第二特征值获取模块S451,适于根据所述图片信息的内容,获取该图片信息的特征值;第二特征值比较模块S452,,适于将所述特征值与浏览器侧或者服务器侧存储的不良图片信息的特征值进行匹配比较;第三判断模块S453,当匹配上时,则判断当前图片信息为不良图片信息。
其中,所述不良图片信息包括色情图片、暴力图片中的至少一种。其中,所述指定像素为肉色类、血色类像素中的至少一种;或所述指定像素为用户配置的。其中,所述阈值为用户配置的。参照图10,其示出了本发明一种网页中不良图片信息的处理装置实施例二的结构示意图,包括网页信息获取模块510,适于发送网页请求至服务器,并从所述服务器获取网页信息;解析模块520,适于解析所述网页信息对应的文档对象模型树;不良图片信息分析模块530,适于查找所述文档对象模型树中各节点的不良图片
信息,并确定所述不良图片信息在文档对象模型树中的位置信息;块级元素生成模块540,适于依据所述位置信息生成块级元素覆盖所述不良图片
信息;第一渲染模块550,适于对所述生成的块级元素和所述文档对象模型树进行渲染和显示。优选的,参照图11,所述块级元素生成模块包括第一块级元素生成模块S511,适于生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素;该块级元素覆盖所述不良图片信息内容中连续指定像素的区域。其中,参照图12,所述第一块级元素生成模块包括第一尺寸获取模块S521,适于获取所述不良图片信息的像素尺寸;第二尺寸获取模块S522,适于获取所述不良图片信息中至少一连续指定像素区域的尺寸;相对位置信息确定模块S523,适于根据指定像素区域的尺寸和不良图片信息的像素尺寸确定所述指定像素区域的相对于不良图片信息的相对位置信息;第三块级元素生成模块S524,适于依据所述相对位置信息,生成至少一相对于所述不良图片信息所在的节点进行布置的块级元素,其高、宽参数为所述连续指定像素区域对应的高、宽参数。参照图13,其示出了本发明一种网页中不良图片信息的处理装置实施例三的结构示意图,包括网页信息获取模块610,适于发送网页请求至服务器,并从所述服务器获取网页信息;解析模块620,适于解析所述网页信息对应的文档对象模型树;不良图片信息分析模块630,适于查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;替换模块640,适于依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容。第二渲染模块550,适于将所述替换处理后的文档对象模型树进行渲染和显示。对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明实施例所必须的。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。上述本发明实施例中的方法、装置适适于各种网络或者客户端环境中,例如可以实现在诸如个人计算机设备之类的计算机设备中,或者可以实现在诸如移动电话、移动通信设备、个人数字助理(PDA)等其他便携式电子设备或者非便携式电子设备中。因此本领域技术人员要明确的是,本发明的保护范围并不限于PC上运行浏览器中的替换功能和覆盖功能,仅是出于描述的简洁和方便而在本发明实施例中采用了 PC上运行浏览器中的替换功能和覆盖功能进行描述。本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。以上对本发明所提供的一种网页中不良图片信息的处理方法和装置,进行了详细 介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种网页中不良图片信息的处理方法,其特征在于,包括 发送网页请求至服务器,并从所述服务器获取网页信息; 解析所述网页信息对应的文档对象模型树; 查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息; 依据所述位置信息将所述不良图片信息进行替换或者覆盖处理; 将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。
2.根据权利要求I所述的方法,其特征在于,依据所述位置信息将所述不良图片信息进行覆盖处理包括 依据所述位置信息生成块级元素覆盖所述不良图片信息; 则进一歩所述将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示包括 对所述生成的块级元素和所述文档对象模型树进行渲染和显示。
3.根据权利要求I所述的方法,其特征在于,依据所述位置信息将所述不良图片信息进行替换处理包括 依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容。
4.根据权利要求I所述的方法,其特征在于,所述不良图片信息包括 色情图片、暴力图片中的至少ー种。
5.根据权利要I所述的方法,其特征在于,所述查找所述文档对象模型树中各节点的不良图片信息的步骤包括 从文档对象模型的根节点开始,遍历文档对象模型的各节点; 获取各节点中图片信息,分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。
6.根据权利要求5所述的方法,其特征在于,所述确定所述不良图片信息在文档对象模型树中的位置信息的步骤包括 依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID ; 依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。
7.根据权利要求6所述的方法,其特征在于,所述依据所述位置信息生成块级元素覆盖所述不良图片信息的步骤包括 生成至少ー相对于所述不良图片信息所在的节点进行布置的块级元素; 该块级元素覆盖所述不良图片信息内容中连续指定像素的区域。
8.根据权利要求7所述的方法,其特征在干,所述生成至少ー相对于所述不良图片信息所在的节点进行布置的块级元素,该块级元素覆盖所述不良图片信息内容中连续指定像素的区域的步骤包括 获取所述不良图片信息的像素尺寸; 获取所述不良图片信息中至少ー连续指定像素区域的尺寸; 根据指定像素区域的尺寸和不良图片信息的像素尺寸确定所述指定像素区域的相对于不良图片信息的相对位置信息; 依据所述相对位置信息,生成至少ー相对于所述不良图片信息所在的节点进行布置的块级元素,其高、宽參数为所述连续指定像素区域对应的高、宽參数。
9.根据权利要求5所述的方法,其特征在于,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括 判断所述图片信息的内容中连续指定像素的分布比例是否大于阈值; 如果大于,则判断所述图片信息为不良图片信息。
10.根据权利要求9所述的方法,其特征在干, 所述指定像素为肉色类、血色类像素中的至少ー种;或 所述指定像素为用户配置的。
11.根据权利要求9所述的方法,其特征在干, 所述阈值为用户配置的。
12.根据权利要求5所述的方法,其特征在于,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括 获取当前图片信息的特征值; 将所述特征值发送至云端服务器,并与云端服务器存储的不良图片信息的特征值进行匹配比较; 当匹配上时,则判断当前图片信息为不良图片信息。
13.根据权利要求5所述的方法,其特征在于,所述分析该图片信息的内容,判定出所获取图片信息中的不良图片信息的步骤包括 根据所述图片信息的内容,获取该图片信息的特征值; 将所述特征值与浏览器侧储的不良图片信息的特征值进行匹配比较; 当匹配上时,则判断当前图片信息为不良图片信息。
14.一种网页中不良图片信息的处理装置,其特征在于,包括 网页信息获取模块,适于发送网页请求至服务器,并从所述服务器获取网页信息; 解析模块,适于解析所述网页信息对应的文档对象模型树; 不良图片信息分析模块,适于查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息; 不良图片信息处理模块,适于依据所述位置信息将所述不良图片信息进行替换或者覆盖处理; 渲染模块,适于将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。
15.根据权利要求14所述的装置,其特征在于,所述不良图片信息处理模块包括 块级元素生成模块,适于依据所述位置信息生成块级元素覆盖所述不良图片信息; 则进一歩所述渲染模块包括 第一渲染模块,适于对所述生成的块级元素和所述文档对象模型树进行渲染和显示。
16.根据权利要求14所述的装置,其特征在于,所述不良图片信息处理模块包括 替换模块,适于依据用户预置的个性化内容和所述位置信息,将文档对象模型树中相应位置的不良图片信息替换为所述用户的个性化内容。
17.根据权利要求14所述的装置,其特征在于,所述不良图片信息包括 色情图片、暴力图片中的至少ー种。
18.根据权利要求14所述的装置,其特征在于,所述不良图片信息分析模块包括遍历模块,适于从文档对象模型的根节点开始,遍历文档对象模型的各节点; 获取分析模块,适于获取各节点中图片信息,分析该图片信息的内容,判定出所获取图片信息中的不良图片信息。
19.根据权利要求18所述的装置,其特征在于,所述不良图片信息分析模块包括 ID确定模块,适于依据查找到的不良图片信息,确定该图片在文档对象模型树中的ID ; 节点确定模块,适于依据所述图片ID确定该不良图片信息在文档对象模型树中的节点。
20.根据权利要求19所述的装置,其特征在于,所述块级元素生成模块包括 第一块级元素生成模块,适于生成至少ー相对于所述不良图片信息所在的节点进行布置的块级元素; 该块级元素覆盖所述不良图片信息内容中连续指定像素的区域。
21.根据权利要求20所述的装置,其特征在于,所述第一块级元素生成模块包括 第一尺寸获取模块,适于获取所述不良图片信息的像素尺寸; 第二尺寸获取模块,适于获取所述不良图片信息中至少ー连续指定像素区域的尺寸;相对位置信息确定模块,适于根据指定像素区域的尺寸和不良图片信息的像素尺寸确定所述指定像素区域的相对于不良图片信息的相对位置信息; 第三块级元素生成模块,适于依据所述相对位置信息,生成至少ー相对于所述不良图片信息所在的节点进行布置的块级元素,其高、宽參数为所述连续指定像素区域对应的高、宽參数。
22.根据权利要求18所述的装置,其特征在于,所述不良图片信息分析模块包括 第一判断模块,适于判断所述图片信息的内容中连续指定像素的分布比例是否大于阈值; 如果大于,则判断所述图片信息为不良图片信息。
23.根据权利要求22所述的装置,其特征在干, 所述指定像素为肉色类、血色类像素中的至少ー种;或 所述指定像素为用户配置的。
24.根据权利要求22所述的装置,其特征在干, 所述阈值为用户配置的。
25.根据权利要求18所述的装置,其特征在于,所述不良图片信息分析模块包括 第一特征值获取模块,适于获取当前图片信息的特征值; 特征值发送模块,适于将所述特征值发送至云端服务器,并与云端服务器存储的不良图片信息的特征值进行匹配比较; 第二判断模块,适于当匹配上时,则判断当前图片信息为不良图片信息。
26.根据权利要求18所述的装置,其特征在于,所述不良图片信息分析模块包括 第二特征值获取模块,适于根据所述图片信息的内容,获取该图片信息的特征值; 第二特征值比较模块,适于将所述特征值与浏览器侧或者服务器侧存储的不良图片信息的特征值进行匹配比较; 第三判断模块,当匹配上时,则判断当前图片信息为不良图片信息。
全文摘要
本发明提供了一种网页中不良图片信息的处理方法和装置,涉及浏览器技术领域。所述方法包括发送网页请求至服务器,并从所述服务器获取网页信息;解析所述网页信息对应的文档对象模型树;查找所述文档对象模型树中各节点的不良图片信息,并确定所述不良图片信息在文档对象模型树中的位置信息;依据所述位置信息将所述不良图片信息进行替换或者覆盖处理;将所述替换或者覆盖处理后的文档对象模型树进行渲染和显示。本发明可在浏览器侧有效对不良图片进行处理,尤其可针对服务器侧无法统一进行处理的,而对于某一特定人群属于不良图片的图片,可针对该特定人群进行针对性处理,避免网络中的这些图片信息对该特定人群的误导和不健康影响。
文档编号G06F17/30GK102799655SQ201210227120
公开日2012年11月28日 申请日期2012年6月29日 优先权日2012年6月29日
发明者唐曦, 陈志 , 李鸣, 任寰 申请人:奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1