基于家长个性化推荐管控的安全网络浏览系统的制作方法

文档序号:6549562阅读:126来源:国知局
基于家长个性化推荐管控的安全网络浏览系统的制作方法
【专利摘要】本发明提供一种基于家长个性化推荐管控的安全网络浏览系统,包括网络浏览模块、家长管控模块以及内容过滤系统,网络浏览模块用于显示家长所指定的主题相关信息,家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,网络过滤系统模块包括查询模块、文本分类模块和结果处理模块。家长可以利用系统给出的主题选项进行直观选择,并在显示模块按家长指定的主题分类搜索到相关信息,按类别分类醒目的显示出来;对孩子浏览的网页,由网络内容过滤模块进行过滤,使孩子能访问安全网页。
【专利说明】基于家长个性化推荐管控的安全网络浏览系统
【技术领域】
[0001]本发明涉及网络浏览【技术领域】,具体而言涉及一种基于家长个性化推荐管控的安全网络浏览系统。
【背景技术】
[0002]针对当前复杂的网络内容,各种信息扑面而来,由于现在的儿童接触网络比较早,在浏览网页时若不能很好的选择网页内容,会严重影响他们的认知及成长,这给家长们带来很大的烦恼。而当前的儿童浏览器存在家长管控方式受限,家长本身并不知道有哪些网站可以访问并且对各网站的地址也不熟悉,所以通过网站推荐的地址会使得家长感到束手无策,这样不能较好地控制孩子的浏览行为。
[0003]对于过滤网络的内容,目前大多数采用以下几种方法:基于分级标签的监管方法、基于URL过滤的方法及基于关键词过滤的方法。基于分级标签的监管方法有效的先决条件是信息发布者具有良好的自律性;基于URL过滤的方法有效的先决条件是预先知道含有不安全信息的网址;基于关键词过滤的方法没有考虑整个文本信息的主题含义,通常效果不是很理想。当前的基于内容的过滤系统缺乏反馈机制,不能很好的适应家长的定制需求。

【发明内容】

[0004]针对现有技术的家长管控系统中,家长指定网站过于依赖家长本身的知识储备的缺陷,本发明目的在于提供一种基于家长个性化推荐管控的安全网络浏览系统,家长可以利用系统给出的主题选项进行直观选择,并在显示模块按家长指定的主题分类搜索到相关信息,按类别分类醒目的显示出来;对孩子浏览的网页,由网络内容过滤模块进行过滤,使孩子能访问安全网页。
[0005]本发明的上述目的通过独立权利要求的技术特征实现,从属权利要求以另选或有利的方式发展独立权利要求的技术特征。
[0006]为达成上述目的,本发明所采用的技术方案如下:
[0007]一种基于家长个性化推荐管控的安全网络浏览系统,包括网络浏览模块、家长管控模块以及内容过滤系统,其中:
[0008]所述网络浏览模块用于显示家长所指定的主题相关信息,其中,家长指定的主题包括多个大类,每一个大类由若干个小类组成;
[0009]所述家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,所述黑名单地址列表用于存储禁止访问的黑名单地址,所述白名单地址列表用于存储允许访问的白名单地址,所述灰名单地址列表用于存储待确认的灰名单访问地址;
[0010]所述网络过滤系统模块包括查询模块、文本分类模块和结果处理模块,其中:
[0011]所述查询模块用于根据输入的字符按照前缀和后缀匹配的原则查询黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页;如果属于灰名单地址列表,则禁止访问;
[0012]所述文本分类模块用于进行文本预处理,将预处理后的文本信息存入文本信息库,然后将库中信息进行特征提取,计算特征权值,得出特征向量,然后利用分类器进行分类;
[0013]所述结果处理模块包括一个知识库和判别模块,该知识库中存储有各个主题的特征向量和特征值,该判别模块用于将上述分类结果与知识库中的特征值和特征向量比对,判别上述文本的主题类别:如果属于家长指定的主题,则将该文本的地址加入所述白名单地址列表并允许访问;若属于系统推荐主题,则将该文本的地址加入灰名单地址列表并暂时禁止观看,供家长查看后选择是否允许访问;否则,将该文本的地址加入黑名单列表并禁止访问。
[0014]进一步的实施例中,所述文本分类模块按照下述方式进行文本分类处理:
[0015]首先,利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维;
[0016]然后,利用VSM进行文本表示,再计算TF-1DF权值,
[0017]最后,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。
[0018]进一步的实施例中,所述黑、白、灰名单地址列表根据输入字符和匹配结果自动更新。
[0019]由以上本发明的技术方案可知,本发明的有益效果在于:针对当前网络化时代,各种网络内容铺天盖地而来,其中包括大量不健康的网络内容,严重影响了儿童的身心健康,针对这个问题本发明采用家长可管控的安全浏览系统;当前用于儿童浏览网页的系统缺乏引导性的功能,使得家长很难控制需要访问的网页主题,针对这个问题本发明采用具有推荐主题的家长管控方式,系统事先已经将整个网络内容分成几个大的主题,家长只需从这些主题中做出选择即可;当前的系统过滤精度不够高、速度不够快,针对这个问题本发明所采用的系统事先将家长指定的主题分类存储,将网址加入白名单地址列表,该主题下的网页内容是访问频率比较高的,这类信息可以直接利用网址查询,查询不到的可以利用网络内容过滤系统进行分类,将属于指定主题的网址加入白名单列表,将属于禁止主题的网址加入黑名单地址列表,否则将网址加入灰名单地址列表以供家长审核,若审核通过,则将网页地址移入白名单地址列表,否则将网页地址移入黑名单地址列表。运用该系统即方便又快捷。
【专利附图】

【附图说明】
[0020]图1为本发明一实施方式基于家长个性化推荐管控的安全网络浏览系统的原理框图。
[0021]图2为图1基于家长个性化推荐管控的安全网络浏览系统的系统处理过程示意图。
[0022]图3为图1实施例中内容过滤系统的原理框图。
[0023]图4为图1实施例中文本分类模块的原理框图。
[0024]图5为图1实施例中结果处理模块的处理示意图。【具体实施方式】
[0025]为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
[0026]图1所示为本发明一实施方式基于家长个性化推荐管控的安全网络浏览系统的原理框图,其中,一种基于家长个性化推荐管控的安全网络浏览系统,包括网络浏览模块、家长管控模块以及内容过滤系统。
[0027]所述网络浏览模块用于显示家长所指定的主题相关信息,其中,家长指定的主题包括多个大类,每一个大类由若干个小类组成。
[0028]如图1所示,所述家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,所述黑名单地址列表用于存储禁止访问的黑名单地址,所述白名单地址列表用于存储允许访问的白名单地址,所述灰名单地址列表用于存储待确认的灰名单访问地址。
[0029]如图3所示,所述网络过滤系统模块包括查询模块、文本分类模块和结果处理模块。
[0030]所述查询模块用于根据输入的字符按照前缀和后缀匹配的原则查询黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页;如果属于灰名单地址列表,则禁止访问。
[0031]如果在黑、白、灰名单地址列表中没有查询到,即该输入字符的前缀和后缀匹配在三个地址列表中查找不存在,则使用HTTP协议下的文本传输协议捕获网页文本信息。
[0032]所述文本分类模块用于对前述捕获的文本信息进行文本预处理,将预处理后的文本信息存入文本信息库,然后将库中信息进行特征提取,计算特征权值,得出特征向量,然后利用分类器进行分类。
[0033]作为优选的实施方式,如图4所示,前述文本分类模块按照下述方式进行文本分类处理:
[0034]首先,利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维;
[0035]然后,利用VSM进行文本表示,再计算TF-1DF权值,
[0036]最后,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。
[0037]本实施例中,在LSI降维的基础上,再用GA进行优化降维,LSI和GA相结合不仅可以大大降低文本空间的维数,而且也进一步提高了分类的精度。
[0038]所述结果处理模块包括一个知识库和判别模块,该知识库中存储有各个主题的特征向量和特征值,该判别模块用于将上述分类结果与知识库中的特征值和特征向量比对,结合图5所示,判别模块判别上述文本的主题类别:如果属于家长指定的主题,则将该文本的地址加入所述白名单地址列表并允许访问;若属于系统推荐主题,则将该文本的地址加入灰名单地址列表并暂时禁止观看,供家长查看后选择是否允许访问;否则,将该文本的地址加入黑名单列表并禁止访问。
[0039]如图2所示为系统处理过程示意,结合图1所示,下面具体介绍前述实施例的基于家长个性化推荐管控的安全网络浏览系统的处理过程,该处理过程包括以下步骤:[0040]步骤1,首先家长通过口令密码进入管控系统进入家长管控模块,家长可以实现指定允许孩子访问的主题,可以指定不允许孩子访问的主题,可以指定允许访问的具体的网页地址,也可以指定禁止访问的网页地址,还可以审查灰名单列表中的网页是否被允许,灰名单列表中存储着系统认为和家长指定的主题相关的网页地址信息。系统捕获家长的指定允许访问的主题信息,系统会按主题搜索到相关信息,分类显示在浏览首页,供浏览使用。
[0041]步骤2,从安全浏览模块的地址输入框输入网址。
[0042]步骤3,网络过滤模块捕获输入的字符.[0043]步骤4,按照前缀和后缀匹配的原则查找存储在高速闪存中的黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页,地址会被送到服务器,服务器送回相对应的网页内容,访问结束。如果属于灰名单地址列表,则禁止访问。
[0044]步骤5,(如图4)如果查找不存在,则在访问服务器后,使用HTTP协议下的文本传输协议捕获网页文本信息,将文本信息进行预处理,即利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维,在LSI降维的基础上,再用GA进行优化降维,LSI和GA相结合不仅可以大大降低文本空间的维数,而且也进一步提高了分类的精度。然后利用VSM进行文本表示,计算TF-1DF权值,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。(如图5)将分类的结果查询主题库,通过与主题库中的特征值和特征向量比对,确定网页所属的主题类别,如果属于家长允许的主题,则进入步骤6,如果属于家长禁止的主题,则进入步骤7,否则如果属于系统推荐主题,进入步骤
8。否则进入步骤7.[0045]步骤6,将该网页发送到显示端,并将网页的地址存储到白名单地址列表。进入步 骤I或者结束。进入步骤I或者结束。
[0046]步骤7,屏蔽掉该网页内容,并将网页地址存储到黑名单地址列表。进入步骤I或者结束。
[0047]步骤8,屏蔽掉该网页内容,并将网页地址加入灰名单地址列表。进入步骤I或者结束。
[0048]如图5所示,其中的主题库可包括前述的家长指定主题库、家长禁止主题库,主题库中存储着事先分类好的几种主题,每种主题下的特征向量和特征值,系统将其中若干种主题作为禁止主题,并且对家长指定的主题利用KNN算法找出相近主题作为系统推荐主题。对分类结果查找出主题时,如果属于系统推荐主题时就将该网页加入灰名单地址列表,供家长审核,选择将该网页移入黑名单还是白名单。
[0049]间隔一段时间,黑、白、灰名单将地址列表根据输入字符和匹配结果自动更新,,以显示最近孩子关心的内容。
[0050]虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属【技术领域】中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
【权利要求】
1.一种基于家长个性化推荐管控的安全网络浏览系统,其特征在于,包括网络浏览模块、家长管控模块以及内容过滤系统,其中: 所述网络浏览模块用于显示家长所指定的主题相关信息,其中,家长指定的主题包括多个大类,每一个大类由若干个小类组成; 所述家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,所述黑名单地址列表用于存储禁止访问的黑名单地址,所述白名单地址列表用于存储允许访问的白名单地址,所述灰名单地址列表用于存储待确认的灰名单访问地址; 所述网络过滤系统模块包括查询模块、文本分类模块和结果处理模块,其中: 所述查询模块用于根据输入的字符按照前缀和后缀匹配的原则查询黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页;如果属于灰名单地址列表,则禁止访问; 所述文本分类模块用于进行文本预处理,将预处理后的文本信息存入文本信息库,然后将库中信息进行特征提取,计算特征权值,得出特征向量,然后利用分类器进行分类; 所述结果处理模块包括一个知识库和判别模块,该知识库中存储有各个主题的特征向量和特征值,该判别模块用于将上述分类结果与知识库中的特征值和特征向量比对,判别上述文本的主题类别:如果属于家长指定的主题,则将该文本的地址加入所述白名单地址列表并允许访问;若属于系统推荐主题,则将该文本的地址加入灰名单地址列表并暂时禁止观看,供家长查看后选择是否允许访问;否则,将该文本的地址加入黑名单列表并禁止访问。
2.根据权利要求1所述的基于家长个性化推荐管控的安全网络浏览系统,其特征在于,所述文本分类模块按照下述方式进行文本分类处理: 首先,利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维; 然后,利用VSM进行文本表示,再计算TF-1DF权值, 最后,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。
3.根据权利要求1或2所述的基于家长个性化推荐管控的安全网络浏览系统,其特征在于,所述黑、白、灰名单地址列表根据输入字符和匹配结果自动更新。
【文档编号】G06F17/30GK104035999SQ201410263662
【公开日】2014年9月10日 申请日期:2014年6月13日 优先权日:2014年6月13日
【发明者】赵雪美, 张琨, 郭林锋, 王羽 申请人:南京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1