自学习的发帖审计系统的实现方法

文档序号:6366130阅读:246来源:国知局
专利名称:自学习的发帖审计系统的实现方法
技术领域
本发明涉及ー种自学习的发帖审计系统的实现方法,属于网络安全技术领域。
背景技术
目前,公司内部员エ对机密文件、敏感信息的窃取和泄漏,以及在工作时间,利用公司网络资源进行与工作无关的活动,严重损害了公司的利益。随着我国电子政务系统的实施和建设,政府、企事业单位对安全提出了更高的要求。公司员エ通过网络与外界联系的方式通常有以下几种即时通讯软件、电子邮件、论坛博客等。其中,即时通讯软件和电子邮件由于对安全性和隐私性有比较高的要求,因此对技术的要求比较高,且用户比较集中(据统计,QQ用户数量超过9. 3亿,网易邮箱用户数量超过4亿)、用户粘性比较大,因此对于审计系统来说,通常只要分析几个主流的产品即可覆盖大部分用户,工程量较小,维护相对容易。但是这种情况对于论坛博客来说不成立。首先,论坛博客系统存储的个人信息比较少,或者根本不需要,导致论坛博客系统对安全性的要求不高,因此对技术的要求相对较低,比较容易实现;其次,开源论坛博客系统流行(例如Discuz!、JForum、WordPress等等),利用开源的代码搭建一个论坛博客网站十分容易,且成本低;第三,论坛博客的种类五花八门、各有特色(鉄血网、西陆论坛是著名的军事论坛,cnblogs是著名的技术博客等)。以上这些特点都导致了用户分散(著名的天涯论坛用户数量超过6千万,但远不及QQ的用户数量),给发帖审计带来困难需要分析数十个论坛博客系统,工程量大,维护困难。现在有些公司还搭建了自己的内部论坛,以方便员エ的交流,而对于这种论坛,又需要推出针对某个公司的特别版本才能审计,这无疑又加大了产品维护的困难。在论坛中发帖、在博客中发博文等行为通常都是采用HTTP POST的方式将帖子、博文通过浏览器提交到服务器端。如果能对这类HTTP POST报文加以分析,并提炼出相似的部分,则能对解决发帖审计系统的以上这些缺点有极大的帮助。

发明内容
本发明针对目前发帖审计系统可扩展性、可维护性差、不能用户自定义等方面的不足,提供ー种自学习的发帖审计系统的实现方法,提高系统的可扩展性、可维护性、易用性和智能性。本发明的目的通过以下技术方案来实现
自学习的发帖审计系统的实现方法,包括以下步骤
1)将发帖时提交的HTTPPOST报文正文解析成一个关键字-值对列表的形式,对于不同的论坛博客系统,根据不同的标题关键字、内容关键字在列表中查找,即得到相应的标题、内容;
2)将每个不同的论坛博客的特征写成一个仅与关键字有关的配置,并将这个配置采用的数据库的方式存储,方便添加和修改;3)将关键字-值对列表展示给用户,并允许用户根据这个表修改标题、内容的关键字,以达到用户自定义论坛的目的;
4)设置ー些经常出现关键字,以实现在论坛博客系统升级,导致关键字特征改变时,仍能审计到标题、内容的自学习功能。进ー步地,上述的自学习的发帖审计系统的实现方法,在审计系统获得一个完整的HTTP POST报文 后,首先根据RFC2616中规定的HTTP格式解析HTTP首部,得到Host和Content-Type字段,即域名和HTTP正文的格式;然后,根据前面得到的格式解析HTTP正文,得到关键字-值对列表;接着,根据前面得到的域名找到相应的配置;最后,根据配置中的标题、内容关键字在列表中查找得到相应的值;
程序在启动时,从数据库中读取各个论坛博客的关键字配置,并组织成ー个配置链表,在审计系统获取HTTP POST报文的Host字段后,与配置中的Host相匹配,匹配成功,即找到论坛博客网站的配置,链表按优先级从高到低排序,用户自定义论坛的配置优先级最高,预置的论坛博客的配置为普通优先级;如果前面的论坛博客的配置一个都没有匹配上,进入最低优先级的配置进行匹配,此时不再根据Host匹配,而是根据关键字匹配,如果关键字-值对列表中存在某个配置的关键字,则匹配成功,然后可以根据配置中的标题、内容关键字到关键字-值对列表中查找;
用户从页面设置新的标题、内容关键字后,更新到程序中的配置链表,使以后的审计使用新的配置;还更新到数据库,使程序重启后从数据库中读取新的配置。本发明技术方案突出的实质性特点和显著的进步主要体现在
利用抽象化的思想,将发帖报文解析成一个列表的形式,并将不同的论坛博客的特征写成ー个配置的形式,大大提高了系统的可扩展性;将不同论坛博客的配置用数据库的方式存储,大大提高了系统的可维护性;用户可以根据列表修改标题、内容的关键字,显示了系统的易用性和灵活性;在论坛博客系统升级,或其他导致关键字特征改变的情况时,仍能审计到标题、内容,显示了系统的智能性和強健性。


下面结合附图对本发明技术方案作进ー步说明
图I:发帖审计流程示意 图2 :配置的数据结构示意 图3 :用户自定义论坛流程示意图。
具体实施例方式在论坛中发帖、在博客中发博文等行为通常都是采用HTTP POST的方式将帖子、博文通过浏览器提交到服务器端的。通常情况下,这类HTTP POST报文正文的格式为application/x-www-form-urIencodea 或 multipart/form-data,这都是由 HTTP 报又直部的Content-Type字段決定的,这两种格式的特点是都可以解析成许多“关键字-值”对的形式,而标题、内容就是其中的ー个或两个“关键字-值”对。然后根据各个论坛博客系统不同的标题关键字、内容关键字就可以找到相应的标题、内容。自学习的发帖审计系统的实现方法,包括以下步骤1)将发帖时提交的HTTPPOST报文正文解析成一个关键字-值对列表的形式,对于不同的论坛博客系统,根据不同的标题关键字、内容关键字在列表中查找,即得到相应的标题、内容
2)将每个不同的论坛博客的特征写成一个仅与关键字有关的配置,并将这个配置采用的数据库的方式存储,方便添加和修改;
3)将关键字-值对列表展示给用户,并允许用户根据这个表修改标题、内容的关键字,以达到用户自定义论坛的目的;
4)设置ー些经常出现关键字,比如“title”、“C0ntent”、“b0dy”等,以实现在论坛博客系统升级,导致关键字特征改变时,仍能审计到标题、内容的自学习功能。如图I所示发帖审计流程,自学习的发帖审计系统,在审计系统获得一个完整的HTTP POST报文后,首先根据RFC2616中规定的HTTP格式解析HTTP首部,得到Host和Content-Type字段,即域名和HTTP正文的格式;然后,根据前面得到的格式解析HTTP正文,得到“关键字-值”对列表;接着,根据前面得到的域名找到相应的配置;最后,根据配置中的标题、内容关键字在列表中查找得到相应的值。如图2所示配置的数据结构;程序在启动时,从数据库中读取各个论坛博客的关键字配置,并组织成ー个配置链表;在审计系统获取HTTP POST报文的Host字段后,与配置中的Host相匹配,匹配成功,即找到该论坛博客网站的配置;为了防止误匹配情况发生,链表按优先级从高到低排序,用户自定义论坛的配置优先级最高,预置的论坛博客的配置为普通优先级;如果前面的论坛博客的配置一个都没有匹配上,进入最低优先级的配置进行匹配,此时不再根据Host匹配,而是根据关键字匹配,如果“关键字-值”对列表中存在某个配置的关键字,则匹配成功,然后根据配置中的标题、内容关键字到“关键字-值”对列表中查找。如图3所示用户自定义论坛流程,用户从页面设置了新的标题、内容关键字后,需要更新到程序中的配置链表,以保证以后的审计可以使用新的配置;还需要更新到数据库,以保证程序重启后可以从数据库中读取新的配置。综上所述,本发明提供ー种自学习的发帖审计系统的实现方法,利用抽象化的思想,将发帖报文解析成一个列表的形式,并将不同的论坛博客的特征写成ー个配置的形式,大大提高了系统的可扩展性;将不同论坛博客的配置用数据库的方式存储,大大提高了系统的可维护性;用户可以根据列表修改标题、内容的关键字,显示了系统的易用性和灵活性;在论坛博客系统升级,或其他导致关键字特征改变的情况时,仍能审计到标题、内容,显示了系统的智能性和強健性。需要理解到的是以上所述仅是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
权利要求
1.自学习的发帖审计系统的实现方法,其特征在于包括以下步骤 1)将发帖时提交的HTTPPOST报文正文解析成一个关键字-值对列表的形式,对于不同的论坛博客系统,根据不同的标题关键字、内容关键字在列表中查找,即得到相应的标题、内容; 2)将每个不同的论坛博客的特征写成一个仅与关键字有关的配置,并将这个配置采用的数据库的方式存储,方便添加和修改; 3)将关键字-值对列表展示给用户,并允许用户根据这个表修改标题、内容的关键字,以达到用户自定义论坛的目的; 4)设置ー些经常出现关键字,以实现在论坛博客系统升级,导致关键字特征改变时,仍能审计到标题、内容的自学习功能。
2.根据权利要求I所述的自学习的发帖审计系统的实现方法,其特征在于在审计系统获得一个完整的HTTP POST报文后,首先根据RFC2616中规定的HTTP格式解析HTTP首部,得到Host和Content-Type字段,即域名和HTTP正文的格式;然后,根据前面得到的格式解析HTTP正文,得到关键字-值对列表;接着,根据前面得到的域名找到相应的配置;最后,根据配置中的标题、内容关键字在列表中查找得到相应的值; 程序在启动时,从数据库中读取各个论坛博客的关键字配置,并组织成ー个配置链表,在审计系统获取HTTP POST报文的Host字段后,与配置中的Host相匹配,匹配成功,即找到论坛博客网站的配置,链表按优先级从高到低排序,用户自定义论坛的配置优先级最高,预置的论坛博客的配置为普通优先级;如果前面的论坛博客的配置一个都没有匹配上,进入最低优先级的配置进行匹配,此时不再根据Host匹配,而是根据关键字匹配,如果关键字-值对列表中存在某个配置的关键字,则匹配成功,然后可以根据配置中的标题、内容关键字到关键字-值对列表中查找; 用户从页面设置新的标题、内容关键字后,更新到程序中的配置链表,使以后的审计使用新的配置;还更新到数据库,使程序重启后从数据库中读取新的配置。
全文摘要
本发明涉及自学习的发帖审计系统的实现方法,将发帖时提交的HTTPPOST报文正文解析成一个关键字-值对列表的形式,对于不同的论坛博客系统,根据不同的标题关键字、内容关键字在列表中查找,即得到相应的标题、内容;将每个不同的论坛博客的特征写成一个仅与关键字有关的配置,并将这个配置采用的数据库的方式存储,方便添加和修改;将关键字-值对列表展示给用户,并允许用户根据这个表修改标题、内容的关键字,以达到用户自定义论坛的目的;设置一些经常出现关键字,以实现在论坛博客系统升级,导致关键字特征改变时,仍能审计到标题、内容的自学习功能。提高系统的可扩展性、可维护性、易用性和智能性。
文档编号G06F15/18GK102662977SQ20121006460
公开日2012年9月12日 申请日期2012年3月13日 优先权日2012年3月13日
发明者刘继明, 林恩峰, 王东泉, 王克非, 谢炜 申请人:网经科技(苏州)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1