一种网络访问的管理方法及装置与流程

文档序号:11138674阅读:684来源:国知局
一种网络访问的管理方法及装置与制造工艺

本发明涉及通信领域,尤其涉及一种网络访问的管理方法及装置。



背景技术:

近年来,随着互联网技术与移动通信技术的迅速发展,网络应用逐渐变得更加丰富,随之而来的,用户进行网络访问的方式也发生了巨大变化,从早期的用户仅能通过网页浏览访问网络,发展到如今用户可以通过包括网络搜索、邮件收发、论坛访问、即时通讯软件通讯、网络储存等一系列方式对网络进行访问。丰富的网络应用虽然能够为用户提供更丰富的网络内容并使用户访问网络更加便捷,但同时也带来了一系列的问题,例如当用户在禁止使用部分网络应用的场景下随意使用网络应用进行网络访问时,可能造成部分信息外泄或造成通信链路堵塞使网络访问效率降低。因此,网络运营商和网络管理员需要根据自身的需求对用户的网络访问进行管理。

通常情况下对网络访问进行管理,可以为当获取到网络访问的数据时,根据预先设定的管理方法从该网络访问的数据中提取需要的内容并进行解析以获取关键字段,以便于根据关键字段对该网络访问进行管理。其中,提取需要的内容以及对该内容进行解析的过程通常是和网络访问的类型强相关的,若网络访问的类型发生变更或同时存在多个类型的网络访问,那么上述预先设定的管理方法无法从网络访问的数据中提取相应的内容并进行相应的解析。虽然在出现上述问题时可以重新设定新的管理方法,但进行重新设定的过程往往耗时较多,并且也无法在同时存在多个类型的网络访问时,根据网络访问的数据获取与网络访问的类型对应的关键字段,从而降低了管理网络访问的效率,并损害了用户体验。



技术实现要素:

本申请提供一种网络访问的管理方法及装置,能够在同时存在多个类型的网络访问时,根据网络访问的数据获取与网络访问的类型对应的关键字段。

为达到上述目的,本申请采用如下技术方案:

第一方面,本发明的实施例提供了一种网络访问的管理方法,包括:获取网络访问的数据,并根据网络访问的数据确定与网络访问对应的数据流规则;根据数据流规则筛选解析函数,并根据筛选出的解析函数获取网络访问的数据中的关键字段,关键字段用于管理网络访问。

第二方面,本发明的实施例提供了一种网络访问的管理装置,包括:获取模块,被配置为获取网络访问的数据;处理模块,被配置为根据网络访问的数据确定与网络访问对应的数据流规则;处理模块还被配置为,根据数据流规则筛选解析函数,并根据筛选出的解析函数获取网络访问的数据中的关键字段,关键字段用于管理网络访问。

本发明的实施例提供了一种网络访问的管理方法及装置,通过确定与网络访问对应的数据流规则,并根据该数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段,由于该数据流规则可以筛选解析函数,并且被筛选的解析函数可以包括对应多个数据流规则的解析函数,因此即使同时存在多个类型的网络访问,本发明提供的网络访问的管理方法仍能够根据网络访问的数据获取与该网络访问的类型对应的关键字段,从而能够根据该关键字段管理该网络访问,因此提高了管理网络访问的效率,并改善了用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的实施例所提供的一种网络访问的管理方法的示意性流程图;

图2为本发明的另一实施例所提供的一种网络访问的管理方法的示意性流程图;

图3为本发明的实施例所提供的一种网络访问的管理装置的示意性结构图;

图4为本发明的另一实施例所提供的一种网络访问的管理装置的示意性结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。

近年来,随着互联网技术与移动通信技术的迅速发展,网络应用逐渐变得更加丰富,这使得人们上网的行为方式也发生了巨大变化,从早期的用户仅能通过网页浏览访问网络,发展到如今用户可以通过包括网络搜索、邮件收发、论坛访问、即时通讯软件通讯、网络储存等一系列方式对网络进行访问。而随着移动互联网时代的到来,这些应用的类型和数量以及网络用户在互联网上表现出来的行为更加趋于多样化。这种趋势在丰富了网络内容的同时,也带来了不少弊端,如企业机密信息外泄、员工工作效率降低等。因此,网络运营商和网络提供者对用户所进行的网络访问的管理已经成为越来越迫切的需求。这种需求意味着不仅需要识别用户的网络访问,更需要对网络访问中的非法行为进行控制。

网络访问管理技术在近几年的快速发展过程中,所能识别和控制的网络访问的数据日渐丰富。其中通过识别和记录网络层源目的网络协议(英文全称:Internet Protocol,英文简称:IP)信息、传输层协议、源目的端口信息等,能够做到事后有记录可查,同时结合内网IP地址可以划分或认证系统中的组织结构区分不同的用户类型,并且可以根据传输层源目的端口信息简单区分不同的应用类型,如超文本传输协议(英文全称:HyperText Transfer Protocol,英文简称:HTTP)、简单邮件传输协议(英文全称:Simple Mail Transfer Protocol,英文简称:SMTP)、文件传输协议(英文全称:File Transfer Protocol,英文简称:FTP)等,从而定制不同的上网行为策略。

统一资源定位符(英文全称:Uniform Resource Locator,英文简称:URL)是一种对从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。基本URL包含模式(或称协议)、服务器名称(或IP地址)、路径和文件名,如“协议://授权/路径?查询”。URL分类即是根据授权/路径字段区分出不同的应用类型,如新闻、论坛、邮箱、银行或者色情、赌博等非法类型。深度分组检测(英文全称:Deep Packet Inspection,英文简称:DPI)技术是相对普通报文检测而言的一种新的检测技术,即对网络第七层,也即应用层的内容(净荷)进行深度分析,从而根据应用层的净荷特征识别其应用类型或内容。如传统端口类型识别仅是根据传输层TCP协议的80端口识别出是HTTP协议的网页浏览应用,而DPI技术则能够根据HTTP协议载荷中的特征字符串,如mail.163.com(识别为网页邮箱),识别出具体应用类型。随着URL分类和DPI技术的发展,用户的普通网页浏览行为可以被近一步细分,识别出新闻类、科技类、社交类、邮箱类以及各种非法类别,非网页类应用,如游戏、办公、下载、视频等行为也可被进一步识别,借助应用层信息的细分,上网行为管理设备能够针对用户的不同行为定制策略,从而审计和控制上网用户的合法和非法行为。进一步的,针对同一种应用类型,用户的不同行为和行为内容要求可以被进一步细分,如社交微博类应用,从而区分出浏览、发帖、回复、附件上传等不同行为,例如邮箱类应用可以识别出发件人、收件人、邮件标题、正文、附件等,不同的行为内容能够匹配特定的特征库关键字,然后定义相应的放行或阻断策略。

尽管上网行为管理技术发展到今天,已经能够很精细地控制和管理用户的上网行为,但是随着WEB3.0和移动互联网时代的到来,上网行为管理技术开始面临各种新的挑战,各种应用发生了翻天覆地的变化(例如同一种应用可能出现了PC端、Android移动版、IOS移动版等不同形式),应用协议、数据格式也出现了大范围的更新和改变(例如传统WEB邮箱的附件形式逐步转变为网盘类的附件形式),应用的数量迅速发展,人们的要求不断提高(例如用户希望不仅能识别出某一行为的IP地址,而且希望能够知道这一行为的用户帐号、ID等虚拟身份信息)。面对这种局势,由于现有网络访问的管理方法在获取到网络访问的数据时会根据预先设定从该网络访问的数据中提取需要的字段并进行协议解析,以便于根据解析后的字段对该网络访问进行管理,其中提取需要的字段以及对字段进行协议解析的过程通常是和网络访问的类型强相关的,若网络访问的类型发生变更,那么上述网络访问的管理方法无法根据预先设定从类型发生变更后的网络访问的数据中提取相应的字段信息并进行相应的解析。虽然在出现上述问题时可以重新对所提取的字段以及用于解析的协议进行设定,但进行重新设定的过程往往耗时较多,降低了管理网络访问的效率,并损害了用户体验。

针对上述问题,本发明的实施例提供了一种网络访问的管理方法,能够根据网络访问的数据确定与网络访问对应的数据流规则,并根据该数据流规则提取并解析所提取的网络访问的数据中的关键字段,从而能够提取并解析不同类型的网络访问的数据中的关键字段,以便于根据该关键字段管理不同类型的网络访问,提高了管理网络访问的效率并改善了用户体验。

如附图1所示,本发明的实施例提供了一种网络访问的管理方法,其特征在于,包括:

101、获取网络访问的数据。

具体的,所述网络访问的数据可以为用户使用应用进行网络访问时,该应用与网络间交互的数据。示例性的,当用户通过新浪微博应用发布微博时,新浪微博应用向对应的服务器端所传输的数据可以被认为是网络访问的数据。

102、根据网络访问的数据确定与网络访问对应的数据流规则。

其中数据流规则用于指示网络访问的数据中的关键字段以及用于解析关键字段的解析协议。

具体的,根据网络访问的数据确定与网络访问对应的数据流规则,可以为根据网络访问的数据确定该网络访问对应的应用的类型,即通过该网络访问的数据进行网络访问的应用的类型,并确定与该类型对应的数据流规则。

网络访问的数据中的关键字段可以为网络访问的数据中特定的字段,数据流规则可以通过指示该特定字段的字段信息、数据类型(整型、字符型)或长度来指示该关键字段。解析关键字段的解析协议可以为能够将该关键字段解析为指定格式的协议。

示例性的,当网络访问为邮箱类型的应用所进行的网络访问时,数据流规则可以通过检索指定字符确定网络访问的数据中的特定字段例如发件人字段、收件人字段、标题字段、附件字段等,同时数据流规则还可以分别指定特定字段的数据类型(整型、字符型)或长度以便于进一步在网络访问的数据中确定特定字段。

进一步的,数据流规则所指示的特定字段可以包括三类,其中每一类特定字段需要能够指定数据类型(整型、字符型)和长度。为了保证描述信息的简洁,可以采用指示特定字段的类型和特定字段的长度前缀的方式,特定字段的长度通常可以预先设置好,不需要显示描述。

示例性的,特定字段可以包括应用关键字段、报文相关信息字段以及普通变量字段,其中,应用关键字段为需要进行审计存入数据库或者进行精细化策略控制的应用信息,例如论坛发帖的标题、正文等,示例性的,应用关键字段可以为:$str_title、$str_content。报文相关信息字段可以为链路层MAC地址信息、网络层IP地址信息、传输层协议、端口信息、应用层载荷、长度等,报文相关信息字段可视为常量,一般不做修改。示例性的,报文相关信息字段可以为:@str_smac、@int_sip、@int_proto、@int_sport、@str_payload、@int_payloadlen。普通变量字段可以为整型变量、字符串变量,普通变量字段一般作为关键字段提取过程中暂存信息使用,保存临时数据或计算结果,也可作为条件判断、循环控制的临时变量。示例性的,普通变量字段可以为int0、int1、str0、str1。

需要说明的是,数据流规则所指示的特定字段的长度可以根据数据流规则对应的网络访问类型的决定,例如报文相关信息字段的长度通常是固定,普通变量字段的长度能够被预先设定。本发明的实施例并不对数据流规则的组织形式进行具体限定,数据流规则的组织形式可以包括键值对、可扩展标记语言(英文全称:Extensible Markup Language,英文简称:XML)或JavaScript对象表示法(英文全称:JavaScript Object Notation,英文简称:JSON)等

103、根据数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段并对关键字段进行解析。

具体的,由于根据数据流规则可以获取用于获取所述网络访问的数据中的关键字段以及用于解析所述关键字段的解析协议,因此根据数据流规则筛选出的解析函数也可以理解为将数据流规则所指示的内容,该解析函数用于从对应的网络访问的数据中提取对应的关键字段并解析对应的关键字段,也可以理解将数据流规则所指示的处理逻辑进行抽象,定义出一个个语义独立的函数即筛选出的解析函数,该解析函数用于从对应的网络访问的数据中提取对应的关键字段并解析对应的关键字段。根据数据流规则筛选解析函数,可以为根据数据流规则从预设的多个解析函数中删选出需要的解析函数,该预设的多个解析函数可以认为包括与多个数据流规则对应的技术函数,筛选出的解析函数可以认为与网络访问对应,筛选出的解析函数可以从网络访问的数据中提取需要的数据并进行解析以获取解析后的关键字段,筛选出的解析函数也可以将网络访问的数据进行解析并从解析后的网络访问的数据中提取需要的部分以获取解析后的关键字段。

需要说明的是,获取独立的解析后的关键字段也可以被抽象为通过独立的解析函数实现,用于获取多个解析后的关键字段可以被认为包括一个或多个独立的解析函数的逻辑组合。

示例性的,筛选出的解析函数提取网络访问的数据中的需要的部分后,可以对所提取的部分进行URL解码以获取关键字段。

本发明的实施例提供了一种网络访问的管理方法,通过确定与网络访问对应的数据流规则,并根据该数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段并对关键字段进行解析,由于该数据流规则可以筛选解析函数,并且被筛选的解析函数可以包括对应多个数据流规则的解析函数,因此即使同时存在多个类型的网络访问,本发明提供的网络访问的管理方法仍能够根据网络访问的数据获取与该网络访问的类型对应的解析后的关键字段,从而能够根据该解析后的关键字段管理该网络访问,因此提高了管理网络访问的效率,并改善了用户体验。

具体的,如附图2所示,本发明的实施例提供了一种网络访问的管理方法,其特征在于,包括:

201、获取网络访问的数据。

具体内容参照上述实施例中步骤101,在此不再赘述。

202、确定网络访问的数据的应用节点,并根据应用节点在网络访问的数据中确定网络访问的数据的报文载荷。

203、将网络访问的数据的报文载荷与特征字符串进行匹配以确定与网络访问对应的数据流规则。

其中,特征字符串与数据流规则对应。

具体的,可以对网络访问的数据进行识别以确定该网络访问的类型,并根据该网络访问的类型查找应用结点哈希表以确定网络访问的数据的应用节点,并根据该应用节点在网络访问的数据中确定网络访问的数据的报文载荷。

将网络访问的数据的报文载荷与特征字符串进行匹配以确定与网络访问对应的数据流规则,可以为对网络访问的数据的应用层载荷部分进行特征字符串多模匹配,当网络访问的数据匹配中某一数据流规则对应的特征字符串后,确定该网络访问与该数据流规则对应。

更进一步的,当网络访问的数据匹配中某一数据流规则对应的特征字符串后,可以对网络访问的数据进行IP地址、传输层协议和端口的检查,以便于根据检测结果进一步确定是否命中该某一数据流规则,特征字符串还可以增加与或非的语义,以满足更复杂的筛选条件。若对网络访问的数据进行匹配的次数超过匹配报文数量仍然没有命中数据流规则,则放行网络访问的数据。

示例性的,当网络访问的类型为新浪微博时,可以确定网络访问的数据的应用节点,并根据应用节点在网络访问的数据中确定网络访问的数据的报文载荷,将网络访问的数据的报文载荷匹配新浪微博对应的数据流规则对应的特征字符串,如果命中“POST/aj/mblog/add”,则进一步匹配传输层协议、目的端口等信息,若进一步的匹配结果满足要求,则确认命中新浪微博发帖数据流规则,其它微博浏览类数据流则无法命中,避免进入应用关键字段提取的深度处理。

204、根据数据流规则筛选解析函数,并根据筛选出的解析函数获取网络访问的数据中的关键字段并进行解析。

具体内容参照上述实施例中步骤103。

进一步的,可以将完成获取解析后的关键字段的解析函数组合称为函数链,当网络访问的数据包含多个关键字段信息时,该网络访问对应的数据流规则可以用于指示多个函数链,其中每个关键字段可以均对应有特征字符串标识,特征字符串标识可以作为函数链执行的入口。根据与数据流规则对应的解析函数解析网络访问的数据以获取关键字段,可以为调用与数据流规则对应的函数链,然后遍历执行函数链下的解析函数,完成关键字段提取以及解析。其中函数链下的解析函数中,每个解析函数的代码实现是统一的,可以以指针的形式作为解析函数数据结构的成员,其它的成员可以包括解析函数要操作的参数结构体。每个解析函数的数据结构在其所属的函数链中可以拥有索引信息,当函数链执行时,会保存当前解析函数的索引信息,可以通过改变函数链的当前函数索引实现循环和条件判断等。

需要说明的是,可以在网络访问的数据中查找关键字段并通过与数据流规则对应的解析函数对关键字段进行解析。当确定网络访问的数据中不包括关键字段并且网络访问的数据为跨报文传输时,获取再次到来的所述网络访问的数据,并在获取再次到来的所述网络访问的数据中查找关键字段并通过与数据流规则对应的解析函数对查找到的关键字段进行解析。

具体的,由于在实际应用中,关键字段可能被分在多个网络访问的数据报文进行传输即网络访问的数据为跨报文传输,而网络访问的数据报文在传输中又存在乱序的情况,因此,可以将收到的网络访问的数据进行缓存,并在确定网络访问的数据中不包括关键字段并且网络访问的数据为跨报文传输时,等待再次到来的网络访问的数据,当获取再次到来的网络访问的数据时,在再次到来的网络访问的数据中查找关键字段并通过与数据流规则对应的解析函数对查找到的关键字段进行解析。其中确定网络访问的数据中不包括关键字段并且网络访问的数据为跨报文传输,可以为在网络访问的数据查找开始特征字符串,并将开始特征字符串和结束特征字符串之间的字段确定为关键字段,当在网络访问的数据查找到开始特征字符串但直至当前数据报文结束仍未查找到结束特征字符串,则确定网络访问的数据为跨报文传输。

示例性的,当网络访问的类型为新浪微博时,可以根据与新浪微博对应的数据流规则的特征字符串匹配网络访问的数据报文,当命中“&text=”时,依次执行数据流规则对应的函数链中的解析函数,读取“&text=”之后的信息存入$str_content动态映射后的应用关键字段数据结构,直到结束特征串标识“&”出现。若当前网络访问的数据报文读取结束仍未找到结束特征串,则说明出现跨报文情况,因此保存函数链的当前函数索引为读取字符串动作的索引,以及报文已经读取的长度等信息,函数链转为挂起状态。当该网络访问的下一个数据报文到来时,函数链从挂起状态恢复为运行状态,从之前保存的当前函数索引开始继续执行读取字符串动作,完成关键字段的提取及解析。

205、将解析后的关键字段储存为预设格式,预设格式与网络访问对应。

具体的,解析后的关键字段可以储存为指定的数据库记录以便于进一步审计,解析后的关键字段也可以作为精细化策略控制单元的输入。精细化策略控制单元可以根据解析后的关键字段是否包含非法信息进行阻断,也可以根据解析后的关键字段本身进行阻断,从而实现精细化行为管理。

本发明的实施例提供了一种网络访问的管理方法,通过确定与网络访问对应的数据流规则,并根据该数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段并进行解析,由于该数据流规则可以筛选解析函数,并且被筛选的解析函数可以包括对应多个数据流规则的解析函数,因此即使同时存在多个类型的网络访问,本发明的实施例仍能够根据网络访问的数据获取与该网络访问的类型对应的解析后的关键字段,从而能够根据该解析后的关键字段管理该网络访问,因此提高了管理网络访问的效率,并改善了用户体验。

如附图3所示,本发明的实施例提供了一种网络访问的管理装置301,其特征在于,包括:

获取模块302,被配置为获取网络访问的数据。

具体的,所述网络访问的数据可以为用户使用应用进行网络访问时,该应用与网络间交互的数据。示例性的,当用户通过新浪微博应用发布微博时,新浪微博应用向对应的服务器端所传输的数据可以被认为是网络访问的数据。

处理模块303,被配置为根据网络访问的数据确定与网络访问对应的数据流规则。

其中数据流规则用于指示网络访问的数据中的关键字段以及用于解析关键字段的解析协议。

具体的,根据网络访问的数据确定与网络访问对应的数据流规则,可以为根据网络访问的数据确定该网络访问对应的应用的类型,即通过该网络访问的数据进行网络访问的应用的类型,并确定与该类型对应的数据流规则。

网络访问的数据中的关键字段可以为网络访问的数据中特定的字段,数据流规则可以通过指示该特定字段的字段信息、数据类型(整型、字符型)或长度来指示该关键字段。解析关键字段的解析协议可以为能够将该关键字段解析为指定格式的协议。

示例性的,当网络访问为邮箱类型的应用所进行的网络访问时,数据流规则可以通过检索指定字符确定网络访问的数据中的特定字段例如发件人字段、收件人字段、标题字段、附件字段等,同时数据流规则还可以分别指定特定字段的数据类型(整型、字符型)或长度以便于进一步在网络访问的数据中确定特定字段。

进一步的,数据流规则所指示的特定字段可以包括三类,其中每一类特定字段需要能够指定数据类型(整型、字符型)和长度。为了保证描述信息的简洁,可以采用指示特定字段的类型和特定字段的长度前缀的方式,特定字段的长度通常可以预先设置好,不需要显示描述。

示例性的,特定字段可以包括应用关键字段、报文相关信息字段以及普通变量字段,其中,应用关键字段为需要进行审计存入数据库或者进行精细化策略控制的应用信息,例如论坛发帖的标题、正文等,示例性的,应用关键字段可以为:$str_title、$str_content。报文相关信息字段可以为链路层MAC地址信息、网络层IP地址信息、传输层协议、端口信息、应用层载荷、长度等,报文相关信息字段可视为常量,一般不做修改。示例性的,报文相关信息字段可以为:@str_smac、@int_sip、@int_proto、@int_sport、@str_payload、@int_payloadlen。普通变量字段可以为整型变量、字符串变量,普通变量字段一般作为关键字段提取过程中暂存信息使用,保存临时数据或计算结果,也可作为条件判断、循环控制的临时变量。示例性的,普通变量字段可以为int0、int1、str0、str1。

需要说明的是,数据流规则所指示的特定字段的长度可以根据数据流规则对应的网络访问类型的决定,例如报文相关信息字段的长度通常是固定,普通变量字段的长度能够被预先设定。本发明的实施例并不对数据流规则的组织形式进行具体限定,数据流规则的组织形式可以包括键值对、可扩展标记语言(英文全称:Extensible Markup Language,英文简称:XML)或JavaScript对象表示法(英文全称:JavaScript Object Notation,英文简称:JSON)等

处理模块303还被配置为,根据数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段并对关键字段进行解析,解析后的关键字段用于管理网络访问。

具体的,由于根据数据流规则可以获取用于获取所述网络访问的数据中的关键字段以及用于解析所述关键字段的解析协议,因此根据数据流规则筛选出的解析函数也可以理解为将数据流规则所指示的内容,该解析函数用于从对应的网络访问的数据中提取对应的关键字段并解析对应的关键字段,也可以理解将数据流规则所指示的处理逻辑进行抽象,定义出一个个语义独立的函数即筛选出的解析函数,该解析函数用于从对应的网络访问的数据中提取对应的关键字段并解析对应的关键字段。根据数据流规则筛选解析函数,可以为根据数据流规则从预设的多个解析函数中删选出需要的解析函数,该预设的多个解析函数可以认为包括与多个数据流规则对应的技术函数,筛选出的解析函数可以认为与网络访问对应,筛选出的解析函数可以从网络访问的数据中提取需要的数据并进行解析以获取解析后的关键字段,筛选出的解析函数也可以将网络访问的数据进行解析并从解析后的网络访问的数据中提取需要的部分以获取解析后的关键字段。

需要说明的是,获取独立的解析后的关键字段也可以被抽象为通过独立的解析函数实现,用于获取多个解析后的关键字段可以被认为包括一个或多个独立的解析函数的逻辑组合。

示例性的,筛选出的解析函数提取网络访问的数据中的需要的部分后,可以对所提取的部分进行URL解码以获取关键字段。

本发明的实施例提供了一种网络访问的管理装置,通过确定与网络访问对应的数据流规则,根据该数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段并对关键字段进行解析,由于该数据流规则可以筛选解析函数,并且被筛选的解析函数可以包括对应多个数据流规则的解析函数,因此即使同时存在多个类型的网络访问,本发明提供的网络访问的管理装置仍能够根据网络访问的数据获取与该网络访问的类型对应的解析后的关键字段,从而能够根据该解析后的关键字段管理该网络访问,因此提高了管理网络访问的效率,并改善了用户体验。

具体的,处理模块303具体被配置为:

确定网络访问的数据的应用节点,并根据应用节点在网络访问的数据中确定网络访问的数据的报文载荷,将网络访问的数据的报文载荷与特征字符串进行匹配以确定与网络访问对应的数据流规则,特征字符串与数据流规则对应。

具体的,可以对网络访问的数据进行识别以确定该网络访问的类型,并根据该网络访问的类型查找应用结点哈希表以确定网络访问的数据的应用节点,并根据该应用节点在网络访问的数据中确定网络访问的数据的报文载荷。

将网络访问的数据的报文载荷与特征字符串进行匹配以确定与网络访问对应的数据流规则,可以为对网络访问的数据的应用层载荷部分进行特征字符串多模匹配,当网络访问的数据匹配中某一数据流规则对应的特征字符串后,确定该网络访问与该数据流规则对应。

更进一步的,当网络访问的数据匹配中某一数据流规则对应的特征字符串后,可以对网络访问的数据进行IP地址、传输层协议和端口的检查,以便于根据检测结果进一步确定是否命中该某一数据流规则,特征字符串还可以增加与或非的语义,以满足更复杂的筛选条件。若对网络访问的数据进行匹配的次数超过匹配报文数量仍然没有命中数据流规则,则放行网络访问的数据。

示例性的,当网络访问的类型为新浪微博时,可以确定网络访问的数据的应用节点,并根据应用节点在网络访问的数据中确定网络访问的数据的报文载荷,将网络访问的数据的报文载荷匹配新浪微博对应的数据流规则对应的特征字符串,如果命中“POST/aj/mblog/add”,则进一步匹配传输层协议、目的端口等信息,若进一步的匹配结果满足要求,则确认命中新浪微博发帖数据流规则,其它微博浏览类数据流则无法命中,避免进入应用关键字段提取的深度处理。

具体的,处理模块303具体被配置为:

在网络访问的数据中查找关键字段并通过与数据流规则对应的解析函数对查找到的关键字段进行解析;

当确定已查找的网络访问的数据中不包括关键字段并且网络访问的数据为跨报文传输时,获取再次到来的网络访问的数据,并在再次到来的网络访问的数据中查找关键字段并通过与数据流规则对应的解析函数对查找到的关键字段进行解析。

具体的,由于在实际应用中,关键字段可能被分在多个网络访问的数据报文进行传输即网络访问的数据为跨报文传输,而网络访问的数据报文在传输中又存在乱序的情况,因此,可以将收到的网络访问的数据进行缓存,并在确定网络访问的数据中不包括关键字段并且网络访问的数据为跨报文传输时,等待再次到来的网络访问的数据,当获取再次到来的网络访问的数据时,在再次到来的网络访问的数据中查找关键字段并通过与数据流规则对应的解析函数对关键字段进行解析。其中确定网络访问的数据中不包括关键字段并且网络访问的数据为跨报文传输,可以为在网络访问的数据查找开始特征字符串,并将开始特征字符串和结束特征字符串之间的字段确定为关键字段,当在网络访问的数据查找到开始特征字符串但直至当前数据报文结束仍未查找到结束特征字符串,则确定网络访问的数据为跨报文传输。

可以将完成获取关键字段的解析函数组合称为函数链,当网络访问的数据包含多个关键字段信息时,该网络访问对应的数据流规则可以用于指示多个函数链,其中每个关键字段可以均对应有特征字符串标识,特征字符串标识可以作为函数链执行的入口。根据与数据流规则对应的解析函数解析网络访问的数据以获取解析后的关键字段,可以为调用与数据流规则对应的函数链,然后遍历执行函数链下的解析函数,完成关键字段提取以及解析。其中函数链下的解析函数中,每个解析函数的代码实现是统一的,可以以指针的形式作为解析函数数据结构的成员,其它的成员可以包括解析函数要操作的参数结构体。每个解析函数的数据结构在其所属的函数链中可以拥有索引信息,当函数链执行时,会保存当前解析函数的索引信息,可以通过改变函数链的当前函数索引实现循环和条件判断等。

示例性的,当网络访问的类型为新浪微博时,可以根据与新浪微博对应的数据流规则的特征字符串匹配网络访问的数据报文,当命中“&text=”时,依次执行数据流规则对应的函数链中的解析函数,读取“&text=”之后的信息存入$str_content动态映射后的应用关键字段数据结构,直到结束特征串标识“&”出现。若当前网络访问的数据报文读取结束仍未找到结束特征串,则说明出现跨报文情况,因此保存函数链的当前函数索引为读取字符串动作的索引,以及报文已经读取的长度等信息,函数链转为挂起状态。当该网络访问的下一个数据报文到来时,函数链从挂起状态恢复为运行状态,从之前保存的当前函数索引开始继续执行读取字符串动作,完成关键字段的提取及解析。

具体的,如附图4所示,网络访问的管理装置301还包括储存模块304;

所述处理模块303还被配置为:

控制储存模块304将解析后的关键字段储存为预设格式,预设格式与网络访问对应。

具体的,解析后的关键字段可以储存为指定的数据库记录以便于进一步审计,解析后的关键字段也可以作为精细化策略控制单元的输入。精细化策略控制单元可以根据解析后的关键字段是否包含非法信息进行阻断,也可以根据解析后的关键字段本身进行阻断,从而实现精细化行为管理。

本发明的实施例提供了一种网络访问的管理装置,通过确定与网络访问对应的数据流规则,并根据该数据流规则筛选解析函数,根据筛选出的解析函数获取网络访问的数据中的关键字段并进行解析,由于该数据流规则可以筛选解析函数,并且被筛选的解析函数可以包括对应多个数据流规则的解析函数,因此即使同时存在多个类型的网络访问,本发明的实施例仍能够根据网络访问的数据获取与该网络访问的类型对应的解析后的关键字段,从而能够根据该解析后的关键字段管理该网络访问,因此提高了管理网络访问的效率,并改善了用户体验。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括随机存储器(英文全称:Random Access Memory,英文简称:RAM)、只读存储器(英文全称:Read Only Memory,英文简称:ROM)、电可擦可编程只读存储器(英文全称:Electrically Erasable Programmable Read Only Memory,英文简称:EEPROM)、只读光盘(英文全称:Compact Disc Read Only Memory,英文简称:CD-ROM)或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户专线(英文全称:Digital Subscriber Line,英文简称:DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在计算机可读介质的定义中。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,当以软件方式实现本发明时,可以将用于执行上述方法的指令或代码存储在计算机可读介质中或通过计算机可读介质进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、ROM、电可擦可编程只读存储器(全称:electrically erasable programmable read-only memory,简称:EEPROM)、光盘、磁盘或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1