自动构建网络个人身份库的方法

文档序号:7971577阅读:255来源:国知局

专利名称::自动构建网络个人身份库的方法
技术领域
:本发明涉及一种网络安全技术,尤其涉及一种自动构建网络个人身份库的方法。
背景技术
:随着互联网的发展,基于网络的应用和用户都呈现出爆炸式增长,而且同一个网络用户可能在不同网络应用中使用多个不同的身份标识,这为网络监管提出了严竣的挑战。对此,现有的技术方案是通常是网络实名制和网络个人身份库等。但由于各种原因暂时无法全面推广网络实名制,网民可以在网上进行各种匿名的行为,这使得追查十分困难。而网络个人身份库在网络监管方面具有较好的应用前景,但是目前构建网络个人身份库仍是基于人工登记录入的方式。显然,这样一种方式不仅无法支持大范围、多层次网络用户的海量数据的录入与整理,也无法实现网络个人身份库的实时更新与维护,因而也无法满足全面、及时的网络监管要求。
发明内容本发明的目的在于解决上述问题,提供一种自动构建网络个人身份库的方法,为全面及时的网络监管提供技术支撑。本发明的技术方案为本发明提供了一种自动构建网络个人身份库的方法,包括a.待处理信息的准备,筛选网M入信息与网络应用使用信息;b.将网络接入信息与网络应用使用信息进行地址和时间上的关联处理,得到若干个网络身份标识归集;c.将所得到的网络身份标识归集插入到网络个人身份库中。上述的自动构建网络个人身份库的方法,其中,步骤b进一步包括(1)网络接入信息与网络应用使用信息进行地址关联处理,得到若干个网络应用使用记录子集和若干个网络身份标识归集;(2)依据网络接入信息将该些网络应用使用记录子集中的网络应用使用记录进行时间关联处理;(3)从相关联的网络应用使用记录得到若干个网络身份标识归集。上述的自动构建网络个人身份库的方法,其中,步骤a的预处理是通过检查筛选使构成该些网络接入信息的每条网络接入记录至少包括网络接入设备标识、用户分配地址和用户在线时段;构成该些网络应用使用信息的每条网络应用使用记录至少包括网络应用标识、访问身份标识、访问地址和访问时间。上述的自动构建网络个人身份库的方法,其中,步骤b中的步骤(l)进一步包括根据访问地址对所有该些网络应用使用记录进行分组;对于任一组访问地址相同的网络应用使用记录,如果存在一条用户分配地址与该访问地址相同的网络接入记录,则该组网络应用使用记录构成一个网络应用使用记录子集;否则,该组中的各条网络应用使用记录包含的网络应用标识和访问身份标识构成一个网络身份标识归集{(AID,UID)},其中AID表示网络应用标识,UID表示访问身份标识。上述的自动构建网络个人身份库的方法,其中,步骤b中的步骤(2)进一步包括对于该些网络应用使用记录子集,判断每个网络应用使用记录子集中的每两条网络应用使用记录的访问时间是否落在同一条网络接入记录中的用户在线时段之间,如果是则该两条网络应用使用记录相关联,否则该两条网络应用使用记录不相关联。上述的自动构建网络个人身份库的方法,其中,步骤b中的步骤(3)进一步包括对于每组相关联的网络应用使用记录,将每条网络应用使用记录的网络应用标识AIDn和访问身份标识UIDn构成二元组(AIDn,UIDn),并经过去冗余处理得到网络身份标识归集"AIDn,UIDn)In>1}。上述的自动构建网络个人身份库的方法,其中,步骤c进一步包括对于每个网络身份标识归集((AIDn,UIDn)In>l},作如下操作将其插入网络个人身份库对于首个身份标识(AID!,UIIW,如果网络个人身份库中已存有此身份标识,将该网络身份标识归集KAIDn,UIDn)In>1}合并到网络个人身份库中该身份标识所属的网络身份标识归集;否则,在网络个人身份库中创建该网络身份标识归集{(AIDn,UIDn)|n>l};依次检查其它身份标识(AIDn,UIDn)(n>2),如果身份标识(AIDn,UIDn)(n>2)还存在于网络个人身份库中其它的网络身份标识归集,将该身份标识所属的这两个网络身份标识归集合并。本发明对比现有技术有如下的有益效果本发明对经预处理的网络监听设备提供的网络接入信息与网络应用使用信息作关联分析,将一次上下线过程中同一个地址所对应的所有网络应用的身份标识归为同一个网络用户所使用的标识,实现对应于同一个网络用户的不同网络身份标识的归集,从而完成网络个人身份库的自动构建。与现有技术相比,不仅可以支持大范围、多层次网络用户的海量数据的录入与整理,也实现了网络个人身份库的实时更新与维护,为全面、及时的网络监管提供坚实的技术支撑。图1是本发明的自动构建网络个人身份库的方法的一个较佳实施例的流程图。具体实施方式下面结合附图和实施例对本发明作进一步的描述。图1示出了本发明的自动构建网络个人身份库的方法的一个较佳实施例的流程。请参见图l,下面结合一具体实例对该方法流程中的各步骤进行详细的描述。数据源说明本发明所用到的网络应用使用信息和网络接入信息,均可以通过现有设备采集并经过现有技术预处理得。假设在本实施例中,所使用的网络应用使用信息如网络应用使用信息表1所示<table>tableseeoriginaldocumentpage7</column></row><table>假设在本实施例中,所使用的网络接入信息如网络接入信息表2所示:<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table>步骤Sl:检查网络应用使用信息表1,删除记录字段不全的网络应用使用记录,确保每条网络应用使用记录至少包括网络应用标识AID、访问身份标识UID、访问地址Add和访问时间Time,得到网络应用使用信息表3。同时检查网!^姿入信息表2,删除记录字段不全的网络接入记录,确保每条网^l妄入记录至少包括网络接入设备标识AEID、用户分配地址ADD和用户在线时段DUR,得到网络接入信息表4。根据上述的方式,得到网络应用使用信息表3:<table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table>同时得到网络接入信息表4:<table>tableseeoriginaldocumentpage9</column></row><table>步骤S2:将网络接入信息与网络应用使用信息进行地址关联处理。具体地说,根据访问地址对网络应用使用信息表3中的所有网络应用使用记录进行分组;对于任一组访问地址Add相同的网络应用使用记录,如果存在一条用户分配地址ADD与该访问地址Add相同的网络接入记录,则该组网络应用使用记录构成一个网络应用使用记录子集;否则,该组中的各条网络应用使用记录包含的网络应用标识和访问身份标识构成一个网络身份标识归集{(AID,UID)}。由此得到若干个网络应用使用记录子集网络应用使用记录子集1:UIDAIDAddTimechenjie518hotmail.com210.221.85.1212006-05-2209:31:187208100qq.com210.221.85.1212006-05-2209:34:0840917195qq.com210.221.85.1212006-05-2209:35:53网络应用使用记录子集2:UIDAIDAddTimexiaycnhotmail.com222.217.33.1782006-05-2209:32:588169293qq.com222.217.33.1782006-05-2209:34:38网络应用使用记录子集3:■AIDAddTimeshihsinal1msn.com210.56.188.182006-05-2209:32:44196621189qq.com210.56.188.182006-05-2209:34:16并得到如下的网络身份标识归集{(qq.com,93430153)}、Uqq.com,48973396)}、{(qq.com,11140676)}和{(hotmai1.com,rouzheng)}。步骤S3:依据网络接入信息将网络应用使用记录子集中的网络应用使用记录进行时间关联处理。具体地说,对于网络应用使用记录子集1、2和3,判断每个网络应用使用记录子集中的每两条网络应用使用记录的访问时间Timel和Time2是否落在同一条网络接入记录中的用户在线时段DUR之间,如果是则该两条网络应用使用记录相关联,否则该两条网络应用使用记录不相关联。由此得到网络应用使用记录的若干个关联组:关联组1:<table>tableseeoriginaldocumentpage11</column></row><table>关联组2:<table>tableseeoriginaldocumentpage11</column></row><table>关联组3:<table>tableseeoriginaldocumentpage11</column></row><table>关联组4:<table>tableseeoriginaldocumentpage11</column></row><table>步骤S4:从相关联的网络应用使用记录得到网络身份标识归集。具体地说,对于每组相关联的网络应用使用记录,将每条网络应用使用记录的网络应用标识AIDn和访问身份标识UIDn构成二元组(AIDn,UIDn),并经过去冗余处理,得到网络身份标识归集((AIIX,UIDn)In>l}。由此得到如下的网络身份标识归集Khotmail.com,chenjie518),(qq.com,7208100),(qq.com,40917195)}、{(hotmail.com,xiaycn))、{(qq.com,8169293)}和{(msn.com,shihainall),(qq.com,196621189)}。步骤S5:将所得到的网络身份标识归集插入到网络个人身份库中。具体的插入方法为(1)对于首个身份标识(AID,,UIDi),如果网络个人身份库中已存有此身份标识,将该网络身份标识归集KAIDn,UIDJ|11>1}合并到网络个人身份库中该身份标识所属的网络身份标识归集;否则,在网络个人身份库中创建该网络身份标识归集UAIDn,线)In>l}。(2)依次检查其它身份标识(AIDn,UID。)(02),如果身份标识(AID。,UIDn)(n>2)还存在于网络个人身份库中其它的网络身份标识归集,将该身份标识所属的这两个网络身份标识归集合并。在本实例中,经过上述步骤Sl-S4的处理,得到如下网络身份标识归集"hotmail.com,chenjie518),(qq.com,7208100),(qq.com,40917195)}、{(hotmail.com,xiaycn))、{(qq.com,8169293)}、{(msn.com,shihainall),(qq.com,196621189)}、{(qq.com,93430153)}、{(qq.com,48973396)}、{(qq.com,11140676)}和{(hotmail.com,rouzheng)}。假设已有网络个人身份库,现截取该网络个人身份库中与上述网络身份标识相关的i己录,如表6所示<table>tableseeoriginaldocumentpage12</column></row><table>在表6中,一条记录所包括的所有(AIDn,UIDn)构成一个网络身份标识归集,其对应的SeqID用作该归集在网络个人身份库中的唯一编号,这里已略去。为了节省空间,在表6中删除了中间不相关记录,并使得所有的记录相邻。下面以网络身份标识归集((hotmail.com,chenjie518),(qq.com,7208100),(qq.com,40917195)}为例,介绍这一插入过程(1)对于身份标识(hotmail.com,chenjie518),发现已经存在于网络个人身份库中,故将此网络身份标识归集合并到网络个人身份库中(hotniail.com,chenjie518)所属的网络身份标识归集{(hotmail.com,chenjie518),(yahoo.com.cn,cj8868)h因此在网络个人身份库中有对应新生成的网络身份标识归集的记录SeqID(AID,,UID,)(AID2,跳)(AID4,跳)(AID5,UID5)xxxxxxxxxxx(hotmail.com,chenjie518)(yahoo,com.cn,cj8868)(qq.com,7208100)(qq.com,40917195)null(2)依次检查身份标识,发现均未出现在该网络个人身份库的其它网络标识归集中,故该归集的插入过程结束。对于上述其它网络身份标识归集完成类似的在网络个人身份库中的插入过程,得到新的网络个人身份库,修改部分如表7所示<table>tableseeoriginaldocumentpage13</column></row><table>从上述的实施例可知,从最初的待处理信息检查,到记录的关联处理,以及最后的网络身份标识归集的插入,均可以自动完成,而无需人工介入或操作,这对于大范围、多层次网络用户的海量数据的录入与整理非常有效。而且,在网络身份标识归集的插入过程中由于信息不全等原因导致的同一个网络用户所使用的网络身份标识没有归入同一个归集或没有完全纳入网络个人身份库等问题,在后续的网络个人身份库的实时更新与维护中得到逐步解决。因此,与手工登记录入网络个人身份库的构建方法相比,本发明具有实质性特点和显著进步。上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。权利要求1.一种自动构建网络个人身份库的方法,包括a.待处理信息的准备,筛选网络接入信息与网络应用使用信息;b.将网络接入信息与网络应用使用信息进行地址和时间上的关联处理,得到若干个网络身份标识归集;c.将所得到的网络身份标识归集插入到网络个人身份库中。全文摘要本发明公开了一种自动构建网络个人身份库的方法,为全面及时的网络监管提供技术支撑。其技术方案为该方法包括待处理信息的准备,筛选网络接入信息与网络应用使用信息;将网络接入信息与网络应用使用信息进行地址和时间上的关联处理,得到若干个网络身份标识归集;将所得到的网络身份标识归集插入到网络个人身份库中。本发明应用于网络安全监管领域。文档编号H04L12/24GK101212337SQ20061014872公开日2008年7月2日申请日期2006年12月30日优先权日2006年12月30日发明者吴承荣,远张,张世永,谢剑峰,巍郭申请人:上海复旦光华信息科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1