一种互联网账户信息挖掘的方法和装置的制造方法_3

文档序号:9865628阅读:来源:国知局
6]总积分排序模块:用于依据所述待测数据包的总积分从高到低的显示设定数量的待测数据包,待测时间段内所述待测数据包的总积分从高到低表明所述待测数据包中包含的待测互联网账户与已知互联网账户的相关程度从高到低。
[0097]进一步的,所述总积分计算模块,具体包括:
[0098]聚类积分添加模块:用于为IP地址聚类组中的每个待测数据包添加预设积分A;为入网账号聚类组中的每个待测数据包添加预设积分B;为互联网账户密码聚类组中的每个待测数据包添加预设积分C;
[0099]聚类积分计算模块:用于针对在待测时间段内采集的任一所述待测数据包,基于该待测数据包分别存在于IP地址聚类组、入网账号聚类组和互联网账户密码聚类组中添加的预设积分,计算得到该待测数据包的初始积分;
[0100]时间点积分模块:用于计算待测数据包时间点与样本数据包时间点的时间间隔,根据时间间隔为待测数据包添加对应的预设积分D,将待测数据包的预设积分D与初始积分相加,得到所述待测数据包的总积分。
[0101]本发明实施例中介绍的互联网账户信息挖掘的方法和装置,依据上网人的使用习惯、物理位置和使用设备特点进行多重互联网账户关联。通过入网账号,即可找到用户上网时的物理地址;通过一段时间内的IP地址就能找到用户上网时所使用的设备。本发明实施例中,能够有效的解决互联网中多重虚拟身份关联的问题,在解决互联网水军、垃圾邮件分检、犯罪分子多重虚拟身份挖掘等应用中,都能起到重要作用。
[0102]通过【具体实施方式】的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。
【主权项】
1.一种互联网账户信息挖掘的方法,其特征在于,包括: 步骤1:获取包含已知互联网账户信息的样本数据包的信息;所述样本数据包的信息包括:时间点和账户上网信息; 步骤2:在待测时间段内采集包含待测互联网账户信息的待测数据包,基于所述待测数据包的账户上网信息,对所述待测数据包进行聚类分组; 步骤3:根据所述待测数据包的聚类分组情况、以及所述待测数据包时间点与样本数据包时间点的时间间隔,确定出所述待测数据包中的待测互联网账户与已知互联网账户的相关程度。2.根据权利要求1所述的互联网账户信息挖掘的方法,其特征在于,所述账户上网信息,包括:互联网账户密码;或者, 所述账户上网信息,包括以下三种信息中的至少两种:IP地址、入网账号和互联网账户密码; 在所述步骤2中,基于所述待测数据包的账户上网信息,对所述待测数据包进行聚类分组,包括: 若待测数据包与样本数据包的IP地址相同,则把所述待测数据包存储到IP地址聚类组中;若待测数据包与样本数据包的入网账号相同,则把所述待测数据包存储到入网账号聚类组中;若待测数据包与样本数据包的互联网账户密码相同,则把所述待测数据包存储到互联网账户密码聚类组中。3.根据权利要求1所述的互联网账户信息挖掘的方法,其特征在于,所述步骤3,包括: 步骤31:根据所述待测数据包的聚类分组情况为所述待测数据包添加第一类预设积分;基于所述待测数据包时间点与样本数据包时间点的时间间隔,为所述待测数据包添加第二类预设积分;将所述第一类预设积分与所述第二类预设积分相加,得到所述待测数据包的总积分; 步骤32:依据所述待测数据包的总积分从高到低的显示设定数量的待测数据包,待测时间段内所述待测数据包的总积分从高到低表明所述待测数据包中包含的待测互联网账户与已知互联网账户的相关程度从高到低。4.根据权利要求3所述的互联网账户信息挖掘的方法,其特征在于,所述步骤31,包括: 步骤311:为IP地址聚类组中的每个待测数据包添加预设积分A;为入网账号聚类组中的每个待测数据包添加预设积分B;为互联网账户密码聚类组中的每个待测数据包添加预设积分C; 步骤312:针对在待测时间段内采集的任一所述待测数据包,基于该待测数据包分别存在于IP地址聚类组、入网账号聚类组和互联网账户密码聚类组中添加的预设积分,计算得到该待测数据包的初始积分; 步骤313:计算待测数据包时间点与样本数据包时间点的时间间隔,根据时间间隔为待测数据包添加对应的预设积分D,将待测数据包的预设积分D与初始积分相加,得到所述待测数据包的总积分。5.根据权利要求4所述的互联网账户信息挖掘的方法,其特征在于,所述步骤311中,预设积分AC预设积分B<预设积分C。6.根据权利要求4所述的互联网账户信息挖掘的方法,其特征在于,所述步骤312,包括: 若样本数据包中的账户上网信息为互联网账户密码,则该待测数据包的初始积分等于预设积分C; 若样本数据包中的账户上网信息为:IP地址、入网账号和互联网账户密码三种信息中的至少两种信息,则将该待测数据包中相应的所述至少两种信息的预设积分相加得到该待测数据包的初始积分。7.一种互联网账户信息挖掘的装置,其特征在于,包括: 样本信息模块:用于获取包含已知互联网账户信息的样本数据包的信息;所述样本数据包的信息包括:时间点和账户上网信息; 聚类分组模块:用于在待测时间段内采集包含待测互联网账户信息的待测数据包,基于所述待测数据包的账户上网信息,对各所述待测数据包进行聚类分组; 账户相关模块:用于根据所述待测数据包的聚类分组情况、以及所述待测数据包时间点与样本数据包时间点的时间间隔,确定出所述待测数据包中的待测互联网账户与已知互联网账户的相关程度。8.根据权利要求7所述的互联网账户信息挖掘的装置,其特征在于,所述账户上网信息,包括:互联网账户密码;或者,所述账户上网信息,包括以下三种信息中的至少两种:IP地址、入网账号和互联网账户密码; 所述聚类分组模块,具体用于: 若待测数据包与样本数据包的IP地址相同,则把所述待测数据包存储到IP地址聚类组中;若待测数据包与样本数据包的入网账号相同,则把所述待测数据包存储到入网账号聚类组中;若待测数据包与样本数据包的互联网账户密码相同,则把所述待测数据包存储到互联网账户密码聚类组中。9.根据权利要求7所述的互联网账户信息挖掘的装置,其特征在于,所述账户相关模块,包括: 总积分计算模块:用于根据所述待测数据包的聚类分组情况为所述待测数据包添加第一类预设积分;基于所述待测数据包时间点与样本数据包时间点的时间间隔,为所述待测数据包添加第二类预设积分;将所述第一类预设积分与所述第二类预设积分相加,得到所述待测数据包的总积分; 总积分排序模块:用于依据所述待测数据包的总积分从高到低的显示设定数量的待测数据包,待测时间段内所述待测数据包的总积分从高到低表明所述待测数据包中包含的待测互联网账户与已知互联网账户的相关程度从高到低。10.根据权利要求9所述的互联网账户信息挖掘的装置,其特征在于,所述总积分计算丰吴块,包括: 聚类积分添加模块:用于为IP地址聚类组中的每个待测数据包添加预设积分A;为入网账号聚类组中的每个待测数据包添加预设积分B;为互联网账户密码聚类组中的每个待测数据包添加预设积分C; 聚类积分计算模块:用于针对在待测时间段内采集的任一所述待测数据包,基于该待测数据包分别存在于IP地址聚类组、入网账号聚类组和互联网账户密码聚类组中添加的预设积分,计算得到该待测数据包的初始积分; 时间点积分模块:用于计算待测数据包时间点与样本数据包时间点的时间间隔,根据时间间隔为待测数据包添加对应的预设积分D,将待测数据包的预设积分D与初始积分相加,得到所述待测数据包的总积分。
【专利摘要】本发明提出了一种互联网账户信息挖掘的方法和装置,所述互联网账户信息挖掘的方法,包括:获取包含已知互联网账户信息的样本数据包的信息;所述样本数据包的信息包括:时间点和账户上网信息;在待测时间段内采集包含待测互联网账户信息的待测数据包,对所述待测数据包进行聚类分组;根据所述待测数据包的聚类分组情况、以及所述待测数据包时间点与样本数据包时间点的时间间隔,确定出所述待测数据包中的待测互联网账户与已知互联网账户的相关程度。本发明能快速准确的通过已知互联网账户,识别出与该互联网账户相关的其他互联网账户。在解决互联网水军、垃圾邮件分检、犯罪分子多重虚拟身份挖掘等应用中,都能起到重要作用。
【IPC分类】G06F17/30
【公开号】CN105630904
【申请号】CN201510962602
【发明人】安洋, 陈雪松, 代启亮, 李海静, 张养辉
【申请人】中国电子科技集团公司第十五研究所
【公开日】2016年6月1日
【申请日】2015年12月21日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1