一种互联网账户信息挖掘的方法和装置的制造方法_2

文档序号:9865628阅读:来源:国知局
[0046]具体的,所述时间点为产生任一数据包的时间;
[0047]所述账户上网信息,包括:互联网账户密码;或者,
[0048]所述账户上网信息,包括以下三种信息中的至少两种:IP地址、入网账号和互联网账户密码。
[0049]步骤S102:在待测时间段内采集包含待测互联网账户信息的待测数据包,基于所述待测数据包的账户上网信息,对所述待测数据包进行聚类分组;
[0050]具体的,所述步骤S102中,基于所述待测数据包的账户上网信息,对所述待测数据包进行聚类分组,包括:
[0051]若待测数据包与样本数据包的IP地址相同,则把所述待测数据包存储到IP地址聚类组中;若待测数据包与样本数据包的入网账号相同,则把所述待测数据包存储到入网账号聚类组中;若待测数据包与样本数据包的互联网账户密码相同,则把所述待测数据包存储到互联网账户密码聚类组中;同一个待测数据包可能同时被存储到一个或多个聚类组中。
[0052]步骤S103:根据所述待测数据包的聚类分组情况、以及所述待测数据包时间点与样本数据包时间点的时间间隔,确定出所述待测数据包中的待测互联网账户与已知互联网账户的相关程度;
[0053]具体的,所述步骤S103,包括:
[0054]步骤Al:根据所述待测数据包的聚类分组情况为所述待测数据包添加第一类预设积分;基于所述待测数据包时间点与样本数据包时间点的时间间隔,为所述待测数据包添加第二类预设积分;将所述第一类预设积分与所述第二类预设积分相加,得到所述待测数据包的总积分;
[0055]进一步的,所述步骤Al,包括:
[0056]步骤AU:为IP地址聚类组中的每个待测数据包添加预设积分A;为入网账号聚类组中的每个待测数据包添加预设积分B;为互联网账户密码聚类组中的每个待测数据包添加预设积分C;
[0057]更进一步的,所述步骤All中,预设积分六<预设积分8<预设积分C;
[0058]步骤A12:针对在待测时间段内采集的任一所述待测数据包,基于该待测数据包分别存在于IP地址聚类组、入网账号聚类组和互联网账户密码聚类组中添加的预设积分,计算得到该待测数据包的初始积分;
[0059]更进一步的,所述步骤A12,包括:
[0060]若样本数据包中的账户上网信息为互联网账户密码,则该待测数据包的初始积分等于预设积分C;
[0061]若样本数据包中的账户上网信息为:IP地址、入网账号和互联网账户密码三种信息中的至少两种信息,则将该待测数据包中相应的所述至少两种信息的预设积分相加得到该待测数据包的初始积分;
[0062]步骤Al3:计算待测数据包时间点与样本数据包时间点的时间间隔,根据时间间隔为待测数据包添加对应的预设积分D,将待测数据包的预设积分D与初始积分相加,得到所述待测数据包的总积分;
[0063]步骤A2:依据所述待测数据包的总积分从高到低的显示设定数量的待测数据包,待测时间段内所述待测数据包的总积分从高到低表明所述待测数据包中包含的待测互联网账户与已知互联网账户的相关程度从高到低;
[0064]优选的,在步骤A2中,所述设定数量为一个,即显示总积分最高的那个待测数据包,该总积分最高的待测数据包中所包含的待测互联网账户与已知互联网账户的相关程度最高。
[0065]本发明第二实施例,一种互联网账户信息挖掘的方法,如图2所示,包括以下具体步骤:
[0066]步骤S201:获取包含已知互联网账户信息的样本数据包的信息;将满足配置文件基本要求的样本数据包的信息进行存储;
[0067]具体的,所述步骤S201,包括:
[0068]步骤B1:获取包含已知互联网账户信息的样本数据包的信息;
[0069]步骤B2:加载配置文件,读取配置文件中对样本数据包的基本要求;
[0070]所述配置文件要求样本数据包中必须包括特征信息;所述特征信息包括:1P地址、入网账号、互联网账户密码、时间点、协议种类和应用种类;
[0071]步骤B3:判断所述样本数据包是否满足配置文件的基本要求:
[0072]若是,则将所述样本数据包的信息进行存储;
[0073]若否,则删除所述样本数据包,用户输入新的样本数据包重新执行步骤BI。
[0074]步骤S202:在待测时间段内采集包含待测互联网账户信息的待测数据包,基于所述待测数据包的信息,对所述待测数据包进行聚类分组;
[0075]具体的,所述基于所述待测数据包的信息,对所述待测数据包进行聚类分组,包括:
[0076]若待测数据包与样本数据包的IP地址相同,则把所述待测数据包存储到IP地址聚类组中;若待测数据包与样本数据包的入网账号相同,则把所述待测数据包存储到入网账号聚类组中;若待测数据包与样本数据包的互联网账户密码相同,则把所述待测数据包存储到互联网账户密码聚类组中;同一个待测数据包可能同时被存储到一个或多个聚类组中。
[0077]步骤S203:为IP地址聚类组中的每个待测数据包添加4分;为入网账号聚类组中的每个待测数据包添加5分;为互联网账户密码聚类组中的每个待测数据包添加6分;将一个待测数据包在IP地址聚类组、ADSL账号聚类组和账户密码聚类组中的积分相加,得到所述待测数据包的初始积分。
[0078]步骤S204:计算待测数据包时间点与样本数据包时间点的时间间隔,根据所述时间间隔得到所述待测数据包的总积分;
[0079]具体的,所述根据所述时间间隔得到所述待测数据包的总积分,包括:
[0080]若待测数据包时间点与样本数据包时间点的时间间隔小于等于5分钟,则给所述待测数据包的初始积分加10分,得到所述待测数据包的总积分;
[0081 ]若待测数据包时间点与样本数据包时间点的时间间隔小于等于30分钟,则给所述待测数据包的初始积分加9分,得到所述待测数据包的总积分;
[0082]若待测数据包时间点与样本数据包时间点的时间间隔小于等于24小时,则给所述待测数据包的初始积分加8分,得到所述待测数据包的总积分;
[0083]若待测数据包时间点与样本数据包时间点的时间间隔小于等于48小时,则给所述待测数据包的初始积分加7分,得到所述待测数据包的总积分;
[0084]若待测数据包时间点与样本数据包时间点的时间间隔大于48小时,则所述待测数据包的初始分数即为总积分。
[0085]步骤S205:显示总积分最高的那个待测数据包,该总积分最高的待测数据包中所包含的待测互联网账户与已知互联网账户的相关程度最高。
[0086]本发明第三实施例,与第一实施例对应的介绍一种互联网账户信息挖掘的装置,如图3所示,包括以下组成部分:
[0087]I)样本信息模块301:用于获取包含已知互联网账户信息的样本数据包的信息;所述样本数据包的信息包括:时间点和账户上网信息;
[0088]具体的,所述账户上网信息,包括:互联网账户密码;或者,
[0089]所述账户上网信息,包括以下三种信息中的至少两种:IP地址、入网账号和互联网账户密码;
[0090]2)聚类分组模块302:用于在待测时间段内采集包含待测互联网账户信息的待测数据包,基于所述待测数据包的账户上网信息,对各所述待测数据包进行聚类分组;
[0091 ]具体的,聚类分组模块302,具体用于:
[0092]若待测数据包与样本数据包的IP地址相同,则把所述待测数据包存储到IP地址聚类组中;若待测数据包与样本数据包的入网账号相同,则把所述待测数据包存储到入网账号聚类组中;若待测数据包与样本数据包的互联网账户密码相同,则把所述待测数据包存储到互联网账户密码聚类组中。
[0093]3)账户相关模块303:用于根据所述待测数据包的聚类分组情况、以及所述待测数据包时间点与样本数据包时间点的时间间隔,确定出所述待测数据包中的待测互联网账户与已知互联网账户的相关程度。
[0094]具体的,账户相关模块303,具体包括:
[0095]总积分计算模块:用于根据所述待测数据包的聚类分组情况为所述待测数据包添加第一类预设积分;基于所述待测数据包时间点与样本数据包时间点的时间间隔,为所述待测数据包添加第二类预设积分;将所述第一类预设积分与所述第二类预设积分相加,得到所述待测数据包的总积分;
[009
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1