Ip地理定位数据的挖掘方法及装置的制造方法_2

文档序号:8282400阅读:来源:国知局
生成所 述第=临时数据集;其中,所述第=临时数据集包括第一子数据集和第二子数据集;所述 第一子数据集包括各IP段号码和各IP段所对应的累积权值;所述第二子数据集包括各IP 段号码、各IP段对应的归属地信息和各IP段所对应的累积权值。
8. 根据权利要求7所述的IP地理定位数据的挖掘方法,其特征在于,所述确定所述第 =临时数据集中各IP段对应的综合可信度,并根据所述第=临时数据集和所述综合可信 度生成第四临时数据集,包括: 根据所述第=临时数据集确定所述第=临时数据集中各IP段对应的基数可信度CBip 和分布可信度CDip z。。。; 根据所述基数可信度CBip和分布可信度CD ip ,。。。确定所述综合可信度C ip,。。。: Cip zone - CB 化 *CDip_z〇ne 其中,所述b和d分别为预先设置的所述基数可信度和分布可信度的权重; 根据所述第=临时数据集中的IP段号码、各IP段对应的归属地信息W及各IP段对应 的所述综合可信度Cip ,。。。,生成所述第四临时数据集。
9. 根据权利要求8所述的IP地理定位数据的挖掘方法,其特征在于,根据所述第=临 时数据集确定所述第=临时数据集中各IP段对应的基数可信度CBip,包括:
其中Bip为所述第一子数据集中的各IP段所对应的累积权值;P为预先设置的算法参 数。
10. 根据权利要求8所述的IP地理定位数据的挖掘方法,其特征在于,根据所述第=临 时数据集确定所述第=临时数据集中各IP段对应的分布可信度CDip ,。。。,包括:
其中,所述S为预先设置的放大系数,所述Bip w。。为所述第二子数据集中的各IP段所 对应的累积权值。
11. 根据权利要求9或10所述的IP地理定位数据的挖掘方法,其特征在于,所述根据 一预先设置的可信度阔值与所述综合可信度,对第四临时数据集中的数据条目进行筛选, 生成IP地理定位数据的可信数据,包括: 判断所述综合可信度是否大于所述可信度阔值; 若所述综合可信度大于所述可信度阔值,则确定该综合可信度所对应的数据条目的数 据为可信数据; 若所述综合可信度小于等于所述可信度阔值,则删除该综合可信度所对应的数据条目 的数据。
12. -种IP地理定位数据的挖掘装置,其特征在于,包括: 数据集获取单元,用于获取IP地理定位数据库历史数据集W及金融系统归档日志数 据集; 第一临时数据集生成单元,用于将所述IP地理定位数据库历史数据集W及金融系统
归档日志数据集分别进行加权处理,并合并为一第一临时数据集; 第二临时数据集生成单元,用于根据一数据权值衰落时间窗口算法对所述第一临时数 据集进行处理,对第一临时数据集中的权值进行修正,生成一第二临时数据集;所述第二临 时数据集包括各单个IP地址; 第=临时数据集生成单元,用于根据所述各单个IP地址,将第二临时数据集中的数据 条目W IP段进行合并,形成第=临时数据集; 第四临时数据集生成单元,用于确定所述第=临时数据集中各IP段对应的综合可信 度,并根据所述第=临时数据集和所述综合可信度生成第四临时数据集; 可信数据生成单元,用于根据一预先设置的可信度阔值与所述综合可信度,对第四临 时数据集中的数据条目进行筛选,生成IP地理定位数据的可信数据。
13. 根据权利要求12所述的IP地理定位数据的挖掘装置,其特征在于,还包括: 外部数据接收单元,用于接收一 IP地理定位标准基础数据,并接收用户输入的IP地理 定位参考数据; IP地理定位最终数据生成单元,用于将所述IP地理定位标准基础数据、所述可信数据 和所述IP地理定位参考数据进行整合处理,形成IP地理定位最终数据。
14. 根据权利要求13所述的IP地理定位数据的挖掘装置,其特征在于,所述外部数据 接收单元接收的所述IP地理定位标准基础数据包括IP分配情况信息。
15. 根据权利要求14所述的IP地理定位数据的挖掘装置,其特征在于,所述外部数据 接收单元接收的所述IP地理定位最终数据包括各IP段与地理区域的对应关系表,所述对 应关系表包括;IP段对应的身份标识、IP段号码、IP段长度、归属地信息、更新时间、W及所 述综合可信度。
16. 根据权利要求15所述的IP地理定位数据的挖掘装置,其特征在于,所述第一临时 数据集生成单元生成的所述第一临时数据集包括单个IP地址、归属地信息、更新时间W及 权值。
17. 根据权利要求16所述的IP地理定位数据的挖掘装置,其特征在于,所述第二临时 数据集生成单元,具体用于: 获取当前时间与第一临时数据集中的更新时间的时间间隔刻度n ; 根据所述第一临时数据集中的权值H、所述时间间隔刻度n和一预先设置的衰弱系数 k,生成修正权值Hw: H(n) = H*k。 根据所述第一临时数据集中的单个IP地址、归属地信息和所述修正权值,生成所述第 二临时数据集。
18. 根据权利要求17所述的IP地理定位数据的挖掘装置,其特征在于,所述第=临时 数据集生成单元,具体用于: 根据一预先设置的IP段长度W及预先设置的IP段划分策略,确定各单个IP地址所在 的IP段; 将同一 IP段内的各单个IP地址所对应的修正权值叠加,生成各IP段所对应的累积权 值; 根据各IP段号码、各IP段所对应的累积权值W及各IP段对应的归属地信息,生成所 述第=临时数据集;其中,所述第=临时数据集包括第一子数据集和第二子数据集;所述 第一子数据集包括各IP段号码和各IP段所对应的累积权值;所述第二子数据集包括各IP 段号码、各IP段对应的归属地信息和各IP段所对应的累积权值。
19. 根据权利要求18所述的IP地理定位数据的挖掘装置,其特征在于,所述第四临时 数据集生成单元,具体用于: 根据所述第=临时数据集确定所述第=临时数据集中各IP段对应的基数可信度CBip 和分布可信度CDip ,。。。; 根据所述基数可信度CBip和分布可信度CD ip ,。。。确定所述综合可信度C ip,。。。: Cip_zone= CB ip'^*CDip_^〇ne"* 其中,所述b和d分别为预先设置的所述基数可信度和分布可信度的权重; 根据所述第=临时数据集中的IP段号码、各IP段对应的归属地信息W及各IP段对应 的所述综合可信度Cip ,。。。,生成所述第四临时数据集。
20. 根据权利要求19所述的IP地理定位数据的挖掘装置,其特征在于,所述第四临时 数据集生成单元,具体用于通过公式:
确定所述第=临时数据集中各IP段对应的基数可信度CBip;其中B ip为所述第一子数 据集中的各IP段所对应的累积权值;P为预先设置的算法参数。
21. 根据权利要求19所述的IP地理定位数据的挖掘装置,其特征在于,所述第四临时 数据集生成单元,具体用于通过公式:
确定所述第=临时数据集中各IP段对应的分布可信度CDip ,。。。;其中,所述S为预先设 置的放大系数,所述Bip w。。为所述第二子数据集中的各IP段所对应的累积权值。
22. 根据权利要求20或21所述的IP地理定位数据的挖掘装置,其特征在于,所述可信 数据生成单元,具体用于: 判断所述综合可信度是否大于所述可信度阔值; 在判断到所述综合可信度大于所述可信度阔值时,确定该综合可信度所对应的数据条 目的数据为可信数据; 在判断到所述综合可信度小于等于所述可信度阔值时,删除该综合可信度所对应的数 据条目的数据。

【专利摘要】本发明实施例公开了一种IP地理定位数据的挖掘方法及装置,涉及数据挖掘技术领域,方法包括:获取IP地理定位数据库历史数据集以及金融系统归档日志数据集;分别进行加权处理,合并为一第一临时数据集;根据一数据权值衰落时间窗口算法对第一临时数据集进行处理,对第一临时数据集中的权值进行修正,生成一第二临时数据集;将第二临时数据集中的数据条目以IP段进行合并,形成第三临时数据集;确定第三临时数据集中各IP段对应的综合可信度,并生成第四临时数据集;根据一预先设置的可信度阈值与综合可信度,对第四临时数据集中的数据条目进行筛选,生成IP地理定位数据的可信数据。本发明能够解决当前的IP地理定位数据库可靠性差,难以更新的问题。
【IPC分类】G06F17-30
【公开号】CN104598580
【申请号】CN201510018295
【发明人】蒋家棠, 张爽, 敦宏程, 关靖远, 王贵智
【申请人】中国工商银行股份有限公司
【公开日】2015年5月6日
【申请日】2015年1月14日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1