Ip地理定位数据的挖掘方法及装置的制造方法

文档序号:8282400阅读:396来源:国知局
Ip地理定位数据的挖掘方法及装置的制造方法
【技术领域】
[0001] 本发明涉及数据挖掘技术领域,尤其涉及一种IP地理定位数据的挖掘方法及装 置。
【背景技术】
[0002] IP地理定位数据库是将虚拟的计算机网络世界与现实世界建立起关联关系,被广 泛应用于互联网应用产业中的重要数据库。随着计算机技术和金融行业的发展,IP地理定 位技术在金融领域的应用也越来越广泛。在金融领域中,IP地理定位数据库在网银安全提 示、可疑业务监控、安全事件分析、业务优化挖掘等多个方面都有较为重要的作用。例如,在 电子银行业务的诈骗等案件中,绝大多数都存在犯罪分子在非客户所在地登录客户电子银 行并进行交易操作的情况。因此建立准确的IP地理定位数据库十分必要。
[0003] 当前,在金融领域中,各种金融运行商(如银行等)均具有自己的IP地理定位数 据库,但当前的IP地理定位数据库大多需要靠金融用户主动反馈或者从外部导入其他数 据库的数据,可靠性较差,且IP地理定位数据难以更新。

【发明内容】

[0004] 本发明的实施例提供一种IP地理定位数据的挖掘方法及装置,以解决当前的IP 地理定位数据库大多需要靠金融用户主动反馈或者从外部导入其他数据库的数据,可靠性 较差,且IP地理定位数据难以更新的问题。
[0005] 为达到上述目的,本发明采用如下技术方案:
[0006] 一种IP地理定位数据的挖掘方法,包括:
[0007] 获取IP地理定位数据库历史数据集以及金融系统归档日志数据集;
[0008] 将所述IP地理定位数据库历史数据集以及金融系统归档日志数据集分别进行加 权处理,并合并为一第一临时数据集;
[0009] 根据一数据权值衰落时间窗口算法对所述第一临时数据集进行处理,对第一临时 数据集中的权值进行修正,生成一第二临时数据集;所述第二临时数据集包括各单个IP地 址;
[0010] 根据所述各单个IP地址,将第二临时数据集中的数据条目以IP段进行合并,形成 第三临时数据集;
[0011] 确定所述第三临时数据集中各IP段对应的综合可信度,并根据所述第三临时数 据集和所述综合可信度生成第四临时数据集;
[0012] 根据一预先设置的可信度阈值与所述综合可信度,对第四临时数据集中的数据条 目进行筛选,生成IP地理定位数据的可信数据。
[0013] 进一步的,所述IP地理定位数据的挖掘方法,还包括:
[0014] 接收一 IP地理定位标准基础数据,并接收用户输入的IP地理定位参考数据;
[0015] 将所述IP地理定位标准基础数据、所述可信数据和所述IP地理定位参考数据进 行整合处理,形成IP地理定位最终数据。
[0016] 具体的,所述IP地理定位标准基础数据包括IP分配情况信息。
[0017] 具体的,所述IP地理定位最终数据包括各IP段与地理区域的对应关系表,所述对 应关系表包括:IP段对应的身份标识、IP段号码、IP段长度、归属地信息、更新时间、以及所 述综合可信度。
[0018] 具体的,所述第一临时数据集包括单个IP地址、归属地信息、更新时间以及权值。
[0019] 此外,所述根据一数据权值衰落时间窗口算法对所述第一临时数据集进行处理, 对第一临时数据集中的权值进行修正,生成一第二临时数据集,包括:
[0020] 获取当前时间与第一临时数据集中的更新时间的时间间隔刻度η ;
[0021] 根据所述第一临时数据集中的权值Η、所述时间间隔刻度η和一预先设置的衰弱 系数k,生成修正权值Η (η):
[0022] H(n)=H*kn
[0023] 根据所述第一临时数据集中的单个IP地址、归属地信息和所述修正权值,生成所 述第二临时数据集。
[0024] 此外,根据所述各单个IP地址,将第二临时数据集中的数据条目以IP段进行合 并,形成第三临时数据集,包括:
[0025] 根据一预先设置的IP段长度以及预先设置的IP段划分策略,确定各单个IP地址 所在的IP段;
[0026] 将同一 IP段内的各单个IP地址所对应的修正权值叠加,生成各IP段所对应的累 积权值;
[0027] 根据各IP段号码、各IP段所对应的累积权值以及各IP段对应的归属地信息,生 成所述第三临时数据集;其中,所述第三临时数据集包括第一子数据集和第二子数据集; 所述第一子数据集包括各IP段号码和各IP段所对应的累积权值;所述第二子数据集包括 各IP段号码、各IP段对应的归属地信息和各IP段所对应的累积权值。
[0028] 具体的,所述确定所述第三临时数据集中各IP段对应的综合可信度,并根据所述 第三临时数据集和所述综合可信度生成第四临时数据集,包括:
[0029] 根据所述第三临时数据集确定所述第三临时数据集中各IP段对应的基数可信度 CBil^p分布可信度⑶ ip-zone,
[0030] 根据所述基数可信度CBip和分布可信度⑶ip z_确定所述综合可信度C ip z_:
[0031] Cip-ZQne= CB ipb*Q)ip-zoned
[0032] 其中,所述b和d分别为预先设置的所述基数可信度和分布可信度的权重;
[0033] 根据所述第三临时数据集中的IP段号码、各IP段对应的归属地信息以及各IP段 对应的所述综合可信度C ip z_,生成所述第四临时数据集。
[0034] 此外,根据所述第三临时数据集确定所述第三临时数据集中各IP段对应的基数 可信度CB ip,包括:
【主权项】
1. 一种IP地理定位数据的挖掘方法,其特征在于,包括: 获取IP地理定位数据库历史数据集W及金融系统归档日志数据集; 将所述IP地理定位数据库历史数据集W及金融系统归档日志数据集分别进行加权处 理,并合并为一第一临时数据集; 根据一数据权值衰落时间窗口算法对所述第一临时数据集进行处理,对第一临时数据 集中的权值进行修正,生成一第二临时数据集;所述第二临时数据集包括各单个IP地址; 根据所述各单个IP地址,将第二临时数据集中的数据条目W IP段进行合并,形成第= 临时数据集; 确定所述第=临时数据集中各IP段对应的综合可信度,并根据所述第=临时数据集 和所述综合可信度生成第四临时数据集; 根据一预先设置的可信度阔值与所述综合可信度,对第四临时数据集中的数据条目进 行筛选,生成IP地理定位数据的可信数据。
2. 根据权利要求1所述的IP地理定位数据的挖掘方法,其特征在于,还包括: 接收一 IP地理定位标准基础数据,并接收用户输入的IP地理定位参考数据; 将所述IP地理定位标准基础数据、所述可信数据和所述IP地理定位参考数据进行整 合处理,形成IP地理定位最终数据。
3. 根据权利要求2所述的IP地理定位数据的挖掘方法,其特征在于,所述IP地理定位 标准基础数据包括IP分配情况信息。
4. 根据权利要求3所述的IP地理定位数据的挖掘方法,其特征在于,所述IP地理定位 最终数据包括各IP段与地理区域的对应关系表,所述对应关系表包括;IP段对应的身份标 识、IP段号码、IP段长度、归属地信息、更新时间、W及所述综合可信度。
5. 根据权利要求4所述的IP地理定位数据的挖掘方法,其特征在于,所述第一临时数 据集包括单个IP地址、归属地信息、更新时间W及权值。
6. 根据权利要求5所述的IP地理定位数据的挖掘方法,其特征在于,所述根据一数据 权值衰落时间窗口算法对所述第一临时数据集进行处理,对第一临时数据集中的权值进行 修正,生成一第二临时数据集,包括: 获取当前时间与第一临时数据集中的更新时间的时间间隔刻度n ; 根据所述第一临时数据集中的权值H、所述时间间隔刻度n和一预先设置的衰弱系数 k,生成修正权值Hw: H(n)=味吐。 根据所述第一临时数据集中的单个IP地址、归属地信息和所述修正权值,生成所述第 二临时数据集。
7. 根据权利要求6所述的IP地理定位数据的挖掘方法,其特征在于,根据所述各单个 IP地址,将第二临时数据集中的数据条目W IP段进行合并,形成第=临时数据集,包括: 根据一预先设置的IP段长度W及预先设置的IP段划分策略,确定各单个IP地址所在 的IP段; 将同一 IP段内的各单个IP地址所对应的修正权值叠加,生成各IP段所对应的累积权 值; 根据各IP段号码、各IP段所对应的累积权值W及各IP段对应的归属地信息,
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1