用户信息处理方法及系统的制作方法_2

文档序号:9551055阅读:来源:国知局
群;
[0051]步骤102、所述集中集群对各个所述分区集群发送的第一归集结果进行归集,得到第二归集结果,并存储所述第二归集结果。
[0052]采用本发明方法能够在全国范围内全面快速地采集用户的网络行为数据,形成大数据体系,并利用可自定义的预定规则从采集的网络行为数据中归集出用户在日常生活的多个领域中的信用信息。与现有技术相比,本发明数据来源广泛,能够全面关联用户在各个领域的信用信息并进行实时归集,以供后续进行提取核实,提高了用户身份及信用信息归集核实的效率和准确性。
[0053]这里的分区集群可以是设置在各省的分省集群,用于采集用户在各省的网络行为数据。
[0054]在步骤101中,所述网络行为数据包括用户的主动访问数据和/或网络服务器的被访问数据。
[0055]所述采集用户在本区的网络行为数据的步骤包括:
[0056]所述分区集群通过移动网络采集用户在本区的主动访问数据;和/或,所述分区集群通过互联网数据中心机房的出口采集本区的网络服务器的被访问数据。
[0057]可以看出,本发明能够在全国范围内的移动网络和互联网数据中心机房采集用户的网络行为数据,从而建立大数据体系,具有数据来源广、关联度高的优点。
[0058]本发明中可以根据需求自定义所述预定规则。例如,所述预定规则包括:以身份证号码或手机号码为主维度且以信用历史、行为偏好、履约能力、身份特质和人脉中的任意一项或多项为从属维度的对用户的信用信息进行提取的规则。
[0059]并且,在信用历史、行为偏好、履约能力、身份特质、人脉等从属维度中,还可以进一步自定义提取信息的数量和相关程度等,以便于后续进行归集。
[0060]与传统的分析历史数据不同,本发明方法采用分布式实时提取归集的方式,将所述预定规则下发到各个分区集群中,以每个分区集群作为一个计算单元,并将得到的第一归集结果发送给集中集群,形成级联型分析结构。
[0061]对于步骤102,集中集群对多个分区集群分别发送的第一归集结果进行汇总和整理,确定用户在全国范围内的整体信用信息轨迹。
[0062]具体地,所述集中集群对各个所述分区集群发送的第一归集结果进行归集,得到第二归集结果的步骤包括:
[0063]所述集中集群从接收到的多个第一归集结果中提取用户的身份证号码,以及与该身份证号码相关联的手机号码;
[0064]所述集中集群提取与所述手机号码相关联的信用信息,得到所述第二归集结果。
[0065]例如,以用户的身份证号码或手机号码为主维度,以信用历史、行为偏好、履约能力、身份特质和人脉5项为从属维度,那么所述第二归集结果中包含用户在全国范围内的上述5个从属维度的整体信用信息。
[0066]优选地,所述分区集群还能够判断自身的资源利用率是否达到预设标准。由于各个分区集群所采集到的用户的网络行为数据的数量非常大,当某个分区集群的资源利用率超出预设标准时,该分区集群可以将超出的归集任务转发给其他的分区集群,通过其他分区集群进行协助处理。
[0067]上述过程的具体步骤包括:
[0068]当所述分区集群判断自身的资源利用率超出预设标准时,将超出的归集任务进行拆分,并发送请求信息给所述集中集群;
[0069]所述集中集群接收到所述请求信息后发送广播信息至其他分区集群;
[0070]当其他分区集群判断自身的资源利用率未达到预设标准时,向所述集中集群发送反馈信息,同时与上述资源利用率超出预设标准的分区集群建立数据连接,领取其中一个或多个拆分的归集任务进行处理。
[0071]例如,如图2所示,当分区集群A的资源利用率大于预设标准(比如80%)时,分区集群A将超出的归集任务进行拆分,形成更小的任务单元,并发送请求信息给集中集群,集中集群发广播信息到各个其余的分区集群中,当有分区集群B的资源利用率低于预设标准时,则该分区集群发送反馈信息给集中集群,之后从分区集群A处领取其中一个或多个任务单元,协助其完成归集任务,直至每个分区集群的资源利用率都满足预设标准为止。
[0072]其中,分区集群A发送请求信息的格式可以为Token (分区集群A数据地址,请求标识,0),当分区集群B的资源有空闲时,发送反馈信息的格式可以为Token (分区集群A数据地址,请求标识,1)。
[0073]进一步地,所述用户信息处理系统还包括信息核实装置,所述方法还包括:
[0074]所述信息核实装置从存储的所述第二归集结果中提取预定周期内的第二归集结果,并根据预先设定的评分标准对提取的第二归集结果进行评价。
[0075]这里的评分标准可以是通过对海量用户的第二归集结果进行分析排名所得出的评分标准。当需要对某个用户的信用信息进行核实评价时,实时提取预定周期(比如3年)内的该用户的第二归集结果,根据所述评分标准,对该用户的信用信息进行评价,从而核实该用户的身份,以及该用户的信用状况,避免产生信用风险。
[0076]实施例二
[0077]图3为本发明实施例二提供的一种用户信息处理系统的结构示意图,如图3所示,所述用户信息处理系统包括多个分区集群1和一个集中集群2 ;
[0078]分区集群1用于采集用户在本区的网络行为数据,按照预定规则从所述网络行为数据中提取出与用户身份信息对应的信用信息,并对所述信用信息进行归集,得出第一归集结果,将所述第一归集结果发送给集中集群2 ;
[0079]集中集群2用于对各个分区集群1发送的第一归集结果进行归集,得到第二归集结果,并存储所述第二归集结果。
[0080]采用本发明方法能够在全国范围内全面快速地采集用户的网络行为数据,形成大数据体系,并利用可自定义的预定规则从采集的网络行为数据中归集出用户在日常生活的多个领域中的信用信息。与现有技术相比,本发明数据来源广泛,能够全面关联用户在各个领域的信用信息并进行实时归集,以供后续进行提取核实,提高了用户身份及信用信息归集核实的效率和准确性。
[0081]进一步地,分区集群1包括分区采集装置11和分区归集装置12。
[0082]分区采集装置11用于采集用户在本区的网络行为数据,并将所述网络行为数据发送给分区归集装置12 ;
[0083]分区归集装置12用于按照预定规则从所述网络行为数据中提取出与用户身份信息对应的信用信息,并对所述信用信息进行归集,得出第一归集结果,将所述第一归集结果发送给集中集群2。
[0084]优选地,所述网络行为数据包括用户的主动访问数据和/或网络服务器的被访问数据。
[0085]分区采集装置11包括第一采集模块11a和第二采集模块11b,第一采集模块11a用于通过移动网络3采集用户在本区的主动访问数据,第二采集模块lib用于通过互联网数据中心机房4的出口采集本区的网络服务器的被访问数据。
[0086]本发明能够在全国范围内的移动网络3和互联网数据中心机房4采集用户的网络行为数据,从而建立大数据体系,具有数据来源广、关联度高的优点。
[0087]本发明中可以根据需求自定义所述预定规则。例如,所述预定规则包括:以身份证号码或手机号码为主维度且以信用历史、行为偏好、履约能力、身份特质和人脉中的任意一项或多项为从属维度的对用户的信用信息进行提取的规则。
[0088]并且,在信用历史、行为偏好、履约能力、身份特质、人脉等从属维度中,还可以进一步自定义提取信息的数量和相关程度等,以便于后续进行归集。
[0089]与传统的分析历史数据不同,本发明方法采用分布式实时提取归集的方式,将所述预定规则下发到各个分区集群中,以每个分区集群1作为一个计算单元,并将得到的第一归集结果发送给集中集群2,形成级联型分析结构。
[0090]进一步地,集中集群2包括集中归集装置21和存储装置22 ;
[0091]集中归集装置21用于对各个分区集
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1