基于社保数据构建用户画像的方法和用户画像生成器与流程

文档序号:12734003阅读:来源:国知局

技术特征:

1.一种基于社保数据构建用户画像的方法,其特征在于:包括以下步骤:

获取用户社保数据,所述社保数据为可查询数据;

将所述用户社保数据存储在Hbase数据库中;

对所述用户的社保数据进行过滤,得到社保数据的关键字段,所述关键字段至少用于指示用户的基本信息、参保信息、待遇信息、医疗信息和人事资质信息中的一种;将所述关键字段作为用户基本标签;

采用大数据并行计算方法对所述用户的社保数据进行分析,定义分析类标签的标签值和阈值,标签值根据所述用户社保数据与权重值加权计算得到,阈值用来区分所述用户的不同社保状态,根据标签值与阈值的关系,确定用户的社保状态,并将此时的社保状态作为用户分析类标签;所述社保状态至少用于指示用户的社保缴费状态、健康状态、收入水平、生存状态、生育状态和业务经办行为偏好中的一种;所述业务经办行为偏好包括偏好业务大厅办理、偏好自助终端办理、偏好网上办理和偏好手机终端办理;

生成以基本标签和分析类标签为集合的用户画像。

2.根据权利要求1所述的方法,其特征在于还包括:

获取社会保障领域可以执行的所有业务信息;

采用大数据并行计算方法对用户画像和社会保障领域可以执行的所有业务信息进行关联分析,得到用户画像可以做和必须做的业务信息。

3.根据权利要求1所述的方法,其特征在于所述获取用户的社保数据还包括:

获取公安部门和民政部门记载的用户信息,用于验证所述用户的社保数据是否正确,并舍弃不正确的社保数据。

4.根据权利要求1所述的方法,其特征在于将所述用户社保数据中重复数据删除,对所述用户社保数据中不完整数据,采用0值、空字符串或实际社保数据进行补齐。

5.根据权利要求1所述的方法,其特征在于所述用户的基本信息至少包括性别、年龄段、经常居住地和教育信息中的一种。

6.根据权利要求1所述的方法,其特征在于所述用户社保数据包括:保险数据、人事人才数据、公共就业数据和劳动关系数据。

7.根据权利要求1所述的方法,其特征在于采用Sqoop数据工具获取所述用户社保数据。

8.一种基于社保数据的用户画像生成器,其特征在于,包括:

获取模块,用于获取用户的社保数据,所述社保数据为可查询数据;

存储模块,用于将所述用户社保数据存储在Hbase数据库中;

过滤模块,用于对所述用户的社保数据进行过滤,得到社保数据的关键字段,所述关键字段至少用于指示用户的参保信息、待遇信息、医疗信息和人事资质信息中的一种;将所述关键字段作为用户基本标签;

分析模块,采用大数据并行计算方法对所述用户的社保数据进行分析,定义分析类标签的标签值和阈值,标签值根据所述用户社保数据与权重值加权计算得到,阈值用来区分所述用户的不同社保状态,根据标签值与阈值的关系,确定用户的社保状态,并将此时的社保状态作为用户分析类标签;所述社保状态至少用于指示用户的社保缴费状态、健康状态、收入水平、生存状态、生育状态和业务经办行为偏好中的一种;所述业务经办行为偏好包括偏好业务大厅办理、偏好自助终端办理、偏好网上办理和偏好手机终端办理;

生成模块,用于生成以基本标签和分析类标签为集合的用户画像。

9.根据权利要求8所述的用户画像生成器,其特征在于,所述社保数据获取模块还包括验证模块,用于获取公安部门和民政部门记载的用户信息,并验证所述用户的社保数据是否正确,并舍弃不正确的社保数据。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1