一种基于数据仓库的用户数据整合方法及系统的制作方法_2

文档序号:9326990阅读:来源:国知局
,新分配用户手机号ID,根据建立的用户级别和用户统一级别之间的映射表,得到用户 统一级别,添加到该整合数据表中。其中,建立的整合数据表中,还可以将用户基础表中除 关键字信息之外的数据进行存储。
[0036] 在本实施例中,在整合数据表中重新生成的用户账号ID与用户基础表中的用户 账号ID编写的方法是不同的,如在用户基础表中,用户账号ID为100001、100002等;而在 整合数据表中,用户账号ID为10001U100022等;其作用均是为了区别每一条的用户数据, 仅编写的方法不同。在整合数据表中重新生成用户账号ID时,用户来源相同时,根据排列 的顺序进行编号;用户来源不同时,用户账号ID的首位数字是不同的。如,在整合数据表 中,用户来源为QQ端,用户账号ID为100011、100022、100033等,按照排列顺序进行编号; 当用户来源为APP端时,用户账号ID与QQ端的用户账号ID首位数字是不同的,依然按照 排列顺序进行编号,用户账号ID为200011、200022、200033等。在整合的数据表中,用户账 号ID也可以有其他编写形式,能够体现用户数据的来源是否相同或不同即可(用户数据来 源相同,用户账号ID首位数字相同;否则,用户账号ID首位数字不同)。
[0037] S140:对整合后的数据表中的用户数据进行过滤,将过滤后的数据表中的用户数 据与预存储的用户购物行为表中的数据进行加工。
[0038] 在本实施例中,由于用户基础表中包含了一些无用的用户数据,因此整合的数据 表中的用户也存在一些无用的用户数据,需将这些无用的用户数据进行去除。其中,无用的 数据包括没有手机号的用户数据以及用户统一级别为注册用户的用户数据。
[0039] 用户的购物行为表可以是用户的订单、用户的晒单等。过滤后的数据表中包含一 个用户多个账号的用户数据,根据用户手机号ID进行判断在不同来源下的用户是否是同 一个用户,如果在不同的来源下,用户手机号ID相同,则为同一个用户。将不同来源下的 同一个用户的多个账号的多条用户数据以用户为维度进行存储为一条用户数据,并将同一 个用户不同来源的购物行为表的数据进行聚合,这样有利于分析不同来源下的同一个用户 的个人喜好、个人属性、购物习惯等信息。
[0040] 例如,如果一个用户,在QQ端、APP端、微信端均有用户注册账号XX,那么在过滤 后的数据表中,存在3条该用户的用户数据,将以3条用户数据进行压缩,压缩成该用户的 1条用户数据记录,并且该用户在QQ端、APP端、微信端均有一个订单,将各个订单的信息 聚合在一起,存储在该用户的购物信息中,根据购物的信息分析该用户的个人喜好、个人属 性、购物习惯等。
[0041] 本发明实施例一提供的一种基于数据仓库的用户数据整合方法,该方法通过获取 线上数据库中各种来源下的用户基础表、关键字信息以及建立的用户级别和用户统一级别 之间的映射表,对各个用户基础表进行整合,最后将整合后的数据表进行过滤,并将过滤后 数据表中的用户数据与用户购物行为表中的数据进行加工。本发明实施例简化了一个用户 多账号之间的绑定关系;去掉了大量的无效的数据,查询效率高、资源消耗少。
[0042] 实施例二
[0043] 图2是本实施例二提供的一种基于数据仓库的用户数据整合方法的流程图;在上 述实施例的基础上,在获取线上数据库中各种来源下的用户基础表的关键字信息之前,还 执行如下操作:
[0044] 设定线上数据库中用户基础表的关键字信息。
[0045] 进一步的,在上述技术方案中,所述根据获取的各种来源下的用户基础表的关键 字信息、以及建立的映射表对用户基础数据表进行整合,获得整合后的数据表的操作优选 包括:
[0046] 将获取的用户基础表中的关键字信息存储到一个数据表中,并根据所述用户来源 以及用户注册账号为关联主键,生成新的用户账号ID,并将新的用户账号ID作为数据表的 主关键字;
[0047] 根据所述用户手机号,分配与所述用户手机号对应的用户手机号ID ;
[0048] 查询所述建立的映射表,根据用户级别生成用户统一级别,获得整合后的数据表。
[0049] 由此,通过用户来源以及用户注册账号,生成新的用户账号ID,使每一条不同来源 下的用户数据进行区分,通过用户手机号分配与用户手机号相对应的用户手机号ID,由于 用户手机号是加密的,内容较长,用户手机号ID相对于用户手机号内容较少,采用用户手 机号ID便于用户数据的查询、统计和分析。通过建立的映射表根据用户级别生成用户统一 级别,获得整合后的数据表,将不同来源下的用户级别进行统一划分,使用户数据便于统计 和分析。
[0050] 进一步的,在上述技术方案中,所述对整合后的数据表进行过滤,将过滤后的数 据表中的用户数据与预存储的用户购物行为表中的用户购物信息进行加工的操作优选包 括:
[0051] 将整合后的数据表中没有手机号的用户数据以及统一级别为注册用户的用户数 据均去除;其中注册用户为仅注册且没有任何购物行为的用户;
[0052] 将过滤后的数据表中各种来源下的同一目标用户的多条用户数据,存储为目标用 户的一条用户数据,并将预先存储的与目标用户的用户来源相对应的多个购物行为表中的 数据进行聚合。
[0053] 由此,通过将整合后的数据表中没有手机号的用户数据以及统一级别为注册用户 的用户均去除的方法,能够提高用户数据查询的效率,降低系统资源的消耗。
[0054] 将过滤后的数据表中各种来源下的同一目标用户的多条用户数据,存储为目标用 户的一条用户数据,并将预先存储的与目标用户的用户来源相对应的多个购物行为表中的 数据进行聚合,有利于分析不同来源下的同一个用户的个人喜好、个人属性、购物习惯等信 息。
[0055] 基于上述优化,如图2所示,本实施例提供的技术方案具体包括如下:
[0056] S210:设定线上数据库中用户基础表的关键字信息。
[0057] 在本实施例中,因为用户数据的来源比较多,所以用户的基础信息较多,在线上数 据库中需要存储用户基础表中必要的关键字信息。所述关键字信息包括:用户注册账号、用 户手机号、用户级别以及用户来源。
[0058] S220:获取线上数据库中各种来源下的用户基础表的关键字信息。
[0059] S230:根据预设的规则建立用户在各种来源下的用户级别和用户统一级别之间的 映射表。
[0060] S240 :将获取的用户基础表中的关键字信息存储到一个数据表中,并根据所述用 户来源以及用户注册账号为关联主键,生成新的用户账号ID,并将新的用户账号ID作为数 据表的主关键字。
[0061] 在本实施例中,在不同的用户来源下,会存在相同的用户注册账号的情形,但是, 通过用户来源和用户注册账号确定的用户数据是唯一的,因此,通过用户来源和注册账号 确定的数据表的主关键字是唯一的,生成的新的用户账号ID也是唯一的。例如,在QQ端和 APP端,存在相同的用户注册账号li3,仅通过用户注册账号确定的用户数据不唯一(两条 用户数据),但通过用户来源和用户注册账号后,用户数据分别为QQ端、li3和APP端、li3; 这两条用户数据中虽然用户注册账号相同,但用户来源不同,所以用户数据是不同的,故通 过用户来源和用户注册账号确定的用户数据是唯一的。因此,在不同的用户来源下,不论用 户注册账号是否相同,新生成的用户账号ID是不同的。所以,将新的用户账号ID作为整合 后数据表的主关键字,通过上述方法将每一条的用户数据进行区分。
[0062] S250 :根据所述用户手机号,分配与所述用户手机号对应的用户手机号ID。
[0063] 在本实施例中,由于用户手机号是加密的,内容较长多变,不便于查询、统计和分 析,因此根据每一个用户的手机号分配唯一的用户手机号ID,在处理用户手机号ID的内容 时相对于用户手机号内容更加方便。例如,用户手机号的位数是11位,其中,最后两位为 10,则10通过加密后可以为"abcdef","10"加密后占用为6个字符。用户手机号其他数 字也可以通过上述加密的方法,则用户手机号加密后,占用的字符大于11,而用户的手机号 ID是与用户的数量有关系的,如果用户的数量为100个,则手机号ID采用3个字符进行表 示,如100, 101等;如
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1