一种基于数据仓库的用户数据整合方法及系统的制作方法_3

文档序号:9326990阅读:来源:国知局
果用户数量比较多,如30万,则用户手机号ID采用6个字符进行表 示,相对于用户手机号而言,占用的字符比较少,内容少,便于用户数据的查询、统计、分析。
[0064] S260:查询所述建立的映射表,根据用户级别生成用户统一级别,获得整合后的数 据表。
[0065] 在本实施例中,在数据表中,根据用户级别,查询建立的映射表,找到该级别下的 用户统一级别。例如,在用户来源为QQ端时,用户级别为红钻,查询映射表,对应QQ端用户 级别为红钻的用户统一级别为钻石。其中,整合后的数据表中包括新的用户账号ID,用户来 源、用户注册账号、用户手机号、用户手机号ID、用户级别、用户统一级别,其中新的账号ID 目的是为了区别存储的每一条用户数据。
[0066] S270:将整合后的数据表中没有手机号的用户数据以及用户统一级别为注册用户 的用户数据均去除。其中注册用户为仅注册且没有任何购物行为的用户。
[0067] 在本实施例中,没有手机号的用户数据、以及用户统一级别为注册用户的用户数 据为无用数据,每次对用户数据进行分析时掺有这些无用数据会影响查询的效率,故将这 些无用的数据,进行去除。其中,注册用户是指只注册且无任何购物行为的用户;注册用户 的成长值为〇,成长值是用户通过登录、购物、评价、晒单所获得的,累积的成长值总额决定 用户级别。
[0068] S280:将过滤后的数据表中各种来源下的同一目标用户的多条用户数据,存储为 目标用户的一条用户数据,并将预先存储的与目标用户的用户来源相对应的多个购物行为 表中的数据进行聚合。
[0069] 在本实施例中,过滤后的数据表中针对一个目标用户存在多个账号的情形,根据 用户手机号ID进行判断在不同来源下的目标用户是否是同一个用户,如果在不同的来源 下,用户手机号ID相同,则为同一个用户。将不同来源下的同一个用户的多个账号的多条 用户数据以用户为维度存储为一条用户数据,并将预先存储的与目标用户相对应的多个购 物行为表中的数据进行聚合,使多个购物表中的数据存储在目标用户的购物信息中,这样 使一个用户对应不同来源的购物行为数据,有利于分析不同来源下的同一个用户的个人喜 好、个人属性、购物习惯等信息。
[0070] 本实施例提供了一种基于数据仓库的用户数据整合方法,该实施在实施例一的基 础上进行了优化,简化了一个用户多账号之间的绑定关系;去掉了大量的无效的数据,查询 效率高、资源消耗少。
[0071] 实施例三
[0072] 图3本实施例三提供的一种基于数据仓库的用户数据整合方法的流程结构图,如 图3所示,线上数据库中具有大量的用户的数据,包括电商公司内部的数据以及公司外部 传入的数据。公司内部的数据包括表1 :电脑PC端用户数据、表2:手机APP端用户数据、 表3:手机M端用户数据等;公司传入的数据包括表4:QQ端用户数据、表5微信端用户数据 等。
[0073] 该方法包括:步骤:310 :设定表1、表2、表3、表4、表5以及其他来源的用户基础 表中的关键字信息。其中,关键字信息包括:用户账号、用户手机号、用户级别和用户来源。
[0074] 例如,表a示出了为用户数据来自于为QQ端的用户基础表;其中,表a中包含了用 户账号ID、用户注册账号、用户手机号、用户级别和用户来源,其中表a中还包括其他的用 户信息,表a中没有示出;其他来源的用户数据的用户基础表均可以如表a中所示的内容, 仅用户来源不同而已。用户账号ID为用户数据对应的用户来源生成的编号,在通过表a所 示的形式对不同的来源的用户基础表进行表示时,用户账号ID的编写形式会不同,如,如 表a中所示,用户数据来源为QQ端时,用户账号ID的编写形式为100001、100002、100003 等;当用户数据来源为手机APP端时,用户账号的编写形式为200001、200002、200003等; 当用户数据来源为M端时,用户账号的编写形式为300001、300002、300003等。其中,表a 的内容为图3中表4的内容,表1、表2、表3、表5等采用表a的形式进行表示。
[0075] 表 a
[0078] 步骤320 :获取表1、表2、表3、表4、表5以及其他来源的关键字信息。
[0079] 步骤330 :根据预设的规则建立用户级别与用户统一级别的映射表b。
[0080] 在本实施例中,如表b所示,用户来源为QQ的用户数据,用户级别为钻石、红钻、注 册分别对应的用户统一级别为钻石、钻石、注册,用户来源为APP的用户级别为铁牌对应的 用户统一级别为铜牌。其中,如表b所示,在QQ端,用户级别分别为钻石和红钻的用户,用 户统一级别均为钻石,导致这种情形有可能是:在QQ端,以消费的多少进行划分用户级别, 规定2000-2500元之间的用户级别为钻石,2500元以上的用户级别为红钻;而用户的统一 级别规定2000元以上为钻石。如果一个用户的消费在2000-2500元之间,用户级别为钻 石,用户统一级别也为钻石;如果另一个用户的消费在2500元以上,用户级别为红钻,则用 户统一级别仍为钻石。
[0081] 表 b
[0082]
[0083]

[0084] 在上述实施例的基础上,用户级别和用户统一级别之间的映射表中的对应关系还 可以设置成其他的关系,可以根据查询的方便的原则或者需要进行任意的设定。
[0085] 步骤340 :将获取的表1、表2、表3、表4、表5以及其他来源的用户基础表中的关 键字信息存储到一个数据表中,并根据所述用户来源以及用户注册账号为关联主键,生成 新的用户账号ID,并将新的用户账号ID作为数据表的主关键字。
[0086] 步骤350 :根据所述用户手机号,分配与所述用户手机号对应的用户手机号ID。
[0087] 步骤360 :查询所述建立的映射表b,根据用户级别生成用户统一级别,获得整合 后的数据表Co
[0088] 在本实施例中,整合后的数据表如表c所不,将表1、表2、表3、表4、表5以及其他 来源的用户基础表中的关键字信息存储到一个数据表中,其中,数据表中包括:新的用户账 号ID,用户来源、用户注册账号、用户手机号、用户手机号ID、用户级别、统一级别。如表c 所示,用户数据分别来源于QQ、APP和PC端,注册账号均为li3的用户,用户手机号、用户手 机号ID相同,每一个用户手机号对应唯一的用户手机号ID,因在不同的用户来源下,用户 级别以及用户统一级别是不同的。
[0089] 表 c
[0090]
[0091] 步骤370 :将整合后的数据表c中没有手机号的用户数据以及用户统一级别为注 册用户的用户数据均去除。
[0092] 在本实施例中,将整合后的表c进行过滤后,得到过滤后的数据表d。如表d中所 示,用户账号ID为3000011的用户,没有用户手机号信息;用户账号ID为1000033的用户, 其用户统一级别为注册用户;故将表c中用户账号ID为3000011以及1000033的用户数据 进行了过滤。其中,注册用户是指只注册且无任何购物行为的用户。
[0093] 表 d
[0095] S380 :将过滤后的数据表d中各种来源下的同一目标用户的多条用户数据,存储 为目标用户的一条用户数据,并将预先存储的与目标用户的用户来源相对应的多个购物行 为表中的数据进行聚合。
[0096] 在本实施例中,将表d中各种来源下的同一目标用户的多条用户数据,存储为目 标用户的一条用户数据,并将预先存储的与目标用户的用户来源相对应的多个购物行为表 中的数据进行聚合,获得表e。表e示出了加工后的用户数据表,如表e所示,购物信息中的 订单信息中只给出了用户消费的金额以及用户购物的种类,其他信息没有示出。其中,对于 用户注册账号为li3的用户,订单信息有两条;第一条订单信息来源APP端,第二条订单信 息来源PC端(参照表c),将来自APP端和PC端的同一个用户的购物行为信息进行聚合,有 利于用户数据的分析。其中,用户注册账号为li3的用户,根据订单的信息,可以分析该用 户喜好购买食品的货物。
[0097] 表 e
[0098]
[0099] 在上述实施例的基础上,表e中的内容还可以设置成其他的形式。
[0100] 本实施例三提供了一种
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1