本发明涉及数据处理,特别涉及一种用户分群方法、设备及存储介质。
背景技术:
1、目前,各种各样的软件应用会保存用户的相关数据。为对大量用户进行分析以把握用户群体需求,以便更好地推进后续业务,一般会为用户设置标签,并通过标签进行用户分群。例如,可为音乐软件产品的用户生成各种不同的标签,如年龄、性别、是否为vip用户、过去一周听歌次数、过去一周k歌次数等,进而业务人员可以根据需求圈选出符合一定要求的用户群体,然后为该群体推送一些运营活动,而圈选用户的过程便称为用户分群。然而,现有的用户分群方案存在查询逻辑复杂、查询速度慢(分钟级)、查询性能不稳定且存储空间占用较多的缺陷。
2、因此,上述技术问题亟待本领域技术人员解决。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种用户分群方法、设备及存储介质,能够在降低存储空间占用率的基础上实现秒级分群。其具体方案如下:
2、本申请的第一方面提供了一种用户分群方法,包括:
3、获取客户端创建的标签规则;所述标签规则包含所述客户端选取的多个预设标签及标签间的逻辑关系;
4、如果多个所述预设标签的标签类型均为热标签,则在实时数仓中查询符合所述标签规则的用户群体;所述实时数仓中存储标签类型为热标签的用户数据;
5、如果多个所述预设标签中存在标签类型为冷标签的标签,则在离线数仓中查询符合所述标签规则的用户群体;所述离线数仓中存储全部标签类型的用户数据。
6、可选的,所述用户分群方法,还包括:
7、实时统计各所述预设标签被所述客户端选取的频次;
8、根据频次高低确定各所述预设标签的标签类型;标签类型为冷标签或热标签。
9、可选的,所述用户分群方法,还包括:
10、将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓,使得所述实时数仓中存储标签类型为热标签的用户数据。
11、可选的,所述将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓之后,还包括:
12、将同步的用户数据填充至在所述实时数仓中构建的目标竖表中,使得所述实时数仓中存储标签类型为热标签的用户数据;所述目标竖表的每一行至少存储一个所述预设标签、所述预设标签的一个标签值及一个包含具有所述预设标签和所述标签值的用户标识的序列。
13、可选的,所述目标竖表的每一行存储的用户标识的存储形式为位图格式。
14、可选的,所述在实时数仓中查询符合所述标签规则的用户群体,包括:
15、在所述实时数仓的所述目标竖表中查询出符合所述标签规则的用户标识。
16、可选地,所述在实时数仓中查询符合所述标签规则的用户群体,包括:
17、利用第一数据库引擎将所述标签规则转化为第一查询语句,并在所述实时数仓中执行所述第一查询语句以得到符合所述标签规则的用户群体;
18、所述在离线数仓中查询符合所述标签规则的用户群体,包括:
19、利用第二数据库引擎将所述标签规则转化为第二查询语句,并在所述离线数仓中执行所述第二查询语句以得到符合所述标签规则的用户群体。
20、可选的,所述用户分群方法,还包括:
21、将得到的符合所述标签规则的用户群体进行打包处理得到相应的人群包;
22、将所述人群包上传至云存储平台,以便所述客户端从所述云存储平台下载所述人群包。
23、本申请的第二方面提供了一种电子设备,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述用户分群方法。
24、本申请的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述用户分群方法。
25、本申请中,先获取客户端创建的标签规则;所述标签规则包含所述客户端选取的多个预设标签及标签间的逻辑关系;如果多个所述预设标签的标签类型均为热标签,则在实时数仓中查询符合所述标签规则的用户群体;所述实时数仓中存储标签类型为热标签的用户数据;如果多个所述预设标签中存在标签类型为冷标签的标签,则在离线数仓中查询符合所述标签规则的用户群体;所述离线数仓中存储全部标签类型的用户数据。可见,本申请通过对标签进行冷热分离,利用不同的数据仓库存储不同标签类型的用户数据,以降低存储空间占用率,在此基础上针对不同标签类型采用不同的查询方案,从而将用户分群速度提升了一个数量级,实现秒级分群。
1.一种用户分群方法,其特征在于,包括:
2.根据权利要求1所述的用户分群方法,其特征在于,还包括:
3.根据权利要求1所述的用户分群方法,其特征在于,还包括:
4.根据权利要求3所述的用户分群方法,其特征在于,所述将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓之后,还包括:
5.根据权利要求4所述的用户分群方法,其特征在于,所述目标竖表的每一行存储的用户标识的存储形式为位图格式。
6.根据权利要求4所述的用户分群方法,其特征在于,所述在实时数仓中查询符合所述标签规则的用户群体,包括:
7.根据权利要求1所述的用户分群方法,其特征在于,所述在实时数仓中查询符合所述标签规则的用户群体,包括:
8.根据权利要求1至7任一项所述的用户分群方法,其特征在于,还包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至8任一项所述的用户分群方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至8任一项所述的用户分群方法。