本发明涉及数据处理,特别是涉及一种基于小程序的用户行为标签生成方法、一种基于小程序的用户行为标签生成装置、一种电子设备以及一种计算机可读介质。
背景技术:
1、基于微信平台的小程序服务模式自推出以来得到广大用户和服务提供商的青睐,小程序凭借“用完即走”的便捷特性,使其在不同领域中迅速推广和普及,目前,全网小程序数量达到550万,日活跃用户数量超过4亿,应用领域包括政务、医疗、教育、餐饮、生活服务等。
2、在小程序被使用的过程中,被网络不断创造且持续存在于网络中的数据包含的信息价值是不可估量的,通过对这些数据的提取、分析处理,可以使得客户能够了解用户的小程序使用行为,让客户更加清晰的了解用户,提升自身服务水平,开拓新的业务领域。但由于小程序数据涉及千差万别的业务场景,采用常规软件工具对这些数据提取使用极端困难,使得处在网络中的各方既希望从行为数据中获益,又无法轻松自如的从这些数据中得到有价值的信息。
技术实现思路
1、鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于小程序的用户行为标签生成方法和相应的一种基于小程序的用户行为标签生成装置、一种电子设备以及一种计算机可读介质。
2、本发明实施例公开了一种基于小程序的用户行为标签生成方法,所述方法包括:
3、获取小程序数据包;所述小程序数据包括用户属性和用户的小程序行为数据;
4、将所述用户的小程序行为数据输入用户行为识别模型;
5、获取所述用户行为识别模型输出的行为标签;
6、将所述行为标签与所述用户属性关联 ,生成所述用户的用户行为标签。
7、可选地,所述获取小程序数据包的步骤,包括:
8、对网络传输数据进行监控,采集网络数据包;
9、解析所述网络数据包,得到所述小程序数据包。
10、可选地,所述将所述用户的小程序行为数据输入用户行为识别模型的步骤,包括:
11、对所述小程序行为数据进行预处理;
12、从预处理后的小程序行为数据中提取行为特征;
13、将所述行为特征输入所述用户行为识别模型。
14、可选地,所述对所述小程序行为数据进行预处理的步骤,包括:
15、对所述小程序行为数据进行数据清洗和数据转换;其中,所述数据清洗包括删除重复值、补充缺失值、剔除或修正异常值;所述数据转换包括编码转换。
16、可选地,所述用户行为识别模型生成方式,包括:
17、获取训练样本数据集;其中,所述训练样本数据集包括历史小程序行为数据和所述历史小程序行为数据对应的历史用户行为标签;
18、采用所述训练样本数据集训练得到所述用户行为识别模型。
19、可选地,所述训练样本数据集获取方式,包括:
20、从移动大数据平台获取历史小程序行为数据;
21、对所述历史小程序行为数据进行特征分析,生成特征规则;
22、根据所述特征规则,确定所述历史小程序行为数据对应的历史用户行为标签。
23、可选地,所述采用所述训练样本数据集训练得到所述用户行为识别模型的步骤,包括:
24、采用所述训练样本数据集初始化弱学习器;
25、计算每个训练样本数据的残差;
26、将所述残差作为新的回归树的训练样本数据;
27、计算回归树的最佳拟合值;
28、采用所述最佳拟合值更新学习器;
29、通过上述步骤进行迭代训练,得到所述用户行为识别模型。
30、本发明实施例还公开了一种基于小程序的用户行为标签生成装置,所述装置包括:
31、第一获取模块,用于获取小程序数据包;所述小程序数据包括用户属性和用户的小程序行为数据;
32、输入模块,用于将所述用户的小程序行为数据输入用户行为识别模型;
33、第二获取模块,用于所述用户行为识别模型输出的行为标签;
34、生成模块,用于将所述行为标签与所述用户属性关联 ,生成所述用户的用户行为标签。
35、可选地,所述第一获取模块,包括:
36、采集子模块,用于对网络传输数据进行监控,采集网络数据包;
37、解析子模块,用于解析所述网络数据包,得到所述小程序数据包。
38、可选地,所述输入模块,包括:
39、预处理子模块,用于对所述小程序行为数据进行预处理;
40、提取子模块,用于从预处理后的小程序行为数据中提取行为特征;
41、输入子模块,用于将所述行为特征输入所述用户行为识别模型。
42、可选地,所述预处理子模块,包括:
43、预处理单元,用于对所述小程序行为数据进行数据清洗和数据转换;其中,所述数据清洗包括删除重复值、补充缺失值、剔除或修正异常值;所述数据转换包括编码转换。
44、可选地,所述用户行为识别模型通过如下模块生成:
45、第三获取模块,用于获取训练样本数据集;其中,所述训练样本数据集包括历史小程序行为数据和所述历史小程序行为数据对应的历史用户行为标签;
46、训练模块,用于采用所述训练样本数据集训练得到所述用户行为识别模型。
47、可选地,所述训练样本数据集通过以下模块得到:
48、第四获取模块,用于从移动大数据平台获取历史小程序行为数据;
49、特征分析模块,用于对所述历史小程序行为数据进行特征分析,生成特征规则;
50、确定模块,用于根据所述特征规则,确定所述历史小程序行为数据对应的历史用户行为标签。
51、可选地,所述训练模块,包括:
52、初始化子模块,用于采用所述训练样本数据集初始化弱学习器;
53、第一计算子模块,用于计算每个训练样本数据的残差;
54、新训练样本数据确定子模块,用于将所述残差作为新的回归树的训练样本数据;
55、第二计算子模块,用于计算回归树的最佳拟合值;
56、学习器更新子模块,用于采用所述最佳拟合值更新学习器;
57、用户行为识别模型确定子模块,用于通过上述步骤进行迭代训练,得到所述用户行为识别模型。
58、本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
59、所述存储器,用于存放计算机程序;
60、所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的基于小程序的用户行为标签生成方法。
61、本发明实施例还公开了一个或多个计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的基于小程序的用户行为标签生成方法。
62、本发明实施例包括以下优点:
63、本发明实施例的基于小程序的用户行为标签生成方法,通过获取小程序数据包,所述小程序数据包括用户属性和用户的小程序行为数据,将所述用户的小程序行为数据输入用户行为识别模型,获取所述用户行为识别模型输出的行为标签,将所述行为标签与所述用户属性关联 ,生成所述用户的用户行为标签。通过本发明的用户行为识别模型,可以实现对庞大且复杂的小程序行为数据进行准确识别,明确用户有哪些小程序使用行为,建立用户行为标签,从而客户可以更加清晰的了解用户,提升自身服务水平,开拓新的业务领域。