一种基于自训练的用户价值分层方法、装置、存储介质及设备与流程

文档序号：30729905发布日期：2022-07-13 02:39阅读：69来源：国知局

1.本发明涉及用户价值分层领域，具体涉及一种基于自训练的用户价值分层方法、装置、存储介质及设备。

背景技术：

2.本部分的描述仅提供与本发明公开相关的背景信息，而不构成现有技术。
3.用户价值分层指根据用户的参与意愿及创利能力将其划分不同的群体，以便平台为其提供定制化的服务。面向广告投放业务，不同类型的用户在参与动机和意愿等方面存在差异，他们所创造的价值也存在差异。对用户价值进行分层，便于针对性地设置有效的广告投放策略，增加业务的创收。因此，如何利用采集到的用户行为特征来进行价值分层具有切实的意义。然而，面向广告投放业务，目前尚无成熟的用户价值分层方案。由于实际采集到的数据动态增长且缺乏置信的标签，相关领域的用户价值分层方法难以适用。
4.应该注意，上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明，并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。

技术实现要素：

5.本发明要解决的技术问题是提供一种基于自训练的用户价值分层方法、装置、存储介质及设备。
6.为了解决上述技术问题，本发明提供了一种基于自训练的用户价值分层方法，其特征在于，所述的方法包括以下步骤，
7.步骤(一)，根据rfm模型提取用户样本的数据特征，并将数据特征进行归一化处理，得到用户样本数据集；
8.步骤(二)，基于统计分析，确定步骤(一)中的用户样本数据集的部分数据的标签，得到部分数据有标签的样本集合；
9.步骤(三)，将步骤(二)中的样本集合基于自训练，获得用户价值分层模型。
10.优选地，步骤(一)具体包括，
11.特征采集：采集单位时间内用户游戏闯关数r、单位时间内观看广告的数量f及用户的生命周期价值m，分别如式(1)-(3)所示，其中，δt表示一段时间的间隔，
[0012][0013][0014]
m＝ltv(3)，
[0015]
特征处理：定义用户参与意愿w，如式(4)所示，其中，f(f，m)为每关平均展示广告的数量，并对样本进行归一化处理，如式(5)所示，
[0016][0017][0018]
优选地，步骤(二)具体包括，
[0019]
样本处理过的数据集d＝{(x1，y1)，...，(xi，yi)，...，(xn，yn)}，其中为用户参与意愿w与生命周期价值m构成的特征向量，对应用户所属的类别，
[0020]
根据四分位点和均值确定高阈值和低阈值，如式(6)和式(7)所示，并确定部分数据集的标签，如式(8)所示，
[0021][0022][0023][0024]
优选地，yi＝1，对应的用户类型为用户参与意愿强且创造的收益多的“重要价值用户”；yi＝2，对应的用户类型为用户参与意愿强但创造的收益少的“一般价值用户”；yi＝3，对应的用户类型为用户参与意愿弱但创造的收益多的“重要发展客户”；yi＝4，对应的用户类型为用户参与意愿弱且创造的收益少的“一般发展用户”。
[0025]
优选地，步骤(三)具体包括，
[0026]
用xgboost作为训练模型的基学习器，如式9-10所示，其中l(φ)为损失函数，ω(fk)为正则项，将部分带有标签的样本用于训练初始的分类器，
[0027][0028][0029]
优选地，使用基学习器预测数据集中未被标记的样本，并从中挑选出置信度高的数据添加至新的训练集中，所述的置信度高的数据为预测概率高于阈值的数据，如式(11)所示，其中i表明该数据是否属于高置信度的数据，重复该过程，更新数据集和分类模型，直到训练任务结束，得到用户价值分层模型p，
[0030][0031]
根据自训练得到的模型p，可对输入特征进行分类，得到其对应类别yi＝p(xi)，完成对用户价值进行分层。
[0032]
本技术还提供一种基于自训练的用户价值分层装置，所述的装置包括，
[0033]
样本处理模块，用于根据rfm模型提取用户样本的数据特征，并将数据特征进行归一化处理，得到用户样本数据集；
[0034]
基于统计分析的数据标记模块，用于基于统计分析，确定用户样本数据集的部分数据的标签，得到部分数据有标签的样本集合；
[0035]
自训练模块，用于将样本集合基于自训练，获得用户价值分层模型。
[0036]
优选地，所述的样本处理模块包括，
[0037]
特征采集单元，用于采集单位时间内用户游戏闯关数r、单位时间内观看广告的数量f及用户的生命周期价值m；
[0038]
特征处理单元，用于定义用户参与意愿w，如式(4)所示，其中，f(f，m)为每关平均展示广告的数量，并对样本进行归一化处理，如式(5)所示，
[0039][0040][0041]
本技术还提供一种存储有计算机程序的计算机可读存储介质，其特征在于，当所述计算机程序被处理器执行时，致使所述处理器实现所述的基于自训练的用户价值分层方法。
[0042]
本技术还提供一种电子设备，包括：
[0043]
至少一个处理器；以及
[0044]
与所述至少一个处理器通信连接的存储器；其中，
[0045]
所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行所述的基于自训练的用户价值分层方法。
[0046]
借由以上的技术方案，本发明的有益效果如下：
[0047]
本发明的基于自训练的用户价值分层方法、装置、存储介质及设备，能够在数据动态增长和缺乏置信标签的情况下高效且准确的划分不同价值类别的用户。本方案将整体架构进行了解耦化，方便部署以及试错检查、此外具有良好的可扩展性和迁移性。
附图说明
[0048]
图1是本技术的基于自训练方法的用户价值分层整体框架图；
[0049]
图2是本技术的样本处理流程图；
[0050]
图3是本技术的基于统计分析的数据标记流程图；
[0051]
图4是本技术的自训练模型的工作流程图。
具体实施方式
[0052]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0053]
如图1所示，为本技术的基于自训练方法的用户价值分层整体框架，基于自训练的用户价值分层方法包括以下步骤，
[0054]
步骤(一)，根据rfm模型提取用户样本的数据特征，并将数据特征进行归一化处理，得到用户样本数据集；步骤(二)，基于统计分析，确定步骤(一)中的用户样本数据集的部分数据的标签，得到部分数据有标签的样本集合；步骤(三)，将步骤(二)中的样本集合基于自训练，获得用户价值分层模型。另外，在人工干预生成数据集的情况下，可直接引入人工构建的数据集用于后续模型的训练。
[0055]
如图2所示，为本技术的样本处理流程图，包括，
[0056]
特征采集：提取rfm模型对应的特征向量，包括，单位时间内用户游戏闯关数r、单位时间内观看广告的数量f及用户的生命周期价值m，分别如式(1)-(3)所示，其中，δt表示一段时间的间隔，
[0057][0058][0059]
m＝ltv
ꢀꢀꢀꢀꢀꢀꢀ
(3)，
[0060]
通过对采集的数据进行分析，发现r与f呈现一定的相关性且能够共同反映用户参与的积极性，故定义用户参与意愿w，如式4所示，其中f(f，m)表示每关平均展示广告的数量，由当前用户的f和m值共同确定。通过引入用户参与意愿w，不仅增强了用户分层模型的可解释性(参见表1)，也为后续广告的投放策略提供了评估指标(参见f(f，m))。在得到特征w和m后，对样本进行归一化处理，
[0061][0062][0063]
如图3所示，由于所采集的数据缺乏置信的标签，难以直接用于用户价值的分层。基于统计分析的数据标记方法旨在通过分析数据集本身的特点，结合用户价值层级的定义，对数据集的一部分给出初步的置信划分，并用于后续分类模型的训练。
[0064]
样本处理过的数据集d＝{(x1，y1)，...，(xi，yi)，...，(xn，yn)}，其中为用户参与意愿w与生命周期价值m构成的特征向量，对应用户所属的类别，如表1所示，在未对数据集进行加工之前总有表明未知用户所属的类别，因此，所提出方法的关键在于确定即用户所属的类别。
[0065]
表1用户分组类别及描述
[0066]
用户分组用户类型用户描述1重要价值用户用户参与意愿强且创造的收益多2一般价值用户用户参与意愿强但创造的收益少3重要发展用户用户参与意愿弱但创造的收益多4一般发展用户用户参与意愿弱且创造的收益少
[0067]
在分析已采集数据的基础上，发现用户创造的价值与参与意愿分布均遵从帕累托法则，即大部分用户参与意愿相对偏低且创造价值偏少，但小部分用户参与意愿很高且创造价值很大。因此，在无人工干预的情况下，可分别根据四分位点和均值确定高阈值和低阈值，如式(6)和式(7)所示，接着结合表1的定义，可确定部分数据集的标签，如式8所示。另外，在人工干预生成数据集的情况下，可直接引入人工构建的数据集用于后续模型的训练。
[0068][0069][0070][0071]
如图4所示，由于采集到的用户数据是增量变化的，人工标记数据不仅耗时，而且代价昂贵，因此，半监督的学习方法适配该应用场景。自训练是一种半监督的增量学习算法，能够根据已有标签的样本训练出初始的分类器，在随后样本增加的过程中预测它们的标签，并将其融合到现有数据集中，用于分类模型的迭代更新。
[0072]
针对自训练的半监督学习方法，基学习器的选择往往决定着训练的效果。考虑计算性能以及分类准确度，采用xgboost作为训练模型的基学习器，，如式9-10所示，其中l(φ)为损失函数，ω(fk)为正则项，将部分带有标签的样本用于训练初始的分类器，
[0073][0074]
[0075]
根据基学习器，模型可预测数据集中未被标记的样本，并从中挑选出置信度高(即预测概率高于阈值)的数据添加到新的训练集中，如式11所示，其中i表明该数据是否属于高置信度的数据。重复该过程，不断更新数据集和分类模型，直到训练任务结束，得到精度最高和泛化性最佳的分类模型p。
[0076][0077]
根据自训练得到的模型p，可对输入特征进行分类，得到其对应类别yi＝p(xi)，完成对用户价值进行分层。
[0078]
本技术还一种基于自训练的用户价值分层装置，所述的装置包括，样本处理模块，用于根据rfm模型提取用户样本的数据特征，并将数据特征进行归一化处理，得到用户样本数据集；基于统计分析的数据标记模块，用于基于统计分析，确定用户样本数据集的部分数据的标签，得到部分数据有标签的样本集合；自训练模块，用于将样本集合基于自训练，获得用户价值分层模型。
[0079]
所述的样本处理模块包括，特征采集单元，用于采集单位时间内用户游戏闯关数r、单位时间内观看广告的数量f及用户的生命周期价值m；特征处理单元，用于定义用户参与意愿w，如式(4)所示，其中，f(f，m)为每关平均展示广告的数量，并对样本进行归一化处理，如式(5)所示，
[0080][0081][0082]
本技术还提供一种存储有计算机程序的计算机可读存储介质，当所述计算机程序被处理器执行时，致使所述处理器实现所述的基于自训练的用户价值分层方法。
[0083]
本技术还提供一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行所述的基于自训练的用户价值分层方法。
[0084]
在本技术中，rfm为衡量客户价值和创造利益能力的模型，r(recency)指最近一次消费代表，f(frequency)指消费频率，m(monetary)指消费金额。wm为衡量客户参与意愿和创造利益能力的模型，w(willingness)指参与意愿，m(monetary)指创收价值。帕累托法则即八二法则，“20％的人口掌握了80％的社会财富”。基学习器为同质集成的个体学习器。半监督学习是监督学习与无监督学习相结合的一种学习方法。自训练为首先在标注数据上训练，然后用它对大规模无标注数据进行标注，把得到的结果当做伪标注数据去训练。xgboost为extreme gradient boosting，是基于梯度提升树框架的一种集成学习模型。
[0085]
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例，本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换，均在本发明
的保护范围之内。本发明的保护范围以权利要求书为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周洪海
技术所有人：金数信息科技（苏州）有限公司
我是此专利的发明人

上一篇：一种建筑施工用混凝土养护装置的制作方法
上一篇：一种接触式测量产品外形的夹具的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。