用户对象分类方法及装置、计算机可读介质和电子设备与流程

文档序号:33622012发布日期:2023-03-25 12:31阅读:来源:国知局

技术特征:
1.一种用户对象分类方法,其特征在于,包括:实时监测用户对象的应用程序切换行为,并基于所述应用程序切换行为生成应用程序标识序列;通过预训练语言模型对所述应用程序标识序列进行编码处理,得到应用程序标识词向量;根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量;对所述行为特征向量进行聚类分类,确定所述用户对象的分类结果。2.根据权利要求1所述的方法,其特征在于,所述预训练语言模型由多个基于注意力机制的编码网络构成,所述编码网络包括多头自注意力网络和前馈神经网络;所述通过预训练语言模型对所述应用程序标识序列进行编码处理,得到应用程序标识词向量,包括:对所述应用程序标识序列进行转换处理,得到所述应用程序标识序列对应的字向量序列、段向量序列和位置向量序列;将所述字向量序列、所述段向量序列和所述位置向量序列的和输入到所述预训练语言模型中进行编码处理,得到应用程序标识词向量。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:基于预构建的掩码语言模型对所述应用程序标识序列进行随机掩码处理,所述随机掩码处理包括按照预设比例对应用程序标识序列进行随机替换处理和随机遮掩处理。4.根据权利要求1所述的方法,其特征在于,所述基于所述应用程序切换行为生成应用程序标识序列,包括:基于所述应用程序切换行为获取应用程序切换数据,所述应用程序切换数据包括终端标识数据、应用程序标识数据以及应用程序切换时间戳;对所述应用程序切换数据进行清洗处理,并根据清洗处理后的应用程序切换数据生成应用程序标识序列。5.根据权利要求4所述的方法,其特征在于,所述对所述应用程序切换数据进行清洗处理包括以下至少一种或者多种处理过程的组合:将检测到所述应用程序切换时间戳出现错误的应用程序切换数据进行过滤处理;将所述应用程序切换时间戳或者所述应用程序标识数据重复上报的应用程序切换数据进行重复项合并处理;将同一所述终端标识数据下的错误数据进行删除处理。6.根据权利要求4所述的方法,其特征在于,所述根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量,包括:获取所述应用程序标识词向量对应的应用程序切换时间戳;根据所述应用程序切换时间戳计算所述应用程序标识序列中各应用程序的使用时间;对所述使用时间进行归一化处理以确定各应用程序的权重数据;基于所述应用程序标识词向量以及所述权重数据确定所述用户对象对应的行为特征向量。7.根据权利要求1至6任意一项所述的方法,其特征在于,所述对所述行为特征向量进行聚类分类,确定所述用户对象的分类结果,包括:
将所述行为特征向量输入到自编码聚类网络中,输出所述用户对象的分类结果。8.一种用户对象分类装置,其特征在于,包括:序列生成模块,用于实时监测用户对象的应用程序切换行为,并基于所述应用程序切换行为生成应用程序标识序列;词向量生成模块,用于通过预训练语言模型对所述应用程序标识序列进行编码处理,得到应用程序标识词向量;特征向量确定模块,用于根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量;分类结果确定模块,用于对所述行为特征向量进行聚类分类,确定所述用户对象的分类结果。9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。10.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。

技术总结
本公开提供一种用户对象分类方法及装置、计算机可读介质和电子设备,涉及数据处理技术领域。该方法包括:实时监测用户对象的应用程序切换行为,并基于所述应用程序切换行为生成应用程序标识序列;通过预训练语言模型对所述应用程序标识序列进行编码处理,得到应用程序标识词向量;根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量;对所述行为特征向量进行聚类分类,确定所述用户对象的分类结果。本公开能够根据用户对象实时的应用程序切换行为生成应用程序标识序列实现对用户对象的分类,有效处理用户兴趣、偏好中的动态性和实时性,及时捕捉用户兴趣的变化,提高了分类结果的准确性,保证了分类结果的时效性。保证了分类结果的时效性。保证了分类结果的时效性。


技术研发人员:苏钰 帅朝春
受保护的技术使用者:杭州逗酷软件科技有限公司
技术研发日:2021.09.18
技术公布日:2023/3/24
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1