基于大数据挖掘的用户画像确定方法及云计算服务系统与流程

文档序号:30510029发布日期:2022-06-25 01:37阅读:95来源:国知局
基于大数据挖掘的用户画像确定方法及云计算服务系统与流程

1.本公开涉及大数据技术领域,具体而言,涉及一种基于大数据挖掘的用户画像确定方法及云计算服务系统。


背景技术:

2.随着大数据和云计算技术的发展,各类互联网服务平台通过提供各式各样的个性化服务,旨在为用户提供便捷的信息内容资讯服务。在个性化服务的开发运营过程中,确定相关用户的用户画像是必不可少的一步。用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等涉及到的关注兴趣数据信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让机器更容易理解用户,并且可以方便计算机处理。
3.在相关技术中,对于用户画像的确定,需要通过大数据挖掘以获得相关的用户关注兴趣数据,大数据挖掘路径可以反映大数据挖掘过程中的业务路径数据,这些业务路径数据通常也会作为用户关注兴趣数据中的一部分进行用户画像分类,以考虑更多维度的特征。然而,当前缺少针对大数据挖掘路径进行优化更新的方案,导致用户画像分类的准确性不佳。


技术实现要素:

4.为了至少克服现有技术中的上述不足,本公开的目的在于提供一种基于大数据挖掘的用户画像确定方法及云计算服务系统。
5.第一方面,本公开提供一种基于大数据挖掘的用户画像确定方法,应用于云计算服务系统,所述云计算服务系统与多个业务使用设备通信连接,所述方法包括:获取第一大数据挖掘模型挖掘到的第一用户关注兴趣数据,其中,所述第一用户关注兴趣数据包括所述第一大数据挖掘模型处于第一大数据挖掘路径序列下所挖掘到的用户关注兴趣数据;在用户关注兴趣数据库中识别与所述第一用户关注兴趣数据匹配的第二用户关注兴趣数据,其中,所述第二用户关注兴趣数据包括第二大数据挖掘模型处于第二大数据挖掘路径序列下所挖掘到的用户关注兴趣数据;根据所述第一大数据挖掘路径序列和所述第二大数据挖掘路径序列,对所述第一大数据挖掘路径序列中的挖掘路径进行更新,得到第三大数据挖掘路径序列;根据所述第三大数据挖掘路径序列,对所述第一用户关注兴趣数据进行更新,得到目标用户关注兴趣数据;对所述目标用户关注兴趣数据进行用户画像分类,获得所述业务用户对应的目标用户画像。
6.譬如,在第一方面的一种基于独立构思的实施例中,所述对所述目标用户关注兴
趣数据进行用户画像分类,获得所述业务用户对应的目标用户画像的步骤,包括:根据预先训练的用户画像分类模型确定所述目标用户关注兴趣数据对应的基础用户画像;获取与所述目标用户关注兴趣数据相关的动态扩展数据,并基于所述用户画像分类模型确定所述动态扩展数据对应的动态扩展画像;根据所述基础用户画像和所述动态扩展画像确定所述业务用户对应的目标用户画像;基于所述业务用户对应的目标用户画像实时向所述业务使用设备推送对应的个性化业务事项链接信息。
7.在第一方面的一种基于独立构思的实施例中,所述获取与所述目标用户关注兴趣数据相关的动态扩展数据的步骤,包括:获取所述目标用户关注兴趣数据的当前关注兴趣节点和其协同互动的关注兴趣节点之间扩展会话流程的扩展会话行为数据;基于所述扩展会话行为数据,确定所述扩展会话流程的参考持续性行为数据;通过所述参考持续性行为数据对预设时序范围内所述扩展会话流程的互动行为实例进行筛选,得到所述预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志;获取所述兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述兴趣触发日志;通过所述兴趣触发日志确定在所述预设时序范围内所述扩展会话流程的动态扩展数据。
8.在第一方面的一种基于独立构思的实施例中,所述参考持续性行为数据包括持续性行为数据的共有行为数据和持续性行为数据的低频行为数据;所述通过所述参考持续性行为数据对预设时序范围内所述扩展会话流程的互动行为实例进行筛选,得到所述预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志,包括:通过所述持续性行为数据的共有行为数据对预设时序范围内所述扩展会话流程的互动行为实例进行筛选,得到所述预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志;在通过所述兴趣触发日志确定在所述预设时序范围内所述扩展会话流程的动态扩展数据之前,还包括:通过所述持续性行为数据的低频行为数据剔除所述兴趣触发日志中不符合第二筛选条件的兴趣触发活动。
9.在第一方面的一种基于独立构思的实施例中,所述扩展会话流程的扩展会话行为数据包括互动行为实例从所述扩展会话流程连接所述当前关注兴趣节点的第一连接流程节点以及互动行为实例连接所述协同互动的关注兴趣节点的第二连接流程节点,所述预设时序范围包括业务投放起始节点至业务投放结束节点之间的第一预设时序范围,以及所述业务投放结束节点之后后一个业务投放起始节点至后一个业务投放结束节点之间的第二预设时序范围;
所述基于所述扩展会话行为数据,确定所述扩展会话流程的参考持续性行为数据包括:基于所述第一连接流程节点和所述第二连接流程节点所处的流程节点范围,确定互动行为实例从所述扩展会话流程激活所述当前关注兴趣节点的第一激活节点,以及互动行为实例激活所述协同互动的关注兴趣节点的第二激活节点;通过所述第二激活节点和所述第一连接流程节点,汇总所述扩展会话流程全部互动行为实例的行为数据;解析所述扩展会话流程全部互动行为实例的行为数据,获取所述持续性行为数据的低频行为数据和所述持续性行为数据的共有行为数据;所述通过所述持续性行为数据的共有行为数据对预设时序范围内所述扩展会话流程的互动行为实例进行筛选,得到所述预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志包括:汇总所述第一激活节点处于所述第一预设时序范围的第一目标互动行为实例,以及所述第一激活节点处于所述第二预设时序范围的第二目标互动行为实例;通过所述第一连接流程节点、所述第一激活节点、所述业务投放起始节点、所述业务投放结束节点和所述行为数据、所述持续性行为数据的共有行为数据之间的对比信息,从所述第一目标互动行为实例中筛选出第一兴趣触发日志和第一兴趣结束日志;以及,通过所述第一连接流程节点、所述第一激活节点、所述后一个业务投放起始节点、所述后一个业务投放结束节点和所述行为数据、所述持续性行为数据的共有行为数据之间的对比信息,从所述第二目标互动行为实例中筛选出第二兴趣触发日志和第二兴趣结束日志;所述获取所述兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述兴趣触发日志包括:获取所述第一兴趣结束日志中的兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述第一兴趣触发日志;以及,获取所述第二兴趣结束日志中的兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述第二兴趣触发日志;所述通过所述持续性行为数据的低频行为数据剔除所述兴趣触发日志中不符合第二筛选条件的兴趣触发活动包括:通过所述持续性行为数据的低频行为数据剔除所述第一兴趣触发日志中不符合第二筛选条件的兴趣触发活动,并剔除所述第二兴趣触发日志中不符合第二筛选条件的兴趣触发活动;所述通过所述兴趣触发日志确定在所述预设时序范围内所述扩展会话流程的动态扩展数据包括:通过剔除处理之后的第一兴趣触发日志确定在所述第一预设时序范围内所述扩展会话流程的动态扩展数据,以及通过剔除处理之后的第二兴趣触发日志确定在所述第二预设时序范围内所述扩展会话流程的动态扩展数据。
10.在第一方面的一种基于独立构思的实施例中,所述解析所述扩展会话流程全部互
动行为实例的行为数据,获取所述持续性行为数据的低频行为数据和所述持续性行为数据的共有行为数据包括:将全部互动行为实例的行为数据进行排序整理,获取行为数据序列;获取所述行为数据序列中的预设频率范围的行为数据,并将所述预设频率范围的行为数据认定为所述持续性行为数据的低频行为数据;筛选所述行为数据序列中设定行为标签范围内的行为数据,并将筛选得到的行为数据的共享行为数据部分认定为所述持续性行为数据的共有行为数据。
11.在第一方面的一种基于独立构思的实施例中,所述基于所述第一连接流程节点和所述第二连接流程节点所处的流程节点范围,确定互动行为实例从所述扩展会话流程激活所述当前关注兴趣节点的第一激活节点,以及互动行为实例激活所述协同互动的关注兴趣节点的第二激活节点包括:如果所述第一连接流程节点处于激活流程节点范围,则将所述第一连接流程节点认定为所述第一激活节点;如果所述第一连接流程节点处于非激活流程节点范围,则将所述非激活流程节点范围完结之后的业务投放起始节点认定为所述第一激活节点;如果所述第二连接流程节点处于激活流程节点范围,则将所述第二连接流程节点认定为所述第二激活节点;如果所述第二连接流程节点处于非激活流程节点范围,则将所述非激活流程节点范围完结之后的业务投放起始节点认定为所述第二激活节点。
12.在第一方面的一种基于独立构思的实施例中,所述通过所述第一连接流程节点、所述第一激活节点、所述业务投放起始节点、所述业务投放结束节点和所述行为数据、所述持续性行为数据的共有行为数据之间的对比信息,从所述第一目标互动行为实例中筛选出第一兴趣触发日志和第一兴趣结束日志包括:将所述第一目标互动行为实例依照所述第一连接流程节点的顺序进行排序;判断整理后的第一目标互动行为实例中第一个互动行为实例是否符合第一预设活动特征;如果是,则将全部所述第一目标互动行为实例认定为非兴趣触发活动;如果不是,则对整理后的第一目标互动行为实例依次进行解析,并基于解析结果将所述第一目标互动行为实例加载到所述第一兴趣触发日志或所述第一兴趣结束日志。
13.在第一方面的一种基于独立构思的实施例中,所述对整理后的第一目标互动行为实例依次进行解析,并基于解析结果将所述第一目标互动行为实例加载到所述第一兴趣触发日志或所述第一兴趣结束日志之前,所述方法包括:将第一结束信息默认配置为第一度量参数;所述对整理后的第一目标互动行为实例依次进行解析,并基于解析结果将所述第一目标互动行为实例加载到所述第一兴趣触发日志或所述第一兴趣结束日志包括:如果当前第一目标互动行为实例的第二激活节点先于所述业务投放起始节点,则将当前第一目标互动行为实例以及后继第一目标互动行为实例认定为所述非兴趣触发活动;如果当前第一目标互动行为实例的第一激活节点和第一连接流程节点之间的行
为衔接度在第一目标行为衔接度内,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的第一激活节点和第一连接流程节点之间的行为衔接度在第一目标行为衔接度内,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的第一连接流程节点小于所述业务投放起始节点,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的第一连接流程节点小于所述业务投放起始节点,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的第一激活节点和在前第一目标互动行为实例的第一激活节点之间的行为衔接度符合第二预设活动特征,则将当前第一目标互动行为实例以及后继第一目标互动行为实例认定为非兴趣触发活动;如果当前第一目标互动行为实例的行为衔接度等于零,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的行为衔接度等于零,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的行为衔接度大于等于所述持续性行为数据的共有行为数据的第一比例行为衔接度,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的行为衔接度大于等于所述持续性行为数据的共有行为数据的所述第一比例行为衔接度,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的行为衔接度小于所述持续性行为数据的共有行为数据的第二比例行为衔接度,则将当前第一目标互动行为实例以及后继第一目标互动行为实例认定为所述非兴趣触发活动;如果当前第一目标互动行为实例的行为数据与所述持续性行为数据的共有行为数据之间的量化对比信息在所述第一比例行为衔接度和所述第二比例行为衔接度之间,则将所述第一结束信息设置为第二度量参数,并将当前第一目标互动行为实例加载到第一兴趣结束日志。
14.在第一方面的一种基于独立构思的实施例中,所述第一比例行为衔接度大于所述第二比例行为衔接度;和/或,所述第一预设活动特征包括如下任一项:所述第一连接流程节点和所述业务投放起始节点之间的行为衔接度大于第一预设行为衔接度;所述第一连接流程节点和所述业务投放起始节点之间的行为衔接度大于第二预
设行为衔接度,且所述第一激活节点和所述第一连接流程节点之间的行为衔接度小于第三预设行为衔接度,且所述行为衔接度小于所述持续性行为数据的共有行为数据的所述第一比例行为衔接度;其中,所述第一预设行为衔接度大于所述第二预设行为衔接度、所述第三预设行为衔接度;和/或,所述第二预设活动特征包括如下任一项:当前第一目标互动行为实例的第一激活节点和在前第一目标互动行为实例的第一激活节点之间的行为衔接度大于第四预设行为衔接度,且第一激活节点小于所述业务投放结束节点;当前第一目标互动行为实例的第一激活节点和在前第一目标互动行为实例的第一激活节点之间的行为衔接度大于第五预设行为衔接度,且所述第一激活节点小于所述业务投放结束节点,且所述第一激活节点和所述第一连接流程节点之间的行为衔接度小于第六预设行为衔接度,且所述行为衔接度小于所述持续性行为数据的共有行为数据的所述第一比例行为衔接度;其中,所述第四预设行为衔接度大于所述第五预设行为衔接度、所述第六预设行为衔接度。
15.第二方面,本公开实施例还提供一种基于大数据挖掘的用户画像确定系统,所述基于大数据挖掘的用户画像确定系统包括云计算服务系统以及与所述云计算服务系统通信连接的多个业务使用设备;所述云计算服务系统,用于:获取第一大数据挖掘模型挖掘到的第一用户关注兴趣数据,其中,所述第一用户关注兴趣数据包括所述第一大数据挖掘模型处于第一大数据挖掘路径序列下所挖掘到的用户关注兴趣数据;在用户关注兴趣数据库中识别与所述第一用户关注兴趣数据匹配的第二用户关注兴趣数据,其中,所述第二用户关注兴趣数据包括第二大数据挖掘模型处于第二大数据挖掘路径序列下所挖掘到的用户关注兴趣数据;根据所述第一大数据挖掘路径序列和所述第二大数据挖掘路径序列,对所述第一大数据挖掘路径序列中的挖掘路径进行更新,得到第三大数据挖掘路径序列;根据所述第三大数据挖掘路径序列,对所述第一用户关注兴趣数据进行更新,得到目标用户关注兴趣数据;对所述目标用户关注兴趣数据进行用户画像分类,获得所述业务用户对应的目标用户画像。
16.根据上述任意一个方面,通过获取第一用户关注兴趣数据,在用户关注兴趣数据库中查找与第一用户关注兴趣数据匹配的第二用户关注兴趣数据,根据第一大数据挖掘路径序列和第二大数据挖掘路径序列,对第一大数据挖掘路径序列中的挖掘路径进行更新,得到第三挖掘路径序列,从而对挖掘路径进行了更新优化,并由此对第一用户关注兴趣数据进行更新,得到目标用户关注兴趣数据后,对目标用户关注兴趣数据进行用户画像分类,获得目标用户关注兴趣数据对应的目标用户画像,从而结合不同形式挖掘到的用户关注兴趣数据来考虑到对大数据挖掘路径进行优化更新的方案,可以提高用户画像分类的准确
性。
附图说明
17.图1为本公开实施例提供的基于大数据挖掘的用户画像确定系统的应用环境示意图;图2为本公开实施例提供的基于大数据挖掘的用户画像确定方法的流程示意图;图3为本公开实施例提供的用于实现上述的基于大数据挖掘的用户画像确定方法的云计算服务系统的结构示意框图。
具体实施方式
18.下面结合说明书附图对本公开进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。
19.图1是本公开一种实施例提供的基于大数据挖掘的用户画像确定系统10的应用环境示意图。基于大数据挖掘的用户画像确定系统10可以包括云计算服务系统100以及与云计算服务系统100通信连接的业务使用设备200。图1所示的基于大数据挖掘的用户画像确定系统10仅为一种可行的示例,在其它可行的实施例中,该基于大数据挖掘的用户画像确定系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。
20.本实施例中,基于大数据挖掘的用户画像确定系统10中的云计算服务系统100和业务使用设备200可以通过配合执行以下方法实施例所描述的基于大数据挖掘的用户画像确定方法,具体云计算服务系统100和业务使用设备200的执行步骤部分可以参照以下方法实施例的详细描述。
21.本实施例提供的基于大数据挖掘的用户画像确定方法可以由图1中所示的云计算服务系统100执行,下面对该基于大数据挖掘的用户画像确定方法进行详细介绍。
22.步骤s110,获取第一大数据挖掘模型挖掘到的第一用户关注兴趣数据,其中,所述第一用户关注兴趣数据包括所述第一大数据挖掘模型处于第一大数据挖掘路径序列下所挖掘到的用户关注兴趣数据。
23.步骤s120,在用户关注兴趣数据库中识别与所述第一用户关注兴趣数据匹配的第二用户关注兴趣数据,其中,所述第二用户关注兴趣数据包括第二大数据挖掘模型处于第二大数据挖掘路径序列下所挖掘到的用户关注兴趣数据。
24.步骤s130,根据所述第一大数据挖掘路径序列和所述第二大数据挖掘路径序列,对所述第一大数据挖掘路径序列中的挖掘路径进行更新,得到第三大数据挖掘路径序列。
25.步骤s140,根据所述第三大数据挖掘路径序列,对所述第一用户关注兴趣数据进行更新,得到目标用户关注兴趣数据,其中,所述目标用户关注兴趣数据中包括每个目标用户关注兴趣点对应的大数据挖掘路径。
26.步骤s150,对所述目标用户关注兴趣数据进行用户画像分类,获得所述业务用户对应的目标用户画像。
27.基于以上步骤,本实施例通过获取第一用户关注兴趣数据,在用户关注兴趣数据库中查找与第一用户关注兴趣数据匹配的第二用户关注兴趣数据,根据第一大数据挖掘路
径序列和第二大数据挖掘路径序列,对第一大数据挖掘路径序列中的挖掘路径进行更新,得到第三挖掘路径序列,从而对挖掘路径进行了更新优化,并由此对第一用户关注兴趣数据进行更新,得到目标用户关注兴趣数据后,对目标用户关注兴趣数据进行用户画像分类,获得目标用户关注兴趣数据对应的目标用户画像,从而结合不同形式挖掘到的用户关注兴趣数据来考虑到对大数据挖掘路径进行优化更新的方案,可以提高用户画像分类的准确性。
28.一种基于同一构思的实施例中,本实施例提供的基于大数据挖掘的用户画像确定方法可以由图1中所示的云计算服务系统100执行,下面对该基于大数据挖掘的用户画像确定方法进行详细介绍。
29.步骤a110,获取第一用户关注兴趣数据,其中,第一用户关注兴趣数据包括第一大数据挖掘路径序列,第一用户关注兴趣数据是根据第一大数据挖掘模型沿第一挖掘业务路径挖掘到的数据确定得到的用户关注兴趣数据,第一挖掘业务路径上包括第一簇挖掘业务单元,第一大数据挖掘路径序列包括第一簇挖掘业务单元中的每关联两个挖掘业务单元上第一大数据挖掘模型的单元挖掘路径、以及在第一簇挖掘业务单元中的每个挖掘业务单元上第一大数据挖掘模型的全局挖掘路径。
30.步骤a120,在用户关注兴趣数据库中查找与第一用户关注兴趣数据匹配的第二用户关注兴趣数据,其中,第二用户关注兴趣数据是根据第二大数据挖掘模型沿第二挖掘业务路径挖掘到的数据确定得到的用户关注兴趣数据,第二挖掘业务路径所对应的挖掘业务路径分布与第一挖掘业务路径对应的挖掘业务路径分布存在交叉分布,第二挖掘业务路径上包括第二簇挖掘业务单元,第二用户关注兴趣数据包括第二大数据挖掘路径序列,第二大数据挖掘路径序列包括第二簇挖掘业务单元中的每关联两个挖掘业务单元上第二大数据挖掘模型的单元挖掘路径、在第二簇挖掘业务单元中的每个挖掘业务单元上第二大数据挖掘模型的全局挖掘路径。
31.步骤a130,根据第一大数据挖掘路径序列和第二大数据挖掘路径序列,对第一大数据挖掘路径序列中的全局挖掘路径以及第二大数据挖掘路径序列中的全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,其中,第三挖掘路径序列和第四挖掘路径序列满足目标限制策略。
32.步骤a140,根据第三挖掘路径序列中的第三组全局挖掘路径,对第一用户关注兴趣数据中的第一组用户关注兴趣数据进行更新,其中,第三挖掘路径序列是将第一大数据挖掘路径序列中的第一组全局挖掘路径更新成第三组全局挖掘路径所得到的挖掘路径序列,第一用户关注兴趣数据是第一大数据挖掘模型沿第一挖掘业务路径挖掘到的用户关注兴趣数据,第一组全局挖掘路径包括第一簇挖掘业务单元中的第三簇挖掘业务单元上第一大数据挖掘模型的全局挖掘路径,第一组用户关注兴趣数据包括第三簇挖掘业务单元上第一大数据挖掘模型挖掘的用户关注兴趣数据。根据第四挖掘路径序列中的第四组全局挖掘路径,对第二用户关注兴趣数据中的第二组用户关注兴趣数据进行更新,获得目标用户关注兴趣数据,其中,第四挖掘路径序列是将第二大数据挖掘路径序列中的第二组全局挖掘路径更新成第四组全局挖掘路径所得到的挖掘路径序列,第二用户关注兴趣数据包括第二用户关注兴趣数据,第二用户关注兴趣数据是第二大数据挖掘模型沿第二挖掘业务路径挖掘到的用户关注兴趣数据,第二组全局挖掘路径包括第二簇挖掘业务单元中的第四簇挖掘
业务单元上第二大数据挖掘模型的全局挖掘路径,第二组用户关注兴趣数据包括第四簇挖掘业务单元上第二大数据挖掘模型挖掘的用户关注兴趣数据。
33.步骤a150,对所述目标用户关注兴趣数据进行用户画像分类,获得所述业务用户对应的目标用户画像。
34.一种独立构思的实施例中,第一大数据挖掘模型上部署有大数据挖掘规则,根据部署的大数据挖掘规则可以获得第一大数据挖掘模型沿挖掘业务路径挖掘的用户关注兴趣数据中的关注兴趣点信息。
35.根据第一用户关注兴趣数据对应的挖掘业务路径分布在用户关注兴趣数据库中查找匹配的第二用户关注兴趣数据,其中,第二用户关注兴趣数据对应的挖掘业务路径分布与第一用户关注兴趣数据对应的挖掘业务路径分布存在部分或全部交叉。也就是说,找到与第一用户关注兴趣数据存在交叉部分的用户关注兴趣数据,该用户关注兴趣数据也是第二大数据挖掘模型沿第二挖掘业务路径挖掘到的数据,该第二大数据挖掘模型可以是第一大数据挖掘模型,即第一用户关注兴趣数据和第二用户关注兴趣数据是同一个大数据挖掘模型沿同一个挖掘业务路径挖掘两轮得到的两个用户关注兴趣数据,也可以是不同的两大数据挖掘模型对象沿同一个挖掘业务路径挖掘到的两个用户关注兴趣数据,还可以是不同的两个大数据挖掘模型对象沿不同的两个挖掘业务路径挖掘到的两个用户关注兴趣数据。
36.换言之,第一用户关注兴趣数据和第二用户关注兴趣数据挖掘可以通过如下方式:方式一:大数据挖掘模型对象1沿挖掘业务路径1挖掘的第一用户关注兴趣数据,大数据挖掘模型对象2沿挖掘业务路径1挖掘的第二用户关注兴趣数据。不同大数据挖掘模型对象通过同一个挖掘业务路径挖掘到的用户关注兴趣数据。
37.方式二:大数据挖掘模型对象1沿挖掘业务路径1挖掘的第一用户关注兴趣数据,大数据挖掘模型对象1沿挖掘业务路径1挖掘的第二用户关注兴趣数据。同一大数据挖掘模型对象通过同一个挖掘业务路径挖掘多遍到的用户关注兴趣数据。
38.方式三:大数据挖掘模型对象1沿挖掘业务路径1挖掘的第一用户关注兴趣数据,大数据挖掘模型对象1沿挖掘业务路径2挖掘的第二用户关注兴趣数据。不同大数据挖掘模型对象通过同一个挖掘业务路径挖掘到的用户关注兴趣数据。
39.例如,用户关注兴趣数据库中可以包括多个用户关注兴趣数据,多个用户关注兴趣数据中的每个用户关注兴趣数据可以包括一个挖掘路径序列,每个用户关注兴趣数据是根据一个大数据挖掘模型沿一条挖掘业务路径挖掘到的数据确定得到的用户关注兴趣数据。用户关注兴趣数据库中的多个用户关注兴趣数据可以是多大数据挖掘模型多次挖掘到的数据,其中,用户关注兴趣数据库中的多个用户关注兴趣数据中的每个用户关注兴趣数据与第一用户关注兴趣数据相似,可以包括一个挖掘路径序列,也就是说,用户关注兴趣数据库中的用户关注兴趣数据和第一用户关注兴趣数据中的数据是相同维度的数据。
40.一种独立构思的实施例中,第二用户关注兴趣数据可以是根据第二大数据挖掘模型沿第二挖掘业务路径挖掘到的数据确定得到的用户关注兴趣数据;还可以是第一大数据挖掘模型沿第二挖掘业务路径挖掘到的数据确定的用户关注兴趣数据,还可以是第一大数据挖掘模型再次沿第一挖掘业务路径挖掘到的数据确定的用户关注兴趣数据。
41.其中,第二挖掘业务路径上可以包括第二簇挖掘业务单元,第二用户关注兴趣数据可以包括第二大数据挖掘路径序列,第二大数据挖掘路径序列包括第二簇挖掘业务单元中的每关联两个挖掘业务单元上第二大数据挖掘模型的单元挖掘路径、在第二簇挖掘业务单元中的每个挖掘业务单元上第二大数据挖掘模型的全局挖掘路径。单元挖掘路径是根据大数据挖掘模型上大数据挖掘规则的规则配置信息确定的,单元挖掘路径是根全局挖掘路径确定的。第二用户关注兴趣数据中的第二大数据挖掘路径序列的确定方式与第一大数据挖掘路径序列的确定方式。
42.一种独立构思的实施例中,可以根据多个挖掘路径序列更新每个挖掘路径序列中挖掘业务单元上大数据挖掘模型的全局业务节点,可以实现多个用户关注兴趣数据共同更新,即实现多个挖掘路径序列的整体更新,进而得到精确的挖掘数据。
43.例如,每个挖掘路径序列中均包括一簇挖掘业务单元,将挖掘业务单元进行相连,得到挖掘业务单元网络,更新整个挖掘业务单元网络,即更新了每个挖掘路径序列的数据,得到多个挖掘路径序列的整体更新。
44.例如,假设包括2个挖掘路径序列,每个挖掘路径序列对应大数据挖掘模型沿挖掘业务路径挖掘的一个用户关注兴趣数据,即2个挖掘路径序列对应2个路径,每个路径对应一个挖掘业务路径,每个路径上的点对应一个挖掘业务单元。
45.根据第一大数据挖掘路径序列中的全局挖掘路径、单元挖掘路径以及第二大数据挖掘路径序列中的全局挖掘路径、单元挖掘路径更新所有挖掘路径序列挖掘业务单元上大数据挖掘模型的全局挖掘路径。
46.如此设计,获取第一用户关注兴趣数据,其中,第一用户关注兴趣数据包括第一大数据挖掘路径序列,第一用户关注兴趣数据是根据第一大数据挖掘模型沿第一挖掘业务路径挖掘到的数据确定得到的用户关注兴趣数据,第一挖掘业务路径上包括第一簇挖掘业务单元,第一大数据挖掘路径序列包括第一簇挖掘业务单元中的每关联两个挖掘业务单元上第一大数据挖掘模型的单元挖掘路径、以及在第一簇挖掘业务单元中的每个挖掘业务单元上第一大数据挖掘模型的全局挖掘路径;在用户关注兴趣数据库中查找与第一用户关注兴趣数据匹配的第二用户关注兴趣数据,其中,第二用户关注兴趣数据是根据第二大数据挖掘模型沿第二挖掘业务路径挖掘到的数据确定得到的用户关注兴趣数据,第二挖掘业务路径所对应的挖掘业务路径分布与第一挖掘业务路径对应的挖掘业务路径分布存在交叉分布,第二挖掘业务路径上包括第二簇挖掘业务单元,第二用户关注兴趣数据包括第二大数据挖掘路径序列,第二大数据挖掘路径序列包括第二簇挖掘业务单元中的每关联两个挖掘业务单元上第二大数据挖掘模型的单元挖掘路径、在第二簇挖掘业务单元中的每个挖掘业务单元上第二大数据挖掘模型的全局挖掘路径;根据第一大数据挖掘路径序列和第二大数据挖掘路径序列,对第一大数据挖掘路径序列中的全局挖掘路径以及第二大数据挖掘路径序列中的全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,其中,第三挖掘路径序列和第四挖掘路径序列满足目标限制策略,实现多个用户关注兴趣数据中的整体更新的目的,即对挖掘路径进行了优化更新,使得挖掘路径损失满足预设限制策略,从而提高后续用户画像分类的准确性,从而经过整体更新后,所有涉及本次用户关注兴趣挖掘的用户关注兴趣数据的挖掘路径信息都获得了优化更新,这些更新会同步到用户关注兴趣数据库中,以便于后续在进行画像分类时不仅考虑到用户关注兴趣特征,也考虑到相关的
精确匹配的挖掘路径特征,提高画像分类的准确性。
47.一种独立构思的实施例中,对第一大数据挖掘路径序列中的全局挖掘路径以及第二大数据挖掘路径序列中的全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,可以包括:s201,根据第一大数据挖掘路径序列和第二大数据挖掘路径序列,确定第一挖掘路径关系网络,其中,第一挖掘路径关系网络包括第一簇挖掘业务单元、第一组挖掘业务关联属性、第二簇挖掘业务单元、第二组挖掘业务关联属性以及第三组挖掘业务关联属性,第一组挖掘业务关联属性包括第一簇挖掘业务单元中每关联两个挖掘业务单元之间的挖掘业务关联属性,第二组挖掘业务关联属性包括第二簇挖掘业务单元中每关联两个挖掘业务单元之间的挖掘业务关联属性,第三组挖掘业务关联属性包括第一簇挖掘业务单元中的挖掘业务单元与第二簇挖掘业务单元中的挖掘业务单元之间的挖掘业务关联属性;s202,获取第三组挖掘业务关联属性中的每条挖掘业务关联属性所连通的两个挖掘业务单元之间的单元挖掘路径;s203,根据第三组挖掘业务关联属性中的每条挖掘业务关联属性所连通的两个挖掘业务单元之间的单元挖掘路径,确定第三组挖掘业务关联属性中是否存在冗余的挖掘业务关联属性;s204,在第三组挖掘业务关联属性中存在冗余的挖掘业务关联属性时,在第一挖掘路径关系网络中隐藏冗余的挖掘业务关联属性,得到第二挖掘路径关系网络;s205,根据第二挖掘路径关系网络,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,其中,第三挖掘路径序列是将第一大数据挖掘路径序列中的第一组全局挖掘路径更新成第三组全局挖掘路径所得到的挖掘路径序列,第四挖掘路径序列是将第二大数据挖掘路径序列中的第二组全局挖掘路径更新成第四组全局挖掘路径所得到的挖掘路径序列。
48.一种独立构思的实施例中,第二大数据挖掘路径序列可以包括一个或多个,如第二大数据挖掘路径序列包括1个,假设包括1个第一大数据挖掘路径序列和1个第二大数据挖掘路径序列,即2个挖掘路径序列,挖掘路径序列编号为w、t,其中,每个挖掘路径序列包括一簇挖掘业务单元中的每关联两个挖掘业务单元上第一大数据挖掘模型的单元挖掘路径、以及在一簇挖掘业务单元中的每个挖掘业务单元上第一大数据挖掘模型的全局挖掘路径。挖掘路径序列w中包括5个挖掘业务单元,挖掘路径序列t包括6个挖掘业务单元,其中,第一组挖掘业务关联属性包括挖掘路径序列w对应的4条挖掘业务关联属性w12、w23、w34、w45,第二组挖掘业务关联属性包括挖掘路径序列t对应的5条挖掘业务关联属性t12、t23、t34、t45、t56,第三组挖掘业务关联属性包括第一簇挖掘业务单元中的挖掘业务单元与第二簇挖掘业务单元中的挖掘业务单元之间挖掘业务关联属性r1至r10。
49.上述根据第一大数据挖掘路径序列和第二大数据挖掘路径序列,确定第一挖掘路径关系网络可以理解为是根据第一大数据挖掘路径序列和第二大数据挖掘路径序列进行连通关系网络配置。
50.一种独立构思的实施例中,需要判断第一挖掘路径关系网络中存在冗余的挖掘业务关联属性,冗余的挖掘业务关联属性是该挖掘业务关联属性在每个连通关系网络中单元
挖掘路径损失不为0,例如,假设挖掘业务关联属性u4在挖掘业务关联属性u3、u4与挖掘业务关联属性w23构成的连通关系网络1中,还存在u4、u5与挖掘业务关联属性t23构成的连通关系网络2中,根据u4所在的两个连通关系网络中的单元挖掘路径的全局损失确定,该挖掘业务关联属性u4是否需要隐藏,需要说明的,挖掘业务关联属性u4在连通关系网络1中的损失ls1等于挖掘业务关联属性u3、u4与挖掘业务关联属性w23对应的单元挖掘路径的连乘积,挖掘业务关联属性u4在连通关系网络2中的损失ls2等于挖掘业务关联属性u4、u5与挖掘业务关联属性t23对应的单元挖掘路径的连乘积,根据损失ls1和ls2确定该挖掘业务关联属性4是否需要隐藏,如在ls1和ls2的和小于0则,隐藏该挖掘业务关联属性4。
51.例如,第二大数据挖掘路径序列可以包括2个,假设包括1个第一大数据挖掘路径序列和2个第二大数据挖掘路径序列,即3个挖掘路径序列,挖掘路径序列编号为w、t、u,其中,每个挖掘路径序列包括一簇挖掘业务单元中的每关联两个挖掘业务单元上第一大数据挖掘模型的单元挖掘路径、以及在一簇挖掘业务单元中的每个挖掘业务单元上第一大数据挖掘模型的全局挖掘路径。挖掘路径序列w中包括5个挖掘业务单元,挖掘路径序列t包括6个挖掘业务单元,挖掘路径序列w中包括5个挖掘业务单元其中,第一组挖掘业务关联属性包括挖掘路径序列w对应的4条挖掘业务关联属性w12、w23、w34、w45,第二组挖掘业务关联属性包括挖掘路径序列t和挖掘路径u对应的9条挖掘业务关联属性t12、t23、t34、t45、t56,u12、u23、u34、u45,第三组挖掘业务关联属性包括第一簇挖掘业务单元中的挖掘业务单元、第二簇挖掘业务单元中的挖掘业务单元、第三簇挖掘业务单元中的挖掘业务单元之间的r1-r15。
52.一种独立构思的实施例中,需要判断第一挖掘路径关系网络中存在冗余的挖掘业务关联属性,冗余的挖掘业务关联属性是该挖掘业务关联属性在每个连通关系网络中单元挖掘路径损失不为0,假设挖掘业务关联属性r5在挖掘业务关联属性r5、r4与挖掘业务关联属性t34构成的连通关系网络1中,还存在r5、r10与r11构成的连通关系网络2中,还存在r5、r9、u23与r11构成的连通关系网络3中,还存在挖掘业务关联属性r5、r6与w23构成的连通关系网络4中,根据r5所在的4个连通关系网络中的单元挖掘路径的全局损失确定,该挖掘业务关联属性r5是否需要隐藏,需要说明的,挖掘业务关联属性r5在连通关系网络1中的损失ls1等于挖掘业务关联属性r5、r4与挖掘业务关联属性w34对应的单元挖掘路径的连乘积,挖掘业务关联属性r5在连通关系网络2中的损失ls2等于挖掘业务关联属性r5、r10与r11对应的单元挖掘路径的连乘积,挖掘业务关联属性r5在连通关系网络3中的损失ls3等于挖掘业务关联属性r5、r9、u23与r11对应的单元挖掘路径的连乘积,挖掘业务关联属性r5在连通关系网络4中的损失ls4等于挖掘业务关联属性r5、r6与w23对应的单元挖掘路径的连乘积,根据损失ls1、ls2、ls3和ls4确定该挖掘业务关联属性r5是否需要隐藏,如在ls1、ls2、ls3和ls4的和小于0则,隐藏该挖掘业务关联属性r5。
53.由上可知,一种独立构思的实施例中,以挖掘业务关联属性为单元,先获取该挖掘业务关联属性所在的所有连通关系网络,其连通关系网络可以包括3挖掘业务关联属性网格、4挖掘业务关联属性网格等多个挖掘业务关联属性的连通关系网络,根据所在的一组连通关系网络中的每个连通关系网络中的挖掘业务关联属性对应的单元挖掘路径,确定该挖掘业务关联属性是否隐藏。
54.按照上述方式,判断第三组挖掘业务关联属性中的每个挖掘业务关联属性是否需
要隐藏,在判断后,将冗余的挖掘业务关联属性隐藏后,得到第二挖掘路径关系网络。根据第二挖掘路径关系网络对大数据挖掘模型的全局挖掘路径进行更新。
55.需要说明的是,挖掘业务关联属性是否需要隐藏可以理解为连通关系网络校验,连通关系网络校验是为了隐藏约束损失较大的挖掘业务关联属性,进而将不满足约束的挖掘业务关联属性隐藏后,得到第二挖掘路径关系网络,根据第二挖掘路径关系网络整体更新得到每个挖掘路径序列中的大数据挖掘模型的全局挖掘路径。
56.一种独立构思的实施例中,根据第三组挖掘业务关联属性中的每条挖掘业务关联属性所连通的两个挖掘业务单元之间的单元挖掘路径,确定第三组挖掘业务关联属性中是否存在冗余的挖掘业务关联属性,可以包括:确定第三组挖掘业务关联属性中的每条挖掘业务关联属性与第一组挖掘业务关联属性以及第二组挖掘业务关联属性中的挖掘业务关联属性形成的连通关系网络,共得到第一组连通关系网络;根据第一组连通关系网络中的每个连通关系网络中的挖掘业务关联属性对应的单元挖掘路径,确定第三组挖掘业务关联属性中是否存在冗余的挖掘业务关联属性。
57.其中,确定第三组挖掘业务关联属性中的每条挖掘业务关联属性与第一组挖掘业务关联属性以及第二组挖掘业务关联属性中的挖掘业务关联属性形成的连通关系网络,共得到第一组连通关系网络,可以包括:在预设的连通关系网络关联属性数包括n个属性数量时,对于n个属性数量中的每个属性数量,执行以下步骤,共得到第一组连通关系网络,其中,n为1或大于1的自然数,在执行以下步骤时,每个属性数量为当前属性数量:确定第三组挖掘业务关联属性中的每条挖掘业务关联属性与第一组挖掘业务关联属性以及第二组挖掘业务关联属性中的挖掘业务关联属性形成的连通关系网络,其中,形成的连通关系网络包括的挖掘业务关联属性的数量为当前属性数量。
58.其中,根据第一组连通关系网络中的每个连通关系网络中的挖掘业务关联属性对应的单元挖掘路径,确定第三组挖掘业务关联属性中是否存在冗余的挖掘业务关联属性,可以包括:对于第三组挖掘业务关联属性中的每条挖掘业务关联属性,执行以下步骤,其中,在执行以下步骤时,每条挖掘业务关联属性为当前挖掘业务关联属性:在第一组连通关系网络中确定包括当前挖掘业务关联属性的第二组连通关系网络;根据第二组连通关系网络中的每个连通关系网络中的挖掘业务关联属性对应的单元挖掘路径,确定当前挖掘业务关联属性的冗余度量参数;在当前挖掘业务关联属性的冗余度量参数不满足预设条件时,将当前挖掘业务关联属性确定为冗余的挖掘业务关联属性。
59.一种独立构思的实施例中,确定连通关系网络1、连通关系网络2、连通关系网络3中的冗余度量参数。
60.一种独立构思的实施例中,根据第二组连通关系网络中的每个连通关系网络中的挖掘业务关联属性对应的单元挖掘路径,确定当前挖掘业务关联属性的冗余度量参数,可以包括:对于第二组连通关系网络中的每个连通关系网络,执行以下步骤,其中,在执行以下步骤时,每个连通关系网络为当前连通关系网络:将当前连通关系网络中的每条挖掘业务关联属性对应的单元挖掘路径转换成挖掘路径网格,得到一组挖掘路径网格,其中,挖掘路径网格中的参数用于表示单元挖掘路径中的挖掘业务节点和挖掘维度;根据一组挖掘路径网格,确定当前连通关系网络对应的冗余度量参数;根据第二组连通关系网络中的每个
连通关系网络对应的冗余度量参数,确定当前挖掘业务关联属性的冗余度量参数。
61.需要说明的是,根据一组挖掘路径网格,确定当前连通关系网络对应的冗余度量参数,可以包括:将一组挖掘路径网格按照预设顺序进行一次融合,得到目标网格,其中,目标网格中的参数用于表示目标单元挖掘路径中的挖掘业务节点和挖掘维度,目标单元挖掘路径为当前连通关系网络中的每条挖掘业务关联属性对应的单元挖掘路径所形成的累计单元挖掘路径;将目标网格中的参数转换为目标冗余变量;根据目标冗余变量,确定当前连通关系网络对应的冗余度量参数。
62.一种独立构思的实施例中,根据连通关系网络中的每条挖掘业务关联属性的单元挖掘路径计算得到该边的一个损失数值,其计算过程为,将相位挖掘路径转换为挖掘路径网格,将每个单元挖掘路径的挖掘路径网格相乘得到目标网格,将目标网格中的参数转换为目标冗余变量;根据目标冗余变量,确定当前连通关系网络对应的冗余度量参数。
63.一种独立构思的实施例中,根据第二组连通关系网络中的每个连通关系网络对应的冗余度量参数,确定当前挖掘业务关联属性的冗余度量参数,可以包括:将第二组连通关系网络中的每个连通关系网络对应的冗余度量参数的累加值确定为当前挖掘业务关联属性的冗余度量参数的参数。
64.其中,在当前挖掘业务关联属性的冗余度量参数不满足预设条件时,将当前挖掘业务关联属性确定为冗余的挖掘业务关联属性,可以包括:在当前挖掘业务关联属性的冗余度量参数的参数小于0时,将当前挖掘业务关联属性确定为冗余的挖掘业务关联属性。
65.一种独立构思的实施例中,根据第二挖掘路径关系网络,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,可以包括:根据第一限制策略,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,其中,第一限制策略是根据第二挖掘路径关系网络中的第四组挖掘业务关联属性对应的单元挖掘路径确定得到的限制策略,目标限制策略可以包括第一限制策略。
66.其中,根据第一限制策略,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,可以包括:对第一大数据挖掘路径序列中的全局挖掘路径以及第二大数据挖掘路径序列中的全局挖掘路径进行更新,使得第二挖掘路径关系网络中的各挖掘业务关联属性已获取的单元挖掘路径与各挖掘业务关联属性重新计算的单元挖掘路径之间的损失之和最小,其中,各挖掘业务关联属性重新计算的单元挖掘路径是通过各挖掘业务关联属性所连通的挖掘业务单元上的全局挖掘路径计算得到的单元挖掘路径。
67.一种独立构思的实施例中,根据第二挖掘路径关系网络,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,可以包括:根据第二限制策略,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,其中,第二限制策略是根据第二挖掘路径关系网络中的第四组挖掘业务关联属性对应的单元挖掘路径和第一组先验挖掘路径确定得到的限制策略,第四组挖掘业务
关联属性包括第三组挖掘业务关联属性中除冗余的挖掘业务关联属性之外的挖掘业务关联属性,第一组先验挖掘路径中的每个先验挖掘路径为第一簇挖掘业务单元中的一个挖掘业务单元的先验挖掘路径,目标限制策略包括第二限制策略。
68.其中,根据第二限制策略,对第一大数据挖掘路径序列中的第一组全局挖掘路径以及第二大数据挖掘路径序列中的第二组全局挖掘路径进行更新,得到第三挖掘路径序列和第四挖掘路径序列,还可以包括:对第一大数据挖掘路径序列中的全局挖掘路径以及第二大数据挖掘路径序列中的全局挖掘路径进行更新,使得第一全局损失与第二全局损失之和最小,其中,第一全局损失是第二挖掘路径关系网络中的各挖掘业务关联属性已获取的单元挖掘路径与各挖掘业务关联属性重新计算的单元挖掘路径之间的损失之和,各挖掘业务关联属性重新计算的单元挖掘路径是通过各挖掘业务关联属性所连通的挖掘业务单元上的全局挖掘路径计算得到的单元挖掘路径,第二全局损失是第一组先验挖掘路径中的每个先验挖掘路径与对应的挖掘业务单元上的全局挖掘路径之间的损失之和。
69.一种独立构思的实施例中,可以根据第一大数据挖掘模型挖掘的挖掘路径确定为先验挖掘路径,进行辅助确定第一大数据挖掘模型对应挖掘业务单元上的全局挖掘路径。
70.一种独立构思的实施例中,对于步骤s140,本公开实施例进一步提供一种基于人工智能和用户画像的个性化推送方法,可以通过以下步骤实现。
71.步骤b110,根据预先训练的用户画像分类模型确定所述目标用户关注兴趣数据对应的基础用户画像。
72.步骤b120,获取与所述目标用户关注兴趣数据相关的动态扩展数据,并基于所述用户画像分类模型确定所述动态扩展数据对应的动态扩展画像。
73.步骤b130,根据所述基础用户画像和所述动态扩展画像确定所述业务用户对应的目标用户画像。
74.步骤b140,基于所述业务用户对应的目标用户画像实时向所述业务使用设备推送对应的个性化业务事项链接信息。
75.本实施例中,该预先训练的用户画像分类模型可以基于预先收集的用户关注兴趣数据样本以及用户关注兴趣数据样本对应的用户标签标签向量训练获得。
76.本实施例中,目标用户关注兴趣数据相关的动态扩展数据可以是指与目标用户关注兴趣数据的当前关注兴趣节点存在业务会话协同关系的其它兴趣关联数据。
77.本实施例中,在步骤b130中,可以将所述基础用户画像和所述动态扩展画像进行画像标签向量的融合以确定所述业务用户对应的目标用户画像,例如可以将所述基础用户画像的画像标签向量集合中不包括所述动态扩展画像相关的扩展画像标签向量融合到所述基础用户画像的画像标签向量集合中,获得目标用户画像。
78.本实施例中,在步骤b140中,在基于所述业务用户对应的目标用户画像实时向所述业务使用设备推送对应的个性化业务事项链接信息的过程中,可以根据所述目标用户画像,预测所述业务用户分别点击各候选个性化业务事项连接信息的点击倾向参数,根据各所述点击倾向参数,确定各所述候选个性化业务事项连接信息的潜在个性化业务事项后,将所述潜在个性化业务事项推送给所述业务使用设备。
79.基于以上步骤,本实施例根据预先训练的用户画像分类模型确定目标用户关注兴趣数据对应的基础用户画像,在此基础上进一步获取与目标用户关注兴趣数据相关的动态
扩展数据,并基于用户画像分类模型确定动态扩展数据对应的动态扩展画像,从而可以根据基础用户画像和动态扩展画像确定业务用户对应的目标用户画像,并基于业务用户对应的目标用户画像实时向业务使用设备推送对应的个性化业务事项链接信息,考虑不仅考虑到了用户关注兴趣数据,也进一步考虑到相关的动态扩展数据,由此进行基础用户画像优化后进行个性化业务事项链接信息的推送,可以提高推送的准确性。
80.一种独立构思的实施例中,针对步骤b120,本公开实施例进一步提供一种基于大数据的用户画像挖掘数据扩展方法,可以通过以下步骤实现。
81.步骤c11:获取所述目标用户关注兴趣数据的当前关注兴趣节点和其协同互动的关注兴趣节点之间扩展会话流程的扩展会话行为数据。
82.一种基于独立构思的实施例中,扩展会话行为数据可以包括由会话应用程序检测得到的互动行为实例连接关注兴趣节点的信息,如:连接流程节点等等,此外,扩展会话行为数据还可以包括关注兴趣节点的状态数据,如:业务投放起始节点、业务投放结束节点等等。
83.步骤c12:基于扩展会话行为数据,确定扩展会话流程的参考持续性行为数据。
84.一种基于独立构思的实施例中,参考持续性行为数据可以理解为持续性行为数据的参考数据。例如,可以分别基于第一连接流程节点和第二连接流程节点所处的流程节点范围,确定互动行为实例从扩展会话流程激活当前关注兴趣节点的第一激活节点,以及互动行为实例激活协同互动的关注兴趣节点的第二激活节点,从而通过确定第二激活节点和第一连接流程节点之间的行为衔接度。
85.一种基于独立构思的实施例中的参考持续性行为数据可以包括但不限于:持续性行为数据的低频行为数据、持续性行为数据的共有行为数据。
86.步骤c13:通过参考持续性行为数据对预设时序范围内扩展会话流程的互动行为实例进行筛选,得到预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志。
87.步骤c14:获取兴趣结束活动的行为数据,并将行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到兴趣触发日志。
88.步骤c15:通过兴趣触发日志确定在预设时序范围内扩展会话流程的动态扩展数据。
89.基于以上步骤,通过获取当前关注兴趣节点和其协同互动的关注兴趣节点之间扩展会话流程的扩展会话行为数据,确定扩展会话流程的参考持续性行为数据,从而通过参考持续性行为数据对预设时序范围内扩展会话流程的互动行为实例进行筛选,得到预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志,可以规避非兴趣触发活动对确定动态扩展数据的影响。并且,再将行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到兴趣触发日志,从而可以通过兴趣触发日志确定在预设时序范围内扩展会话流程的动态扩展数据,提高动态扩展数据的准确性。
90.一种基于独立构思的实施例中,所述参考持续性行为数据包括持续性行为数据的共有行为数据和持续性行为数据的低频行为数据。步骤c13具体可以通过所述持续性行为数据的共有行为数据对预设时序范围内所述扩展会话流程的互动行为实例进行筛选,得到
所述预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志。
91.一种基于独立构思的实施例中,在通过所述兴趣触发日志确定在所述预设时序范围内所述扩展会话流程的动态扩展数据之前,还包括:通过所述持续性行为数据的低频行为数据剔除所述兴趣触发日志中不符合第二筛选条件的兴趣触发活动。
92.一种基于独立构思的实施例中,所述扩展会话流程的扩展会话行为数据包括互动行为实例从所述扩展会话流程连接所述当前关注兴趣节点的第一连接流程节点以及互动行为实例连接所述协同互动的关注兴趣节点的第二连接流程节点,所述预设时序范围包括业务投放起始节点至业务投放结束节点之间的第一预设时序范围,以及所述业务投放结束节点之后后一个业务投放起始节点至后一个业务投放结束节点之间的第二预设时序范围;一种基于独立构思的实施例中,基于所述扩展会话行为数据,确定所述扩展会话流程的参考持续性行为数据包括:步骤c101,基于所述第一连接流程节点和所述第二连接流程节点所处的流程节点范围,确定互动行为实例从所述扩展会话流程激活所述当前关注兴趣节点的第一激活节点,以及互动行为实例激活所述协同互动的关注兴趣节点的第二激活节点;步骤c102,通过所述第二激活节点和所述第一连接流程节点,汇总所述扩展会话流程全部互动行为实例的行为数据;步骤c103,解析所述扩展会话流程全部互动行为实例的行为数据,获取所述持续性行为数据的低频行为数据和所述持续性行为数据的共有行为数据;一种基于独立构思的实施例中,所述通过所述持续性行为数据的共有行为数据对预设时序范围内所述扩展会话流程的互动行为实例进行筛选,得到所述预设时序范围内覆盖至少一个兴趣触发活动的兴趣触发日志和覆盖至少一个兴趣结束活动的兴趣结束日志包括:步骤c201,汇总所述第一激活节点处于所述第一预设时序范围的第一目标互动行为实例,以及所述第一激活节点处于所述第二预设时序范围的第二目标互动行为实例;步骤c202,通过所述第一连接流程节点、所述第一激活节点、所述业务投放起始节点、所述业务投放结束节点和所述行为数据、所述持续性行为数据的共有行为数据之间的对比信息,从所述第一目标互动行为实例中筛选出第一兴趣触发日志和第一兴趣结束日志;步骤c203,通过所述第一连接流程节点、所述第一激活节点、所述后一个业务投放起始节点、所述后一个业务投放结束节点和所述行为数据、所述持续性行为数据的共有行为数据之间的对比信息,从所述第二目标互动行为实例中筛选出第二兴趣触发日志和第二兴趣结束日志;一种基于独立构思的实施例中,步骤c14中获取所述兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述兴趣触发日志包括:步骤c301,获取所述第一兴趣结束日志中的兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述第一兴趣触发日志;
步骤c302,获取所述第二兴趣结束日志中的兴趣结束活动的行为数据,并将所述行为数据符合第一筛选条件的兴趣结束活动认定为兴趣触发活动并加载到所述第二兴趣触发日志;所述通过所述持续性行为数据的低频行为数据剔除所述兴趣触发日志中不符合第二筛选条件的兴趣触发活动包括:通过所述持续性行为数据的低频行为数据剔除所述第一兴趣触发日志中不符合第二筛选条件的兴趣触发活动,并剔除所述第二兴趣触发日志中不符合第二筛选条件的兴趣触发活动。
93.所述通过所述兴趣触发日志确定在所述预设时序范围内所述扩展会话流程的动态扩展数据包括:通过剔除处理之后的第一兴趣触发日志确定在所述第一预设时序范围内所述扩展会话流程的动态扩展数据,以及通过剔除处理之后的第二兴趣触发日志确定在所述第二预设时序范围内所述扩展会话流程的动态扩展数据。
94.一种基于独立构思的实施例中,所述解析所述扩展会话流程全部互动行为实例的行为数据,获取所述持续性行为数据的低频行为数据和所述持续性行为数据的共有行为数据包括:将全部互动行为实例的行为数据进行排序整理,获取行为数据序列;获取所述行为数据序列中的预设频率范围的行为数据,并将所述预设频率范围的行为数据认定为所述持续性行为数据的低频行为数据;筛选所述行为数据序列中设定行为标签范围内的行为数据,并将筛选得到的行为数据的共享行为数据部分认定为所述持续性行为数据的共有行为数据。
95.一种基于独立构思的实施例中,所述基于所述第一连接流程节点和所述第二连接流程节点所处的流程节点范围,确定互动行为实例从所述扩展会话流程激活所述当前关注兴趣节点的第一激活节点,以及互动行为实例激活所述协同互动的关注兴趣节点的第二激活节点包括:如果所述第一连接流程节点处于激活流程节点范围,则将所述第一连接流程节点认定为所述第一激活节点;如果所述第一连接流程节点处于非激活流程节点范围,则将所述非激活流程节点范围完结之后的业务投放起始节点认定为所述第一激活节点;如果所述第二连接流程节点处于激活流程节点范围,则将所述第二连接流程节点认定为所述第二激活节点;如果所述第二连接流程节点处于非激活流程节点范围,则将所述非激活流程节点范围完结之后的业务投放起始节点认定为所述第二激活节点。
96.一种基于独立构思的实施例中,所述通过所述第一连接流程节点、所述第一激活节点、所述业务投放起始节点、所述业务投放结束节点和所述行为数据、所述持续性行为数据的共有行为数据之间的对比信息,从所述第一目标互动行为实例中筛选出第一兴趣触发日志和第一兴趣结束日志包括:将所述第一目标互动行为实例依照所述第一连接流程节点的顺序进行排序;判断整理后的第一目标互动行为实例中第一个互动行为实例是否符合第一预设活动特征;如果是,则将全部所述第一目标互动行为实例认定为非兴趣触发活动;如果不是,则对整理后的第一目标互动行为实例依次进行解析,并基于解析结果将所述第一目标互动行为实例加载到所述第一兴趣触发日志或所述第一兴趣结束日志。
97.一种基于独立构思的实施例中,所述对整理后的第一目标互动行为实例依次进行解析,并基于解析结果将所述第一目标互动行为实例加载到所述第一兴趣触发日志或所述第一兴趣结束日志之前,所述方法包括:将第一结束信息默认配置为第一度量参数。
98.所述对整理后的第一目标互动行为实例依次进行解析,并基于解析结果将所述第
一目标互动行为实例加载到所述第一兴趣触发日志或所述第一兴趣结束日志包括:如果当前第一目标互动行为实例的第二激活节点先于所述业务投放起始节点,则将当前第一目标互动行为实例以及后继第一目标互动行为实例认定为所述非兴趣触发活动;如果当前第一目标互动行为实例的第一激活节点和第一连接流程节点之间的行为衔接度在第一目标行为衔接度内,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的第一激活节点和第一连接流程节点之间的行为衔接度在第一目标行为衔接度内,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的第一连接流程节点小于所述业务投放起始节点,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的第一连接流程节点小于所述业务投放起始节点,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的第一激活节点和在前第一目标互动行为实例的第一激活节点之间的行为衔接度符合第二预设活动特征,则将当前第一目标互动行为实例以及后继第一目标互动行为实例认定为非兴趣触发活动;如果当前第一目标互动行为实例的行为衔接度等于零,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的行为衔接度等于零,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的行为衔接度大于等于所述持续性行为数据的共有行为数据的第一比例行为衔接度,且所述第一结束信息的结束度量参数为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣触发日志;如果当前第一目标互动行为实例的行为衔接度大于等于所述持续性行为数据的共有行为数据的所述第一比例行为衔接度,且所述第一结束信息的结束度量参数不为所述第一度量参数,则将当前第一目标互动行为实例加载到所述第一兴趣结束日志;如果当前第一目标互动行为实例的行为衔接度小于所述持续性行为数据的共有行为数据的第二比例行为衔接度,则将当前第一目标互动行为实例以及后继第一目标互动行为实例认定为所述非兴趣触发活动;如果当前第一目标互动行为实例的行为数据与所述持续性行为数据的共有行为数据之间的量化对比信息在所述第一比例行为衔接度和所述第二比例行为衔接度之间,则将所述第一结束信息设置为第二度量参数,并将当前第一目标互动行为实例加载到第一兴趣结束日志。
99.一种基于独立构思的实施例中,所述第一比例行为衔接度大于所述第二比例行为衔接度;和/或,所述第一预设活动特征包括如下任一项:所述第一连接流程节点和所述业务投放起始节点之间的行为衔接度大于第一预设行为衔接度;所述第一连接流程节点和所述业务投放起始节点之间的行为衔接度大于第二预设行为衔接度,且所述第一激活节点和所述第一连接流程节点之间的行为衔接度小于第三预设行为衔接度,且所述行为衔接度小于所述持续性行为数据的共有行为数据的所述第一比例行为衔接度;其中,所述第一预设行为衔接度大于所述第二预设行为衔接度、所述第三预设行为衔接度;和/或,所述第二预设活动特征包括如下任一项:当前第一目标互动行为实例的
第一激活节点和在前第一目标互动行为实例的第一激活节点之间的行为衔接度大于第四预设行为衔接度,且第一激活节点小于所述业务投放结束节点;当前第一目标互动行为实例的第一激活节点和在前第一目标互动行为实例的第一激活节点之间的行为衔接度大于第五预设行为衔接度,且所述第一激活节点小于所述业务投放结束节点,且所述第一激活节点和所述第一连接流程节点之间的行为衔接度小于第六预设行为衔接度,且所述行为衔接度小于所述持续性行为数据的共有行为数据的所述第一比例行为衔接度;其中,所述第四预设行为衔接度大于所述第五预设行为衔接度、所述第六预设行为衔接度。
100.图3示出了本公开实施例提供的用于实现上述的基于大数据挖掘的用户画像确定方法的云计算服务系统100的硬件结构意图,如图3所示,云计算服务系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
101.在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机可执行指令,使得处理器110可以执行如上方法实施例的基于大数据挖掘的用户画像确定方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作,从而可以与前述的业务使用设备200进行数据收发。
102.处理器110的具体实现过程可参见上述云计算服务系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
103.此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机可执行指令,当处理器执行所述计算机可执行指令时,实现如上基于大数据挖掘的用户画像确定方法。
104.最后,应当理解的是,本说明书中实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导匹配。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1