基于大数据分析的用户行为意图挖掘方法及大数据系统与流程

文档序号:30841562发布日期:2022-07-23 00:38阅读:244来源:国知局
基于大数据分析的用户行为意图挖掘方法及大数据系统与流程

1.本发明涉及大数据分析技术领域,具体而言,涉及一种基于大数据分析的用户行为意图挖掘方法及大数据系统。


背景技术:

2.随着互联网信息技术中的发展,越来越多的互联网产品上线,可以为用户提供各种需求的互联网产品服务,用户在互联网信息平台中的行为意图可以表征用户针对某个互联网产品页面中的关注点特征,以用户行为意图作为基本特征对用户以及文本内容进行建模,从而支持内容精准、个性化分发。然而,在相关技术中的意图挖掘输出过程中,没有针对关联性特征和非关联性特征进行可靠分析,导致意图分析可靠性不佳。


技术实现要素:

3.为了至少克服现有技术中的上述不足,本发明的目的在于提供一种基于大数据分析的用户行为意图挖掘方法及大数据系统。
4.第一方面,本发明实施例提供一种基于大数据分析的用户行为意图挖掘方法,应用于大数据系统,所述方法包括:基于用户行为大数据获取待挖掘的第一预设数量个用户行为事件中各个用户行为事件相关联的第一行为关注变量簇,所述第一行为关注变量簇为依据第一关注性节点内的初始行为事件进行特征抽取获得;依据第二预设数量个行为倾向提取维度对各个所述用户行为事件相关联的第一行为关注变量簇进行分析,确定各个所述用户行为事件相关联的第一行为倾向变量,所述第一行为倾向变量包括第二预设数量个第一意图度量信息,各第一意图度量信息对应于一个行为倾向提取维度;基于各个所述用户行为事件相关联的第一行为倾向变量,对所述第一预设数量个用户行为事件进行分簇,并在达到分簇结束要求时,确定对应于所述第一关注性节点的每个分簇特征分布,其中,所述每个分簇特征分布用于表征各个所述用户行为事件对应于所述第一关注性节点的关联性特征和非关联性特征;对对应于所述第一关注性节点的每个分簇特征分布进行意图输出,确定各个用户行为事件相关联的用户行为意图。
5.针对第一方面的一些可能的实施方式,所述对对应于所述第一关注性节点的每个分簇特征分布进行意图输出,确定各个用户行为事件相关联的用户行为意图,包括:将对应于所述第一关注性节点的每个分簇特征分布输入到用户行为意图挖掘模型中,确定各个用户行为事件相关联的用户行为意图;其中,所述用户行为意图挖掘模型的训练步骤包括:获取范例分簇特征分布序列,所述范例分簇特征分布序列包括多个标定了范例学习行为意图的范例分簇特征分布;
获取范例用户行为意图挖掘模型,所述范例用户行为意图挖掘模型包括深度卷积编码分支、行为意图输出分支、以及意图连通分支;对于每个所述范例分簇特征分布,结合所述深度卷积编码分支获取所述范例分簇特征分布在多个产品应用节点下的深度卷积编码特征分布;结合所述行为意图输出分支将每个所述产品应用节点下的深度卷积编码特征分布进行行为意图输出,输出每个所述产品应用节点下的深度卷积编码特征分布对应的成员行为意图;结合所述意图连通分支基于所述产品应用节点下的深度卷积编码特征分布对应的成员行为意图得到一输出行为意图;结合所述输出行为意图与所述范例学习行为意图确定第一意图挖掘代价值;结合所述第一意图挖掘代价值对所述范例用户行为意图挖掘模型进行模型参数层的遍历调优和选取,直至所述第一意图挖掘代价值满足第一决策条件,输出调优完成的范例用户行为意图挖掘模型作为所述用户行为意图挖掘模型;其中,所述第一意图挖掘代价值由各所述输出行为意图中的各学习行为意图与所述范例学习行为意图中对应的各学习行为意图的第一损失函数评估值进行确定,所述第一决策条件包括所述第一意图挖掘代价值表征的第一损失函数评估值小于第一预设损失函数值。
6.所述用户行为意图挖掘模型的训练步骤还包括:获取范例分簇特征分布序列,所述范例分簇特征分布序列包括多个标定了范例学习行为意图的范例分簇特征分布;获取范例用户行为意图挖掘模型,并对所述范例用户行为意图挖掘模型进行线上共享模型参数层信息的加载与配置,输出初步配置的范例用户行为意图挖掘模型;对于每个所述范例分簇特征分布,结合所述范例用户行为意图挖掘模型获取所述范例分簇特征分布在多个产品应用节点下的深度卷积编码特征分布,并结合所述产品应用节点下的深度卷积编码特征分布以及所述范例学习行为意图包括的成员行为意图确定第二意图挖掘代价值;结合所述第二意图挖掘代价值对所述初步配置的范例用户行为意图挖掘模型进行模型参数层的遍历调优和选取,直至所述第二意图挖掘代价值满足第二决策条件,输出调优完成的范例用户行为意图挖掘模型作为所述用户行为意图挖掘模型;譬如,针对第一方面的一些可能的实施方式,所述第二意图挖掘代价值由各所述产品应用节点下的深度卷积编码特征分布与所述范例学习行为意图中对应的各学习行为意图的第二损失函数评估值进行确定,所述第二决策条件包括所述第二意图挖掘代价值表征的第二损失函数评估值小于第二预设损失函数值,所述第二预设损失函数值小于所述第一预设损失函数值。
7.其中,所述获取范例分簇特征分布序列,包括:结合多个产品开发项目获取目标互联网产品场景下的关注性节点的分簇特征分布,输出多个分簇特征分布;将各所述分簇特征分布作为范例分簇特征分布加载到预设的范例特征库中;提取所述范例特征库中的各所述范例分簇特征分布在多个产品应用节点下的深
度卷积编码特征分布,输出每个范例分簇特征分布对应的深度卷积编码特征分布;结合每个所述范例分簇特征分布对应的深度卷积编码特征分布,对所述范例特征库中的范例分簇特征分布进行特征冗余优化,输出特征冗余优化后的范例特征库;结合特征冗余优化后的范例特征库中各范例分簇特征分布对应的深度卷积编码特征分布得到所述范例分簇特征分布对应的范例学习行为意图,并将所述学习行为意图与所述范例分簇特征分布在所述范例特征库中进行关联性设置,输出所述范例分簇特征分布序列;其中,结合每个所述范例分簇特征分布对应的深度卷积编码特征分布,对所述范例特征库中的范例分簇特征分布进行特征冗余优化,得的特征冗余优化后的范例特征库,包括:针对每个所述范例分簇特征分布,确定所述范例分簇特征分布对应的所述深度卷积编码特征分布中是否存在指定噪声特征;若存在指定噪声特征,则将所述范例分簇特征分布从所述范例分簇特征分布序列中删除;其中,所述指定噪声特征包括所述范例分簇特征分布对应的深度卷积编码特征分布中未关联于预先配置的产品应用节点下的深度卷积编码特征分布或者未关联于预设数量个产品应用节点下的深度卷积编码特征分布。
8.其中,所述获取范例分簇特征分布序列,还包括:复制所述范例分簇特征分布序列中一部分范例分簇特征分布作为模糊分簇特征分布;将所述模糊分簇特征分布对应的成员行为意图中的一个或者多个产品应用节点对应的成员行为意图进行关联性意图配置;将关联性意图配置后的模糊分簇特征分布作为关联性分簇特征分布加载到所述范例分簇特征分布序列,并对加载到所述关联性分簇特征分布后的范例分簇特征分布序列进行整理,输出整理量后的范例分簇特征分布序列。
9.第二方面,本发明实施例还提供一种大数据系统,所述大数据系统包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以实现以上第一方面的基于大数据分析的用户行为意图挖掘方法。
10.采用以上任意方面的技术方案,分别基于用户行为大数据获取每个用户行为事件相关联的第一行为关注变量簇,依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第一行为关注变量簇进行分析,确定每个用户行为事件相关联的第一行为倾向变量,基于每个用户行为事件相关联的第一行为倾向变量,对第一预设数量个用户行为事件进行分簇,并在达到分簇结束要求时,确定对应于第一关注性节点的每个分簇特征分布,对对应于第一关注性节点的每个分簇特征分布进行意图输出,确定每个用户行为事件相关联的用户行为意图。由此,在用户行为意图挖掘之前通过基于行为倾向提取维度确定第一关注性节点的每个分簇特征分布,可以提高意图挖掘输出过程中针对关联性特征和非关联性特征的分析性能,进而提高意图分析可靠性。
附图说明
11.图1为本发明实施例提供的基于大数据分析的用户行为意图挖掘方法的流程示意图;图2为本发明实施例提供的用于实现上述的基于大数据分析的用户行为意图挖掘方法的大数据系统的结构示意框图。
具体实施方式
12.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及它们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
13.下面介绍本发明一种实施例提供的基于大数据分析的用户行为意图挖掘系统10的架构,该基于大数据分析的用户行为意图挖掘系统10可以包括大数据系统100以及与大数据系统100通信连接的用户应用服务器200。其中,基于大数据分析的用户行为意图挖掘系统10中的大数据系统100和用户应用服务器200可以通过配合执行以下方法实施例所描述的基于大数据分析的用户行为意图挖掘方法,具体大数据系统100和用户应用服务器200的执行步骤部分可以参照以下方法实施例的详细描述。
14.本实施例提供的基于大数据分析的用户行为意图挖掘方法可以由大数据系统100执行,下面结合图1对该基于大数据分析的用户行为意图挖掘方法进行详细介绍。
15.process110、基于用户行为大数据获取待挖掘的第一预设数量个用户行为事件中各个用户行为事件相关联的第一行为关注变量簇,所述第一行为关注变量簇为依据第一关注性节点内的初始行为事件进行特征抽取获得,n为大于1的整数;针对一些可能的设计思路而言,大数据系统100可确定待挖掘的第一预设数量个用户行为事件。例如,将某个用户应用中的所有用户行为事件或者部分用户行为事件作为待挖掘的用户行为事件。大数据系统100基于用户行为大数据提取第一关注性节点内每个用户行为事件的第一行为关注变量,第一行为关注变量是基于初始行为事件获取到的。第一预设数量个第一行为关注变量即构成第一行为关注变量簇。
16.值得说明的是,本发明中涉及的用户行为事件是指任意与用户在线上应用中的操作行为相关的事件,例如用户发起的在线咨询事件,用户发起的订阅事件,用户发起的直播互动事件等,但不限制于此。
17.值得说明的是,第一关注性节点的特征范围可以基于实际需求进行设定,例如可以设定业务字段a到业务字段f之间的业务节点为第一关注性节点。
18.大数据系统100可部署于云计算服务器,或者,部署于计算机终端,又或者,部署于由云计算服务器和计算机终端组成的系统。
19.process120、依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第一行为关注变量簇进行分析,确定每个用户行为事件相关联的第一行为倾向变量,第
一行为倾向变量包括第二预设数量个第一意图度量信息,各第一意图度量信息对应于一个行为倾向提取维度;针对一些可能的设计思路而言,大数据系统100在获得第一行为关注变量簇之后,可以对这些第一行为关注变量进行分析,即依据不同的行为倾向提取维度分别统计每个用户行为事件的行为倾向变量。假设有第二预设数量个行为倾向提取维度,那么挖掘的行为倾向变量包括第二预设数量个第一意图度量信息。
20.process130、基于每个用户行为事件相关联的第一行为倾向变量,对第一预设数量个用户行为事件进行分簇,并在达到分簇结束要求时,确定对应于第一关注性节点的每个分簇特征分布。
21.针对一些可能的设计思路而言,大数据系统100在得到第一预设数量个第一行为倾向变量之后,可采用分簇方法对这第一预设数量个第一行为倾向变量进行分簇,在达到分簇结束要求时,即停止分簇,并得到对应于第一关注性节点的每个分簇特征分布。其中,分簇会依据某个依据数值(例如关联代价值),将一个第一预设数量个用户行为事件拆分成不同的簇,使得同一个簇内的用户行为事件之间的关联性尽可能大,同时不在同一个簇中的用户行为事件的区别性也尽可能大。其中,所述每个分簇特征分布用于表征各个所述用户行为事件对应于所述第一关注性节点的关联性特征和非关联性特征;。
22.例如,当分簇次数达到预设次数时,可以确定达到分簇结束要求。或者,当分簇关联代价值小于或等于关联代价值阈值时,可以确定达到分簇结束要求。
23.值得说明的是,分簇算法可以采用k均值算法。
24.process140、对对应于第一关注性节点的每个分簇特征分布进行意图输出,确定每个用户行为事件相关联的用户行为意图。
25.采用以上技术方案,基于用户行为大数据获取每个用户行为事件相关联的第一行为关注变量簇,依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第一行为关注变量簇进行分析,确定每个用户行为事件相关联的第一行为倾向变量,基于每个用户行为事件相关联的第一行为倾向变量,对第一预设数量个用户行为事件进行分簇,并在达到分簇结束要求时,确定对应于第一关注性节点的每个分簇特征分布,对对应于第一关注性节点的每个分簇特征分布进行意图输出,确定每个用户行为事件相关联的用户行为意图。由此,在用户行为意图挖掘之前通过基于行为倾向提取维度确定第一关注性节点的每个分簇特征分布,可以提高意图挖掘输出过程中针对关联性特征和非关联性特征的分析性能,进而提高意图分析可靠性。
26.针对一些可能的设计思路而言,以上实施例还可以包括:从用户行为触发进程中提取初始行为事件;从初始行为事件中获取每个行为日志数据;对每个行为日志数据进行行为关注变量挖掘,确定行为关注变量;将行为关注变量加载到用户行为大数据中。
27.例如,首先从用户行为触发进程中提取初始行为事件,从初始行为事件中提取出满足条件的每个行为日志数据。然后对每个满足条件的行为日志数据进行行为关注变量挖掘。例如,一个行为日志数据可提取一个行为关注变量。
28.针对一些可能的设计思路而言,从初始行为事件中获取每个行为日志数据,例如
可以包括下述步骤:从初始行为事件中获取候选行为日志数据簇;对候选行为日志数据簇中的每个行为日志数据进行汇聚,确定对应于同一个行为触发属性的每个行为日志数据;对每个行为日志数据进行行为关注变量挖掘,确定行为关注变量,例如可以包括下述步骤:对对应于同一个行为触发属性的每个行为日志数据进行行为日志数据的特征连通处理,确定特征连通行为日志数据;对特征连通行为日志数据进行行为关注变量挖掘,确定行为关注变量。
29.针对一些可能的设计思路而言,基于用户行为大数据获取每个用户行为事件相关联的第一行为关注变量簇,例如可以包括下述步骤:基于用户行为大数据获取行为节点在第一关注性节点内的目标行为关注变量簇;对应于每个用户行为事件,将目标行为关注变量簇中源服务页面标签对应于新上线服务页面标签的行为关注变量,确定为第一行为关注变量簇中的第一行为关注变量,新上线服务页面标签为用户行为事件的服务页面标签;对应于每个用户行为事件,将目标行为关注变量簇中目的服务页面标签对应于新上线服务页面标签的行为关注变量,确定为第一行为关注变量簇中的第一行为关注变量。
30.针对一些可能的设计思路而言,基于上述实施方式可知,用户行为大数据中存储有行为日志数据(或,特征连通行为日志数据)对应的行为关注变量,行为关注变量中包括行为节点,因此,可基于行为节点筛选出相应关注性节点的行为关注变量。
31.例如,假设第一关注性节点为设定业务字段a到业务字段f之间的业务节点,由此可基于用户行为大数据获取行为节点在该第一关注性节点内的所有行为关注变量,并将这些行为关注变量作为目标行为关注变量簇。例如,以待挖掘的任意一个用户行为事件为例,可获知该用户行为事件的新上线服务页面标签,于是,从目标行为关注变量簇中筛选出源服务页面标签或目的服务页面标签对应于该新上线服务页面标签的第一行为关注变量,并将这些第一行为关注变量作为该用户行为事件的第一行为关注变量簇。
32.值得说明的是,对于其它待挖掘的用户行为事件而言,也采用类似方式提取相应的第一行为关注变量,由此,确定每个用户行为事件相关联的第一行为关注变量簇。
33.针对一些可能的设计思路而言,第二预设数量个行为倾向提取维度包括前向动态行为倾向、后向动态行为倾向、前后向动态行为倾向、前向动态行为倾向影响力以及后向动态行为倾向影响力中的至少一项;依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第一行为关注变量簇进行分析,确定每个用户行为事件相关联的第一行为倾向变量,例如可以包括下述步骤:对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括前向动态行为倾向,则对第一行为关注变量簇中源服务页面标签对应于新上线服务页面标签的第一行为关注变量所包括的行为日志数据量进行结合分析,确定第一行为倾向变量中前向动态行为倾向相关联的第一意图度量信息,新上线服务页面标签为用户行为事件的服务页面标签;
对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括后向动态行为倾向,则对第一行为关注变量簇中目的服务页面标签对应于新上线服务页面标签的第一行为关注变量所包括的行为日志数据量进行结合分析,确定第一行为倾向变量中后向动态行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括前后向动态行为倾向,则对后向动态行为倾向相关联的第一意图度量信息以及前向动态行为倾向相关联的第一意图度量信息进行结合分析,确定第一行为倾向变量中前后向动态行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括前向动态行为倾向影响力,则计算前向动态行为倾向相关联的第一意图度量信息与前后向动态行为倾向相关联的第一意图度量信息之间的比较系数,确定第一行为倾向变量中前向动态行为倾向影响力相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括后向动态行为倾向影响力,则计算后向动态行为倾向相关联的第一意图度量信息与前后向动态行为倾向相关联的第一意图度量信息之间的比较系数,确定第一行为倾向变量中后向动态行为倾向影响力相关联的第一意图度量信息。
34.针对一些可能的设计思路而言,介绍了一种依据前后向行为关注变量进行分析的方式。基于上述实施方式可知,在获取到每个用户行为事件的第一行为关注变量簇之后,依据不同的行为倾向提取维度分别对第一行为关注变量簇进行分析。下面将以待挖掘的任意一个用户行为事件为例,分别从前向动态行为倾向、后向动态行为倾向、前后向动态行为倾向、前向动态行为倾向影响力以及后向动态行为倾向影响力的维度,对统计第一意图度量信息的方式进行说明。
35.一、前向动态行为倾向;例如,前向相关数据量表示从主动发起的行为的相关数据量。假设用户行为事件的第一行为关注变量簇中,从该用户行为事件的服务页面标签(即,源服务页面标签对应于用户行为事件的服务页面标签)发出的行为日志数据量之和为50兆,由此,可得到前向动态行为倾向相关联的第一意图度量信息为50。
36.二、后向动态行为倾向;例如,后向相关数据量表示被动发起的行为的相关数据量。假设用户行为事件的第一行为关注变量簇中,通过该用户行为事件的服务页面标签(即,目的服务页面标签对应于用户行为事件的服务页面标签)下载的行为日志数据量之和为800兆,由此,可得到后向动态行为倾向相关联的第一意图度量信息为800。
37.三、前后向动态行为倾向;例如,假设用户行为事件的第一行为关注变量簇中,从该用户行为事件的服务页面标签(即,源服务页面标签对应于用户行为事件的服务页面标签)发出的行为日志数据量之和为50兆,而通过该用户行为事件的服务页面标签(即,目的服务页面标签对应于用户行为事件的服务页面标签)下载的行为日志数据量之和为800兆,由此,可得到前后向动态行为倾向相关联的第一意图度量信息为850。
38.四、前向动态行为倾向影响力;
例如,假设用户行为事件的第一行为关注变量簇中,该用户行为事件的前向动态行为倾向相关联的第一意图度量信息为50(即,表示50兆),用户行为事件的前后向动态行为倾向相关联的第一意图度量信息为850(即,表示850兆),基于此,计算两者之间的比较系数,由此,可得到前向动态行为倾向影响力相关联的第一意图度量信息为0.06。
39.五、后向动态行为倾向影响力;例如,假设用户行为事件的第一行为关注变量簇中,该用户行为事件的后向动态行为倾向影响力相关联的第一意图度量信息为800(即,表示800兆),用户行为事件的前后向动态行为倾向相关联的第一意图度量信息为850(即,表示850兆),基于此,计算两者之间的比较系数,由此,可得到后向动态行为倾向影响力相关联的第一意图度量信息为0.94。
40.值得说明的是,对于其它待挖掘的用户行为事件而言,也采用类似方式统计相关数据量维度相关的特征,由此,确定每个用户行为事件相关联的第一行为倾向变量。
41.针对一些可能的设计思路而言,第二预设数量个行为倾向提取维度包括引导性动态行为倾向、非引导性动态行为倾向、协同动态行为倾向、引导性动态行为倾向影响力以及非引导性动态行为倾向影响力中的至少一项;依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第一行为关注变量簇进行分析,确定每个用户行为事件相关联的第一行为倾向变量,例如可以包括下述步骤:对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括引导性动态行为倾向,则对第一行为关注变量簇中源服务页面标签和目的服务页面标签对应于引导性标签的第一行为关注变量所包括的行为日志数据量进行结合分析,确定第一行为倾向变量中引导性动态行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括非引导性动态行为倾向,则对第一行为关注变量簇中源服务页面标签或目的服务页面标签对应于非引导性标签的第一行为关注变量所包括的行为日志数据量进行结合分析,确定第一行为倾向变量中非引导性动态行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括协同动态行为倾向,则对引导性动态行为倾向相关联的第一意图度量信息以及非引导性动态行为倾向影响力相关联的第一意图度量信息进行结合分析,确定第一行为倾向变量中协同动态行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括引导性动态行为倾向影响力,则计算引导性动态行为倾向相关联的第一意图度量信息与协同动态行为倾向相关联的第一意图度量信息之间的比较系数,确定第一行为倾向变量中引导性动态行为倾向影响力相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括非引导性动态行为倾向影响力,则计算非引导性动态行为倾向影响力相关联的第一意图度量信息与协同动态行为倾向相关联的第一意图度量信息之间的比较系数,确定第一行为倾向变量中非引导性动态行为倾向影响力相关联的第一意图度量信息。
42.针对一些可能的设计思路而言,介绍了一种依据协同行为关注变量进行分析的方式。基于上述实施方式可知,在获取到每个用户行为事件的第一行为关注变量簇之后,依据
不同的行为倾向提取维度分别对第一行为关注变量簇进行分析。下面将以待挖掘的任意一个用户行为事件为例,分别从引导性动态行为倾向、非引导性动态行为倾向、协同动态行为倾向、引导性动态行为倾向影响力以及非引导性动态行为倾向影响力的维度,对统计第一意图度量信息的方式进行说明。
43.下面介绍进一步的实施例。
44.一、引导性动态行为倾向;例如,引导性相关数据量表示源服务页面标签和目的服务页面标签均为属于引导性标签的相关数据量。假设该用户行为事件的第一行为关注变量簇中,行为日志数据的源服务页面标签和目的服务页面标签均属于引导性标签的行为日志数据量之和为500兆,由此,可得到引导性动态行为倾向相关联的第一意图度量信息为500。
45.二、非引导性动态行为倾向;例如,非引导性相关数据量表示源服务页面标签或目的服务页面标签对应于非引导性标签的相关数据量。假设该用户行为事件的第一行为关注变量簇中,行为日志数据的源服务页面标签或目的服务页面标签对应于非引导性标签的行为日志数据量之和为100兆,由此,可得到非引导性动态行为倾向相关联的第一意图度量信息为100。
46.三、协同动态行为倾向;例如,假设用户行为事件的第一行为关注变量簇中,行为日志数据的源服务页面标签和目的服务页面标签均属于引导性标签的行为日志数据量之和为500兆,而行为日志数据的源服务页面标签或目的服务页面标签对应于非引导性标签的行为日志数据量之和为100兆,由此,可得到协同动态行为倾向相关联的第一意图度量信息为600。
47.四、引导性动态行为倾向影响力;例如,假设用户行为事件的第一行为关注变量簇中,该用户行为事件的引导性动态行为倾向相关联的第一意图度量信息为500(即,表示500兆),用户行为事件的协同动态行为倾向相关联的第一意图度量信息为600(即,表示600兆),基于此,计算两者之间的比较系数,由此,可得到引导性动态行为倾向影响力相关联的第一意图度量信息为0.83。
48.五、非引导性动态行为倾向影响力;例如,假设用户行为事件的第一行为关注变量簇中,该用户行为事件的非引导性动态行为倾向影响力相关联的第一意图度量信息为100(即,表示100兆),用户行为事件的协同动态行为倾向相关联的第一意图度量信息为600(即,表示600兆),基于此,计算两者之间的比较系数,由此,可得到非引导性动态行为倾向影响力相关联的第一意图度量信息为0.17。
49.针对一些可能的设计思路而言,第二预设数量个行为倾向提取维度包括持续性静态行为倾向、持续性被动行为倾向、持续性静态行为倾向影响力以及持续性被动行为倾向影响力中的至少一项;依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第一行为关注变量簇进行分析,确定每个用户行为事件相关联的第一行为倾向变量,例如可以包括下述步骤:对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括持续性静态行为倾向,则基于第一行为关注变量簇确定静态行为倾向的总相关数据量以及每
个静态行为倾向的相关数据量,并将相关数据量占比最大的静态行为倾向作为第一行为倾向变量中持续性静态行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括持续性被动行为倾向,则基于第一行为关注变量簇确定被动行为倾向总相关数据量以及每个被动行为倾向的相关数据量,并将相关数据量占比最大的被动行为倾向作为第一行为倾向变量中持续性被动行为倾向相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括持续性静态行为倾向影响力,则计算持续性静态行为倾向相关联的相关数据量与静态行为倾向的总相关数据量之间的比较系数,确定第一行为倾向变量中持续性静态行为倾向影响力相关联的第一意图度量信息;对应于每个用户行为事件,如果解析到第二预设数量个行为倾向提取维度包括持续性被动行为倾向影响力,则计算持续性被动行为倾向相关联的相关数据量与被动行为倾向总相关数据量之间的比较系数,确定第一行为倾向变量中持续性被动行为倾向影响力相关联的第一意图度量信息。
50.针对一些可能的设计思路而言,在获取到每个用户行为事件的第一行为关注变量簇之后,依据不同的行为倾向提取维度分别对第一行为关注变量簇进行分析。下面将以待挖掘的任意一个用户行为事件为例,分别从持续性静态行为倾向、持续性被动行为倾向、持续性静态行为倾向影响力以及持续性被动行为倾向影响力的维度,对统计第一意图度量信息的方式进行说明。
51.一、持续性静态行为倾向;例如,统计该用户行为事件的第一行为关注变量簇中所有静态行为倾向的总相关数据量,假设静态行为倾向的总相关数据量为1000兆,静态行为倾向“a1”的相关数据量为800兆,其相关数据量占比为0.8。静态行为倾向“a2”的相关数据量为200兆,其相关数据量占比为0.2。基于此,相关数据量占比最大的静态行为倾向为“a1”,由此,可得到持续性静态行为倾向相关联的第一意图度量信息为a1。
52.二、持续性被动行为倾向;例如,统计该用户行为事件的第一行为关注变量簇中所有被动行为倾向的总相关数据量,假设被动行为倾向的总相关数据量为800兆,被动行为倾向“a3”的相关数据量为500兆,其相关数据量占比为0.625。被动行为倾向“a4”的相关数据量为300兆,其相关数据量占比为0.375。基于此,相关数据量占比最大的被动行为倾向为“a3”,由此,可得到持续性被动行为倾向相关联的第一意图度量信息为a3。
53.三、持续性静态行为倾向影响力;例如,统计该用户行为事件的第一行为关注变量簇中所有静态行为倾向的总相关数据量,假设静态行为倾向的总相关数据量为1000兆,静态行为倾向“a1”的相关数据量为800兆,其相关数据量占比为0.8。静态行为倾向“a2”的相关数据量为200兆,其相关数据量占比为0.2。基于此,相关数据量占比最大的静态行为倾向(即,持续性静态行为倾向)为“a1”,由此,可得到持续性静态行为倾向影响力相关联的第一意图度量信息为0.8。
54.四、持续性被动行为倾向影响力;例如,统计该用户行为事件的第一行为关注变量簇中所有被动行为倾向的总相关
数据量,假设被动行为倾向的总相关数据量为800兆,被动行为倾向“a3”的相关数据量为800兆,其相关数据量占比为0.625。被动行为倾向“a4”的相关数据量为300兆,其相关数据量占比为0.375。基于此,相关数据量占比最大的被动行为倾向(即,持续性被动行为倾向)为“a3”,由此,可得到持续性被动行为倾向影响力相关联的第一意图度量信息为0.625。
55.针对一些可能的设计思路而言,基于每个用户行为事件相关联的第一行为倾向变量,对第一预设数量个用户行为事件进行分簇,并在达到分簇结束要求时,确定对应于第一关注性节点的每个分簇特征分布,例如可以包括下述步骤:获取在先预设的第二预设数量个影响因子序列,每个影响因子序列对应于一个行为倾向提取维度;对应于每个用户行为事件,基于第二预设数量个影响因子序列以及第一行为倾向变量确定与第三预设数量个分簇重心之间的关联代价值,并将用户行为事件分配到关联代价值最小的分簇;如果达到分簇结束要求,则输出对应于第一关注性节点的每个分簇特征分布;如果没有达到分簇结束要求,则更新第三预设数量个分簇重心。
56.针对一些可能的设计思路而言,阐述了基于预设影响因子序列进行分簇的方式。基于上述实施方式可知,在分簇的过程中,还可以为每个行为倾向提取维度设置一个影响因子序列,结合影响因子序列计算第一行为倾向变量与每个分簇重心的关联代价值。
57.例如,以第二预设数量个行为倾向提取维度包括引导性动态行为倾向、非引导性动态行为倾向和协同动态行为倾向为例。假设引导性动态行为倾向对应的影响因子序列为0.5,非引导性动态行为倾向为0.8,协同动态行为倾向为0.1。假设第一行为倾向变量为(500,100,600)。假设分簇重心a为(200,300,500),分簇重心b为(100,200,300)。基于此,采用如下方式分别计算该第一行为倾向变量与两个分簇重心的关联代价值。
58.la=0.5
×
(500-200)2+0.8
×
(100-300)2+0.1
×
(600-500)2=78000lb=0.5
×
(500-100)2+0.8
×
(100-200)2+0.1
×
(600-300)2=97000不难获知,第一行为倾向变量与分簇重心a之间的关联代价值la更小,因此,可将第一行为倾向变量对应的用户行为事件分配到分簇a。值得说明的是,对其它用户行为事件相关联的第一行为倾向变量进行类似处理,达到分簇结束要求时,即可得到分簇特征分布。如果不达到分簇结束要求,则可以更新第三预设数量个分簇重心。
59.针对一些可能的设计思路而言,以上实施例还可以包括:基于用户行为大数据获取每个用户行为事件相关联的第二行为关注变量簇,第二行为关注变量簇为依据第二关注性节点内的初始行为事件进行特征抽取获得;依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第二行为关注变量簇进行分析,确定每个用户行为事件相关联的第二行为倾向变量,第二行为倾向变量包括第二预设数量个第二意图度量信息,每个第二意图度量信息对应于一个行为倾向提取维度;如果解析到用户行为事件相关联的第一行为倾向变量与第一分簇重心的关联代价值大于用户行为事件相关联的第二行为倾向变量与第二分簇重心的关联代价值,则从第一分簇重心相关联的分簇特征分布中剔除用户行为事件。
60.针对一些可能的设计思路而言,用户行为事件可以是动态变化的,同一用户行为
事件在不同的关注性节点内的行为关注变量也可能发生变化,因此,可对不同关注性节点内的相同用户行为事件进行分簇。
61.例如,基于设置好的关注性节点大小,基于用户行为大数据获取每个用户行为事件相关联的第二行为关注变量簇。假设第二关注性节点为设定业务字段g到业务字段r之间的业务节点,基于此,可基于用户行为大数据获取行为节点在该第二关注性节点内的所有行为关注变量并将这些行为关注变量作为目标行为关注变量簇。例如,以待挖掘的任意一个用户行为事件为例,可获知该用户行为事件的新上线服务页面标签,于是,从目标行为关注变量簇中筛选出源服务页面标签或目的服务页面标签对应于该新上线服务页面标签的第二行为关注变量,并将这些第二行为关注变量作为该用户行为事件的第二行为关注变量簇。
62.然后,依据第二预设数量个行为倾向提取维度对每个用户行为事件相关联的第二行为关注变量簇进行分析,由此得到每个用户行为事件相关联的第二行为倾向变量。值得说明的是,获取第二行为倾向变量的方式与获取第一行为倾向变量的方式类似,故此处不做赘述。
63.在此基础上,导入上一次的分簇特征分布,即导入对应于第一关注性节点的每个分簇特征分布。如果存在某个原本属于第一分簇特征分布的用户行为事件,其对应的第一行为倾向变量与第一分簇重心的关联代价值大于第二行为倾向变量与第二分簇重心的关联代价值,表示该用户行为事件的属性已发生改变、因此,将该用户行为事件从第一分簇重心相关联的分簇特征分布中,并可以将该用户行为事件加入至第二分簇重心相关联的分簇中。
64.值得说明的是,对于第一分簇重心对应的分簇和第二分簇重心对应的分簇而言,可保留原本的用户行为意图。
65.针对一些可能的设计思路而言,以上实施例还可以包括:如果解析到用户行为事件为在第二关注性节点内新添加的用户行为事件,则基于用户行为事件相关联的第二行为倾向变量,对各个用户行为事件进行分簇,并在达到分簇结束要求时,确定对应于第二关注性节点的每个分簇特征分布。
66.针对一些可能的设计思路而言,用户行为事件是动态变化的,在不同的关注性节点可能会加入新的用户行为事件,因此,因此,可基于新添加的用户行为事件进行重新分簇。
67.值得说明的是,前述实施例已介绍如何获取用户行为事件的第二行为倾向变量。一些示例中,保留原有用户行为事件(即,第一关注性节点内的用户行为事件)对应的分簇特征分布,仅对新添加的用户行为事件进行分簇,达到分簇结束要求时,确定对应于第二关注性节点的每个分簇特征分布。此外,将重新获取原有用户行为事件(即,第一关注性节点内的用户行为事件)的第二行为倾向变量,结合新用户行为事件的第二行为倾向变量,重新进行分簇,达到分簇结束要求时,确定对应于第二关注性节点的每个分簇特征分布。
68.进一步地,针对process140,可以将对应于所述第一关注性节点的每个分簇特征分布输入到用户行为意图挖掘模型中,确定各个用户行为事件相关联的用户行为意图。
69.其中,所述用户行为意图挖掘模型的训练步骤包括:a1、获取范例分簇特征分布序列,所述范例分簇特征分布序列包括多个标定了范
例学习行为意图的范例分簇特征分布;a2、获取范例用户行为意图挖掘模型,所述范例用户行为意图挖掘模型包括深度卷积编码分支、行为意图输出分支、以及意图连通分支;a3、对于每个所述范例分簇特征分布,结合所述深度卷积编码分支获取所述范例分簇特征分布在多个产品应用节点下的深度卷积编码特征分布;a4、结合所述行为意图输出分支将每个所述产品应用节点下的深度卷积编码特征分布进行行为意图输出,输出每个所述产品应用节点下的深度卷积编码特征分布对应的成员行为意图;a5、结合所述意图连通分支基于所述产品应用节点下的深度卷积编码特征分布对应的成员行为意图得到一输出行为意图;a6、结合所述输出行为意图与所述范例学习行为意图确定第一意图挖掘代价值;a7、结合所述第一意图挖掘代价值对所述范例用户行为意图挖掘模型进行模型参数层的遍历调优和选取,直至所述第一意图挖掘代价值满足第一决策条件,输出调优完成的范例用户行为意图挖掘模型作为所述用户行为意图挖掘模型;其中,所述第一意图挖掘代价值由各所述输出行为意图中的各学习行为意图与所述范例学习行为意图中对应的各学习行为意图的第一损失函数评估值进行确定,所述第一决策条件包括所述第一意图挖掘代价值表征的第一损失函数评估值小于第一预设损失函数值。
70.所述用户行为意图挖掘模型的训练步骤还包括:b1、获取范例分簇特征分布序列,所述范例分簇特征分布序列包括多个标定了范例学习行为意图的范例分簇特征分布;b2、获取范例用户行为意图挖掘模型,并对所述范例用户行为意图挖掘模型进行线上共享模型参数层信息的加载与配置,输出初步配置的范例用户行为意图挖掘模型;b3、对于每个所述范例分簇特征分布,结合所述范例用户行为意图挖掘模型获取所述范例分簇特征分布在多个产品应用节点下的深度卷积编码特征分布,并结合所述产品应用节点下的深度卷积编码特征分布以及所述范例学习行为意图包括的成员行为意图确定第二意图挖掘代价值;b4、结合所述第二意图挖掘代价值对所述初步配置的范例用户行为意图挖掘模型进行模型参数层的遍历调优和选取,直至所述第二意图挖掘代价值满足第二决策条件,输出调优完成的范例用户行为意图挖掘模型作为所述用户行为意图挖掘模型。
71.譬如,所述第二意图挖掘代价值由各所述产品应用节点下的深度卷积编码特征分布与所述范例学习行为意图中对应的各学习行为意图的第二损失函数评估值进行确定,所述第二决策条件包括所述第二意图挖掘代价值表征的第二损失函数评估值小于第二预设损失函数值,所述第二预设损失函数值小于所述第一预设损失函数值。
72.其中,所述获取范例分簇特征分布序列,包括:结合多个产品开发项目获取目标互联网产品场景下的关注性节点的分簇特征分布,输出多个分簇特征分布;将各所述分簇特征分布作为范例分簇特征分布加载到预设的范例特征库中;提取所述范例特征库中的各所述范例分簇特征分布在多个产品应用节点下的深度卷积编码特征分布,输出每个范例分簇特征分布对应的深度卷积编码特征分布;结合每个所述范例分簇特征分布对应的深度卷积
编码特征分布,对所述范例特征库中的范例分簇特征分布进行特征冗余优化,输出特征冗余优化后的范例特征库;结合特征冗余优化后的范例特征库中各范例分簇特征分布对应的深度卷积编码特征分布得到所述范例分簇特征分布对应的范例学习行为意图,并将所述学习行为意图与所述范例分簇特征分布在所述范例特征库中进行关联性设置,输出所述范例分簇特征分布序列。
73.其中,结合每个所述范例分簇特征分布对应的深度卷积编码特征分布,对所述范例特征库中的范例分簇特征分布进行特征冗余优化,得的特征冗余优化后的范例特征库,包括:针对每个所述范例分簇特征分布,确定所述范例分簇特征分布对应的所述深度卷积编码特征分布中是否存在指定噪声特征;若存在指定噪声特征,则将所述范例分簇特征分布从所述范例分簇特征分布序列中删除。
74.其中,所述指定噪声特征包括所述范例分簇特征分布对应的深度卷积编码特征分布中未关联于预先配置的产品应用节点下的深度卷积编码特征分布或者未关联于预设数量个产品应用节点下的深度卷积编码特征分布。
75.其中,所述获取范例分簇特征分布序列,还包括:复制所述范例分簇特征分布序列中一部分范例分簇特征分布作为模糊分簇特征分布;将所述模糊分簇特征分布对应的成员行为意图中的一个或者多个产品应用节点对应的成员行为意图进行关联性意图配置;将关联性意图配置后的模糊分簇特征分布作为关联性分簇特征分布加载到所述范例分簇特征分布序列,并对加载到所述关联性分簇特征分布后的范例分簇特征分布序列进行整理,输出整理量后的范例分簇特征分布序列。
76.图2示出了本发明实施例提供的用于实现上述的基于大数据分析的用户行为意图挖掘系统的大数据系统100的硬件结构意图,如图2所示,大数据系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
77.处理器110可以基于存储在机器可读存储介质120中的程序而执行各种适当的动作和处理,例如前述实施例所描述的基于大数据分析的用户行为意图挖掘方法所相关的程序指令。处理器110、机器可读存储介质120以及通信单元140通过总线130进行信号传输。
78.特别地,基于本发明的实施例,上文范例流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信单元140从网络上被下载和安装,在该计算机程序被处理器110执行时,执行本发明实施例的方法中限定的上述功能。
79.本发明又一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的基于大数据分析的用户行为意图挖掘方法。
80.需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(lam)、只读存储器(lom)、可擦式可编程只读存储器(eplom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-lom)、光存储器件、磁存储器件、
或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、lm(射频)等等,或者上述的任意合适的组合。
81.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
82.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
83.本发明又一实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上述任一实施例所述的基于大数据分析的用户行为意图挖掘方法。
84.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1