基于人工智能识别的用户关注需求决策方法及大数据系统与流程

文档序号:32422474发布日期:2022-12-02 23:15阅读:32来源:国知局
基于人工智能识别的用户关注需求决策方法及大数据系统与流程

1.本发明涉及人工智能技术领域,具体而言,涉及一种基于人工智能识别的用户关注需求决策方法及大数据系统。


背景技术:

2.互联网技术的迅速发展,为各行各业的线上内容分发带来了巨大推动力量。在互联网中通过用户需求挖掘完善线上推送内容优化,不仅能够让自家的互联网产品或服务信息全面的呈现在用户眼前,还能够提升互联网产品的用户渗透度。互联网产品是以人为本、需求驱动的产品,真正的服务于用户,关注用户。因此,如何有效地结合人工智能技术挖掘用户关注需求,以便于更好地完善线上推送内容优化,是各家互联网服务商的研究重点。然而本技术发明人研究发现,相关技术中,仅以兴趣点维度进行用户关注需求决策的方式,其可靠性不佳。


技术实现要素:

3.为了至少克服现有技术中的上述不足,本发明的目的在于提供一种基于人工智能识别的用户关注需求决策方法及大数据系统。
4.第一方面,本技术提供一种基于人工智能识别的用户关注需求决策方法,应用于大数据系统,所述大数据系统与多个互联网页面服务器通信连接,所述方法包括:基于人工智能模型训练获得的用户兴趣挖掘模型对目标用户的互联网活动轨迹大数据进行兴趣点挖掘,获得所述目标用户所对应的兴趣指向数据,并将所述兴趣指向数据加载至目标用户的历史平台兴趣大数据中;对所述目标用户的历史平台兴趣大数据进行兴趣路径特征分析,并基于兴趣路径特征分析结果进行用户关注需求决策,获得所述目标用户的用户关注需求分布;基于所述目标用户的用户关注需求分布对所述目标用户所订阅的线上服务页面进行页面内容优化。
5.第二方面,本技术实施例还提供一种基于人工智能识别的用户关注需求决策系统,所述基于人工智能识别的用户关注需求决策系统包括大数据系统和与所述大数据系统通信连接的多个互联网页面服务器;所述大数据系统,用于:基于人工智能模型训练获得的用户兴趣挖掘模型对目标用户的互联网活动轨迹大数据进行兴趣点挖掘,获得所述目标用户所对应的兴趣指向数据,并将所述兴趣指向数据加载至目标用户的历史平台兴趣大数据中;对所述目标用户的历史平台兴趣大数据进行兴趣路径特征分析,并基于兴趣路径特征分析结果进行用户关注需求决策,获得所述目标用户的用户关注需求分布;基于所述目标用户的用户关注需求分布对所述目标用户所订阅的线上服务页面进行页面内容优化。
6.采用以上任意一个方面的技术方案,通过对目标用户的互联网活动轨迹大数据进行兴趣点挖掘,获得目标用户所对应的兴趣指向数据,并将兴趣指向数据加载至目标用户的历史平台兴趣大数据中,对目标用户的历史平台兴趣大数据进行兴趣路径特征分析,并基于兴趣路径特征分析结果进行用户关注需求决策,获得目标用户的用户关注需求分布,据于此对目标用户所订阅的线上服务页面进行页面内容优化,从而在进行兴趣点挖掘后,进一步结合兴趣路径特征维度进行用户关注需求决策,相较于仅以兴趣点维度进行用户关注需求决策的方式,可以提高用户关注需求决策的可靠性,进而提高相关用户的页面内容优化可靠性。
附图说明
7.图1为本发明实施例提供的基于人工智能识别的用户关注需求决策方法的流程示意图。
具体实施方式
8.下面介绍本发明一种实施例提供的基于人工智能识别的用户关注需求决策系统10的架构,该基于人工智能识别的用户关注需求决策系统10可以包括大数据系统100以及与大数据系统100通信连接的互联网页面服务器200。其中,基于人工智能识别的用户关注需求决策系统10中的大数据系统100和互联网页面服务器200可以基于配合执行以下方法实施例所描述的基于人工智能识别的用户关注需求决策方法,具体大数据系统100和互联网页面服务器200的执行步骤部分可以参照以下方法实施例的详细描述。
9.本实施例提供的基于人工智能识别的用户关注需求决策方法可以由大数据系统100执行,下面结合图1对该基于人工智能识别的用户关注需求决策方法进行详细介绍。
10.process100,基于人工智能模型训练获得的用户兴趣挖掘模型对目标用户的互联网活动轨迹大数据进行兴趣点挖掘,获得所述目标用户所对应的兴趣指向数据,并将所述兴趣指向数据加载至目标用户的历史平台兴趣大数据中。
11.本实施例中,互联网活动轨迹大数据可以表示目标用户在相关的互联网服务页面(如电子商务在线服务页面等)进行一系列的互联网活动(如电商直播浏览活动、电商下单活动、电商分享活动等)产生的轨迹数据集合,兴趣指向数据可以用于表征目标用户的兴趣点(如某个电商页面对象,例如电商类别板块)所指向的兴趣数据区间。
12.process200,对所述目标用户的历史平台兴趣大数据进行兴趣路径特征分析,并基于兴趣路径特征分析结果进行用户关注需求决策,获得所述目标用户的用户关注需求分布。
13.本实施例中,兴趣路径特征可以用于表示该目标用户的兴趣路径相关特征,兴趣路径可以是指经由兴趣点产生过程中的用户针对页面数据的各个操作点构成的路径。
14.process300,基于所述目标用户的用户关注需求分布对所述目标用户所订阅的线上服务页面进行页面内容优化。
15.例如,可以从最新更新的页面内容库中获取目标用户的用户关注需求分布中各个用户关注需求所匹配的目标页面内容,并加载到所述目标用户所订阅的线上服务页面进行页面内容优化。
16.基于以上步骤,本实施例通过对目标用户的互联网活动轨迹大数据进行兴趣点挖掘,获得目标用户所对应的兴趣指向数据,并将兴趣指向数据加载至目标用户的历史平台兴趣大数据中,对目标用户的历史平台兴趣大数据进行兴趣路径特征分析,并基于兴趣路径特征分析结果进行用户关注需求决策,获得目标用户的用户关注需求分布,据于此对目标用户所订阅的线上服务页面进行页面内容优化,从而在进行兴趣点挖掘后,进一步结合兴趣路径特征维度进行用户关注需求决策,相较于仅以兴趣点维度进行用户关注需求决策的方式,可以提高用户关注需求决策的可靠性,进而提高相关用户的页面内容优化可靠性。
17.一些示例性的设计思路中,process200可以通过下述实施例实现。
18.process101,获取候选平台兴趣事件数据,对所述候选平台兴趣事件数据进行兴趣路径网络解析,确定用于表示所述候选平台兴趣事件数据的兴趣路径网络;所述候选平台兴趣事件数据包括多个平台兴趣事件;所述兴趣路径网络包括多个兴趣路径节点特征;一个平台兴趣事件对应一个兴趣路径节点特征。
19.process102,确定所述多个兴趣路径节点特征分别对应的需求影响系数,基于所述需求影响系数对所述多个兴趣路径节点特征进行特征融合,确定第一兴趣路径特征。
20.示例性地,需求影响系数可以用于衡量兴趣路径节点特征对于用户关注需求挖掘的重要性,需求影响系数越大,代表对应的兴趣路径节点特征越重要,在最终输出的第一兴趣路径特征中,其对应的兴趣路径节点特征的权重就越大。每个兴趣路径节点特征对应的需求影响系数可以采用一个以其自身为输入的模型进行训练得到。
21.示例性地,在得到需求影响系数后,就可以对兴趣路径节点特征进行特征融合,即基于需求影响系数对兴趣路径节点特征进行聚合,就可以得到第一兴趣路径特征。
22.process103,对所述多个兴趣路径节点特征进行聚团,确定多个特征聚团分别包含的成员兴趣路径节点特征,基于所述多个特征聚团和预设频繁模式树确定每个成员兴趣路径节点特征分别对应的频繁模式度量值,基于多个频繁模式度量值确定第二兴趣路径特征;一个成员兴趣路径节点特征对应的频繁模式度量值是依据所属特征聚团中的成员兴趣路径节点特征进行确定。其中,第二兴趣路径特征可以是频繁模式度量值大于预设频繁模式度量值的成员兴趣路径节点特征构成的特征集合。
23.示例性地,为了更好地解析各兴趣路径节点特征之间的相关特征向量,可以先对多个兴趣路径节点特征进行聚团,即基于兴趣路径节点特征的关联性将多个兴趣路径节点特征划分为多个特征聚团,一个特征聚团中的兴趣路径节点特征对应的平台兴趣事件属于相同类别的平台兴趣事件。然后从每个特征聚团中提取出部分兴趣路径节点特征,作为成员兴趣路径节点特征。
24.process104,基于所述第一兴趣路径特征和所述第二兴趣路径特征,确定所述候选平台兴趣事件数据的用户关注需求决策信息。
25.示例性地,在得到第一兴趣路径特征和第二兴趣路径特征后,就可以采用用户关注需求决策模型对第一兴趣路径特征和第二兴趣路径特征进行预测,输出用户关注需求决策信息。
26.采用以上步骤,可以对包括多个平台兴趣事件的候选平台兴趣事件数据进行兴趣路径网络解析,确定用于表示该候选平台兴趣事件数据的兴趣路径网络,该兴趣路径网络包括多个平台兴趣事件分别对应的兴趣路径节点特征,基于两种方案挖掘平台兴趣事件的
信息,一种是独立挖掘各个平台兴趣事件的信息,即确定所述多个兴趣路径节点特征分别对应的需求影响系数,再基于需求影响系数对多个兴趣路径节点特征进行特征融合,确定第一兴趣路径特征;二是挖掘同类别的平台兴趣事件之间的相关信息,即对多个兴趣路径节点特征进行聚团,确定多个特征聚团分别包含的成员兴趣路径节点特征,基于多个特征聚团和预设频繁模式树确定每个成员兴趣路径节点特征分别对应的频繁模式度量值,基于多个频繁模式度量值确定第二兴趣路径特征;最后基于第一兴趣路径特征和第二兴趣路径特征,确定候选平台兴趣事件数据的用户关注需求决策信息。由此,基于两种方案得到的第一兴趣路径特征和第二兴趣路径特征之间可以相互补充且相互约束,因此可以提高用户关注需求决策准确率,另外通过预设频繁模式树来保证在计算成员兴趣路径节点特征对应的频繁模式度量值时,只关注和该成员兴趣路径节点特征属于同一特征聚团的成员兴趣路径节点特征之间的相关性,提高决策可靠性。
27.一些实施例中,确定所述多个兴趣路径节点特征分别对应的需求影响系数,基于所述需求影响系数对所述多个兴趣路径节点特征进行特征融合,确定第一兴趣路径特征的方案,可以参见下述process201-process210:process201,将所述多个兴趣路径节点特征加载至用户关注需求决策模型中的第一需求影响决策分支;所述第一需求影响决策分支包括需求影响决策单元和需求影响融合单元。
28.process202,在所述需求影响决策单元中,对所述多个兴趣路径节点特征分别进行需求影响决策,确定所述多个兴趣路径节点特征分别对应的需求影响系数。
29.process203,在所述需求影响融合单元中,基于所述需求影响系数对每个所述兴趣路径节点特征进行融合,确定每个所述兴趣路径节点特征分别对应的融合兴趣路径节点特征,对所述融合兴趣路径节点特征进行汇总,确定第一兴趣路径特征。
30.下面介绍初始用户关注需求决策模型训练方法,至少可以包括以下process101-process104:process301,获取范例平台兴趣事件数据,对所述范例平台兴趣事件数据进行兴趣路径网络解析,确定用于表示所述范例平台兴趣事件数据的参考兴趣路径网络;所述范例平台兴趣事件数据包括多个参考平台兴趣事件;所述参考兴趣路径网络包括多个参考兴趣路径节点特征;一个参考平台兴趣事件对应一个参考兴趣路径节点特征。
31.示例性地,process301的实现过程可以参见对process101的描述,此次不作赘述。
32.process302,将所述多个参考平台兴趣事件加载至初始用户关注需求决策模型,在所述初始用户关注需求决策模型中,确定所述多个参考兴趣路径节点特征分别对应的参考需求影响系数,基于所述多个参考兴趣路径节点特征分别对应的参考需求影响系数,对所述多个参考兴趣路径节点特征进行特征融合,确定第一参考兴趣路径特征。
33.示例性地,初始用户关注需求决策模型可以包含有第一初始需求影响决策分支,大数据系统可以在第一初始需求影响决策分支中,确定多个参考兴趣路径节点特征分别对应的参考需求影响系数,基于多个参考兴趣路径节点特征分别对应的参考需求影响系数,对多个参考兴趣路径节点特征进行特征融合,确定第一参考兴趣路径特征,具体实现过程可以参见前述process201-process203的描述,此次不作赘述。
34.process303,在所述初始用户关注需求决策模型中,对所述多个参考兴趣路径节
点特征进行聚团,确定多个参考特征聚团分别包含的参考成员兴趣路径节点特征,基于所述多个参考特征聚团和预设频繁模式树确定每个参考成员兴趣路径节点特征分别对应的参考频繁模式度量值,基于多个参考频繁模式度量值确定第二参考兴趣路径特征;一个参考成员兴趣路径节点特征对应的参考频繁模式度量值是依据所属参考特征聚团中的参考成员兴趣路径节点特征进行确定。
35.示例性地,初始用户关注需求决策模型还可以包含有第二初始需求影响决策分支,然后在第二初始需求影响决策分支中,对多个参考兴趣路径节点特征进行聚团,确定多个参考特征聚团分别包含的参考成员兴趣路径节点特征,基于多个参考特征聚团和预设频繁模式树确定每个参考成员兴趣路径节点特征分别对应的参考频繁模式度量值,基于多个参考频繁模式度量值确定第二参考兴趣路径特征,具体实现过程可以参见前述process205-process209的描述,此次不作赘述。
36.process304,在所述初始用户关注需求决策模型中,基于所述第一参考兴趣路径特征和所述第二参考兴趣路径特征确定所述范例平台兴趣事件数据的先验用户关注需求决策信息。
37.示例性地,初始用户关注需求决策模型还可以包含有初始分类子网络,然后在初始分类子网络中基于第一参考兴趣路径特征和第二参考兴趣路径特征确定范例平台兴趣事件数据的先验用户关注需求决策信息,具体实现可以参见前述process210的描述,此次不作赘述。
38.process305,基于所述多个参考特征聚团、所述多个参考兴趣路径节点特征分别对应的需求影响系数、所述先验用户关注需求决策信息以及所述范例平台兴趣事件数据对应的用户关注需求,对所述初始用户关注需求决策模型进行模型调优,确定用于输出候选平台兴趣事件数据的用户关注需求决策信息的用户关注需求决策模型。
39.示例性地,因为最终得到的用户关注需求决策模型中第一需求影响决策分支和第二需求影响决策分支的加载至都是相同的兴趣路径节点特征,因此第一需求影响决策分支对多个兴趣路径节点特征的需求影响系数分布和第二需求影响决策分支对多个兴趣路径节点特征的需求影响系数分布应该是一致的,因此,大数据系统在对初始用户关注需求决策模型进行训练的过程中,可以先基于多个参考特征聚团以及多个参考兴趣路径节点特征分别对应的参考需求影响系数,确定第一模型训练代价值;然后基于先验用户关注需求决策信息以及范例平台兴趣事件数据对应的用户关注需求,确定第二模型训练代价值;最后对第一模型训练代价值和第二模型训练代价值进行加权求和,确定目标模型训练代价值;基于目标模型训练代价值对初始用户关注需求决策模型进行模型调优,确定用于输出候选平台兴趣事件数据的用户关注需求决策信息的用户关注需求决策模型。其中,第一模型训练代价值用于保证最终训练得到的用户关注需求决策模型的两个网络分支对同样的兴趣路径节点特征加载至的需求影响系数分布一致。第二模型训练代价值用于保证最终训练得到的用户关注需求决策模型输出的用户关注需求决策信息能更接近真实结果。
40.示例性地,上述基于多个参考特征聚团以及多个参考兴趣路径节点特征分别对应的参考需求影响系数,确定第一模型训练代价值的实现过程,可以为:获取多个参考特征聚团中的第i个参考特征聚团;i为正整数,且i不大于多个参考特征聚团的数量;将第i个参考特征聚团包含的参考兴趣路径节点特征,作为目标参考兴趣路径节点特征;基于目标参考
兴趣路径节点特征对应的参考需求影响系数和目标参考兴趣路径节点特征的数量,确定第i个参考特征聚团对应的输出训练代价值;将每个参考特征聚团分别对应的输出训练代价值进行累加,确定第一模型训练代价值。因为大数据系统在对范例平台兴趣事件数据进行关注需求分析时,在第二初始需求影响决策分支中对范例平台兴趣事件数据包含的参考兴趣路径节点特征进行了聚类,确定了多个参考特征聚团,同一参考特征聚团中的参考兴趣路径节点特征在第二初始需求影响决策分支中的关注度是相同的,因此在第一初始需求影响决策分支中,同一参考特征聚团中的参考兴趣路径节点特征的关注度也应该是相同的。例如,范例平台兴趣事件数据包括6个参考兴趣路径节点特征,即f1、f2、f3、f4、f5和f6,在第一初始需求影响决策分支中生成的参考需求影响系数依次为0.10、0.22、0.11、0.31、0.22、0.12,在第二初始需求影响决策分支中生成的参考特征聚团为:参考特征聚团1{f1,f3,f6},参考特征聚团2{f2,f4,f5},可见,参考特征聚团1中的f1、f3、f4对应的参考需求影响系数接近一致,合理;但是参考特征聚团2中的f4对应的参考需求影响系数明显高于f2和f5,这是不合理的,因此需要通过第一模型训练代价值来进行调整。也就是说,同一参考特征聚团中的参考兴趣路径节点特征在第一需求影响决策分支中生成的需求影响系数应当服从均匀分布,因此每个参考特征聚团可以确定出一个输出训练代价值。最后将每个参考特征聚团分别对应的输出训练代价值进行累加,就得到第一模型训练代价值。
41.示例性地,基于目标参考兴趣路径节点特征对应的参考需求影响系数和目标参考兴趣路径节点特征的数量,确定第i个参考特征聚团对应的输出训练代价值的实现过程,可以为:获取由目标参考兴趣路径节点特征对应的参考需求影响系数所构成的拟合需求影响系数分布;对拟合需求影响系数分布进行归一化处理,确定第一需求影响系数分布;将目标参考兴趣路径节点特征的数量对应的均匀需求影响系数分布,作为第二需求影响系数分布;基于第一需求影响系数分布和第二需求影响系数分布,确定第i个参考特征聚团对应的输出训练代价值。假设目标参考兴趣路径节点特征对应的参考需求影响系数为0.10、0.12、0.11,则构成的拟合需求影响系数分布即为[0.10,0.12,0.11],为便于后续输出训练代价值计算时要求加载至的是概率,因此需要对该拟合需求影响系数分布进行归一化处理,即加起来和为1,确定第一需求影响系数分布为[0.303,0.363,0.333]。目标参考兴趣路径节点特征的数量为3,则对应的均匀需求影响系数分布作为第二需求影响系数分布,为[1/3,1/3,1/3]。
[0042]
一些示例性的设计思路中,针对process100,基于人工智能模型训练获得的用户兴趣挖掘模型对目标用户的互联网活动轨迹大数据进行兴趣点挖掘,获得所述目标用户所对应的兴趣指向数据,可以通过下述实施例实现。
[0043]
process401,获取参考互联网活动轨迹数据序列,参考互联网活动轨迹数据序列中包括携带先验兴趣指向数据的参考互联网活动轨迹数据。
[0044]
其中,先验兴趣指向数据表征参考互联网活动轨迹数据中目标兴趣点数据的指向行为节点数据。
[0045]
process402,获取参考互联网活动轨迹数据对应的参考活动轨迹块,并依据参考活动轨迹块获取参考活动轨迹块簇。
[0046]
其中,参考活动轨迹块簇携带与先验兴趣指向数据对应的先验簇兴趣数据,参考活动轨迹块是对参考互联网活动轨迹数据进行基于用户活动时空域的拆分获得的轨迹块。
[0047]
一些示例性的设计思路中,在将参考互联网活动轨迹数据分割成参考活动轨迹块后,组成参考活动轨迹块簇时包括如下情况中的至少一种。
[0048]
将属于同一参考互联网活动轨迹数据的参考活动轨迹块归纳至同一参考活动轨迹块簇,确定与各个参考互联网活动轨迹数据对应的参考活动轨迹块簇。
[0049]
则,参考互联网活动轨迹数据所标注的先验兴趣指向数据即为该参考活动轨迹块簇对应的先验簇兴趣数据,且基于参考互联网活动轨迹数据中所标注的目标兴趣点数据所处的数据分区,对应确定参考互联网活动轨迹数据所拆分得到的各参考活动轨迹块中目标兴趣点数据的指向行为节点数据,并针对参考活动轨迹块标注块兴趣数据。
[0050]
一些示例性的设计思路中,当参考互联网活动轨迹数据的先验兴趣指向数据指示参考互联网活动轨迹数据中不包括目标兴趣点数据时,则参考活动轨迹块簇仅需要先验簇兴趣数据,即表征参考活动轨迹块簇中不包括目标兴趣点数据的先验簇兴趣数据,而无需再针对参考活动轨迹块标注块兴趣数据。
[0051]
在将各参考互联网活动轨迹数据拆分成参考活动轨迹块后,获取参考活动轨迹块的参考活动轨迹块序列,并从参考活动轨迹块序列中随机获取n个参考活动轨迹块组成参考活动轨迹块簇,其中,n为预设的正整数。
[0052]
也即,处于同一参考活动轨迹块簇中的参考活动轨迹块来自相同或者不同的参考互联网活动轨迹数据。
[0053]
则基于参考活动轨迹块对应的块兴趣数据确定参考活动轨迹块簇的先验簇兴趣数据;或者,基于参考活动轨迹块的来源参考互联网活动轨迹数据的先验兴趣指向数据确定参考活动轨迹块簇的先验簇兴趣数据,如:参考活动轨迹块所来自的参考互联网活动轨迹数据的先验兴趣指向数据皆表示不存在目标兴趣点数据,则参考活动轨迹块自然不包括目标兴趣点数据,则参考活动轨迹块簇的先验簇兴趣数据表征不包括目标兴趣点数据。
[0054]
而当参考活动轨迹块所来自的参考互联网活动轨迹数据中存在参考互联网活动轨迹数据中包括目标兴趣点数据,则需要基于块兴趣数据确定参考活动轨迹块簇的先验簇兴趣数据。
[0055]
将属于同一参考互联网活动轨迹数据的参考活动轨迹块归纳至同一参考活动轨迹块簇,以及,从参考活动轨迹块序列中随机获取n个参考活动轨迹块组成参考活动轨迹块簇,也即,参考活动轨迹块簇中既包括从同一参考互联网活动轨迹数据拆分获得的参考活动轨迹块簇,也包括从不同参考互联网活动轨迹数据拆分获得的参考活动轨迹块组成的参考活动轨迹块簇。
[0056]
process403,基于初始化用户兴趣挖掘模型对参考活动轨迹块簇进行兴趣挖掘,依据先验簇兴趣数据和预测簇兴趣数据之间的特征训练代价函数值信息确定参考活动轨迹块簇对应的相对熵训练代价函数值和第一交叉熵训练代价函数值。
[0057]
一些示例性的设计思路中,相对熵训练代价函数值是依据对参考活动轨迹块簇中目标兴趣点数据进行预测得到的特征关注因子分布,以及参考活动轨迹块簇的先验簇兴趣数据对应的兴趣影响参数分布之间的特征训练代价函数值信息确定的训练代价函数值。也即,基于初始化用户兴趣挖掘模型对参考活动轨迹块簇进行编码描述后,对编码描述进行分布状态分析,从而得到参考活动轨迹块簇中目标兴趣点数据的特征关注因子分布,而参考活动轨迹块簇本身携带先验簇兴趣数据,该先验簇兴趣数据指示了该参考活动轨迹块簇
对应的兴趣影响参数分布,则基于特征关注因子分布和兴趣影响参数分布之间的特征训练代价函数值信息,确定参考活动轨迹块簇的相对熵训练代价函数值。也即,基于初始化用户兴趣挖掘模型对参考活动轨迹块簇进行编码描述,确定簇兴趣描述向量,依据簇兴趣描述向量对应的特征关注因子分布和先验簇兴趣数据对应的兴趣影响参数分布,确定参考活动轨迹块簇对应的相对熵训练代价函数值。
[0058]
一些示例性的设计思路中,第一交叉熵训练代价函数值是依据对参考活动轨迹块簇中目标兴趣点数据进行分析得到的预测结果,以及参考活动轨迹块簇的先验簇兴趣数据之间的特征训练代价函数值信息确定的训练代价函数值。也即,基于初始化用户兴趣挖掘模型对参考活动轨迹块簇进行编码描述后,对提取得到的特征进行目标兴趣点数据的分析,从而得到目标参考活动轨迹块包中目标兴趣点数据的预测指向行为节点数据,基于预测指向行为节点数据和先验簇兴趣数据所表示的指向行为节点数据之间的特征训练代价函数值信息,确定参考活动轨迹块簇的第一交叉熵训练代价函数值。也即,依据对簇兴趣描述向量进行目标兴趣点数据挖掘的挖掘数据和先验簇兴趣数据之间的特征训练代价函数值信息,确定参考活动轨迹块簇对应的第一交叉熵训练代价函数值。
[0059]
process404,基于初始化用户兴趣挖掘模型对参考活动轨迹块进行兴趣挖掘,依据先验兴趣指向数据和预测兴趣指向数据之间的特征训练代价函数值信息确定参考活动轨迹块对应的第二交叉熵训练代价函数值。
[0060]
一些示例性的设计思路中,第二交叉熵训练代价函数值是依据对参考活动轨迹块中的目标兴趣点数据进行分析得到的预测结果,以及参考活动轨迹块的块兴趣数据之间的特征训练代价函数值信息确定的训练代价函数值。其中,块兴趣数据可以实现为参考互联网活动轨迹数据本身的先验兴趣指向数据,也可以实现为依据先验兴趣指向数据推断获得的轨迹块标签。
[0061]
也即,基于初始化用户兴趣挖掘模型对参考活动轨迹块进行编码描述后,对编码描述进行目标兴趣点数据的分析,从而得到目标参考活动轨迹块中目标兴趣点数据的指向行为节点数据,基于预测得到的指向行为节点数据和块兴趣数据所表示的指向行为节点数据之间的特征训练代价函数值信息,确定参考活动轨迹块的第二交叉熵训练代价函数值。
[0062]
其中,上述process403和process404是两个并列的步骤,可以先执行process403再执行process404,也可以先执行process404再执行process403,还可以同时执行process403和process404,本实施例对此不加以限定。
[0063]
process405,依据相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值对初始化用户兴趣挖掘模型进行模型参数层的调优和选取。
[0064]
一些示例性的设计思路中,对相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值进行融合得到总训练代价函数值,从而依据总训练代价函数值对初始化用户兴趣挖掘模型进行模型参数层的调优和选取。
[0065]
一些示例性的设计思路中,在对相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值进行加权计算时,采用各自对应的权重对相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值进行加权计算,如:对相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值加权计算,确定总训练代价函数值。
[0066]
一些示例性的设计思路中,在依据总训练代价函数值对初始化用户兴趣挖掘模型进行模型参数层的调优和选取时,依据梯度下降法对初始化用户兴趣挖掘模型的模型参数进行调整。
[0067]
一些示例性的设计思路中,在对对初始化用户兴趣挖掘模型进行训练,基于全局训练代价函数值对初始化用户兴趣挖掘模型中第一兴趣描述向量聚合单元和第二兴趣描述向量聚合单元中的参数进行调整,一些示例性的设计思路中,还可以基于全局训练代价函数值对初始化用户兴趣挖掘模型中其它网络层的参数进行调整。
[0068]
基于以上步骤,本实施例在初始化用户兴趣挖掘模型的模型配置流程中中,针对需要兴趣挖掘的参考互联网活动轨迹数据,分别利用参考活动轨迹块和参考活动轨迹块簇对初始化用户兴趣挖掘模型进行模型参数层的调优和选取,提高了对参考活动轨迹块中目标兴趣点数据的挖掘有效性,避免由于单个参考活动轨迹块挖掘误差而导致整个参考互联网活动轨迹数据的挖掘数据出现较大误差的情况。
[0069]
一些示例性的设计思路中,初始化用户兴趣挖掘模型中包括第一兴趣描述向量聚合单元和第二兴趣描述向量聚合单元。上述相对熵训练代价函数值和交叉熵训练代价函数值是依据兴趣描述向量聚合单元确定的。上述process403和process404可以实现为如下步骤。
[0070]
process4031,基于初始化用户兴趣挖掘模型对参考活动轨迹块簇进行编码描述,确定簇兴趣描述向量。
[0071]
一些示例性的设计思路中,基于初始化用户兴趣挖掘模型中的编码单元对参考活动轨迹块簇进行编码描述,确定簇兴趣描述向量。一些示例性的设计思路中,基于编码单元对参考活动轨迹块簇中的参考活动轨迹块进行编码描述,确定块编码描述变量,从而确定由块编码描述变量构成的簇兴趣描述向量,其中,簇兴趣描述向量为块编码描述变量的序列。
[0072]
以编码单元实现为初始化用户兴趣挖掘模型中的组成部分为例进行说明,一些示例性的设计思路中,该编码单元还可以实现为一个独立的特征提取网络。
[0073]
一些示例性的设计思路中,编码单元基于卷积操作对参考活动轨迹块簇中的参考活动轨迹块进行上采样/下采样,从而得到块编码描述变量,并依据块编码描述变量整合构成簇兴趣描述向量。
[0074]
process4032,基于初始化用户兴趣挖掘模型中的第一兴趣描述向量聚合单元对簇兴趣描述向量进行第一兴趣向量学习,确定第一兴趣描述聚合向量。
[0075]
初始化用户兴趣挖掘模型中包括第一兴趣描述向量聚合单元,其中,兴趣描述向量聚合单元可理解为全连接层。
[0076]
process4033,基于注意力机制对第一兴趣描述聚合向量进行基于注意力机制的兴趣向量学习,确定参考活动轨迹块簇对应的特征关注因子分布。
[0077]
process4034,依据先验簇兴趣数据确定参考活动轨迹块簇对应的兴趣影响参数分布。
[0078]
先验簇兴趣数据的获取方式在上述process402中已进行了说明,此处不再赘述。
[0079]
一些示例性的设计思路中,依据先验簇兴趣数据确定参考活动轨迹块簇的兴趣影响参数分布时,包括如下情况中的至少一种。
[0080]
如果先验簇兴趣数据用于表示参考活动轨迹块簇中的参考活动轨迹块中不存在目标兴趣点数据,确定该参考活动轨迹块簇的兴趣影响参数分布为均匀分布。
[0081]
先验簇兴趣数据指示参考活动轨迹块簇中的参考活动轨迹块不存在目标兴趣点数据,则参考活动轨迹块簇对应的兴趣影响参数分布是均匀分布。
[0082]
如果先验簇兴趣数据用于表示参考活动轨迹块簇中的参考活动轨迹块中存在目标兴趣点数据,获取先验簇兴趣数据中与参考活动轨迹块对应的块兴趣数据,依据块兴趣数据确定参考活动轨迹块簇的兴趣影响参数分布。
[0083]
process4035,依据特征关注因子分布与兴趣影响参数分布之间的特征训练代价函数值信息,确定参考活动轨迹块簇对应的相对熵训练代价函数值。
[0084]
一些示例性的设计思路中,在确定特征关注因子分布和兴趣影响参数分布后,确定特征关注因子分布与兴趣影响参数分布之间的特征训练代价函数值信息,从而得到参考活动轨迹块簇对应的相对熵训练代价函数值。
[0085]
process4036,基于初始化用户兴趣挖掘模型中的第二兴趣描述向量聚合单元对第一兴趣描述聚合向量和参考活动轨迹块簇对应的特征关注因子分布进行第二兴趣向量学习,确定第二兴趣描述聚合向量作为挖掘数据。
[0086]
上述过程中是针对参考活动轨迹块簇的特征关注因子分布情况确定训练代价函数值值。此外,还可以针对参考活动轨迹块簇中目标兴趣点数据的挖掘数据确定交叉熵训练代价函数值值。
[0087]
一些示例性的设计思路中,对上述第一兴趣描述聚合向量和参考活动轨迹块簇对应的特征关注因子分布进行聚合,从而将聚合特征输入至第二兴趣描述向量聚合单元。
[0088]
process4037,依据第二兴趣描述聚合向量和先验簇兴趣数据之间的特征训练代价函数值信息,确定参考活动轨迹块簇对应的第一交叉熵训练代价函数值。
[0089]
process4041,基于初始化用户兴趣挖掘模型对参考活动轨迹块进行编码描述,确定块编码描述变量。
[0090]
一些示例性的设计思路中,基于初始化用户兴趣挖掘模型中的编码单元对参考活动轨迹块进行编码描述,确定块编码描述变量。
[0091]
process4042,基于初始化用户兴趣挖掘模型中的第一兴趣描述向量聚合单元对块编码描述变量进行第一兴趣向量学习,确定第三兴趣描述聚合向量。
[0092]
process4043,基于初始化用户兴趣挖掘模型中的第二兴趣描述向量聚合单元对第三兴趣描述聚合向量进行第二兴趣向量学习,确定第四兴趣描述聚合向量作为预测兴趣指向数据。
[0093]
process4044,依据第四兴趣描述聚合向量和块兴趣数据之间的特征训练代价函数值信息,确定该参考活动轨迹块对应的第二交叉熵训练代价函数值。
[0094]
process405,依据相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值对初始化用户兴趣挖掘模型进行模型参数层的调优和选取。
[0095]
一些示例性的设计思路中,对相对熵训练代价函数值、第一交叉熵训练代价函数值和第二交叉熵训练代价函数值进行加权计算,确定全局训练代价函数值,依据全局训练代价函数值对初始化用户兴趣挖掘模型进行模型参数层的调优和选取。
[0096]
一些示例性的设计思路中,上述process402还可以实现为如下步骤。
[0097]
process4021,对参考互联网活动轨迹数据进行基于用户活动时空域的拆分,确定参考活动轨迹块。
[0098]
一些示例性的设计思路中,对参考互联网活动轨迹数据进行基于用户活动时空域的拆分的方式在上述process402中已进行了介绍,此处不再赘述。
[0099]
process4022,将属于同一参考互联网活动轨迹数据的参考活动轨迹块分配至相同簇,确定参考活动轨迹块簇。
[0100]
一些示例性的设计思路中,将属于同一参考互联网活动轨迹数据的所有参考活动轨迹块分配至相同簇,确定参考活动轨迹块簇;或者,将属于同一参考互联网活动轨迹数据的部分参考活动轨迹块分配至相同簇。
[0101]
其中,当将部分参考活动轨迹块分配至相同簇时,包括如下情况中的至少一种。
[0102]
1、从参考互联网活动轨迹数据的参考活动轨迹块中随机挑选n个参考活动轨迹块分配至相同簇。
[0103]
2、从参考互联网活动轨迹数据的指定位置区域中挑选n个参考活动轨迹块分配至相同簇。
[0104]
3、从参考互联网活动轨迹数据的参考活动轨迹块中,跳跃式选取n个参考活动轨迹块分配至相同簇。
[0105]
也即,每相邻两个参考活动轨迹块中选择一个分配至相同簇。
[0106]
一些示例性的设计思路中,如果参考活动轨迹块簇中的参考活动轨迹块来自同一参考互联网活动轨迹数据,将参考互联网活动轨迹数据对应的先验兴趣指向数据作为参考活动轨迹块簇对应的先验簇兴趣数据。
[0107]
process4023,将属于不同参考互联网活动轨迹数据的参考活动轨迹块混合分配至相同簇,确定参考活动轨迹块簇。
[0108]
一些示例性的设计思路中,在混合分配时,包括如下分配方式中的至少一种。
[0109]
第一种,从每个参考互联网活动轨迹数据的参考活动轨迹块中选择至少一个参考活动轨迹块,分配至同一包中得到参考活动轨迹块簇。
[0110]
其中,从每个参考互联网活动轨迹数据中获取的参考活动轨迹块的数量相同或者不相同。
[0111]
第二种,将不同参考互联网活动轨迹数据的参考活动轨迹块进行混合,确定参考活动轨迹块序列,从参考活动轨迹块序列中随机获取n个参考活动轨迹块,构成参考活动轨迹块簇。
[0112]
第三种,从不同标签分类的参考互联网活动轨迹数据中各获取部分参考活动轨迹块,构成参考活动轨迹块簇。
[0113]
值得注意的是,上述参考活动轨迹块簇的分配方式仅为例如举例,本实施例对此不加以限定。
[0114]
一些示例性的设计思路中,如果参考活动轨迹块簇中的参考活动轨迹块来自不同参考互联网活动轨迹数据,依据参考活动轨迹块对应的块兴趣数据确定参考活动轨迹块簇对应的先验簇兴趣数据。
[0115]
一些实施例中,大数据系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
[0116]
处理器110可以通过存储在机器可读存储介质120中的程序而执行各种适当的动作和处理,例如前述实施例所描述的基于人工智能识别的用户关注需求决策方法所相关的程序指令。处理器110、机器可读存储介质120以及通信单元140通过总线130进行信号传输。
[0117]
特别地,基于本发明的实施例,上文示例性流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信单元140从网络上被下载和安装,在该计算机程序被处理器110执行时,执行本发明实施例的方法中限定的上述功能。
[0118]
本发明又一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的基于人工智能识别的用户关注需求决策方法。
[0119]
本发明又一实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上述任一实施例所述的基于人工智能识别的用户关注需求决策方法。
[0120]
应该理解的是,虽然本技术实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本技术实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其它的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本技术实施例对此不限制。
[0121]
以上所述仅是本技术部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术的方案技术构思的前提下,采用基于本技术技术思想的其它类似实施手段,同样属于本技术实施例的保护范畴。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1