应用于大数据挖掘的用户分析方法及服务器与流程

文档序号:30489977发布日期:2022-06-22 01:27阅读:100来源:国知局
应用于大数据挖掘的用户分析方法及服务器与流程

1.本公开涉及大数据技术领域,尤其涉及一种应用于大数据挖掘的用户分析方法及服务器。


背景技术:

2.大数据时代下的用户分析无处不在。用户分析能够为产品优化、服务升级提供准确可靠的处理依据,从而使得优质的产品服务更好地应用到人们的日常生产生活中。
3.随着用户分析/用户行为分析(analysis of users’behavior)技术的不断发展,现目前已有部分技术能够广泛应用。作为用户分析/用户行为分析的其中一个重要手段,知识库(knowledge base)的作用必不可少。然而发明人在经过对知识库的长期研究和分析之后发现,为了满足日益多变的大数据挖掘需求,通常需要对已有的知识库进行扩展优化处理,但是相关技术一方面难以保障知识库的扩展质量,另一方面会耗费较多的资源开销。


技术实现要素:

4.本公开的一个目的是提供一种应用于大数据挖掘的用户分析方法及服务器,能够使目标用户兴趣知识库的扩展质量与目标用户兴趣知识库的初始拓扑结构匹配,从而在保障目标用户兴趣知识库的原有知识内容的基础上尽可能丰富目标用户兴趣知识库,并且不用收集大量的知识库模板对第一知识单元扩展策略进行调优,在一定程度上节省了不必要的资源开销。
5.本公开的技术方案是通过如下至少部分实施例实现的。
6.一种应用于大数据挖掘的用户分析方法,应用于大数据挖掘服务器,所述方法至少包括:对存在知识单元扩展需求的目标用户兴趣知识库进行热门兴趣标签挖掘,获得所述目标用户兴趣知识库对应的热门用户兴趣内容集;确定所述目标用户兴趣知识库中存在知识单元扩展需求的目标视觉关系型知识单元集;在所述热门用户兴趣内容集中,确定所述目标视觉关系型知识单元集对应的第一热门用户兴趣知识单元集;通过已经完成调优的第一知识单元扩展策略对所述目标视觉关系型知识单元集和所述第一热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,其中,所述第一知识单元扩展策略是在先通过参考型用户兴趣知识库集调优所得的,所述参考型用户兴趣知识库集中的参考型用户兴趣知识库是通过所述目标用户兴趣知识库所得的。
7.如此设计,基于存在知识单元扩展需求的目标用户兴趣知识库获得参考型用户兴趣知识库集,通过所述参考型用户兴趣知识库集对第一知识单元扩展策略进行调优,通过对目标用户兴趣知识库进行热门兴趣标签挖掘,获得目标用户兴趣知识库对应的热门用户兴趣内容集,确定目标用户兴趣知识库中存在知识单元扩展需求的目标视觉关系型知识单元集,在所述热门用户兴趣内容集中,确定目标视觉关系型知识单元集对应的第一热门用户兴趣知识单元集,并通过已经完成调优的第一知识单元扩展策略对目标视觉关系型知识
单元集和第一热门用户兴趣知识单元集进行扩展操作,获得目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,因此针对用于对目标用户兴趣知识库进行扩展的第一知识单元扩展策略,只需通过基于目标用户兴趣知识库所得的参考型用户兴趣知识库进行调优,进而可以改善用户兴趣知识库的不同使用端(比如不同服务商平台系统、不同服务安全监管系统等)之间存在使用习惯差异的问题,能够使目标用户兴趣知识库的扩展质量与目标用户兴趣知识库的初始拓扑结构匹配,从而在保障目标用户兴趣知识库的原有知识内容的基础上尽可能丰富目标用户兴趣知识库,并且不用收集大量的知识库模板对第一知识单元扩展策略进行调优,在一定程度上节省了不必要的资源开销。
8.对于一些可独立实施的设计思路而言,所述参考型用户兴趣知识库集涵盖若干参考型知识库二元组,所述若干参考型知识库二元组中的任一参考型知识库二元组包括知识库示例和热门内容示例,其中,所述知识库示例是从所述目标用户兴趣知识库中拆分出的用户兴趣知识库示例,所述热门内容示例是从所述热门用户兴趣内容集中拆分出的用户兴趣知识库示例,且匹配于相同参考型知识库二元组的所述知识库示例和所述热门内容示例对应于相同的拆分标识;在所述通过已经完成调优的第一知识单元扩展策略对所述目标视觉关系型知识单元集和所述第一热门用户兴趣知识单元集进行扩展操作之前,所述方法还包括:对于所述若干参考型知识库二元组中的任一参考型知识库二元组,对所述知识库示例和所述热门内容示例进行挖掘处理,获得所述知识库示例对应的知识库挖掘示例和所述热门内容示例对应的热门内容挖掘示例;将所述知识库挖掘示例和所述热门内容挖掘示例加载至所述第一知识单元扩展策略,通过所述第一知识单元扩展策略获得所述知识库挖掘示例对应的知识库扩展示例;依据所述知识库扩展示例与所述知识库示例之间的比较结果,对所述第一知识单元扩展策略进行调优。
9.如此设计,通过基于目标用户兴趣知识库实现参考型用户兴趣知识库的内容衍生,并基于由目标用户兴趣知识库进行内容衍生所得的参考型用户兴趣知识库进行无标签分析,因此能够使第一知识单元扩展策略训练获得目标用户兴趣知识库的相关显著性描述,从而能够使第一知识单元扩展策略训练获得针对目标用户兴趣知识库进行用户兴趣知识库扩展的性能。
10.对于一些可独立实施的设计思路而言,所述对所述知识库示例和所述热门内容示例进行挖掘处理,获得所述知识库示例对应的知识库挖掘示例和所述热门内容示例对应的热门内容挖掘示例,包括:获取所述知识库示例和所述热门内容示例对应的挖掘指示;通过所述挖掘指示对所述知识库示例进行挖掘处理,获得所述知识库示例对应的知识库挖掘示例;通过所述挖掘指示对所述热门内容示例进行挖掘处理,获得所述热门内容示例对应的热门内容挖掘示例。
11.如此设计,通过利用该设计思路获得知识库挖掘示例和热门内容挖掘示例,因此能够基于无标签分析(无监督学习)实现第一知识单元扩展策略的调优,从而保障第一知识单元扩展策略的扩展质量。
12.对于一些可独立实施的设计思路而言,所述将所述知识库挖掘示例和所述热门内容挖掘示例加载至所述第一知识单元扩展策略,通过所述第一知识单元扩展策略获得所述知识库挖掘示例对应的知识库扩展示例,包括:将所述热门内容挖掘示例加载至所述第一知识单元扩展策略的第一策略线程,通过所述第一策略线程获得所述热门内容挖掘示例对
应的热门内容扩展示例;将所述知识库挖掘示例和所述热门内容扩展示例加载至所述第一知识单元扩展策略的第二策略线程,通过所述第二策略线程获得所述知识库挖掘示例对应的知识库扩展示例。
13.如此设计,第一策略线程可以用于热门用户兴趣知识单元的连接关系的扩展,第二策略线程可以结合扩展所得的热门用户兴趣知识单元的连接关系信息进行偏好特征扩展,以尽可能获得较佳的扩展质量。
14.对于一些可独立实施的设计思路而言,所述依据所述知识库扩展示例与所述知识库示例之间的比较结果,对所述第一知识单元扩展策略进行调优,包括:依据所述知识库扩展示例与所述知识库示例之间的比较结果,以及所述热门内容扩展示例与所述热门内容示例之间的比较结果,对所述第一知识单元扩展策略进行调优。
15.如此设计,在对第一知识单元扩展策略进行调优时,不仅综合第二策略线程导出的知识库扩展示例与知识库示例之间的比较结果,还综合第一策略线程导出的热门内容扩展示例与热门内容示例之间的比较结果,从而有利于进一步提高第一知识单元扩展策略的扩展质量,保障第一知识单元扩展策略的应用范围。
16.对于一些可独立实施的设计思路而言,所述通过已经完成调优的第一知识单元扩展策略对所述目标视觉关系型知识单元集和所述第一热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,包括:将所述第一热门用户兴趣知识单元集加载至已经完成调优的第一知识单元扩展策略的第一策略线程,通过所述第一策略线程获得所述第一热门用户兴趣知识单元集对应的第二热门用户兴趣知识单元集;通过所述第一知识单元扩展策略的第二策略线程对所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。
17.如此设计,第一策略线程可以用于进行目标视觉关系型知识单元集的热门用户兴趣知识单元的连接关系的扩展,第二策略线程可以结合扩展所得的热门用户兴趣知识单元的连接关系信息进行目标视觉关系型知识单元集的偏好特征扩展,从而能够针对目标用户兴趣知识库得到较佳的扩展质量。
18.对于一些可独立实施的设计思路而言,所述通过所述第一知识单元扩展策略的第二策略线程对所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,包括:对所述目标视觉关系型知识单元集进行前置处理,获得前置处理后的目标视觉关系型知识单元集;将所述前置处理后的目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集加载至所述第一知识单元扩展策略的第二策略线程,通过所述第二策略线程获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。
19.如此设计,通过对目标视觉关系型知识单元集进行前置处理,获得前置处理后的目标视觉关系型知识单元集,并将前置处理后的目标视觉关系型知识单元集和第二热门用户兴趣知识单元集加载至第二策略线程,通过第二策略线程获得目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,因此有利于得到较佳的扩展质量。
20.对于一些可独立实施的设计思路而言,所述对所述目标视觉关系型知识单元集进行前置处理,获得前置处理后的目标视觉关系型知识单元集,包括:依据所述目标视觉关系
型知识单元集和所述第二热门用户兴趣知识单元集,确定所述目标视觉关系型知识单元集中的偏好特征分布;确定与所述目标视觉关系型知识单元集的偏好特征存在共性的目标偏好特征;将所述目标偏好特征添加至所述偏好特征分布,获得前置处理后的目标视觉关系型知识单元集。
21.如此设计,通过对目标视觉关系型知识单元集的待扩展知识单元簇中的部分知识单元簇通过偏好特征添加的形式进行扩展,能够减少由于知识单元扩展策略单次扩展规模较大的知识单元簇所引发的误差,这样可以在保障知识库准确度的前提下尽可能扩展知识库。
22.对于一些可独立实施的设计思路而言,所述依据所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集,确定所述目标视觉关系型知识单元集中的偏好特征分布,包括:对所述目标视觉关系型知识单元集中的待扩展知识单元簇和所述第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行单元关系网识别,确定所述目标视觉关系型知识单元集中的目标扩展知识单元簇,其中,所述待扩展知识单元簇旨在反映目标视觉关系型知识单元集中匹配于挖掘知识单元簇中的未扩展知识单元簇的知识单元簇;将所述待扩展知识单元簇中所述目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布。
23.如此设计,通过对目标视觉关系型知识单元集中的待扩展知识单元簇和第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行单元关系网识别,确定目标视觉关系型知识单元集中的目标扩展知识单元簇,将待扩展知识单元簇中目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布,通过第二策略线程对目标扩展知识单元簇进行扩展,通过偏好特征添加对偏好特征分布进行扩展,从而能够把控每轮通过第二策略线程扩展的知识单元簇的状态,从而实现精细化、针对性的知识单元扩展。
24.对于一些可独立实施的设计思路而言,所述对所述目标视觉关系型知识单元集中的待扩展知识单元簇和所述第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行单元关系网识别,确定所述目标视觉关系型知识单元集中的目标扩展知识单元簇,包括:对所述目标视觉关系型知识单元集中的待扩展知识单元簇进行单元关系标注操作,获得第一待定知识单元簇;对所述第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行衍生操作,获得第二待定知识单元簇;将所述第一待定知识单元簇和所述第二待定知识单元簇的组合结果确定为所述目标视觉关系型知识单元集中的目标扩展知识单元簇。
25.如此设计,能够把控每轮通过第二策略线程扩展的知识单元簇的状态,从而实现精细化、针对性的知识单元扩展。
26.对于一些可独立实施的设计思路而言,所述确定所述目标用户兴趣知识库中存在知识单元扩展需求的目标视觉关系型知识单元集,包括:基于所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,在所述未扩展知识单元簇中确定目标标识;依据所述目标标识,从所述目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,其中,所述目标视觉关系型知识单元集涵盖所述目标标识。
27.如此设计,在目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇的基础上,在未扩展知识单元簇中确定目标标识,并基于目标标识从目标用户兴趣知识库中
确定存在知识单元扩展需求的目标视觉关系型知识单元集,因此能够针对未扩展知识单元簇进行扩展,提高扩展效率。
28.对于一些可独立实施的设计思路而言,所述在所述未扩展知识单元簇中确定目标标识,包括:将所述未扩展知识单元簇的热门用户兴趣知识单元的其中一个知识主题确定为目标标识。
29.如此设计,通过将未扩展知识单元簇的热门用户兴趣知识单元的其中一个知识主题作为目标标识,并基于目标标识从目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,因此阶段性扩展未扩展知识单元簇,有利于进一步提高扩展质量。
30.对于一些可独立实施的设计思路而言,所述依据所述目标标识,从所述目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,包括:以所述目标标识为基准,从所述目标用户兴趣知识库中拆分出第一设定规模的视觉关系型知识单元集作为存在知识单元扩展需求的目标视觉关系型知识单元集。
31.如此设计,基于该设计思路拆分出目标视觉关系型知识单元集,有利于使目标视觉关系型知识单元集中需要扩展的知识单元簇的关联区域和不需要扩展的知识单元簇的关联区域基本一致,从而有利于兼容扩展效率和扩展质量。
32.对于一些可独立实施的设计思路而言,在所述获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集之后,所述方法还包括:以所述目标标识为基准,从所述已扩展视觉关系型知识单元集中拆分出第二设定规模的视觉关系型知识单元集作为待使用视觉关系型知识单元集,其中,所述第二设定规模小于所述第一设定规模;通过所述待使用视觉关系型知识单元集覆盖所述目标用户兴趣知识库中相应标识的视觉关系型知识单元集。
33.如此设计,通过以目标标识为基准,从已扩展视觉关系型知识单元集中拆分出第二设定规模的视觉关系型知识单元集作为待使用视觉关系型知识单元集,并通过待使用视觉关系型知识单元集覆盖目标用户兴趣知识库中相应标识的视觉关系型知识单元集,因此从而实现精细化、针对性的知识单元扩展,进一步提高扩展质量。
34.对于一些可独立实施的设计思路而言,在所述基于所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,在所述未扩展知识单元簇中确定目标标识之前,所述方法还包括:对所述目标用户兴趣知识库进行设定语义的实体检测,确定所述目标用户兴趣知识库中的设定语义的实体所属的知识单元簇,并将所述设定语义的实体所属的知识单元簇作为所述目标用户兴趣知识库中的挖掘知识单元簇。
35.如此设计,能够从目标用户兴趣知识库中去除设定语义的实体,并能够针对设定语义的实体所属的知识单元簇获得符合实际需求的扩展质量。
36.对于一些可独立实施的设计思路而言,在所述基于所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,在所述未扩展知识单元簇中确定目标标识之前,所述方法还包括:将所述目标用户兴趣知识库加载至已经完成调优的第二知识单元扩展策略,通过所述第二知识单元扩展策略解析所述目标用户兴趣知识库中的挖掘知识单元簇,其中,所述第二知识单元扩展策略是在先根据多个用户兴趣知识库以及与多个用户兴趣知识库逐一绑定的挖掘知识单元簇的引导内容调优的。
37.如此设计,通过将目标用户兴趣知识库加载至已经完成调优的第二知识单元扩展策略,通过第二知识单元扩展策略解析目标用户兴趣知识库中的挖掘知识单元簇,因此能够提高所确定的挖掘知识单元簇的精度,并能提高确定挖掘知识单元簇的速率,减少用户兴趣知识库的扩展耗时。
38.对于一些可独立实施的设计思路而言,所述目标用户兴趣知识库为办公用户兴趣知识库。
39.如此设计,仅仅通过存在知识单元扩展需求的办公用户兴趣知识库获得参考型用户兴趣知识库集,并基于该参考型用户兴趣知识库集进行第一知识单元扩展策略的调优,以使第一知识单元扩展策略基于存在知识单元扩展需求的办公用户兴趣知识库本身进行深度学习,因此能够解决办公场景的不同服务商平台系统之间知识库使用习惯存在差异的缺陷,能够使该办公用户兴趣知识库的扩展质量与该办公用户兴趣知识库的初始拓扑结构匹配,保障扩展之后的知识库的可用性,此外,无需大量样本知识库来实现知识单元扩展策略的调优处理,进而有效提高资源利用率。
40.一种大数据挖掘服务器,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
41.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
附图说明
42.图1是示出可以实现本公开的实施例的大数据挖掘服务器的一种通信配置的示意图。
43.图2是示出可以实现本公开的实施例的应用于大数据挖掘的用户分析方法的流程示意图。
44.图3是示出可以实现本公开的实施例的应用于大数据挖掘的用户分析方法的应用环境的架构示意图。
具体实施方式
45.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,所描述的实施例不应视为对本公开的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的,不是旨在限制本公开。
46.图1是示出可以实现本公开的实施例的大数据挖掘服务器100的一种通信配置的框图,大数据挖掘服务器100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本公开实施例中应用于大数据挖掘的用户分
析方法的处理器102。
47.图2是示出可以实现本公开的实施例的应用于大数据挖掘的用户分析方法的流程示意图,应用于大数据挖掘的用户分析方法可以通过图1所示的大数据挖掘服务器100实现,进一步可以包括以下相关步骤所描述的技术方案。
48.step11,对存在知识单元扩展需求的目标用户兴趣知识库进行热门兴趣标签挖掘,获得所述目标用户兴趣知识库对应的热门用户兴趣内容集。
49.step12,确定所述目标用户兴趣知识库中存在知识单元扩展需求的目标视觉关系型知识单元集。
50.step13,在所述热门用户兴趣内容集中,确定所述目标视觉关系型知识单元集对应的第一热门用户兴趣知识单元集。
51.step14,通过已经完成调优的第一知识单元扩展策略对所述目标视觉关系型知识单元集和所述第一热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,其中,所述第一知识单元扩展策略是在先通过参考型用户兴趣知识库集调优所得的,所述参考型用户兴趣知识库集中的参考型用户兴趣知识库是通过所述目标用户兴趣知识库所得的。
52.在本公开实施例中,目标用户兴趣知识库可以为需要进行用户兴趣知识库扩展的多种类别的用户兴趣知识库。比如,目标用户兴趣知识库的类别可以是办公用户兴趣知识库、游戏用户兴趣知识库、电商用户兴趣知识库等。进一步地,用户兴趣知识库可以理解为以知识图谱(knowledge graph)的形式将用户兴趣、用户画像、用户偏好等进行图形化关联处理所得到的,用户兴趣知识可以为后续的用户分析和信息推送提供决策依据。
53.对于一些可独立实施的设计思路而言,所述目标用户兴趣知识库为办公用户兴趣知识库。其中,办公用户兴趣知识库可以表征用户兴趣知识库内容为办公的用户兴趣知识库。对于办公而言,不同服务商平台系统之间存在知识库使用习惯的比较结果。对于本公开实施例而言,仅仅通过存在知识单元扩展需求的办公用户兴趣知识库获得参考型用户兴趣知识库集,并基于该参考型用户兴趣知识库集进行第一知识单元扩展策略的调优,以使第一知识单元扩展策略基于存在知识单元扩展需求的办公用户兴趣知识库本身进行深度学习,因此能够解决办公场景的不同服务商平台系统之间知识库使用习惯存在差异的缺陷,能够使该办公用户兴趣知识库的扩展质量与该办公用户兴趣知识库的初始拓扑结构匹配,保障扩展之后的知识库的可用性,此外,无需大量样本知识库来实现知识单元扩展策略的调优处理,进而有效提高资源利用率。
54.在本公开实施例中,可以通过相关标签挖掘算法对目标用户兴趣知识库进行热门兴趣标签挖掘,获得目标实体(知识库中的用户,比如用户a、用户b)对应的热门用户兴趣内容集(比如不同用户的偏好、需求等)。其中,不对热门兴趣标签挖掘的示例性方法进行限制。热门用户兴趣内容集的规模(比如内容量或者内容尺寸)可以与目标用户兴趣知识库的规模相同。对于一些可独立实施的设计思路而言,热门用户兴趣内容集可以为量化兴趣内容,比如,热门用户兴趣内容集中匹配于热门用户兴趣知识单元的兴趣内容特征的量化值可以为第一设定值,不匹配于热门用户兴趣知识单元的兴趣内容特征的量化值可以为第二设定值。
55.在本公开实施例中,目标视觉关系型知识单元集可以表征目标用户兴趣知识库中
存在知识单元扩展需求的视觉关系型知识单元集(目标视觉关系型知识单元集中包括多个视觉关系型知识单元,视觉关系型知识单元可以理解为图形化的知识单元或者知识节点)。在本公开实施例中,可以每轮仅扩展一组视觉关系型知识单元集,在扩展完成一组视觉关系型知识单元集之后,再扩展另一组视觉关系型知识单元集。换言之,在本公开实施例中,每轮可以仅从目标用户兴趣知识库中确定一个存在知识单元扩展需求的目标视觉关系型知识单元集。当然,也可以同时扩展两组以上视觉关系型知识单元集,本公开实施例不作进一步限制。
56.在本公开实施例中,目标视觉关系型知识单元集和第一热门用户兴趣知识单元集为目标用户兴趣知识库和热门用户兴趣内容集中相同标识(比如相同分布位置)的视觉关系型知识单元集,且目标视觉关系型知识单元集与第一热门用户兴趣知识单元集的规模相同。比如,目标视觉关系型知识单元集和第一热门用户兴趣知识单元集的规模皆是第一设定规模。在本公开实施例中,通过结合第一热门用户兴趣知识单元集进行目标视觉关系型知识单元集的扩展,因此能够利用目标视觉关系型知识单元集中的单元关系信息进行目标视觉关系型知识单元集的扩展,以尽可能获得较佳的扩展质量。进一步地,所扩展得到的知识库能够适用于尽可能多的用户分析任务或者业务推荐任务。
57.在本公开实施例中,第一知识单元扩展策略可以是基于ai搭建的神经网络模型。比如,第一知识单元扩展策略可以通过gan(generative adversarial networks,生成对抗模型)。通过利用gan(generative adversarial networks,生成对抗模型),可以利用gan(generative adversarial networks,生成对抗模型)的无标签分析性能针对目标用户兴趣知识库进行深度学习。此外,也可以根据实际情况灵活选择第一知识单元扩展策略的类别,本公开实施例不作进一步限制。
58.在本公开实施例中,用于对第一知识单元扩展策略进行调优的参考型用户兴趣知识库集中的全部参考型用户兴趣知识库均是通过目标用户兴趣知识库所得的,换言之,第一知识单元扩展策略的调优不依靠于目标用户兴趣知识库之外的用户兴趣知识库。相关技术中,在调优用于用户兴趣知识库扩展的知识单元扩展策略时,通常通过大量不同的用户兴趣知识库调优知识单元扩展策略,这样调优所得的知识单元扩展策略对于某一特殊的待扩展用户兴趣知识库而言,难以获得符合实际需求的扩展质量。在本公开实施例中,对于用于扩展目标用户兴趣知识库的第一知识单元扩展策略,仅仅通过目标用户兴趣知识库获得参考型用户兴趣知识库集,并基于该参考型用户兴趣知识库集进行第一知识单元扩展策略的调优,以使第一知识单元扩展策略基于目标用户兴趣知识库本身进行深度学习,因此能够解决用户兴趣知识库的不同使用端之间使用习惯存在差异的缺陷,能够使目标用户兴趣知识库的扩展质量与目标用户兴趣知识库的初始拓扑结构匹配,从而在保障目标用户兴趣知识库的原有知识内容的基础上尽可能丰富目标用户兴趣知识库,并且不用收集大量的知识库模板对第一知识单元扩展策略进行调优,在一定程度上节省了不必要的资源开销。
59.对于一些可独立实施的设计思路而言,所述参考型用户兴趣知识库集涵盖若干参考型知识库二元组,所述若干参考型知识库二元组中的任一参考型知识库二元组包括知识库示例和热门内容示例,其中,所述知识库示例是从所述目标用户兴趣知识库中拆分出的用户兴趣知识库示例,所述热门内容示例是从所述热门用户兴趣内容集中拆分出的用户兴趣知识库示例,且匹配于相同参考型知识库二元组的所述知识库示例和所述热门内容示例
对应于相同的拆分标识;在所述通过已经完成调优的第一知识单元扩展策略对所述目标视觉关系型知识单元集和所述第一热门用户兴趣知识单元集进行扩展操作之前,所述方法还包括:对于所述若干参考型知识库二元组中的任一参考型知识库二元组,对所述知识库示例和所述热门内容示例进行挖掘处理,获得所述知识库示例对应的知识库挖掘示例和所述热门内容示例对应的热门内容挖掘示例;将所述知识库挖掘示例和所述热门内容挖掘示例加载至所述第一知识单元扩展策略,通过所述第一知识单元扩展策略获得所述知识库挖掘示例对应的知识库扩展示例;依据所述知识库扩展示例与所述知识库示例之间的比较结果,对所述第一知识单元扩展策略进行调优。
60.在本公开实施例中,知识库示例的规模小于目标用户兴趣知识库的规模,热门内容示例的规模小于热门用户兴趣内容集的规模,且知识库示例的规模与热门内容示例的规模相同。知识库挖掘示例可以表征对知识库示例进行挖掘处理后所得的用户兴趣知识库示例,知识库挖掘示例的规模可以与知识库示例的规模相同。热门内容挖掘示例可以表征对热门内容示例进行挖掘处理后所得的用户兴趣知识库示例,热门内容挖掘示例的规模可以与热门内容示例的规模相同。知识库扩展示例可以表征第一知识单元扩展策略基于知识库挖掘示例和热门内容挖掘示例扩展所得的用户兴趣知识库示例,知识库扩展示例的规模可以与知识库挖掘示例的规模相同。
61.对于本公开实施例而言,可以从目标用户兴趣知识库和热门用户兴趣内容集中拆分出多对知识库示例和热门内容示例,每一对知识库示例和热门内容示例组成一个参考型知识库二元组。其中,相应的知识库示例和热门内容示例(即匹配于相同参考型知识库二元组的知识库示例和热门内容示例)为目标用户兴趣知识库和所述热门用户兴趣内容集中相同标识的视觉关系型知识单元集。知识库示例和热门内容示例的规模可以皆是第一设定规模。对于本公开实施例而言,针对任一参考型知识库二元组,对知识库示例和热门内容示例进行挖掘处理,可以指对知识库示例和热门内容示例中相同标识的兴趣内容特征进行挖掘处理。其中,对知识库示例和热门内容示例中相同标识的兴趣内容特征进行挖掘处理,可以包括以下任意一项:将知识库示例和热门内容示例中相同标识的兴趣内容特征的兴趣内容特征值修改为第二设定值,将知识库示例和热门内容示例中相同标识的兴趣内容特征的兴趣内容特征值置为空,将知识库示例和热门内容示例中相同标识的兴趣内容特征的兴趣内容特征值置为无效。当然,也可以通过其他方法对知识库示例和热门内容示例中相同标识的兴趣内容特征进行挖掘处理,本公开实施例不作进一步限制。
62.在本公开实施例中,上述示例作为策略调优的样本或者模板。对于本公开实施例而言,通过基于目标用户兴趣知识库实现参考型用户兴趣知识库的内容衍生,并基于由目标用户兴趣知识库进行内容衍生所得的参考型用户兴趣知识库进行无标签分析,因此能够使第一知识单元扩展策略训练获得目标用户兴趣知识库的相关显著性描述,从而能够使第一知识单元扩展策略训练获得针对目标用户兴趣知识库进行用户兴趣知识库扩展的性能。
63.在一些可独立实施的设计思路下,所述对所述知识库示例和所述热门内容示例进行挖掘处理,获得所述知识库示例对应的知识库挖掘示例和所述热门内容示例对应的热门内容挖掘示例,包括:获取所述知识库示例和所述热门内容示例对应的挖掘指示;通过所述挖掘指示对所述知识库示例进行挖掘处理,获得所述知识库示例对应的知识库挖掘示例;通过所述挖掘指示对所述热门内容示例进行挖掘处理,获得所述热门内容示例对应的热门
内容挖掘示例。
64.举例而言,所述挖掘指示可以是挖掘约束条件、多维列表等形式,本公开实施例不作进一步限制。在一些可能的示例中,所述挖掘指示中的待定知识单元簇的关联区域与知识库示例的关联区域之间的量化分析结果(比例)不大于设定占比。比如,设定占比可以为30%。此外,也可以根据实际情况灵活调整设定占比,本公开实施例不作进一步限制。
65.进一步地,在所述挖掘指示中,待定知识单元簇的量化值可以为“1”,非待定知识单元簇的量化值可以为第一设定值。待定知识单元簇可以对应于知识库示例和热门内容示例中需要进行挖掘处理的知识单元簇,非待定知识单元簇可以对应于知识库示例和热门内容示例中不需要进行挖掘处理的知识单元簇。通过所述挖掘指示对知识库示例进行挖掘处理,可以表征对知识库示例中待定知识单元簇对应的用户兴趣知识库知识单元簇进行挖掘处理;通过所述挖掘指示对热门内容示例进行挖掘处理,可以表征对热门内容示例中待定知识单元簇对应的用户兴趣知识库知识单元簇进行挖掘处理。在知识库损失示例和热门内容挖掘示例中,待定知识单元簇对应的用户兴趣知识库知识单元簇的兴趣内容特征值可以皆是第二设定值,本公开实施例不作进一步限制。通过利用该示例获得知识库挖掘示例和热门内容挖掘示例,因此能够基于无标签分析(无监督学习)实现第一知识单元扩展策略的调优。
66.以一些示例性的角度来看待,所述将所述知识库挖掘示例和所述热门内容挖掘示例加载至所述第一知识单元扩展策略,通过所述第一知识单元扩展策略获得所述知识库挖掘示例对应的知识库扩展示例,包括:将所述热门内容挖掘示例加载至所述第一知识单元扩展策略的第一策略线程,通过所述第一策略线程获得所述热门内容挖掘示例对应的热门内容扩展示例;将所述知识库挖掘示例和所述热门内容扩展示例加载至所述第一知识单元扩展策略的第二策略线程,通过所述第二策略线程获得所述知识库挖掘示例对应的知识库扩展示例。其中,热门内容扩展示例可以表征第一策略线程基于热门内容挖掘示例扩展所得的用户兴趣知识库示例,热门内容扩展示例的规模可以与热门内容挖掘示例的规模相同。
67.可以理解的是,第一知识单元扩展策略包括第一策略线程和第二策略线程,其中,两个策略线程可以协作调优、协同处理,从而可以得到较佳的调优情况。当然,两个策略线程也可以异步调优。在该实施例中,第一策略线程可以用于热门用户兴趣知识单元的连接关系的扩展,第二策略线程可以结合扩展所得的热门用户兴趣知识单元的连接关系信息进行偏好特征扩展,以尽可能获得较佳的扩展质量。
68.在一些可能的示例中,所述依据所述知识库扩展示例与所述知识库示例之间的比较结果,对所述第一知识单元扩展策略进行调优,包括:依据所述知识库扩展示例与所述知识库示例之间的比较结果(差异),以及所述热门内容扩展示例与所述热门内容示例之间的比较结果,对所述第一知识单元扩展策略进行调优。结合该示例,可以根据知识库扩展示例与知识库示例之间的比较结果,以及热门内容扩展示例与热门内容示例之间的比较结果,获得策略评价(损失函数),并通过该策略评价对第一知识单元扩展策略进行调优。结合该示例,在对第一知识单元扩展策略进行调优时,不仅综合第二策略线程导出的知识库扩展示例与知识库示例之间的比较结果,还综合第一策略线程导出的热门内容扩展示例与热门内容示例之间的比较结果,从而有利于进一步提高第一知识单元扩展策略的扩展质量。
69.在另一些可能的示例中,可以不考虑所述热门内容扩展示例与所述热门内容示例之间的比较结果,仅依据所述知识库扩展示例与所述知识库示例之间的比较结果,对第一知识单元扩展策略进行调优。
70.对于一些可独立实施的设计思路而言,在对第一知识单元扩展策略进行调优时,可以不对目标用户兴趣知识库和热门用户兴趣内容集进行拆分。比如,可以对目标用户兴趣知识库和热门用户兴趣内容集进行多轮非限制性挖掘处理,获得挖掘知识单元簇不同的多组目标用户兴趣知识库和热门用户兴趣内容集,并基于因此所得的多组挖掘后的目标用户兴趣知识库和热门用户兴趣内容集进行第一知识单元扩展策略的调优。
71.在另外的设计思路下,还可以基于目标用户兴趣知识库,通过其他用于用户兴趣知识库的内容衍生方法,获得所述参考型用户兴趣知识库集中的参考型用户兴趣知识库。
72.在本公开实施例中,第一知识单元扩展策略调优的循环轮数可以由根据调优情况确定,或者,第一知识单元扩展策略的循环轮数可以是设定轮数。
73.在本公开实施例中,目标视觉关系型知识单元集与其对应的已扩展视觉关系型知识单元集相比,可以只有匹配于未扩展知识单元簇的部分存在差异。换言之,第一知识单元扩展策略可以仅对目标视觉关系型知识单元集中匹配于未扩展知识单元簇的部分进行扩展。其中,未扩展知识单元簇可以表征目标用户兴趣知识库中匹配于挖掘知识单元簇且还未被扩展的知识单元簇,换言之,未扩展知识单元簇可以表征目标用户兴趣知识库中匹配于挖掘知识单元簇且还没有被已扩展视觉关系型知识单元集或者待使用视觉关系型知识单元集覆盖的知识单元簇。
74.对于一些可独立实施的设计思路而言,所述通过已经完成调优的第一知识单元扩展策略对所述目标视觉关系型知识单元集和所述第一热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,包括:将所述第一热门用户兴趣知识单元集加载至已经完成调优的第一知识单元扩展策略的第一策略线程,通过所述第一策略线程获得所述第一热门用户兴趣知识单元集对应的第二热门用户兴趣知识单元集;通过所述第一知识单元扩展策略的第二策略线程对所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。其中,第二热门用户兴趣知识单元集可以表征第一策略线程对第一热门用户兴趣知识单元集扩展所得的视觉关系型知识单元集。第二热门用户兴趣知识单元集的规模可以与第一热门用户兴趣知识单元集的规模一致。对于本公开实施例而言,第一策略线程可以用于进行目标视觉关系型知识单元集的热门用户兴趣知识单元的连接关系的扩展,第二策略线程可以结合扩展所得的热门用户兴趣知识单元的连接关系信息进行目标视觉关系型知识单元集的偏好特征扩展,从而能够针对目标用户兴趣知识库得到较佳的扩展质量。
75.以一些示例性的角度来看待,所述通过所述第一知识单元扩展策略的第二策略线程对所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,包括:对所述目标视觉关系型知识单元集进行前置处理,获得前置处理后的目标视觉关系型知识单元集;将所述前置处理后的目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集加载至所述第一知识单元扩展策略的第二策略线程,通过所述第二策略线程获得所述目标
视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。在示例中,可以通过偏好特征添加、单元关系网识别、扰动过滤、注意力处理等中的至少一种用户兴趣知识库处理方法,对目标视觉关系型知识单元集进行前置处理。通过对目标视觉关系型知识单元集进行前置处理,获得前置处理后的目标视觉关系型知识单元集,并将前置处理后的目标视觉关系型知识单元集和第二热门用户兴趣知识单元集加载至第二策略线程,通过第二策略线程获得目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,因此有利于得到较佳的扩展质量。
76.对于一些可能的实施例而言,所述对所述目标视觉关系型知识单元集进行前置处理,获得前置处理后的目标视觉关系型知识单元集,包括:依据所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集,确定所述目标视觉关系型知识单元集中的偏好特征分布;确定与所述目标视觉关系型知识单元集的偏好特征存在共性的目标偏好特征;将所述目标偏好特征添加至所述偏好特征分布,获得前置处理后的目标视觉关系型知识单元集。
77.在该实施例中,偏好特征分布可以表征目标视觉关系型知识单元集的待扩展知识单元簇中,不通过第二策略线程进行扩展、而通过偏好特征添加进行扩展的知识单元簇。在该实施例中,可以从偏好特征库中,确定与目标视觉关系型知识单元集的偏好特征存在共性的目标偏好特征。其中,目标偏好特征可以是偏好特征库中与目标视觉关系型知识单元集的偏好特征存在共性的目标偏好特征,或者,目标偏好特征可以是偏好特征库中与基于目标视觉关系型知识单元集获取的偏好特征存在共性的偏好特征。其中,偏好特征库中的偏好特征可以根据目标用户兴趣知识库获取的。比如,可以根据目标用户兴趣知识库中的多组视觉关系型知识单元集的偏好特征,分别获取更多的偏好特征。比如,在偏好特征库中,若基于第一视觉关系型知识单元集获取的偏好特征与基于目标视觉关系型知识单元集获取的偏好特征的相关性最高,则可以将基于第一视觉关系型知识单元集获取的偏好特征作为目标偏好特征,其中,第一视觉关系型知识单元集表示目标用户兴趣知识库中的任一视觉关系型知识单元集。在该实施例中,通过对目标视觉关系型知识单元集的待扩展知识单元簇中的部分知识单元簇通过偏好特征添加的形式进行扩展,能够规避由于知识单元扩展策略单次扩展规模较大的知识单元簇所引发的误差,这样可以在保障知识库准确度的前提下尽可能扩展知识库。
78.在一些可能的示例中,所述依据所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集,确定所述目标视觉关系型知识单元集中的偏好特征分布,包括:对所述目标视觉关系型知识单元集中的待扩展知识单元簇和所述第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行单元关系网识别,确定所述目标视觉关系型知识单元集中的目标扩展知识单元簇,其中,所述待扩展知识单元簇旨在反映目标视觉关系型知识单元集中匹配于挖掘知识单元簇中的未扩展知识单元簇的知识单元簇;将所述待扩展知识单元簇中所述目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布。其中,所述待扩展知识单元簇为所述目标视觉关系型知识单元集的子知识单元簇,换言之,所述目标视觉关系型知识单元集涵盖所述待扩展知识单元簇,所述待扩展知识单元簇的关联区域不大于所述目标视觉关系型知识单元集的关联区域。并且,所述待扩展知识单元簇匹配于目标用户兴趣知识库的挖掘知识单元簇中的未扩展知识单元簇,换言之,所述
待扩展知识单元簇为所述未扩展知识单元簇的子知识单元簇,所述待扩展知识单元簇的关联区域不大于所述未扩展知识单元簇的关联区域。结合该示例,对目标视觉关系型知识单元集中的待扩展知识单元簇和第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇所进行的单元关系网识别。结合该示例,通过对目标视觉关系型知识单元集中的待扩展知识单元簇和第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行单元关系网识别,确定目标视觉关系型知识单元集中的目标扩展知识单元簇,将待扩展知识单元簇中目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布,通过第二策略线程对目标扩展知识单元簇进行扩展,通过偏好特征添加对偏好特征分布进行扩展,从而能够把控每轮通过第二策略线程扩展的知识单元簇的状态,从而实现精细化、针对性的知识单元扩展。
79.比如,所述对所述目标视觉关系型知识单元集中的待扩展知识单元簇和所述第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行单元关系网识别,确定所述目标视觉关系型知识单元集中的目标扩展知识单元簇,包括:对所述目标视觉关系型知识单元集中的待扩展知识单元簇进行单元关系标注操作,获得第一待定知识单元簇;对所述第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行衍生操作,获得第二待定知识单元簇;将所述第一待定知识单元簇和所述第二待定知识单元簇的组合结果确定为所述目标视觉关系型知识单元集中的目标扩展知识单元簇。比如,可以进行设定区域的单元关系标注操作(添加不同单元之间的上下游关系或者传递关系的标签),本公开实施例不作进一步限制。第一待定知识单元簇可以表征对待扩展知识单元簇进行单元关系标注操作所得的知识单元簇。第二待定知识单元簇可以表征对第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行衍生操作所得的知识单元簇。基于此,能够把控每轮通过第二策略线程扩展的知识单元簇的状态,从而实现精细化、针对性的知识单元扩展。另外,通过将第一待定知识单元簇和第二待定知识单元簇的组合结果确定为目标视觉关系型知识单元集中的目标扩展知识单元簇,从而尽可能保障知识库的扩展质量。
80.在另一些可能的示例中,所述依据所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集,确定所述目标视觉关系型知识单元集中的偏好特征分布,包括:对所述目标视觉关系型知识单元集中的待扩展知识单元簇进行单元关系网识别,确定所述目标视觉关系型知识单元集中的目标扩展知识单元簇;将所述待扩展知识单元簇中所述目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布。比如,可以对所述目标视觉关系型知识单元集中的待扩展知识单元簇进行单元关系标注操作,获得所述目标视觉关系型知识单元集中的目标扩展知识单元簇。
81.以另一些实施例来看待,所述通过所述第一知识单元扩展策略的第二策略线程对所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集进行扩展操作,获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集,包括:将所述目标视觉关系型知识单元集和所述第二热门用户兴趣知识单元集加载至第二策略线程,通过第二策略线程获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。在该实施例中,可以不对目标视觉关系型知识单元集进行前置处理获得前置处理后的目标视觉关系型知识单元集。
82.对于一些可独立实施的设计思路而言,所述确定所述目标用户兴趣知识库中存在知识单元扩展需求的目标视觉关系型知识单元集,包括:基于所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,在所述未扩展知识单元簇中确定目标标识;依据所述目标标识,从所述目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,其中,所述目标视觉关系型知识单元集涵盖所述目标标识。其中,所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,可以旨在反映目标用户兴趣知识库的挖掘知识单元簇中还没有被扩展的知识单元簇的关联区域不为第一设定值。对于本公开实施例而言,在目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇的基础上,在未扩展知识单元簇中确定目标标识,并基于目标标识从目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,因此能够针对未扩展知识单元簇进行扩展,提高扩展效率。
83.以一些示例性的角度来看待,所述在所述未扩展知识单元簇中确定目标标识,包括:将所述未扩展知识单元簇的热门用户兴趣知识单元的其中一个知识主题确定为目标标识。在该实施例中,通过将未扩展知识单元簇的热门用户兴趣知识单元的其中一个知识主题作为目标标识,并基于目标标识从目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,因此阶段性扩展未扩展知识单元簇,有利于进一步提高扩展质量。
84.此外,还可以将未扩展知识单元簇中的其中一个知识主题作为目标标识。以一些示例性的角度来看待,所述依据所述目标标识,从所述目标用户兴趣知识库中确定存在知识单元扩展需求的目标视觉关系型知识单元集,包括:以所述目标标识为基准,从所述目标用户兴趣知识库中拆分出第一设定规模的视觉关系型知识单元集作为存在知识单元扩展需求的目标视觉关系型知识单元集。根据该示例拆分出目标视觉关系型知识单元集,有利于使目标视觉关系型知识单元集中需要扩展的知识单元簇的关联区域和不需要扩展的知识单元簇的关联区域基本一致,从而有利于兼容扩展效率和扩展质量。
85.进一步地,在一些情况下,目标标识也可以不为目标视觉关系型知识单元集的基准,只要目标视觉关系型知识单元集包含目标标识即可。
86.在一些可能的示例中,在所述获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集之后,所述方法还包括:以所述目标标识为基准,从所述已扩展视觉关系型知识单元集中拆分出第二设定规模的视觉关系型知识单元集作为待使用视觉关系型知识单元集,其中,所述第二设定规模小于所述第一设定规模;通过所述待使用视觉关系型知识单元集覆盖所述目标用户兴趣知识库中相应标识的视觉关系型知识单元集。其中,待使用视觉关系型知识单元集可以包括由第二策略线程扩展所得的部分和/或通过偏好特征添加所得的部分。结合该示例,通过以目标标识为基准,从已扩展视觉关系型知识单元集中拆分出第二设定规模的视觉关系型知识单元集作为待使用视觉关系型知识单元集,并通过待使用视觉关系型知识单元集覆盖目标用户兴趣知识库中相应标识的视觉关系型知识单元集,因此从而实现精细化、针对性的知识单元扩展,进一步提高扩展质量。
87.进一步地,通过待使用视觉关系型知识单元集覆盖目标用户兴趣知识库中相应标识的视觉关系型知识单元集后,目标用户兴趣知识库的挖掘知识单元簇中的未扩展知识单元簇的范围将减少,或者,将不再存在未扩展知识单元簇(即挖掘知识单元簇全部被扩展)。
88.以一些示例性的角度来看待,在所述基于所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,在所述未扩展知识单元簇中确定目标标识之前,所述方法还包括:对所述目标用户兴趣知识库进行设定语义的实体检测,确定所述目标用户兴趣知识库中的设定语义的实体所属的知识单元簇,并将所述设定语义(比如可以理解为类别)的实体所属的知识单元簇作为所述目标用户兴趣知识库中的挖掘知识单元簇。
89.以另一些实施例来看待,在所述基于所述目标用户兴趣知识库的挖掘知识单元簇中存在未扩展知识单元簇,在所述未扩展知识单元簇中确定目标标识之前,所述方法还包括:将所述目标用户兴趣知识库加载至已经完成调优的第二知识单元扩展策略,通过所述第二知识单元扩展策略解析所述目标用户兴趣知识库中的挖掘知识单元簇,其中,所述第二知识单元扩展策略是在先根据多个用户兴趣知识库以及与多个用户兴趣知识库逐一绑定的挖掘知识单元簇的引导内容调优的。比如,可以通过人工标定了挖掘知识单元簇的多个不同的用户兴趣知识库调优第二知识单元扩展策略,从而使第二知识单元扩展策略训练获得解析用户兴趣知识库中的挖掘知识单元簇的性能。通过将目标用户兴趣知识库加载至已经完成调优的第二知识单元扩展策略,通过第二知识单元扩展策略解析目标用户兴趣知识库中的挖掘知识单元簇,因此能够提高所确定的挖掘知识单元簇的精度,并能提高确定挖掘知识单元簇的速率,减少用户兴趣知识库的扩展耗时。
90.本公开实施例提供的应用于大数据挖掘的用户分析方法可以用于各种不同语义的用户兴趣知识库扩展,在一些应用场景中,目标用户兴趣知识库为目标办公用户兴趣知识库。可以先对目标办公用户兴趣知识库进行热门兴趣标签挖掘,获得目标办公用户兴趣知识库对应的热门用户兴趣内容集。
91.比如,可以先基于目标办公用户兴趣知识库,调优用于对目标办公用户兴趣知识库进行扩展的第一知识单元扩展策略。其中,第一知识单元扩展策略可以为gan(generative adversarial networks,生成对抗模型),第一知识单元扩展策略可以包括第一策略线程和第二策略线程。可以从目标办公用户兴趣知识库和热门用户兴趣内容集中的相同标识拆分出具有scale1的知识库示例和热门内容示例。可以获取知识库示例和热门内容示例对应的挖掘指示,通过该挖掘指示对知识库示例进行挖掘处理,获得知识库示例对应的知识库挖掘示例,并通过该挖掘指示对热门内容示例进行挖掘处理,获得热门内容示例对应的热门内容挖掘示例。可以将热门内容挖掘示例加载至第一策略线程,通过第一策略线程获得热门内容挖掘示例对应的热门内容扩展示例。在获得热门内容扩展示例之后,可以将知识库挖掘示例和热门内容扩展示例加载至第二策略线程,通过第二策略线程获得知识库挖掘示例对应的知识库扩展示例。可以根据知识库扩展示例与知识库示例之间的比较结果,以及热门内容扩展示例与热门内容示例之间的比较结果,对第一知识单元扩展策略进行调优,其中,第一策略线程和第二策略线程可以协作调优。
92.在第一知识单元扩展策略调优完成后,可以通过已经完成调优的用于确定用户兴趣知识库中的挖掘知识单元簇的第二知识单元扩展策略,确定目标办公用户兴趣知识库中的挖掘知识单元簇。可以以挖掘知识单元簇的热门用户兴趣知识单元的其中一个知识主题为基准,从目标办公用户兴趣知识库中拆分出具有scale1的视觉关系型知识单元集作为本轮存在知识单元扩展需求的目标视觉关系型知识单元集。可以在热门用户兴趣内容集中,确定目标视觉关系型知识单元集对应的第一热门用户兴趣知识单元集。可以将第一热门用
户兴趣知识单元集加载至第一策略线程,通过第一策略线程获得第一热门用户兴趣知识单元集对应的第二热门用户兴趣知识单元集。可以对目标视觉关系型知识单元集中的待扩展知识单元簇进行单元关系标注操作,获得第一待定知识单元簇,对第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行衍生操作,获得第二待定知识单元簇,并可以将第一待定知识单元簇和第二待定知识单元簇的组合结果确定为目标视觉关系型知识单元集中的目标扩展知识单元簇,其中,待扩展知识单元簇可以表征目标视觉关系型知识单元集中匹配于挖掘知识单元簇的知识单元簇。可以将待扩展知识单元簇中目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布。对偏好特征分布进行偏好特征添加,可以获得前置处理后的目标视觉关系型知识单元集。可以将前置处理后的目标视觉关系型知识单元集和第二热门用户兴趣知识单元集加载至第二策略线程,通过第二策略线程获得目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。可以以已扩展视觉关系型知识单元集的基准为基准,拆分出具有scale2的视觉关系型知识单元集作为待使用视觉关系型知识单元集,并通过待使用视觉关系型知识单元集覆盖目标办公用户兴趣知识库中相应标识的视觉关系型知识单元集。
93.在挖掘知识单元簇中存在未扩展知识单元簇的基础上,可以以未扩展知识单元簇的热门用户兴趣知识单元的其中一个知识主题为基准,从目标办公用户兴趣知识库中拆分出具有scale1的视觉关系型知识单元集作为本轮存在知识单元扩展需求的目标视觉关系型知识单元集。可以在热门用户兴趣内容集中,确定目标视觉关系型知识单元集对应的第一热门用户兴趣知识单元集。可以将第一热门用户兴趣知识单元集加载至第一策略线程,通过第一策略线程获得第一热门用户兴趣知识单元集对应的第二热门用户兴趣知识单元集。可以对目标视觉关系型知识单元集中的待扩展知识单元簇进行单元关系标注操作,获得第一待定知识单元簇,对第二热门用户兴趣知识单元集中的热门用户兴趣知识单元所属的知识单元簇进行衍生操作,获得第二待定知识单元簇,并可以将第一待定知识单元簇和第二待定知识单元簇的组合结果确定为目标视觉关系型知识单元集中的目标扩展知识单元簇,其中,待扩展知识单元簇可以表征目标视觉关系型知识单元集中匹配于未扩展知识单元簇的知识单元簇。可以将待扩展知识单元簇中目标扩展知识单元簇之外的知识单元簇确定为偏好特征分布。对偏好特征分布进行偏好特征添加,可以获得前置处理后的目标视觉关系型知识单元集。可以将前置处理后的目标视觉关系型知识单元集和第二热门用户兴趣知识单元集加载至第二策略线程,通过第二策略线程获得目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集。可以以已扩展视觉关系型知识单元集的基准为基准,拆分出具有scale2的视觉关系型知识单元集作为待使用视觉关系型知识单元集,并通过待使用视觉关系型知识单元集覆盖目标办公用户兴趣知识库中相应标识的视觉关系型知识单元集。可以循环实施上述内容,直至挖掘知识单元簇中不再存在未扩展知识单元簇(即挖掘知识单元簇全部被扩展)。
94.除此之外,对于一些可独立实施的设计思路而言,在获得所述目标视觉关系型知识单元集对应的已扩展视觉关系型知识单元集之后,该方法还可以包括以下内容:根据所述已扩展视觉关系型知识单元集确定价值型用户兴趣描述;基于所述价值型用户兴趣描述进行信息推送;获得与所述信息推送对应的用户反馈,根据所述用户反馈更新所述价值型用户兴趣描述。
95.在本公开实施例中,可以通过已扩展视觉关系型知识单元集中的相关知识单元以及服务商系统所提供的用户需求调查报告确定具有分析价值的用户兴趣描述(价值型用户兴趣描述),该价值型用户兴趣描述可以通过特征向量或者特征图的形式进行表示。进一步地,基于所述价值型用户兴趣描述进行信息推送可以借助信息推送模型实现,而用户反馈能够用于更新和优化价值型用户兴趣描述从而优化后续的信息推送质量。
96.除此之外,对于一些可独立实施的设计思路而言,基于所述价值型用户兴趣描述进行信息推送可以借助信息推送模型实现,可以包括以下内容:利用预设信息推送模型进行潜在需求挖掘,确定价值型用户兴趣描述的潜在需求内容表达;利用所述预设信息推送模型进行影响情况挖掘,确定所述价值型用户兴趣描述中第一潜在需求与第二潜在需求之间的第一影响情况内容表达和第二影响情况内容表达;其中,所述第一影响情况内容表达的局部影响情况涵盖所述第二影响情况内容表达;结合所述潜在需求内容表达对应的潜在需求、所述第一影响情况内容表达对应的第一上下游传递标签和所述第二影响情况内容表达对应的第二上下游传递标签,获得用户需求统计结果;其中,存在影响情况内容表达的潜在需求中的至少一个属于所述潜在需求内容表达对应的潜在需求;从预设数据库中确定与所述用户需求统计结果对应的待推送信息,将所述待推送信息进行推送。
97.在本公开实施例中,能够考虑不同潜在需求之间的互相影响以及上下游关系,这样能够完整准确地确定出用户需求统计结果,从而在预设数据库中准确定位与用户需求统计结果匹配的待推送信息,以实现潜在需求针对性的信息推送,提高推送效率,避免低效或者干扰式推送。
98.图3是示出可以实现本公开的实施例的应用于大数据挖掘的用户分析方法的应用环境的架构示意图,应用于大数据挖掘的用户分析方法的应用环境中可以包括互相通信的大数据挖掘服务器100和业务用户终端200。基于此,大数据挖掘服务器100和业务用户终端200在运行时实现或者部分实现本公开实施例的应用于大数据挖掘的用户分析方法。
99.以上所述,仅为本公开的较佳实施例而已,并非用于限定本公开的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1