事项推荐方法及相关装置、电子设备和存储介质与流程

文档序号:29694980发布日期:2022-04-16 12:45阅读:69来源:国知局
事项推荐方法及相关装置、电子设备和存储介质与流程

1.本技术涉及智能推荐技术领域,特别是涉及一种事项推荐方法及相关装置、电子设备和存储介质。


背景技术:

2.随着电子信息技术的不断发展,在诸如政务服务、医疗服务等众多场景,利用智能推荐技术来实现事项推荐,以引导用户完成事项,已经得到越来越广泛的应用。
3.在现实场景中,受限于业务本身的复杂性、用户对业务缺乏了解等诸多因素,仍然普遍存在事项推荐难以满足用户需求的情况。在此情况下,依然需要人工服务来满足用户需求。有鉴于此,如何提升事项推荐的精度成为亟待解决的问题。


技术实现要素:

4.本技术主要解决的技术问题是提供一种事项推荐方法及相关装置、电子设备和存储介质,能够提升事项推荐的精度。
5.为了解决上述技术问题,本技术第一方面提供了一种事项推荐方法,包括:获取用户画像知识图谱,并获取用户事项办理情况;其中,用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,且相连节点之间存在关系,用户事项办理情况包括各用户分别是否办理过各事项;基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征,并基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征;基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度;其中,目标推荐度表征向目标用户推荐办理目标事项的程度,且目标用户为任一用户,目标事项为任一事项。
6.为了解决上述技术问题,本技术第二方面提供了一种事项推荐装置,包括:信息获取模块、第一提取模块、第二提取模块和推荐预测模块,信息获取模块,用于获取用户画像知识图谱,并获取用户事项办理情况;其中,用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,且相连节点之间存在关系,用户事项办理情况包括各用户分别是否办理过各事项;第一提取模块,用于基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征;第二提取模块,用于基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征;推荐预测模块,用于基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度;其中,目标推荐度表征向目标用户推荐办理目标事项的程度,且目标用户为任一用户,目标事项为任一事项。
7.为了解决上述技术问题,本技术第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的事项推荐方法。
8.为了解决上述技术问题,本技术第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的事项推荐方法。
9.上述方案,获取用户画像知识图谱,并获取用户事项办理情况,且用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,相连节点之间存在关系,用户事项办理情况包括各用户分别是否办理过各事项,在此基础上,基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征,并基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征,再基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度,一方面目标用户为任一用户,且目标事项为任一事项,故能够获取向任一用户推荐任一事项的推荐程度,有利于提升事项推荐的全面性,另一方面在事项推荐过程中,能够分别从业务知识和办理行为两个不同维度抽象出用户特征和事项特征,并融合两个维度的相关特征共同进行预测,有利于提升事项推荐的精度。
附图说明
10.图1是本技术事项推荐方法一实施例的流程示意图;
11.图2是获取聚类集合一实施例的过程示意图;
12.图3是标签抽取一实施例的过程示意图;
13.图4是用户画像知识图谱一实施例的框架示意图;
14.图5是事项推荐模型一实施例的框架示意图;
15.图6是本技术事项推荐方法另一实施例的流程示意图;
16.图7是用户画像知识图谱一实施例的示意图;
17.图8是用户子图谱一实施例的示意图;
18.图9是事项子图谱一实施例的示意图;
19.图10是标签传播一实施例的示意图;
20.图11是本技术事项推荐方法一实施例的过程示意图;
21.图12是本技术事项推荐装置一实施例的框架示意图;
22.图13是本技术电子设备一实施例的框架示意图;
23.图14是本技术计算机可读存储介质一实施例的框架示意图。
具体实施方式
24.下面结合说明书附图,对本技术实施例的方案进行详细说明。
25.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本技术。
26.本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
27.请参阅图1,图1是本技术事项推荐方法一实施例的流程示意图。
28.具体而言,可以包括如下步骤:
29.步骤s11:获取用户画像知识图谱,并获取用户事项办理情况。
30.本公开实施例中,用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,且相连节点之间存在关系。需要说明的是,用户标签可以表征用户的爱好、职业、学历等相关属性,而事项标签可以保证事项的办理地点、办理时间、办理要求等相关属性。示例性地,对于用户“张三”而言,其可以具有与爱好相关的用户标签“旅游美食”,对于用户“小黄”而言,其可以具有与职业相关的用户标签“新闻资讯”,其他情况可以以此类推,在此不再一一举例。此外,事项的具体内容,可以根据实际应用需要进行设置。例如,在政务服务场景中,事项可以是各种政务事项,如可以包括但不限于:结婚登记、工商注册、社保缴费等,在此不做限定;或者,在医疗服务场景中,事项可以是各种医疗事项,如可以包括但不限于:门诊挂号、门诊预约等,在此不做限定,其他场景可以以此类推,在此不再一一举例。
31.在一个实施场景中,可以基于用户在办理事项时的交互数据进行画像构建,得到用户画像,并基于事项知识库和事项办理库进行知识抽取,得到知识数据,且用户画像可以包括用户标签和事项标签,事项知识库可以包括办理各事项的业务知识,事项办理库可以包括各用户的办理行为。在此基础上,可以基于用户画像和知识数据进行关系构建,得到用户画像知识图谱。需要说明的是,交互数据可以包括但不限于交互文本等,例如,“怎么缴纳社保”等。前述业务知识可以包括但不限于:办理各事项的时间、地点以及相关要求等,在此不做限定。此外,办理行为可以包括但不限于:具体办理了什么事项、办理该事项的用户是谁、该用户是在什么时候办理该事项的等,在此不做限定。上述方式,通过用户办理事项时的交互数据构建用户画像,并通过事项知识库和事项办理库抽取出知识数据,以及结合用户画像和知识数据构建出用户画像知识图谱,能够有效利用非结构化的交互数据、事项知识库以及事项办理库进行用户和事项知识挖掘,从而能够为后续精准推荐事项提供基础。
32.在一个具体的实施场景中,可以将交互数据进行聚类,得到若干事项的聚类集合,且对于各事项的聚类集合,可以获取交互数据中分词词语的词语权重,并基于词语权重,选择至少一个分词词语作为标签,且词语权重由分词词语的tf值和tf-idf值加权得到,在此基础上,再基于分别与各事项相关的用户和标签,构建用户画像。上述方式,通过将交互数据进行聚类,得到若干事项的聚类集合,而交互数据中分词词语的词语权重是基于分词词语的tf值和idf值加权得到的,且根据分词词语的词语权重,选择至少一个分词词语作为标签,故一方面可以通过tf-idf值筛选出各个事项中重要的分词词语,有利于排除一些无用或者很少出现的分词词语,另一方面结合tf值可以给出每个分词词语的重要性,从而结合两者能够准确地筛选出各个事项相关的标签,进而结合各个相关的用户,能够提升用户画像构建的准确性。
33.具体来说,可以提取交互数据的语义特征表示,并基于语义特征表示之间的相似度进行聚类,得到若干事项的聚类集合。示例性地,如前所述,交互数据可以包括交互文本,如对于“社保缴纳事项”对应的交互文本可以包括但不限于:“社保如何缴纳”、“怎么缴纳社保”、“我如何缴纳社保”、“怎么办理社保缴纳”等,在此不做限定。进一步地,请结合参阅图2,图2是获取聚类集合一实施例的过程示意图。如图2所示,可以通过诸如bert(bidirectional encoder representation from transformers,即基于transformer的双向编码器表征)等预训练模型对各个交互文本进行语义提取,得到语义特征表示。需要说明
的是,语义特征表示可以以向量形式予以表征,如[0.25,0.34,0.5,

]。在此基础上,可以利用诸如k-means++等聚类算法进行聚类,在聚类过程中,语义特征表示之间的距离,可以通过余弦相似度等相似度度量方式来进行计算,最终可以聚类得到k个聚类集合。为了提升聚类准确性,在得到k个聚类集合之后,可以进一步在业务层面对k个聚类集合进行审核,以得到若干事项的聚类集合。上述方式,通过提取各个交互数据的语义特征表示,并基于语义特征表示之间的相似度进行聚类,得到若干事项的聚类集合,能够在语义层面实现数据聚类,提升交互数据聚类的准确性。
[0034]
具体来说,对于各个聚类集合而言,均可以获取该聚类集合内各个交互数据的分词词语,并计算每个分词词语的tf值和tf-idf值。示例性地,如前所述,对于“社保缴纳事项”对应的交互文本可以包括但不限于:“社保如何缴纳”、“怎么缴纳社保”、“我如何缴纳社保”、“怎么办理社保缴纳”等,在此基础上,可以通过分词、去停用词等操作得到分词词语“缴纳”、“社保”。在此基础上,可以采用tf-idf(term frequency

inverse document frequency,词频-逆文本频率指数)算法计算得到分词词语的tf值(即词频)以及idf值(即逆文本频率指数),再结合tf值和idf值,即可得到tf-idf值。为了便于描述,可以将聚类集合j中的分词词语wi的tf值记为tf
ij
,tf值tf
ij
可以表示为:
[0035][0036]
上述公式(1)中,n
ij
表示分词词语wi在第j个聚类集合dj中的出现次数,k表示通过前述步骤得到的各个聚类集合。
[0037]
此外,为了便于描述,可以将聚类集合j中的分词词语wi的idf值记为idfi,idf值idfi可以表示为:
[0038][0039]
上述公式(2)中,|d|表示若干聚类集合的总数,|{j:wi∈dj}|表示包含分词词语wi的聚类集合数量。
[0040]
在此基础上,可以得到分词词语wi的tf-idf值tfidfi
ij

[0041]
tfidf
ij
=f
ij
*dfi……
(3)
[0042]
此外,如前所述,可以将分词词语的tf值和tf-idf值进行加权,得到分词词语的词语权重。为了便于描述,可以将tf值的加权因子记为α,则对于聚类集合dj中的分词词语wi而言,其词语权重weigh
ij
可以表示为:
[0043]
weigh
ij
=fidfi
ij
+fi
ij
*
……
(4)
[0044]
上述公式中,加权因子α可以基于统计比值得到,且统计比值为第一统计值和第二统计值之间的比值,第一统计值为统计出tf-idf值的最小值,第二统计值为统计出tf值的最大值,即加权因子α可以表示为:
[0045][0046]
需要说明的是,上述加权因子α可以设置为恒定值。当然,加权因子α也可以在使用过程中调整,在此不做限定。上述方式,将分词词语的tf值的加权因子设置为基于统计比值得到,且统计比值为第一统计值与第二统计值之间的比值,第一统计值为统计出tf-idf值
的最小值,第二统计值为统计出tf值的最大值,能够提升词语权重的准确性。
[0047]
请结合参阅图3,图3是标签抽取一实施例的过程示意图。如图3所示,交互文本经上述聚类、分词、计算tf-idf值和tf值、tf-idf值和tf值加权计算之后,即可得到各个分词词语的词语权重,在此基础上,可以将分词词语按照词语权重由大到小的顺序进行排序,并选择其中位于预设序位之前(如,前三位)的分词词语,作为标签抽取出。进一步地,可以将抽取出来的标签中与用户相关的作为用户标签,以及将抽取出来的标签中与事项相关的作为事项标签。上述方式,通过将与事项相关的标签作为事项标签,将与用户相关的标签作为用户标签,能够有利于划清用户标签与事项标签,提升后续所构建的用户画像知识图谱的准确性。
[0048]
在一个具体的实施场景中,可以对事项知识库和事项办理库进行知识抽取所得到的知识数据,可以包括各种三元组。例如,以用户作为头实体、事项作为尾实体的三元组(该三元组可以表达该用户办理过该事项),或者,以事项作为头实体、材料(即办理该事项所需要的材料类型)作为尾实体的三元组,在此不再一一举例。
[0049]
在一个具体的实施场景中,在关系构建过程中,可以构建如下至少一种关系:用户与用户标签之间的关系、用于标签与用户画像之间的关系、用户标签与事项之间的关系、用户画像与事项之间的关系。示例性地,若某用户与某用户标签之间存在关系,则可以在用户画像知识图像中将表示该用户的节点与表示该用户标签的节点连接;或者,若某用户标签与某事项之间存在关系,则可以在用户画像知识图谱中将表示该用户标签的节点与表示该事项的节点连接,其他情况可以以此类推,在此不再一一举例。请结合参阅图4,图4是用户画像知识图谱一实施例的框架示意图。如图4所示,用户画像知识图谱包括用户、用户标签、事项、事项标签等,此外,还可以包括与事项相关的材料(如,对于“离婚事项”而言,需要结婚证等证明材料)等。需要说明的是,用户画像可以由一系列的用户标签组成,如对于“张三”的用户画像而言,可以表示其爱好的用户标签“旅游美食”、表示其职业的用户标签“新闻资讯”等一系列用户标签组成,即用户画像与标签之间存在一定的上下位关系,而标签又包含用户标签与事项标签,即标签本身与细分的用户标签、事项标签之间也存在一定的上下位关系。在此基础上,即可构建上述各种关系,得到用户画像知识图谱。上述方式,通过构建用户与用户标签之间的关系、用于标签与用户画像之间的关系、用户标签与事项之间的关系、用户画像与事项之间的关系中至少一种关系,来形成用户画像知识图谱,有利于提升用户画像知识图谱的准确性和全面性。
[0050]
本公开实施例中,用户事项办理情况包括各用户分别是否办理过各事项。需要说明的是,用户事项办理情况可以是基于事项办理库转换得到的,以提升用户实现办理情况的准确性。示例性地,事项办理库可以包括如下记录:“张三于某月某日办理社保缴纳事项”、“李四于某月某日办理工商注册事项”、“王五于某月某日办理结婚登记事项”、“小黄于某月某日办理车辆登记事项”,在此基础上,可以将用户事项办理情况表示为一个矩阵,且矩阵的横向表示为各个用户,矩阵的纵向表示为各个事项,若矩阵中某一元素的元素值为1,则表示该元素横向对应的用户办理过该元素纵向对应的事项。以上述示例为例,可以得到下述表示用户事项办理情况的矩阵:
[0051][0052]
需要说明的是,为了清楚地表征矩阵中各个元素的含义,在矩阵横向标注出各个用户,在矩阵纵向标注出各个事项。由上述矩阵可见,矩阵中第1行第1列元素的元素值为1,则表示该元素在横向对应的用户“张三”办理过该元素在纵向对应的事项“社保缴纳”。其他情况可以以此类推,在此不再一一举例。
[0053]
步骤s12:基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征,并基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征。
[0054]
在一个实施场景中,知识表示可以通过transx来实现,包括但不限于:transe、transh、transr、transd等,在此不做限定。知识表示的具体过程,可以参阅transx的技术细节,在此不再赘述。此外,也可以预先训练诸如图神经网络的知识表示网络,从而可以通过知识表示网络对用户画像知识图谱进行特征提取,得到各用户的第一用户特征和各事项的第一事项特征。在此不做限定。
[0055]
在一个实施场景中,通过协同过滤提取各用户的第二用户特征和各事项的第二事项特征,可以参阅协同过滤的技术细节,在此不再赘述。示例性地,可以结合隐语义模型来提取得到上述第二用户特征和第二事项特征,在此不做限定。
[0056]
在一个实施场景中,为了提升事项推荐的效率,可以预先训练一个事项推荐模型,请结合参阅图5,图5是事项推荐模型一实施例的框架示意图。如图5所示,事项推荐模型可以包括第一编码网络和第二编码网络,第一编码网络用于编码得到第一用户特征和第一事项特征,而第二编码网络可以编码得到第二用户特征和第二事项特征。具体而言,第一编码网络可以采用上述transx、图神经网络等来实现,而第二编码网络可以采用上述隐语义模型来等来实现,在此不做限定。
[0057]
步骤s13:基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度。
[0058]
本公开实施例中,目标推荐度表征向目标用户推荐办理目标事项的程度,且目标用户为任一用户,目标事项为任一事项。示例性地,目标用户可以为“李四”、目标事项可以为“社保缴纳”;或者,目标用户也可以为“张三”、目标事项可以为“车辆登记”,在此不做限定。此外,目标推荐度可以采用数值来表示,例如,可以采用0至1的数值来表示目标推荐度,且数值越大,向目标用户推荐办理目标事项的程度越高,反之,数值越小,向目标用户推荐办理目标事项的程度越小。
[0059]
在一个实施场景中,可以基于目标用户的第一用户特征和目标事项第一事项特征,得到第一关联特征,并基于目标用户的第二用户特征和目标事项的第二事项特征,得到第二关联特征,且第一关联特征和第二关联特征分别表示,在业务知识和办理行为两个维
度上,目标用户和目标事项之间的相关性,在此基础上,可以再基于第一关联特征和第二关联特征进行联合预测,得到目标推荐度。上述方式,先分别从业务知识维度和办理行为维度关联用户特征和事项特征,得到两个维度的关联特征,再结合两个维度的关联特征进行联合预测,有利于提升事项推荐的精准性。
[0060]
在一个具体的实施场景中,如前所述,为了提升事项推荐的效率,可以预先训练一个事项推荐模型。请继续结合参阅图5,事项推荐模型可以包括第一关联网络、第二关联网络,以及分别与第一关联网络和第二关联网络连接的联合预测网络,第一关联网络用于获取第一关联特征,第二关联网络用于获取第二关联特征,联合预测网络用于执行联合预测。需要说明的是,第一关联网络、第二关联网络和联合预测网络中所表示的网络层可以通过卷积层来实现。上述方式,通过事项推荐模型来获取目标推荐度,且事项推荐模型包括第一关联网络、第二关联网络,以及分别与第一关联网络和第二关联网络连接的联合预测网络,第一关联网络用于获取第一关联特征,第二关联网络用于获取第二关联特征,联合预测网络用于执行联合预测,有利于提升事项推荐的效率。
[0061]
上述方案,获取用户画像知识图谱,并获取用户事项办理情况,且用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,相连节点之间存在关系,用户事项办理情况包括各用户分别是否办理过各事项,在此基础上,基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征,并基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征,再基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度,一方面目标用户为任一用户,且目标事项为任一事项,故能够获取向任一用户推荐任一事项的推荐程度,有利于提升事项推荐的全面性,另一方面在事项推荐过程中,能够分别从业务知识和办理行为两个不同维度抽象出用户特征和事项特征,并融合两个维度的相关特征共同进行预测,有利于提升事项推荐的精度。
[0062]
请结合参阅图6,图6是本技术事项推荐方法另一实施例的流程示意图。具体而言,可以包括如下步骤:
[0063]
步骤s61:获取用户画像知识图谱,并获取用户事项办理情况。
[0064]
本公开实施例中,用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,且相连节点之间存在关系,用户事项办理情况包括各用户分别是否办理过各事项,具体可以参阅前述公开实施例中相关描述,在此不再赘述。
[0065]
步骤s62:基于用户画像知识图谱,构建子图谱。
[0066]
本公开实施例中,子图谱由属于目标类型的节点形成,目标类型在用户类型、事项类型中选择得到,子图谱中相连节点之间的连线标记有关系权重。
[0067]
在一个实施场景中,如前所述,用户画像知识谱图中,在表征用户的节点与表征事项的节点相连的情况下,表示用户办理过事项,则在选择用户类型为目标类型的情况下,属于目标类型的节点包括表征各用户的节点,或者,在在选择事项类型为目标类型的情况下,属于目标类型的节点包括表征各事项的节点,关系权重与办理两个事项相同用户的数量正相关。上述方式,用户画像知识谱图中,在表征用户的节点与表征事项的节点相连的情况下,表示用户办理过事项,而在选择用户类型为目标类型的情况下,属于目标类型的节点包括表征各用户的节点,关系权重与两个用户办理相同事项的数量正相关,在选择事项类型
为目标类型的情况下,属于目标类型的节点包括表征各事项的节点,关系权重与办理两个事项相同用户的数量正相关,故无论在用户子图谱还是在事项子图谱中,均能够有效体现关系权重,有利于后续标签传播的准确性。
[0068]
在一个实施场景中,为了便于描述,可以将目标类型为用户类型所对应的子图谱称为用户子图谱,而将目标类型为事项类型所对应的子图谱成为事项子图谱。此外,用户子图谱中关系权重与两个用户办理相同事项的数量正相关,而事项子图谱中关系权重与办理两个事项相同用户的数量正相关。请结合参阅图7,图7是用户画像知识图谱一实施例的示意图。如图7所示,用户“李四”与“事项a”、“事项b”、“事项c”、“事项d”相连,则可以认为用户“李四”共办理过“事项a”、“事项b”、“事项c”、“事项d”4件事项。其他用户可以以此类推,在此不再一一举例。在此基础上,可以抽取出各个用户“张三”、“李四”、“王五”、“赵六”、“小刘”、“小张”、“小黄”,并获取上述用户两两之间办理相同事项的数量,从而可以确定用户两两之间的关系权重。示例性地,“李四”和“赵六”共同办理了事项b、事项c和事项d,则可以确定两者之间的关系权重为3,其他用户可以以此类推,从而可以获取如图8所示的用户子图谱。类似地,事项f和事项e共同被王五办理了,则可以确定事项f和事项e之间的关系权重为1,其他事项可以以此类推,从而可以获取如图9所示的事项子图谱。需要说明的是,图7、图8和图9仅仅示例性地表示从用户画像知识图谱划分出用户子图谱和事项子图谱的过程,其他用户画像知识图谱可以照此类推,划分得到用户子图谱和事项子图谱。
[0069]
步骤s63:基于子图谱中相连节点之间的关系权重,在相连节点之间进行标签传播,以更新用户画像知识图谱。
[0070]
具体而言,标签传播的具体过程,可以参阅标签传播的技术细节,在此不再赘述。示例性地,相似的用户通常会办理相似的事项,基于上述用户子图谱和事项子图谱,可以利用标签传播算法,对没有标签或者标签缺失的用户进行标签补全,类似地,也可以对没有标签或者标签缺失的事项进行标签补全。请结合参阅图10,图10是标签补全一实施例的示意图。如图10所示,“张三”、“李四”、“王五”“赵六”四个用户办理的事项相似,他们之间的知识关联较强,在用户子图谱中关系权重也较大,则可以利用标签传播算法进行标签补全。例如,“张三”和“王五”均具有“旅游美食”标签,则可以推测“李四”和“赵六”也有类似的标签,从而可以给“李四”和“赵六”补全“旅游美食”标签(如图10中虚线矩形框所示)。当然,对于“小刘”、“小张”、“小黄”同理,可以给“小刘”补全“新闻资讯”标签(如图10中虚线矩形框所示)。其他情况可以以此类推,在此不再一一举例。
[0071]
步骤s64:基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征,并基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征。
[0072]
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
[0073]
步骤s65:基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度。
[0074]
本公开实施例中,目标推荐度表征向目标用户推荐办理目标事项的程度,且目标用户为任一用户,目标事项为任一事项,具体可以参阅前述公开实施例中相关描述,在此不再赘述。
[0075]
在一个实施场景中,请结合参阅图11,图11是本技术事项推荐方法一实施例的过
程示意图。如图11所示,交互数据通过聚类、基于tf-idf和tf抽取标签以及画像构建可以得到用户画像,而事项知识库和事项办理库可以通过知识抽取得到知识数据,在此基础上可以构建得到用户画像知识图谱。进一步地,通过用户画像知识图谱可以抽取出用户子图谱和事项子图谱,并基于标签传播算法进行知识补全,及融合知识表示和协同过滤进行智能推荐,得到向目标用户推荐目标事项的目标推荐度。
[0076]
上述方案,基于用户画像知识图谱,构建子图谱,且子图谱由属于目标类型的节点形成,目标类型在用户类型、事项类型中选择得到,子图谱中相连节点之间的连线标记有关系权重。基于此,再基于子图谱中相连节点之间的关系权重,在相连节点之间进行标签传播,以更新用户画像知识图谱,能够补全用户画像知识图谱,有利于进一步提升事项推荐的精确性。
[0077]
请参阅图12,图12是本技术事项推荐装置120一实施例的框架示意图。事项推荐装置120包括:信息获取模块121、第一提取模块122、第二提取模块123和推荐预测模块124,信息获取模块121,用于获取用户画像知识图谱,并获取用户事项办理情况;其中,用户画像知识图谱包括:分别表征用户和用户标签的节点、分别表征事项和事项标签的节点,且相连节点之间存在关系,用户事项办理情况包括各用户分别是否办理过各事项;第一提取模块122,用于基于用户画像知识图谱进行知识表示,得到各用户的第一用户特征和各事项的第一事项特征;第二提取模块123,用于基于用户事项办理情况进行协同过滤,得到各用户的第二用户特征和各事项的第二事项特征;推荐预测模块124,用于基于目标用户的第一用户特征和第二用户特征,以及目标事项的第一事项特征和第二事项特征进行推荐预测,得到目标推荐度;其中,目标推荐度表征向目标用户推荐办理目标事项的程度,且目标用户为任一用户,目标事项为任一事项。
[0078]
上述方案,一方面目标用户为任一用户,且目标事项为任一事项,故能够获取向任一用户推荐任一事项的推荐程度,有利于提升事项推荐的全面性,另一方面在事项推荐过程中,能够分别从业务知识和办理行为两个不同维度抽象出用户特征和事项特征,并融合两个维度的相关特征共同进行预测,有利于提升事项推荐的精度。
[0079]
在一些公开实施例中,推荐预测模块124包括特征关联子模块,用于基于目标用户的第一用户特征和目标事项的第一事项特征,得到第一关联特征,并基于目标用户的第二用户特征和目标事项的第二事项特征,得到第二关联特征;其中,第一关联特征和第二关联特征分别表示,在业务知识和办理行为两个维度上,目标用户和目标事项之间的相关性;推荐预测模块124包括联合预测子模块,用于基于第一关联特征和第二关联特征进行联合预测,得到目标推荐度。
[0080]
因此,先分别从业务知识维度和办理行为维度关联用户特征和事项特征,得到两个维度的关联特征,再结合两个维度的关联特征进行联合预测,有利于提升事项推荐的精准性。
[0081]
在一些公开实施例中,目标推荐度基于事项推荐模型得到,事项推荐模型包括第一关联网络、第二关联网络,以及分别与第一关联网络和第二关联网络连接的联合预测网络,第一关联网络用于获取第一关联特征,第二关联网络用于获取第二关联特征,联合预测网络用于执行联合预测。
[0082]
因此,通过事项推荐模型来获取目标推荐度,且事项推荐模型包括第一关联网络、
第二关联网络,以及分别与第一关联网络和第二关联网络连接的联合预测网络,第一关联网络用于获取第一关联特征,第二关联网络用于获取第二关联特征,联合预测网络用于执行联合预测,有利于提升事项推荐的效率。
[0083]
在一些公开实施例中,信息获取模块121包括画像构建子模块,用于基于用户在办理事项时的交互数据进行画像构建,得到用户画像;信息获取模块121包括知识抽取子模块,用于基于事项知识库和事项办理库进行知识抽取,得到知识数据;其中,用户画像包括用户标签和事项标签,事项知识库包括办理各事项的业务知识,事项办理库包括各用户的办理行为;信息获取模块121包括关系构建子模块,用于基于用户画像和知识数据进行关系构建,得到用户画像知识图谱。
[0084]
因此,通过用户办理事项时的交互数据构建用户画像,并通过事项知识库和事项办理库抽取出知识数据,以及结合用户画像和知识数据构建出用户画像知识图谱,能够有效利用非结构化的交互数据、事项知识库以及事项办理库进行用户和事项知识挖掘,从而能够为后续精准推荐事项提供基础。
[0085]
在一些公开实施例中,画像构建子模块包括数据聚类单元,用于将交互数据进行聚类,得到若干事项的聚类集合;画像构建子模块包括标签抽取单元,用于对于各事项的聚类集合,获取交互数据中分词词语的词语权重,并基于词语权重,选择至少一个分词词语作为标签;其中,词语权重由分词词语的tf值和tf-idf值加权得到;画像构建子模块包括画像构建单元,用于基于分别与各事项相关的用户和标签,构建用户画像。
[0086]
因此,通过将交互数据进行聚类,得到若干事项的聚类集合,而交互数据中分词词语的词语权重是基于分词词语的tf值和idf值加权得到的,且根据分词词语的词语权重,选择至少一个分词词语作为标签,故一方面可以通过tf-idf值筛选出各个事项中重要的分词词语,有利于排除一些无用或者很少出现的分词词语,另一方面结合tf值可以给出每个分词词语的重要性,从而结合两者能够准确地筛选出各个事项相关的标签,进而结合各个相关的用户,能够提升用户画像构建的准确性。
[0087]
在一些公开实施例中,数据聚类单元包括提取子单元,用于提取各个交互数据的语义特征表示;数据聚类单元包括聚类子单元,用于基于语义特征表示之间的相似度进行聚类,得到若干事项的聚类集合。
[0088]
因此,通过提取各个交互数据的语义特征表示,并基于语义特征表示之间的相似度进行聚类,得到若干事项的聚类集合,能够在语义层面实现数据聚类,提升交互数据聚类的准确性。
[0089]
在一些公开实施例中,分词词语的tf值的加权因子基于统计比值得到,且统计比值为第一统计值与第二统计值之间的比值,第一统计值为统计出tf-idf值的最小值,第二统计值为统计出tf值的最大值。
[0090]
因此,将分词词语的tf值的加权因子设置为基于统计比值得到,且统计比值为第一统计值与第二统计值之间的比值,第一统计值为统计出tf-idf值的最小值,第二统计值为统计出tf值的最大值,能够提升词语权重的准确性。
[0091]
在一些公开实施例中,与事项相关的标签作为事项标签,与用户相关的标签作为用户标签。
[0092]
因此,通过将与事项相关的标签作为事项标签,将与用户相关的标签作为用户标
specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器132可以由集成电路芯片共同实现。
[0103]
上述方案,一方面目标用户为任一用户,且目标事项为任一事项,故能够获取向任一用户推荐任一事项的推荐程度,有利于提升事项推荐的全面性,另一方面在事项推荐过程中,能够分别从业务知识和办理行为两个不同维度抽象出用户特征和事项特征,并融合两个维度的相关特征共同进行预测,有利于提升事项推荐的精度。
[0104]
请参阅图14,图14是本技术计算机可读存储介质140一实施例的框架示意图。计算机可读存储介质140存储有能够被处理器运行的程序指令141,程序指令141用于实现上述任一事项推荐方法实施例中的步骤。
[0105]
上述方案,一方面目标用户为任一用户,且目标事项为任一事项,故能够获取向任一用户推荐任一事项的推荐程度,有利于提升事项推荐的全面性,另一方面在事项推荐过程中,能够分别从业务知识和办理行为两个不同维度抽象出用户特征和事项特征,并融合两个维度的相关特征共同进行预测,有利于提升事项推荐的精度。
[0106]
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
[0107]
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
[0108]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
[0109]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0110]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0111]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,
read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1