一种物品推荐方法、装置、设备及存储介质与流程

文档序号:30979204发布日期:2022-08-03 00:11阅读:52来源:国知局
一种物品推荐方法、装置、设备及存储介质与流程

1.本发明涉及计算机技术领域,尤其涉及一种物品推荐方法、装置、设备及存储介质。


背景技术:

2.随着网络技术的快速发展和移动智能设备的普及,信息呈现爆发式增长。如何在海量信息中筛选得到用户感兴趣的信息,对满足不断增长的用户个性化需求具有重要意义。
3.目前,现有的物品推荐方法,通过对用户的历史行为数据进行分析和挖掘,以对用户的兴趣偏好进行建模,最终生成用户可能感兴趣的推荐物品列表。然而,在现有技术中,无法有效克服实际工业场景中的数据稀疏、隐式反馈数据较多、样本标注成本高、冷启动、可解释性受限和惊喜度差等问题,从而导致推荐结果的可用性较差。


技术实现要素:

4.本发明提供了一种物品推荐方法、装置、设备及存储介质,可以实现对行为数据和属性数据的充分挖掘,可以有效提升推荐结果的可用性。
5.根据本发明的一方面,提供了一种物品推荐方法,包括:
6.当检测到用户对目标物品的操作行为时,获取所述目标物品对应的交互行为数据和静态属性数据;
7.通过基于物品的协同过滤方法,根据所述目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度;
8.基于来自翻译模型的双向编码器表示模型,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合语义相似度;
9.根据各所述待推荐物品对应的融合行为相似度和融合语义相似度,获取各所述待推荐物品对应的总推荐度,并根据各所述待推荐物品对应的总推荐度对所述用户进行物品推荐。
10.根据本发明的另一方面,提供了一种物品推荐装置,包括:
11.数据获取模块,用于当检测到用户对目标物品的操作行为时,获取所述目标物品对应的交互行为数据和静态属性数据;
12.融合行为相似度获取模块,用于通过基于物品的协同过滤方法,根据所述目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度;
13.融合语义相似度获取模块,用于基于来自翻译模型的双向编码器表示模型,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合语义相似度;
14.总推荐度获取模块,用于根据各所述待推荐物品对应的融合行为相似度和融合语义相似度,获取各所述待推荐物品对应的总推荐度,并根据各所述待推荐物品对应的总推荐度对所述用户进行物品推荐。
15.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
16.至少一个处理器;以及
17.与所述至少一个处理器通信连接的存储器;其中,
18.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的物品推荐方法。
19.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的物品推荐方法。
20.本发明实施例的技术方案,当检测到用户对目标物品的操作行为时,获取目标物品对应的交互行为数据和静态属性数据;之后通过基于物品的协同过滤方法,根据目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度;并基于来自翻译模型的双向编码器表示模型,根据目标物品对应的静态属性数据,获取各待推荐物品对应的融合语义相似度;最终根据各待推荐物品对应的融合行为相似度和融合语义相似度,获取各待推荐物品对应的总推荐度,并根据各待推荐物品对应的总推荐度对用户进行物品推荐,通过采用基于物品的协同过滤方法和来自翻译模型的双向编码器表示模型共同进行相关物品推荐,可以实现对行为数据和属性数据的充分挖掘,可以克服数据稀疏、冷启动、可解释性受限和惊喜度差等问题,可以有效提升推荐结果的可用性。
21.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
22.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1a是根据本发明实施例一提供的一种物品推荐方法的流程图;
24.图1b是根据本发明实施例一提供的一种icf方法的流程示意图;
25.图1c是根据本发明实施例一提供的一种bert模型的训练过程示意图;
26.图2a是根据本发明实施例二提供的一种物品推荐方法的流程图;
27.图2b是根据本发明实施例二提供的一种物品推荐方法的流程示意图;
28.图3是根据本发明实施例三提供的一种物品推荐装置的结构示意图;
29.图4是实现本发明实施例的物品推荐方法的电子设备的结构示意图。
具体实施方式
30.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范
围。
31.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
32.实施例一
33.图1a为本发明实施例一提供了一种物品推荐方法的流程图,本实施例可适用于在检测到用户对物品的操作时,对用户进行物品推荐的情况,该方法可以由物品推荐装置来执行,该物品推荐装置可以采用硬件和/或软件的形式实现,该物品推荐装置可配置于电子设备中,典型的,电子设备可以是计算机设备或者服务器。如图1a所示,该方法包括:
34.s110、当检测到用户对目标物品的操作行为时,获取所述目标物品对应的交互行为数据和静态属性数据。
35.其中,目标物品,可以是用户当前正在操作的物品,例如,可以是商品、视频或者音频等。在本实施例中,当检测到用户对目标物品的操作行为,例如,浏览、点击、关注和分享等时,可以获取该目标物品对应的交互行为数据和静态属性数据。具体的,可以通过采用用户注册或者产品埋点采集的数据采集方式,获取目标物品对应的交互行为数据和静态属性数据。
36.其中,交互行为数据,可以是用户在应用程序或者计算机网站等多种业务场景中,对物品的操作行为数据。典型的,交互行为数据,可以包括用户标识、目标物品标识、交互行为类型以及行为发生时间等字段。交互行为类型可以包括浏览、点击、关注和分享等,行为发生时间可以使用时间戳进行表示。静态属性数据,可以包括物品标识、标题、类别、摘要和标签等字段。
37.可选的,在获取到交互行为数据和静态属性数据之后,可以按行对数据的各个字段进行存储。在本实施例中,在当前业务场景中,当检测到任意用户对任意物品的操作行为时,即可以采集对应的交互行为数据和静态属性数据,并可以按照设定格式将采集数据存储至本地数据库。
38.可选的,在对采集的交互行为数据和静态属性数据进行存储之前,还可以对采集数据进行预处理,例如,预处理可以包括字段类型检查、异常值检查、重复采集数据的清洗、异常用户过滤以及过热物品过滤等操作。
39.s120、通过基于物品的协同过滤方法,根据所述目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度。
40.其中,基于物品的协同过滤(item-based collaborative filtering,icf)方法,是通过对用户的行为数据进行关联分析和挖掘以生成相关推荐结果,即假设两个物品相关,如果用户对其中一个很感兴趣则对另一个也会很感兴趣。可以理解的是,在实际业务场景中,用户和物品之间的交互行为可以包括多种行为类型,例如,点击、点赞、收藏以及购买等。
41.icf方法的流程可以如图1b所示。其中,当前业务场景包括m个交互行为类型。具体的,首先,构建物品相似度矩阵,物品的数量为n。对于r,表示多个用户对于两个物品存在相同的交互行为类型,其取值表示用户的数量;例如,对于物品1和物品u,存在多个用户具有相同的交互行为类型。之后,基于物品相似度矩阵计算得到两个物品之间的各交互行为类型对应的行为相似度。最终,基于预设权重向量对各交互行为类型对应的行为相似度进行加权求和,以获取两个物品之间的融合行为相似度。
42.在本实施例中,首先根据目标物品对应的交互行为数据,获取目标物品对应的一个或者多个交互行为类型;然后,基于icf方法,计算得到目标物品与待推荐物品集合中每个待推荐物品之间的各交互行为类型对应的行为相似度;最终,将每个交互行为类型对应的行为相似度进行加权求和,以获取目标物品与每个待推荐物品之间的融合行为相似度。
43.其中,待推荐物品集合,可以包括至少一个待推荐物品;待推荐物品,可以是预先设置的物品,或者可以是与目标物品属于同一分类的物品。
44.s130、基于来自翻译模型的双向编码器表示模型,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合语义相似度。
45.其中,来自翻译模型的双向编码器表示(bidirectional encoder representation from transformers,bert)模型,用于提取文本对应的语义向量。bert模型的训练过程可以如图1c所示,主要通过使用掩码语言模型和下句预测两个新颖的无监督预测任务完成训练,可以为下游任务提供包含原始句子语义的嵌入或编码。
46.在本实施例中,首先,可以从目标物品对应的静态属性数据中,提取各字段对应的文本信息;然后,可以通过bert模型获取各文本信息对应的语义向量,故可获取各字段对应的语义向量。同时,可以在本地数据库中,获取各待推荐物品对应的静态属性数据,并基于bert模型提取各待推荐物品对应的各字段匹配的语义向量。进一步的,可以对目标物品与每个待推荐物品之间的各字段匹配的语义向量进行语义相似度计算,并对计算得到的各字段匹配的语义相似度进行加权求和,以获取目标物品与每个待推荐物品之间的融合语义相似度。
47.s140、根据各所述待推荐物品对应的融合行为相似度和融合语义相似度,获取各所述待推荐物品对应的总推荐度,并根据各所述待推荐物品对应的总推荐度对所述用户进行物品推荐。
48.具体的,在获取到目标物品与每个待推荐物品之间的融合行为相似度和融合语义相似度之后,可以对融合语义相似度和融合行为相似度进行加权求和,并将和值作为目标物品与每个待推荐物品之间的总推荐度。进一步的,可以按照总推荐度从高到低的顺序,对所有待推荐物品进行排序。最后,可以从排序后的待推荐物品中选择一定数量的物品向用户进行推荐。例如,可以生成推荐物品列表,并将该推荐物品列表的跳转链接发送至用户,或者可以将推荐物品列表展示在用户当前浏览页面的下方。本实施例对物品推荐的方式不作具体限定。
49.本发明实施例的技术方案,当检测到用户对目标物品的操作行为时,获取目标物品对应的交互行为数据和静态属性数据;之后通过基于物品的协同过滤方法,根据目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度;并基于来自翻译模型的双向编码器表示模型,根据目标物品对应的静态属性数据,获取各待
推荐物品对应的融合语义相似度;最终根据各待推荐物品对应的融合行为相似度和融合语义相似度,获取各待推荐物品对应的总推荐度,并根据各待推荐物品对应的总推荐度对用户进行物品推荐,通过采用基于物品的协同过滤方法和来自翻译模型的双向编码器表示模型共同进行相关物品推荐,可以实现对行为数据和属性数据的充分挖掘,可以克服数据稀疏、冷启动、可解释性受限和惊喜度差等问题,可以有效提升推荐结果的可用性。
50.在本实施例的一个可选的实施方式中,通过基于物品的协同过滤方法,根据所述目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度,可以包括:
51.s121、根据所述目标物品对应的交互行为数据,获取所述用户对所述目标物品执行的至少一个交互行为类型;
52.具体的,可以从交互行为数据中提取各字段对应的字段内容,以获取目标物品对应的一个或者多个行为类型。
53.s122、从本地数据库中获取历史交互行为数据,并通过所述基于物品的协同过滤方法,根据所述历史交互行为数据获取各所述待推荐物品对应的各所述交互行为类型匹配的行为相似度;
54.其中,历史交互行为数据,可以包括不同用户对不同物品的交互行为记录。在本实施例中,可以从历史交互行为数据中,获取每个待推荐物品对应的交互行为数据。
55.在一个具体的例子中,可以基于下述公式,计算得到物品i和j之间对于交互行为类型g的行为相似度simg(i,j)。
[0056][0057]
其中,ng(i)表示与物品i有过g行为的用户列表,其长度为|ng(i)|。ng(j)表示与物品j有过g行为的用户列表,其长度为|ng(j)|。ng(i)∩ng(j)表示对物品i和j均有g行为的用户列表。g取不同值表示不同的交互行为类型。在上述公式中,分子部分可以降低活跃用户的影响,而分母部分可以降低热门物品的影响。
[0058]
s123、根据各所述待推荐物品对应的各所述交互行为类型匹配的行为相似度,获取各所述待推荐物品对应的融合行为相似度。
[0059]
具体的,首先基于下述公式对各交互行为类型匹配的行为相似度进行最大值归一化处理,以获取归一化行为相似度norm_simg(i,j)。
[0060][0061]
然后,基于下述公式计算得到目标物品与待推荐物品之间的融合行为相似度sim(i,j)。
[0062]
[0063]
其中,p∈rs,表示各个交互行为类型对应的权重向量,g∈{1,2,

,s},s表示交互行为类型的数量。由此,基于上述过程,可以计算得到目标物品与每个待推荐物品之间的融合行为相似度。
[0064]
上述设置的好处在于,通过引入icf方法并进行优化,在相似度计算上减弱了热门物品和活跃用户对整体结果的影响,增强了推荐结果的解释性,同时克服了文本匹配带来的多样性和精细度差的问题。
[0065]
在本实施例的另一个可选的实施方式中,基于来自翻译模型的双向编码器表示模型,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合语义相似度,可以包括:
[0066]
s131、从所述目标物品对应的静态属性数据中,获取所述目标物品对应的各预设字段匹配的第一字段文本信息,并获取当前待推荐物品对应的各所述预设字段匹配的第二字段文本信息;
[0067]
其中,第一字段文本信息,为目标物品对应的各预设字段的字段内容;第二字段文本信息,为当前待推荐物品对应的各预设字段的字段内容。预设字段,可以包括物品标识、标题、类别和标签等字段。
[0068]
在本实施例中,可以从目标物品对应的静态属性数据中,提取各预设字段的字段内容,以获取第一字段文本信息。同时,可以从本地数据库中,获取当前待推荐物品对应的各预设字段的字段内容,以获取第二字段文本信息。
[0069]
s132、基于来自翻译模型的双向编码器表示模型,根据各所述预设字段匹配的第一字段文本信息,获取各所述预设字段匹配的第一语义向量,并根据各所述预设字段匹配的第二字段文本信息,获取各所述预设字段匹配的第二语义向量;
[0070]
其中,第一语义向量,为目标物品对应的各预设字段匹配的语义向量;第二语义向量,为待推荐物品对应的各预设字段匹配的语义向量。
[0071]
s133、基于欧式距离方法,根据各所述预设字段匹配的第一语义向量和第二语义向量,计算得到所述当前待推荐物品对应的各所述预设字段匹配的字段语义相似度;
[0072]
具体的,可以基于下述公式,计算得到物品i和j之间的对于预设字段f的字段语义相似度distf(i,j);
[0073][0074]
其中,k∈{1,2,

,n},表示语义向量的维度。由此,基于上述公式,可以计算得到当前待推荐物品对应的各预设字段匹配的字段语义相似度。
[0075]
s134、根据各所述预设字段匹配的字段语义相似度,计算得到所述当前待推荐物品对应的融合语义相似度。
[0076]
具体的,基于下述公式,对各预设字段匹配的字段语义相似度进行最大值归一化处理,以获取归一化字段语义相似度norm_distf(i,j)。
[0077][0078]
进一步的,对各归一化字段语义相似度进行加权求和,以获取融合语义相似度dist(i,j)。
[0079][0080]
其中,v∈rs,表示各个预设字段对应的权重向量,f∈{1,2,

,k},k表示预设字段的数量。
[0081]
在本实施例的另一个可选的实施方式中,基于欧式距离方法,根据各所述预设字段匹配的第一语义向量和第二语义向量,计算得到所述当前待推荐物品对应的各所述预设字段匹配的字段语义相似度,可以包括:基于近似最近邻方法,根据所述目标物品对应的各预设字段匹配的第一语义向量,从所述各待推荐物品中筛选得到预设数量的候选待推荐物品;若确定所述候选待推荐物品包括所述当前待推荐物品,则基于欧式距离方法,根据各所述预设字段匹配的第一语义向量和第二语义向量,计算得到所述当前待推荐物品对应的各所述预设字段匹配的字段语义相似度。
[0082]
在本实施例中,可以基于近似最近邻(approximate nearest neighbor,ann)方法对推荐结果生成进行优化。具体的,建立二叉树结构用于表示各预设字段对应的语义向量,每一个节点表示待推荐物品对应的一个语义向量,在空间中距离接近的语义向量在二叉树结构中表现为位置靠近的节点。此外,针对每一个预设字段,可以建立对应的二叉树结构,以生成森林。然后,对各二叉树进行搜索,即对于目标物品对应的预设字段匹配的第一语义向量,从根节点依次使用法向量与第一语义向量做内积运算,以判断使用左子树还是右子树,直至完成对各二叉树的遍历,以筛选得到预设数量的候选待推荐物品。
[0083]
进一步的,对于筛选得到的候选待推荐物品,基于欧式距离方法,计算目标物品与每个候选待推荐物品之间的各预设字段匹配的字段语义相似度。
[0084]
在本实施例的另一个可选的实施方式中,根据各所述预设字段匹配的字段语义相似度,计算得到所述当前待推荐物品对应的融合语义相似度,可以包括:对各所述预设字段匹配的字段语义相似度进行归一化处理,以获取各所述预设字段匹配的归一化字段语义相似度;对各所述预设字段匹配的归一化字段语义相似度进行加权求和,以获取所述当前待推荐物品对应的融合语义相似度。
[0085]
具体的,在对待推荐物品对应的融合语义相似度计算时,可以首先获取所有预设字段匹配的最大字段语义相似度,然后采用各预设字段匹配的字段语义相似度除以该最大字段语义相似度,以获取对应的归一化字段语义相似度。最终,对各预设字段匹配的归一化字段语义相似度进行加权求和,将和值作为当前待推荐物品对应的融合语义相似度。
[0086]
上述设置的好处在于,基于bert模型进行深度语义实时匹配推荐,并基于ann方法对推荐结果进行优化,可以在提升推荐结果相关度的同时,克服纯文本匹配导致的惊喜度差以及文本特征稀疏的问题。
[0087]
实施例二
[0088]
图2a为本发明实施例二提供的一种物品推荐方法的流程图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施方式结合。如图2a所示,该方法包括:
[0089]
s210、当检测到用户对目标物品的操作行为时,获取所述目标物品对应的交互行为数据和静态属性数据。
[0090]
s220、通过基于物品的协同过滤方法,根据所述目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度。
[0091]
s230、基于来自翻译模型的双向编码器表示模型,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合语义相似度。
[0092]
s240、通过预设热度推荐方法,根据所述目标物品对应的交互行为数据,获取各所述待推荐物品对应的融合热度。
[0093]
在本实施例中,在获取到各待推荐物品对应的融合行为相似度和融合语义相似度的基础上,还可以通过预设热度推荐方法,获取各待推荐物品对应的融合热度。
[0094]
在一个具体的例子中,对于交互行为类型g,其对应的用户集合为ug,长度为|ug|,则可以基于下述公式计算得到物品i的交互行为类型g对应的热度。
[0095][0096]
同时,考虑到置信度问题,可以使用威尔逊区间(wilson confidence intervals)下限值对物品i的热度的计算方法进行优化,故可以基于下述公式计算得到物品i的交互行为类型g对应的优化热度。
[0097][0098]
其中,表示对应某个置信水平的z统计量,为常数。一般情况下,在95%的置信水平下,z统计量的值为1.96。
[0099]
之后,可以基于下述公式,对各交互行为类型对应的优化热度进行最大值归一化处理,以获取对应的归一化优化热度norm_hotg(i)。
[0100][0101]
最终,可以基于下述公式对各交互行为类型对应的归一化优化热度进行加权求和,以获取融合热度hot(i)。
[0102][0103]
上述设置的好处在于,通过引入热度计算,考虑到了推荐结果的受欢迎程度,同时通过引入威尔逊区间,提升了推荐结果的置信度,从而保证了线上推荐系统的鲁棒性。
[0104]
s250、通过bm25方法,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合文本相似度。
[0105]
在本实施例,还可以基于搜索引擎中bm25(best match 25)方法,根据静态属性数据中各预设字段对应的字段文本信息,与各待推荐物品进行文本匹配,以获取各待推荐物品对应的融合文本相似度。
[0106]
在一个具体的例子中,一个预设字段对应的字段文本信息可以视为一个文档,假设目标物品的字段文档为q,则所有物品的该字段文档构成字段文档集合c,其长度可以表示为|c|。之后,对c中文本信息进行分词去重后得到词典v,其长度可以表示为|v|。采用向量对任意字段的字段文本信息进行表示,可以得到其中dn表示中第n个词的词频,则设表示中第n个词的权重,忽略q中重复情况,则可以基于下述公式计算得到
[0107][0108]
其中,dfn表示第n个词在c中出现的文档频率,dl表示的长度,avdl表示c中所有文档长度的平均值,k1用来控制权重计算对词频的敏感程度,b用来控制文档长度对权重计算的惩罚程度,二者均为可调常数。由此,则可以基于下述公式计算得到物品j对应的文本和物品i对应的文本q之间的文本相似度。
[0109][0110]
假设所有预设字段组成的集合为t={1,

,f,

,k},其中,不同的f表示不同的预设字段,例如,f=1表示标题,f=2表示标签等。则单个物品的各字段文本信息可以表示为其中,表示词频向量,d为一个矩阵。
[0111]
因此,可以基于下述公式计算得到物品i和物品j在单个预设字段的文本相似度。
[0112][0113]
然后,基于下述公式对各预设字段的文本相似度进行最大值归一化处理,以获取对应的归一化文本相似度norm_relf(i,j)。
[0114][0115]
最终,可以基于下述公式计算得到各待推荐物品对应的融合文本相似度rel(i,j)。
[0116][0117]
其中,v∈rk,表示各预设字段对应的权重向量。
[0118]
上述设置的好处在于,可以在克服冷启动的影响的同时,进一步提升推荐结果的可解释性。
[0119]
s260、根据各所述待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度,获取各所述待推荐物品对应的总推荐度,并根据各所述待推荐物品对应的总推荐度对所述用户进行物品推荐。
[0120]
在本实施例中,可以综合考虑各待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度,以确定各待推荐物品对应的总推荐度。例如,可以将各匹配计算结果进行相加,并将和值作为最终的总推荐度。
[0121]
本发明实施例的技术方案,通过在获取到各推荐物品对应的融合行为相似度和融合语义相似度之后,通过预设热度推荐方法,根据目标物品对应的交互行为数据,获取各待推荐物品对应的融合热度;并通过bm25方法,根据目标物品对应的静态属性数据,获取各待推荐物品对应的融合文本相似度,最终,根据各待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度,获取各待推荐物品对应的总推荐度,并根据各待推荐物品对应的总推荐度对用户进行物品推荐,通过综合考虑融合行为相似度、融合语义相似度、融合热度和融合文本相似度,可以实现对交互行为数据和静态属性数据的更加充分的挖掘,可以提升对各种应用场景的适应性,可以进一步提升推荐结果的可用性。
[0122]
在本实施例的一个可选的实施方式中,根据各所述待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度,获取各所述待推荐物品对应的总推荐度,包括:对各所述待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度进行加权求和,以获取各所述待推荐物品对应的总推荐度。
[0123]
在一个具体的例子中,可以基于下述公式计算得到物品i和j之间的总推荐度rec_score(i,j);
[0124]
rec_score(i,j)=α
·
rel(i,j)+β
·
dist(i,j)+δ
·
sim(i,j)+λ
·
hot(j)
[0125]
其中,α、β、δ和λ均为预设权重,为实数。
[0126]
上述设置的好处在于,无需样本标注即可实现对多种类型的隐式反馈数据的有效利用,可以实现对多类型的交互行为数据和多字段的静态属性数据的充分分析和挖掘,可以有效克服数据稀疏、冷启动、可解释性受限以及惊喜度差等问题。
[0127]
在本实施例的一个具体的实施方式中,物品推荐方法的流程可以如图2b所示。具体的,首先在检测到用户对目标物品的操作行为时,获取静态属性数据和交互行为数据。然后,对于静态属性数据,获取各文本字段的字段文本信息,并基于bert模型和ann方法,根据各字段对应的字段文本信息,计算得到最大值归一化处理后的语义匹配推荐融合结果。同时,基于搜索引擎和bm25方法,根据各字段对应的字段文本信息,计算得到最大值归一化处理后的文本匹配推荐融合结果。
[0128]
此外,可以根据交互行为数据,获取用户对目标物品执行的各行为类型。然后,基于icf方法,根据目标物品对应的各行为类型,计算得到最大值归一化处理后的基于物品协
同过滤推荐融合结果。同时,基于热度计算方法,根据目标物品对应的各行为类型,计算得到最大值归一化处理后的热度推荐融合结果。
[0129]
最终,对语义匹配推荐融合结果、文本匹配推荐融合结果、基于物品协同过滤推荐融合结果和热度推荐融合结果进行加权求和,以获取物品相关推荐融合结果。进一步的,根据物品相关推荐融合结果,对各待推荐物品按照从高到低的顺序进行排序,并从排序后的所有待推荐物品中选择一定数量的待推荐物品进行用户推荐。
[0130]
实施例三
[0131]
图3为本发明实施例三提供的一种物品推荐装置的结构示意图。如图3所示,该装置包括:数据获取模块310、融合行为相似度获取模块320、融合语义相似度获取模块330和总推荐度获取模块340;其中,
[0132]
数据获取模块310,用于当检测到用户对目标物品的操作行为时,获取所述目标物品对应的交互行为数据和静态属性数据;
[0133]
融合行为相似度获取模块320,用于通过基于物品的协同过滤方法,根据所述目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度;
[0134]
融合语义相似度获取模块330,用于基于来自翻译模型的双向编码器表示模型,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合语义相似度;
[0135]
总推荐度获取模块340,用于根据各所述待推荐物品对应的融合行为相似度和融合语义相似度,获取各所述待推荐物品对应的总推荐度,并根据各所述待推荐物品对应的总推荐度对所述用户进行物品推荐。
[0136]
本发明实施例的技术方案,当检测到用户对目标物品的操作行为时,获取目标物品对应的交互行为数据和静态属性数据;之后通过基于物品的协同过滤方法,根据目标物品对应的交互行为数据,获取待推荐物品集合中各待推荐物品对应的融合行为相似度;并基于来自翻译模型的双向编码器表示模型,根据目标物品对应的静态属性数据,获取各待推荐物品对应的融合语义相似度;最终根据各待推荐物品对应的融合行为相似度和融合语义相似度,获取各待推荐物品对应的总推荐度,并根据各待推荐物品对应的总推荐度对用户进行物品推荐,通过采用基于物品的协同过滤方法和来自翻译模型的双向编码器表示模型共同进行相关物品推荐,可以实现对行为数据和属性数据的充分挖掘,可以克服数据稀疏、冷启动、可解释性受限和惊喜度差等问题,可以有效提升推荐结果的可用性。
[0137]
可选的,所述物品推荐装置,还包括:
[0138]
融合热度获取模块,用于通过预设热度推荐方法,根据所述目标物品对应的交互行为数据,获取各所述待推荐物品对应的融合热度;
[0139]
融合文本相似度获取模块,用于通过bm25方法,根据所述目标物品对应的静态属性数据,获取各所述待推荐物品对应的融合文本相似度;
[0140]
总推荐度获取模块340,具体用于根据各所述待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度,获取各所述待推荐物品对应的总推荐度。
[0141]
可选的,总推荐度获取模块340,具体用于对各所述待推荐物品对应的融合行为相似度、融合语义相似度、融合热度和融合文本相似度进行加权求和,以获取各所述待推荐物品对应的总推荐度。
[0142]
可选的,融合语义相似度获取模块330,包括:
[0143]
字段文本信息获取单元,用于从所述目标物品对应的静态属性数据中,获取所述目标物品对应的各预设字段匹配的第一字段文本信息,并获取当前待推荐物品对应的各所述预设字段匹配的第二字段文本信息;
[0144]
语义向量获取单元,用于基于来自翻译模型的双向编码器表示模型,根据各所述预设字段匹配的第一字段文本信息,获取各所述预设字段匹配的第一语义向量,并根据各所述预设字段匹配的第二字段文本信息,获取各所述预设字段匹配的第二语义向量;
[0145]
字段语义相似度计算单元,用于基于欧式距离方法,根据各所述预设字段匹配的第一语义向量和第二语义向量,计算得到所述当前待推荐物品对应的各所述预设字段匹配的字段语义相似度;
[0146]
融合语义相似度计算单元,用于根据各所述预设字段匹配的字段语义相似度,计算得到所述当前待推荐物品对应的融合语义相似度。
[0147]
可选的,字段语义相似度计算单元,具体用于基于近似最近邻方法,根据所述目标物品对应的各预设字段匹配的第一语义向量,从所述各待推荐物品中筛选得到预设数量的候选待推荐物品;若确定所述候选待推荐物品包括所述当前待推荐物品,则基于欧式距离方法,根据各所述预设字段匹配的第一语义向量和第二语义向量,计算得到所述当前待推荐物品对应的各所述预设字段匹配的字段语义相似度。
[0148]
可选的,融合语义相似度计算单元,包括:
[0149]
归一化处理子单元,用于对各所述预设字段匹配的字段语义相似度进行归一化处理,以获取各所述预设字段匹配的归一化字段语义相似度;
[0150]
加权求和子单元,用于对各所述预设字段匹配的归一化字段语义相似度进行加权求和,以获取所述当前待推荐物品对应的融合语义相似度。
[0151]
可选的,融合行为相似度获取模块320,包括:
[0152]
交互行为类型获取单元,用于根据所述目标物品对应的交互行为数据,获取所述用户对所述目标物品执行的至少一个交互行为类型;
[0153]
行为相似度获取单元,用于从本地数据库中获取历史交互行为数据,并通过所述基于物品的协同过滤方法,根据所述历史交互行为数据获取各所述待推荐物品对应的各所述交互行为类型匹配的行为相似度;
[0154]
融合行为相似度获取单元,用于根据各所述待推荐物品对应的各所述交互行为类型匹配的行为相似度,获取各所述待推荐物品对应的融合行为相似度。
[0155]
本发明实施例所提供的物品推荐装置可执行本发明任意实施例所提供的物品推荐方法,具备执行方法相应的功能模块和有益效果。
[0156]
需要说明的是,本实施例的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0157]
实施例四
[0158]
图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作
为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0159]
如图4所示,电子设备40包括至少一个处理器41,以及与至少一个处理器41通信连接的存储器,如只读存储器(rom)42、随机访问存储器(ram)43等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器41可以根据存储在只读存储器(rom)42中的计算机程序或者从存储单元48加载到随机访问存储器(ram)43中的计算机程序,来执行各种适当的动作和处理。在ram 43中,还可存储电子设备40操作所需的各种程序和数据。处理器41、rom 42以及ram 43通过总线44彼此相连。输入/输出(i/o)接口45也连接至总线44。
[0160]
电子设备40中的多个部件连接至i/o接口45,包括:输入单元46,例如键盘、鼠标等;输出单元47,例如各种类型的显示器、扬声器等;存储单元48,例如磁盘、光盘等;以及通信单元49,例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0161]
处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理,例如物品推荐方法。
[0162]
在一些实施例中,物品推荐方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元48。在一些实施例中,计算机程序的部分或者全部可以经由rom 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到ram 43并由处理器41执行时,可以执行上文描述的物品推荐方法的一个或多个步骤。备选地,在其他实施例中,处理器41可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行物品推荐方法。
[0163]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0164]
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0165]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质
可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0166]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0167]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0168]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0169]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0170]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1