物品推荐方法和装置与流程

文档序号:15831797发布日期:2018-11-07 07:23阅读:138来源:国知局
物品推荐方法和装置与流程

本申请涉及数据应用技术领域,具体而言,涉及一种物品推荐方法和装置。

背景技术

随着互联网的高速发展,物品推荐方法的应用场景越来越多,已经被广泛集成到了很多商业应用系统中,比较著名的有netflix在线视频推荐系统、amazon网络购物商城、今日头条等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了物品推荐方法,如淘宝、京东商城等。在物品推荐方法业务应用场景中,除了主页信息流的个性化推荐之外,物品详情页的相关推荐,也扮演着越来越重要的角色。物品推荐方法提供的相关推荐可以帮助用户更好的找到跟当前物品相关的物品,在电商平台中,相关的商品可以捆绑销售,在资讯平台中,物品推荐方法推荐的相关资讯可以作为深度阅读,或者兴趣发现等等,是体现推荐系统价值的非常重要的一个应用场景。amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。而资讯类的今日头条,其核心技术之一就是有一套优秀的物品推荐方法。

现有技术中,物品推荐方法是基于物品内容进行推荐,通常是基于物品的标签等,而这非常依赖于一套优秀的标签系统,例如,根据两个物品包括的标签进行关联,从而确定这两个物品之间的相似度,再根据物品相似度进行推荐。

在实施本申请实施例的过程中,发明人发现现有技术至少存在以下技术问题:

现有技术中,物品推荐方法只能基于物品内容进行推荐,推荐维度单一,推荐过程忽略了用户的行为,从而导致推荐给用户的物品并非用户最感兴趣的物品,推荐结果不准确。



技术实现要素:

本申请的主要目的在于提供一种物品推荐方法和装置,以解决现有技术推荐维度单一,推荐过程忽略了用户的行为,从而导致推荐给用户的物品并非用户最感兴趣的物品,推荐结果不准确的问题。

为了实现上述目的,第一方面,本申请实施例提供了一种物品推荐方法。

根据本申请的物品推荐方法包括:

根据目标物品获取与目标物品相关的多个推荐物品;

根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息;

分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。

可选地,根据目标物品和每个推荐物品的内容信息及协同信息,获得目标物品和每个推荐物品的综合信息,包括:

根据目标物品和每个推荐物品的内容信息获取目标物品和每个推荐物品的内容向量,并根据目标物品和每个推荐物品的标识获取目标物品和每个推荐物品的协同向量,其中,协同向量为协同信息;

根据目标物品的内容向量和协同向量获得目标物品的融合向量,以及根据每个推荐物品的内容向量和协同向量获得每个推荐物品的融合向量,其中,融合向量为综合信息。

可选地,根据目标物品和每个推荐物品的内容信息获取目标物品和每个推荐物品的内容向量,包括:

根据目标物品和每个推荐物品的内容信息,获取目标物品和每个推荐物品的标题分词和/或标签分词;

对目标物品和每个推荐物品的标题分词和/或标签分词进行向量化处理,获得目标物品的内容向量和每个推荐物品的内容向量。

可选地,根据目标物品的内容向量和协同向量获得目标物品的融合向量,以及根据每个推荐物品的内容向量和协同向量获得每个推荐物品的融合向量,包括:

对目标物品的内容向量和协同向量进行拼接处理获取目标物品的融合向量,以及对每个推荐物品的内容向量和协同向量进行拼接处理获取每个推荐物品的融合向量。

可选地,本物品推荐方法还包括:

根据业务信息和/或经验信息对每个推荐物品相对目标物品的相似度值进行数据处理,获取每个推荐物品相对目标物品的相似度评分,从而得到每个推荐物品与目标物品的相似度评分排序。

第二方面,本申请实施例提供了一种物品推荐装置,包括:

第一获取模块,用于根据目标物品获取与目标物品相关的多个推荐物品;

第二获取模块,用于根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息;

运算模块,用于分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。

可选地,第二获取模块,用于:

根据目标物品和每个推荐物品的内容信息获取目标物品和每个推荐物品的内容向量,并根据目标物品和每个推荐物品的标识获取目标物品和每个推荐物品的协同向量,其中,协同向量为协同信息;

根据目标物品的内容向量和协同向量获得目标物品的融合向量,以及根据每个推荐物品的内容向量和协同向量获得每个推荐物品的融合向量,其中,融合向量为综合信息。

可选地,第二获取模块,用于:

根据目标物品和每个推荐物品的内容信息,获取目标物品和每个推荐物品的标题分词和/或标签分词;

对目标物品和每个推荐物品的标题分词和/或标签分词进行向量化处理,获得目标物品的内容向量和每个推荐物品的内容向量。

可选地,第二获取模块,用于:

对目标物品的内容向量和协同向量进行拼接处理获取目标物品的融合向量,以及对每个推荐物品的内容向量和协同向量进行拼接处理获取每个推荐物品的融合向量。

可选地,本物品推荐装置还包括:

数据处理模块,用于根据业务信息和/或经验信息对每个推荐物品相对目标物品的相似度值进行数据处理,获取每个推荐物品相对目标物品的相似度评分,从而得到每个推荐物品与目标物品的相似度评分排序。

在本申请实施例中提供的物品推荐方法,通过根据目标物品获取与目标物品相关的多个推荐物品;根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息;分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。这样,采用每个推荐物品的内容信息及协同信息获取综合信息,其中协同信息中包括有用户的行为,达到了多个推荐维度对推荐物品的相似度进行运算,提高了推荐结果准确性的目的,从而实现了更加准确地确定了每个推荐物品相对目标物品的相似度值,得到每个推荐物品与目标物品的更加合理的相似度排序的技术效果,进而解决了现有技术推荐维度单一,推荐过程忽略了用户的行为,从而导致推荐给用户的物品并非用户最感兴趣的物品,推荐结果不准确的技术问题。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的一种物品推荐方法的流程图;

图2是根据本申请实施例的一种步骤200的流程图;

图3是根据本申请实施例的一种步骤210的流程图;

图4是根据本申请实施例的另一种物品推荐方法的流程图;

图5是根据本申请实施例的一种物品推荐装置的结构示意图;

图6是根据本申请实施例的另一种物品推荐装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本申请实施例提供了一种物品推荐方法,如图1所示,该方法包括如下的步骤s100至步骤s300:

s100,根据目标物品获取与目标物品相关的多个推荐物品。

在本实施例中,该目标物品可以为电商平台中的商品或服务项目,例如,该目标物品可以为某电商平台上的电子产品或者咨询服务项目等,该目标物品也可以为资讯平台中的资讯,例如该目标物品可以为一个体育新闻或娱乐新闻等,该目标物品也可以为视频平台中的视频,例如,该目标物品可以为一个电影或电视机等。与该目标物品相关的推荐物品,对应的也可以电商平台中的商品或服务项目,也可以为资讯平台中的资讯,也可以为视频平台中的视频。

在实施中,获取与目标物品相关的多个推荐物品的方法,可以是基于内容推荐方法生成的与目标物品相关的多个推荐物品,可以是根据用户协同推荐方法或者物品协同方法生成的与目标物品相关的多个推荐物品,也可以是根据业务规则推荐方法生成的与目标物品相关的多个推荐物品,还可以是上述各方法生成的并集,该并集中包括上述各方法生成的与目标物品相关的多个推荐物品。

s200,根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息。

在本实施例中,目标物品的内容信息至少包括目标物品的标题和/或标签,目标物品的协同信息包括与目标物品相关的用户的行为信息,推荐物品的内容信息至少包括推荐物品的标题和/或标签,推荐物品的协同信息至少包括与推荐物品相关的用户的行为信息。

在实施中,可选地,如图2所示,步骤200,根据目标物品和每个推荐物品的内容信息及协同信息,获得目标物品和每个推荐物品的综合信息,包括如下的步骤210和步骤220:

步骤210,根据目标物品和每个推荐物品的内容信息获取目标物品和每个推荐物品的内容向量,并根据目标物品和每个推荐物品的标识获取目标物品和每个推荐物品的协同向量,其中,协同向量为协同信息。

在本实施例中,协同向量即为协同信息,目标物品和每个推荐物品的标识即为目标物品和每个推荐物品的id(identification,身份标识)。根据目标物品和每个推荐物品的标识获取目标物品和每个推荐物品的协同向量,具体为:

向协同向量数据库发送第一请求,其中,第一请求中包括目标物品的标识或一个推荐物品的标识,以使协同向量数据库根据第一请求调取对应第一请求中目标物品的标识或推荐物品的标识的协同向量,并将对应标物品的标识或推荐物品的标识的协同向量进行反馈;

接收对应标物品的标识或推荐物品的标识的协同向量,即获取了目标物品或推荐物品的协同向量。

另外,当向协同向量数据库不存在对应目标物品的标识或推荐物品的标识的协同向量时,设定该目标物品或推荐物品的协同向量为0。

在本实施例中,协同向量数据库中存储的协同向量,根据历史用户评分矩阵生成或者根据用户的行为记录生成,其中,根据历史用户评分矩阵生成协同向量数据库中的协同向量或者根据对应各物品的用户的行为记录生成协同向量数据库中的协同向量的过程,具体为:

根据sparkals算法对历史用户评分矩阵或者对应各物品的用户的行为记录进行运算获取对应各物品的协同向量,其中,该历史用户评分矩阵根据用户的显式或隐式行为反馈计算生成。比如在视频推荐领域,常见的用户行为有点击、播放、收藏、评论、分享、点赞等。这里可以对每种行为设置一个权重,比如权重范围是1到5,点击、播放、收藏、评论、分享、点赞的权重分别为1、2、3、4、5,通过解析大量的用户行为日志即可得到用户对视频的历史用户评分矩阵,如表1所示。表1为历史用户评分矩阵的部分内容,“-”表示用户对改物品没有评分。

表1历史用户评分矩阵

而用户的行为记录可以为用户查看物品的时长或一个物品的总点击量等。

在本实施例中,具体地,如图3所示,在步骤210中,根据目标物品和每个推荐物品的内容信息获取目标物品和每个推荐物品的内容向量,包括如下步骤211和步骤212:

步骤211,根据目标物品和每个推荐物品的内容信息,获取目标物品和每个推荐物品的标题分词和/或标签分词。

在实施中,获取目标物品和每个推荐物品的标题分词和/或标签分词,例如,目标物品为一个体育新闻,标题为“哈登确定复出,火箭变阵,悍将代替铁扎首发”,对该标题分词后,获得分词“哈登/确定/复出/,/火箭/变阵/,/悍将/代替/铁扎/首发”,目标物品的标签为“体育新闻”分词后,获得“体育/新闻”。

步骤212,对目标物品和每个推荐物品的标题分词和/或标签分词进行向量化处理,获得目标物品的内容向量和每个推荐物品的内容向量。

在实施中,对目标物品和每个推荐物品的标题分词和/或标签分词进行向量化处理,获取每个标题分词和/或标签分词对应的词向量,该向量化处理可以由word2vec执行,假设物品的标题经过分词后,分词分别为w1w2…wm,经过word2vec进行向量化后,生成的词向量分别为vw1vw2vw3…vwm,物品的标签分词分别为t1t2…tn,经过word2vec进行向量化后,生成相应的向量,vt1vt2vt3…vtn,最终物品的内容向量为

公式中,vci为内容向量,vi为标题对应的词向量,vj为标签对应的词向量,m为标题对应的词向量个数,n为标签对应的词向量个数。

步骤220,根据目标物品的内容向量和协同向量获得目标物品的融合向量,以及根据每个推荐物品的内容向量和协同向量获得每个推荐物品的融合向量,其中,融合向量为综合信息。

在实施中,根据目标物品的内容向量和协同向量获得目标物品的融合向量,以及根据每个推荐物品的内容向量和协同向量获得每个推荐物品的融合向量,具体为:

对目标物品的内容向量和协同向量进行拼接处理获取目标物品的融合向量,以及对每个推荐物品的内容向量和协同向量进行拼接处理获取每个推荐物品的融合向量。

例如,一个推荐物品的内容向量为(0.01,0.1,0.0081,0.6,0.7),该推荐物品的协同向量为(0.58,0.607,0.432),对该推荐物品的内容向量和协同向量进行拼接,获得该推荐物品的融合向量(0.01,0.1,0.0081,0.6,0.7,0.58,0.607,0.432),目标物品的内容向量为(0.02,0.09,0.0003,0.5,0.7),目标物品的协同向量为0,对该目标物品的内容向量和协同向量进行拼接,获得该目标物品的融合向量(0.02,0.09,0.0003,0.5,0.7,0,0,0)。

s300,分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。

在实施中,分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算可以通过cosine余弦相似度公式进行运算,例如:

公式中,scoresr为相似度值,vsi为目标物品的融合向量,vri为第i个推荐物品的融合向量。

其中,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序,例如,目标物品为一个体育新闻,标题为“哈登确定复出,火箭变阵,悍将代替铁扎首发”,多个推荐物品均为体育新闻,多个推荐物品标题及对应的相似度分别为:

标题为“火箭老大放话,两首发被送上替补席!解决这一问题,火箭必须变阵”,相似度值为0.8623;

标题为“火箭变阵,首发阵容完善,两首发送上替补席,有一个你意想不到!”,相似度值为0.8450;

标题为“火箭12连胜后再迎好消息,内线悍将明天复出,球迷贺杀神回归”,相似度值为0.7532;

标题为“不可思议!哈登再次创下nba一项72年的记录,火箭一导师很关键!”,相似度值为0.6249;

根据上述各推荐物品相对目标物品的相似度值,确定各推荐物品的排序。

可选地,如图4所示,本物品推荐方法还包括:

步骤400,根据业务信息和/或经验信息对每个推荐物品相对目标物品的相似度值进行数据处理,获取每个推荐物品相对目标物品的相似度评分,从而得到每个推荐物品与目标物品的相似度评分排序。

在本实施例中,业务信息可以为业务上需求设置等,例如需要对某些物品进行推广等业务,根据业务信息在推荐物品的相对目标物品的相似度值基础上,获取每个推荐物品相对目标物品的相似度评分,例如,一个推荐物品的相对目标物品的相似度值为0.7859,但是该推荐物品包括在业务信息内,则该推荐物品相对目标物品的相似度评分为相似度值加上一个由业务信息预设的值,这样,该推荐物品相对目标物品的相似度评分会大于0.7859,当另一个推荐物品的相对目标物品的相似度值为0.8001时,但是该推荐物品未包括在业务信息内,则该推荐物品相对目标物品的相似度评分即为该推荐物品相对目标物品的相似度值,为0.8001。经验信息可以为历史经验,例如当一个物品的标题包含某一个特定的词语时,该物品更加用户的欢迎,根据该推荐物品为体育新闻时,其标题中包含有“梅西”,则根据经验信息在推荐物品的相对目标物品的相似度值基础上,获取每个推荐物品相对目标物品的相似度评分,例如,该推荐物品的相对目标物品的相似度值为0.8326,经过经验信息对该推荐物品进行数据处理后,该推荐物品的相对目标物品的相似度评分为0.9326,在相似度值0.8326的基础上加了一个预设值0.1。

在本申请实施例中提供的物品推荐方法,通过根据目标物品获取与目标物品相关的多个推荐物品;根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息;分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。这样,采用推荐物品的内容信息及协同信息获取综合信息,其中协同信息中包括有用户的行为,达到了多个推荐维度对推荐物品的相似度进行运算,提高了推荐结果准确性的目的,从而实现了更加准确地确定了每个推荐物品相对目标物品的相似度值,得到每个推荐物品与目标物品的更加合理的相似度排序的技术效果,进而解决了现有技术推荐维度单一,推荐过程忽略了用户的行为,从而导致推荐给用户的物品并非用户最感兴趣的物品,推荐结果不准确的技术问题。

基于与上述物品推荐方法相同的技术构思,本申请实施例还提供了一种物品推荐装置,如图5所示,包括:

第一获取模块10,用于根据目标物品获取与目标物品相关的多个推荐物品;

第二获取模块20,用于根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息;

运算模块30,用于分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。

可选地,第二获取模块20,用于:

根据目标物品和每个推荐物品的内容信息获取目标物品和每个推荐物品的内容向量,并根据目标物品和每个推荐物品的标识获取目标物品和每个推荐物品的协同向量,其中,协同向量为协同信息;

根据目标物品的内容向量和协同向量获得目标物品的融合向量,以及根据每个推荐物品的内容向量和协同向量获得每个推荐物品的融合向量,其中,融合向量为综合信息。

可选地,第二获取模块20,用于:

根据目标物品和每个推荐物品的内容信息,获取目标物品和每个推荐物品的标题分词和/或标签分词;

对目标物品和每个推荐物品的标题分词和/或标签分词进行向量化处理,获得目标物品的内容向量和每个推荐物品的内容向量。

可选地,第二获取模块20,用于:

对目标物品的内容向量和协同向量进行拼接处理获取目标物品的融合向量,以及对每个推荐物品的内容向量和协同向量进行拼接处理获取每个推荐物品的融合向量。

可选地,如图6所示,本物品推荐装置还包括:

数据处理模块40,用于根据业务信息和/或经验信息对每个推荐物品相对目标物品的相似度值进行数据处理,获取每个推荐物品相对目标物品的相似度评分,从而得到每个推荐物品与目标物品的相似度评分排序。

在本申请实施例中提供的物品推荐装置,通过第一获取模块10,用于根据目标物品获取与目标物品相关的多个推荐物品;第二获取模块20,用于根据目标物品和每个推荐物品的内容信息及协同信息,获取目标物品和每个推荐物品的综合信息;运算模块30,用于分别将每个推荐物品的综合信息与目标物品的综合信息进行相似度运算,得到每个推荐物品相对目标物品的相似度值,从而得到每个推荐物品与目标物品的相似度排序。这样,本物品推荐装置采用推荐物品的内容信息及协同信息获取综合信息,其中协同信息中包括有用户的行为,达到了多个推荐维度对推荐物品的相似度进行运算,提高了推荐结果准确性的目的,从而实现了更加准确地确定了每个推荐物品相对目标物品的相似度值,得到每个推荐物品与目标物品的更加合理的相似度排序的技术效果,进而解决了现有技术推荐维度单一,推荐过程忽略了用户的行为,从而导致推荐给用户的物品并非用户最感兴趣的物品,推荐结果不准确的技术问题。

显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1