商品流行度的演化分析方法及装置与流程

文档序号:11729440阅读:208来源:国知局
商品流行度的演化分析方法及装置与流程

本发明涉及数据处理及分析技术领域,尤其涉及一种商品流行度的演化分析方法及装置。



背景技术:

视频的流行度对于在线视频业务中的优化资源配置和视频推荐来说是一个重要参考因素。现有技术中大多是对视频流行度的预测方法,却极少有对该流行度的演化过程进行分析,不对流行度算法的结果进行分析,就无法保证视频推荐的准确性,因此,现有技术中存在着无法保证视频推荐的准确性的问题。



技术实现要素:

本发明的主要目的在于提出一种商品流行度的演化分析方法及装置,旨在解决现有技术中存在的无法保证视频推荐的准确性的问题。

为实现上述目的,本发明提供了一种商品流行度的演化分析方法,所述方法包括:

根据用户的历史行为记录构建用户-商品的二分网络;

根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度;

利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度;

基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。

此外,为实现上述目的,本发明还提供了一种商品流行度的演化分析装置,所述装置包括:

构建模块,用于根据用户的历史行为记录构建用户-商品的二分网络;

第一确定模块,用于根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度;

第二确定模块,用于利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度;

第三确定模块,用于基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。

本发明提出的商品流行度的演化分析方法,根据用户的历史行为记录构建用户-商品的二分网络,然后根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度,并利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度,从而基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。跟现有技术相比,本发明首先根据用户的历史行为记录构建用户-商品的二分网络,并根据该二分网络确定商品的真实增长流行度,利用预设依附偏好机制及所述二分网络确定所述商品i的预期增长流行度,通过真实增长流行度及预期增长流行度可以得到关联比,基于该关联比可以对商品流行度的预测结果进行分析,从而提高视频推荐的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明第一实施例提供的一种商品流行度的演化分析方法的流程示意图;

图2为图1中的步骤s102的细化步骤的流程示意图;

图3为本发明第一实施例提供的一个二分网络示意图;

图4为本发明第二实施例提供的一种商品流行度的演化分析方法的流程示意图;

图5为movielens和netflix的用户数量的增长趋势图;

图6为所有商品的评价数增长趋势图;

图7为早年发布的商品的关联比ri(t)趋势图;

图8为不同年份发布的商品的关联比ri(t)的分布情况的示意图;

图9为不同的时间间隔下对不同发布年限的商品的关联比ri(t)的分布情况的示意图;

图10为本发明第三实施例提供的一种商品流行度的演化分析装置的功能模块的示意图;

图11为本发明第三实施例中的第一确定模块1102的细化功能模块的示意图;

图12为本发明第四实施例提供的一种商品流行度的演化分析装置的功能模块的示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

请参阅图1,图1为本发明第一实施例提供的一种商品流行度的演化分析方法的流程示意图,包括:

步骤s101、根据用户的历史行为记录构建用户-商品的二分网络;

在本发明实施例中,历史行为记录可以是用户购买商品的记录和/或用户对商品的评价记录。

其中,二分网络由两种类型的节点构成,边只在不同类型的节点间存在。在本发明实施例中,根据用户的历史行为记录构建用户-商品的二分网络,将用户节点集合记为u(t),商品节点集合记为o(t),用户与商品之间的二元关系记为l(t),所述二元关系表示在用户节点与商品节点间存在的边。

优选的,本发明实施例中的二分网络中的一条边表示:用户γ对商品i进行过评分并生成一条记录lγi,其中,lγi∈l。

步骤s102、根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度;

具体的,请参阅图2,为本发明第一实施例中的步骤s102的细化步骤的流程示意图,包括:

步骤s201、利用所述二分网络确定所述商品i在所述t时刻的真实流行度及所述t+1时刻的真实流行度;

在本发明实施例中,从二分网络中获取t时刻商品i与每一个用户之间的边的数量,该数量即为商品i在t时刻的真实流行度。从二分网络中获取t+1时刻商品i与每一个用户之间的边的数量,该数量即为商品i在t+1时刻的真实流行度。

步骤s202、将所述商品i在所述t+1时刻的真实流行度与所述商品i在所述t时刻的真实流行度的差值作为所述商品i从所述t时刻到所述t+1时刻的真实增长流行度。

在本发明实施例中,商品i在t+1时刻的真实流行度减去商品i在t时刻的真实流行度的结果就是商品i从t时刻到t+1时刻的真实增长流行度。例如,基于图3所示的二分网络示意图,可以知道商品α在t=2的时候的流行度等于3(商品α在t=1的时候的边的数量加上商品α在t=2的时候的边的数量,即2+1),商品α在t=3的时候的流行度等于4(商品α在t=1的时候的边的数量加上商品α在t=2的时候的边的数量加上商品α在t=3的时候的边的数量,即2+1+1),将商品α在t=3时刻的真实流行度与商品α在t=2时刻的真实流行度的差值(4-3=1)作为商品α从t=2时刻到t=3时刻的真实增长流行度。

在本发明实施例中,根据用户的历史行为记录构建用户-商品的二分网络,利用二分网络确定商品i在t时刻的真实流行度及t+1时刻的真实流行度,之后将商品i在t+1时刻的真实流行度与商品i在t时刻的真实流行度的差值作为商品i从t时刻到t+1时刻的真实增长流行度。并利用预设依附偏好机制及二分网络确定商品i的预期增长流行度,通过真实增长流行度及预期增长流行度可以得到关联比,基于该关联比可以对商品流行度的预测结果进行分析,从而提高视频推荐的准确性。

步骤s103、利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度;

在本发明实施例中,按照如下预设依附偏好机制计算商品i从t时刻到t+1时刻的预期增长流行度。

预设依附偏好机制具体为:

其中,i表示一个或一类商品,δl(t+1)表示所有商品从t时刻到t+1时刻的真实增长流行度总和,ki(t)表示商品i在t时刻的流行度,l(t)表示所有商品在t时刻的真实流行度总和。

步骤s104、基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。

在本发明实施例中,将商品i的真实增长流行度与商品i的预期增长流行度的商作为关联比,且商为:

其中,r表示关联比,i表示一个或一类商品,δki(t+1)表示商品i从t时刻到t+1时刻的预期增长流行度,l(t)表示所有商品在t时刻的真实流行度总和,δl(t+1)表示所有商品从t时刻到t+1时刻真实增长流行度总和,ki(t)表示商品i在t时刻的流行度。

在本发明实施例中,根据用户的历史行为记录构建用户-商品的二分网络,并根据该二分网络确定商品的真实增长流行度,利用预设依附偏好机制及二分网络确定商品i的预期增长流行度,通过真实增长流行度及预期增长流行度可以得到关联比,基于该关联比可以对商品流行度的预测结果进行分析,从而提高视频推荐的准确性。

请参阅图4,图4为本发明第二实施例提供的一种商品流行度的演化分析方法的流程示意图,包括:

步骤s401、根据用户的历史行为记录构建用户-商品的二分网络;

步骤s402、利用获取到的所述二分网络的容量大小确定所述t时刻与所述t+1时刻之间的时间间隔。

在本发明实施例中,获取二分网络中所有商品与所有用户之间的二元关系,并利用该二元关系的容量大小确定t时刻与t+1时刻之间的时间间隔。

例如,获取的二分网络中所有商品与所有用户之间的二元关系的起始时间为2000年,结束时间为2005年,可以根据2000年-2005年间所有商品与所有用户的二元关系的容量大小将t时刻与t+1时刻之间的时间间隔设置为6个月,从而将2000年-2005年分为10等分。

步骤s403、根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度;

步骤s404、利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度;

步骤s405、基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。

其中,本发明实施例中的步骤s401、步骤s403、步骤s404、步骤s405分别与第一实施例中的步骤s101、步骤s102、步骤s103、步骤s104描述的内容一致,此处不再赘述。

在本发明实施例中,通过对这个关联比ri(t)的分析,可以判断出:

1、ri(t)=0时,表示商品i在t时刻没有获得流行度,即δki(t)=0。

2、0<ri(t)<1时,表示商品i在t时刻真实增长流行度<预期增长流行度。

3、ri(t)=1时,表示商品i在t时刻真实增长流行度=预期增长流行度。

4、ri(t)>1时,表示商品i在t时刻真实增长流行度>预期增长流行度。

其中,当ri(t)>>1时,表示商品i在t时刻真实增长流行度远远超过于预期增长流行度,这时可以判断出,商品i在t时刻出现了爆发现象。

其中,本发明实施例中,选择两个常用的真实评分系统:movielens和netflix。本发明实施例中尝试在这两个实际的系统中所产生的真实数据进行实验与分析并得到如下结论:

1、movielens和netflix的用户数量的增长趋势如图5所示,a为movielens的用户数量的增长趋势,b为netflix的用户数量的增长趋势,从图中可以看出movielens的用户增长逐渐变缓慢,而netflix的用户增长逐渐增大。

2、所有商品的评价数增长趋势如图6所示,从图中可以看出所有商品的评价数增长趋势总体上呈现一开始商品的评价数量增加较多,但随着时间增长商品的总评分数增长的越来越缓慢,最后趋于稳定。

3、从图7可以看出,早年发布的商品,很长一段时间关联比ri(t)=0,netflix相对比movielens少一些,但总体可以看出越早年发布的商品,会有越多的关联比ri(t)=0,它们的流行度越趋于稳定(流行度为0)。

4、不同年份发布的商品的关联比ri(t)的分布情况如图8所示,从图8中可以看出,商品在发布后的早期时间段内,会爆发获得比较大的流行度,但在爆发之后流行度会相应的减少,最后趋向稳定值(关联比ri(t)=1),此时真实增长流行度与预期增长流行度相差不大。

5、根据二元网络的容量大小确定t时刻与t+1时刻之间的时间间隔,图9示出了在不同的时间间隔下对不同发布年限的商品的关联比ri(t)的分布情况,从图9中可以看出,movielens在1995年以前发布的商品的关联比ri(t)趋向稳定,在关联比ri(t)=1进行上下浮动,netflix在2000年以前发布的商品的关联比ri(t)趋向稳定,在关联比ri(t)=1进行上下浮动,其中,时间间隔越大,关联比ri(t)的值越低,也就是说随着时间流逝,商品的流行度在降低。movielens在1995年之后发布的商品及netflix在2000年之后发布的商品,在发布的早期,将爆发获得比较大的流行度(呈指数增长),并且时间间隔越小,增长越快速,也就是说,时间越早,爆发的效果越明显。从整体反映出,越新的商品,越容易爆发获得比较大的流行度。

在本发明实施例中,根据用户的历史行为记录构建用户-商品的二分网络,利用获取到的二分网络的容量大小确定t时刻与t+1时刻之间的时间间隔。其中,利用二分网络的容量大小确定t时刻与t+1时刻之间的时间间隔有利于真实增长流行度与预期增长流行度的计算,使得计算过程更加简便,计算结果更加准确,从而也会提高通过真实增长流行度及预期增长流行度得到的关联比,提高视频推荐的准确性。

请参阅图10,图10为本发明第三实施例中商品流行度的演化分析装置的功能模块的示意图,该演化分析装置包括:构建模块1001、第一确定模块1002、第二确定模块1003、第三确定模块1004。具体的:

构建模块1001,用于根据用户的历史行为记录构建用户-商品的二分网络;

在本发明实施例中,历史行为记录可以是用户购买商品的记录和/或用户对商品的评价记录。

其中,二分网络由两种类型的节点构成,边只在不同类型的节点间存在。在本发明实施例中,根据用户的历史行为记录构建用户-商品的二分网络,将用户节点集合记为u(t),商品节点集合记为o(t),用户与商品之间的二元关系记为l(t),二元关系表示在用户节点与商品节点间存在的边。

优选的,本发明实施例中的二分网络中的一条边表示:用户γ对商品i进行过评分并生成一条记录lγi,其中,lγi∈l。

第一确定模块1002,用于根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度;

进一步的,请参阅图11,为本发明第三实施例中的第一确定模块1002的细化功能模块的示意图,第一确定模块1002包括:确定单元1101、差值单元1102。具体的:

确定单元1101,用于利用获取到的所述二分网络确定所述商品i在所述t时刻的真实流行度及所述t+1时刻的真实流行度;

在本发明实施例中,确定单元1101从二分网络中获取t时刻商品i与每一个用户之间的边的数量,该数量即为商品i在t时刻的真实流行度。确定单元1101从二分网络中获取t+1时刻商品i与每一个用户之间的边的数量,该数量即为商品i在t+1时刻的真实流行度。

差值单元1102,用于将所述商品i在所述t+1时刻的真实流行度与所述商品i在所述t时刻的真实流行度的差值作为所述商品i从所述t时刻到所述t+1时刻的真实增长流行度。

在本发明实施例中,商品i在t+1时刻的真实流行度减去商品i在t时刻的真实流行度的结果就是商品i从t时刻到t+1时刻的真实增长流行度。例如,根据图3所示的二分网络示意图,可以知道商品α在t=2的时候的流行度等于3(商品α在t=1的时候的边的数量加上商品α在t=2的时候的边的数量,即2+1),商品α在t=3的时候的流行度等于4(商品α在t=1的时候的边的数量加上商品α在t=2的时候的边的数量加上商品α在t=3的时候的边的数量,即2+1+1),差值单元1102将商品α在t=3时刻的真实流行度与商品α在t=2时刻的真实流行度的差值(4-3=1)作为商品α从t=2时刻到t=3时刻的真实增长流行度。

在本发明实施例中,根据用户的历史行为记录构建用户-商品的二分网络,确定单元1101根据二分网络确定商品i在t时刻的真实流行度及t+1时刻的真实流行度,之后差值单元1102将商品i在t+1时刻的真实流行度与商品i在t时刻的真实流行度的差值作为商品i从t时刻到t+1时刻的真实增长流行度。并利用预设依附偏好机制及二分网络确定商品i的预期增长流行度,通过真实增长流行度及预期增长流行度可以得到关联比,基于该关联比可以对商品流行度的预测结果进行分析,从而提高视频推荐的准确性。

第二确定模块1003,用于利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度;

在本发明实施例中,按照如下预设依附偏好机制计算商品i从t时刻到t+1时刻的预期增长流行度。

预设依附偏好机制具体为:

其中,i表示一个或一类商品,δl(t+1)表示所有商品从t时刻到t+1时刻的真实增长流行度总和,ki(t)表示商品i在t时刻的流行度,l(t)表示所有商品在t时刻的真实流行度总和。

第三确定模块1004,用于基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。

在本发明实施例中,第三确定模块1004将商品i的真实增长流行度与商品i的预期增长流行度的商作为关联比,且商为:

其中,r表示关联比,i表示一个或一类商品,δki(t+1)表示商品i从t时刻到t+1时刻的预期增长流行度,l(t)表示所有商品在t时刻的真实流行度总和,δl(t+1)表示所有商品从t时刻到t+1时刻真实增长流行度总和,ki(t)表示商品i在t时刻的流行度。

在本发明实施例中,构建模块1001根据用户的历史行为记录构建用户-商品的二分网络,第一确定模块1002利用获取到的该二分网络确定商品的真实增长流行度,第二确定模块1003利用预设依附偏好机制及二分网络确定商品i的预期增长流行度,第三确定模块1004通过真实增长流行度及预期增长流行度可以得到关联比,基于该关联比可以对商品流行度的预测结果进行分析,从而提高视频推荐的准确性。

请参阅图12,图12为本发明第四实施例提供的一种商品流行度的演化分析装置的功能模块示意图,包括:构建模块1201、第四确定模块1202、第一确定模块1203、第二确定模块1204、第三确定模块1205。

其中,本发明实施例中的构建模块1201、第一确定模块1203、第二确定模块1204、第三确定模块1205分别与第三实施例中的构建模块1001、第一确定模块1002、第二确定模块1003、第三确定模块1004描述的内容一致,此处不再赘述。具体的:

构建模块1201,用于根据用户的历史行为记录构建用户-商品的二分网络;

第四确定模块1202,用于利用获取到的所述二分网络的容量大小确定所述t时刻与所述t+1时刻之间的时间间隔。

在本发明实施例中,第四确定模块1202获取二分网络中所有商品与所有用户之间的二元关系,并利用该二元关系的容量大小确定t时刻与t+1时刻之间的时间间隔。

例如,第四确定模块1202获取的二分网络中所有商品与所有用户之间的二元关系的起始时间为2000年,结束时间为2005年,可以根据2000年-2005年间所有商品与所有用户的二元关系的容量大小将t时刻与t+1时刻之间的时间间隔设置为6个月,从而将2000年-2005年分为10等分。

第一确定模块1203,用于根据所述二分网络确定商品i从t时刻到t+1时刻的真实增长流行度;

第二确定模块1204,用于利用预设依附偏好机制及所述二分网络确定所述商品i从所述t时刻到所述t+1时刻的预期增长流行度;

第三确定模块1205,用于基于所述商品i的真实增长流行度及所述商品i的预期增长流行度确定关联比,以使基于所述关联比实现对所述商品i的演化分析。

在本发明实施例中,构建模块1201根据用户的历史行为记录构建用户-商品的二分网络,第二确定模块1204利用获取到的二分网络的容量大小确定t时刻与t+1时刻之间的时间间隔。其中,利用二分网络的容量大小确定t时刻与t+1时刻之间的时间间隔有利于真实增长流行度与预期增长流行度的计算,使得计算过程更加简便,计算结果更加准确,从而也会提高通过真实增长流行度及预期增长流行度得到的关联比,提高视频推荐的准确性。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上为对本发明所提供的一种商品流行度的演化分析方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1