一种视频对挖掘方法及装置与流程

文档序号:12470358阅读:301来源:国知局
一种视频对挖掘方法及装置与流程

本申请涉及计算机技术领域,尤其涉及一种视频对挖掘方法及装置。



背景技术:

随着网络技术的不断发展,用户能够通过网络获取到的也越来越多,如,通过网络获取视频。

目前,为了能够更好的为用户提供服务,在为用户提供用户当前向服务器请求的视频(也即,用户当前想要观看的视频)时,服务器中的视频推荐系统还会为用户推荐与用户当前向服务器请求的视频相关的视频,后续,用户在观看当前向服务器请求的视频的同时,如果在推荐的视频中有用户所需的视频,用户也会点击该视频,在本申请中,将用户当前向服务器发送请求而获取用户所要观看的视频定义为请求视频,将根据请求视频为用户推荐的视频中被用户观看的视频为点击视频,并将一个请求视频与一个点击视频共同组成视频对。

进一步的,为了更好的为用户推荐点击视频,因此,通常都会基于一些训练特征(如,针对历史上出现的视频对,根据视频对中的请求视频为用户推荐该视频对中的点击视频被用户观看的次数与该视频对中的请求视频对请求的次数的比值、用户信息等)训练出相应的视频点击概率预测模型,后续,在给出用户当前的请求视频后,视频推荐系统根据该视频点击概率预测模型,预测待推荐的视频的点击概率,将所有的待推荐的视频的点击概率由高到低进行排序,并将点击概率大于预设的阈值的待推荐的视频推荐给用户。

但是,在整个模型训练以及预测视频的点击概率的过程中,所使用针对历史上出现的视频对,根据视频对中的请求视频为用户推荐该视频对中的点击视频被用户观看的次数与该视频对中的请求视频对请求的次数的比值(在本申请中,该比值可以定义为点击视频的点击率)这一特征时,包含的视频对都是历史上出现过的视频对,而在实际应用中,在给定某个请求视频的情况下,有可能存在从来没有推荐给用户的视频,但没有推荐给用户的视频却与包含该请求视频的视频对中的点击视频存在视频对的关系的情况,也就是说,该请求视频与没有推荐给用户的视频是存在一定关联的,也可以说,是存在请求点击关系的,可以是视频对的关系,如,视频对1中包含请求视频A以及点击视频B,视频对2中包含请求视频B以及点击视频C,其中,点击视频B与请求视频B是同一个视频,可以从中看出,请求视频A与点击视频C是存在一定的请求点击关系的,也就是说,当用户在观看请求视频A的同时,如果服务器向该用户推荐视频C的话,用户有可能会去点击视频C。

为了更好的训练更优的模型,并进行更准确的预测待推荐的视频的点击概率,可挖掘这些潜在的视频对的关系,以此来增加在给定历史上出现的视频对中的请求视频的情况下,该视频对中的点击视频被点击的次数与该视频对中请求视频被请求的次数的比值这一训练特征中包含的数据内容,而现在技术中,对于挖掘这些潜在的视频对,还有相应的手段来实现,因此,挖掘潜在的视频对成为了一个亟待解决的问题。



技术实现要素:

本申请实施例提供一种视频对挖掘方法及装置,用以解决现有技术中还没有相应的手段来实现挖掘潜在的视频对,也就是,挖掘具有间接请求点击关系的视频对的问题。

本申请实施例提供的一种视频对挖掘方法,所述方法包括:

获取各视频对样本数据,其中,所述视频对样本数据中包含有请求视频的视频标识、点击视频的视频标识以及用户观看请求视频的情况下点击视频的点击率;

根据所述请求视频的视频标识、所述点击视频的视频标识以及所述点击视频的点击率,确定概率矩阵;

计算所述概率矩阵对应的N步转移矩阵,其中,所述N为大于1的整数;

根据计算出的N步转移矩阵以及获取的各视频对样本数据,挖掘视频对,

其中,视频对由请求视频和点击视频组成,点击视频是根据请求视频为用户推荐的视频中被用户观看的视频。

本申请实施例提供的一种视频对挖掘装置,所述装置包括:

获取模块,用于获取各视频对样本数据,其中,所述视频对样本数据中包含有请求视频的视频标识、点击视频的视频标识以及用户观看请求视频的情况下点击视频的点击率;

确定模块,用于根据所述请求视频的视频标识、所述点击视频的视频标识以及所述点击视频的点击率,确定概率矩阵;

计算模块,用于计算所述概率矩阵对应的N步转移矩阵,其中,所述N为大于1的整数;

挖掘模块,用于根据计算出的N步转移矩阵以及获取的各视频对样本数据,挖掘视频对,其中,视频对由请求视频和点击视频组成,点击视频是根据请求视频为用户推荐的视频中被用户观看的视频。

本申请实施例提供一种视频对挖掘方法及装置,该方法获取包含有请求视频的视频标识、点击视频的视频标识以及用户观看请求视频的情况下点击视频的点击率各视频对样本数据,根据该请求视频的视频标识、该点击视频的视频标识以及该点击视频的点击率,确定概率矩阵,并计算该概率矩阵对应的N步转移矩阵,根据计算出的N步转移矩阵以及获取的各视频对样本数据,挖掘视频对。通过上述方法,可以有效的挖掘潜在的视频对,也就是说,有效的挖掘具有间接请求点击关系的视频对,进而丰富视频推荐系统中视频对的数量,也可提高视频推荐系统推荐的准确性。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请实施例提供的视频对挖掘过程示意图;

图2为本申请实施例提供的概率矩阵结果示意图;

图3为本申请实施例提供的视频对挖掘装置结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施例提供的视频对挖掘过程,具体包括以下步骤:

S101:获取各视频对样本数据。

在本申请中,为了能够挖掘潜在的视频对,首先需要获取各视频对样本数据。

在此需要说明的是,所获取的各视频对样本数据是历史上已经出现过的视频对数据,也就是说,该历史上出现的视频对是由用户当前向服务器发送请求而获取用户所要观看的视频定(即,请求视频)以及根据请求视频为用户推荐的视频中被用户观看的视频(即,点击视频)组成的,一个视频对中只包含有一个请求视频以及一个点击视频。

而视频对数据是由请求视频的视频标识、点击视频的视频标识以及用户观看请求视频的情况下点击视频的点击率组成的,其中,所述点击视频的点击率是针对某一视频对,根据视频对中的请求视频为用户推荐该视频对中的点击视频被用户观看的次数与该视频对中的请求视频对请求的次数的比值。

S102:根据所述请求视频的视频标识、所述点击视频的视频标识以及所述点击视频的点击率,确定概率矩阵。

由于本申请主要通过转移矩阵来确定需要挖掘的视频对,而要想得到转移矩阵,首先需要建立概率矩阵,因此,在本申请中,当获取到各视频对样本数据后,可根据各视频对样本数据,建立概率矩阵。

进一步的,本申请提供了一种建立概率矩阵的方式,具体的是根据各视频对样本数据,建立概率矩阵,具体的,将各请求视频对应的视频标识作为概率矩阵的行,将各点击视频对应的视频标识作为概率矩阵的列,将各视频对样本数据中的点击视频的点击率作为概率矩阵的元素值确定概率矩阵,如,假设存在三个视频对数据,分别是包含有1(1为该请求视频的标识)和9(9为点击视频的标识)以及点击视频的点击率0.2的视频对A、包含有3(3为该请求视频的标识)和10(10为点击视频的标识)以及点击视频的点击率0.5的视频对B、包含有5(5为该请求视频的标识)和6(6为点击视频的标识)以及点击视频的点击率0.7的视频对C,因此,将各请求视频对应的视频标识作为概率矩阵的行,将各点击视频对应的视频标识作为概率矩阵的列,将各视频对样本数据中的点击视频的点击率作为概率矩阵的元素值确定概率矩阵具体如图2所示。

在此需要说明的是,概率矩阵中如果有的元素位置没有视频对,可直接填0。

通常情况下,由于请求视频的标识以及点击视频的标识有可能是达到上万甚至上亿,但是实际上,针对某一请求视频,与该请求视频有联系的点击视频所形成的视频对可能只有几十或几百,这样根据上述给出的建立概率矩阵的方式,会造成整个矩阵的行的数量以及列的数量会达到上万甚至上亿,后续会造成计算机计算上的运算量和压力,因此,在本申请中,可以从各视频对样本数据中提取不重复的请求视频的视频标识以及点击视频的视频标识(也就是说,提取出的请求视频的视频标识以及点击视频的视频标识是两两不重复的),对提取出的各请求视频对应的视频标识以及点击视频对应的视频标识进行编号,并生成请求视频对应的视频标识与编号的对应关系以及点击视频对应的视频标识与编号的对应关系,根据编号后的各请求视频对应的视频标识对应的编号、点击视频对应的视频标识对应的编号以及点击视频的点击率,确定概率矩阵,这样可以有效的降低概率矩阵的行和列的数量,后续降低计算机在处理概率矩阵的计算量和压力,如,假设上述例子中,分别从三个视频对(即,各视频对样本数据)中提取不重复的请求视频的视频标识以及点击视频的视频标识,即,1(1为该请求视频的标识)、9(9为点击视频的标识)、3(3为该请求视频的标识)、10(10为点击视频的标识)、5(5为该请求视频的标识)以及6(6为点击视频的标识),并对提取出的各请求视频对应的视频标识以及点击视频对应的视频标识进行编号,即,1(请求视频的标识1对应的编号)、2(点击视频的标识9对应的编号)、3(请求视频的标识3对应的编号)、4(点击视频的标识10对应的编号)、5(请求视频的标识5对应的编号)、6(点击视频的标识6对应的编号)。

在此需要说明的是,在对请求视频的标识以及点击视频的标识进行编号的过程中,可以进行连续编号,如,2、3、4、5,也可以进行不连续编号,如,2、4、6、8,但是这样的编号方式都不是概率矩阵的行和列的数量是最少的,而最优的编号方式则是,从1开始对所有的请求视频的视频标识以及点击视频的视频标识进行连续编号,这样建立完成的概率矩阵的行和列的数量是最少,需要注意的是,虽然理论上是从1开始编号,但是在计算机运行处理中,编号需要从0开始编号,其实0代表概率矩阵中的第一行或第一列,相当于理论中的数字1,这样可有效的降低计算机后续的计算量和压力。

进一步的,在根据编号后的各请求视频对应的视频标识对应的编号、点击视频对应的视频标识对应的编号以及点击视频的点击率,确定概率矩阵的过程中,本申请给出了一种实施方式,具体的,将各请求视频对应的视频标识对应的编号作为概率矩阵的行,将各点击视频对应的视频标识对应的编号作为概率矩阵的列,将各视频对样本数据中的点击视频的点击率作为概率矩阵的元素值确定概率矩阵。

S103:计算所述概率矩阵对应的N步转移矩阵。

在建立完成概率矩阵后,需要计算该概率矩阵对应的N步转移矩阵,其中,N是大于1的整数。

但是,根据步骤S102中所建立起来的概率矩阵通常是有效的行数和有效的列数不一致(在此需要说明的是,非零元素中所处的最大行数即为有效的行数,非零元素中所处的最大列数即为有效的列数),因此,当概率矩阵的有效行数与有效列数不一致时是无法直接进行N步转移矩阵的计算,基于此,本申请在计算概率矩阵对应的N步转移矩阵之前,需要对概率矩阵进行扩充行或列的数量,如果行的数量大于列的数量,则需要增加列的数量,使得列的总数量等于行的总数量,如果列的数量大于行的数量,则需要增加行的数量,使得行的总数量等于列的总数量,所增加的行中的元素或者增加的列中的元素均填0即可,但是在实际计算机存储时,为了减少额外的存储开销,概率矩阵中所有为0的元素实际是不存储的,只存储那些非零元素。

另外,在此需要说明的是,本申请中N的设定可根据实际情况来设定,通常情况下,是如果想挖掘一层间接请求点击关系就将N设定为2即可,如,请求视频A与点击视频B是视频对,而请求视频B与点击视频C时视频对,其中,请求视频B与点击视频B是同一视频,这样,请求视频A与点击视频C只有一层间接请求点击关系,如果想挖掘N层间接请求点击关系,就将N设定为N+1即可。

另外,由于将N个概率矩阵进行连乘,需要进行N-1次相乘的运算,因此,为了降低相乘的运算次数,可以将N个所述概率矩阵进行分组,其中,分组后的各组中,至少有两个组包含概率矩阵的数量相同,去除包含概率矩阵的数量重复的各组,并针对任一剩余的组,将该组内包含的所有概率矩阵进行相乘,将分组后的所有组对应的相乘后得到的矩阵进行相乘,将分组后的所有组进行相乘后得到的矩阵作为所述概率矩阵对应的N步转移矩阵。如,假设需要计算7步转移矩阵,且M代表概率矩阵,因此,可以将7个概率矩阵分为四组,也就是,第一组包含两个概率矩阵,第二组包含两个概率矩阵,第三组包含两个概率矩阵,第四组包含一个概率矩阵,去除包含概率矩阵的数量重复的各组,即,第一组或第二组或第三组中的任意两组,这是因为其中有三个组中的概率矩阵的数量是相同的重复的,因此,只需要将其中任意一组中包含的概率矩阵进行相乘即可,直接将相乘后得到的矩阵作为其他两组的矩阵,不用重复将其他两个组中包含的概率矩阵进行相乘,再第四组中的包含的所有概率矩阵进行相乘,最后直接将分组后的所有组对应的相乘后得到的矩阵进行相乘,也即,将第一组对应的相乘后得到的矩阵乘以第二组对应的相乘后得到的矩阵乘以第三组对应的相乘后得到的矩阵乘以第四组对应的相乘后得到的矩阵,将分组后的所有组进行相乘后得到的矩阵作为所述概率矩阵对应的7步转移矩阵,这样只需要做四次运算就可得到7步转移矩阵,降低了运算次数。

另外,本申请中还给出一段计算机在计算一次概率矩阵相乘的计算机代码,具体如下:

//读取数据

valcoorMatrix=MTUtils.loadCoordinateMatrix(sc.args(0))

//转换格式CoordinateMatrix→DenseVecMatrix

valdenseVecMatrix=coorMatrixTODenseVecMatrix(coorMatrix,row,cols)

//转换格式CoordinateMatrix→SparseVecMatrix

valsparseVecMatrix=denseVecMatrixtoSparseVecMatrix

valleftMatrix=SparseVecMatrix

valrightMatrix=leftMatrix

//矩阵相乘

valmultiplyResult=leftMatrix.multiplySparse(rightMatrix)

在上述计算机代码中,coorMatrixTODenseVecMatrix是自定义重新实现的函数,主要强制指定变换矩阵的行列数,避免实际数据中边界位置有效数据不存在导致原变换方式所得矩阵行列小于期望值,导致后续相乘时矩阵维度不一致,对应操作如下:

S104:根据计算出的N步转移矩阵以及获取的各视频对样本数据,挖掘视频对。

在得到N步转移矩阵后,需要根据N步转移矩阵进行还原,也就是,根据N步转移矩阵,建立视频对数据。

进一步的,在根据N步转移矩阵,建立视频对数据的过程中,如果在执行步骤S102确定概率矩阵时采用的是将各所述请求视频对应的视频标识作为概率矩阵的行,将各所述点击视频对应的视频标识作为概率矩阵的列,将各视频对样本数据中的所述点击视频的点击率作为概率矩阵的元素值确定概率矩阵,那么根据N步转移矩阵,建立视频对数据的过程如下所示:针对所述N步转移矩阵中不为0的每个元素,根据确定的各请求视频对应的视频标识对应的矩阵概率的行,确定该元素对应的请求视频对应的视频标识,根据确定的各点击视频对应的视频标识对应的列,确定该元素对应的点击视频对应的视频标识,并将该元素值作为该元素对应的点击视频的点击率,根据确定出的所述请求视频对应的视频标识、所述点击视频对应的视频标识以及所述点击视频的点击率,建立视频对数据,根据建立的视频对数据以及获取的各视频对样本数据,挖掘视频对。

如果在执行步骤S102确定概率矩阵时采用的是将各请求视频对应的视频标识对应的编号作为概率矩阵的行,将各点击视频对应的视频标识对应的编号作为概率矩阵的列,将各视频对样本数据中的点击视频的点击率作为概率矩阵的元素值确定概率矩阵,那么根据N步转移矩阵,建立视频对数据的过程如下所示:针对所述N步转移矩阵中不为0的每个元素,根据该元素对应的行号,确定该元素对应的请求视频的编号,根据该元素对应的列号,确定该元素对应的点击视频的编号,并根据该元素的数值,确定该元素对应的点击视频的点击率,根据生成的请求视频对应的视频标识与编号的对应关系,确定所述请求视频的编号对应的请求视频的视频标识,根据生成的点击视频对应的视频标识与编号的对应关系,确定所述点击视频的编号对应的点击视频的视频标识,根据确定出的所述请求视频的视频标识、所述点击视频的视频标识以及所述点击视频的点击率,建立视频对数据,根据建立的视频对数据以及获取的各视频对样本数据,挖掘视频对。

进一步的,当根据N步转移矩阵,建立视频对数据后,需要根据建立的视频对数据以及获取的各视频对样本数据,挖掘视频对,具体的,将建立的视频对数据与获取的各视频对样本数据进行匹配,在建立各视频对数据中,确定与获取的各视频对样本数据不一致的视频对数据。

而本申请在确定与获取的各视频对样本数据不一致的视频对数据时,主要有两种情况,第一种情况是建立的视频对数据中的点击视频的点击率与获取的各视频对样本数据中的点击视频的点击率不同的视频对数据,因此,在确定与获取的各视频对样本数据不一致的视频对数据时,可确定建立的视频对数据中的点击视频的点击率与获取的各视频对样本数据中的点击视频的点击率不同的视频对数据,后续,可根据确定的视频对数据中的请求视频的视频标识以及点击视频的视频标识,在包含各视频对样本数据的视频推荐系统中查找到该确定的视频对数据对应的视频对样本数据,将该确定的视频对数据替换掉该确定的视频对数据对应的视频对样本数据。

在此需要说明的是,将该确定的视频对数据替换掉该确定的视频对数据对应的视频对样本数据的过程中,可以将视频对数据中的请求视频的视频标识、点击视频的视频标识以及点击视频的点击率均替换掉该确定的视频对数据对应的视频对样本数据中的请求视频的视频标识、点击视频的视频标识以及点击视频的点击率,也可以将视频对数据中的点击视频的点击率替换掉该确定的视频对数据对应的视频对样本数据中的点击视频的点击率。

第二种情况是确定建立的视频对数据中的请求视频的视频标识以及点击视频的视频标识有至少一个与获取的各视频对样本数据中的请求视频的视频标识以及点击视频的视频标识不同的视频对数据,因此,在确定与获取的各视频对样本数据不一致的视频对数据时,确定建立的视频对数据中的请求视频的视频标识以及点击视频的视频标识有至少一个与获取的各视频对样本数据中的请求视频的视频标识以及点击视频的视频标识不同的视频对数据,后续,可添加该确定的视频对数据到视频推荐系统中。

通过上述方法,可以有效的挖掘潜在的视频对,也就是说,有效的挖掘具有间接请求点击关系的视频对,进而丰富视频推荐系统中视频对的数量,也可提高视频推荐系统推荐的准确性。

另外,在实际应用中,视频推荐系统中的视频对的数量进行丰富和扩展后,不仅仅只可用于提高视频推荐系统的准确性,也可以在用户观看请求视频时,增加用户推荐视频的数量,因为,在对视频对进行挖掘后,可能某一请求视频对应的点击视频会增多,如,用户在观看某一请求视频时,假设网站会推荐给该用户十个与请求视频有关系的点击视频,但是在挖掘视频对之前,视频推荐系统里只有五个点击视频与该请求视频有关系,因此,视频推荐系统会将这五个点击视频推荐给用户的同时,还会再找五个与该请求视频无关系的视频推荐给用户,在挖掘视频对之后,与该请求视频有关系的点击视频就有可能超过十个,这样视频推荐系统可以将十个与该请求视频有关系的点击视频推荐给用户,从而避免了因视频推荐系统使用的预测模型而得到的推荐的视频的数量不够的情况。

以上为本申请实施例提供的视频对挖掘方法,基于同样的思路,本申请实施例还提供一种视频对挖掘装置,如图3所示。

图3为本申请实施例提供的视频对挖掘装置结构示意图,所述装置包括:

获取模块201,用于获取各视频对样本数据,其中,所述视频对样本数据中包含有请求视频的视频标识、点击视频的视频标识以及用户观看请求视频的情况下点击视频的点击率;

确定模块202,用于根据所述请求视频的视频标识、所述点击视频的视频标识以及所述点击视频的点击率,确定概率矩阵;

计算模块203,用于计算所述概率矩阵对应的N步转移矩阵,其中,所述N为大于1的整数;

挖掘模块204,用于根据计算出的N步转移矩阵以及获取的各视频对样本数据,挖掘视频对,其中,视频对由请求视频和点击视频组成,点击视频是根据请求视频为用户推荐的视频中被用户观看的视频。

所述确定模块202具体用于,将各请求视频对应的视频标识作为概率矩阵的行,将各点击视频对应的视频标识作为概率矩阵的列,将各视频对样本数据中的点击视频的点击率作为概率矩阵的元素值确定概率矩阵。

所述确定模块202具体用于,从各视频对样本数据中提取不重复的请求视频的视频标识,点击视频的视频标识,对提取出的各请求视频对应的视频标识以及点击视频对应的视频标识进行编号,并生成请求视频对应的视频标识与编号的对应关系以及点击视频对应的视频标识与编号的对应关系,根据编号后的各请求视频对应的视频标识对应的编号、点击视频对应的视频标识对应的编号以及点击视频的点击率,确定概率矩阵。

所述确定模块202具体用于,将各请求视频对应的视频标识对应的编号作为概率矩阵的行,将各点击视频对应的视频标识对应的编号作为概率矩阵的列,将各视频对样本数据中的点击视频的点击率作为概率矩阵的元素值确定概率矩阵。

所述计算模块203具体用于,将N个所述概率矩阵进行分组,其中,分组后的各组中,至少有两个组包含概率矩阵的数量相同,去除包含概率矩阵的数量重复的各组,并针对任一剩余的组,将该组内包含的所有概率矩阵进行相乘,将分组后的所有组对应的相乘后得到的矩阵进行相乘,将分组后的所有组进行相乘后得到的矩阵作为所述概率矩阵对应的N步转移矩阵。

所述挖掘模块204具体用于,针对所述N步转移矩阵中不为0的每个元素,根据确定的各请求视频对应的视频标识对应的矩阵概率的行,确定该元素对应的请求视频对应的视频标识,根据确定的各点击视频对应的视频标识对应的列,确定该元素对应的点击视频对应的视频标识,并将该元素值作为该元素对应的点击视频的点击率,根据确定出的所述请求视频对应的视频标识、所述点击视频对应的视频标识以及所述点击视频的点击率,建立视频对数据,根据建立的视频对数据以及获取的各视频对样本数据,挖掘视频对。

所述挖掘模块204具体用于,针对所述N步转移矩阵中不为0的每个元素,根据该元素对应的行号,确定该元素对应的请求视频的编号,根据该元素对应的列号,确定该元素对应的点击视频的编号,并根据该元素的数值,确定该元素对应的点击视频的点击率,根据生成的请求视频对应的视频标识与编号的对应关系,确定所述请求视频的编号对应的请求视频的视频标识,根据生成的点击视频对应的视频标识与编号的对应关系,确定所述点击视频的编号对应的点击视频的视频标识,根据确定出的所述请求视频的视频标识、所述点击视频的视频标识以及所述点击视频的点击率,建立视频对数据,根据建立的视频对数据以及获取的各视频对样本数据,挖掘视频对。

所述挖掘模块204具体用于,将建立的视频对数据与获取的各视频对样本数据进行匹配,在建立各视频对数据中,确定与获取的各视频对样本数据不一致的视频对数据。

所述挖掘模块204具体用于,确定建立的视频对数据中的点击视频的点击率与获取的各视频对样本数据中的点击视频的点击率不同的视频对数据,根据确定的视频对数据中的请求视频的视频标识以及点击视频的视频标识,在包含各视频对样本数据的视频推荐系统中查找到该确定的视频对数据对应的视频对样本数据,将该确定的视频对数据替换掉该确定的视频对数据对应的视频对样本数据。

所述挖掘模块204具体用于,确定建立的视频对数据中的请求视频的视频标识以及点击视频的视频标识有至少一个与获取的各视频对样本数据中的请求视频的视频标识以及点击视频的视频标识不同的视频对数据,添加该确定的视频对数据到视频推荐系统中。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现存储。可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1