视频推荐方法和装置与流程

文档序号:14689804发布日期:2018-06-15 16:47阅读:158来源:国知局

本发明涉及多媒体技术领域,尤其涉及一种视频推荐方法和装置。



背景技术:

目前,在采用网络视频来播放电视剧、电影、综艺等节目时,通常可以在网页中显示其他的推荐内容。具体而言,通常协同过滤算法进行节目视频推荐,这样,需要依赖于海量用户同时观看的节目视频序列进行推荐。

由于协同过滤过于依赖用户行为,导致推荐出的剧集很多是同档期播出的剧集,很多情况下上映时间上的相关性强于内容上的相关性。对于即将上映的剧集,由于没有用户观看行为,协同过滤方法得不到推荐结果。



技术实现要素:

技术问题

有鉴于此,本发明要解决的技术问题是,如何向用户推荐与目标视频的内容关联度高的其他视频。

解决方案

为了解决上述技术问题,根据本发明的一实施例,提供了一种视频推荐方法,包括:

根据待处理视频的人物排序、内容介绍和节目类型的至少一种信息,获取所述待处理视频的内容特征,所述待处理视频包括目标视频和待推荐视频;

分别比较所述目标视频与各所述待推荐视频的内容特征的相似度;

按照比较得到的相似度的顺序,对各所述待推荐视频进行排序,以生成所述目标视频的推荐结果。

对于上述方法,在一种可能的实现方式中,根据待处理视频的人物排序、内容介绍和节目类型的至少一种信息,获取所述待处理视频的内容特征,包括以下至少一个步骤:

根据所述待处理视频的人物排序,确定所述待处理视频的人物向量;

根据所述待处理视频的内容介绍,确定所述待处理视频的内容向量;

根据所述待处理视频的节目类型,确定所述待处理视频的类型向量。

对于上述方法,在一种可能的实现方式中,根据所述待处理视频的人物排序,确定所述待处理视频的人物向量,包括:

确定所述待处理视频的人物维度;

获取所述人物维度中各人物对应的排序;

计算各所述人物的基本权重。

对于上述方法,在一种可能的实现方式中,计算各所述人物的基本权重,包括:

采用式1计算在所述人物维度下的一个人物的基本权重personweight,

其中,rank为在所述人物维度下的一个人物对应的排序。

对于上述方法,在一种可能的实现方式中,根据所述待处理视频的内容介绍,确定所述待处理视频的内容向量,包括:

对所述内容介绍进行分词处理以提取各特征词,并统计各所述特征词在所述内容介绍中所占的词频比,一个特征词在所述内容介绍中所占的词频比是指该特征词的词频与所述内容介绍中的最大词频的比值;

获取各所述特征词的逆向文件频率和搜索热度权重;

根据各所述特征词的词频比、逆向文件频率和搜索热度权重,分别计算各所述特征词的内容向量权重,一个特征词的内容向量权重为该特征词的词频比、逆向文件频率和搜索热度权重的乘积。

对于上述方法,在一种可能的实现方式中,分别比较所述目标视频与各所述待推荐视频的内容特征的相似度,包括:

采用式6计算所述目标视频与所述待推荐视频的相似度Sum_cosine_similarity(VA,VB):

其中,a+b+c=1.0,cosine_similarity(Vpa,Vpb)为所述目标视频A的人物向量Vpa与所述待推荐视频B的人物向量Vpb的余弦相似度,cosine_similarity(Vca,Vcb)为所述目标视频A的内容向量Vca与所述待推荐视频B的内容向量Vcb的余弦相似度,cosine_similarity(Vsa,Vsb)为所述目标视频A的类型向量Vsa与所述待推荐视频B的类型向量Vsb的余弦相似度。

根据本发明的另一实施例,提供了一种视频推荐装置,包括:

内容特征获取模块,用于根据待处理视频的人物排序、内容介绍和节目类型的至少一种信息,获取所述待处理视频的内容特征,所述待处理视频包括目标视频和待推荐视频;

相似度比较模块,与所述内容特征获取模块连接,用于分别比较所述目标视频与各所述待推荐视频的内容特征的相似度;

推荐模块,与所述相似度比较模块连接,用于按照比较得到的相似度的顺序,对各所述待推荐视频进行排序,以生成所述目标视频的推荐结果。

对于上述装置,在一种可能的实现方式中,所述内容特征获取模块包括以下至少一个单元:

人物向量单元,用于根据所述待处理视频的人物排序,确定所述待处理视频的人物向量;

内容向量单元,用于根据所述待处理视频的内容介绍,确定所述待处理视频的内容向量;

类型向量单元,用于根据所述待处理视频的节目类型,确定所述待处理视频的类型向量。

对于上述装置,在一种可能的实现方式中,所述人物向量单元还用于确定所述待处理视频的人物维度;获取所述人物维度中各人物对应的排序;计算各所述人物的基本权重。

对于上述装置,在一种可能的实现方式中,所述人物向量单元还用于采用式1计算在所述人物维度下的一个人物的基本权重personweight,

其中,rank为在所述人物维度下的一个人物对应的排序。

对于上述装置,在一种可能的实现方式中,所述内容向量单元还用于对所述内容介绍进行分词处理以提取各特征词,并统计各所述特征词在所述内容介绍中所占的词频比,一个特征词在所述内容介绍中所占的词频比是指该特征词的词频与所述内容介绍中的最大词频的比值;获取各所述特征词的逆向文件频率和搜索热度权重;根据各所述特征词的词频比、逆向文件频率和搜索热度权重,分别计算各所述特征词的内容向量权重,一个特征词的内容向量权重为该特征词的词频比、逆向文件频率和搜索热度权重的乘积。

对于上述装置,在一种可能的实现方式中,所述相似度比较模块还用于采用式6计算所述目标视频与所述待推荐视频的相似度Sum_cosine_similarity(VA,VB):

其中,a+b+c=1.0,cosine_similarity(Vpa,Vpb)为所述目标视频A的人物向量Vpa与所述待推荐视频B的人物向量Vpb的余弦相似度,cosine_similarity(Vca,Vcb)为所述目标视频A的内容向量Vca与所述待推荐视频B的内容向量Vcb的余弦相似度,cosine_similarity(Vsa,Vsb)为所述目标视频A的类型向量Vsa与所述待推荐视频B的类型向量Vsb的余弦相似度。

有益效果

本发明实施例的视频推荐方法和装置,根据视频的人物排序、内容介绍和节目类型的至少一种信息,获取视频的内容特征,再比较不同视频的内容特征,来生成推荐列表,由于充分考虑了视频的具体内容,得到的推荐列表与目标内容关联度比采用传统的协同算法高,推荐结果更符合目标视频的内容。

根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。

图1示出根据本发明一实施例的视频推荐方法的流程图;

图2示出根据本发明一实施例的视频推荐方法中获取内容特征的流程图;

图3示出根据本发明另一实施例的视频推荐方法的流程图;

图4示出根据本发明一实施例的视频推荐装置的结构示意图;

图5示出根据本发明另一实施例的视频推荐装置的结构示意图。

具体实施方式

以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。

实施例1

图1示出根据本发明一实施例的视频推荐方法的流程图。如图1所示,该视频推荐方法主要包括:

步骤101、根据待处理视频的人物排序、内容介绍和节目类型的至少一种信息,获取所述待处理视频的内容特征,所述待处理视频包括目标视频和待推荐视频。其中,目标视频是指作为后续推荐依据的视频。目标视频的状态可以是当前播放的视频、当前选中待播放的视频等。目标视频和待推荐视频可以是电视剧的剧集,也可以是电影、综艺等具有元信息的视频。其中,视频的元信息中通常记载有该视频的人物关系(例如:演职人员名称、排序等)、内容介绍等。

步骤102、分别比较所述目标视频与各所述待推荐视频的内容特征的相似度。

步骤103、按照比较得到的相似度的顺序,对各所述待推荐视频进行排序,以生成所述目标视频的推荐结果。

在一种可能的实现方式中,如图2所示,步骤101具体包括以下至少一个步骤,并且不限定以下步骤的具体时序:

步骤201、根据所述待处理视频的人物排序,确定所述待处理视频的人物向量。

具体地,可以先确定所述待处理视频的人物维度;再获取所述人物维度中各人物对应的排序;然后计算各所述人物的基本权重。例如:采用式1计算在所述人物维度下的一个人物的基本权重personweight,

其中,rank为在所述人物维度下的一个人物对应的排序。

通常,视频的人物维度可以包括该视频所涉及的演员、角色、导演、嘉宾、主持人等,不同视频节目的人物维度可能不同。本实施例中不具体限定人物维度所包括的内容。人物维度和某一种人物维度下的演员排序,通常可以从视频的元信息中获取。

步骤202、根据所述待处理视频的内容介绍,确定所述待处理视频的内容向量。

具体地,视频的内容介绍可以介绍该视频的剧情,也可以称为剧情介绍、内容简介、主要内容、分集剧情等,本实施例不限定内容介绍的具体形式。视频的内容介绍,通常可以从视频的元信息中获取。

在一种可能的实现方式中,首先对所述内容介绍进行分词处理以提取各特征词,并统计各所述特征词在所述内容介绍中所占的词频比,一个特征词在所述内容介绍中所占的词频比是指该特征词的词频与所述内容介绍中的最大词频的比值。然后,获取各所述特征词的逆向文件频率和搜索热度权重。最后,根据各所述特征词的词频比、逆向文件频率和搜索热度权重,分别计算各所述特征词的内容向量权重,一个特征词的内容向量权重为该特征词的词频比、逆向文件频率和搜索热度权重的乘积。

步骤203、根据所述待处理视频的节目类型,确定所述待处理视频的类型向量。

具体地,视频的节目类型可以包括“喜剧、古装、战争、爱情、城市……”等,视频的内容介绍,通常可以从视频的元信息中获取。

在一种可能的实现方式中,步骤101具体包括:

采用式6计算所述目标视频与所述待推荐视频的相似度Sum_cosine_similarity(VA,VB):

其中,a+b+c=1.0,cosine_similarity(Vpa,Vpb)为所述目标视频A的人物向量Vpa与所述待推荐视频B的人物向量Vpb的余弦相似度,cosine_similarity(Vca,Vcb)为所述目标视频A的内容向量Vca与所述待推荐视频B的内容向量Vcb的余弦相似度,cosine_similarity(Vsa,Vsb)为所述目标视频A的类型向量Vsa与所述待推荐视频B的类型向量Vsb的余弦相似度。

然后,在步骤103中,根据每个待推荐视频与目标视频A的相似度进行排序,从而得到针对该目标视频A的推荐结果,例如:一个包括多个待推荐视频的标识和排列顺序的推荐列表。

本实施例的视频推荐方法,根据视频的人物排序、内容介绍和节目类型的至少一种信息,获取视频的内容特征,再比较不同视频的内容特征,来生成推荐列表,由于充分考虑了视频的具体内容,得到的推荐列表与目标内容关联度比采用传统的协同算法高,推荐结果更符合目标视频的内容。

实施例2

图3示出根据本发明另一实施例的视频推荐方法的流程图。本实施例中的视频节目可以包括电视剧、电影、综艺等。如图3所示,以某一电影为例对该方法进行示例性说明,具体可以包括以下步骤:

步骤301、计算视频的特征向量。

在步骤3011中,计算人物向量。

权重personweight的计算公式例如下式1。

其中,rank为人物在节目某个人物维度(主演、嘉宾、角色、主持人、导演、原著)的排序,这个排序体现了人物的相对重要程度。

例如《大话西游之月光宝盒》主演为“周星驰、莫文蔚、吴孟达”,角色为“至尊宝、白晶晶、二当家”,导演为“刘镇伟”。

则以上人物的级别rank值分别为:rank周星驰=1,rank莫文蔚=2,rank吴孟达=3,rank至尊宝=1,rank白晶晶=2,rank二当家=3,rank刘镇伟=1。

将上述rank值代入式1,则可以得到以上人物的基本权重baseweight值分别为:personweight周星驰=1.0,personweight莫文蔚=0.707,personweight吴孟达=0.577,personweight至尊宝=1.0,personweight白晶晶=0.707,personweight二当家=0.577,personweight刘镇伟=1.0。

从而可以得到这个电影的人物向量Vp为:(周星驰:1.0,莫文蔚:0.707,吴孟达:0.577,至尊宝:1.0,白晶晶:0.707,二当家:0.577,刘镇伟:1.0)。

在步骤3012中,计算内容向量。

首先,对节目的内容简介进行分词,保留动词、名词和复合词组等作为特征词。

例如,将《大话西游之月光宝盒》的内容简介进行分词,提取的特征词结果为:freq孙悟空=3,freq时光倒流=2,freq月光宝盒=4,freq投胎=1。

其中,freq表示某一特征词在该节目的内容简介中出现的词频(次数)。

接着,根据下式2,可以计算各特征词在该内容简介中所占的词频比tf。

tf=freq/freqmax式2,

其中,freq为某特征词在该节目简介中的词频,freqmax为该节目简介中的词频最大的特征词词频,此例中freqmax为4。

接上例,将各特征词的词频和最大词频代入式2,则可以得到各个特征词tf值为:tf孙悟空=0.75,tf时光倒流=0.5,tf月光宝盒=1.0,tf投胎=0.25。

随后,根据下式3,计算各特征值的IDF(InverseDocumentFrequency,逆向文件频率)。

其中,dfsum为例如某一视频网站中所有节目简介的个数,df为包含该特征词的节目简介的个数。假设dfsum=100000;并且,df孙悟空=20,df时光倒流=10,df月光宝盒=2,df投胎=50。则代入式3,可以得到各个特征词的idf值为:idf孙悟空=3.68,idf时光倒流=3.96,idf月光宝盒=4.52,idf投胎=3.29。

然后,根据下式4,计算每个特征词的搜索热度权重searchhot,

其中,searchfreq值为该特征词在某一时间段内如当天视频搜索中被搜索的次数,相应地,searchfreqmax为当天视频搜索中被搜索的次数最多的特征词的搜索次数。

假设,当天“冰桶”被搜索的次数最多,为10000000次,该剧特征词被搜索的次数分别为:searchfreq孙悟空=1000,searchfreq时光倒流=10,searchfreq月光宝盒=1,searchfreq投胎=10,则该剧的特征词搜索热度权重为:searchhot孙悟空=1.375,searchhot时光倒流=1.125,searchhot月光宝盒=1.0,searchhot=1.125。

最后,根据式2、式3、式4的计算结果,根据得到的各特征词的词频比tf、逆向文件频率idf、搜索热度权重searchhot,采用下式5计算得到内容向量Vc的权重contentweight:

contentweight=tf×idf×searchhot式5。

在步骤3013中,计算类型向量。

电影、电视剧、综艺等视频通常都有很多节目类型,如“喜剧、古装、战争、爱情、城市……”。

接上例,假设《大话西游之月光宝盒》的类型为“喜剧、古装”,则类型向量Vs可以表示为(喜剧:1,古装:1,战争:0,爱情:1…)。

步骤302、进行不同视频的向量匹配。

首先,在步骤3021中,对于剧集A(目标视频的示例),在人物向量、内容向量和类型向量上分别与其他剧集进行向量相似度计算。

假设以cosin(余弦)相似度公式(例如下式6)来计算剧集A与剧集B(待推荐视频的示例)的相似度Sum_cosine_similarity(VA,VB):

其中,参数a+b+c=1.0,这里a,b,c的值可以根据频道或节目的需求的不同灵活设置。cosine_similarity(Vpa,Vpb)为剧集A的人物向量Vpa与剧集B的人物向量Vpb的cosin相似度,cosine_similarity(Vca,Vcb)为剧集A的内容向量Vca与剧集B的内容向量Vcb的cosin相似度,cosine_similarity(Vsa,Vsb)为剧集A的类型向量Vsa与剧集B的类型向量Vsb的cosin相似度。

然后,在步骤3022中,根据Sum_cosine_similarity的值,对与剧集A匹配的其他剧集(剧集B、C、D等)按照相似度(参照式6分别计算相似度)计算结果例如按照相似度从大到小进行排序,形成推荐列表。

本实施例的视频推荐方法,根据视频的人物排序、内容介绍和节目类型的至少一种信息,获取视频的内容特征,再比较不同视频的内容特征,来生成推荐列表,由于充分考虑了视频的具体内容,得到的推荐列表与当前播放视频的内容关联度比采用传统的协同算法高,推荐结果更符合当前播放的视频的内容。因此,可以避免传统协同过滤方式产生的同档期节目相互推荐的情况,更加注重人物、内容方面的匹配,从而改善推荐冷启动问题。

实施例3

图4示出根据本发明一实施例的视频推荐装置的结构示意图,如图4所示,该视频推荐装置主要可以包括:

内容特征获取模块41,用于根据待处理视频的人物排序、内容介绍和节目类型的至少一种信息,获取所述待处理视频的内容特征,所述待处理视频包括目标视频和待推荐视频;

相似度比较模块43,与所述内容特征获取模块41连接,用于分别比较所述目标视频与各所述待推荐视频的内容特征的相似度;

推荐模块45,与所述相似度比较模块43连接,用于按照比较得到的相似度的顺序,对各所述待推荐视频进行排序,以生成所述目标视频的推荐结果。

本实施例的视频推荐装置能够执行上述实施例中的视频推荐方法,根据视频的人物排序、内容介绍和节目类型的至少一种信息,获取视频的内容特征,再比较不同视频的内容特征,来生成推荐列表,由于充分考虑了视频的具体内容,得到的推荐列表与目标内容关联度比采用传统的协同算法高,推荐结果更符合目标视频的内容。

实施例4

图5示出根据本发明另一实施例的视频推荐装置的结构示意图,图5中标号与图4相同的组件具有相同的功能,在此不再赘述。

如图5所示,与上一实施例的主要区别在于,该视频推荐装置的内容特征获取模块41包括以下至少一个单元:

人物向量单元411,用于根据所述待处理视频的人物排序,确定所述待处理视频的人物向量;

内容向量单元413,用于根据所述待处理视频的内容介绍,确定所述待处理视频的内容向量;

类型向量单元415,用于根据所述待处理视频的节目类型,确定所述待处理视频的类型向量。

在一种可能的实现方式中,所述人物向量单元还用于确定所述待处理视频的人物维度;获取所述人物维度中各人物对应的排序;计算各所述人物的基本权重。

在一种可能的实现方式中,所述人物向量单元411还用于采用式1计算在所述人物维度下的一个人物的基本权重personweight,

其中,rank为在所述人物维度下的一个人物对应的排序。

在一种可能的实现方式中,所述内容向量单元413还用于对所述内容介绍进行分词处理以提取各特征词,并统计各所述特征词在所述内容介绍中所占的词频比,一个特征词在所述内容介绍中所占的词频比是指该特征词的词频与所述内容介绍中的最大词频的比值;获取各所述特征词的逆向文件频率和搜索热度权重;根据各所述特征词的词频比、逆向文件频率和搜索热度权重,分别计算各所述特征词的内容向量权重,一个特征词的内容向量权重为该特征词的词频比、逆向文件频率和搜索热度权重的乘积。

在一种可能的实现方式中,所述相似度比较模块43还用于采用式6计算所述目标视频与所述待推荐视频的相似度Sum_cosine_similarity(VA,VB):

其中,a+b+c=1.0,cosine_similarity(Vpa,Vpb)为所述目标视频A的人物向量Vpa与所述待推荐视频B的人物向量Vpb的余弦相似度,cosine_similarity(Vca,Vcb)为所述目标视频A的内容向量Vca与所述待推荐视频B的内容向量Vcb的余弦相似度,cosine_similarity(Vsa,Vsb)为所述目标视频A的类型向量Vsa与所述待推荐视频B的类型向量Vsb的余弦相似度。

本实施例中式1和式6的具体含义和推导过程可以参见上述视频推荐方法实施例中的相关描述。本实施例的视频推荐装置,根据视频的人物排序、内容介绍和节目类型的至少一种信息,获取视频的内容特征,再比较不同视频的内容特征,来生成推荐列表,由于充分考虑了视频的具体内容,得到的推荐列表与当前播放视频的内容关联度比采用传统的协同算法高,推荐结果更符合当前播放的视频的内容。因此,可以避免传统协同过滤方式产生的同档期节目相互推荐的情况,更加注重人物、内容方面的匹配,从而改善推荐冷启动问题。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1