一种多媒体文件推荐方法和终端的制作方法_3

文档序号:9810659阅读:来源:国知局
3均是大于或等于1的整数;若某个历史视频的标签列表中包含某 个特定标签,则将表示该历史视频与该特定标签之间的关联程度的数值标记为1,反之则标 记为0。那么,每个历史视频与每个特定标签之间的关联程度可以如表1所示。
[0072] 表 1
[0073]
[0074] 其中,表1中的列标题(历史视频1···历史视频N)表示用户的历史视频集中的历史 视频的标识,行标题(导演1......演员1......视频类型n3)表示特定标签的标识。
[0075] 步骤2、根据公式fi = [sumi,sum2,···,sumi,···,sumi],得到表示该用户与该各特定 标签之间的关联程度的向量fi,其中,sunu是表示每个历史视频与第i个特定标签之间的关 联程度的数值之和,I是特定标签的总数目,1 < i < I,i、I均为整数。
[0076]由于向量心中的元素的值可能大于1,而后续步骤4中得到的向量f2中的元素的值 在〇~1之间,因此具体实现时,为了与f2结合,可以对5进行归一化处理,从而得到标准化后 的f 1,后续将标准化后的f 1标记为f 1'。其中,f 1' = [ a 1,a 2,…,a i,…,a I ],
_min(fi)是向量fi中的各元素的最小值,max(fi)是向量fi中的各元 素的最大值。该过程的示意图可以参考图3。
[0077]基于表1的示例,sunu即为表1中的第i个特定标签所在的列中表示关联程度的各 数值之和,因此,基于表1的示例,所得到的表示该用户与该各特定标签之间的关联程度的 向 : f 1 - [ SUIIll,· · ·,SUIIlnl,SUninl+l,· · ·,SUIIlnl+n2,SUIIlnl+n2+l · · ·,SUIIlnl+n2+n3 ]。又寸()3 处理,得到 f /,其中,f / = [ai,a2, ···,anl+n2+n3] 〇
[0078] 步骤3:终端获取用户的历史视频集中的每个历史视频在与每个特定主题之间的 关联关系。
[0079] 具体的:终端可以首先获取视频信息库中的所有视频在各特定主题上的概率分 布,然后再从中提取出该用户的历史视频集中的每个历史视频在与每个特定主题之间的关 联关系。其中,终端获取视频信息库中的所有视频在各特定主题上的概率分布的过程可以 包括以下步骤31-33:
[0080] 步骤31、从视频信息库提取所有视频(包含目标视频的每个相关视频和用户的每 个历史视频)的简介。
[0081] 步骤32:对该所有视频的简介进行分词,得到语料库。
[0082] 其中,终端可以使用分词工具进行分词,本发明实施例对该分词工具的具体实现 方式不进行限定,例如可以是现有技术中的任一种分词工具。
[0083] 步骤33:基于该语料库以及指定的特定主题的数目,训练LDA主题模型,得到视频 信息库中的每个视频分别在各特定主题上的概率分布。
[0084] 步骤31-33的过程的示意图可参见图4。
[0085]具体实现时,该方法还可以包括:存储视频信息库中的每个视频分别在各特定主 题上的概率分布。这样,当需要使用任一个视频在各特定主题上的概率分布时,可以直接从 所存储的信息中读取。
[0086]假设视频信息库中有Μ个视频,Μ是大于1的整数,指定的特定主题的数目为20,那 么每个视频在20个特定主题上的概率分布可以如表2所示。
[0087]表 2
[0089]其中,表2中的列标题(视频1……视频Μ)表示视频信息库中的视频的标识,行标题 (主题1……主题20)表示特定主题的标识。
[0090] 步骤4:根据公式f2 = [meani,mean2,…,meanj,…,mean:],得到表示该用户与各特 定主题之间的关联程度的向量f 2,其中,mean」是各历史视频在第j个特定主题上的概率分布 值的均值,J是特定主题的总数目,1 < j <J,j、J均为整数。该过程的示意图可以参考图4。
[0091] 从表2中提取用户的历史视频集中的各历史视频在各特定主题上的概率分布,如 图3所示。其中假设历史视频集中的历史视频的数目为T。
[0092] 表 3
[0094]这样,mean」即为提取出的各历史视频中的第i个特定主题所在的列中表示关联程 度的各数值的均值。因此,基于表3的示例,所得到的表示该用户在各特定主题上的概率分 布的向量为:f2 = [meam,mean2,…,mean20] 〇
[0095] 综上,可以得到:用户的特征向量为f = [f/,f2]。基于表1、3的示例,f = [f/,f2] =[ai,a2,· · ·,ani+n2+n3,meam,mean〗,· · ·,mean20 ] 〇
[0096] 终端获取相关视频的特征信息的过程
[0097] 相关视频的特征信息包括相关视频与每个特定标签之间的关联程度,和相关视频 在每个特定主题上的概率分布。其中,终端可以按照上述步骤1所示的方法,获取每个相关 视频与每个特定标签之间的关联程度。另外,终端在执行上述步骤3的过程中,即可获取到 每个相关视频在每个特定主题上的概率分布,具体的,可以从上述表2中提取到每个相关视 频在每个特定主题上的概率分布。
[0098] 下面说明终端获取相关视频集的过程,具体可包括以下步骤a-b:
[0099] 步骤a:生成视频信息库中所有视频的标签列表,一个视频的标签列表包括该视频 的演员、导演、视频类型。
[0100]步骤b:以获取视频A的相关视频集为例:分别将视频信息库中的每个视频的标签 列表与视频A的标签列表进行匹配,将其标签包含在视频A的标签列表中的视频均作为视频 A的相关视频。例如,如视频《智取威虎山》的标签列表为:["动作"、"战争"、"冒险"、"历 史〃、〃徐克〃、〃梁家辉〃,〃林更新〃、〃张涵予〃、〃余男〃、〃佟丽娅〃、〃韩庚〃、〃陈晓〃],视频《集 结号》的标签列表为:[〃动作〃、〃枪战〃、〃战争〃、〃冯小刚〃、〃廖凡〃、〃张涵予〃、〃邓超〃、〃王宝 强〃、〃袁文康〃];"智取威虎山"和"集结号"分别匹配上了"动作"、"战争"和"张涵予"这三个 标签,则将《集结号》加入到《智取威虎山》的相关视频集中。按照上述方法,遍历完视频信息 库中所有视频,会生成视频信息库中的每个视频的相关视频集。
[0101] 下面说明本发明实施例提供的对应于上述方法实施例的装置实施例。
[0102] 参见图5,为本发明实施例提供的一种终端的结构示意图。图5所示的终端5用以执 行上文提供的多媒体文件推荐方法,本实施例中相关内容的解释可以参考上文。终端5可以 包括:确定单元51、获取单元52、选择单元53和推荐单元54。
[0103] 确定单元51,用于确定用户的特征信息和目标多媒体文件的相关多媒体文件集中 的每个相关多媒体文件的特征信息。
[0104] 获取单元52,用于根据该用户的特征信息和该每个相关多媒体文件的特征信息, 获取该用户对该每个相关多媒体文件的偏好值。
[0105] 选择单元53,用于根据该用户对该每个相关多媒体文件的偏好值,从相关多媒体 文件集中选择出目标多媒体文件的关于该用户的相关多媒体文件。
[0106] 推荐单元54,用于向该用户推荐目标多媒体文件的关于该用户的相关多媒体文 件。
[0107] 可选的,获取单元52具体用于:获取用户的历史多媒体文件集中的每个历史多媒 体文件的特征信息;其中,历史多媒体文件包括该用户已观看的多媒体文件,和/或该用户 收藏的多媒体文件;根据每个历史多媒体文件的特征信息,获取用户的特征信息。
[0108] 可选的,多媒体文件的特征信息包括多媒体文件与各特定标签之间的关联程度, 该用户的特征信息包括该用户与各特定标签之间的关联程度;其中,特定标签是指推荐过 程中使用的多媒体文件标签;和/或,多媒体文件的特征信息包括多媒体文件与各特定主题 之间的关联程度,该用户的特征信息包括该用户与各特定主题之间的关联程度;其中,特定 主题是指在推荐的过程中使用的多媒体文件主题。
[0109] 可选的,获取单元52具体用于:
[0110] 当多媒体文件的特征信息包括多媒体文件与各特定标签之间的关联程度时,根据 公式f 1 = [ sumi,SUII12,…,sumi,…,sumi ],得到表示该用户与各特定标签之间的关联程度的 向量,sunn是表示每个历史多媒体文件与第i个特定标签之间的关联程度的数值之和,I表 示特定标签的总数目,1 < i < I,i、I均为整数;和/或,
[0111]当多媒体文件的特征信息包括多媒体文件与各特定主题之间的关联程度时,根据 公式f2= [meani,mean2,…,meanj,…,meanj],得到表示该用户与各特定主题之间的关联程 度的向量f2,其中,mean」是各历史多媒体文件在
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1