一种视频推荐方法及装置的制造方法

文档序号:9751005阅读:652来源:国知局
一种视频推荐方法及装置的制造方法
【技术领域】
[0001 ]本发明涉及推荐技术领域,尤其涉及一种视频推荐方法及装置。
【背景技术】
[0002] 随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时 代,推荐系统应运而生。推荐系统为用户找到其已知范围之外的感兴趣的视频,拓展其观影 体验。
[0003] 已有视频推荐系统中,一种是基于视频标签来计算视频间的相似度,即根据一定 数目固有标签是否匹配来计算视频间的相似度,根据视频间的相似度生成推荐列表为用户 推荐未观看的视频。但是,已有技术中这种基于视频标签计算视频间相似度的方法存在两 个问题:一是,标签存在信息量过载、无序、垃圾标签等问题,这会影响推荐系统的准确度和 个性化程度;二是,对于视频推荐,各个固有标签对于用户的重要程度是有差别的,如果一 律同等对待,会导致推荐准确度不高,影响用户体验。

【发明内容】

[0004] 本发明的实施例提供一种视频推荐方法及装置,能够针对用户需求和兴趣,为其 推荐合适的视频,提高推荐的准确性。
[0005] 为达到上述目的,本发明的实施例采用如下技术方案: 本发明实施例提供一种视频推荐方法,包括以下步骤: 获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别; 根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之 间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别的优先级; 根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
[0006] 本发明实施例还提供了一种视频推荐装置,包括: 获取模块,用于获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属 类别; 权重得分计算模块,用于根据所述视频属性信息及预设的视频标签所属类别权重,计 算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属 类别优先级; 推荐模块,用于根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进 行推荐。
[0007] 本发明实施例所提供的视频推荐方法及装置,根据视频属性信息及预设的视频标 签所属类别权重,来计算目标视频与其他视频之间的权重得分,根据计算的目标视频与其 他视频之间的权重得分,生成视频推荐列表进行推荐。因为对视频标签进行了类别划分,所 以视频标签就不会出现无序、垃圾标签等问题,因为对视频标签所属类别设置了权重,视频 标签所属类别权重反映了视频标签类别的优先级,所以在计算目标视频与其他视频之间权 重得分时,也体现了视频标签所属类别的优先级,视频标签所属类别优先级高的,在权重得 分中也会占用较高的权重,表明和目标视频越类似,在对用户进行视频推荐时,则更倾向于 用户喜欢的视频类型,从而提高了推荐的准确性,用户体验更好。
【附图说明】
[0008] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0009] 图1为本发明实施例提供的一种视频推荐方法的方法流程图; 图2为本发明实施例提供的一种视频推荐装置的结构示意图。
【具体实施方式】
[0010]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0011 ]本发明实施例提供一种视频推荐方法,如图1所示,该方法包括: 101、视频推荐装置获取视频属性信息。
[0012] 本发明实施例中的视频推荐装置可以为管理所有终端设备的服务器,也可以为某 一终端设备,该终端设备可以是智能电视或便携式、袖珍式或手持式的电子设备,例如,智 能手机、平板电脑以及个人数字助理等。
[0013] 本发明实施例中的视频属性信息包括视频标识、视频标签及视频标签所属类别。 其中,上述的视频标识可以为视频的名称或其他可唯一表示该视频的标识,本实施例中采 用vl、v2、v3、 、vm表示不同视频的标识。
[0014] 每个视频包括以下属性信息:视频ID、名称、类型、国家、导演、演员、简介等。对简 介进行文本分词处理,并去除停用词(介词、连接词、语气词等虚词),将剩下的实词和名称、 类型、国家、导演、演员等信息,作为视频标签。视频标签为体现视频特性的元素,如几何数 学,武侠,爱情等。
[0015] 需要说明的是,具体视频的属性信息根据视频的类型会有所变化,以上只是一种 示例说明。
[0016] 首先,在数据库中存储有所有视频的数据信息。
[0017] 示例性的,通过遍历每一条视频数据信息,枚举出所有这些视频标签,并进行去重 处理,来进行分析,并把他们按照视频涉及的内容进行自然分类,即根据视频标签所属类别 进行分类。
[0018] 具体地,影视类视频标签所属类别可以为题材、年代、国家、关键词,教育类视频标 签所属类别可以为年级、科目、适用人群、版本、关键词,一般来说,可以把视频标签分成4、5 个左右的类别属性。
[0019] 下面以视频标签所属类别为5为例进行说明。
[0020]假设这五个视频标签所属类别所描述的集合为附,呢,似,财,阳。每个视频标签所 属类别中会包含着很多的子类别,假设每个视频标签所属类别中的子类别所代表的集合分 别是nli、集合n2i、集合n3i、集合n4i、集合n5i(其中,nli代表N1中的子集元素,i从1到m), 每一条视频都含有这五个视频标签所属类别,每个视频标签所属类别里的元素对应着属于 nli、n2i、n3i、n4i、n5i里的元素,每个元素相当于视频标签。这五个集合需要满足如下特 占 . (1)每个视频都可以按照视频标签所属类别进行分类。
[0021] (2)任意两个集合中的子集:nikUnjl>nik(i !=j),即任意两个视频标签所属类别 所包含的子集中的视频标签之间是没有包含关系的。
[0022] (3)存在nli Π n2i Π n3i Π n4i Π n5i=0的情况,即任意视频标签所属类别所包含 的子集中的视频标签之间是不重叠的。
[0023 ] (4)这些类别属性(Nl、N2、N3、Μ、N5)之间存在着优先级高低的顺序。
[0024] 为了增加推荐视频的准确度,可以再给每一个视频标签所属类别添加关键词类 别。
[0025] 最终,在视频推荐装置上实现的视频分类后的存储结构是如下格式的: _id:Number Nl:nli N2:n2i N3:n3i N4:n4i N5:n5i M:keyword 示例性的,根据上述格式的视频存储结构生成视频集合存储到字典数据结构中,存储 格式为:{视频标识:"XXX",视频标签所属类别1: "视频标签",视频标签所属类别2: "视频标 签",视频标签所属类别3: "视频标签",…,视频标签所属类别η-l: "视频标签",关键词: ["关键词Γ,"关键词2",…,"关键词m" ]},n、m为自然数。
[0026] 对上述视频集合进行处理,按照视频标识、视频标签所属类别及视频标签,生成列 表1,其中视频标签所属类别不包括关键词类别。
[0027] 将视频标识和关键词类别及关键词视频标签等信息进行整理,生成列表2。
[0028] 将列表1和列表2分别存储到一个新的字典结构中。将原字典拆分为两个新字典, 主要是为了方便后续通过视频标识来获取关键词信息及其他视频标签信息。
[0029] 其中,列表1的存储格式为:{视频标识:"XXX,视频标签1,视频标签2,…,视频标 签η},视频标签1对应视频标签1所属类别,视频标签2对应视频
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1