一种在线视频标签生成方法和系统的制作方法

文档序号:6382344阅读:249来源:国知局
专利名称:一种在线视频标签生成方法和系统的制作方法
技术领域
本发明实施例涉及互联网领域,具体涉及一种在线视频标签生成方法和系统。
背景技术
在线视频标签的生成是描述在线视频特征的有效方法,被广泛应用到在线视频搜索和在线视频推荐系统中。一个在线视频标签由标签内容和标签强度组成,标签内容描述在线视频特征,标签强度说明该特征的重要性。终端通过查看标签内容,能够分辨出该在线视频的特征,确认是否可能满足自己的观影需求。而通过对一个在线视频的全部标签的标签强度进行比较,可以知道该在线视频的主要特征和次要特征。如果主要特征与观影需求一致,则可以确定该在线视频最满足终端的观影需求;否则,虽然一定程度上该在线视频满足观影需求,但可能不是最佳匹配的影片。传统的在线视频标签生成方法包括三个步骤,如图1所示步骤00、建设在线视频标签库。通过领域知识建立一个在线视频标签库。步骤02、为每个在线视频标注标签内容。对每一个在线视频,选择标签库中的一个或多个标签作为在线视频的标签内容。步骤04、基于终端的评分计算在线视频所有标签的标签强度。对于每一个在线视频,通过终端对在线视频的全部标签内容进行投票或打分,用得到的分数,通过计算得到全部标签内容的标签强度。由于传统的在线视频标签生成方法需要对每个在线视频标注标签内容,工作量巨大,成本高;而且部分在线视频可能缺少标签内容,或者部分在线视频的标签强度不准确。

发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种在线视频标签生成系统和相应的标签生成方法。根据本发明的一个方面,提供了 一种在线视频标签生成方法。本发明实施例中,计算各在线视频的原始标签矩阵,并计算各在线视频的相似度矩阵;其中,各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵,各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵;基于各在线视频的相似度矩阵和各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵;基于各在线视频的原始标签矩阵和各在线视频的候选标签矩阵,判断各在线视频的候选标签矩阵是否符合预置条件;当符合预置条件时,基于各在线视频的候选标签矩阵,确定各在线视频的更新的标签。根据本发明的另一个方面,提供了 一种在线视频标签生成系统。本发明实施例中,原始标签矩阵计算模块,适于计算各在线视频的原始标签矩阵;其中,各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵;相似度矩阵计算模块,适于计算各在线视频的相似度矩阵;其中,各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵;候选标签矩阵计算模块,适于基于各在线视频的相似度矩阵和各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵;循环操作模块,适于基于各在线视频的原始标签矩阵和各在线视频的候选标签矩阵,判断各在线视频的候选标签矩阵是否符合预置条件;当符合预置条件时,基于各在线视频的候选标签矩阵,确定各在线视频的更新的标签。根据本发明实施例的在线视频标签生成方法和系统,可以基于各在线视频的观看数据和评分数据,确定各在线视频中相似的在线视频;在相似的在线视频之间,确定在线视频的相似度矩阵和传递的标签内容;根据在线视频的相似度矩阵逐步计算得到候选标签矩阵,进一步判断候选标签矩阵是否符合预置条件,基于符合预置条件的候选标签矩阵确定各在线视频的新的标签内容和标签强度,由此解决了背景技术中需要标注每个在线视频的标签内容,以及标签强度不准确的问题,取得了节省标注标签内容的成本,提高了标签内容和标签强度准确率的有益效果。而且,根据本发明实施例的在线视频标签生成方法和系统,可以基于各在线视频的观看数据和评分数据,确定各在线视频中相似的在线视频;在相似的在线视频之间,确定在线视频的相似度矩阵和传递的标签内容;根据在线视频的相似度矩阵逐步计算得到候选标签矩阵,进一步判断候选标签矩阵是否符合预置条件,基于符合预置条件的候选标签矩阵确定各在线视频的新的标签内容和标签强度;再结合符合预置条件的候选标签矩阵和对应终端的终端在线视频矩阵,计算得到所述终端的在线视频推荐矩阵,将各在线视频中权值高的在线视频作为推荐的在线视频。由此解决了背景技术中需要标注每个在线视频的标签内容,以及标签强度不准确和在线视频推荐结果不准确的问题,取得了节省标注标签内容的成本,提高了标签内容、标签强度和在线视频推荐准确率的有益效果。并且,根据本发明实施例的在线视频标签生成方法和系统,可以基于各在线视频的观看数据和评分数据,确定各在线视频中相似的在线视频;在相似的在线视频之间,确定在线视频的相似度矩阵和传递的标签内容;根据在线视频的相似度矩阵逐步计算得到候选标签矩阵,进一步判断候选标签矩阵是否符合预置条件,基于符合预置条件的候选标签矩阵确定各在线视频的新的标签内容和标签强度;再结合符合预置条件的候选标签矩阵和对应终端的终端在线视频矩阵,计算得到所述终端的在线视频推荐矩阵,将各在线视频中权值高的在线视频作为推荐的在线视频;根据数据库中的查询结果,将推荐的在线视频发送至终端。由此解决了背景技术中需要标注每个在线视频的标签内容,以及标签强度不准确和在线视频推荐结果不准确的问题,取得了节省标注标签内容的成本,提高了标签内容、标签强度和在线视频推荐准确率的有益效果。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式



通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中图1示出了背景技术中在线视频标签生成方法示意图;图2示出了根据本发明一个实施例的一种在线视频标签生成方法流程图;图3示出了根据本发明一个实施例的一种在线视频标签生成方法流程图;图4示出了根据本发明一个实施例的一种在线视频标签生成方法示意图;图5示出了根据本发明一个实施例的一种在线视频标签生成系统结构图;图6示出了根据本发明一个实施例的一种在线视频标签生成系统结构图;图7示出了根据本发明一个实施例的一种在线视频标签生成系统示意图;图8示出了根据本发明一个实施例的一种在线视频推荐方法流程图;图9示出了根据本发明一个实施例的一种在线视频推荐方法流程图;图10示出了根据本发明一个实施例的一种在线视频推荐系统结构图;图11示出了根据本发明一个实施例的一种在线视频推荐系统结构图;图12示出了根据本发明一个实施例的一种在线视频处理系统示意图。
具体实施例方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本发明实施例可以应用于计算机系统/服务器,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。随着在线视频数量的快速增长,对在线视频标注标签内容的工作量也明显增多,付出的成本相应地提高。而且还可能出现在线视频缺少标签内容的情况,例如,在线视频“无间道”,因为不确定会拍系列剧集,标注的标签内容为“香港”、“警匪”、“动作”;在线视频“无间道2”和“无间道3”上线后,标注“无间道2”的标签内容为“无间道系列”、“香港”、“动作”;在线视频“无间道3”的标签内容为“无间道系列”、“香港”、“警匪”。在线视频“无间道”也属于“无间道系列”,但是在线视频“无间道”缺少标签内容“无间道系列”。当终端搜索“无间道系列”时,无法找到在线视频“无间道”。虽然一个在线视频的标签内容的标签强度可以基于终端的评分动态更新,但是对于新上线的在线视频和低热度的在线视频来说,由于主动打分的终端的比率偏低,打分数据存在数据稀疏问题,例如在线视频“无间道2”刚上线时,只有一个终端对其标签内容“无间道系列”、“香港”、“动作”进行了评分,未对标签内容“警匪”进行评分。根据各标签内容的终端评分计算得到的标签强度分别为“无间道系列”:0. 57,“动作”:0. 57,“香港”:0. 57,“警匪” :0。因此在搜索“香港警匪电影”时,由于在线视频“无间道2”的标签内容“警匪”的标签强度为O,所以搜索结果中不会返回“无间道2”,标签内容“警匪”的标签强度准确率低。为此,本发明实施例公开了一种在线视频标签生成方法和系统。下面通过列举几个具体的实施例详细介绍本发明公开的一种在线视频推荐及标签生成方法和系统、处理系统。 实施例一详细介绍本发明实施例公开的一种在线视频标签生成方法。参考图2,示出了本发明实施例中一种在线视频标签生成方法流程图。步骤100,计算各在线视频的原始标签矩阵。上述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。上述各在线视频可以指几个标签内容相似的在线视频,各在线视频的标签内容是从已经创建的标签库中选择出来,各在线视频的标签内容可以完全相同,也可以部分相同。例如,在在线视频的标签库中,为3个在线视频V1、V2和V3选择5个标签作为3个在线视频的标签内容,分别为标签tl、t2、t3、t4和t5。具体对应关系为Vl 的标签内容为 tl、t3、t4、t5 ;V2 的标签内容为 tl、t2、t4、t5 ;V3 的标签内容为 tl、t2、t3、t5。由于上述3个在线视频V1、V2和V3的标签内容均从标签tl、t2、t3、t4和t5中选择,可以认为上述3个在线视频V1、V2和V3为相似的在线视频。通过获取各在线视频的标签内容的评分数据,进行归一化处理后,计算得到各在线视频的原始标签矩阵。例如,获取5个在线视频的标签内容的评分数据,得到矩阵D。
1 2 3 0 00 3 0 7 0D= O O 5 O O
O O O 10 40 0 3 0 4其中,第一行的数值表示在线视频Vl的标签内容tl、t2、t3的评分分别是1、2、3分,标签内容t4和t5没有评分数据;第二行的数值表示在线视频V2的标签内容t2和t4的评分分别为3和7,标签内容tl、t3和t5没有评分数据;其他同理。对矩阵D进行归一化处理后得到各在线视频的原始标签矩阵,即VIDE0_TAG矩阵。
权利要求
1.一种在线视频标签生成方法,包括 计算各在线视频的原始标签矩阵,并计算各在线视频的相似度矩阵;其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵,所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵; 基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵; 基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件; 当符合所述预置条件时,基于所述各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
2.根据权利要求1所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件之后,还包括 当不符合所述预置条件时,将所述各在线视频的候选标签矩阵作为所述各在线视频的原始标签矩阵,进入计算各在线视频的下一个候选标签矩阵和判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
3.根据权利要求1所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件,包括 基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,计算得到各在线视频的差异标签矩阵; 将所述各在线视频的差异标签矩阵中的各个数值与预置的差异阈值进行比较,基于比较结果判断所述各在线视频的候选标签矩阵是否符合预置条件; 当所述各在线视频的差异标签矩阵中的各个数值均小于所述差异阈值时,所述各在线视频的候选标签矩阵符合预置条件; 当所述各在线视频的差异标签矩阵中的各个数值中,至少一个数值大于等于所述差异阈值时,所述各在线视频的候选标签矩阵不符合预置条件。
4.根据权利要求1所述的方法,所述计算各在线视频的相似度矩阵,包括 获取终端在线视频矩阵;其中,所述终端在线视频矩阵的各行表示各终端,所述终端在线视频矩阵的各列表示各在线视频,所述终端在线视频矩阵的各数值表示各终端与各在线视频的对应关系; 将所述终端在线视频矩阵进行转置操作,得到在线视频终端矩阵;所述在线视频终端矩阵的各行表示各在线视频,所述在线视频终端矩阵的各列表示各终端,所述在线视频终端矩阵的各数值表示各在线视频与各终端的对应关系; 根据所述在线视频终端矩阵,依次确定各在线视频中的每个在线视频i与各在线视频中除该在线视频之外的在线视频j共现终端的数量;其中,i=l、2......n, j = 1、2......η, η为各在线视频的数量,η为正整数,j; 将所述共现终端的数量与所述在线视频j的终端数量相除,得到该在线视频i与在线视频j的相似度;对所述相似度进行归一化处理,得到所述各在线视频的相似度矩阵。
5.根据权利要求1所述的方法,所述基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵,包括 基于所述各在线视频的原始标签矩阵和所述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵; 基于所述各在线视频的原始标签矩阵和所述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵。
6.根据权利要求5所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵,包括 对原始标签矩阵中的每个在线视频,遍历各在线视频中除该在线视频之外的在线视频; 基于相似度矩阵判断该在线视频与各在线视频中除该在线视频之外的各在线视频的相似度是否大于0 ; 当相似度大于0时,将该在线视频的当前标签内容作为传递的标签内容,将相似度与该在线视频的当前标签强度相乘作为传递的标签强度。
7.根据权利要求5所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵,包括 根据h=yXq + cX (1 - q) Xy计算得到各在线视频的候选标签矩阵; 其中,h为各在线视频的候选标签矩阵,y为各在线视频的原始标签矩阵,q为原始标签权值,c为各在线视频的传递的标签矩阵; 所述各在线视频的候选标签矩阵的标签内容为所述各在线视频的原始标签矩阵的标签内容和所述各在线视频的传递的标签矩阵的标签内容的合集; 所述各在线视频的候选标签矩阵的标签强度为所述各在线视频的原始标签矩阵的标签强度和所述各在线视频的传递的标签矩阵的标签强度的线性组合。
8.—种在线视频标签生成系统,包括 原始标签矩阵计算模块,适于计算各在线视频的原始标签矩阵;其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵; 相似度矩阵计算模块,适于计算各在线视频的相似度矩阵;其中,所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵; 候选标签矩阵计算模块,适于基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵; 循环操作模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件;当符合所述预置条件时,基于所述各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
9.根据权利要求8所述的系统,所述循环操作模块还适于当所述各在线视频的候选标签矩阵不符合所述预置条件时,将所述各在线视频的候选标签矩阵作为所述各在线视频的原始标签矩阵,并进入所述候选标签矩阵计算模块计算各在线视频的下一个候选标签矩阵和所述循环操作模块判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
10.根据权利要求8所述的系统,所述循环操作模块,包括 差异标签矩阵计算子模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,计算得到各在线视频的差异标签矩阵; 比较子模块,适于将所述各在线视频的差异标签矩阵中的各个数值与预置的差异阈值进行比较, 候选标签矩阵判断子模块,适于基于比较结果判断所述各在线视频的候选标签矩阵是否符合预置条件;当所述各在线视频的差异标签矩阵中的各个数值均小于所述差异阈值时,所述各在线视频的候选标签矩阵符合预置条件;当所述各在线视频的差异标签矩阵中的各个数值中,至少一个数值大于等于所述差异阈值时,所述各在线视频的候选标签矩阵不符合预置条件。
11.根据权利要求8所述的系统,所述相似度矩阵计算模块,包括 终端在线视频矩阵获取子模块,适于获取终端在线视频矩阵;其中,所述终端在线视频矩阵的各行表示各终端,所述终端在线视频矩阵的各列表示各在线视频,所述终端在线视频矩阵的各数值表示各终端与各在线视频的对应关系; 在线视频终端矩阵确定子模块,适于将所述终端在线视频矩阵进行转置操作,得到在线视频终端矩阵;其中,所述在线视频终端矩阵的各行表示各在线视频,所述在线视频终端矩阵的各列表示各终端,所述在线视频终端矩阵的各数值表示各在线视频与各终端的对应关系; 共现终端数量确定子模块,适于根据所述在线视频终端矩阵,依次确定各在线视频中的每个在线视频i与各在线视频中除该在线视频之外的在线视频j共现终端的数量;其中,i=l、2......n, j = 1、2......η, η为各在线视频的数量,η为正整数,i关j ; 相似度确定子模块,适于将所述共现终端的数量与所述在线视频j的终端数量相除,得到该在线视频i与在线视频j的相似度; 归一化处理子模块,适于对所述相似度进行归一化处理,得到所述各在线视频的相似度矩阵。
12.根据权利要求8所述的系统,所述候选标签矩阵计算模块,包括 传递的标签矩阵计算子模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵; 候选标签矩阵计算子模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵。
13.根据权利要求12所述的系统,所述传递的标签矩阵计算子模块,包括 遍历子单元,适于对原始标签矩阵中的每个在线视频,遍历各在线视频中除该在线视频之外的在线视频; 判断子单元,适于基于相似度矩阵判断该在线视频与各在线视频中除该在线视频之外的各在线视频的相似度是否大于O ; 传递的标签确定子单元,适于当相似度大于O时,将该在线视频的当前标签内容作为传递的标签内容,将相似度与该在线视频的当前标签强度相乘作为传递的标签强度。
14.根据权利要求12所述的系统 所述候选标签矩阵计算子模块根据h=yXq + cX (1- q)Xy计算得到各在线视频的候选标签矩阵; 其中,h为各在线视频的候选标签矩阵,y为各在线视频的原始标签矩阵,q为原始标签权值,c为各在线视频的传递的标签矩阵; 所述各在线视频的候选标签矩阵的标签内容为所述各在线视频的原始标签矩阵的标签内容和所述各在线视频的传递的标签矩阵的标签内容的合集; 所述各在线视频的候选标签矩阵的标签强度为所述各在线视频的原始标签矩阵的标签强度和所述 各在线视频的传递的标签矩阵的标签强度的线性组合。
全文摘要
本发明实施例公开了一种在线视频标签生成方法和系统,解决了需要标注每个在线视频的标签内容,以及标签强度不准确的问题。其中,所述在线视频标签生成方法包括计算各在线视频的原始标签矩阵和相似度矩阵;基于相似度矩阵和原始标签矩阵,计算得到候选标签矩阵;基于原始标签矩阵和候选标签矩阵,判断候选标签矩阵是否符合预置条件;当符合预置条件时,基于候选标签矩阵,确定各在线视频的更新的标签。本发明实施例节省了标注标签内容的成本,提高了标签内容和标签强度准确率。
文档编号G06F17/30GK103049479SQ20121048898
公开日2013年4月17日 申请日期2012年11月26日 优先权日2012年11月26日
发明者杨浩, 吴凯 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1