一种视频标签排序方法、装置及智能电视与流程

文档序号:16088158发布日期:2018-11-27 22:41阅读:233来源:国知局
本申请涉及视频标签
技术领域
,尤其涉及一种视频标签排序方法、装置及智能电视。
背景技术
:随着视频资源的越来越多,视频的类型也多种多样。对于各大视频网站来说,当用户检索关键词寻找需要看的视频时,在无数的视频资源中,能否将用户真正需要的视频内容准确推送给用户将严重影响到用户体验。为了实现视频推荐的准确性,目前各个视频网站一般根据视频标签获取视频与用户需求的关联程度,从而保证推送给用户的视频的准确性。常见的推荐方法一般包括视频的相关推荐和用户的个性化推荐。首先对于视频相关推荐来讲,就是根据视频标签(类型、演员、导演等)信息上的相似性进行相似度计算的,显然视频标签的准确性对于推荐效果影响巨大。其次,在个性化推荐中,用户的推荐也主要是两种形式,一种是利用用户的观看历史推荐与该视频关联度较高的视频,这个过程中就需要用到上述相关推荐的结果,另一种利用用户画像,即给用户打标签,然后根据用户画像数据进行视频推荐,这个过程中,第一,用户的很多标签来源于视频标签,即根据用户的历史行为将视频标签进行转化形成用户的标签数据;第二,根据用户画像的数据进行视频推荐的过程中,同样需要用到视频标签数据。因此在整个推荐过程中,视频标签的准确性及相关性起到至关重要的作用。但是,目前在各大视频网站中,对于视频的属性主要是通过视频标签(包括类型、演员、导演等)来体现。如图1所示,A视频含有视频标签包括动作、科幻和恐怖,B视频含有视频标签包括动作和战争,而各类视频标签给出的时候往往只是有或无的区别,即某视频是否具有某个视频标签,无法准确区分视频的准确类型,从而降低了视频推送的准确性。技术实现要素:本申请提供了一种视频标签排序方法、装置及智能电视,以解决传统的视频标签影响视屏推荐准确率的问题。第一方面,本申请实施例提供了一种视频标签排序方法,包括:获取通过第一视频关联跳转播放的第二视频的视频标签库,第二视频为通过第一视频关联跳转播放次数在预设排名内的任一视频,视频标签库根据第一视频的第一视频标签和第二视频的跳转播放次数确定,第一视频标签为第一视频的任一视频标签,视频标签库中包含第二视频的视频标签,且视频标签库中的视频标签为第一视频包含的视频标签;根据第一视频的第一视频标签和视频标签库确定第一视频标签的词频(TermFrequency,TF)值;根据第二视频的视频总数和第二视频中包含第一视频标签的视频总数确定第一视频标签的逆文本频率指数(InverseDocumentFrequency,IDF)值;根据所述第一视频标签的TF值和所述第一视频标签的IDF值确定所述第一视频标签的TF-IDF值,所述TF-IDF值用于确定所述第一视频标签在所述第一视频包含的所有视频标签中的排列顺序。通过用户观看的第一视频关联跳转播放的第二视频,通过第二视频的视频标签确定出视频标签库,进而可以确定出第一视频中每个视频标签在视频标签库中的TF值,为了保证第一视频的视频标签排序的准确性,进一步获取第一视频中每个视频标签的IDF值,最终获得第一视频中每个视频标签的TF-IDF值,TF-IDF表示了第一视频中每个视频标签在第一视频的所有视频标签中权重值,进而根据TF-IDF值对第一视频的所有视频标签可以准确的排序。第二方面,本申请实施例提供了一种视频标签排序装置,包括:获取模块,用于获取通过第一视频关联跳转播放的第二视频的视频标签库,第二视频为通过第一视频关联跳转播放次数在预设排名内的任一视频,视频标签库根据第一视频的第一视频标签和第二视频的跳转播放次数确定,第一视频标签为第一视频的任一视频标签,视频标签库中包含第二视频的视频标签,且视频标签库中的视频标签为第一视频包含的视频标签;第一确定模块,用于根据第一视频的第一视频标签和视频标签库确定所述第一视频标签的词频TF值;第二确定模块,用于根据第二视频的视频总数和所述第二视频中包含第一视频标签的视频总数确定第一视频标签的逆文本频率指数IDF值;顺序确定模块,用于根据第一视频标签的TF值和第一视频标签的IDF值确定第一视频标签的TF-IDF值,TF-IDF值用于确定第一视频标签在第一视频包含的所有视频标签中的排列顺序。第三方面,本申请实施例提供了一种智能电视,包括:显示屏;处理器;用于存储所述处理器处理可执行指令的存储器;所述处理器执行视频标签排序方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有指令,当该指令在处理器上运行时,使得该处理器执行第一方面的方法。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的传统技术中视频标签的示意图;图2为本申请实施例提供的一种视频标签排序方法的流程示意图;图3为本申请实施例提供的一种视频标签排序装置的示意图;图4为本申请实施例提供的一种智能电视的结构示意图。具体实施方式为了使本
技术领域
的人员更好地理解本申请实施例中的技术方案,下面结合附图对本申请实施例中技术方案作进一步详细的说明。一般用户在观看完一类视频时,随后会有相关的视频推荐。例如如果在当前时刻观看的是一部动作类的视频,则观看结束后一般推荐的为动作类的。但是不乏推荐的视频为相类似的,比如战争类、科幻类等。而本实施例中的方法就是为了使每一个视频中的视频标签按照视频内容的类型进行合理的排序,从而达到根据用户需求可以精确推送目的。参见图2,为本申请实施例提供的一种视频标签排序方法的流程示意图。如图2所示,频标签排序方法包括:S101,获取通过第一视频关联跳转播放的第二视频的视频标签库。本实施例中第一视频为需要进行标签排序的视频,用户在观看完第一视频后,会根据视频网站或客户端的推荐观看其他的视频。为了保证数据的准确性,设置一个预设时间段内,对观看过第一视频,然后又关联跳转播放的其他视频一一进行记录。如果通过第一视频关联跳转播放的视频数量比较大,而且有的视频只播放了一次,因此没有实际的参考价值。因此选择播放次数排在前N名的视频用于组建视频标签库。在这里,将通过观看第一视频然后关联跳转播放次数排在前N名的视频定义为第二视频,因此第二视频不是单指某一视频。当确定了播放次数排在前N名的第二视频后,依次确定每个第二视频的播放次数和每个视频对应的第二视频标签,第二视频标签为所述第二视频的任一视频标签。将每个视频的视频标签与第一视频的第一视频标签进行比对,第一视频标签为第一视频的任一视频标签。如果存在与第一视频标签不同的,则直接删除。这样做的目的是防止最终生成的视频标签库中出现过多与第一视频标签不相关的视频标签。经过上述筛选后,从所有第二视频标签中筛选出与第一视频标签相关的第三视频标签。最后根据每个第二视频跳转播放的次数和每个第二视频对应的第三视频标签,确定视频标签库。一个示意性实施例,假设从通过第一视频关联跳转播放的视频中选择播放次数为前10名的视频作为第二视频。每个第二视频的播放次数和对应的第二视频标签如表1所示:表1第二视频列表视频名称视频播放次数视频标签A视频15动作,战争,科幻B视频13动作,战争C视频10动作,科幻D视频10战争,科幻,搞笑E视频9动作,战争,冒险F视频8动作,推理,悬疑G视频8动作,搞笑H视频8科幻,推理I视频7战争,悬疑,恐怖J视频6动作,战争假设第一视频标签有动作、战争和科幻。由表1可知,D视频中还包含视频标签搞笑,E视频包含视频标签冒险,F视频包含视频标签推理和悬疑,G视频包含视频标签搞笑,H视频包含视频标签推理,I视频包含视频标签悬疑和恐怖。由于上述视频标签在第一视频标签中都没有出现,因此将上述第二视频中不相关的第二视频标签筛选掉,只保留与第一视频标签相同的第二视频标签。进一步根据表1中每个第二视频播放的次数,确定视频标签库。视频标签库中包含动作69个,战争53个,科幻43个,因此视频标签库中包含有165个标签。当然上述只是示意性的,为了保证获取的视频标签库的准确性,可以选择在一个月内通过第一视频关联跳转播放的视频中播放次数为前100名的视频作为第二视频,在此不再赘述。S102,根据所述第一视频的第一视频标签和所述视频标签库确定所述第一视频标签的词频TF值。词频TF值的定义为TF=关键词出现的次数/文档中所有词的数量,这里关键词即为本申请的第一视频标签,文档即为本申请的视频标签库。因此由S101中可知,只要确定出第一视频标签在视频标签库中出现的次数,自然就可以确定出第一视频标签在视频标签库中的词频TF值。如果如S101中示例只选取了10个第二视频,则可以按照一个个筛选确定的方法,但是如果第二视频的数量达到几百个甚至几千个,则会出现筛选的复杂性和浪费时间的问题。因此本实施例中根据,每个第二视频的标签和播放的次数确定每个第二视频与第一视频的视频标签相似度。很显然视频标签相似度为小数级的数值,因此将视频标签相似度按照预设放大倍数进行取整,取整后的视频标签相似度近似作为所述第二视频包含所述第一视频标签的次数。将每个取整后的第二视频与第一视频的视频标签相似度加和,获得第一次数。根据第一次数和视频标签库中视频标签总数确定第一视频标签的词频TF值。本实施例中采用基于物品的协同过滤原理,即物品i和物品j具有很大的相似度,因为喜欢物品i的用户也大都喜欢物品j,因此,其中|Ni|为喜欢物品i的用户数,Ni∩Nj为既喜欢物品i,又喜欢物品j的用户数。根据上述原理可以认为看多第一视频的人大都看过第二视频,而且在一个月内,看过第一视频的人又看了第二视频的n次。假设需要获取第一视频标签“战争”的词频TF,如果根据上述协同过滤原理获得第二视频与第一视频“战争”的视频标签相似度为(s1,s2...,sN),按照预设放大倍数取整后,得到视频标签相似度为(n1,n2,...,nN),则第一视频标签“战争”在视频标签库中出现的次数为n1+n2+...+nN。则可以得出第一视频标签“战争”的词频TF值为:TF=(n1+n2+...+nN)/频标签库中视频标签总数S103,根据所述第二视频的视频总数和所述第二视频中包含所述第一视频标签的视频总数确定所述第一视频标签的IDF值。如果第二视频的视频标签包含第一视频标签则将标记数记为1,否则记为0,将每个第二视频对应标记数加和获得第二视频中包含第一视频标签的视频总数,第一视频标签的IDF值=log第二视频的视频总数/(1+第二视频中包含所述第一视频标签的视频总数)。本实施例中确定第一视频标签的IDF值的目的是为了防止,视频资源是在特定视频库中推荐选取的,这样单纯依靠第一视频标签的词频TF值则不能直接判定第一视频标签的的排序位置。例如,第一视频标签为“战争”,而通过第一视频关联跳转播放的第二视频出自与战争片视频支援库,由上述可知每个视频都带有战争视频标签,则根据上述第二视频确定出的视频标签库则失去了意义。因此本实施例中获取第一视频标签的逆文本频率指数IDF值,由第一视频标签的IDF值的确定公式可知,第一视频标签的IDF值反映第一视频标签的普遍程度,当第一视频标签越普遍(视频标签库中包含这个词过多)时第一视频标签的IDF值越低,反之,则第一视频标签的IDF值越高。S104,根据所述第一视频标签的TF值和所述第一视频标签的IDF值确定所述第一视频标签的TF-IDF值。TF-IDF值用于确定第一视频标签在第一视频包含的所有视频标签中的排列顺序。具体地,将第一视频标签的TF值和第一视频标签的IDF值相乘之后的数值作为第一视频标签的TF-IDF值。然后对比每个第一视频标签的TF-IDF值,根据第一视频标签的TF-IDF值对第一视频中的视频标签进行权重排序。例如第一视频的第一视频标签有动作、战争和科幻,本来只是简单的示出存在这三个视频标签。但是根据上述方法确定出动作的TF-IDF值为0.2,战争的TF-IDF值为0.7,科幻TF-IDF值为0.1,因此第一视频的视频标签则会进行新的显示方式,具体如表2所示:表2第一视频标签排序视频名称视频标签名称排序第一视频战争1第一视频动作2第一视频科幻3通过上述排列后,如果用户检索关于战争的视频,则第一视频则作为推荐视频,如果用户检索动作和科幻的视频,则第一视频被推荐的可能性较小。由上述实施例可知,本实施例提供的一种视频标签排序方法,通过用户观看的第一视频关联跳转播放的第二视频,通过第二视频的视频标签确定出视频标签库,进而可以确定出第一视频中每个视频标签在视频标签库中的TF值,为了保证第一视频的视频标签排序的准确性,进一步获取第一视频中每个视频标签的IDF值,最终获得第一视频中每个视频标签的TF-IDF值,TF-IDF表示了第一视频中每个视频标签在第一视频的所有视频标签中权重值,进而根据TF-IDF值对第一视频的所有视频标签可以准确的排序。与上述提供的一种视频标签排序方法的实施例相对应,本申请还提供了一种视频标签排序装置的实施例,如图3所示,视频标签排序装置20包括:获取模块201、第一确定模块202、第二确定模块203和顺序确定模块204。其中,获取模块201,用于获取通过第一视频关联跳转播放的第二视频的视频标签库,第二视频为通过第一视频关联跳转播放次数在预设排名内的任一视频,视频标签库根据第一视频的第一视频标签和第二视频的跳转播放次数确定。第一视频标签为第一视频的任一视频标签,视频标签库中包含第二视频的视频标签,且视频标签库中的视频标签为第一视频包含的视频标签。第一确定模块202,用于根据第一视频的第一视频标签和视频标签库确定第一视频标签的词频TF值。第二确定模块203,用于根据第二视频的视频总数和第二视频中包含第一视频标签的视频总数确定第一视频标签的逆文本频率指数IDF值。顺序确定模块204,用于根据第一视频标签的TF值和第一视频标签的IDF值确定第一视频标签的TF-IDF值,TF-IDF值用于确定第一视频标签在第一视频包含的所有视频标签中的排列顺序。进一步地,获取模块201包括第一获取单元、选择单元和第一确定单元。第一获取单元用于获取第一视频的第一视频标签和第二视频的第二视频标签及第二视频跳转播放的次数,第二视频标签为第二视频的任一视频标签。选择单元用于从第二视频标签中筛选出与第一视频标签相同的第三视频标签。第一确定单元用于根据每个第二视频跳转播放的次数和每个第二视频对应的第三视频标签,确定第二视频的视频标签库。第一确定模块202包括第二获取单元和第二确定单元。第二获取单元用于获取第一视频标签在视频标签库中出现的第一次数。第二确定单元用于根据第一次数和视频标签库中视频标签总数确定第一视频标签的词频TF值。可选地,第二获取单元包括确定子单元、处理子单元和获取子单元。确定子单元用于确定每个第二视频与第一视频的视频标签相似度。处理子单元将视频标签相似度按照预设放大倍数进行取整,取整后的视频标签相似度近似作为第二视频包含第一视频标签的次数。获取子单元用于将每个取整后的第二视频与第一视频的视频标签相似度加和,获得第一次数。第二确定模块203包括:第三获取单元和第三确定单元。第三获取单元用于如果第二视频的视频标签包含第一视频标签则将标记数记为1,否则记为0,将每个第二视频对应标记数加和获得第二视频中包含第一视频标签的视频总数。第三确定单元用户确定所述IDF值=log第二视频的视频总数/(1+第二视频中包含所述第一视频标签的视频总数)。顺序确定模块204包括:计算单元,用于将第一视频标签的TF值和第一视频标签的IDF值相乘之后的数值作为第一视频标签的TF-IDF值。第一视频标签的TF-IDF值用于标识第一视频标签的权重值,权重值用于确定第一视频标签在第一视频所有标签中的排序位置。本实施例提供的视频标签排序装置20还包括标签排序单元,用于根据第一视频标签的TF-IDF值第一视频中的视频标签进行权重排序。由上述实施例可知,本实施例提供了一种视频标签排序装置,获取模块201通过用户观看的第一视频关联跳转播放的第二视频,通过第二视频的视频标签确定出视频标签库,进而第一确定模块202可以确定出第一视频中每个视频标签在视频标签库中的TF值,为了保证第一视频的视频标签排序的准确性,第二确定模块203进一步获取第一视频中每个视频标签的IDF值,最终获得第一视频中每个视频标签的TF-IDF值,TF-IDF表示了第一视频中每个视频标签在第一视频的所有视频标签中权重值,进而顺序确定模块204根据TF-IDF值对第一视频的所有视频标签可以准确的排序。本申请还提供了一种智能电视的实施例,参加图4,该智能电视可以包括以下一个或多个组件:处理器301、存储器302和显示屏303,处理器301与存储器302和显示屏303通信。启动智能电视后,处理器301和存储器302上电,处理器301执行上述实施例中的视频标签排序方法,获取通过第一视频关联跳转播放的第二视频的视频标签库,,根据第一视频的第一视频标签和视频标签库确定第一视频标签的词频TF值,根据第二视频的视频总数和第二视频中包含第一视频标签的视频总数确定第一视频标签的逆文本频率指数IDF值,根据所述第一视频标签的TF值和所述第一视频标签的IDF值确定所述第一视频标签的TF-IDF值,最后通过所述TF-IDF值确定第一视频中每个视频标签的权重值,进行标签排序。处理器301通常是控制智能电视的整体功能,例如智能电视的启动、以及智能电视启动后视频的处理等,处理器301可以包括一个或多个处理器来执行指令,以完成上述的方法的全部或部分步骤。此外,处理器301可以包括一个或多个模块,处理器301和其他设备之间的交互。存储器302被配置为存储各种类型的数据以支持智能电视的操作。这些数据的示例包括用于在智能电视上操作的任何应用程序或方法的指令,应用,图片,视频等。存储器302可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。在一个示意性实施例中,本申请实施例提供的智能电视还包括电源组件,电源组件为智能电视的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为智能电视生成、管理和分配电力相关联的组件。I/O接口,I/O接口处理器301和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。通信组件,通信组件被配置为便于智能电视和其他设备之间有线或无线方式的通信。智能电视可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。在一个示意性实施例中,智能电视可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、处理器或其他电子元件实现。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本申请说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于装置及智能电视实施例而言,由于其中的方法基本相似于视频标签排序方法的实施例,所以描述的比较简单,相关之处参见视频标签排序方法实施例中的说明即可。以上所述的本申请实施方式并不构成对本申请保护范围的限定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1