视频标签生成方法、视频处理方法、设备及存储介质与流程

文档序号:30517156发布日期:2022-06-25 03:41阅读:130来源:国知局
视频标签生成方法、视频处理方法、设备及存储介质与流程

1.本技术实施例涉及人工智能(artificial intelligence,ai),尤其涉及一种视频标签生成方法、视频处理方法、设备及存储介质。


背景技术:

2.在视频推荐、视频检索、视频广告投放等领域,视频标签决定着这些应用的准确度。例如:在视频推荐领域,电子设备可以根据视频标签有效归纳用户感兴趣的视频垂类,并在后续向用户推荐具有相同或相似标签的视频;在视频检索领域,视频标签可直接决定检索结果的准确性;在视频广告投放领域,视频标签发挥着用户精准定位功能,关联用户感兴趣内容的广告及投放,实现广告精确化、个性化。
3.目前视频标签生成方法是基于视觉和文本的多模态标签分类模型实现的,以为视频生成对应的标签,然而生成的标签未必适用于视频推荐、视频检索、视频广告投放,例如:假设在汽车垂类中,假设某视频的标签是丰田,在视频推荐中用户更倾向于看到的是关于丰田汽车的展览、驾驶视频等,而并不想看到的是关于丰田汽车的开车技巧等。基于此,通过目前视频标签生成方法所生成的视频标签,可能会导致视频推荐、视频检索、视频广告投放等准确度不高。


技术实现要素:

4.本技术提供一种视频标签生成方法、视频处理方法、设备及存储介质,从而可以提高视频推荐、视频检索、视频广告投放等的准确度,进而可以提高用户体验感。
5.第一方面,本技术提供一种视频标签生成方法,包括:获取视频标签生成任务和测试视频;确定测试视频对于视频标签生成任务的重要性;根据测试视频对于视频标签生成任务的重要性确定是否针对测试视频执行视频标签生成任务。
6.第二方面,本技术提供一种视频处理方法,包括:获取至少一个视频,并根据第一方面或第一方面的可选方式确定是否针对每个视频执行视频标签生成任务;根据至少一个视频的标签结果,对至少一个视频进行处理。
7.第三方面,提供一种视频标签生成装置,包括:第一获取模块、第一确定模块和第二确定模块,其中,第一获取模块用于获取视频标签生成任务和测试视频;第一确定模块用于确定测试视频对于视频标签生成任务的重要性;第二确定模块用于根据测试视频对于视频标签生成任务的重要性确定是否针对测试视频执行视频标签生成任务。
8.第四方面,提供一种视频处理装置,包括:获取模块、第一处理模块和第二处理模块,其中,获取模块用于获取至少一个视频;第一处理模块用于根据第一方面或第一方面的可选方式确定是否针对每个视频执行视频标签生成任务;第二处理模块用于根据至少一个视频的标签结果,对至少一个视频进行处理。
9.第五方面,提供一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行如第一方面、第二方面
或其各实现方式中的方法。
10.第六方面,提供一种计算机可读存储介质,用于存储计算机程序,计算机程序使得计算机执行如第一方面、第二方面或其各实现方式中的方法。
11.第七方面,提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行如第一方面、第二方面或其各实现方式中的方法。
12.第八方面,提供一种计算机程序,计算机程序使得计算机执行如第一方面、第二方面或其各实现方式中的方法。
13.通过本技术提供的技术方案,电子设备可以根据测试视频对于视频标签生成任务是否重要来确定是否针对测试视频执行视频标签生成任务。从而可以提高视频推荐、视频检索、视频广告投放等的准确度,进而可以提高用户体验感。
附图说明
14.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
15.图1为本技术实施例提供的一种视频标签生成方法的流程图;
16.图2为本技术实施例提供的另一种视频标签生成方法的流程图;
17.图3为本技术实施例提供的再一种视频标签生成方法的流程图;
18.图4为本技术实施例提供的又一种视频标签生成方法的流程图;
19.图5为本技术实施例提供的一种视频处理方法的流程图;
20.图6为本技术实施例提供的一种视频标签生成装置600的示意图;
21.图7为本技术实施例提供的一种视频处理装置700的示意图;
22.图8是本技术实施例提供的电子设备的示意性框图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
25.在介绍本技术技术方案之前,下面将对本技术技术方案的相关知识进行说明:
26.视频标签:即视频的标记,目的是方便后续视频推荐、视频检索、视频广告投放等。
的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、追踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
34.下面将对本技术技术方案进行详细阐述:
35.图1为本技术实施例提供的一种视频标签生成方法的流程图,该方法可以由台式电脑、笔记本电脑、平板、云服务器等电子设备执行,该方法包括:
36.s110:获取视频标签生成任务和测试视频;
37.s120:确定测试视频对于视频标签生成任务的重要性;
38.s130:根据测试视频对于视频标签生成任务的重要性确定是否针对测试视频执行视频标签生成任务。
39.应理解的是,视频标签生成任务指的是生成某类标签的任务。例如:在汽车垂类下,生成汽车款式标签的任务。
40.应理解的是,测试视频可以是任意视频,本技术对此不做限制。
41.应理解的是,测试视频对于视频标签生成任务的重要性也可以被称为基于该视频标签生成任务所生成的测试视频的标签在该测试视频中的重要性。例如:假设视频标签生成任务是在汽车垂类下,生成汽车款式标签的任务,而测试视频是上述视频1,该视频1展示的是侧方停车技巧,基于该任务生成的视频1的标签是大众捷达,基于此,在本技术中就是要考虑该视频1对于在汽车垂类下,生成汽车款式标签的任务的重要性,即考虑大众捷达在视频1中的重要性。
42.可选地,若测试视频对于视频标签生成任务重要,则确定针对测试视频执行视频标签生成任务;若测试视频对于视频标签生成任务不重要,则确定针对测试视频不执行视频标签生成任务。换句话讲,若测试视频对于视频标签生成任务重要,则生成该测试视频在视频标签生成任务下的标签;若测试视频对于视频标签生成任务不重要,则不生成该测试视频在视频标签生成任务下的标签。
43.示例性地,假设视频标签生成任务是在汽车垂类下,生成汽车款式标签的任务,而测试视频是上述视频1,该视频1展示的是侧方停车技巧,基于该任务生成的视频1的标签是大众捷达,假设电子设备确定该视频1对于该任务来讲不重要,那么电子设备无需为该视频1生成标签大众捷达。
44.综上,在本技术中,电子设备可以根据测试视频对于视频标签生成任务是否重要来确定是否针对测试视频执行视频标签生成任务。换句话讲,假设某视频对于该视频标签生成任务不重要,那么电子设备无需为该视频生成该视频标签生成任务下的标签,后续在视频推荐、视频检索、视频广告投放时,也不会推荐、检索或者投放该视频,从而可以提高视频推荐、视频检索、视频广告投放等的准确度,进而可以提高用户体验感。
45.图2为本技术实施例提供的另一种视频标签生成方法的流程图,该方法可以由台式电脑、笔记本电脑、平板、云服务器、车载终端等电子设备执行,该方法包括:
46.s210:获取视频标签生成任务和测试视频;
47.s220:获取视频训练集和视频标题集;
48.s230:获取视频训练集中各个视频的属性;
49.s240:根据视频训练集中各个视频的属性和视频标签生成任务将视频训练集划分为第一视频子集和第二视频子集;
50.s250:根据第一视频子集、第二视频子集和视频标题集确定测试视频对于视频标签生成任务的重要性;
51.s260:根据测试视频对于视频标签生成任务的重要性确定是否针对测试视频执行视频标签生成任务。
52.应理解的是,视频训练集包括至少一个视频。视频标题集由视频训练集中各个视频的标题组成。
53.应理解的是,第一视频子集中各个视频的属性对视频标签生成任务不重要,第二视频子集中各个视频的属性对视频标签生成任务重要。
54.可选地,每个视频的属性为以下任一项:该视频的第n级标签、类型、时长,n为正整数。
55.示例性地,假设每个视频的属性是该视频的一级标签,视频标签生成任务是在汽车垂类下,生成汽车款式标签的任务,由于“开车技巧”、“车模”这些一级标签对于在汽车垂类下,生成汽车款式标签的任务不重要,因此,电子设备可以将视频训练集中带有这些一级标签的视频组成第一视频子集。而由于“开车展销”、“车辆保养”这些一级标签对于在汽车垂类下,生成汽车款式标签的任务重要,因此,电子设备可以将视频训练集中带有这些一级标签的视频组成第二视频子集。
56.可选地,在本技术中,可以采用人工标注方式来对每个视频的一级标签的重要性进行标注,但不限于此。
57.上述s250可以通过以下任一种可实现方式来实现,但不限于此:
58.可实现方式一,如图3所示,s250包括:
59.s2501a:对视频标题集中的各个标题进行分词处理,得到各个标题对应的至少一个分词;
60.s2502a:判断每个分词在第一视频子集和第二视频子集中的出现概率;
61.s2503a:根据每个分词在第一视频子集和第二视频子集中的出现概率确定关键词集;
62.s2504a:根据关键词集确定测试视频对于视频标签生成任务的重要性。
63.可选地,电子设备可以采用开源的python开源库jieba或qqseg将一个视频标题分割为至少一个分词,例如:将“我来到北京清华大学“分割为“我”、“来到”、“北京”、“清华大学”。也可以采用其他分词方式对视频标题进行分词处理,本技术对分词方式不做限制。
64.应理解的是,第一视频子集和第二视频子集均是由至少一个视频组成,每个视频可以包括一些文本信息,例如:视频中的字幕、标题等,电子设备可以采用文字识别方式识别视频中的文字信息,并分别对第一视频子集和第二视频子集中的文字进行统计,比如:统计得到第一视频子集中总共包括:1000个分词,这1000个分词可以包括重复的分词,其中,“技巧”出现的次数是300次,“展销”出现的次数是80次,“保养”出现的次数是80次
……
统计
得到第二视频子集中总共包括:1000个分词,这1000个分词可以包括重复的分词,其中,“技巧”出现的次数是60次,“展销”出现的次数是400次,“保养”出现的次数是300次
……
基于此,假设某视频的标题是“丰田展销会”,经过分词之后,确定“展销”在第一视频子集中的出现概率是0.08,在第二视频子集中的出现概率是0.4。
65.可选地,电子设备可以将在第一视频子集中的出现概率与在第二视频子集中的出现概率差距较大的分词确定为关键词,具体可以通过如下可实现方式来确定目标分词是否为关键词,该目标分词可以是视频标题集中各个标题经过分词处理之后得到的任一个分词:
66.方式一:电子设备计算目标分词在第二视频子集中的出现概率与在第一视频子集中的出现概率的差值;若差值大于预设阈值,则确定目标分词为关键词。
67.可选地,该预设阈值可以是预定义的,或者是电子设备配置的,本技术对此不做限制。
68.可选地,该预设阈值的取值可以是0.2或者0.3等,本技术对此不做限制。
69.方式二:若目标分词在第二视频子集中的出现概率大于第一预设阈值,且该目标分词在第一视频子集中的出现概率小于或等于第二预设阈值,则确定目标分词为关键词。
70.可选地,第一预设阈值大于或等于第二预设阈值。
71.可选地,该第一预设阈值和第二预设阈值可以是预定义的,或者是电子设备配置的,本技术对此不做限制。
72.可选地,第一预设阈值的取值可以是0.2或者0.3等,本技术对此不做限制。
73.可选地,第二预设阈值的取值可以是0.05或者0.1等,本技术对此不做限制。
74.应理解的是,视频标题集中所有分词对应的关键词将构成上述关键词集。例如:关键词集可以包括:展销、保养、洗车、修理厂、新手、机油等。
75.应理解的是,电子设备除了可以根据每个分词在第一视频子集和第二视频子集中的出现概率确定关键词集之外,也可以根据每个分词在第一视频子集和第二视频子集中的出现频次来确定关键词集。
76.可选地,电子设备可以将在第一视频子集中的出现频次与在第二视频子集中的出现频次差距较大的分词确定为关键词,具体可以通过如下可实现方式来确定目标分词是否为关键词,该目标分词可以是视频标题集中各个标题经过分词处理之后得到的任一个分词:
77.方式一:电子设备计算目标分词在第二视频子集中的出现频次与在第一视频子集中的出现频次的差值;若差值大于第三预设阈值,则确定目标分词为关键词。
78.可选地,该第三预设阈值可以是预定义的,或者是电子设备配置的,本技术对此不做限制。
79.可选地,该第三预设阈值的取值可以是200或者300等,本技术对此不做限制。
80.方式二:若目标分词在第二视频子集中的出现频次大于第四预设阈值,且该目标分词在第一视频子集中的出现频次小于或等于第五预设阈值,则确定目标分词为关键词。
81.可选地,第四预设阈值大于或等于第五预设阈值。
82.可选地,该第四预设阈值和第五预设阈值可以是预定义的,或者是电子设备配置的,本技术对此不做限制。
83.可选地,该第四预设阈值的取值可以是200或者300等,本技术对此不做限制。
84.可选地,该第五预设阈值的取值可以是50或者100等,本技术对此不做限制。
85.示例性地,假设统计得到第一视频子集中总共包括:1000个分词,这1000个分词可以包括重复的分词,其中,“技巧”出现的次数是300次,“展销”出现的次数是80次,“保养”出现的次数是80次
……
统计得到第二视频子集中总共包括:1000个分词,这1000个分词可以包括重复的分词,其中,“技巧”出现的次数是60次,“展销”出现的次数是400次,“保养”出现的次数是300次
……
基于此,假设某视频的标题是“丰田普拉多的展销会”,经过分词之后,确定“展销”在第一视频子集中的出现频次是80次,在第二视频子集中的出现频次是400次,那么电子设备可以计算“展销”在第二视频子集中的出现频次与在第一视频子集中的出现频次的差值,得到该差值是320次;若该差值大于预设阈值,则确定“展销”为关键词。
86.可选地,由于视频标题经过分词之后可能会包括一些无意义分词,如“这样”、“自己”、“今天”等,因此,在本技术中,可以通过人工方式删除这些无意义分词,换句话讲,即使根据上述方法确定某无意义分词属于关键词,也可以通过人工方式将这些无意义分词从关键词集中删除。
87.可选地,在电子设备得到关键词集之后,若测试视频的标题包括该关键词集中的至少一个关键词,则确定该测试视频对于视频标签生成任务是重要的。或者,电子设备可以获取视频标签生成任务对应的历史标签集;根据关键词集和历史标签集确定测试视频对于视频标签生成任务的重要性。
88.可选地,该历史标签集可以是其他视频在视频标签生成任务下的标签,例如:假设视频标签生成任务是在汽车垂类下,生成汽车款式标签的任务,历史标签集包括:捷达、凯美瑞、丰田、宝马等。
89.可选地,若测试视频的标题包括关键词集中的至少一个关键词,且包括历史标签集中的至少一个历史标签,则电子设备可以确定测试视频对于视频标签生成任务重要;否则,则确定测试视频对于视频标签生成任务不重要,例如:若测试视频的标题仅包括关键词集中的至少一个关键词,而不包括历史标签集中的至少一个历史标签,则确定测试视频对于视频标签生成任务不重要。又或者,若测试视频的标题不包括关键词集中的至少一个关键词,而仅包括历史标签集中的至少一个历史标签,则确定测试视频对于视频标签生成任务不重要。再或者,若测试视频的标题不包括关键词集中的至少一个关键词,且不包括历史标签集中的至少一个历史标签,则确定测试视频对于视频标签生成任务不重要。
90.示例性地,假设测试视频的标题包括关键词“展销”以及历史标签集中的“丰田”,电子设备可以确定测试视频对于视频标签生成任务重要。假设测试视频的标题包括关键词“展销”,但是不包括历史标签集中的任意标签,电子设备可以确定测试视频对于视频标签生成任务不重要。
91.可实现方式二,如图4所示,s250包括:
92.s2501b:根据第一视频子集和第二视频子集确定视频标题集中各个标题的类别;
93.s2502b:对视频标题集中各个标题进行分词处理,得到各个标题对应的至少一个分词;
94.s2503b:通过各个标题对应的至少一个分词和各个标题的类别训练文本分类模型;
95.s2504b:对测试视频的标题进行分词,得到测试视频的标题对应的至少一个分词;
96.s2505b:将测试视频的标题对应的至少一个分词输入文本分类模型,得到测试视频对于视频标签生成任务的重要性。
97.应理解的是,每个标题的类别为重要或者非重要类别。
98.应理解的是,第一视频子集中各个视频的属性对视频标签生成任务不重要,第二视频子集中各个视频的属性对视频标签生成任务重要。那么如果根据第一视频的属性,如一级标签确定该第一视频属于第一视频子集,则确定第一视频的标题类别是非重要类别;如果根据第二视频的属性,如一级标签确定第二视频属于第二视频子集,则确定第二视频的标题类别是重要类别。基于此,电子设备建立了视频标题集中各个标题与标题类别之间的映射关系。
99.可选地,电子设备可以采用开源的python开源库jieba或qqseg将一个视频标题分割为至少一个分词,例如:将“我来到北京清华大学“分割为“我”、“来到”、“北京”、“清华大学”。也可以采用其他分词方式对视频标题进行分词处理,本技术对分词方式不做限制。
100.可选地,电子设备可以基于任一文本分类模型及中所定义的类别标注,对视频标题集中的各个标题训练重要或非重要类别的二分类模型。
101.可选地,文本分类模型可以是双向编码表征(bidirectional encoder representations from transformers,bert)、基于卷积神经网络的文本分类textcnn、textrcnn等,本技术对此不做限制。
102.可选地,文本分类模型可以是深度学习模型、支持向量机(support vector machine,svm)或决策树等其他机器学习模型,本技术对此不做限制。
103.应理解的是,文本分类模型的输入是至少一个分词,输出是二分类结果,例如:测试视频的标题是重要类型的概率和非重要类型的概率。
104.可选地,若该测试视频的标题是非重要类型的概率大于第一预设概率,则确定测试视频对于视频标签生成任务不重要,若该测试视频的标题是重要类型的概率大于第二预设概率,则确定测试视频对于视频标签生成任务重要。或者,若该测试视频的标题是非重要类型的概率小于或等于第三预设概率,则确定测试视频对于视频标签生成任务重要,若该测试视频的标题是重要类型的概率小于或等于第四预设概率,则确定测试视频对于视频标签生成任务不重要。
105.可选地,第一预设概率、第二预设概率、第三预设概率和第四预设概率可以是预定义的,或者是电子设备配置的,本技术对此不做限制。
106.可选地,第一预设阈值的取值可以是80%、90%等,本技术对此不做限制。
107.可选地,第二预设阈值的取值可以是80%、90%等,本技术对此不做限制。
108.可选地,第三预设阈值的取值可以是20%、30%等,本技术对此不做限制。
109.可选地,第四预设阈值的取值可以是20%、30%等,本技术对此不做限制。
110.需要说明的是,电子设备除了根据第一视频子集、第二视频子集和视频标题集确定测试视频对于视频标签生成任务的重要性,还可以直接根据测试视频的一级标签来确定测试视频对于视频标签生成任务的重要性,例如:如果测试视频的一级标签是重要的,则确定测试视频对于视频标签生成任务重要。如果测试视频的一级标签是非重要的,则确定测试视频对于视频标签生成任务不重要。
111.可选地,在本技术中,可以采用人工标注方式来对测试视频的一级标签的重要性进行标注,但不限于此。
112.综上,本技术提供了确定测试视频对于视频标签生成任务的重要性的若干可实现方式,进一步地,电子设备可以根据测试视频对于视频标签生成任务是否重要来确定是否针对测试视频执行视频标签生成任务。换句话讲,假设某视频对于该视频标签生成任务不重要,那么电子设备无需为该视频生成该视频标签生成任务下的标签,后续在视频推荐、视频检索、视频广告投放时,也不会推荐、检索或者投放该视频,从而可以提高视频推荐、视频检索、视频广告投放等的准确度,进而可以提高用户体验感。
113.图5为本技术实施例提供的一种视频处理方法的流程图,该方法可以由台式电脑、笔记本电脑、平板、云服务器等电子设备执行,该方法包括:
114.s510:获取视频标签生成任务和至少一个视频;
115.s520:确定每个视频对于视频标签生成任务的重要性;
116.s530:根据每个视频对于视频标签生成任务的重要性确定是否针对每个视频执行视频标签生成任务;
117.s540:对至少一个视频中需要执行视频标签生成任务的视频,生成该视频对应的标签,对至少一个视频中无需执行视频标签生成任务的视频,无需生成该视频对应的标签;
118.s550:根据至少一个视频的标签结果,对至少一个视频进行处理。
119.应理解的是,图5所示的实施例是基于图1实施例基础上实现的,实际上,视频处理方法还可以基于上述任一视频标签生成方法实现,本技术对此不做限制。
120.应理解的是,关于s510至s530的解释说明可参见图1对应的实施例,本技术对此不再赘述。此外,本技术对电子设备生成视频标签的方式不做限制。
121.可选地,对于至少一个视频中的任一个视频,电子设备可以对该视频进行推荐、检索、投放等处理,本技术对此不做限制。
122.下面通过若干示例对视频处理方法进行说明:
123.示例一:假设视频1展示的是侧方停车技巧,视频2展示的是警车整齐划一的风采,视频3展示的是丰田普拉多展销会,通过上述视频标签生成方式,确定对于在汽车垂类下,生成汽车款式标签的任务,视频1和视频2是非重要视频,视频3是重要视频,这时电子设备可以不为视频1和视频2打标签,但是为视频3打上标签“丰田普拉多”,当电子设备确定某用户对丰田普拉多感兴趣,则可以向该用户推荐带有标签“丰田普拉多”的视频。
124.示例二:假设视频1展示的是侧方停车技巧,视频2展示的是警车整齐划一的风采,视频3展示的是丰田普拉多展销会,通过上述视频标签生成方式,确定对于在汽车垂类下,生成汽车款式标签的任务,视频1和视频2是非重要视频,视频3是重要视频,这时电子设备可以不为视频1和视频2打标签,但是为视频3打上标签“丰田普拉多”,当某用户搜索丰田普拉多时,电子设备可以呈现带有标签“丰田普拉多”的视频的搜索结果。
125.示例三:假设视频1展示的是侧方停车技巧,视频2展示的是警车整齐划一的风采,视频3展示的是丰田普拉多展销会,通过上述视频标签生成方式,确定对于在汽车垂类下,生成汽车款式标签的任务,视频1和视频2是非重要视频,视频3是重要视频,这时电子设备可以不为视频1和视频2打标签,但是为视频3打上标签“丰田普拉多”,当某用户对丰田普拉多感兴趣时,电子设备可以向该用户定向投放带有标签“丰田普拉多”的视频广告。
126.图6为本技术实施例提供的一种视频标签生成装置600的示意图,该装置600包括:第一获取模块610、第一确定模块620和第二确定模块630,其中,第一获取模块610用于获取视频标签生成任务和测试视频;第一确定模块620用于确定测试视频对于视频标签生成任务的重要性;第二确定模块630用于根据测试视频对于视频标签生成任务的重要性确定是否针对测试视频执行视频标签生成任务。
127.可选地,该装置600还包括:第二获取模块640、第三获取模块650、划分模块660,其中,第二获取模块640用于获取视频训练集和视频标题集;视频标题集由视频训练集中各个视频的标题组成;第三获取模块650用于获取视频训练集中各个视频的属性;划分模块660用于根据视频训练集中各个视频的属性和视频标签生成任务将视频训练集划分为第一视频子集和第二视频子集;第一视频子集中各个视频的属性对视频标签生成任务不重要,第二视频子集中各个视频的属性对视频标签生成任务重要;相应的,第一确定模块620具体用于:根据第一视频子集、第二视频子集和视频标题集确定测试视频对于视频标签生成任务的重要性。
128.可选地,第一确定模块620具体用于:对视频标题集中的各个标题进行分词处理,得到各个标题对应的至少一个分词;判断每个分词在第一视频子集和第二视频子集中的出现概率;根据每个分词在第一视频子集和第二视频子集中的出现概率确定关键词集;根据关键词集确定测试视频对于视频标签生成任务的重要性。
129.可选地,第一确定模块620具体用于:计算至少一个分词中的目标分词在第二视频子集中的出现概率与在第一视频子集中的出现概率的差值;若差值大于预设阈值,则确定目标分词为关键词;其中,至少一个分词中各个分词对应的关键词构成关键词集。
130.可选地,该装置600还包括:第四获取模块670,用于获取视频标签生成任务对应的历史标签集;相应的,第一确定模块620具体用于:根据关键词集和历史标签集确定测试视频对于视频标签生成任务的重要性。
131.可选地,第一确定模块620具体用于:若测试视频的标题包括关键词集中的至少一个关键词,且包括历史标签集中的至少一个历史标签,则确定测试视频对于视频标签生成任务重要;否则,则确定测试视频对于视频标签生成任务不重要。
132.可选地,第一确定模块620具体用于:根据第一视频子集和第二视频子集确定视频标题集中各个标题的类别;每个标题的类别为重要或者非重要类别;对视频标题集中各个标题进行分词处理,得到各个标题对应的至少一个分词;通过各个标题对应的至少一个分词和各个标题的类别训练文本分类模型;对测试视频的标题进行分词,得到测试视频的标题对应的至少一个分词;将测试视频的标题对应的至少一个分词输入文本分类模型,得到测试视频对于视频标签生成任务的重要性。
133.可选地,第一确定模块620具体用于:若第一视频属于第一视频子集,则确定第一视频的标题类别是非重要类别;若第二视频属于第二视频子集,则确定第二视频的标题类别是重要类别。
134.可选地,第二确定模块630具体用于:若测试视频对于视频标签生成任务重要,则确定针对测试视频执行视频标签生成任务;若测试视频对于视频标签生成任务不重要,则确定针对测试视频不执行视频标签生成任务。
135.可选地,每个视频的属性为以下任一项:该视频的第n级标签、类型、时长,n为正整
数。
136.应理解的是,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图6所示的装置600可以执行图1至图4对应的方法实施例,并且装置600中的各个模块的前述和其它操作和/或功能分别为了实现图1至图4中的各个方法中的相应流程,为了简洁,在此不再赘述。
137.上文中结合附图从功能模块的角度描述了本技术实施例的装置600。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本技术实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本技术实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。可选地,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
138.图7为本技术实施例提供的一种视频处理装置700的示意图,该装置700包括:获取模块710、第一处理模块720和第二处理模块730,其中,获取模块710用于获取至少一个视频;第一处理模块720用于上述视频标签生成方法确定是否针对每个视频执行视频标签生成任务;第二处理模块730用于根据至少一个视频的标签结果,对至少一个视频进行处理。
139.应理解的是,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图7所示的装置700可以执行图5对应的方法实施例,并且装置700中的各个模块的前述和其它操作和/或功能分别为了实现图5中的各个方法中的相应流程,为了简洁,在此不再赘述。
140.上文中结合附图从功能模块的角度描述了本技术实施例的装置700。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本技术实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本技术实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。可选地,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
141.图8是本技术实施例提供的电子设备的示意性框图。
142.如图8所示,该电子设备可包括:
143.存储器810和处理器820,该存储器810用于存储计算机程序,并将该程序代码传输给该处理器820。换言之,该处理器820可以从存储器810中调用并运行计算机程序,以实现本技术实施例中的方法。
144.例如,该处理器820可用于根据该计算机程序中的指令执行上述方法实施例。
145.在本技术的一些实施例中,该处理器820可以包括但不限于:
146.通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等等。
147.在本技术的一些实施例中,该存储器810包括但不限于:
148.易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。
149.在本技术的一些实施例中,该计算机程序可以被分割成一个或多个模块,该一个或者多个模块被存储在该存储器810中,并由该处理器820执行,以完成本技术提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序在该电子设备中的执行过程。
150.如图8所示,该电子设备还可包括:
151.收发器830,该收发器830可连接至该处理器820或存储器810。
152.其中,处理器820可以控制该收发器830与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器830可以包括发射机和接收机。收发器830还可以进一步包括天线,天线的数量可以为一个或多个。
153.应当理解,该电子设备中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
154.本技术还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本技术实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
155.当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本技术实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,dvd))、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
156.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
157.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
158.作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
159.以上该,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以该权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1