本技术涉及人工智能,特别是涉及一种视频数据生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、银行网点、金库等金融机构的线下场所常有视频分析的需求,但是目前关于金融机构线下场景的公开数据集较少,视频数据多样性不足,例如关于双录签字动作的视频数据集。使用数据量少、数据多样性低的金融场景视频数据集,对基于数据驱动的人工智能模型进行训练,容易因学习到的样本量不足而造成模型性能较差、准确率较低。
2、传统技术中,常通过在线下场景增设摄像头的方式来增加视频数据集。但是,这种在线下场景增设摄像头的方式,能够采集到的视频类型有限,并且视频中还经常夹在有业务场景无关的视频内容,有效的视频量较少,采集视频数据的效率仍然不高。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高金融行业线下场景视频数据生成效率的视频数据生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种视频数据生成方法。所述方法包括:
3、获取与目标视频类型匹配的视频文本;
4、将所述视频文本,输入至所述目标视频类型对应的图像生成模型中,得到所述视频文本对应的图像数据;
5、对所述图像数据进行风格迁移处理,得到所述图像数据的处理后图像;
6、对所述处理后图像进行视频生成处理,得到所述目标视频类型对应的视频数据。
7、在其中一个实施例中,目标视频类型对应的图像生成模型通过如下方式训练得到:
8、获取所述目标视频类型的样本图像数据以及所述样本图像数据的标注文本;
9、将所述标注文本,输入至待训练的图像生成模型中,得到所述标注文本对应的预测图像数据;
10、根据所述预测图像数据与所述样本图像数据之间的差异,对所述待训练的图像生成模型进行迭代更新,得到所述目标视频类型对应的图像生成模型。
11、在其中一个实施例中,获取所述目标视频类型的样本图像数据以及所述样本图像数据的标注文本,包括:
12、获取所述目标视频类型的历史视频数据;
13、对所述历史视频数据进行图像提取处理,得到所述样本图像数据;
14、对所述样本图像数据进行文本标注处理,得到所述样本图像数据的标注文本。
15、在其中一个实施例中,对所述样本图像数据进行文本标注处理,得到所述样本图像数据的标注文本,包括:
16、对所述样本图像数据进行目标检测处理,得到所述样本图像数据中的客户位置信息和客服位置信息;
17、根据所述客户位置信息,对所述样本图像数据中的客户进行文本标注处理,得到客户标注信息;
18、根据所述客服位置信息,对所述样本图像数据中的客服进行文本标注处理,得到客服标注信息;
19、根据所述客户标注信息和所述客服标注信息,得到所述样本图像数据的标注文本。
20、在其中一个实施例中,对所述图像数据进行风格迁移处理,得到所述图像数据的处理后图像,包括:
21、获取所述图像数据的待处理的图像风格信息;
22、将所述图像数据、所述图像风格信息,输入至风格迁移模型中,得到所述图像数据与所述图像风格信息对应的处理后图像。
23、在其中一个实施例中,对所述处理后图像进行视频生成处理,得到所述目标视频类型对应的视频数据,包括:
24、获取预先训练的视频生成模型;
25、将所述处理后图像和所述目标视频类型,输入至所述预先训练的视频生成模型中,得到所述目标视频类型对应的视频数据。
26、在其中一个实施例中,将所述处理后图像和所述目标视频类型,输入至所述预先训练的视频生成模型中,得到所述目标视频类型对应的视频数据,包括:
27、对所述处理后图像进行潜空间映射处理,得到所述处理后图像的潜在特征;
28、将所述潜在特征和所述目标视频类型设为所述预先训练的视频生成模型的约束条件;
29、基于所述约束条件,通过所述预先训练的视频生成模型对所述处理后图像进行处理,得到所述目标视频类型对应的视频数据。
30、第二方面,本技术还提供了一种视频数据生成装置。所述装置包括:
31、文本获取模块,用于获取与目标视频类型匹配的视频文本;
32、图像生成模块,用于将所述视频文本,输入至所述目标视频类型对应的图像生成模型中,得到所述视频文本对应的图像数据;
33、风格迁移模块,用于对所述图像数据进行风格迁移处理,得到所述图像数据的处理后图像;
34、视频生成模块,用于对所述处理后图像进行视频生成处理,得到所述目标视频类型对应的视频数据。
35、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
36、获取与目标视频类型匹配的视频文本;
37、将所述视频文本,输入至所述目标视频类型对应的图像生成模型中,得到所述视频文本对应的图像数据;
38、对所述图像数据进行风格迁移处理,得到所述图像数据的处理后图像;
39、对所述处理后图像进行视频生成处理,得到所述目标视频类型对应的视频数据。
40、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
41、获取与目标视频类型匹配的视频文本;
42、将所述视频文本,输入至所述目标视频类型对应的图像生成模型中,得到所述视频文本对应的图像数据;
43、对所述图像数据进行风格迁移处理,得到所述图像数据的处理后图像;
44、对所述处理后图像进行视频生成处理,得到所述目标视频类型对应的视频数据。
45、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
46、获取与目标视频类型匹配的视频文本;
47、将所述视频文本,输入至所述目标视频类型对应的图像生成模型中,得到所述视频文本对应的图像数据;
48、对所述图像数据进行风格迁移处理,得到所述图像数据的处理后图像;
49、对所述处理后图像进行视频生成处理,得到所述目标视频类型对应的视频数据。
50、上述视频数据生成方法、装置、计算机设备、存储介质和计算机程序产品,获取与目标视频类型匹配的视频文本;将视频文本,输入至目标视频类型对应的图像生成模型中,得到视频文本对应的图像数据;对图像数据进行风格迁移处理,得到图像数据的处理后图像;对处理后图像进行视频生成处理,得到目标视频类型对应的视频数据。采用本方法,利用文本生成图像、风格迁移、条件图像到视频等技术,实现了通过目标视频类型的视频文本即可生成对应的视频数据,提高了视频数据的生成效率,为金融行业线下场景的视频分析模型提供了可靠的数据。