视频数据生成方法、装置、计算机设备和存储介质与流程

文档序号：37272704发布日期：2024-03-12 21:03阅读：14来源：国知局

本技术涉及人工智能，特别是涉及一种视频数据生成方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、银行网点、金库等金融机构的线下场所常有视频分析的需求，但是目前关于金融机构线下场景的公开数据集较少，视频数据多样性不足，例如关于双录签字动作的视频数据集。使用数据量少、数据多样性低的金融场景视频数据集，对基于数据驱动的人工智能模型进行训练，容易因学习到的样本量不足而造成模型性能较差、准确率较低。

2、传统技术中，常通过在线下场景增设摄像头的方式来增加视频数据集。但是，这种在线下场景增设摄像头的方式，能够采集到的视频类型有限，并且视频中还经常夹在有业务场景无关的视频内容，有效的视频量较少，采集视频数据的效率仍然不高。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高金融行业线下场景视频数据生成效率的视频数据生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本技术提供了一种视频数据生成方法。所述方法包括：

3、获取与目标视频类型匹配的视频文本；

4、将所述视频文本，输入至所述目标视频类型对应的图像生成模型中，得到所述视频文本对应的图像数据；

5、对所述图像数据进行风格迁移处理，得到所述图像数据的处理后图像；

6、对所述处理后图像进行视频生成处理，得到所述目标视频类型对应的视频数据。

7、在其中一个实施例中，目标视频类型对应的图像生成模型通过如下方式训练得到：

8、获取所述目标视频类型的样本图像数据以及所述样本图像数据的标注文本；

9、将所述标注文本，输入至待训练的图像生成模型中，得到所述标注文本对应的预测图像数据；

10、根据所述预测图像数据与所述样本图像数据之间的差异，对所述待训练的图像生成模型进行迭代更新，得到所述目标视频类型对应的图像生成模型。

11、在其中一个实施例中，获取所述目标视频类型的样本图像数据以及所述样本图像数据的标注文本，包括：

12、获取所述目标视频类型的历史视频数据；

13、对所述历史视频数据进行图像提取处理，得到所述样本图像数据；

14、对所述样本图像数据进行文本标注处理，得到所述样本图像数据的标注文本。

15、在其中一个实施例中，对所述样本图像数据进行文本标注处理，得到所述样本图像数据的标注文本，包括：

16、对所述样本图像数据进行目标检测处理，得到所述样本图像数据中的客户位置信息和客服位置信息；

17、根据所述客户位置信息，对所述样本图像数据中的客户进行文本标注处理，得到客户标注信息；

18、根据所述客服位置信息，对所述样本图像数据中的客服进行文本标注处理，得到客服标注信息；

19、根据所述客户标注信息和所述客服标注信息，得到所述样本图像数据的标注文本。

20、在其中一个实施例中，对所述图像数据进行风格迁移处理，得到所述图像数据的处理后图像，包括：

21、获取所述图像数据的待处理的图像风格信息；

22、将所述图像数据、所述图像风格信息，输入至风格迁移模型中，得到所述图像数据与所述图像风格信息对应的处理后图像。

23、在其中一个实施例中，对所述处理后图像进行视频生成处理，得到所述目标视频类型对应的视频数据，包括：

24、获取预先训练的视频生成模型；

25、将所述处理后图像和所述目标视频类型，输入至所述预先训练的视频生成模型中，得到所述目标视频类型对应的视频数据。

26、在其中一个实施例中，将所述处理后图像和所述目标视频类型，输入至所述预先训练的视频生成模型中，得到所述目标视频类型对应的视频数据，包括：

27、对所述处理后图像进行潜空间映射处理，得到所述处理后图像的潜在特征；

28、将所述潜在特征和所述目标视频类型设为所述预先训练的视频生成模型的约束条件；

29、基于所述约束条件，通过所述预先训练的视频生成模型对所述处理后图像进行处理，得到所述目标视频类型对应的视频数据。

30、第二方面，本技术还提供了一种视频数据生成装置。所述装置包括：

31、文本获取模块，用于获取与目标视频类型匹配的视频文本；

32、图像生成模块，用于将所述视频文本，输入至所述目标视频类型对应的图像生成模型中，得到所述视频文本对应的图像数据；

33、风格迁移模块，用于对所述图像数据进行风格迁移处理，得到所述图像数据的处理后图像；

34、视频生成模块，用于对所述处理后图像进行视频生成处理，得到所述目标视频类型对应的视频数据。

35、第三方面，本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

36、获取与目标视频类型匹配的视频文本；

37、将所述视频文本，输入至所述目标视频类型对应的图像生成模型中，得到所述视频文本对应的图像数据；

38、对所述图像数据进行风格迁移处理，得到所述图像数据的处理后图像；

39、对所述处理后图像进行视频生成处理，得到所述目标视频类型对应的视频数据。

40、第四方面，本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

41、获取与目标视频类型匹配的视频文本；

42、将所述视频文本，输入至所述目标视频类型对应的图像生成模型中，得到所述视频文本对应的图像数据；

43、对所述图像数据进行风格迁移处理，得到所述图像数据的处理后图像；

44、对所述处理后图像进行视频生成处理，得到所述目标视频类型对应的视频数据。

45、第五方面，本技术还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

46、获取与目标视频类型匹配的视频文本；

47、将所述视频文本，输入至所述目标视频类型对应的图像生成模型中，得到所述视频文本对应的图像数据；

48、对所述图像数据进行风格迁移处理，得到所述图像数据的处理后图像；

49、对所述处理后图像进行视频生成处理，得到所述目标视频类型对应的视频数据。

50、上述视频数据生成方法、装置、计算机设备、存储介质和计算机程序产品，获取与目标视频类型匹配的视频文本；将视频文本，输入至目标视频类型对应的图像生成模型中，得到视频文本对应的图像数据；对图像数据进行风格迁移处理，得到图像数据的处理后图像；对处理后图像进行视频生成处理，得到目标视频类型对应的视频数据。采用本方法，利用文本生成图像、风格迁移、条件图像到视频等技术，实现了通过目标视频类型的视频文本即可生成对应的视频数据，提高了视频数据的生成效率，为金融行业线下场景的视频分析模型提供了可靠的数据。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高伟,施好健,钟春彬,蔡为彬
技术所有人：中国工商银行股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。