数字人视频的生成方法、装置、电子设备和存储介质与流程

文档序号：35004024发布日期：2023-08-04 02:31阅读：18来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本申请涉及计算机，更具体地，涉及一种数字人视频的生成方法、装置、电子设备和存储介质。

背景技术：

1、随着人工智能技术的不断发展，很多企业或机构为提升服务质量以及客户体验，采用数字人视频进行服务。

2、现有技术中，通过采集大量的数据(如不同姿态、语音等数据)，进行联合训练，从而得到数字人生成模型，再通过语音驱动，表情驱动等方法制作数字人视频，这种方式一般耗时较长，造成数字人视频的生成效率低。

3、因此，如何提高数字人视频的生成效率，是目前有待解决的技术问题。

4、需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、本申请实施例提出了一种数字人视频的生成方法、装置、电子设备和存储介质，用以提高数字人视频的生成效率。

2、第一方面，提供一种数字人视频的生成方法，所述方法包括：获取待播报的目标文本，根据所述目标文本生成目标音频；根据所述目标音频生成唇部动作参数；从真实人脸播报所述目标文本的视频中获取真实人脸图像，根据所述真实人脸图像的形象描述参数生成目标数字人的形象图像；根据所述目标音频、所述唇部动作参数和所述形象图像生成所述目标数字人播报所述目标文本的数字人视频。

3、第二方面，提供一种数字人视频的生成装置，所述装置包括：第一生成模块，用于获取待播报的目标文本，根据所述目标文本生成目标音频；第二生成模块，用于根据所述目标音频生成唇部动作参数；第三生成模块，用于从真实人脸播报所述目标文本的视频中获取真实人脸图像，根据所述真实人脸图像的形象描述参数生成目标数字人的形象图像；第四生成模块，用于根据所述目标音频、所述唇部动作参数和所述形象图像生成所述目标数字人播报所述目标文本的数字人视频。

4、第三方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行第一方面所述的数字人视频的生成方法。

5、第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的数字人视频的生成方法。

6、通过应用以上技术方案，获取待播报的目标文本，根据所述目标文本生成目标音频；根据所述目标音频生成唇部动作参数；从真实人脸播报所述目标文本的视频中获取真实人脸图像，根据所述真实人脸图像的形象描述参数生成目标数字人的形象图像；根据所述目标音频、所述唇部动作参数和所述形象图像生成所述目标数字人播报所述目标文本的数字人视频，无需花费大量时间训练数字人生成模型，只需根据待播报的文本和真实人脸的播报该文本的视频即可快速生成相应的数字人播报视频，从而提高了数字人视频的生成效率。

技术特征：

1.一种数字人视频的生成方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述根据所述目标音频、所述唇部动作参数和所述形象图像生成所述目标数字人播报所述目标文本的数字人视频，包括：

3.如权利要求2所述的方法，其特征在于，在将所述唇部动作视频与所述目标音频进行融合，得到所述数字人视频之前，所述方法还包括：

4.如权利要求1所述的方法，其特征在于，所述根据所述真实人脸图像的形象描述参数生成目标数字人的形象图像，包括：

5.如权利要求1所述的方法，其特征在于，所述根据所述目标音频生成唇部动作参数，包括：

6.如权利要求5所述的方法，其特征在于，所述根据所述预设中性面部中的预设唇部关键点和所述唇部动作序列生成所述唇部动作参数，包括：

7.如权利要求1所述的方法，其特征在于，所述根据所述目标文本生成目标音频，包括：

8.一种数字人视频的生成装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1～7中任意一项所述的数字人视频的生成方法。

技术总结
本发明公开了一种数字人视频的生成方法、装置、电子设备和存储介质，该方法包括：获取待播报的目标文本，根据所述目标文本生成目标音频；根据所述目标音频生成唇部动作参数；从真实人脸播报所述目标文本的视频中获取真实人脸图像，根据所述真实人脸图像的形象描述参数生成目标数字人的形象图像；根据所述目标音频、所述唇部动作参数和所述形象图像生成所述目标数字人播报所述目标文本的数字人视频，无需花费大量时间训练数字人生成模型，只需根据待播报的文本和真实人脸的播报该文本的视频即可快速生成相应的数字人播报视频，从而提高了数字人视频的生成效率。

技术研发人员：程平,吴松城
受保护的技术使用者：厦门黑镜科技有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程平吴松城
技术所有人：厦门黑镜科技有限公司
我是此专利的发明人

上一篇：一种建筑用穿墙眼砂浆封堵设备的制作方法
上一篇：一种具有塑胶外壳的超声骨刀驱动柄的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。