数字人物形象的生成方法、装置、电子设备及存储介质与流程

文档序号：33943472发布日期：2023-04-26 03:21阅读：37来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及数字人，尤其涉及一种数字人物形象的生成方法、装置、电子设备及计算机可读存储介质。

背景技术：

1、数字人物形象生成算法的一个重要的应用场景为完成数字人物的语音播报，其中，采用的ai(artificial intelligence，人工智能)算法自动生成能够说话的数字人物形象，并且形成连续的口型正确的视频。

2、在上述的方案中，为了增强虚拟数字人物的表现力，通常在语音播报的视频中随机地加入眨眼、歪头等动作，以使虚拟数字人物的形象更加真实。但是数字人物仍缺乏情感上的表现力，导致数字人物形象较为呆板，缺乏真实感。

技术实现思路

1、本发明所要解决的技术问题是针对现有技术的上述不足，提供一种数字人物形象的生成方法、装置、电子设备及计算机可读存储介质，以至少解决相关技术中存在的数字人物形象较为呆板，缺乏真实感的问题。

2、第一方面，本发明提供一种数字人物形象的生成方法，包括：获取数字人物目标情感的综合得分序列；将目标情感的综合得分序列生成生成对抗网络gan隐空间矢量；基于gan隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到数字人物形象。

3、优选地，所述获取数字人物目标情感的综合得分序列，具体包括：获取数字人物播报文本对应的目标情感的得分，并获取数字人物播报语音对应的目标情感的得分；比对播报文本对应的目标情感的得分和播报语音对应的目标情感的得分，并基于插值模型算法，计算目标情感的综合得分；将目标情感的综合得分生成目标情感的综合得分序列。

4、优选地，所述获取数字人物播报文本对应的目标情感的得分，具体包括：获取数字人物播报文本；采用文本情感分析模型计算数字人物播报文本对应的目标情感的得分。

5、优选地，所述获取数字人物播报语音对应的目标情感的得分，具体包括：获取数字人物播报语音；采用语音情感分析模型计算数字人物播报语音对应的目标情感的得分。

6、优选地，在所述计算目标情感的综合得分之后，以及在所述将目标情感的综合得分生成目标情感的综合得分序列之前，所述方法还包括：生成播报文本对应的目标情感的得分序列，以使文本情感分析模型根据播报文本对应的目标情感的得分序列更新文本情感分析模型的参数；生成播报语音对应的目标情感的得分序列，以使语音情感分析模型根据播报语音对应的目标情感的得分序列更新语音情感分析模型的参数；获取更新后的文本情感分析模型和语音情感分析模型分别计算的目标情感的得分，并更新目标情感的综合得分。

7、优选地，目标情感包括以下至少之一：微笑、紧张、愤怒、无奈、担忧。

8、优选地，所述将目标情感的综合得分序列生成gan隐空间矢量，具体包括：针对每个目标情感的综合得分序列，采用n个通道计算方式分别生成相应的隐空间矢量，n为大于2的正整数；对n个通道进行评判评分，以选择出评分排序靠前的m个通道，m为小于n且大于1的正整数；对选择出的m个通道的隐空间矢量加权平均，以得到每个目标情感的gan隐空间矢量。

9、第二方面，本发明还提供一种数字人物形象的生成装置，包括：获取模块，用于获取数字人物目标情感的综合得分序列。生成模块，与获取模块连接，用于将目标情感的综合得分序列生成gan隐空间矢量。合成模块，与生成模块连接，用于基于gan隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到数字人物形象。

10、优选地，获取模块包括第一获取单元、第一计算单元和第一生成单元。

11、第一获取单元，用于获取数字人物播报文本对应的目标情感的得分，并获取数字人物播报语音对应的目标情感的得分。

12、第一计算单元，与第一获取单元连接，用于比对播报文本对应的目标情感的得分和播报语音对应的目标情感的得分，并基于插值模型算法，计算目标情感的综合得分。

13、第一生成单元，与第一计算单元连接，用于将目标情感的综合得分生成目标情感的综合得分序列。

14、优选地，目标情感包括以下至少之一：微笑、紧张、愤怒、无奈、担忧。生成模块包括第二生成单元、选择单元和第二计算单元。

15、第二生成单元，用于针对每个目标情感的综合得分序列，采用n个通道计算方式分别生成相应的隐空间矢量，n为大于2的正整数。

16、选择单元，与第二生成单元连接，用于对n个通道进行评判评分，以选择出评分排序靠前的m个通道，m为小于n且大于1的正整数。

17、第二计算单元，与选择单元连接，用于对选择出的m个通道的隐空间矢量加权平均，以得到每个目标情感的gan隐空间矢量。

18、第三方面，本发明还提供一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以实现如第一方面所述的数字人物形象的生成方法。

19、第四方面，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如第一方面所述的数字人物形象的生成方法。

20、本发明提供的数字人物形象的生成方法、装置、电子设备及计算机可读存储介质，通过获取数字人物需要表现的目标情感的综合得分序列，并将目标情感的综合得分序列生成gan隐空间矢量，基于gan隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到真实表现目标情感的数字人物形象。由于获取的是目标情感的综合得分，使得目标情感数据更为准确，从而使得数字人物形象更加真实。

技术特征：

1.一种数字人物形象的生成方法，其特征在于，包括：

2.根据权利要求1所述的数字人物形象的生成方法，其特征在于，所述获取数字人物目标情感的综合得分序列，具体包括：

3.根据权利要求2所述的数字人物形象的生成方法，其特征在于，所述获取数字人物播报文本对应的目标情感的得分，具体包括：

4.根据权利要求3所述的数字人物形象的生成方法，其特征在于，在所述计算目标情感的综合得分之后，以及在所述将目标情感的综合得分生成目标情感的综合得分序列之前，还包括：

5.根据权利要求1所述的数字人物形象的生成方法，其特征在于，目标情感包括以下至少之一：微笑、紧张、愤怒、无奈、担忧，

6.一种数字人物形象的生成装置，其特征在于，包括：

7.根据权利要求6所述的数字人物形象的生成装置，其特征在于，获取模块包括第一获取单元、第一计算单元和第一生成单元，

8.根据权利要求6所述的数字人物形象的生成装置，其特征在于，目标情感包括以下至少之一：微笑、紧张、愤怒、无奈、担忧，

9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以实现如权利要求1-5任一项所述的数字人物形象的生成方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-5任一项所述的数字人物形象的生成方法。

技术总结
本发明提供一种数字人物形象的生成方法、装置、电子设备及计算机可读存储介质，涉及数字人技术领域。所述方法包括：获取数字人物目标情感的综合得分序列；将目标情感的综合得分序列生成生成对抗网络GAN隐空间矢量；基于GAN隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到数字人物形象。以至少解决相关技术中存在的数字人物形象较为呆板，缺乏真实感的问题。适应于数字人物合成、情感分析等场景。

技术研发人员：周广,吴浩然
受保护的技术使用者：中国联合网络通信集团有限公司
技术研发日：
技术公布日：2024/1/11

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周广吴浩然
技术所有人：中国联合网络通信集团有限公司
我是此专利的发明人

上一篇：一种折叠翼解锁装置及系统的制作方法
上一篇：一种防堵塞的研磨机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。