1.一种在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,包括:
2.根据权利要求1所述的在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,所述步骤1包括:
3.根据权利要求2所述的在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,将下载的cmlr中文数据集进行超分处理,得到预设分辨率的视频,包括:
4.根据权利要求2所述的在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,对超分处理后的cmlr中文数据集进行音视频合成,包括:
5.根据权利要求2所述的在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,基于音视频合成后的cmlr中文数据集生成图像序列,并对人脸下半张脸进行关键点检测,得到图像序列中所有下半张脸的点位的最大值和最小值,包括:
6.根据权利要求1-5中任一项所述的在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,所述步骤2包括:
7.根据权利要求1-6中任一项所述的在数字人领域驱动中文语音精准生成唇形视频的方法,其特征在于,所述步骤3中将预处理后的视频帧输入到新的模型进行唇部推理,包括:
8.一种在数字人领域驱动中文语音精准生成唇形视频的装置,其特征在于,包括:
9.一种在数字人领域驱动中文语音精准生成唇形视频的设备,其特征在于,包括:处理器和存储器,所述存储器中存储有可执行的程序指令,所述处理器调用所述存储器中的程序指令时,所述处理器用于:
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7任一项所述的在数字人领域驱动中文语音精准生成唇形视频的方法的步骤。