动画生成方法、系统及计算机设备与流程

文档序号:30967868发布日期:2022-07-30 19:21阅读:97来源:国知局
动画生成方法、系统及计算机设备与流程

1.本技术涉及人工智能及动画处理相关技术领域,具体而言,涉及一种动画生成方法、系统及计算机设备。


背景技术:

2.随着计算机技术的不断发展与应用,基于计算机的动画制作或创造在各种场景中得到了广泛的关注与应用。在一些特定的应用场景中,需要根据音乐自动化生成舞蹈动画。例如,在音乐舞蹈类游戏的应用场景中,往往需要根据音乐生成相应的舞蹈动画。
3.发明人对目前常见的基于音乐生成舞蹈动画的一些方案进行研究分析发现,目前的动画生成方法大多存在扩展性差、生成的动画不够自然合理等问题,影响用户的使用体验。


技术实现要素:

4.基于以上内容,为了至少部分的解决上述技术问题,第一方面,本技术实施例提供一种动画生成方法,所述方法包括:
5.将目标音乐切分为至少两个音乐片段;
6.依次将各所述音乐片段输入预先训练得到的音乐识别模型进行音乐特征识别,得到各所述音乐片段的音乐特征信息,所述音乐特征信息包括所述音乐片段的风格信息和节奏信息;
7.根据各所述音乐片段的音乐特征信息从预先建立的动画库中搜索与各所述音乐片段匹配的动画片段;
8.根据与各所述音乐片段匹配的动画片段生成所述目标音乐对应的动画。
9.基于第一方面的一种实施方式,所述方法还包括对预先选定的深度学习模型进行训练得到所述音乐识别模型的步骤,该步骤包括:
10.建立样本音乐库,其中,所述样本音乐库可以包括具有不同风格类型的样本音乐;
11.将所述样本音乐库中的每首样本音乐切分成多个样本音乐片段,并为每个样本音乐片段标注对应的音乐特征信息得到每个样本音乐片段的音乐特征标签,其中,所述样本音乐片段对应的音乐特征信息包括风格信息和节奏信息;
12.使用所述样本音乐库对预先选定的深度学习模型进行训练,得到用于对音乐的音乐特征信息进行识别的音乐识别模型。
13.基于第一方面的一种实施方式,使用所述样本音乐库对预先选定的深度学习模型进行训练,得到用于对音乐的音乐特征信息进行识别的音乐识别模型,包括:
14.依次将各所述样本音乐片段输入至所述深度学习模型中,由该深度学习模型识别得到所述样本音乐片段的音乐特征信息;
15.根据识别得到的所述样本音乐片段的音乐特征信息与所述样本音乐片段的音乐特征标签计算得到所述深度学习模型的损失函数值;
16.根据所述损失函数值对所述深度学习模型的模型参数进行迭代优化,直到满足模型训练终止条件,将训练完成的深度学习模型作为所述音乐识别模型。
17.基于第一方面的一种实施方式,该方法还包括预先建立所述动画库的步骤,该步骤包括:
18.获取分别与所述样本音乐库中的各样本音乐匹配的动画;
19.对各所述动画进行切分,得到多个动画片段,其中,每个动画片段与所述动画对应的样本音乐的样本音乐片段的时长相同;
20.对各所述动画片段进行特征标注,得到各动画片段对应的动画特征信息,其中,所述动画特征信息包括所述动画片段的风格信息和节奏信息;
21.将标注了所述动画特征信息的各个动画片段保存到设定的数据库中,得到所述动画库。
22.基于第一方面的一种实施方式,根据各所述音乐片段的音乐特征信息从预先建立的动画库中搜索与各所述音乐片段匹配的动画片段,包括:
23.针对任意目标音乐片段,根据所述目标音乐片段的风格信息从所述动画库中搜索与所述音乐片段匹配的多个动画片段;
24.根据所述目标音乐片段的节奏信息从所述多个动画片段中搜索与所述目标音乐片段匹配的至少一个候选动画片段;
25.根据所述至少一个候选动画片段的运动信息确定与所述目标音乐片段匹配的目标动画片段,其中,所述运动信息包括用于表征候选动画片段中的目标对象的位置信息、速度信息、旋转速度及角速度信息。
26.基于第一方面的一种实施方式,根据所述至少一个候选动画片段的运动信息确定与所述目标音乐片段匹配的目标动画片段,包括:
27.获取所述目标音乐片段的前一个音乐片段匹配的动画片段的最后预设数量帧的运动信息作为索引;
28.根据该索引从所述至少一个候选动画片段中查找前预设数量帧的运动信息与所述索引距离最接近的其中一个作为与所述目标音乐片段匹配的目标动画片段。
29.基于第一方面的一种实施方式,所述方法还包括:
30.采用b样条插值法对所述目标动画片段进行缩放,使所述目标动画片段与所述目标音乐片段的时长一致。
31.第二方面,本技术实施例还提供一种动画生成系统,应用于计算机设备,所述动画生成系统包括:
32.切分模块,用于将目标音乐切分为至少两个音乐片段;
33.识别模块,用于依次将各所述音乐片段输入预先训练得到的音乐识别模型进行音乐特征识别,得到各所述音乐片段的音乐特征信息,所述音乐特征信息包括所述音乐片段的风格信息和节奏信息;
34.搜索模块,用于根据各所述音乐片段的音乐特征信息从预先建立的动画库中搜索与各所述音乐片段匹配的动画片段;
35.生成模块,用于根据与各所述音乐片段匹配的动画片段生成所述目标音乐对应的动画。
36.基于第二方面的一种实施方式,所述搜索模块具体用于:
37.针对任意目标音乐片段,根据所述目标音乐片段的风格信息从所述动画库中搜索与所述音乐片段匹配的多个动画片段;
38.根据所述目标音乐片段的节奏信息从所述多个动画片段中搜索与所述目标音乐片段匹配的至少一个候选动画片段;
39.根据所述至少一个候选动画片段的运动信息确定与所述目标音乐片段匹配的目标动画片段,其中,所述运动信息包括用于表征候选动画片段中的目标对象的位置信息、速度信息、旋转速度及角速度信息。
40.第三方面,本技术实施例还提供一种计算机设备,包括机器可读存储介质以及一个或多个处理器,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被所述一个或多个处理器执行时,实现上述的动画生成方法。
41.基于本技术实施例的上述内容,相对于现有技术而言,本技术实施例提供的动画生成方法、系统及计算机设备,本技术实施例提供的动画生成方法、系统及计算机设备,通过使用大量的音乐-动画数据集,不采用端到端的音乐-动画生成模型,而是对音乐特征的提取采用深度学习模型(音乐识别模型),对动画的处理采用特征匹配的搜索算法,在搜索过程中可以按照用户的想法进行修正,实现整个动画匹配与生成过程的可控,并且动画可以是从动作库中查找并修正的高质量动画,可以保证输出的动画是无损的。因此,本实施例中的动画生成方法具有较好的扩展性、生成的动画也更自然合理,可提升用户的使用体验。此外,随着动作库规模的逐渐完善和变大,动画生成效果则相应越好。
附图说明
42.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
43.图1是本技术实施例提供的一种动画生成方法的流程示意图。
44.图2是图1中步骤s200的实现流程示意图。
45.图3是图1中步骤s300的实现流程示意图。
46.图4是本实施例提供的对目标音乐进行切分的示意图。
47.图5是本技术实施例提供的对匹配后的动画片段进行缩放的示意图。
48.图6是本技术实施例提供的动画生成系统的功能模块示意图。
49.图7是本技术实施例提供的用于实现上述动画生成方法的计算机设备的示意图。
具体实施方式
50.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
51.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护
的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
52.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
53.在本技术的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
54.在本技术的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
55.基于前述背景技术中所提及的技术问题,本技术发明人发现,目前常见的基于音乐生成舞蹈动画的方式有两种,一种是采用音乐库和动作库,由用户从设定的音乐库中选中一首音乐,然后系统会根据对应关系从动作库中选出相应的舞蹈动画,从而保证音乐和舞蹈动画在时长、风格、节奏等方面的一致性,但该方案必须要求用户播放的音乐包含在音乐库中,音乐库中不存在的音乐则无法匹配到相应的舞蹈动画,并且扩展性差,如果需要增加新的音乐必须同步增加相应的舞蹈动画才行。
56.另一种是采用深度学习方法直接对音乐与动画的关系进行建模,这种方案通常需要采集大量配对的音乐和动画数据,训练深度学习模型,实现音乐输入到模型中输出动画的目的。然而,该方案可解释性和可控性均较差,生成的动画往往不够自然合理,同时也很难人为的操控整个舞蹈动画的生成过程,并且相对于原始的音乐和舞蹈动画,模型并不能达到百分百的拟合,因此输出的动画也是有损的。
57.下面将结合附图对本技术实施例的实施方案进行示例性的介绍。
58.如图1所示,是本技术实施例提供的一种动画生成方法的流程示意图,本实施例中,所述动画生成方法可以由计算机设备执行并实现。应当理解,本实施例提供的动画生成方法所包含的其中部分步骤的顺序在实际实施时可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除,本实施例对此不进行具体限定。
59.下面结合图1对本实施例的动画生成方法的各个步骤通过示例的方式进行详细介绍,详细地,如图1所示,所述方法可以包括下述的步骤s100至步骤s400所述的相关内容。
60.步骤s100,将目标音乐切分为至少两个音乐片段。
61.其中,在本实施例中,可以按照所述目标音乐的节拍或小节切分成一段段的音乐片段,切分的位置可以处于两个最近的节拍点的中间。其中,所述目标音乐可以是一首完整的歌曲或者一段经过处理的歌曲片段。优选地,本实施例中,所述目标音乐具有固定的bpm(每分钟节拍数),进而使得切分出来的各个音乐片段具有相同的时长。作为一种示例,例如图4所示,可以将所述目标音乐以节拍为单位进行切分,也可以将所述目标音乐以小节为单位进行切分,例如每个小节可以包括四个节拍,本实施例对具体的切分方式不进行限定。
62.步骤s200,依次将各所述音乐片段输入预先训练得到的音乐识别模型中进行音乐特征识别,得到各所述音乐片段的音乐特征信息。其中,本实施例中,所述音乐特征信息包
括,但不限于,所述音乐片段的风格信息和节奏信息。
63.在本实施例的一种可能的实现方式中,如图2所示,所述音乐识别模型可以通过下述的步骤s210-s230预先通过机器学习的方式而实现。
64.步骤s210,建立样本音乐库。其中,所述样本音乐库可以包括大量的具有不同风格类型的样本音乐,例如,可以包括摇滚、流行、古典等不同风格类型的样本音乐。
65.步骤s220,将所述样本音乐库中的每首样本音乐切分成多个样本音乐片段,并为每个样本音乐片段标注对应的音乐特征信息得到每个样本音乐片段的音乐特征标签。
66.例如,本实施例中,可以都按照节拍或小节将每首样本音乐切分成一段段的样本音乐片段,切分的位置可以处于两个最近的节拍点的中间。其中,可以采用机器标注的方式,也可以采用人工标注的方式为每个样本音乐片段标注所述音乐特征信息,所述音乐特征信息可以包括,但不限于,对应的样本音乐片段的风格信息和节奏信息,其中风格信息可以采用摇滚、流行、古典等自然词语进行描述,节奏信息可以采用特征向量(例如one-hot的8维向量)进行表示。优选地,本实施例中,每首样本音乐具有固定bpm(每分钟节拍数),使得切分出的各个样本音乐片段的时长是相同的。同时,同一首样本音乐对应的样本音乐片段的风格信息应该是相同的,但节奏信息可以是不同的。
67.步骤s230,使用所述样本音乐库对预先选定的深度学习模型进行训练,得到用于对音乐的音乐特征信息进行识别的音乐识别模型。
68.例如,在一种可能的实现方式中,可以依次将各所述样本音乐片段输入至所述深度学习模型中,由该深度学习模型识别得到所述样本音乐片段的音乐特征信息;然后,根据识别得到的所述样本音乐片段的音乐特征信息与所述样本音乐片段的音乐特征标签计算得到所述深度学习模型的损失函数值;最后,根据所述损失函数值对所述深度学习模型的模型参数进行迭代优化,直到满足模型训练终止条件,将训练完成的深度学习模型作为所述音乐识别模型。其中,所述模型训练终止条件可以是所述损失函数值小于设定阈值,也可以是迭代训练的次数达到设定次数,本实施例对此不进行限定。
69.此外,本实施例中,将各所述样本音乐片段输入至所述深度学习模型中可以是指将各样本音乐片段通过预先确定的音频处理方法进行处理后得到的音频特征(如mfcc特征)输入所述深度学习模型。所述训练过程所使用到的深度学习模型可以采用目前主流的音乐模型,在此不做限制,训练完成后得到的音乐识别模型能够对外部输入的一段音乐(按节拍或小节切分)准确实现音乐特征信息的识别,例如,可以准确的进行风格识别和节奏向量的输出。
70.步骤s300,根据各所述音乐片段的音乐特征信息从预先建立的动画库中搜索得到与各所述音乐片段匹配的动画片段。
71.示例性地,假设一个音乐片段m输入到音乐识别模型后,模型输出所述音乐片段m对应的风格信息和节奏信息。由于每个动画片段也具有风格信息与节奏信息,且风格信息相对节奏信息来说具有更高层的语义,因此可以先查找到风格信息与所述音乐片段m一致的若干动画片段作为候选,如摇滚的音乐通常在摇滚风格的动画片段中查找,然后根据音乐片段m的节奏信息进一步筛选出更匹配的动画片段。其中,可以采用l2距离衡量音乐片段m的节奏信息对应的特征向量与动画片段对应的特征向量之间的特征距离来筛选最匹配所述音乐片段m的目标动画片段,例如可以将l2距离小于某一阈值的多个动画片段作为候选,
然后从候选中选择其中一个所述目标动画片段,也可以直接将l2距离最小的动画片段作为所述目标动画片段。
72.其中,在本实施例的一种可能的实现方式中,所述动画库可以在所述样本音乐库建立的时候一并进行建立。例如,作为一种示例,如图4所示,所述动画库可以通过下述的步骤s310-s340进行建立而得到,下面进行示例性的说明。
73.步骤s310,获取分别与所述样本音乐库中的各样本音乐匹配的动画。
74.其中,所述动画可以是一段完整的舞蹈动作画面,可以采用惯捕设备或光捕设备对身穿录制设备跟随对应的样本音乐进行跳舞的专业舞蹈演员进行动画捕捉而获得,然后,可以将捕捉到的整个舞蹈动作画面经过处理后进行保存。
75.步骤s320,对各所述动画进行切分,得到多个动画片段,其中,每个动画片段与所述动画对应的样本音乐的样本音乐片段的时长相同。
76.步骤s330,对各所述动画片段进行特征标注,得到各动画片段对应的动画特征信息,其中,所述动画特征信息包括所述动画片段的风格信息和节奏信息。其中,所述动画片段的风格信息与其对应的样本音乐片段的风格信息及节奏信息相同。同时,对同一首样本音乐对应的动画进行切分得到的各动画片段的风格信息一致,但节奏信息可以不同。所切分出的动画片段是作为所述动画生成的最小单元,使得所述样本音乐库中的每一个音乐片段可以对应一个精准匹配的动画片段。其中,所述动画片段以及所述样本音乐片段的片段长度可以小于1秒(按节拍切分),也可以为1~3秒(按小节切分)。
77.步骤s340,将标注了所述动画特征信息的各个动画片段保存到设定的数据库中,得到所述动画库。
78.如此,在最终建立得到的样本音乐库包含的样本是不同的样本音乐片段与相应的标注(音乐特征标签),动画库是各个动画片段与相应的标注(动画特征信息)。其中,音乐库是用来训练深度学习模型得到音乐识别模型,动画库是用于基于音乐识别模型对音乐片段的识别结果(音乐特征信息)进行检索得到匹配的动画片段后生成所目标音乐对应的动画。
79.在上述步骤300的一种可能的应用场景中,可以直接根据与各所述音乐片段匹配的动画片段,生成所述目标音乐对应的动画。如此,在类似于网络直播的应用场景中,主播在播放所述音乐的同时,可以获取所播放的音乐对应的动画,实现对所述音乐的伴舞,提升与用户的直播互动效果。
80.在上述步骤300的另一种可能的应用场景中,可以在播放所述目标音乐的同时将匹配的动画片段进行播放,例如,所述目标音乐可以是当前正在播放的音乐,在音乐播放之前,可以预先对待播放的音乐片段进行动画的匹配,查找与所述音乐片段匹配的动画片段与所述待播放的音乐片段进行同步播放。
81.在音乐与对应的动画同步播放的应用场景下,若音乐片段及其匹配的动画片段时长不一致,可能会产生动画跳变的问题。为了避免该问题,本技术实施例中,在得到各音乐片段的音乐特征信息在动画库中搜索匹配的动画片段时,需要对动画片段进行相应的缩放处理。具体地,在一种可选的实施方式中,本技术实施例通过下述方法实现各音乐片段的动画片段的搜索匹配过程以及动画片段的缩放处理,该过程可以包含在步骤s300之中。
82.首先,针对任意目标音乐片段,根据所述目标音乐片段的风格信息从所述动画库中搜索与所述音乐片段匹配的多个动画片段;
83.然后,根据所述目标音乐片段的节奏信息从所述多个动画片段中搜索与所述目标音乐片段匹配的至少一个候选动画片段;一般来说,根据节奏信息可以搜索到多个与所述目标音乐片段相匹配或相类似的动画片段,作为候选动画片段;
84.最后,根据所述至少一个候选动画片段的运动信息确定与所述目标音乐片段匹配的目标动画片段,其中,所述运动信息包括,但不限于,用于表征动画片段中的目标对象(如主播、虚拟角色等)的位置信息、速度信息、旋转速度及角速度信息等。例如,作为一种示例,可以首先获取所述目标音乐片段的前一个音乐片段匹配的动画片段的最后预设数量帧(如最后3帧)的运动信息作为索引,然后根据该索引从所述至少一个候选动画片段中查找前预设数量帧(如前3帧)的运动信息与所述索引距离最接近的多个动画中的其中一个作为与所述目标音乐片段匹配的目标动画片段,如此可以增加动画生成的多样性。
85.例如,作为一种示例,假设所述目标音乐片段为音乐片段m,其运动信息i(c-3~-1
)作为索引,风格信息、节奏信息与音乐片段m匹配的动画片段集合为共n段动画,其中第i段动画的前3帧运动信息与i(c-3~-1
)最为匹配,那么最终确定的目标动画片段则为动画片段di。其中,动画片段之间的匹配度可以采用l2损失衡量,根据匹配度的大小可以确定所述目标动画片段。
86.进一步地,为了避免动画跳变的问题保证每个音乐片段与其匹配的动画片段在最终播放时能够保持一致,本实施例中,可以采用b样条插值法对所述目标动画片段进行缩放,使所述目标动画片段与所述目标音乐片段的时长一致后再与所述目标音乐片段同步播放。
87.如图5所示,音乐片段m的时长为t,匹配到的对应的动画片段di的时长为td,而与di对应的样本音乐片段xi的时长也为td,由于不同音乐的bpm可能不一样,即不同音乐的节拍之间的时长不一样。如此,在目标音乐为随机的且未包含在所述样本音乐库中的音乐时,可能导致音乐片段m与动画片段di的时长不一致,因此需要对动画片段di进行缩放以匹配音乐片段m的时长。基于此,本实施中,可以采用b样条插值法对所述动画片段di进行缩放后再与所述待播放音乐片段m进行同步播放,以保证所播放的动画的连续性。此外,本实施例可以保证插值点的一阶平滑,在缩放前后节拍点处、片段首尾的动作都不会发生改变,因此保证了缩放后的动作片段中的节拍动画与待播放的音乐片段m的节拍点对应上。经过插值后的动画片段时长di′
与音乐片段m时长一致,当音乐片段m播放完成后,动画片段也随之播放完。
88.步骤s400,根据各所述音乐片段匹配的动画片段生成所述目标音乐对应的动画。
89.本实施例中,在确定各个音乐片段匹配的动画片段之后,可以将各个动画片段拼接或合成为一个完整的动画。本实施例中,可以将生成的动画作为所述目标音乐的配舞动画,以实现为所述音乐自动配舞的功能,可以用于舞蹈动画制作与网络直播等领域。以网络直播为例,可以在主播播放一段音乐的同时,自动生成与所述音乐对应的舞蹈动画并在直播画面中展示该舞蹈动画,以增强观众与主播之间的互动。例如,可以在主播提供直播服务之初,可以事先制作音乐库以及与音乐库配对的高质量舞蹈动作库。高质量舞蹈动作的录制可以采用惯捕设备或光捕设备进行采集,由专业的舞蹈演员(也可以是主播自己)身穿录制设备跟随音乐跳舞,将整个舞蹈动作经过处理后保存到舞蹈动作库中。在音乐库制作过
程中,使用到的音乐可以包含各种不同风格类型的音乐,如摇滚、流行、古典等,经过处理后都存储到音乐库中,每首音乐都按照节拍或小节切分成一段段的音乐片段,切分的位置可以处于两个最近的节拍点的中间。在具体实现时,可以采用所述音乐库对深度学习模型进行训练得到所述音乐识别模型以用于进行音乐特征信息的识别。制作得到的舞蹈动作库可以用作所述动画库,在根据音乐特征信息的识别结果搜索与各音乐片段匹配的动画片段,最后基于搜索到的动画片段生成直播过程中所播放的音乐匹配的配舞动画,进而实现网络直播的互动。
90.如图6所示,是本技术实施例中提供的用于实现上述的动画生成方法的动画生成系统的示意图。本实施例中,所述动画生成系统可以应用于图7所示的计算机设备100。详细地,所述计算机设备100可以包括一个或多个处理器110、机器可读存储介质120以及动画生成系统130。处理器110与机器可读存储介质120可经由系统总线通信连接。机器可读存储介质120存储有机器可执行指令,处理器110通过读取并执行机器可读存储介质120中机器可执行指令实现上文描述的动画生成方法。本实施例中,所述计算机设备100可以是用于执行所述动画生成系统的前端所包括的各功能模块的云端服务器,也可以是用于执行动画生成系统的后端所包括的各功能模块的用户客户端,或者也可以是同时用于执行所述动画生成系统的前端和后端所包括的各功能模块的云端服务器,又或者也可以是分别执行所述动画生成系统的前端和后端所包括的各功能模块的云端服务器以及用户客户端的组合,本实施例对此不进行限制。
91.其中,所述机器可读存储介质120可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。其中,机器可读存储介质120用于存储程序,所述处理器110在接收到执行指令后,执行所述程序。
92.所述处理器110可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是,但不限于,通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)等。
93.本实施例中,所述动画生成系统130可以包括切分模块131、识别模块132、搜索模块133、以及生成模块134。
94.所述切分模块131用于将目标音乐切分为至少两个音乐片段。
95.本实施例中,所述切分模块131可以用于执行上述的步骤s100,关于该切分模块131的更多的详细内容可以参照上述步骤s100的相关内容,此处不再赘述。
96.所述识别模块132用于依次将各所述音乐片段输入预先训练得到的音乐识别模型进行音乐特征识别,得到各所述音乐片段的音乐特征信息,所述音乐特征信息包括所述音乐片段的风格信息和节奏信息。
97.本实施例中,所述识别模块132可以用于执行上述的步骤s200,关于该识别模块132的更多的详细内容可以参照上述步骤s200的相关内容,此处不再赘述。
98.所述搜索模块133用于根据各所述音乐片段的音乐特征信息从预先建立的动画库
中搜索与各所述音乐片段匹配的动画片段。
99.本实施例中,所述搜索模块133可以用于执行上述的步骤s300,关于该搜索模块133的更多的详细内容可以参照上述步骤s300的相关内容,此处不再赘述。
100.所述生成模块134用于根据与各所述音乐片段匹配的动画片段生成所述目标音乐对应的动画。
101.本实施例中,所述生成模块134可以用于执行上述的步骤s400,关于该生成模块134的更多的详细内容可以参照上述步骤s400的相关内容,此处不再赘述。
102.综上所述,本技术实施例提供的动画生成方法、系统及计算机设备,通过使用大量的音乐-动画数据集,不采用端到端的音乐-动画生成模型,而是仅对音乐特征的提取采用深度学习模型(音乐识别模型),对动画的处理采用特征匹配的搜索算法,在搜索过程中可以按照用户的想法进行修正,实现整个动画匹配与生成过程的可控,并且动画都是从动作库中查找并修正的高质量动画,因此输出的动画是无损的。因此,本实施例中的动画生成方法具有较好的扩展性、生成的动画也更自然合理,可提升用户的使用体验。此外,随着动作库规模的逐渐完善和变大,动画生成效果则相应越好。
103.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
104.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
105.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
106.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在
包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
107.以上所述,仅为本技术的各种实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1