音乐的融合方法、装置、电子设备及存储介质与流程

文档序号:33458136发布日期:2023-03-15 02:59阅读:37来源:国知局
音乐的融合方法、装置、电子设备及存储介质与流程

1.本公开涉及计算机技术领域,尤其涉及一种音乐的融合方法、装置、电子设备及存储介质。


背景技术:

2.在快节奏的信息化时代,音乐和人们的生活息息相关。越来越多的人们可能因情绪、生活和工作压力而失眠,从而借助音乐的助眠方式逐渐流行。
3.通常,助眠音乐可以分为两类:第一类是大自然环境声音,比如风雨雷电、花鱼鸟虫等自然声音;第二类是特制音乐,比如轻音乐、催眠曲、脑波音乐等。而这些音乐在音色、音调、节奏风格上差异可能较大,若直接切换可能会造成感官突变,从而可能会对用户造成干扰,无法达到助眠效果。从而,如何对音乐进行融合,显得至关重要。


技术实现要素:

4.本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
5.本公开第一方面实施例提出了一种音乐的融合方法,包括:
6.利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量;
7.将所述多个特征向量进行融合,以生成融合后的特征向量;
8.利用所述生成模型中的解码器将所述融合后的特征向量进行解码处理,以获取融合后的音乐。
9.在该方案中,可以先利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,之后将多个特征向量进行融合,以生成融合后的特征向量,再利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。由此,通过利用训练完成的生成模型即可将待融合的多个音乐进行融合,以生成融合后的音乐,同时又可使融合后的音乐更加丰富,从而可以更好的满足用户需求。
10.可选的,所述融合后的音乐用于在两个音乐之间播放,所述利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,包括:
11.根据播放顺序,由后至前从所述两个音乐中的前一个音乐中截取预设时长的第一音乐片段;
12.根据播放顺序,由前至后从所述两个音乐中的后一个音乐中截取预设时长的第二音乐片段;
13.利用所述编码器将所述第一音乐片段及所述第二音乐片段分别进行编码处理,以获取与所述第一音乐片段及所述第二音乐片段分别对应的特征向量。
14.在该方案,通过将从两个音乐中分别截取的第一音乐片段、第二音乐片段进行处理,可以获取对应的两个特征向量,利用该特征向量,以生成融合后的音乐,当其用于在两个音乐之间播放时,其拼接过渡更加自然,从而可以更好的满足用户需求。
15.可选的,所述利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,包括:
16.根据播放顺序,由后至前从所述两个音乐中的前一个音乐中依次截取n个预设时长的第一音乐片段,其中,n为大于1的正整数;
17.根据播放顺序,由前至后从所述两个音乐中的后一个音乐中依次截取n个预设时长的第二音乐片段;
18.利用所述编码器将n个所述第一音乐片段及n个所述第二音乐片段分别进行编码处理,以获取n个第一特征向量及n个第二特征向量;
19.所述将所述多个特征向量进行融合,以生成融合后的特征向量,包括:
20.基于第一权重序列和第二权重序列,将n个所述第一特征向量及n个所述第二特征向量分别进行融合,以生成融合后的n个子特征向量;
21.将所述融合后的n个子特征向量进行拼接,以生成所述融合后的特征向量;
22.其中,所述第一权重序列及所述第二权重序列中分别包含n个权重值,且所述第一权重序列中n个第一权重值逐渐降低,所述第二权重序列中n个第二权重值逐渐增加,且每个第一权重值与对应的第二权重值的和为1。
23.通过实施该方案,当生成的融合后的音乐用于在两个音乐之间播放时,其拼接过渡更加自然,从而可以更好的满足用户需求。
24.可选的,还包括:
25.根据历史播放数据,确定设备所属用户的音乐兴趣标签;
26.根据所述音乐兴趣标签,确定所述第一权重序列及所述第二权重序列。
27.可选的,所述融合后的音乐用于在两个音乐之间播放,所述将所述多个特征向量进行融合,以生成融合后的特征向量,包括:
28.根据所述两个音乐分别对应的两个特征向量,确定所述两个音乐的差异度;
29.根据所述差异度,确定待融合的特征向量的长度l;
30.根据播放顺序,由后至前从所述两个音乐中的前一个音乐对应的第一特征向量中截取长度为l的第一特征向量片段;
31.根据播放顺序,由前至后从所述两个音乐中的后一个音乐对应的第二特征向量中截取长度为l的第二特征向量片段;
32.将所述第一特征向量片段及所述第二特征向量片段进行融合,以生成融合后的特征向量。
33.通过实施该方案,当生成的融合后的音乐用于在两个音乐之间播放时,其拼接过渡更加自然,从而可以更好的满足用户需求。
34.可选的,所述生成模型为变分自编码器。
35.本公开第二方面实施例提出了一种音乐的融合装置,包括:
36.第一获取模块,用于利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量;
37.生成模块,用于将所述多个特征向量进行融合,以生成融合后的特征向量;
38.第二获取模块,用于利用所述生成模型中的解码器将所述融合后的特征向量进行解码处理,以获取融合后的音乐。
39.可选的,所述融合后的音乐用于在两个音乐之间播放,所述第一获取模块,具体用于:
40.根据播放顺序,由后至前从所述两个音乐中的前一个音乐中截取预设时长的第一音乐片段;
41.根据播放顺序,由前至后从所述两个音乐中的后一个音乐中截取预设时长的第二音乐片段;
42.利用所述编码器将所述第一音乐片段及所述第二音乐片段分别进行编码处理,以获取与所述第一音乐片段及所述第二音乐片段分别对应的特征向量。
43.可选的,所述第一获取模块,还具体用于:
44.根据播放顺序,由后至前从所述两个音乐中的前一个音乐中依次截取n个预设时长的第一音乐片段,其中,n为大于1的正整数;
45.根据播放顺序,由前至后从所述两个音乐中的后一个音乐中依次截取n个预设时长的第二音乐片段;
46.利用所述编码器将n个所述第一音乐片段及n个所述第二音乐片段分别进行编码处理,以获取n个第一特征向量及n个第二特征向量;
47.所述生成模块,具体用于:
48.基于第一权重序列和第二权重序列,将n个所述第一特征向量及n个所述第二特征向量分别进行融合,以生成融合后的n个子特征向量;
49.将所述融合后的n个子特征向量进行拼接,以生成所述融合后的特征向量;
50.其中,所述第一权重序列及所述第二权重序列中分别包含n个权重值,且所述第一权重序列中n个第一权重值逐渐降低,所述第二权重序列中n个第二权重值逐渐增加,且每个第一权重值与对应的第二权重值的和为1。
51.可选的,还包括:
52.确定模块,用于根据历史播放数据,确定设备所属用户的音乐兴趣标签;
53.所述确定模块,还用于根据所述音乐兴趣标签,确定所述第一权重序列及所述第二权重序列。
54.可选的,所述生成模块,具体用于:
55.根据所述两个音乐分别对应的两个特征向量,确定所述两个音乐的差异度;
56.根据所述差异度,确定待融合的特征向量的长度l;
57.根据播放顺序,由后至前从所述两个音乐中的前一个音乐对应的第一特征向量中截取长度为l的第一特征向量片段;
58.根据播放顺序,由前至后从所述两个音乐中的后一个音乐对应的第二特征向量中截取长度为l的第二特征向量片段;
59.将所述第一特征向量片段及所述第二特征向量片段进行融合,以生成融合后的特征向量。
60.可选的,所述生成模型为变分自编码器。
61.本公开提供的音乐的融合装置,可以先利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,之后将多个特征向量进行融合,以生成融合后的特征向量,再利用生成模型中的解码器将融合后的特征向量进行解码处
理,以获取融合后的音乐。由此,通过利用训练完成的生成模型即可将待融合的多个音乐进行融合,以生成融合后的音乐,同时又可使融合后的音乐更加丰富,从而可以更好的满足用户需求。
62.本公开第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的音乐的融合方法。
63.本公开第四方面实施例提出了一种非临时性计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如本公开第一方面实施例提出的音乐的融合方法。
64.本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本公开第一方面实施例提出的音乐的融合方法。
65.本公开提供的音乐的融合方法、装置、电子设备及存储介质,可以先利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,之后将多个特征向量进行融合,以生成融合后的特征向量,再利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。由此,通过利用训练完成的生成模型即可将待融合的多个音乐进行融合,以生成融合后的音乐,同时又可使融合后的音乐更加丰富,从而可以更好的满足用户需求。
66.本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
67.本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
68.图1为本公开一实施例所提供的音乐的融合方法的流程示意图;
69.图2为本公开另一实施例所提供的音乐的融合方法的流程示意图;
70.图2a为本公开一实施例所提供的一种多层lstm编码器结构示意图;
71.图2b为本公开一实施例所提供的一种解码器结构示意图;
72.图3为本公开一实施例所提供的音乐的融合方法的结构示意图;
73.图4为本公开一实施例所提供的音乐的融合方法的结构示意图;
74.图4a为本公开一实施例所提供的一种音乐片段融合的示意图;
75.图4b为本公开一实施例所提供的另一种音乐片段融合的示意图;
76.图5为本公开另一实施例所提供的音乐的融合装置的结构示意图;
77.图6示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
78.下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
79.下面参考附图描述本公开实施例的音乐的融合方法、装置、电子设备和存储介质。
80.图1为本公开实施例所提供的音乐的融合方法的流程示意图。
81.本公开实施例以该音乐的融合方法被配置于音乐的融合装置中来举例说明,该音乐的融合装置可以应用于任一电子设备中,以使该电子设备可以执行音乐的融合功能。
82.其中,电子设备可以为个人电脑(personal computer,简称pc)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
83.如图1所示,该音乐的融合方法可以包括以下步骤:
84.步骤101,利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量。
85.其中,训练完成的生成模型,可以包括编码器。从而将待融合的音乐输入至该生成模型中,经过编码器的编码处理,即可输出各个待融合的音乐各自对应的特征向量。
86.另外,待融合的多个音乐,可以为多个完整的音乐,或者也可以为多个音乐片段,或者也可以为完整的音乐和音乐片段等等,本公开对此不做限定。
87.本公开实施例中,将多个待融合的音乐输入至生成模型,经过编码器的处理,可以得到各个待融合的音乐各自对应的特征向量,该特征向量可以较好的反映各个音乐在节拍、音色、音调等多个维度的特点。
88.步骤102,将多个特征向量进行融合,以生成融合后的特征向量。
89.其中,将多个特征向量进行融合时,可以有多种方式。
90.比如,可以将多个特征向量进行拼接,所得结果即为融合后的特征向量。
91.或者,也可以将多个特征向量进行加和,所得结果即为融合后的特征向量。
92.需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中将多个特征向量进行融合的方式等的限定。
93.步骤103,利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。
94.其中,该生成模型中,还可以包括解码器。从而将融合后的特征向量输入至该生成模型中,经过解码器的解码处理,即可输出其所对应的融合后的音乐。
95.该融合后的音乐结合了各个音乐在节拍、音色、音调等多个维度的特点,充分刻画了音乐的核心属性,可以更加满足用户需求。
96.可选的,本公开中的生成模型可以为变分自编码器。从而在将融合后的特征向量进行解码处理时,变分自编码器的解码器可以从该融合后的特征向量中随机抽取向量进行解码,从而,每次解码的向量可能不同,可使得每次生成的融合后的音乐也不同,进而可使得生成的融合后的音乐更加丰富。
97.本公开实施例,可以先利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,之后将多个特征向量进行融合,以生成融合后的特征向量,再利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。由此,通过利用训练完成的生成模型即可将待融合的多个音乐进行融合,以生成融合后的音乐,同时又可使融合后的音乐更加丰富,从而可以更好的满足用户需求。
98.上述实施例,通过利用生成模型即可将待融合的多个音乐进行融合,从而得到融合后的音乐。在一种可能的实现方式中,融合后的音乐可以用于在两个音乐之间播放,从而
可以根据播放顺序,截取相应的音乐片段,将其进行融合,以使两个音乐之间的过渡更加自然,下面结合图2对上述过程进行详细说明。图2为本公开实施例所提供的音乐的融合方法的流程示意图。如图2所示,该音乐的融合方法可以包括以下步骤:
99.步骤201,根据播放顺序,由后至前从两个音乐中的前一个音乐中截取预设时长的第一音乐片段。
100.步骤202,根据播放顺序,由前至后从两个音乐中的后一个音乐中截取预设时长的第二音乐片段。
101.其中,预设时长,可以为统一设置的数值,或者也可以为用户根据自身需求,自行设置的数值,本公开对此不做限定。
102.比如说,音乐1和音乐2的播放顺序为:先播放音乐1,后播放音乐2,预设的时长为10秒。从而可以截取音乐1中最后10秒的音乐片段,将其作为第一音乐片段,截取音乐2中前10秒的音乐片段,将其作为第二音乐片段。
103.需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中,播放顺序、预设时长、第一音乐片段、第二音乐片段等的限定。
104.步骤203,利用编码器将第一音乐片段及第二音乐片段分别进行编码处理,以获取与第一音乐片段及第二音乐片段分别对应的特征向量。
105.其中,可以将第一音乐片段和第二音乐片段分别输入至训练完成的生成模型中,经过生成模型中的编码器的编码处理,即可输出第一音乐片段和第二音乐片段各自对应的特征向量。该特征向量,可以为均值向量、方差向量等等,本公开对此不做限定。
106.可以理解的是,编码器可以有多种结构,比如可以为循环神经网络(recurrent neural network,rnn)、长短期记忆网络(long short-term memory,lstm)、多层lstm等等,本公开对此不做限定。
107.比如,在如图2a所示的多层lstm编码器结构示意图中,将各个第一音乐片段输入至编码器中,经过多层lstm的处理,即可输出对应的特征向量,该特征向量可以为均值向量、方差向量等等,本公开对此不做限定。
108.步骤204,将两个特征向量进行融合,以生成融合后的特征向量。
109.其中,将两个特征向量进行融合的内容,可以参照本公开其他实施例中将多个特征向量进行融合的具体内容及实现方式,此处不再赘述。
110.步骤205,利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。
111.其中,解码器的结构与编码器的结构相反,解码器的输入为融合后的特征向量,输出为融合后的音乐。
112.比如,在如图2b所示的解码器结构示意图中,将融合后的特征向量输入该解码器中,经过多层lstm的处理,即可输出对应融合后的音乐。
113.可以理解的是,本公开提供的音乐的融合方法,可以适用于任意需要进行音乐融合的场景中。
114.比如,当用户借助音乐进入睡眠状态时,不同的音乐在音色、音调、节奏风格上差异可能较大,若直接切换可能会造成感官突变,从而可能会干扰用户的临睡状态,无法达到助眠效果。从而,可以利用本公开提供的方案,将生成的融合音乐作为两个音乐之间的过渡
音乐,从而可实现音乐的自然拼接,更有助于用户睡眠等等,本公开对此不做限定。
115.本公开实施例,可以先根据播放顺序,从两个音乐中分别截取预设时长的第一音乐片段、第二音乐片段,之后可以利用编码器获取两个音乐片段分别各自对应的特征向量,之后对这两个特征向量进行融合,即可得到融合后的特征向量,再利用生成模型中的解码器的处理,即可确定融合后的音乐。由此,通过利用生成模型将截取的音乐片段进行处理,即可生成融合后的音乐,该音乐在两个音乐之间播放时,可使得两个音乐之间的过渡更加自然,从而更好的满足用户需求,进而可以给予用户良好的体验。
116.上述实施例,通过利用生成模型将截取的音乐片段进行处理,即可生成融合后的音乐,该音乐可以用于在两个音乐之间播放,从而可使得两个音乐之间的过渡更加自然。在一种可能的实现方式中,还可以先根据两个音乐分别对应的特征向量,确定两个音乐之间的差异度,再根据该差异度,确定出待融合的各特征向量片段,并对其进行处理,从而生成融合后的音乐,下面结合图3对上述过程进行详细说明。图3为本公开实施例所提供的音乐的融合方法的流程示意图。如图3所示,该音乐的融合方法可以包括以下步骤:
117.步骤301,利用训练完成的生成模型中的编码器将待融合的两个音乐分别进行编码,以获取两个音乐分别对应的两个特征向量。
118.其中,获取两个音乐分别对应的两个特征向量,可以参照本公开其他各实施例中获取多个音乐分别对应的多个特征向量的具体内容及实现方式,此处不再赘述。
119.步骤302,根据两个音乐分别对应的两个特征向量,确定两个音乐的差异度。
120.其中,表征两个音乐的差异度的方式可以有多种。
121.举例来说,可以先确定出两个特征向量之间的距离,之后可以使用该距离表征两个音乐间的差异度。
122.可以理解的是,两个特征向量之间的距离值越大,表明两个音乐之间的差异就越大,两个特征向量之间的距离值越小,表明两个音乐之间的差异也越小。其中,确定两个特征向量之间的距离可以有多种,比如可以使用欧氏距离公式、曼哈顿距离公式等等,本公开对此不做限定。
123.或者,也可以先确定出两个特征向量之间的相似度,之后使用该相似度表征两个音乐间的差异度。
124.可以理解的是,两个特征向量之间的相似度数值越大,表明两个音乐之间的相似度越高,其对应的差异就越小,两个特征向量之间的相似度数值越小,表明两个音乐之间的相似度越低,其对应的差异就越大。其中,确定两个特征向量之间的相似度可以有多种,比如可以使用余弦相似度、皮尔逊相关系数等等,本公开对此不做限定。
125.步骤303,根据差异度,确定待融合的特征向量的长度l。
126.可以理解的是,待融合的特征向量的长度l与差异度呈正相关的关系。即差异度越大,选取的l值就越大,差异度越小,选取的l值就越小等等。从而根据该差异度的大小,即可确定l的数值等等。本公开对此不做限定。
127.步骤304,根据播放顺序,由后至前从两个音乐中的前一个音乐对应的第一特征向量中截取长度为l的第一特征向量片段。
128.步骤305,根据播放顺序,由前至后从两个音乐中的后一个音乐对应的第二特征向量中截取长度为l的第二特征向量片段。
129.比如说,音乐1和音乐2的播放顺序为:先播放音乐1,后播放音乐2,音乐1对应的第一特征向量为[0 1 0 1 1 0],音乐2对应的第二特征向量为[1 1 0 1 0 0]。确定的l的数值为2,从而按照由后至前的顺序,从第一特征向量截取的第一特征向量片段为[1 0],按照由前至后的顺序,从第二特征向量截取的第二特征向量片段为[1 1]。
[0130]
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中,播放顺序、l的数值、各特征向量及各特征向量片段等的限定。
[0131]
步骤306,将第一特征向量片段及第二特征向量片段进行融合,以生成融合后的特征向量。
[0132]
其中,将第一特征向量片段及第二特征向量片段进行融合时,可以有多种方式。
[0133]
比如,可以将第一特征向量片段及第二特征向量片段进行拼接,所得结果即为融合后的特征向量。或者,也可以将第一特征向量片段及第二特征向量片段进行加和,所得结果即为融合后的特征向量。
[0134]
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中将各特征向量片段进行融合的方式等的限定。
[0135]
步骤307,利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。
[0136]
本公开实施例中,基于两个音乐之间的差异度,确定待融合的特征向量的长度l,从而在将截取的特征向量片段进行融合时,充分考虑到了两个音乐之间的差异,从而可使得融合后的特征向量更加准确,更能刻画音乐的核心属性。从而对该融合后的特征向量进行处理,所得的融合后的音乐,可实现两个音乐在节拍、音色、音调等多个维度的自然拼接过渡。
[0137]
本公开实施例中,可以先利用训练完成的生成模型中的编码器将待融合的两个音乐分别进行编码,以获取两个音乐分别对应的两个特征向量,之后可以确定两个音乐的差异度,再根据该差异度,即可确定待融合的特征向量的长度l,之后可以从两个音乐对应的第一特征向量和第二特征向量中,分别截取长度为l的第一特征向量片段和第二特征向量片段,再将该特征向量片段进行融合,以生成融合后的特征向量,之后利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。由此,先根据两个音乐对应的特征向量,确定两个音乐的差异度,之后基于差异度,截取对应的特征向量片段并进行融合,再将融合后的特征向量进行处理,即可得到融合后的音乐,该融合后的音乐,充分考虑到了两个音乐之间的差异,从而可以从节拍、音色、音调等多个维度实现对音乐的自然拼接过渡。
[0138]
上述实施例,先根据两个音乐对应的特征向量,确定两个音乐的差异度,之后基于差异度,截取对应的特征向量片段并进行融合,从而将融合后的特征向量进行处理,即可得到融合后的音乐。在一种可能的实现方式中,可以分别截取多个音乐片段,之后可以基于对应的各权重序列将各个音乐片段对应的特征向量进行融合,从而获取融合后的音乐,下面结合图4对上述过程进行详细说明。
[0139]
图4为本公开实施例所提供的音乐的融合方法的流程示意图。如图4所示,该音乐的融合方法可以包括以下步骤:
[0140]
步骤401,根据播放顺序,由后至前从两个音乐中的前一个音乐中依次截取n个预
设时长的第一音乐片段,其中,n为大于1的正整数。
[0141]
步骤402,根据播放顺序,由前至后从两个音乐中的后一个音乐中依次截取n个预设时长的第二音乐片段。
[0142]
其中,预设时长和n的取值,可以为统一设置的数值,或者也可以为用户根据自身需求,自行设置的数值,本公开对此不做限定。
[0143]
比如说,音乐1和音乐2的播放顺序为:先播放音乐1,后播放音乐2,n的取值为3,预设的时长为2秒。音乐1共60秒,可以分别截取第55秒至56秒、第57秒至58秒、第59秒至60秒的内容,从而可以得到3个第一音乐片段;音乐2共50秒,可以分别截取第1秒至2秒、第3秒至4秒、第5秒至6秒的内容,从而可以得到3个第二音乐片段。
[0144]
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中,播放顺序、n的取值、预设时长、第一音乐片段、第二音乐片段等的限定。
[0145]
步骤403,利用编码器将n个第一音乐片段及n个第二音乐片段分别进行编码处理,以获取n个第一特征向量及n个第二特征向量。
[0146]
比如说,n为3,则可以将3个第一音乐片段及3个第二音乐片段分别输入至训练完成的生成模型中,经过生成模型中编码器的处理,即可输出3个第一特征向量及3个第二特征向量。
[0147]
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中n的取值、获取第一特征向量及第二特征向量等的限定。
[0148]
步骤404,基于第一权重序列和第二权重序列,将n个第一特征向量及n个第二特征向量分别进行融合,以生成融合后的n个子特征向量。
[0149]
其中,第一权重序列及第二权重序列中分别包含n个权重值,且第一权重序列中n个第一权重值逐渐降低,第二权重序列中n个第二权重值逐渐增加,且每个第一权重值与对应的第二权重值的和为1。
[0150]
另外,确定第一权重序列及第二权重序列时,可以有多种方式。
[0151]
比如,第一权重序列及第二权重序列,可以为提前设定好的,或者,也可以为用户自行设定的。
[0152]
或者,还可以根据历史播放数据,先确定设备所属用户的音乐兴趣标签,之后根据音乐兴趣标签,确定第一权重序列及第二权重序列。
[0153]
其中,不同的用户,其对应的音乐兴趣标签可能也不相同。从而,各个第一权重序列及第二权重列中,包含的权重数量及对应的各个权重值,可能也不同,本公开对此不做限定。
[0154]
比如,根据历史播放数据,确定出用户a的音乐兴趣标签为“轻音乐”,从而可以设置第一权重序列及第二权重序列中各权重值间的变化较小。或者,根据历史播放数据,确定出用户b的音乐兴趣标签为“摇滚”,从而可以设置第一权重序列及第二权重序列中各权重值间的变化较大等等。本公开对此不做限定。
[0155]
举例来说,n为3,根据历史播放数据,确定的第一权重序列中的各权重值分别为0.8、0.5、0.1,第二权重序列中的各权重值分别为0.2、0.5、0.9。3个第一特征向量分别为x
11
、x
12
、x
13
,3个第二特征向量分别为x
21
、x
22
、x
23
。之后,可以将各个权重值与其对应的特征向量相乘,之后再融合,从而融合后的3个子特征向量,分别为0.8*x
11
+0.2*x
21
、0.5*x
12
+
0.5*x
22
、0.1*x
13
+0.9*x
23

[0156]
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中n的取值、各特征向量以及生成子特征向量等的限定。
[0157]
步骤405,将融合后的n个子特征向量进行拼接,以生成融合后的特征向量。
[0158]
比如说,可以将n个子特征向量直接进行拼接,从而可以得到融合后的特征向量。或者,也可以将n个子特征向量分别相加,所得结果即为融合后的特征向量等等,本公开对此不做限定。
[0159]
步骤406,利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。
[0160]
本公开实施例中,可以基于各权重值对各个特征向量进行调整、融合、拼接处理,以生成融合后的特征向量,该融合后的特征向量充分考虑到了各个音乐片段、各个特征向量的权重,从而该融合后的特征向量更加准确、符合用户需求,之后再根据该融合后的特征向量所得到的融合后的音乐,其拼接过渡更为自然,从而可以更加符合用户的需求。
[0161]
下面以图4a所示的音乐片段的融合为例,对本公开提供的音乐的融合方法进行说明。
[0162]
在如图4a所示的示意图中,可以将第一音乐片段和第二音乐片段,分别输入至生成模型中,经过编码器的处理,可以得到对应的第一特征向量和第二特征向量。之后可以基于第一权重序列β和第二权重序列γ,将第一特征向量和第二特征向量分别进行融合,以生成融合后的子特征向量,再将其进行拼接,即可得到对应的融合后的特征向量,再将融合后的特征向量输入至解码器,经过解码器的处理,即可获取融合后的音乐。
[0163]
又或者,在如图4b所示音乐片段融合的示意图中,从音乐1中依次截取5个2秒的第一音乐片段,其对应的第一权重序列中各个权重分别为:0.9、0.7、0.5、0.3、0.1;从音乐2中依次截取5个2秒的第二音乐片段,其对应的第二权重序列中各个权重分别为:0.1、0.3、0.5、0.7、0.9。之后,可以基于第一权重序列和第二权重序列,将各个第一特征向量和第二特征向量进行融合,从而生成各个音乐片段分别对应的融合后的音乐。
[0164]
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中音乐的融合方法、各权重序列等的限定。
[0165]
本公开实施例,可以先根据播放顺序,从两个音乐中分别截取n个预设时长的第一音乐片段和第二音乐片段,之后再利用编码器将n个第一音乐片段及第二音乐片段分别进行编码处理,以获取n个第一特征向量及n个第二特征向量,再基于第一权重序列和第二权重序列,将n个第一特征向量及n个第二特征向量分别进行融合,以生成融合后的n个子特征向量,之后再对其进行拼接,生成融合后的特征向量,再利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。由此,可以基于各权重序列,将各音乐片段对应的各特征向量分别进行融合及拼接,从而确定出融合后的特征向量,之后再将其进行处理后,即可得到融合后的音乐,从而可以从节拍、音色、音调等多个维度实现对音乐的自然拼接过渡,该融合后的音乐更加符合用户需求。
[0166]
为了实现上述实施例,本公开还提出一种音乐的融合装置。
[0167]
图5为本公开实施例所提供的音乐的融合装置的结构示意图。
[0168]
如图5所示,该音乐的融合装置100可以包括:第一获取模块110、生成模块120及第
二获取模块130。
[0169]
第一获取模块110,用于利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量;
[0170]
生成模块120,用于将所述多个特征向量进行融合,以生成融合后的特征向量;
[0171]
第二获取模块130,用于利用所述生成模型中的解码器将所述融合后的特征向量进行解码处理,以获取融合后的音乐。
[0172]
可选的,所述融合后的音乐用于在两个音乐之间播放,所述第一获取模块110,具体用于:
[0173]
根据播放顺序,由后至前从所述两个音乐中的前一个音乐中截取预设时长的第一音乐片段;
[0174]
根据播放顺序,由前至后从所述两个音乐中的后一个音乐中截取预设时长的第二音乐片段;
[0175]
利用所述编码器将所述第一音乐片段及所述第二音乐片段分别进行编码处理,以获取与所述第一音乐片段及所述第二音乐片段分别对应的特征向量。
[0176]
可选的,所述第一获取模块110,还具体用于:
[0177]
根据播放顺序,由后至前从所述两个音乐中的前一个音乐中依次截取n个预设时长的第一音乐片段,其中,n为大于1的正整数;
[0178]
根据播放顺序,由前至后从所述两个音乐中的后一个音乐中依次截取n个预设时长的第二音乐片段;
[0179]
利用所述编码器将n个所述第一音乐片段及n个所述第二音乐片段分别进行编码处理,以获取n个第一特征向量及n个第二特征向量;
[0180]
所述生成模块120,具体用于:
[0181]
基于第一权重序列和第二权重序列,将n个所述第一特征向量及n个所述第二特征向量分别进行融合,以生成融合后的n个子特征向量;
[0182]
将所述融合后的n个子特征向量进行拼接,以生成所述融合后的特征向量;
[0183]
其中,所述第一权重序列及所述第二权重序列中分别包含n个权重值,且所述第一权重序列中n个第一权重值逐渐降低,所述第二权重序列中n个第二权重值逐渐增加,且每个第一权重值与对应的第二权重值的和为1。
[0184]
可选的,上述装置,还包括:
[0185]
确定模块,用于根据历史播放数据,确定设备所属用户的音乐兴趣标签;
[0186]
所述确定模块,还用于根据所述音乐兴趣标签,确定所述第一权重序列及所述第二权重序列。
[0187]
可选的,所述生成模块130,具体用于:
[0188]
根据所述两个音乐分别对应的两个特征向量,确定所述两个音乐的差异度;
[0189]
根据所述差异度,确定待融合的特征向量的长度l;
[0190]
根据播放顺序,由后至前从所述两个音乐中的前一个音乐对应的第一特征向量中截取长度为l的第一特征向量片段;
[0191]
根据播放顺序,由前至后从所述两个音乐中的后一个音乐对应的第二特征向量中截取长度为l的第二特征向量片段;
memory;以下简称:dvd-rom)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
[0204]
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
[0205]
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(local area network;以下简称:lan),广域网(wide area network;以下简称:wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0206]
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
[0207]
本公开的技术方案,可以先利用训练完成的生成模型中的编码器将待融合的多个音乐分别进行编码处理,以获取多个特征向量,之后将多个特征向量进行融合,以生成融合后的特征向量,再利用生成模型中的解码器将融合后的特征向量进行解码处理,以获取融合后的音乐。由此,通过利用生成模型即可将待融合的多个音乐进行融合,以生成融合后的音乐,同时又可使融合后的音乐更加丰富,从而可以更好的满足用户需求。
[0208]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0209]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0210]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开
的实施例所属技术领域的技术人员所理解。
[0211]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0212]
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0213]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0214]
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0215]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1