一种歌曲转换方法、装置、设备以及介质与流程

文档序号:21194989发布日期:2020-06-23 18:38阅读:332来源:国知局
一种歌曲转换方法、装置、设备以及介质与流程

本发明涉及计算机技术领域,特别是涉及一种歌曲转换方法、装置、设备以及介质。



背景技术:

歌曲是由歌词和曲谱相结合的一种艺术形式,歌曲的不同风格可以表现不同的情感。当前歌曲的创作完全依赖于创作者的灵感与智慧,而且,即使一首歌曲创作了出来,想对歌曲的风格再进行改变也需要创作者根据自己的创作水平进行转换,目前难以在原歌曲的基础上自动化地进行歌曲风格的变换更替。



技术实现要素:

有鉴于此,本发明的主要目的在于提供一种歌曲转换方法、装置、设备以及介质,可以高效地进行目标风格的歌曲风格转换。

为实现上述目的,本发明提供了一种歌曲转换方法,包括:

获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量;

获取目标转换曲风对应的风格特征向量;

根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量;

根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲。

优选地,所述根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量包括:

将所述风格特征向量、所述词特征向量和所述曲特征向量进行拼接,得到第一拼接向量;

将所述第一拼接向量进行编码得到所述转换后歌曲特征向量。

优选地,所述将所述第一拼接向量进行编码得到所述转换后歌曲特征向量包括:

将所述第一拼接向量使用前馈神经网络模型进行编码得到所述转换后歌曲特征向量。

优选地,所述根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲包括:

将所述词特征向量和所述转换后歌曲特征向量进行拼接,得到第二拼接向量;

将所述第二拼接向量进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲。

优选地,所述将所述第二拼接向量进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲包括:

将所述第二拼接向量通过长短时记忆网络模型进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲。

优选地,所述将所述词特征向量和所述转换后歌曲特征向量进行拼接,得到第二拼接向量之后,还包括:

获取和谐度判断向量,根据所述和谐度判断向量和所述第二拼接向量,计算风格转换和谐度值。

优选地,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量包括:

将所述词部和所述曲部通过transformer模型进行编码,得到所述词特征向量和所述曲特征向量。

本发明还提供了一种歌曲转换装置,包括:

词曲编码模块,用于获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量;

风格获取模块,用于获取目标转换曲风对应的风格特征向量;

转换向量获取模块,用于根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量;

曲风转换模块,用于根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲。

本发明还提供了一种歌曲转换设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现以上任意一项所述歌曲转换方法的步骤。

本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以上任意一项所述歌曲转换方法的步骤。

应用本发明提供的一种歌曲转换方法、装置、设备以及介质,获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量,获取目标转换曲风对应的风格特征向量,根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量,根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲,可以在保持转换后的词曲协调的基础上高效地进行目标风格的歌曲风格转换。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为申请实施例公开的一种歌曲转换方法的流程图;

图2为申请实施例公开的又一种歌曲转换方法的流程图;

图3为申请实施例公开的又一种歌曲转换方法的流程图;

图4为申请实施例公开的一种歌曲转换装置的结构示意图;

图5为本发明实施例公开的歌曲转换设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一:

本发明实施例一提供了一种歌曲转换方法,图1示出了本发明歌曲转换方法实施例一的流程图,包括:

步骤s101:获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量;

首先获取想要进行曲风转换的第一歌曲yr,获取该第一歌曲yr的词部x1和曲部xr,将词部和曲部分别进行编码得到词特征向量h1和曲特征向量hr,这里词部和曲部都可以视为一个序列,可以使用transformer模型对词部和曲部进行编码,得到词特征向量h1和曲特征向量hr。

步骤s102:获取目标转换曲风对应的风格特征向量;

选择需要转化的歌曲风格,如摇滚、流行、乡村、古典等,获取目标转换曲风对应的风格特征向量,例如选择想要转换的歌曲风格为“摇滚”,获取“摇滚”风格对应的风格特征向量z摇滚。一种具体的实施方式,这里歌曲风格对应的风格特征向量是随机初始化的,在训练的时候通过训练学习得到,每个歌曲风格对应不同的风格特征向量,为每种风格设置一个独有的离散化隐变量,及对应的风格特征向量,对于后续实现歌曲风格转换非常便利。

步骤s103:根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量;

根据上一步获取的风格特征向量,如z摇滚以及词特征向量h1和曲特征向量hr进行处理得到转换风格之后的转换后歌曲特征向量hr’。

作为一种具体实施方式,本申请实施例中,参照图2本申请实施例所提供的具体得到转换后歌曲特征向量步骤的示意图,步骤s103中根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量的过程具体包括:

步骤s201:将所述风格特征向量、所述词特征向量和所述曲特征向量进行拼接,得到第一拼接向量;

将风格特征向量z摇滚、词特征向量h1和曲特征向量hr进行向量拼接,得到第一拼接向量,向量拼接为将向量按照一定的顺序拼接在另一个向量后面的操作。比如向量a=[1,2],向量b=[3,4],向量c=[5,6],那么进行向量拼接得到的拼接向量为[1,2,3,4,5,6]。

步骤s202:将所述第一拼接向量进行编码得到所述转换后歌曲特征向量。

对第一拼接向量进行编码,得到转换后歌曲特征向量hr’,例如将所述第一拼接向量使用前馈神经网络模型进行编码得到所述转换后歌曲特征向量hr’,也可以使用其他模型的编码方式进行风格转换。拼接之后得到的歌曲特征向量hr’由于是初步和歌词相结合,可能仍有一些词曲不和谐的地方,需要进行下一步的调整适配。

步骤s104:根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲。

根据词特征向量h1以及转换后歌曲特征向量hr’得到进行风格转换之后的第二歌曲,如将爵士风格的第一歌曲yr,转换为摇滚风格的第二歌曲yr’,歌词不变且词曲适配。

作为一种具体实施方式,本申请实施例中,参照图3本申请实施例所提供的得到风格转换后的第二歌曲步骤的示意图,步骤s104中根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲的过程具体包括:

步骤s301:将所述词特征向量和所述转换后歌曲特征向量进行拼接,得到第二拼接向量;

词特征向量h1以及转换后歌曲特征向量hr’进行上述的向量拼接处理,得到第二拼接向量zr’,向量拼接为将向量按照一定的顺序拼接在另一个向量后面的操作,比如向量a=[1,2],向量b=[3,4],向量c=[5,6],那么进行向量拼接得到的拼接向量为[1,2,3,4,5,6]。

作为一种具体实施方式,将所述词特征向量和所述转换后歌曲特征向量进行拼接,得到第二拼接向量之后还包括:

获取和谐度判断向量,根据所述和谐度判断向量和所述第二拼接向量,计算风格转换和谐度值。

模型训练时向量拼接之后,获取和谐度判断向量v,用向量v与第二拼接向量zr’求夹角的cos余弦值,得到风格转换的和谐度值,该cos值越大则说明风格转换之后的词曲越和谐,在保证该模型风格转换之后词曲和谐时,实际转换风格过程中,即已得到训练好的模型后直接进行步骤s302,可以不再评估词曲和谐度。

步骤s302:将所述第二拼接向量进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲。

将第二拼接向量进行解码操作得到原第一歌曲yr的词部x1以及风格转换之后的第二歌曲yr’,一种具体的实施方式,可以将所述第二拼接向量通过长短时记忆网络模型进行解码得到所述第一歌曲yr的词部x1和风格转换后的所述第二歌曲yr’,也可以使用其他序列生成模型进行解码,解码模型生成若干长度的序列,在每一步生成一个“符号”,即音符。整个生成过程直到模型生成一个特殊的信号之后完成歌曲生成。如将爵士风格的第一歌曲yr,转换生成为摇滚风格的第二歌曲yr’,歌词不变保持为x1且词曲适配。

本实施例整个转换过程,首先歌词编码得到了歌词单独的特征向量,将目标歌曲的歌词和歌曲分开,然后根据现有的歌词和歌曲之间的搭配,将所选风格的风格特征向量随着歌词自主适应,以契合歌曲的节奏。在得到转换后歌曲风格特征向量之后,把它和歌词特征向量进行拼接,将词曲得以契合。最后将契合后的向量生成转换后歌曲,使得歌曲风格转换过程中保持词曲的协调。

应用本实施例提供的一种歌曲转换方法,获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量,获取目标转换曲风对应的风格特征向量,根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量,根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲,可以在保持转换后的词曲协调的基础上高效地进行目标风格的歌曲风格转换。

实施例二:

下文描述的歌曲转换装置与上文描述的歌曲转换方法可相互对应参照。

本发明实施例还提供了一种歌曲转换装置,图4示出了本发明歌曲转换装置实施例的结构示意图,包括:

词曲编码模块101,用于获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量;

风格获取模块102,用于获取目标转换曲风对应的风格特征向量;

转换向量获取模块103,用于根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量;

曲风转换模块104,用于根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲。

作为一种具体实施方式,本申请实施例中转换向量获取模块103具体用于:

将所述风格特征向量、所述词特征向量和所述曲特征向量进行拼接,得到第一拼接向量;

将所述第一拼接向量进行编码得到所述转换后歌曲特征向量。

作为一种具体实施方式,本申请实施例中曲风转换模块104具体用于:

将所述词特征向量和所述转换后歌曲特征向量进行拼接,得到第二拼接向量;

将所述第二拼接向量进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲。

本实施例的歌曲转换装置用于实现前述的歌曲转换方法,因此歌曲转换装置中的具体实施方式可见前文中的歌曲转换方法的实施例部分,例如,词曲编码模块101,风格获取模块102,转换向量获取模块103,曲风转换模块104,分别用于实现上述歌曲转换方法中的步骤s101,s102,s103,s104,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。

应用本实施例提供的一种歌曲转换装置,获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量,获取目标转换曲风对应的风格特征向量,根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量,根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲,可以在保持转换后的词曲协调的基础上高效地进行目标风格的歌曲风格转换。

实施例三:

基于上述方案,本发明还提供了一种歌曲转换设备,包括上述的歌曲转换装置,歌曲转换装置的详细内容不再赘述。

此外,本申请实施例还提供了一种歌曲转换设备,如图5所示,所述设备包括:

存储器11,用于存储计算机程序;

处理器12,用于执行所述计算机程序时实现如下步骤:获取第一歌曲的词部和曲部,将所述词部和所述曲部分别进行编码,得到词特征向量和曲特征向量;获取目标转换曲风对应的风格特征向量;根据所述风格特征向量、所述词特征向量和所述曲特征向量得到转换后歌曲特征向量;根据所述词特征向量和所述转换后歌曲特征向量得到风格转换后的第二歌曲。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是歌曲转换设备的内部存储单元,例如硬盘。存储器11在另一些实施例中也可以是歌曲转换设备的外部存储设备,例如插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括歌曲转换设备的内部存储单元也包括可以外部存储设备。存储器11不仅可以用于存储安装于歌曲转换设备的应用软件及各类数据,例如歌曲转换的程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行歌曲转换的程序01等。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:

将所述风格特征向量、所述词特征向量和所述曲特征向量进行拼接,得到第一拼接向量;

将所述第一拼接向量进行编码得到所述转换后歌曲特征向量。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:

将所述第一拼接向量使用前馈神经网络模型进行编码得到所述转换后歌曲特征向量。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:

将所述词特征向量和所述转换后歌曲特征向量进行拼接,得到第二拼接向量;

将所述第二拼接向量进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:

将所述第二拼接向量通过长短时记忆网络模型进行解码得到所述第一歌曲的所述词部和风格转换后的所述第二歌曲。

可选地,所述处理器12用于执行所述计算机程序时还实现如下步骤:

获取和谐度判断向量,根据所述和谐度判断向量和所述第二拼接向量,计算风格转换和谐度值。

可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:

将所述词部和所述曲部通过transformer模型进行编码,得到所述词特征向量和所述曲特征向量。

此外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述实施例公开的任一种歌曲转换方法的步骤。

本申请所提供的歌曲转换设备、计算机可读存储介质与前述歌曲转换方法相对应。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、设备和存储介质的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

综上,本申请实施例可以在保持转换后的词曲协调的基础上高效地进行目标风格的歌曲风格转换。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类、设备类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种歌曲转换方法、装置、设备以及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1