为歌词文本生成乐曲的方法、装置及计算机可读存储介质与流程

文档序号：16542291发布日期：2019-01-08 20:31阅读：308来源：国知局

本公开涉及互联网技术领域，特别涉及一种为歌词文本生成乐曲的方法、装置及计算机可读存储介质。

背景技术：

根据歌词进行乐曲创作对专业要求度很高，一般需要运用大量相关的音乐知识比如基本乐理、和声学、复调、配器法、曲式结构等来进行创作。所以通常乐曲的创作都是由具有丰富音乐相关理论知识的人士完成。而对于缺乏音乐理论知识的普通大众来说，根据歌词进行乐曲的创作基本是不可能的。

因此需要一种可以实现根据歌词自动进行乐曲创作的方法，从而可以让普通大众也可以参与到乐曲创作中。

技术实现要素：

本发明的目的在于提供一种可以实现根据歌词自动进行乐曲创作的方法，为了实现该发明目的，本公开提供了一种为歌词文本生成乐曲的方法、装置及计算机可读存储介质。

一种为歌词文本生成乐曲的方法，所述方法包括：

获取歌词文本，所述歌词文本是若干词所顺序构成的序列；

对所述歌词文本进行特征提取获得所述序列映射的文本特征；

进行所述文本特征与语料库中歌词特征之间的特征匹配，获得所述文本特征对应的歌词特征；

通过所训练的随机森林分类器对获得的所述歌词特征进行所述序列中词所对应旋律和节奏的预测，生成适配于所述歌词文本的乐曲数据。

在一示例性实施例中，所述获取歌词文本之前，所述方法还包括：

从样本数据中的歌词样本文本提取歌词特征，从所述样本数据中对应于所述歌词样本文本的乐曲数据提取节奏特征和旋律特征；

由所述歌词特征、节奏特征和旋律特征构建所述语料库；

通过所述歌词特征、节奏特征和旋律特征进行所述随机森林分类器的迭代训练，直至所训练得到的随机森林分类器对已知歌曲文本的旋律和节奏的预测达到指定精度，则停止所述随机森林分类器的迭代训练。

在一示例性实施例中，所述随机森林分类器包括节奏分类器和旋律分类器，所述通过所训练的随机森林分类器对获得的所述歌词特征进行所述序列中词所对应旋律和节奏的预测，生成适配于所述歌词文本的乐曲数据，包括：

通过所述节奏分类器预测得到所述歌词特征对应的节奏特征；

将所述歌词特征和所述节奏特征输入到所述旋律分类器预测得到所述歌词特征对应的旋律特征；

组合所得到的所述节奏特征和所述旋律特征，生成适配于所述歌词文本的乐曲数据。

在一示例性实施例中，所述组合所得到的所述节奏特征和所述旋律特征，生成适配于所述歌词文本的乐曲数据，包括：

通过所得到的所述节奏特征和所述旋律特征，生成所述序列中词对应的音符信息；

组合所述序列中词对应的音符信息，生成所述歌词文本的乐曲数据。

在一示例性实施例中，所述组合所述序列中词对应的音符信息，生成所述歌词文本的乐曲数据，包括：

按照所述序列中词的顺序组合所述序列中词对应的音符信息，生成所述歌词文本对应的音符序列；

根据设定的音符阈值过滤所述音符序列；

通过过滤后的所述音符序列生成所述歌词文本的乐曲数据。

一种为歌词文本生成乐曲的装置，所述装置包括：

获取模块，被配置为执行：获取歌词文本，所述歌词文本是若干词所顺序构成的序列；

文本特征提取模块，被配置为执行：对所述歌词文本进行特征提取获得所述序列映射的文本特征；

特征匹配模块，被配置为执行：进行所述文本特征与语料库中歌词特征之间的特征匹配，获得所述文本特征对应的歌词特征；

乐曲数据生成模块，被配置为执行：通过所训练的随机森林分类器对获得的所述歌词特征进行所述序列中词所对应旋律和节奏的预测，生成适配于所述歌词文本的乐曲数据。

在一示例性实施例中，所述装置还包括：

特征提取模块，被配置为执行：从样本数据中的歌词样本文本提取歌词特征，从所述样本数据中对应于所述歌词样本文本的乐曲数据提取节奏特征和旋律特征；

语料库构建模块，被配置为执行：由所述歌词特征、节奏特征和旋律特征构建所述语料库；

训练模块，被配置为执行：通过所述歌词特征、节奏特征和旋律特征进行所述随机森林分类器的迭代训练，直至所训练得到的随机森林分类器对已知歌曲文本的旋律和节奏的预测达到指定精度，则停止所述随机森林分类器的迭代训练。

在一示例性实施例中，所述随机森林分类器包括节奏分类器和旋律分类器，所述乐曲数据生成模块包括：

节奏特征获得单元，被配置为执行：通过所述节奏分类器预测得到所述歌词特征对应的节奏特征；

旋律特征获得单元，被配置为执行：将所述歌词特征和所述节奏特征输入到所述旋律分类器预测得到所述歌词特征对应的旋律特征；

乐曲数据生成单元，被配置为执行：组合所得到的所述节奏特征和所述旋律特征，生成适配于所述歌词文本的乐曲数据。

在一示例性实施例中，所述乐曲数据生成单元包括：

音符信息生成单元，被配置为执行：通过所得到的所述节奏特征和所述旋律特征，生成所述序列中词对应的音符信息；

音符信息组合单元，被配置为执行：组合所述序列中词对应的音符信息，生成所述歌词文本的乐曲数据。

在一示例性实施例中，所述音符信息组合单元包括：

音符序列生成单元，被配置为执行：按照所述序列中词的顺序组合所述序列中词对应的音符信息，生成所述歌词文本对应的音符序列；

过滤单元，被配置为执行：根据设定的音符阈值过滤所述音符序列；

乐曲数据生成单元，被配置为执行：通过过滤后的所述音符序列生成所述歌词文本的乐曲数据。

一种为歌词文本生成乐曲的装置，所述装置包括：

处理器；以及

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行以上任一项所述的为歌词文本生成乐曲的方法。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以上任一项所述的为歌词文本生成乐曲的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：通过对歌词文本进行特征提取、特征匹配、节奏和旋律预测，实现根据所获取的歌词文本自动生成该歌词文本对应的乐曲数据，用户无需掌握专业的音乐知识即可实现根据歌词文本进行乐曲创作，从而普通大众可以利用本发明根据歌词文本进行乐曲的自动生成。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并于说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的本发明所涉及的实施环境示意图

图2是根据一示例性实施例示出的一种装置200的框图；

图3是根据一示例性实施例示出的一种为歌词文本生成乐曲的方法的流程图；

图4是图3所示实施例步骤s110之前的步骤在一示例性实施例中的流程图；

图5是图3所示实施例的步骤s170在一示例性实施例中的流程图；

图6是图5所示实施例的步骤s175在一示例性实施例中的流程图；

图7是图6所示实施例的步骤s303在一示例性实施例中的流程图；

图8是根据一示例性实施例示出的一种为歌词文本生成乐曲的装置框图；

图9是根据另一示例性实施例示出的一种为歌词文本生成乐曲的装置框图；

图10是图8所示实施例的模块170在一示例性实施例中的框图；

图11是图10所示实施例的乐曲数据生成单元175在一示例性实施例中的框图；

图12是图11所示实施例的音符信息组合单元303在一示例性实施例中的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的本发明所涉及的实施环境示意图。该实施环境为建立网络通信连接的终端100和服务器200，其中服务器200作为本发明为歌词文本生成乐曲的后端实现。

其中终端100可以是台式电脑、笔记本电脑、平板电脑、智能手机或者其他可供为歌词文本生成乐曲的客户端运行以及具备网络连接功能的通信设备，在此不进行限定。

终端100可以发起生成乐曲数据的请求，并提供歌词文本，从而服务器300接收终端100发起的请求，并根据终端100所提供的歌词文本实现为该歌词文本生成乐曲数据，然后将生成乐曲数据输出到终端100，在一种示例性实施例中，服务器300可以是网页服务器，还可以是app服务器。

图2是根据一示例性实施例示出的一种服务器的硬件结构框图。具有此硬件结构的服务器可用于为歌词文本生成乐曲数据而部署在图1所示的实施环境中。

需要说明的是，该服务器200只是一个适配于本发明的示例，不能认为是提供了对本发明的使用范围的任何限制。该服务器200也不能解释为需要依赖于或者必须具有图2中示出的示例性的服务器200中的一个或者多个组件。

该服务器的硬件结构可因配置或者性能的不同而产生较大的差异，如图2所示，服务器200包括：电源210、接口230、至少一存储器250、以及至少一处理器(cpu,centralprocessingunits)270。

其中，电源210用于为服务器200上的各硬件设备提供工作电压。

接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一usb接口237等，用于与外部设备通信。在一示例性实施例中，可以通过无线网络接口与图1实施环境中的终端100通信。

存储器250作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源包括操作系统251、应用程序253及数据255等，存储方式可以是短暂存储或者永久存储。其中，操作系统251用于管理与控制服务器200上的各硬件设备以及应用程序253，以实现处理器270对海量数据255的计算与处理，其可以是windowsservertm、macosxtm、unixtm、linuxtm、freebsdtm等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序，其可以包括至少一模块(图2中未示出)，每个模块都可以分别包含有对服务器200的一系列计算机可读指令。数据255可以是存储于磁盘中的照片、图片等。

处理器270可以包括一个或多个以上的处理器，并设置为通过总线与存储器250通信，用于运算与处理存储器250中的海量数据255。

如上面所详细描述的，适用本发明的服务器200将通过处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成为歌词文本生成乐曲。

此外，通过硬件电路或者硬件电路结合软件也能同样实现本发明，因此，实现本发明并不限于任何特定硬件电路、软件以及两者的组合。

图3是根据一示例性实施例示出的为歌词文本生成乐曲的方法的流程图，如图3所示，该实施例的方法包括：

步骤s110，获取歌词文本，歌词文本是若干词所顺序构成的序列。

词是歌词文本中的最小单位，例如“还没好好的感受，雪花绽放的气候”这一句歌词文本中，歌词文本中的每个字即为该歌词文本的词。当然歌词文本的语言不限，对于中文文本其中的字即为该歌词文本的词，对于英文文本，其中的单词即为该歌词文本的词，在此不进行限定。

在一实施例中，所获取的歌词文本可以是用户在交互界面中输入的文本，从而作为生成乐曲的歌词文本。其中，歌词文本的长度不限，可以是一句文本，也可以是一段文本。在另一实施例中，交互界面还可以展示服务器推荐的歌词文本，用户可以在交互界面上对所推荐的歌词文本进行选择操作，服务器根据用户的选择操作将所选择的歌词文本输入到服务器中。在另一实施例中，服务器还提供歌词文本字数调整选项，从而用户可以在输入文本的基础上，进行文本的字数调整，然后将调整后的文本作为生成乐曲的歌词文本。

步骤s130，对歌词文本进行特征提取获得序列映射的文本特征。

对歌词文本进行特征提取即从歌词文本中获取该歌词文本对应的音节信息，即用文本特征来反映歌词文本的音节信息，其中，歌词文本中每个词对应一个音节。

其中反映歌词文本音节信息的文本特征包括但不仅限于：歌词文本中各词的音节类型、音节数、字频率、字罕见度。其中，音节类型是指歌词中该词对应音节的分类，可以是：单音节、起始音节、中央音节、结束音节等。音节数是指音节的数量，字频率是指在该歌词文本中某字出现的频率；字罕见度是在字频率的函数，其中：

字罕见度＝2*(1-(log10字频率)/7)

歌词文本唯一对应文本特征，即所提取的文本特征为序列映射的文本特征，从而可以通过该文本特征所反映的音节信息来描述该歌词文本。

在一示例性实施例中，可以通过python编程的方式进行文本特征的提取，在预先编写的程序中设定提取歌词文本中各词的音节类型、字频率、以及字罕见度等文本特征的方法。例如，提取字频率的方法包括：先统计所获取的歌词文本的总字数，然后统计每个字在该歌词文本中出现的次数，某字出现的字频率为某字出现的次数/歌词文本的总字数。比如“你”字在一总字数为n的歌词文本中出现的次数为n1，然后根据公式：“你”在该歌词文本中出现的字频率＝n1/n；然后将计算得到的字频率输出，从而可以得到该字的字频率。当然，本示例仅仅是一种字频率提取的示例性实施例，并不能认为是对本发明的使用的限制。在其他实施例中，其他可以进行文本特征提取的技术和方法仍然适用于本发明，例如深度神经网络进行文本特征提取，在此不进行限制。

步骤s150，进行文本特征与语料库中歌词特征之间的特征匹配，获得文本特征对应的歌词特征。

语料库由若干首歌曲的音乐文件组成，其中音乐文件中包括了针对每首歌曲所提取的歌词特征、节奏特征和旋律特征。在一种实施例中，音乐文件在语料库以xml格式存在。值得说明的是，在进行文本特征匹配前，已经构建了该语料库。具体语料库的构建详见下文描述。

通过将文本特征与语料库中的歌词特征进行匹配，从而可以从语料库中匹配到与该文本特征相似的歌词特征，即文本特征对应的歌词特征。从而在后续的步骤，根据所匹配到的歌词特征进行节奏和旋律的预测。

以所提取的文本特征为音节类型、音节数、字频率、字罕见度为例，则所进行的文本特征与语料库中的歌词特征的匹配包括音节类型的匹配、音节数的匹配、字频率的匹配、以及字罕见度的匹配，从而通过匹配，可以从语料库中获得与该歌词文本的音节类型、音节数、字频率、字罕见度这些特征相似的歌词特征。

步骤s170，通过所训练的随机森林分类器对获得的歌词特征进行序列中词所对应旋律和节奏的预测，生成适配于歌词文本的乐曲数据。

根据上文提到的，由于语料库中存储了若干歌曲对应乐曲的节奏特征和旋律特征、以及歌曲对应歌词的歌词特征。

乐曲中音符的时长组合成了该乐曲的节奏。节奏特征用于反映音符的时长信息，比如音的起始、时值等。其中节奏特征可以包括：拍子记号、偏移量、测量偏移量、时值等。拍子记号是指歌词所对应乐曲中音符的拍子记号；偏移量是指音乐开始之前的节拍数量；测量偏移量是指开始测量音乐之前的节拍数量；时值是指乐曲中某字对应音符的时长。

乐曲中各个音符的音级组合成了该乐曲的旋律。旋律特征用于反映音符的音级信息。其中旋律特征可以包括：音调符号、音级、临时记号、弱拍等。其中音调符号是指歌词中某词对应音符的音调符号；音级是指歌词中某词对应音符的音级，临时记号是指直接放在音符前的变音记号；弱拍是指不带强音的单位拍。

歌词特征可以包括：歌词文本中各词的音节类型、音节数、字频率、字罕见度。

值得说明的是，以上所列举的节奏特征、旋律特征仅仅是适配于本发明的举例，不能认为是对本发明的使用的限制。在其他实施例中，节奏特征、旋律特征还可以包括除以上列举的特征外的特征，或者以上列举的某些特征与其他未列举特征的组合。

对应于每首歌曲，由于歌曲的歌词和乐曲是相对应的，从而语料库中的歌词特征是与节奏特征、旋律特征相对应的。从而可以在对歌词文本的文本特征与语料库中的歌词特征进行匹配的基础上，根据所获得文本特征对应的歌词特征进行对应旋律和节奏的预测。

其中，进行节奏和旋律的预测，即通过文本特征对应的歌词特征进行节奏特征和旋律特征的预测，然后根据所预测得到的节奏特征和旋律特征生成节奏和旋律，进而生成乐曲数据。

随机森林分类器是通过特征所构建的多个决策树组合而成，其中各个特征构成了决策树的节点。从而随机森林分类器可以非线性地把各个特征结合起来，而且不需要大量的样本数据来训练随机森林分类器，从而可以在保证所生成乐曲质量的基础上不需要大量的样本数据训练随机森林分类器。

在进行旋律和节奏的预测时，是根据随机森林分类器的各个节点处的特征来进行预测。以通过歌词特征进行节奏的预测为例，即随机森林分类器的输入是歌词特征，输出为节奏特征，那么在构建和训练随机森林分类器时，根据语料库中的歌词特征构建了该预测节奏的随机森林分类器，即语料库中的歌词特征确定了该随机森林分类器的各个节点出的特征以及判断条件，例如，把音节数、音节类型、字频率、字罕见度从上至下设置在随机森林分类器决策树的节点上然后根据各个节点上的判断条件，例如在音节数的这一节点上判断条件：如果音节数≤3，输出对应的时值；如果音节数＞3，根据音节类型判断输出的某一时值。同理，音节类型、字频率、子罕见度上也有相应的判断条件和基于不同条件对应的输出，从而可以基于歌词特征输出时值，当然，其他的节奏特征可以通过类似的决策树预测得到。从而可以通过文本特征对应的歌词特征和随机森林分类器预测得到该歌词特征对应的节奏特征，进而得到该歌词文本对应的节奏。

当然，可以通过类似的方法通过文本特征对应的歌词特征预测得到该歌词特征对应的旋律特征，实现旋律的预测。

然后根据预测得到的节奏特征、旋律特征形成歌词文本对应的节奏和旋律，进而生成歌词文本对应的乐曲数据。在一示例性实施例中，所生成的乐曲数据可以是xml格式的，还可以是midi格式的文件。

通过对歌词文本进行特征提取、特征匹配、节奏和旋律预测，实现根据所获取的歌词文本自动生成该歌词文本对应的乐曲数据，无需用户掌握专业的音乐知识即可实现根据歌词文本进行乐曲创作，从而普通大众也可以根据本发明进行乐曲创作。

图4是图3所示实施例步骤s110之前的步骤在一示例性实施例中的流程图，如图4所示，在步骤s110之前，该实施例的方法还包括：

步骤s210，从样本数据中的歌词样本文本提取歌词特征，从样本数据中对应于歌词样本文本的乐曲数据提取节奏特征和旋律特征。

样本数据是为了训练随机森林分类器所收集的若干首歌曲，其中所收集的每首歌曲均包括歌词和乐曲。歌词样本文本即为样本数据中歌曲的歌词。

其中歌词特征用于描述该样本数据的歌词，节奏特征和旋律特征分别用于描述该样本数据的节奏和旋律。或者说，歌词特征体现了歌词样本文本中每个词的音节信息，节奏特征体现了乐曲中音符的时值信息，旋律特征体现了乐曲中音符的音级信息，在每首歌曲中，音节是与音符相对应的，即歌词中的每个词对应一个音符。

为了保证随机森林分类器的预测效果，在一示例性实施例中，所使用的样本数据是单音轨、单乐器的歌曲，从而该样本数据中，歌词的每个词唯一对应一个音符。

在一示例性实施例中，所提取的歌词特征可以包括：音节类型、音节数、字频率、子罕见度等。所提取的节奏特征可以包括：拍子记号、偏移量、测量偏移量、时值等特征。所提取的旋律特征可以包括：音调符号、音级、临时记号、弱拍等。

需要说明的是，以上所示出的歌词特征、节奏特征、旋律特征的具体类别只是一个适配于本发明的示例，不能认为是提供了对本发明的使用范围的任何限制。也不能解释为需要都提取或者只能提取以上示例中具体的歌词特征、节奏特征、旋律特征才能实现本发明。在其他实施例中，可以提取比以上列举的具体类别的歌词特征、节奏特征以及旋律特征更多或者更少的特征来实施本发明。

当然，所提取的歌词特征、节奏特征、旋律特征能够越充分地描述该歌曲歌词以及对应的乐曲，可以更好地提高随机森林分类器的精度，使在根据歌词文本自动生成该歌词文本对应的乐曲数据时的精度更高。

在一示例性实施例中，提取歌词特征、节奏特征、旋律特征的方式可以是通过深度神经网络，通过深度神经网络提取各个特征(歌词特征、节奏特征以及旋律特征)。在另一示例性实施例中，可以通过python编程的方法提取各个具体的歌词特征、节奏特征以及旋律特征。在此不对提取特征的方式进行限定。

步骤s230，由歌词特征、节奏特征和旋律特征构建语料库。

所提取的各种歌词特征、节奏特征以及旋律特征作为随机森林分类器的语料库，从而根据该语料库进行随机森林分类器的训练以及训练完成后进行歌词文本对应的节奏和旋律的预测。当然语料库还可以包括样本数据的歌词样本文本和对应的乐曲数据，在一示例性实施例中，语料库中的各个样本数据可以以xml文件形式存在。

在一示例性实施例中，通过提取24首单音轨、单乐器的流行音乐的歌词特征、节奏特征、旋律特征来构建语料库，该语料库中包括59个特征，并有12358个观测值。其中观测值是指某一具体特征对应的取值，例如，音节类型这一特征，针对该特征的观测值可以是单音节、起始音节、中央音节以及结束音节。

步骤s250，通过歌词特征、节奏特征和旋律特征进行随机森林分类器的迭代训练，直至所训练得到的随机森林分类器对已知歌曲文本的旋律和节奏的预测达到指定精度，则停止随机森林分类器的迭代训练。

在一实施例中，通过将歌词特征输入到随机森林分类器中，根据随机森林分类器中预测得到的针对该歌词特征输出的节奏特征和旋律特征，将输出的节奏特征、旋律特征分别与该歌词特征实际对应的节奏特征、旋律特征进行对比，如果不相同，则调整随机森林分类器的参数，然后将该歌词特征重新输入到参数调整后的随机森林分类器中，判断根据预测结果输出的节奏特征和旋律特征是否与该歌词特征实际对应的节奏特征和旋律特征相同，如果不同，重复上述步骤；如果相同，则利用语料库中的下一组歌词特征进行随机森林分类器的训练。该过程即为随机森林分类器的迭代训练。

训练一段时间后，进行该随机森林分类器的评估，即评估该随机森林分类器的精度。

用若干样本数据的歌词特征、节奏特征、旋律特征训练随机森林分类器后，进行随机森林分类器的评估。评估的过程为：输入一首已有乐曲的歌曲对应的歌词特征，随机森林分类经预测输出对应的节奏特征、旋律特征，将经过随机森林获得的节奏特征、旋律特征与该歌词实际对应乐曲的节奏特征、旋律特征进行对比，从而计算得到随机森林分类器的精度。

在一实施例中，如果是用多首歌曲的歌词特征、节奏特征、旋律特征进行随机森林分类器的评估，将每首歌曲对应计算得到的随机森林分类器的精度求平均值，从而得到该随机森林分类器的精度。

如果计算所得精度达到指定精度，则完成随机森林分类器的训练；如果计算的预测精度未达到指定精度，则继续通过样本数据歌词特征、节奏特征、旋律特征训练随机森林分类器。

值得说明的是，进行随机森林分类器评估所使用的样本数据不同与训练时所使用的样本数据。举例来说，即如果训练随机森林分类器使用了样本数据中的“匆匆那年”这首歌曲对应的歌词特征、节奏特征和旋律特征，那么进行随机森林分类器评估时，就不能使用该首歌曲对应的歌词特征、节奏特征和旋律特征进行该随机森林分类器的评估。

在一示例性实施例中，随机森林分类器包括节奏分类器和旋律分类器，则随机森林分类器的评估可以分别评估节奏分类器和旋律分类器，从而评估后可以分别得到节奏分类器和旋律分类器的精度。

在一示例性实施例中，利用如上所述的24首流行音乐训练随机森林分类器后，旋律分类器的精度能达到72.28％，节奏分类器可以达到86.79％。

图5是图3所示实施例步骤s170在一示例性实施例中的流程图，在该实施例中，随机森林分类器包括节奏分类器和旋律分类器，如图5所示，步骤s170包括：

步骤s171，通过节奏分类器预测得到歌词特征对应的节奏特征。

节奏分类器是通过若干个决策树组合而成的预测节奏特征的模型，在本实施例中，通过歌词特征进行节奏特征的预测，对应的，节奏分类器的决策树各个节点由样本数据的歌词特征构建。

由于在随机森林分类器的语料库中，歌词特征有对应的节奏特征，通过节奏分类器可以预测得到该歌词特征对应的节奏特征，所得到的节奏特征可以是该歌词特征对应的拍子记号、偏移量、测量偏移量、时值等特征及其组合。

步骤s173，将歌词特征和节奏特征输入到旋律分类器预测得到歌词特征对应的旋律特征。

旋律分类器是通过若干个决策树组合而成的预测旋律特征的模型。在本实施例中，通过歌词特征和节奏特征来进行旋律特征的预测，相应的，旋律分类器的决策树各个节点由样本数据的歌词特征和节奏特征构建。

将节奏特征、歌词特征输入到旋律分类器中进行预测得到歌词特征对应的旋律特征，比如音级、弱拍、临时记号等特征或者其组合。

步骤s175，组合所得到的节奏特征和旋律特征，生成适配于歌词文本的乐曲数据。

通过组合所得到的节奏特征和旋律特征，得到了歌词文本中每个词的音节信息所对应的时值以及音高，从而每个词都会对应一个音符，按照歌词文本中词的顺序组合每个词所对应的音符，从而得到所获取的歌词文本的乐曲数据。

在一示例性实施例中，所生成的乐曲数据可以xml格式，还可以以midi格式。

需要说明的是，在本实施例中，先通过节奏分类器获得节奏特征，然后再通过旋律分类器获得旋律特征，最后组合节奏特征和旋律特征生成所获取的歌词文本的乐曲数据。该种生成乐曲数据的方式仅仅是步骤s170的一示例性实施例。

在其他实施例中，还可以通过将歌词特征输入到旋律分类器中获得旋律特征，然后将歌词特征和旋律特征输入到节奏分类器中获得节奏特征。相应的，该实施例中的旋律分类器的决策树各个节点由样本数据的歌词特征构建，节奏分类器的决策树各个节点由样本数据的歌词特征和旋律特征构建。最后组合所获得的旋律特征和节奏特征生成所获取的歌词文本对应的乐曲数据。

对于是先获得节奏特征还是旋律特征，在一示例性实施例中，可以根据步骤s250中所得到的随机森林分类器(包括节奏分类器和旋律分类器)的精度来确定，即如果经过训练后，节奏分类器的精度高于旋律分类器，可以先通过节奏分类器预测得到节奏特征然后再通过旋律分类器预测得到旋律特征；如果训练后，节奏分类器的精度低于旋律分类器，那么可以按照先旋律特征后节奏特征的方式生成乐曲数据。从而根据精度较高的分类器预测得到对应的特征可以提高整体预测结果的精度。在其他实施例中，还可以从其他角度决定是先获得节奏特征还是旋律特征。

图6是图5所示实施例的步骤s175在一示例性实施例中的流程图，如图6所示，步骤s175包括：

步骤s301，通过所得到的节奏特征和旋律特征，生成序列中词对应的音符信息。

组合所得到的节奏特征和旋律特征，从而得到歌词文本中的词对应的时值信息和音级信息，从而每个词会得到一个音符，即生成序列中词对应的音符信息。

在一示例性实施例中，在生成序列中词对应的音符信息时，结合已经生成的音符的特征生成后续的音符信息，例如，在生成一个音符信息时，结合前5个音符的特征(比如时值、音高等)，从而可以保证每个序列中每个词均生成对应的音符信息。

步骤s303，组合序列中词对应的音符信息，生成歌词文本的乐曲数据。

将歌词文本中词对应的音符信息进行组合，从而得到该歌词文本的乐曲数据。

图7图6所示实施例的步骤s303在一示例性实施例中的流程图，如图7所示，步骤s303包括：

步骤s3031，按照序列中词的顺序组合序列中词对应的音符信息，生成歌词文本对应的音符序列。

歌词文本中的词是顺序构成的序列，在根据节奏特征和旋律特征生成歌词文本中词所对应的音符信息后，将该音符信息按照歌词文本中词的顺序进行组合，得到歌词文本对应的音符序列。

步骤s3033，根据设定的音符阈值过滤音符序列。

其中过滤音符序列是指除去音符序列中的某些音符，其中所设定的音符阈值可以是某一具体的音符，也可以是某一范围内的音符。例如，如果想忽略较短的音符(比如1/16音符)，可以将1/16音符设定为阈值，即保留除1/16的音符外的其它音符，从而可以将原音符序列中的1/16音符去掉，保留其他的音符，得到新的音符序列。例如如果想忽略低于1/16音符的音符，从而可以根据设定的音符阈值除去音符序列中低于1/16音符的音符，比如1/32、1/64音符。

在一示例性实施例中，音符阈值可以根据实际需要进行调整，针对不同的歌词文本所设定的音符阈值可以不同，例如在某一段歌词文本中可以将音符阈值设定为1/64音符，从而除去音符序列中的1/64音符，而在另一段歌词文本中通过设定音符阈值过滤掉音符序列中的1/32音符。

步骤s3035，通过过滤后的音符序列生成歌词文本的乐曲数据。

下述为本公开装置实施例，可以用于执行本公开上述服务器200执行的为歌词文本生成乐曲方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开为歌词文本生成乐曲方法实施例。

图8是根据一示例性实施例示出的一种为歌词文本生成乐曲的装置的框图。该为歌词文本生成乐曲的装置可以用于图2所示服务器200中，上文方法实施例示出的为歌词文本生成乐曲的方法的全部或者部分步骤。如图8所示，该装置包括但不限于：获取模块110、文本特征提取模块130、特征匹配模块150以及乐曲数据生成模块170，其中：

获取模块110，被配置为执行：获取歌词文本，歌词文本是若干词所顺序构成的序列。

文本特征提取模块130，该模块与获取模块110连接，被配置为执行：对歌词文本进行特征提取获得序列映射的文本特征。

特征匹配模块150，该模块与文本特征提取模块130连接，被配置为执行：进行文本特征与语料库中歌词特征之间的特征匹配，获得文本特征对应的歌词特征。

乐曲数据生成模块170，该模块与特征匹配模块150连接，被配置为执行：通过所训练的随机森林分类器对获得的歌词特征进行序列中词所对应旋律和节奏的预测，生成适配于歌词文本的乐曲数据。