一种基于共同语义空间的个性化音乐生成方法及装置与流程

文档序号：12736546阅读：来源：国知局

技术特征：

1.一种基于共同语义空间的个性化音乐生成方法，其特征在于：包括以下步骤：

S1、将文字映射到共同语义空间表示；

S2、将共同语义空间表示转化为乐曲；

S3、将文字蕴含的风格和意境隐含到语义空间表示中，并体现在生成的乐曲中。

2.根据权利要求1所述的一种基于共同语义空间的个性化音乐生成方法，其特征在于：所述的步骤S1和S2均通过基于RNN的编码器来实现。

3.根据权利要求1所述的一种基于共同语义空间的个性化音乐生成方法，其特征在于：所述的共同语义空间是指将文字和音乐映射到在同一个语义空间中。

4.根据权利要求2所述的一种基于共同语义空间的个性化音乐生成方法，其特征在于：包括以下步骤；

A、输入输出格式如下：

文字对应的输入格式：

音符对应的输出格式：

其中：

K_x和K_y分别是文字和音符的字符个数，T_x和T_y分别是一段文字和对应音符的长度；

B、对于encoder；

在encoder阶段使用bidirectional recurrent neural network构建，下面是生成正向隐层的步骤：

其中：

是文字字符对应的词向量矩阵；和是权重矩阵；是偏置向量，m是词向量的维度，n是隐层数；

反向隐层通过相似的计算获得；

拼接正向和反向隐层向量获得如下所示：

C、对于decoder:

在Decoder阶段，生成隐层状态设为s_t的步骤，如下：

其中：

是音符字符对应的词向量矩阵。W_o,W_C,W_i,W_f∈R^n×m，U_o,U_C,U_t,U_f∈R^n×n和C_o,C_C,C_i,C_f∈R^n×2n是权重矩阵，是偏置向量，m是词向量的维度，n是隐层数；

生成下一个音符条件概率的公式如下：

y_t＝argmax_y p(y|s_t,c,y_t-1) (16)

D、代价函数:

使用交叉熵代价函数：

5.实现如权利要求1-4中任意一项所述的一种基于共同语义空间的个性化音乐生成方法的装置，其特征在于，包括将文字映射到共同语义空间表示的影射模块和用于将共同语义空间表示转化为乐曲的转化模块。

完整全部详细技术资料下载

当前第2页1 2 3