本申请涉及数据处理,尤其涉及一种诗文生成方法和装置。
背景技术:
1、诗文生成是根据用户给定的语句或者描述信息等,借助人工智能等技术生成诗句或者诗歌等诗文。
2、但是,目前生成的诗文的音韵节奏较差,使得生成的诗文在音韵节奏上难以满足要求,导致生成的诗文质量不高。
技术实现思路
1、一方面,本申请提供了一种诗文生成方法,包括:
2、获得用于生成诗文中语句的参考语句;
3、基于编码模块,确定所述参考语句的语句特征,基于所述参考语句的语句特征确定所述参考语句相应的目标语句的预测语句特征;
4、基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,以得到所述目标语句。
5、在一种可能的实现方式中,所述基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,包括:
6、通过第一解码模块结合所述参考语句的语句特征确定出所述参考语句的韵律分布特征,基于所述预测语句特征、所述韵律分布特征以及预置的信息库中不同字词的词向量和韵律特征,确定构成所述目标语句的至少一个字词对应的第一语句特征;
7、通过第二解码模块结合所述参考语句的语句特征确定所述参考语句的语义特征,基于所述第一语句特征、所述参考语句的语义特征以及预置的信息库中不同字词的词向量,确定出组成所述目标语句的各字词。
8、在又一种可能的实现方式中,所述基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,包括:
9、通过第三解码模块结合所述参考语句的语句特征确定所述参考语句的语义特征,基于所述预测语句特征、所述参考语句的语义特征以及预置的信息库中不同字词的词向量,确定构成所述目标语句的至少一个字词对应的第二语句特征;
10、通过第四解码模块结合所述参考语句的语句特征确定所述参考语句的韵律分布特征,基于所述第二语句特征、所述韵律分布特征以及预置的信息库中不同字词的词向量,确定出组成所述目标语句的各字词。
11、在又一种可能的实现方式中,所述韵律分布特征包括组成所述参考语句的各个参考字词的参考韵律特征;
12、所述基于所述预测语句特征、所述韵律分布特征以及预置的信息库中不同字词的词向量和韵律特征,确定构成所述目标语句的至少一个字词对应的第一语句特征,包括:
13、基于所述预测语句特征、所述参考语句中各字词的参考韵律特征以及预置的信息库中不同字词的词向量和韵律特征,确定组成所述目标语句的至少一个第一候选字词,得到由所述多个第一候选字词的词向量构成的所述目标语句的第一语句特征;
14、其中,每个第一候选字词的韵律特征与所述参考语句处于目标位置上的参考字词的韵律特征相配,所述目标位置为所述第一候选字词在所述目标语句的位置。
15、在又一种可能的实现方式中,所述基于所述第二语句特征、所述韵律分布特征以及预置的信息库中不同字词的词向量,确定出组成所述目标语句的各字词,包括:
16、基于所述第二语句特征以及预置的信息库中不同字词的词向量,确定能够组成所述目标语句且韵律特征的分布与所述韵律分布特征的相似度超过设定阈值的至少一个字词。
17、在又一种可能的实现方式中,所述基于所述第一语句特征、所述参考语句的语义特征以及预置的信息库中不同字词的词向量,确定出组成所述目标语句的各字词,包括:
18、基于预置的信息库中不同字词的词向量,确定出词向量与第一语句特征相似且词向量表征的语义与所述参考语句的语义特征具有关联的至少一个字词,得到构成所述目标语句的至少一个字词。
19、在又一种可能的实现方式中,所述基于所述预测语句特征、所述参考语句的语义特征以及预置的信息库中不同字词的词向量,确定构成所述目标语句的至少一个字词对应的第二语句特征,包括:
20、基于预测语句特征以及预置的信息库中不同字词的词向量,确定词向量与所述预测语句特征相似且词向量表征的语义与所述参考语句的语义特征具有关联的至少一个第二候选字词,得到所述至少一个第二候选字词的词向量构成的第二语句特征。
21、在又一种可能的实现方式中,所述第一解码模块和第二解码模块为基于多篇诗文样本中的各条语句样本,以最大化所述语句样本对应的生成语句与所述语句样本实际对应的关联语句样本的语义相关性为训练目标训练得到的;
22、或者,所述第三解码模块和第四解码模块为基于多篇诗文样本中各条语句样本,以最大化所述语句样本对应的生成语句与所述语句样本实际对应的关联语句样本之间的语义相关性和韵律分布特征的相似度为训练目标训练得到的。
23、在又一种可能的实现方式中,所述获得用于生成语句的参考语句,包括:获得待生成的目标语句之前的至少一条参考语句;
24、所述基于编码模块,确定所述参考语句的语句特征,基于所述参考语句的语句特征确定所述参考语句对应的目标语句的预测语句特征,包括:
25、基于编码模块,确定所述至少一条参考语句中最后一条参考语句的语句特征,基于所述最后一条参考语句的语句特征确定所述目标语句的预测语句特征;
26、所述方法还包括:获得历史上确定出的所述至少一条参考语句中所述最后一条参考语句之外的其他参考语句的语句特征;
27、所述基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,包括:
28、基于解码模块的两个阶段解码,确定出所述至少一条参考语句中的首条参考语句或者第二条参考语句的语句特征对应的韵律分布特征以及各条参考语句的语句特征对应的语义特征,并结合所述预测语句特征、所述韵律分布特征和各条参考语句的语义特征,确定组成所述目标语句的各字词。
29、又一方面,本申请还提供了一种诗文生成装置,包括:
30、语句获得单元,用于获得用于生成诗文中语句的参考语句;
31、特征编码单元,用于基于编码模块,确定所述参考语句的语句特征,基于所述参考语句的语句特征确定所述参考语句相应的目标语句的预测语句特征;
32、特征解码单元,用于基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,以得到所述目标语句。
1.一种诗文生成方法,包括:
2.根据权利要求1所述的诗文生成方法,所述基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,包括:
3.根据权利要求1所述的诗文生成方法,所述基于解码模块的两个阶段解码,确定出所述参考语句的语句特征对应的韵律分布特征和语义特征,并结合所述预测语句特征、所述韵律分布特征和语义特征,确定组成所述目标语句的各字词,包括:
4.根据权利要求2所述的诗文生成方法,所述韵律分布特征包括组成所述参考语句的各个参考字词的参考韵律特征;
5.根据权利要求3所述的诗文生成方法,所述基于所述第二语句特征、所述韵律分布特征以及预置的信息库中不同字词的词向量,确定出组成所述目标语句的各字词,包括:
6.根据权利要求2所述的诗文生成方法,所述基于所述第一语句特征、所述参考语句的语义特征以及预置的信息库中不同字词的词向量,确定出组成所述目标语句的各字词,包括:
7.根据权利要求3所述的诗文生成方法,所述基于所述预测语句特征、所述参考语句的语义特征以及预置的信息库中不同字词的词向量,确定构成所述目标语句的至少一个字词对应的第二语句特征,包括:
8.根据权利要求2或3所述的诗文生成方法,所述第一解码模块和第二解码模块为基于多篇诗文样本中的各条语句样本,以最大化所述语句样本对应的生成语句与所述语句样本实际对应的关联语句样本的语义相关性为训练目标训练得到的;
9.根据权利要求1所述的诗词生成方法,所述获得用于生成语句的参考语句,包括:获得待生成的目标语句之前的至少一条参考语句;
10.一种诗文生成装置,包括: