文本生成方法以及装置与流程

文档序号:33463837发布日期:2023-03-15 05:52阅读:来源:国知局

技术特征:
1.一种文本生成方法,包括:获取对象属性信息和目标风格信息,其中,所述对象属性信息包括至少一个属性词;根据各所述属性词,生成各所述属性词之间的排列顺序;根据各所述属性词及所述目标风格信息,计算各所述属性词的目标词向量,其中,所述目标词向量融合了所述目标风格信息的风格特征;根据各所述属性词的目标词向量,预测各所述属性词的上下文;按照所述排列顺序,对各所述属性词和上下文进行排列,生成具有目标风格的对象描述文本。2.根据权利要求1所述的方法,所述根据各所述属性词,生成各所述属性词之间的排列顺序,包括:识别各所述属性词的属性类型;根据各所述属性词的属性类型,利用预先训练的排列顺序生成模型,生成各所述属性词之间的排列顺序。3.根据权利要求2所述的方法,在所述根据各所述属性词的属性类型,利用预先训练的排列顺序生成模型,生成各所述属性词之间的排列顺序之前,还包括:获取第一样本集,其中,所述第一样本集包括多个样本文本;提取第一样本文本中样本对象的各样本属性词,其中,所述第一样本文本为所述第一样本集中的任一样本文本;根据各所述样本属性词在所述第一样本文本中的相对位置关系,构建所述第一样本文本对应的属性词拓扑图;利用所述多个样本文本及各样本文本对应的属性词拓扑图,对预设学习模型进行训练,得到排列顺序生成模型。4.根据权利要求1所述的方法,所述根据各所述属性词及所述目标风格信息,计算各所述属性词的目标词向量,包括:对各所述属性词分别进行嵌入计算,得到各所述属性词对应的初始词向量;对所述目标风格信息进行嵌入计算,得到风格向量;将所述风格向量分别与各所述属性词对应的初始词向量进行融合,得到各所述属性词的目标词向量。5.根据权利要求1-4中任一项所述的方法,所述根据各所述属性词的目标词向量,预测各所述属性词的上下文,包括:将各所述属性词的目标词向量依次输入解码器进行上下文预测,获得各所述属性词的上下文,其中,所述解码器的训练方式,包括:获取第二样本集,其中,所述第二样本集包括多个样本文本,各样本文本携带有样本风格标签;提取第二样本文本中样本对象的各样本属性词,其中,所述第二样本文本为所述第二样本集中的任一样本文本;根据各所述样本属性词和所述样本风格标签,计算各所述样本属性词的样本目标词向量;利用解码器对各所述样本属性词的样本目标词向量进行解码,得到各所述样本属性词
的预测上下文;根据所述第二样本文本中各所述样本属性词的上下文和各所述样本属性词的预测上下文,对所述解码器进行训练。6.根据权利要求5所述的方法,所述根据各所述样本属性词和所述样本风格标签,计算各所述样本属性词的样本目标词向量,包括:对各所述样本属性词分别进行嵌入计算,得到各所述样本属性词对应的初始词向量;对各所述初始词向量进行掩码处理,得到各所述样本属性词对应的参考词向量;根据所述样本风格标签,分别对各所述参考词向量进行嵌入计算,得到各所述样本属性词对应的样本风格向量;分别将各所述样本属性词对应的样本风格向量与初始词向量进行融合,得到各所述样本属性词的样本目标词向量。7.根据权利要求5或6所述的方法,所述获取第二样本集,包括:从直播平台获取口语化风格的商品介绍台本,和/或,从电商平台获取书面化风格的商品介绍文章;根据所述商品介绍台本和/或所述商品介绍文章,构建第二样本集。8.根据权利要求5或6所述的方法,在所述获取第二样本集之后,还包括:根据第三样本文本,生成第四样本文本,其中,所述第三样本文本为所述第二样本集中任一样本文本,所述第四样本文本与所述第三样本文本具有不同风格;识别所述第四样本文本的文本特征;根据所述第四样本文本的文本特征,计算所述第四样本文本的样本置信度;若所述第四样本文本的样本置信度满足预设的样本置信度条件,将所述第四样本文本添加至所述第二样本集。9.根据权利要求8所述的方法,所述语义特征包括各词语间的关系特征、语义特征和样本风格标签中的至少一个;所述识别所述第四样本文本的文本特征,包括以下步骤中的至少一个:根据所述第四样本文本中各词语间的关系特征,计算所述第四样本文本的文本流畅度;根据所述第四样本文本的文本特征和所述第二样本集中样本文本的语义特征,计算所述第四样本文本的语义相似度;根据所述第四样本文本的样本风格标签和指定样本风格标签,计算所述第四样本文本的风格准确度。10.根据权利要求1所述的方法,所述对象属性信息包括商品属性信息,所述目标风格信息包括书面化风格信息和/或口语化风格信息,所述对象描述文本包括商品摘要文本;所述获取目标风格信息,包括:获取应用场景标识;根据所述应用场景标识,确定目标风格信息;在所述生成具有目标风格的对象描述文本之后,还包括:在所述目标风格信息为口语化风格信息的情况下,将具有口语化风格的所述商品摘要文本发送至直播平台的主播客户端;
在所述目标风格信息为书面化风格信息的情况下,将具有书面化风格的所述商品摘要文本发送至电商平台的服务端。11.根据权利要求1所述的方法,所述获取目标风格信息,包括:获取风格文本;对所述风格文本进行风格识别,获得目标风格信息。12.一种文本生成装置,包括:获取模块,被配置为获取对象属性信息和目标风格信息,其中,所述对象属性信息包括至少一个属性词;排列顺序生成模块,被配置为根据各所述属性词,生成各所述属性词之间的排列顺序;计算模块,被配置为根据各所述属性词及所述目标风格信息,计算各所述属性词的目标词向量,其中,所述目标词向量融合了所述目标风格信息的风格特征;预测模块,被配置为根据各所述属性词的目标词向量,预测各所述属性词的上下文;生成模块,被配置为按照所述排列顺序,对各所述属性词和上下文进行排列,生成具有目标风格的对象描述文本。13.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述文本生成方法的步骤。14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述文本生成方法的步骤。

技术总结
本说明书实施例提供文本生成方法以及装置,其中所述文本生成方法包括:获取对象属性信息和目标风格信息,根据各属性词,生成各属性词之间的排列顺序,根据各属性词及目标风格信息,计算各属性词的目标词向量,根据各属性词的目标词向量,预测各属性词的上下文,按照排列顺序,对各属性词和上下文进行排列,生成具有目标风格的对象描述文本。根据各属性词的排列顺序对各属性词和上下文进行排列,保证了生成的对象描述文本的语义一致性,提升了生成的对象描述文本的文本流畅度和准确性,根据目标词向量预测各属性词的上下文,使得各属性词的上下文可以体现出目标风格的风格特征,增强了对象描述文本的适用性。了对象描述文本的适用性。了对象描述文本的适用性。


技术研发人员:林旭鸣 井立强 赵中州 周伟 陈海青
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:2022.09.22
技术公布日:2023/3/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1