评论生成模型训练方法和装置、信息生成方法和装置与流程

文档序号:37146902发布日期:2024-02-26 17:00阅读:18来源:国知局
评论生成模型训练方法和装置、信息生成方法和装置与流程

本公开涉及人工智能,具体涉及自然语言处理、深度学习、大模型等,可应用于人工智能的内容生成等场景,尤其涉及一种评论生成模型训练方法和装置、信息生成方法和装置、电子设备以及计算机可读存储介质。


背景技术:

1、评论生成技术旨在针对输入的标题和正文等信息(如社交媒体短文本、新闻长文等),通过自然语言处理技术自动生成一系列多样化与输入内容相关的评论文本,能够增强社区互动的趣味性,提升读者参与度,还能够帮助相关部门进行负面舆情预判和正向舆论引导。


技术实现思路

1、本公开提供了一种评论生成模型训练方法和装置、信息生成方法和装置、电子设备以及计算机可读存储介质。

2、根据第一方面,提供了一种评论生成模型训练方法,该方法包括:获取文本样本集,文本样本集包括:至少一个第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到并拼接展示文本的特征向量和情感立场的特征向量,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,计算评论生成网络的评论损失值;基于评论损失值,对评论生成网络进行训练,得到训练完成的评论生成模型。

3、根据第二方面,提供了一种信息生成方法,该方法包括:获取待处理文本和待处理文本的情感立场文本;将待处理文本和待处理文本的情感立场文本输入采用如第一方面任一实现方式描述的方法生成的评论生成模型中,得到评论结果文本。

4、根据第三方面,提供了一种评论生成模型训练装置,该装置包括:样本获取单元,被配置成获取文本样本集,文本样本集包括:至少一个第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;网络获取单元,被配置成获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到并拼接展示文本的特征向量和情感立场的特征向量,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;评论得到单元,被配置成将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;计算单元,被配置成基于评论结果信息,计算评论生成网络的评论损失值;模型得到单元,被配置成基于评论损失值,对评论生成网络进行训练,得到训练完成的评论生成模型。

5、根据第四方面,又提供了一种信息生成装置,该装置包括:文本获取单元,被配置成获取待处理文本和待处理文本的情感立场文本;输入单元,被配置成将待处理文本和待处理文本的情感立场文本输入采用如第三方面任一实现方式描述的装置生成的评论生成模型中,得到评论结果文本。

6、根据第五方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面任一实现方式描述的方法。

7、根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面任一实现方式描述的方法。

8、本公开的实施例提供的评论生成模型训练方法和装置,首先,获取文本样本集,文本样本集包括:至少一个第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;其次,获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到并拼接展示文本的特征向量和情感立场的特征向量,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;再次,将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;从次,采基于评论结果信息,计算评论生成网络的评论损失值;最后,基于评论损失值,对评论生成网络进行训练,得到训练完成的评论生成模型。本公开的评论生成模型在训练过程中添加了真实场景中的情感、立场等维度的主观性文本,可以使生成评论结果信息可控,提高了评论生成模型得到的可靠性和准确性。

9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种评论生成模型训练方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述文本样本集还包括:至少一个第二文本样本,所述第二文本样本包括:展示文本以及与所述展示文本相关的情感立场文本、历史评论文本,所述编码器还用于对所述历史评论文本进行建模,得到评论特征,并在所述评论全局特征向量中拼接所述评论特征,得到回复全局特征向量;所述解码器用于对所述回复全局特征向量进行解码,得到回复结果信息;所述方法还包括:

3.根据权利要求2所述的方法,所述基于所述回复损失值和所述评论损失值,对所述评论生成网络进行训练,得到训练完成的评论生成模型包括:

4.一种信息生成方法,所述方法包括:

5.根据权利要求4所述的方法,所述评论生成模型还基于第二文本样本训练得到,所述第二文本样本包括:展示文本以及与所述展示文本相关的情感立场文本、历史评论文本,所述方法还包括:

6.根据权利要求5所述的方法,其中,所述评论生成模型包括:编码器和解码器,所述将所述待处理文本、所述待处理文本的情感立场文本以及所述评论结果文本输入所述评论生成模型,得到所述评论生成模型输出的回复结果文本包括:

7.根据权利要求6所述的方法,其中,所述方法还包括:

8.根据权利要求6所述的方法,其中,所述解码器包括词表,所述将所述回复全局特征向量输入所述解码器,得到所述解码器输出的回复结果文本包括:

9.根据权利要求8所述的方法,其中,所述基于所述排列序列,得到最小词汇集合包括:

10.一种评论生成模型训练装置,所述装置包括:

11.一种信息生成装置,所述装置包括:

12.一种电子设备,其特征在于,包括:

13.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述方法。


技术总结
本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。

技术研发人员:罗引,李庆晓,徐楠,王宇琪,曹家,王磊
受保护的技术使用者:北京中科闻歌科技股份有限公司
技术研发日:
技术公布日:2024/2/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1