基于人工智能的话术改写方法、装置、设备及存储介质与流程

文档序号:36399318发布日期:2023-12-16 01:21阅读:22来源:国知局
基于人工智能的话术改写方法与流程

本申请实施例涉及人工智能,特别涉及一种基于人工智能的话术改写方法、装置、设备及存储介质。


背景技术:

1、随着科技的不断发展,自然语言处理(nature language processing,简称nlp)的研究受到了人们的重视。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

2、在电子竞技领域,基于人工智能的游戏解说正崭露头角。在智能解说中,目前的话术改写技术是人工对每个事件进行不同的描述而形成话术池,之后根据事件随机从话术池中选择需要讲解的话术。

3、然而,上述方法在对事件进行不同描述时,需要消耗大量的人力和时间,而且需要不断更新话术池以适应不断变化的个性化需求。


技术实现思路

1、本申请实施例提供了一种基于人工智能的话术改写方法、装置、设备及存储介质。本申请实施例提供的技术方案如下:

2、根据本申请实施例的一个方面,提供了一种基于人工智能的话术改写方法,所述方法包括:

3、获取指定领域的语料数据;

4、采用所述语料数据对第一语言模型进行预训练,得到预训练后的第一语言模型,所述预训练后的第一语言模型具有理解和处理所述指定领域的信息的能力;

5、基于所述语料数据,生成适用于所述指定领域的话术改写任务的至少一条指令数据,所述指令数据用于对所述指定领域的输入文本进行话术风格改写,生成所述输入文本对应的输出文本;

6、采用所述指令数据对所述预训练后的第一语言模型进行调整,得到调整后的第一语言模型,所述调整后的第一语言模型用于执行所述指定领域的话术改写任务。

7、根据本申请实施例的一个方面,提供了一种基于人工智能的话术改写装置,所述装置包括:

8、获取模块,用于获取指定领域的语料数据;

9、预训练模块,用于采用所述语料数据对第一语言模型进行预训练,得到预训练后的第一语言模型,所述预训练后的第一语言模型具有理解和处理所述指定领域的信息的能力;

10、生成模块,用于基于所述语料数据,生成适用于所述指定领域的话术改写任务的至少一条指令数据,所述指令数据用于对所述指定领域的输入文本进行话术风格改写,生成所述输入文本对应的输出文本;

11、调整模块,用于采用所述指令数据对所述预训练后的第一语言模型进行调整,得到调整后的第一语言模型,所述调整后的第一语言模型用于执行所述指定领域的话术改写任务。

12、根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现上述基于人工智能的话术改写方法。

13、根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序用于被处理器执行,以实现上述基于人工智能的话术改写方法。

14、根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机程序,以实现上述基于人工智能的话术改写方法。

15、本申请实施例提供的技术方案至少包括如下有益效果:

16、通过采用指定领域的语料数据对第一语言模型进行预训练,使预训练后的第一语言模型具备指定领域相关知识,然后从上述指定领域的语料数据中挖掘生成适用于指定领域的话术改写任务的指令数据,采用该指令数据对预训练后的第一语言模型进行调整,最终得到的调整后的第一语言模型能够用于执行指定领域的话术改写任务;本申请通过训练第一语言模型得到话术改写模型,利用该话术改写模型可以实现自动化的话术改写任务,充分降低了人力和时间成本;并且,使用指令增强的方法来提高第一语言模型在话术改写任务上的效果,使得最终训练得到的话术改写模型能够在指定领域的话术改写任务上达到高质量的改写效果。



技术特征:

1.一种基于人工智能的话术改写方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述语料数据,生成适用于所述指定领域的话术改写任务的至少一条指令数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述泛化任务指令数据和所述指定领域的领域树,生成至少一条迁移指令,包括:

4.根据权利要求2所述的方法,其特征在于,所述根据所述迁移指令和所述指定领域的数据池,生成适用于所述指定领域的话术改写任务的至少一条指令数据,包括:

5.根据权利要求2所述的方法,其特征在于,所述根据所述种子指令数据,生成至少一条泛化任务指令数据,包括:

6.根据权利要求1所述的方法,其特征在于,所述采用所述指令数据对所述预训练后的第一语言模型进行调整,得到调整后的第一语言模型,包括:

7.根据权利要求1所述的方法,其特征在于,所述获取指定领域的语料数据,包括:

8.根据权利要求7所述的方法,其特征在于,所述对所述原始语料数据进行数据清洗,得到所述语料数据,包括:

9.根据权利要求1所述的方法,其特征在于,所述采用所述语料数据对第一语言模型进行预训练,得到预训练后的第一语言模型,包括:

10.根据权利要求1所述的方法,其特征在于,所述获取指定领域的语料数据之后,还包括:

11.一种基于人工智能的话术改写装置,其特征在于,所述装置包括:

12.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如权利要求1至10任一项所述的方法。

13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序用于被处理器执行,以实现如权利要求1至10任一项所述的方法。

14.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至10任一项所述的方法。


技术总结
一种基于人工智能的话术改写方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:获取指定领域的语料数据;采用语料数据对第一语言模型进行预训练,得到预训练后的第一语言模型;基于语料数据,生成适用于指定领域的话术改写任务的至少一条指令数据,指令数据用于对指定领域的输入文本进行话术风格改写,生成输入文本对应的输出文本;采用指令数据对预训练后的第一语言模型进行调整,得到调整后的第一语言模型,调整后的第一语言模型用于执行指定领域的话术改写任务。实现了自动化的话术改写,降低了人力和时间成本,并且使用指令增强的方法来提高模型在话术改写任务上的效果,使得最终训练得到的模型能够在达到高质量的改写效果。

技术研发人员:李鸣霄,唐然,李峰,冯尧,安东岳,陈祺,陈梓阳,杜楠
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1