生成式大模型训练方法、基于模型的人机协同交互方法与流程

文档序号：36266167发布日期：2023-12-06 10:39阅读：42来源：国知局

本发明涉及人工智能，特别涉及生成式大模型训练方法、基于模型的人机协同交互方法。

背景技术：

1、大型语言模型(llm，largelanguagemodel，其本质是生成式模型，因此也可以被简称为：生成式大模型，本公开后续将统一此表述来指代此类模型)，如chatgpt(chatgenerativepre trainedtransformer，是openai机构研发的聊天机器人程序)，能够为许多下游任务(例如面向任务的对话和问题解答)生成类似人类的流畅响应。然而，将llm应用于现实世界中的任务解决型应用仍然具有挑战性，其在对话过程中无法模仿他人的对话速度，不同的人适应语速程度不同，不能满足较好的对话体验感。

技术实现思路

1、本申请的目的在于提供生成式大模型训练方法、基于模型的人机协同交互方法，以解决上述背景技术中提出的问题。

2、为实现上述目的，本申请提供如下技术方案：生成式大模型训练方法、基于模型的人机协同交互方法，包括获取智能对话中的问答语句；

3、基于预先训练的语速分类器，对所述智能对话中的用户的问答语句通过语速分类器进行速度标记，得到具有语句速度标签的问答语句，形成第一训练集；

4、利用第一训练集对预先训练好的第一生成式大模型进行监督微调训练，得到第二生成式大模型；

5、语速分类器，其对问答的语句进行语速分类，对不同的语速标签的问答语句进行编码，并将编码存储至编码存储数据库里，利用预训练好的第三生成式大模型调取编码存储数据库编码数据进行有监督训练；

6、提取用户对话语句中问题中的关键词及对应的回答中的关键词、回答的语速，以及提取对应的上下文信息，根据提取的关键词和上下文信息，生成预测模型，其包括第一生成单元和第二生成单元；

7、第一生成单元，用于当接收到对话生成请求时，将请求生成对话的问题语句输入至所述对话控制模型中的编码部分，得到上下文语义编码；第二生成单元，用于将请求生成对话的语速分类标签以及所述上下文语义编码共同输入至对话控制模型中的解码部分，得到与所述语速分类标签相匹配回答语句表示，组成后输出相应的回答语句。

8、优选的，在所述基于预先训练的语速分类器，对所述智能对话中的问答语料进行语速标记，得到携带有语速标签的问答语料之前，所述方法还包括：对所述智能对话中的问答语料进行编码，得到未知语速的问答向量，得到第一训练集；所述基于预先训练的语速分类器，对所述智能对话中的问答语料进行语速标记，得到携带有语速标签的问答语料。

9、优选的，根据所述用户输入语音和匹配的输出结果生成新人机对话序列；将所述新人机对话序列中的首项用户输入语音和首项输出结果作为起始样本对；将所述新人机对话序列中位于非首项输出结果前的所有对话内容和所述非首项输出结果作为非起始样本对；基于包含所述起始样本对和所述非起始样本，构建所述第一训练集。

10、优选的，还包括，提取人类对话语句中问题中的关键词及对应的回答中的关键词，根据提取的关键词生成映射关系，根据所述映射关系生成预测模型。

11、优选的，对还包括所述预测模型的输出答复进行匹配度排序，根据所述候选回答的匹配度大小对每个所述候选回答进行排序，得到初始排序结果；根据预设的处理规则对所述初始排序结果进行顺序调整，得到所述候选回答的最终排序结果；其中，所述预设的处理规则包括以下中的一种或多种：候选回答的来源优先级、候选回答的长度、候选回答与对话问题的重复度、候选回答的来源占比、候选回答中包含的词语序列的联合概率。

12、优选的，所述候选回答中的候选回答包括至少一个检索回答和/或至少一个生成回答。

13、综上，本发明的技术效果和优点：

14、本发明中，通过对用户的语速变化进行实施的识别并通过预测模型进行预测语速和语义，将语速和语义结合出来进行输出，这样便可以针对不同人进行不同语速的对话交流，提高用户的体验感。

技术特征：

1.生成式大模型训练方法、基于模型的人机协同交互方法，包括获取智能对话中的问答语句；

2.根据权利要求1所述的生成式大模型训练方法、基于模型的人机协同交互方法，其特征在于：在所述基于预先训练的语速分类器，对所述智能对话中的问答语料进行语速标记，得到携带有语速标签的问答语料之前，所述方法还包括：对所述智能对话中的问答语料进行编码，得到未知语速的问答向量，得到第一训练集；所述基于预先训练的语速分类器，对所述智能对话中的问答语料进行语速标记，得到携带有语速标签的问答语料。

3.根据权利要求1所述的生成式大模型训练方法、基于模型的人机协同交互方法，其特征在于：根据所述用户输入语音和匹配的输出结果生成新人机对话序列；将所述新人机对话序列中的首项用户输入语音和首项输出结果作为起始样本对；将所述新人机对话序列中位于非首项输出结果前的所有对话内容和所述非首项输出结果作为非起始样本对；基于包含所述起始样本对和所述非起始样本，构建所述第一训练集。

4.根据权利要求1所述的生成式大模型训练方法、基于模型的人机协同交互方法，其特征在于：还包括，提取人类对话语句中问题中的关键词及对应的回答中的关键词，根据提取的关键词生成映射关系，根据所述映射关系生成预测模型。

5.根据权利要求1所述的生成式大模型训练方法、基于模型的人机协同交互方法，其特征在于：对还包括所述预测模型的输出答复进行匹配度排序，根据所述候选回答的匹配度大小对每个所述候选回答进行排序，得到初始排序结果；根据预设的处理规则对所述初始排序结果进行顺序调整，得到所述候选回答的最终排序结果；其中，所述预设的处理规则包括以下中的一种或多种：候选回答的来源优先级、候选回答的长度、候选回答与对话问题的重复度、候选回答的来源占比、候选回答中包含的词语序列的联合概率。

6.根据权利要求6所述的生成式大模型训练方法、基于模型的人机协同交互方法，其特征在于：所述候选回答中的候选回答包括至少一个检索回答和/或至少一个生成回答。

技术总结
本发明公开了生成式大模型训练方法、基于模型的人机协同交互方法，包括获取智能对话中的问答语句；语速分类器对智能对话中的用户的问答语句通过语速分类器进行速度标记，形成第一训练集；利用第一训练集对预先训练好的第一生成式大模型进行监督微调训练，得到第二生成式大模型；语速分类器对不同的语速标签的问答语句进行编码，并将编码存储至编码存储数据库里，利用预训练好的第三生成式大模型调取编码存储数据库编码数据进行有监督训练；提取用户对话语句中问题中的关键词及对应的回答中的关键词、回答的语速，以及提取对应的上下文信息，根据提取的关键词和上下文信息，生成预测模型。本发明能实时预测用户的语速，进行变语速交流。

技术研发人员：宋泽
受保护的技术使用者：北京中烟创新科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋泽
技术所有人：北京中烟创新科技有限公司
我是此专利的发明人

上一篇：一种基于杠杆原理的变刚度末端执行器
上一篇：一种分体式的低功耗无线气体检测仪的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。