一种基于大模型思维链的定制化培训方法及装置与流程

文档序号:36272297发布日期:2023-12-06 19:55阅读:28来源:国知局
一种基于大模型思维链的定制化培训方法及装置与流程

本发明涉及培训信息化,特别是指一种基于大模型思维链的定制化培训方法及装置。


背景技术:

1、培训是企业管理的重要一环。在线培训已经成为一种常见的培训方式。在线培训时间地点灵活,有很大的优势。但是在教员和学员互动方面一直存在问题。尤其是问答环节。随着人工智能技术的发展,使用对话机器人可以在传统的人工问答的基础上,提供一定的帮助,在一定程度上降低培训成本。

2、目前,这些基于人工智能的对话机器人可以进行简单的闲聊,没有办法对专业问题进行解答。

3、大模型(llm)是一种基于深度学习的自然语言处理技术,近年来取得了显著的发展。它可以生成高质量的文本、回答问题、进行对话等。大模型可以扩展传统的培训方式。传统的培训通常依赖于教员的指导和教材的限制,而大模型可以根据学生的需求生成丰富多样的培训信息。学生可以通过与大模型的对话获得实时的问题解答和学习支持,不再受到时间和地点的限制。

4、但是大模型,需要学员提出高质量问题才可以触发相应的高质量回复。但是不同学员的基础是不一样的,要求每个学员都能提出高质量问题是一个挑战。

5、首先,问题的词汇的准确性是确保获得准确回答的关键因素。一个准确的问题能够清楚地表达要求,并给出足够的上下文信息,使得回答更加准确和有针对性。其次,问题的合理性是确保获得有用回答的重要因素。一个合理的问题应该有逻辑性,有明确的前应后果结构。此外,问题和培训材料的相关性也是一个重要的考虑因素。在提问时,需要确保问题是相关的,是可以被回答的。综上所述,学员问题质量对于向大模型提问至关重要。如何提出准确、合理、相关的问题,可以提高大模型的回答质量和准确性。


技术实现思路

1、本发明实施例提供了一种基于大模型思维链的定制化培训方法及装置。针对在线培训过程中,问答环节的教员的人工回复效率低下而机器人问答缺乏专业性的问题。基于大模型思维链提供了在问答环节的定制化培训材料的生成方法。大语言模型可以通过对话的方式与学生进行交互,提供实时的专业性问题的解答和学习的支持。学生可以随时随地与大语言模型进行交流,不再受到时间和地点的限制。为解决上述发明目的,所述技术方案如下:

2、一方面,本技术实施例提供了一种基于大模型思维链的定制化培训方法,包括以下步骤:

3、s1:获取培训的文本资料,并对培训的文本资料进行预处理,得到培训知识库;

4、s2:从培训的文本资料中提取关键词,计算每个关键词的重要性,得到每个关键词的权重,将每个关键词及对应的权重添加到培训知识库,作为培训知识库的关键词;

5、s3:获取全部学员的历史问题的文本信息,对全部学员的历史问题的文本信息进行预处理,得到历史问题列表;

6、s4:基于关键词的权重,将历史问题列表中的每个问题添加到培训知识库,得到完整培训知识库;

7、s5:获取目标学员的当前问题的文本信息,对目标学员的当前问题的文本信息进行预处理,得当前问题的词向量;

8、s6:基于当前问题的词向量和培训知识库的关键词的关联关系,根据预设阈值,从完整培训知识库选出相关联的培训知识库的关键词和相关联的全部问题,得到备选问题列表;

9、s7:将当前问题添加到备选问题列表,从备选问题列表中,按照预设次数,每次选取预设数量的问题填入预设的语言模板,得到一个输入提示,组成元素数量为预设数量的输入提示序列;

10、s8:基于输入提示序列和培训知识库,计算每个输入提示的可能性,得到可能性最大的输入提示;

11、s9:将可能性最大的输入提示输入预训练的大模型得到目标学员的当前问题的大模型的输出,将相关联的培训知识库的关键词和当前问题的大模型的输出相结合,得到定制化培训信息。

12、优选地, 所述s1的获取培训的文本资料,并对培训的文本资料进行预处理,得到培训知识库,包括:

13、s11:对培训的文本资料进行预处理,得到关键知识点,并识别出命名实体的标签作为关键概念,所述预处理包括:分词、去除停用词、实体识别和词性分析;

14、s12:基于培训的文本资料,对关键知识点和关键概念进行关系抽取,得到关键概念关系;

15、s13:根据关键知识点、关键概念和关键概念关系,构造初步知识图谱;

16、s14:基于培训的文本资料,为初步知识图谱中的关键知识点添加标注和链接,得到培训知识图谱。

17、优选地, 所述s2的从培训的文本资料中提取关键词,计算每个关键词的重要性,得到每个关键词的权重,将每个关键词及对应的权重添加到培训知识库,作为培训知识库的关键词,包括:

18、s21:对培训的文本资料进行预处理得到预处理的培训的文本资料,预处理包括分词、去停用词以及词干化;

19、s22:基于预处理的培训的文本资料,构建词汇表,并记录所有出现过的词语和每个词语的频率;

20、s23:选出出现次数大于预设阈值的词语,得到培训知识库的关键词;

21、s24:基于预处理的培训的文本资料,构建倒排索引;

22、s25:基于公式(1)计算每个关键词的权重,得到每个培训知识库的关键词的权重:

23、 (1)

24、为关键词的权重,为关键词的在培训的文本资料中出现的次数,;为包含关键词的培训的文本资料数量,为文本资料数量;

25、s26:将每个培训知识库的关键词的权重添加到培训知识库。

26、优选地, 所述s3的获取全部学员的历史问题的文本信息,对全部学员的历史问题的文本信息进行预处理,得到历史问题列表,包括:

27、s31:将全部学员的历史问题的文本信息进行预处理,得到短语集;

28、s32:将短语集中的每个句子输入一个预训练的短语分类器,将全部短语分为问句和非问句;

29、s33:得到问句集,并将问句集转化为历史问题列表。

30、优选地, 所述s4的基于关键词的权重,将历史问题列表中的每个问题添加到培训知识库,得到完整培训知识库,包括:

31、s41:从历史问题列表提取每个短语的关键词;

32、s42:基于每个短语的关键词和关键词的近义词,将该短语和到培训知识库中具有相同关键词的节点建立匹配关系,如果一个短语存在多个关键词,将该短语匹配到关键词的权重最高的节点;

33、s43:基于匹配关系,将每个短语作为标签添加到得到培训知识库,得到完整培训知识库。

34、优选地, 所述s7的将当前问题添加到备选问题列表,从备选问题列表中,按照预设次数,每次选取预设数量的问题填入预设的语言模板,得到一个输入提示,组成元素数量为预设数量的输入提示序列,包括:

35、s71:获取预设的语言模板,所述预设的语言模板是包括n个连贯问题的槽位和连接词的语言模板;

36、s72:从备选问题列表中,按照预设次数,每次选取n个问题;

37、s73:基于完整培训知识库,提取n个问题对应的节点,并获取这些节点的最短路径;利用路径计算方法,对n个问题按照路径的起点和终点进行排列;

38、s74:将排列后的n个问题依次填入n个连贯问题的槽位,得到一个输入提示;

39、s75:重复步骤s72-s74, 直到获得预设次数的输入提示,组成元素数量为预设数量的输入提示序列。

40、优选地, 所述s8的基于输入提示序列和培训知识库,计算每个输入提示的可能性,得到可能性最大的输入提示,包括:

41、s81:基于培训知识库提取输入提示的属性,初始化超参数,并输入公式(2)得到初始化的预测的可能性:

42、 (2)

43、其中,是可能性,是每个输入提示关联关键词的词频总和,是每个输入提示在培训知识库的最短路径几点距离,是输入提示在培训知识库的最短路所经过节点的层级深度,是超参数;

44、s82:基于公式(3)和初始化的预测的可能性对公式(2)进行超参数求解:

45、 (3)

46、其中,l是损失函数,是样本数量,是可能性预测值,是可能性真实值;

47、s83:基于公式(2)和超参数,得到每个输入提示的可能性;

48、s84:按照可能性进行逆排序,得到可能性最大的输入提示。

49、第二方面,本技术实施例提供了一种基于大模型思维链的定制化培训装置,包括以下步骤:

50、文本资料单元:用于获取培训的文本资料,并对培训的文本资料进行预处理,得到培训知识库;

51、关键词单元:用于从培训的文本资料中提取关键词,计算每个关键词的重要性,得到每个关键词的权重,将每个关键词及对应的权重添加到培训知识库,作为培训知识库的关键词;

52、历史问题单元:用于获取全部学员的历史问题的文本信息,对全部学员的历史问题的文本信息进行预处理,得到历史问题列表;

53、知识库单元:用于基于关键词的权重,将历史问题列表中的每个问题添加到培训知识库,得到完整培训知识库;

54、当前问题单元:用于获取目标学员的当前问题的文本信息,对目标学员的当前问题的文本信息进行预处理,得当前问题的词向量;

55、备选问题单元:用于基于当前问题的词向量和培训知识库的关键词的关联关系,根据预设阈值,从完整培训知识库选出相关联的培训知识库的关键词和相关联的全部问题,得到备选问题列表;

56、输入提示单元:用于将当前问题添加到备选问题列表,从备选问题列表中,按照预设次数,每次选取n个问题填入预设的语言模板,得到一个输入提示,组成元素数量为预设数量的输入提示序列;

57、可能性单元:用于基于输入提示序列和培训知识库,计算每个输入提示的可能性,得到可能性最大的输入提示;

58、培训信息单元:用于将可能性最大的输入提示输入预训练的大模型得到目标学员的当前问题的大模型的输出,将相关联的培训知识库的关键词和当前问题的大模型的输出相结合,得到定制化培训信息。

59、第三方面,本技术实施例提供了一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前面任一项所述的方法。

60、第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前面任一项所述的方法。

61、本发明实施例提供的技术方案带来的有益效果至少包括:上述技术方案,与现有技术相比至少具有如下有益效果:基于大模型,给学员提供的信息量超出了传统培训材料范围,实现了学员的定制化培训材料的生成;并在此基础上,充分考虑了学员由于背景不同,提问水平存在多样性的问题,实现了对学员问题进行优化,提高了大模型的输出质量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1