基于图谱的prompt推荐方法、装置、设备及介质与流程

文档序号:35623330发布日期:2023-10-05 19:25阅读:48来源:国知局
基于图谱的prompt推荐方法、装置、设备及介质与流程

本发明涉及人工智能及数字医疗,尤其涉及一种基于图谱的prompt推荐方法、装置、电子设备及计算机可读存储介质。


背景技术:

1、prompt学习是一种利用预训练语言模型(pre-trained language model,简称plm)来完成不同任务的方法,无需对plm进行重新训练或微调,prompt学习的核心是设计合适的prompt,prompt为一种特定的输入格式,用于引导plm产生期望的输出,例如在医疗问诊平台的在线问诊功能中,由于专业医生资源有限,大部分医疗问题集中在如感冒发烧等常见问题,这些常见医疗问题已有回答非常具有参考意义,通过分析已有的医疗问答数据来对患者提出的问题做出一个快速反馈回答以供患者参考,可以利用预训练语言模型(plm)来完成,利用prompt学习的方法减少模型的训练成本和数据需求。

2、目前已经有一些开源框架和工具提供了prompt学习的实现和支持,如openprompt等,这些框架和工具通常提供了一些预定义或手工制作的prompt,以供用户选择或修改,也通常提供了一些方法或接口来自动或半自动地生成或优化prompt,如基于梯度下降、强化学习、元学习等,当前这些方式生成和优化prompt的方法不够智能化和灵活化,导致prompt的质量和生成效率不高。


技术实现思路

1、本发明提供一种基于图谱的prompt推荐方法、装置及计算机可读存储介质,其主要目的在于解决医疗领域问诊平台中医疗问答模型对应的prompt生成和优化质量及效率较低的问题。

2、为实现上述目的,本发明提供的一种基于图谱的prompt推荐方法,包括:

3、获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;

4、获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;

5、对所述增强图谱集进行图谱学习,得到优化图谱集;

6、获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。

7、可选地,所述根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,包括:

8、将所述预设prompt提示库中prompt作为prompt节点;

9、将语言模型集中预训练语言模型作为plm节点;

10、提取所述prompt节点对应的prompt与所述plm节点对应的plm关系,将所述prompt与所述plm关系作为prompt-plm边;

11、提取各个prompt节点之间的关系,并将各个prompt节点之间的关系的作为prompt-prompt边;

12、根据所述prompt节点、所述plm节点、所述prompt-plm边及所述prompt-prompt边,利用预设图谱绘制工具构建图谱集。

13、可选地,所述将所述外部知识数据转换为预设格式知识信息,包括:

14、从所述知识数据中提取与预设prompt提示库中prompt相关的文本信息;

15、抽取所述文本信息中的实体词汇、实体词汇属性、关系词汇及关系词汇属性;

16、将所述实体词汇、所述实体词汇属性、所述关系词汇及所述关系词汇属性构建为预设格式为三元组的知识信息。

17、可选地,所述利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,包括:

18、将所述预设格式知识信息中的所述实体词汇、所述实体词汇属性与所述图谱集中的节点及节点对应的属性进行匹配,得到实体匹配度及属性匹配度;

19、将所述实体匹配度及所述属性匹配度大于或等于预设匹配阈值的实体词汇及实体词汇属性与所述图谱集中的节点进行对齐;

20、将所述实体匹配度及所述属性匹配度小于所述预设匹配阈值的实体词汇及实体词汇属性作为所述图谱集中对应图谱的新节点,并将所述实体词汇对应的所述关系词汇、所述关系词汇属作为新边添加到对应图谱中,得到增强图谱集。

21、可选地,所述对所述增强图谱集进行图谱学习,得到优化图谱集,包括:

22、对所述增强图谱集中各个图谱对应边及节点进行编码,得到节点特征向量集及边特征向量集;

23、随机选取所述节点特征向量集中一个节点特征向量作为第一起始节点特征向量,根据所述第一起始节点特征向量对应的边特征向量,对所述第一起始节点特征向量进行信息传递,得到动态向量特征;

24、利用所述动态向量特征更新与所述边特征向量对应的下一节点特征向量,直至对应图谱中所有节点特征向量更新完毕,得到更新图谱;

25、随机选取所述更新图谱中一个节点特征向量作为第二起始特征向量,根据所述第二起始特征向量、对应的节点属性及对应的边特征向量预测下一节点的属性及对应边的属性,直至对应图谱中所有节点及边的属性预测完毕,得到优化图谱。

26、可选地,所述根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,包括:

27、计算所述用户输入信息与所述优化图谱集的节点及边的语义相似度,得到节点相似度得分及边相似度得分;

28、根据所述用户输入信息及所述优化图谱集中节点及边的属性,构建图查询语句,根据图查询语句查询查询所述优化图谱集,得到prompt候选集;

29、识别所述用户输入信息的需求及偏好;

30、根据所述需求、所述偏好、所述节点相似度得分及所述边相似度得分对所述prompt候选集进行排序,得到prompt排序集;

31、对所述用户输入信息进行意图识别,得到所述用户的目标,根据所述目标从所述prompt排序集中匹配最优prompt。

32、可选地,所述计算所述用户输入信息与所述优化图谱集的节点语义相似度,得到节点相似度得分,包括:

33、对所述用户输入信息进行分词,得到输入分词序列;

34、将所述输入分词序列进行向量转换,得到用户特征向量序列;

35、提取所述优化图谱集中各个节点的节点特征向量;

36、计算所述用户特征向量序列中各个用户特征向量与所述节点特征向量的语义相似度,得到节点相似度得分。

37、为了解决上述问题,本发明还提供一种基于图谱的prompt推荐装置,所述装置包括:

38、图谱构建模块,用于获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;

39、图谱增强模块,用于获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;

40、图谱优化模块,用于对所述增强图谱集进行图谱学习,得到优化图谱集;

41、图谱推荐模块,用于获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。

42、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

43、至少一个处理器;以及,

44、与所述至少一个处理器通信连接的存储器;其中,

45、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于图谱的prompt推荐方法。

46、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于图谱的prompt推荐方法。

47、本发明实施例通过根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,将prompt、预训练语言模型(plm)表示为节点,将prompt之间的关系、prompt与plm之间的关系表示为边,prompt与预训练语言模型(plm)关联性强,使得推荐的prompt质量更高;进一步,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,实现图谱集的扩充,丰富了图谱集的prompt及相关属性的内容及表达,使得prompt更加完善、质量更高;更进一步,对所述增强图谱集进行图谱学习,得到优化图谱集,使得图谱更加准确,提高在线问诊功能的预训练语言模型对应的prompt及相关属性的质量及效率;最后,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,快速为用户提供合适的prompt及对应属性,提升了prompt获取的效率。因此本发明提出的基于图谱的prompt推荐方法、装置、电子设备及计算机可读存储介质,可以解决医疗领域问诊平台中医疗问答模型对应的prompt生成和优化质量及效率较低的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1