垂直领域问答的方法、装置及电子设备与流程

文档序号:37210408发布日期:2024-03-05 14:52阅读:18来源:国知局
垂直领域问答的方法、装置及电子设备与流程

本申请属于人工智能领域,特别是涉及一种垂直领域问答的方法、装置及电子设备。


背景技术:

1、随着人工智能技术的不断发展,大规模语言模型通过学习海量的互联网文本数据包括百科、新闻文章、小说、论坛帖子等,可以生成自然语言文本或理解语言文本的含义,使得人机之间能够通过自然语言进行交互。目前,大规模语言模型已涵盖了文本分类、情感分析、语言翻译、信息检索、自动问答、语音识别等多个领域,具有强大的处理自然语言任务的能力。

2、但是,大规模语言模型通常是使用大量通用的文本数据进行训练的。而特定行业或领域,例如医疗、金融、科技等,这些垂直领域包括大量专业的术语、短语等,这些术语或短语都具有对应正确的理解。并且,大规模语言模型的知识来源只有训练数据,而训练大规模语言模型的语料库中,这些垂直领域对应的训练数据相对较少。因此在用户提问垂直领域的相关问题时,大规模语言模型较难理解用户的问题,生成的答案文本内容浅显简短,甚至还可能生成与该垂直领域毫无关系,甚至是违背事实的答案文本。

3、因此,如何使大规模语言模型生成的垂直领域的答案文本更加准确详实,是亟待解决的技术问题。


技术实现思路

1、本申请的目的在于提供一种垂直领域问答的方法、装置及电子设备,能够使大规模语言模型生成的垂直领域的答案文本更加准确详实。

2、第一方面,本申请实施例提供了一种垂直领域问答的方法,该方法包括:

3、构建目标垂直领域的知识图谱;

4、当每次接收到用户输入的待处理问题时,从目标垂直领域的知识图谱中确定目标路径,该目标路径用于补充待处理问题的问题文本的背景知识;

5、利用大规模语言模型llm对目标路径和待处理问题的问题文本进行处理,得到待处理问题对应的答案文本。

6、通过构建垂直领域的知识图谱,从中选择与问题文本相关的目标路径,一起输入到大规模语言模型中,使得大规模语言模型的输入携带了垂直领域的背景知识,因此大规模语言模型生成的答案文本存在事实依据,更加准确可信。另外,由于该目标路径包含了该问题的相关知识,因此大规模语言模型在生成答案文本时,也能够根据输入提供的相关知识生成更多与问题文本相关的内容,使得答案更加丰富详实。

7、在第一方面的一种可能的实现方式中,从目标垂直领域的知识图谱中确定目标路径,包括以下步骤:

8、根据目标垂直领域的知识图谱的路径信息,提取多条子图路径,该子图路径包括一跳路径和二跳路径;

9、对多条子图路径进行向量化,得到路径向量集合;

10、对问题文本进行向量化,得到问题向量;

11、从路径向量集合中确定出与问题向量对应的目标路径向量;

12、将目标路径向量对应的子图路径确定为目标路径。

13、在第一方面的一种可能的实现方式中,从路径向量集合中确定出与问题向量对应的目标路径向量,包括以下步骤:

14、计算问题向量与路径向量集合中每个路径向量之间的余弦相似度;

15、将余弦相似度满足预设条件的路径向量确定为目标路径向量。

16、在第一方面的一种可能的实现方式中,问题向量与路径向量之间的余弦相似度满足以下公式:

17、

18、其中,向量a表示问题向量,向量b表示路径向量,ai表示向量a中的各分量,bi表示向量b中的各分量,n表示分量的个数。

19、在第一方面的一种可能的实现方式中,对多条子图路径进行向量化,得到路径向量集合,包括以下步骤:

20、利用语义向量模型,对多条子图路径中的每条子图路径进行向量化,得到路径向量集合。

21、在第一方面的一种可能的实现方式中,对问题文本进行向量化,得到问题向量,包括以下步骤:

22、利用语义向量模型,对问题文本进行向量化,得到问题向量。

23、在第一方面的一种可能的实现方式中,构建目标垂直领域的知识图谱,包括以下步骤:

24、收集目标垂直领域的第一数据,该第一数据包括表示所述目标垂直领域的相关知识的非结构化数据、半结构化数据和结构化数据;

25、对非结构化数据和半结构化数据进行数据清洗,得到第二数据;

26、对第二数据进行实体识别和关系抽取,得到多个实体和实体之间的联系,并将其中的第一实体、第二实体,以及第一实体与第二实体之间的联系组成三元组,从而得到多个三元组;其中,第一实体与第二实体之间的联系为第一实体与第二实体之间的关系;或者,第一实体与第二实体之间的联系为第一实体的一种属性,第二实体为该属性的属性值;

27、对多个三元组和结构化数据进行多源数据融合,构建得到目标垂直领域的知识图谱。

28、在第一方面的一种可能的实现方式中,当第一数据包含新增数据时,更新目标垂直领域的知识图谱。

29、第二方面,本申请还提供了一种垂直领域问答的装置,该装置具有实现第一方面或其任意可能的实现方式中的方法的功能。具体地,该装置包括实现第一方面或其任意可能的实现方式中的方法的单元。

30、在其中的一个实施例中,该装置包括:

31、图谱构建单元,用于构建目标垂直领域的知识图谱;

32、知识补充单元,用于当每次接收到用户输入的待处理问题时,从目标垂直领域的知识图谱中确定目标路径,该目标路径用于补充待处理问题的问题文本的背景知识;

33、模型处理单元,用于利用大规模语言模型llm对目标路径和待处理问题的问题文本进行处理,得到待处理问题对应的答案文本。

34、第三方面,本申请还提供了一种电子设备。该电子设备包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序。处理器执行计算机程序时实现上述第一方面任意一种实现方式的方法。

35、第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任意一种实现方式的方法。

36、第五方面,本申请还提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面任意一种实现方式的方法。

37、本申请实施例与现有技术相比存在的有益效果是:通过构建垂直领域的知识图谱,从中选择与问题文本相关的目标路径,共同输入到大规模语言模型中进行处理,使得大规模语言模型的输入携带了垂直领域的背景知识,因此大规模语言模型生成的答案文本存在事实依据,更加准确可信。另外,由于在输入中混合了与问题文本相关的目标路径,该目标路径包含了该问题的相关知识,因此大规模语言模型在生成答案文本时,也能够生成更多与问题文本相关的内容,使得答案更加丰富详实。



技术特征:

1.一种垂直领域问答的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述从所述目标垂直领域的知识图谱中确定目标路径,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述路径向量集合中确定出与所述问题向量对应的目标路径向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述问题向量与路径向量之间的余弦相似度满足以下公式:

5.根据权利要求2所述的方法,其特征在于,所述对多条所述子图路径进行向量化,得到路径向量集合,包括:

6.根据权利要求2所述的方法,其特征在于,所述对所述问题文本进行向量化,得到问题向量,包括:

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述构建目标垂直领域的知识图谱,包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括,当所述第一数据包含新增数据时,更新所述目标垂直领域的知识图谱。

9.一种垂直领域问答的装置,其特征在于,包括:

10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,使得所述电子设备实现如权利要求1至8中任一项所述的方法。


技术总结
本申请公开了一种垂直领域问答的方法,包括:构建目标垂直领域的知识图谱;当每次接收到用户输入的待处理问题时,从目标垂直领域的知识图谱中确定目标路径,该目标路径用于补充待处理问题的问题文本的背景知识;利用大规模语言模型对目标路径和待处理问题的问题文本进行处理,得到待处理问题对应的答案文本。本申请的方案,通过将垂直领域的知识图谱的目标路径与问题文本共同输入给大规模语言模型,使得大规模语言模型在生成答案文本时存在事实依据,并且能够生成更多与问题文本相关的内容,因此本申请的方案生成的答案文本更加准确详实。

技术研发人员:刘博,袁明冬,张力元,屈玉涛,宁洪波,王文敏,何耀彬,阮威健,胡金晖
受保护的技术使用者:中电科新型智慧城市研究院有限公司
技术研发日:
技术公布日:2024/3/4
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1