查询搜索方法、查询信息的处理方法、设备及存储介质与流程

文档序号:37014035发布日期:2024-02-09 13:04阅读:18来源:国知局
查询搜索方法、查询信息的处理方法、设备及存储介质与流程

本技术涉及人工智能技术,尤其涉及一种查询搜索方法、查询信息的处理方法、设备及存储介质。


背景技术:

1、随着互联网技术的不断发展,查询搜索系统的应用也越来越广泛。查询搜索系统可以根据用户输入的query(查询信息)进行搜索,在海量的信息中快速找到用户想要的内容。

2、为了提高搜索的准确性,查询搜索系统在搜索前,可以先将用户输入的query进行改写,例如,将query中的词语替换为同义词、改变词语顺序、句子结构等,但是,这些改写方式对查询搜索效果的提升有限。


技术实现思路

1、本技术提供一种查询搜索方法、查询信息的处理方法、设备及存储介质,用以提升查询搜索的效果。

2、第一方面,本技术实施例提供一种查询搜索方法,包括:

3、获取待处理的原始查询信息;

4、基于改写模型对所述原始查询信息进行语义扩展,得到改写信息;其中,所述改写模型是对大模型进行训练后得到的;

5、根据所述原始查询信息和改写信息在知识库中进行搜索,得到所述原始查询信息对应的搜索结果。

6、可选的,根据所述原始查询信息和改写信息在知识库中进行搜索,得到所述原始查询信息对应的搜索结果,包括:

7、对所述原始查询信息和改写信息进行融合,得到更新后的查询信息;

8、将所述更新后的查询信息输入到搜索组件,以使搜索组件根据更新后的查询信息在知识库中进行搜索,得到对应的搜索结果。

9、可选的,对所述原始查询信息和改写信息进行融合,得到更新后的查询信息,包括:

10、将所述原始查询信息和改写信息进行拼接,得到更新后的查询信息;或者,

11、将所述原始查询信息和改写信息输入到经过训练的语言模型,以通过所述语言模型对所述原始查询信息和改写信息进行融合,得到符合自然语言习惯的更新后的查询信息。

12、可选的,所述方法还包括:

13、构建训练数据集,其中,所述训练数据集中的训练数据包括原始查询信息样本和所述原始查询信息对应的改写信息样本;

14、根据所述训练数据集,对大模型进行训练,得到改写模型;

15、其中,所述改写信息样本包括与对应的所述原始查询信息样本相关的知识。

16、可选的,构建训练数据集,包括:

17、获取原始查询信息样本;

18、将所述原始查询信息样本和提示信息输入到大模型,得到所述原始查询信息对应的改写信息样本;

19、其中,所述提示信息用于提示大模型生成与所述原始查询信息样本相关的知识。

20、可选的,所述提示信息具体用于指示下述至少一项:

21、将所述原始查询信息样本作为问题,生成对应的回答;

22、将所述原始查询信息样本作为蕴含信息,生成对应的被蕴含信息。

23、可选的,根据大模型得到的所述原始查询信息样本对应的改写信息样本有多个;所述方法还包括:

24、对于多个改写信息样本中的任一改写信息样本,将所述原始查询信息样本和所述改写信息样本输入到匹配模型,得到所述原始查询信息样本和所述改写信息样本之间的关系;

25、根据所述原始查询信息样本和对应的各改写信息样本之间的关系,对所述多个改写信息样本进行筛选,以根据筛选后的改写信息样本对大模型进行训练,得到改写模型。

26、可选的,构建训练数据集,包括下述至少一项:

27、获取问答数据集,所述问答数据集包括问题和回答,分别作为原始查询信息样本和改写信息样本;

28、获取推理数据集,所述推理数据集包括蕴含信息和被蕴含信息,分别作为原始查询信息样本和改写信息样本。

29、可选的,构建训练数据集,包括:

30、获取原始查询信息样本;

31、根据原始查询信息样本在知识库中进行搜索,得到搜索结果;

32、其中,所述原始查询信息样本对应的改写信息样本为所述原始查询信息样本对应的搜索结果。

33、可选的,构建训练数据集,包括:

34、获取文章信息,所述文章信息包括文章正文和文章标题;

35、其中,所述文章正文中的至少部分内容作为原始查询信息样本,文章标题作为改写信息样本。

36、可选的,所述方法还包括:

37、通过模型训练交互界面展示训练数据集的多种类型,其中,所述训练数据集的多种类型包括下述至少两项:问答数据集、推理数据集、文章信息、通过大模型得到的训练数据集、通过搜索知识库得到的训练数据集;

38、获取第一用户在多种类型中选择的至少一种类型,以基于所述至少一种类型对应的训练数据集对大模型进行训练,得到改写模型。

39、可选的,所述方法还包括下述至少一项:

40、通过查询搜索界面展示所述改写信息和/或更新后的查询信息;

41、响应于第二用户对所述改写信息或者查询信息的修改操作,获取修改后的改写信息或者修改后的查询信息,以根据修改后的改写信息或者修改后的查询信息得到搜索结果;

42、根据所述原始查询信息和第二用户修改后的改写信息,或者,根据所述原始查询信息和第二用户修改后的查询信息,对所述改写模型进行训练。

43、第二方面,本技术实施例提供一种查询信息的处理方法,包括:

44、获取第二用户在目标企业对应的查询搜索界面输入的原始查询信息;

45、基于改写模型对所述原始查询信息进行语义扩展,得到改写信息;其中,所述改写模型是对大模型进行训练后得到的;

46、在知识库中搜索与所述原始查询信息以及改写信息相匹配的文档,其中,所述知识库包括所述目标企业提供的产品对应的多个文档;

47、根据搜索到的文档和所述原始查询信息,生成对应的回答,以将所述回答展示给所述第二用户。

48、第三方面,本技术实施例提供一种电子设备,包括:

49、至少一个处理器;以及

50、与所述至少一个处理器通信连接的存储器;

51、其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述电子设备执行上述任一方面所述的方法。

52、第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上述任一方面所述的方法。

53、第五方面,本技术实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上述任一方面所述的方法。

54、本技术实施例提供的查询搜索方法、查询信息的处理方法、设备及存储介质,可以获取待处理的原始查询信息,将所述原始查询信息输入到改写模型,以基于改写模型对所述原始查询信息进行语义扩展,得到改写信息,所述改写模型是对大模型进行训练后得到的,并根据所述原始查询信息和改写信息在知识库中进行搜索,得到所述原始查询信息对应的搜索结果,从而可以利用经过训练的模型对原始查询信息进行语义扩展,丰富原始查询信息的语义,提高搜索的准确率,增强查询搜索的整体效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1