数据查询方法、装置、计算机设备和存储介质与流程

文档序号:37241444发布日期:2024-03-06 17:09阅读:22来源:国知局
数据查询方法、装置、计算机设备和存储介质与流程

本技术涉及数据处理,特别是涉及一种数据查询方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、随着信息量的飞速增长,大语言模型在企业的日常应用中变得越来越普遍,其中,大语言模型的其中一个应用为基于知识库的大模型问答系统。在大模型问答系统中,用户需要提供查询语料数据,通过该查询语料数据进行相关信息的查询。

2、传统方法中,大模型问答系统通常会将用户输入的语料数据进行编码处理,得到编码处理后的向量,进而通过该向量,在向量数据库中进行相似度匹配查询,确定与该向量相似度最高的目标问询语料,通过该目标问询语料生成问题提示符,将该问题提示符prompt输入至大模型中进行数据处理,输出反馈结果。

3、然而,传统方法中,通过对语料数据的编码处理,基于相似度匹配算法,确定出查询标签存在一定的误差,进而,造成数据查询结果准确度较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种数据查询方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本技术提供了一种数据查询方法,所述方法包括:

3、响应于数据查询请求,获取用户输入的初始语料数据;

4、对所述初始语料数据进行分词处理,并提取得到所述初始语料数据中的关键词,基于所述关键词进行意图识别,确定所述用户的目标意图;

5、基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,并基于所述查询语料数据构建查询提示符;

6、将所述查询提示符输入至查询模型中,得到数据查询结果。

7、在其中一个实施例中,所述方法还包括:

8、获取训练词条数据;所述训练词条数据携带有分类标识;

9、针对每一类所述训练词条数据进行分词处理,在分词处理后的各分词中选取满足预设词频条件的分词,作为意图分词;

10、所述基于所述关键词进行意图识别,确定所述用户的目标意图,包括:

11、将所述关键词与各意图分词进行匹配,确定所述用户的目标意图。

12、在其中一个实施例中,所述基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,包括:

13、将所述初始语料数据进行编码处理,得到查询向量;

14、基于所述目标意图,在所述目标意图对应的向量数据库中查询与所述查询向量间满足相似度条件的语料,作为查询语料数据;

15、基于所述目标意图,在所述目标意图对应的关键词索引库中查询出现所述关键词的词频最高的语料,作为查询语料数据。

16、在其中一个实施例中,所述基于所述查询语料数据构建查询提示符,包括:

17、基于查询语料数据对应的查询评分,对所述向量数据库查询的查询语料数据以及所述关键词索引库查询的查询语料数据进行排序;

18、在排序后的查询语料数据中,选取预设数量的目标查询语料数据;

19、基于所述目标查询语料数据进行拼接处理,构建查询提示符。

20、在其中一个实施例中,所述基于查询语料数据对应的查询评分,对所述向量数据库查询的查询语料数据以及所述关键词索引库查询的查询语料数据进行排序之前,所述方法还包括:

21、获取所述查询语料数据对应的初始查询评分;

22、基于所述向量数据库与所述关键词索引库的权重值,分别对所述查询语料数据对应的初始查询评分进行加权计算,确定加权计算后每一所述查询语料数据对应的查询评分。

23、在其中一个实施例中,所述方法还包括:

24、获取每一所述数据查询结果对应的结果反馈数据;所述结果反馈数据中包含正反馈数据和负反馈数据;

25、基于所述正反馈数据和所述负反馈数据,分别对所述数据查询结果对应的查询提示符进行排序,得到排序结果;

26、基于所述排序结果,确定各所述查询提示符的排序评分,并选取评分最高的目标查询提示符;

27、基于所述目标查询提示符中包含的查询语料数据的占比,确定所述向量数据库与所述关键词索引库间的权重值。

28、第二方面,本技术还提供了一种数据查询装置,所述装置包括:

29、获取模块,用于响应于数据查询请求,获取用户输入的初始语料数据;

30、第一确定模块,用于对所述初始语料数据进行分词处理,并提取得到所述初始语料数据中的关键词,基于所述关键词进行意图识别,确定所述用户的目标意图;

31、第二确定模块,用于基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,并基于所述查询语料数据构建查询提示符;

32、查询模块,用于,将所述查询提示符输入至查询模型中,得到数据查询结果。

33、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

34、响应于数据查询请求,获取用户输入的初始语料数据;

35、对所述初始语料数据进行分词处理,并提取得到所述初始语料数据中的关键词,基于所述关键词进行意图识别,确定所述用户的目标意图;

36、基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,并基于所述查询语料数据构建查询提示符;

37、将所述查询提示符输入至查询模型中,得到数据查询结果。

38、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

39、响应于数据查询请求,获取用户输入的初始语料数据;

40、对所述初始语料数据进行分词处理,并提取得到所述初始语料数据中的关键词,基于所述关键词进行意图识别,确定所述用户的目标意图;

41、基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,并基于所述查询语料数据构建查询提示符;

42、将所述查询提示符输入至查询模型中,得到数据查询结果。

43、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

44、响应于数据查询请求,获取用户输入的初始语料数据;

45、对所述初始语料数据进行分词处理,并提取得到所述初始语料数据中的关键词,基于所述关键词进行意图识别,确定所述用户的目标意图;

46、基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,并基于所述查询语料数据构建查询提示符;

47、将所述查询提示符输入至查询模型中,得到数据查询结果。

48、上述数据查询方法、装置、计算机设备、存储介质和计算机程序产品,响应于数据查询请求,获取用户输入的初始语料数据;对所述初始语料数据进行分词处理,并提取得到所述初始语料数据中的关键词,基于所述关键词进行意图识别,确定所述用户的目标意图;基于所述目标意图,分别在向量数据库以及关键词索引库中进行检索,确定查询语料数据,并基于所述查询语料数据构建查询提示符;将所述查询提示符输入至查询模型中,得到数据查询结果。采用本方法,通过对用户发送的初始语料数据进行意图识别,并在确定用户的目标意图之后,分别在目标意图对应的向量数据库和关键词索引库中分别进行检索,确定查询语料数据,进而构建查询提示符,提高了查询检索的查询条件的准确性,将更为准确的查询提示符输入至查询模型中进行数据查询,进而,提高了数据查询结果的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1