本申请涉及人工智能,尤其涉及一种知识检索处理方法及计算机设备。
背景技术:
1、在大数据时代,为了能够从海量数据中快速、准确筛选出与查询内容相关的知识,以解决如企业知识问答、智能助手、内部搜索平台等场景下的相应问题,提出通过人工智能技术对知识库进行检索,如通过检索增强生成(retrieval-augmented generation,rag)技术的向量相似检索方式,从知识库中检索出与问题向量相似度高的k个知识文档,用以辅助大语言模型(large language models,llms)准确生成与该问题相对应的答复。
2、然而,目前rag实现的文档级检索召回,在实际场景下,尤其是面对如企业级知识库等大规模知识库,其检索召回率和准确率较低,影响了实际场景的下游任务。
技术实现思路
1、鉴于上述问题,本申请提供了以下方案:
2、本申请第一方面提供一种知识检索处理方法,所述方法包括:
3、获得待答复的问题信息;
4、对所述问题信息和预分类的各个知识类别进行意图匹配,确定与所述问题信息的查询意图相匹配的所述知识类别为候选知识类别;
5、调用每个所述候选知识类别对应配置的至少一种第一检索算子,生成相应所述候选知识类别下与所述问题信息相关的至少一个候选知识子类;
6、调用各个所述候选知识子类对应配置的至少一种第二检索算子,从相应的所述候选知识子类包含的各个知识片段中,筛选用以答复所述问题信息的各个目标知识片段;
7、其中,至少一种所述第一检索算子与所述第二检索算子不同。
8、本申请第二方面提供了一种计算机设备,所述计算机设备包括至少一个通信元件、至少一个存储器和至少一个处理器,其中:
9、所述通信元件,用于接收待答复的问题信息;
10、所述存储器,用于存储多个计算机指令;
11、所述处理器,用于执行所述计算机指令,实现以下步骤:
12、对所述问题信息和预分类的各个知识类别进行意图匹配,确定与所述问题信息的查询意图相匹配的所述知识类别为候选知识类别;
13、调用每个所述候选知识类别对应配置的至少一种第一检索算子,生成相应所述候选知识类别下与所述问题信息相关的至少一个候选知识子类;
14、调用各个所述候选知识子类对应配置的至少一种第二检索算子,从相应的所述候选知识子类包含的各个知识片段中,筛选用以答复所述问题信息的各个目标知识片段。
1.一种知识检索处理方法,所述方法包括:
2.根据权利要求1所述的方法,所述对所述问题信息和预分类的各个知识类别进行意图匹配,确定与所述问题信息的查询意图相匹配的所述知识类别为候选知识类别,包括:
3.根据权利要求2所述的方法,所述基于得到的意图匹配度,从所述预分类的各个知识类别中,筛选第一数量个候选知识类别,包括:
4.根据权利要求1所述的方法,所述调用每个所述候选知识类别对应配置的至少一种第一检索算子,生成相应所述候选知识类别下与所述问题信息相关的至少一个候选知识子类,包括以下至少一种:
5.根据权利要求4所述的方法,其中,对所述候选知识类别下的知识子类集进行过滤过程中,确定该知识子类集中各个知识子类与所述问题信息之间的子类匹配度;
6.根据权利要求1所述的方法,调用各个所述候选知识子类对应配置的至少一种第二检索算子,从相应的所述候选知识子类包含的各个知识片段中,筛选用以答复所述问题信息的各个目标知识片段,包括:
7.根据权利要求1-6任一项所述的方法,所述方法还包括:
8.根据权利要求1-6任一项所述的方法,所述各个知识类别的预分类过程包括:
9.根据权利要求8所述的方法,所述各个知识类别的预分类过程还包括:
10.一种计算机设备,所述计算机设备包括至少一个通信元件、至少一个存储器和至少一个处理器,其中: