文本检索方法、装置、设备、介质及产品与流程

文档序号:35829636发布日期:2023-10-25 02:38阅读:14来源:国知局
文本检索方法、装置、设备、介质及产品与流程

本申请涉及信息检索,特别是涉及一种文本检索方法、装置、设备、介质及产品。


背景技术:

1、对于制度文档而言,往往同一个问题,可能会检索到多个文档,例如可能是不同年份的制度,不同制度类别(操作手册、通知、管理办法等)都包含了类似的内容,而准确的答案往往是在其中的一个文档中。在现有检索技术中,通常通过构建问答对的方式,通过文本相似度匹配到相似问题,得到对应的答案。然而这种方式对于大量的风险政策制度文档,构建问答对的工作量较大,且当提问的问题方式不同时,容易检索不到相关的答案,从而导致检索准确率较差。


技术实现思路

1、本申请提供的一种文本检索方法、装置、设备、介质及产品,能够提高文本检索的准确率。

2、第一方面,本申请实施例提供一种文本检索方法,方法包括:

3、获取用户输入的目标问题分别与预设知识库中各文档之间的多个第一相似度;

4、从多个第一相似度对应的文档中选取符合预设规则的至少两个第一文档以供用户进行选择,预设知识库包括第一文档;

5、接收用户发送的第一输入,第一输入用于从多个第一文档中选择第一目标文档;

6、响应于第一输入,基于第一相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第二相似度,以及基于第二相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第三相似度;

7、针对每个第二相似度,按照从大到小的顺序,选取第二相似度在前n位的第一目标相似度,以及针对每个第三相似度,按照从大小的顺序,选取第三相似度在前n位的第二目标相似度,n为大于1的正整数;

8、将第一目标相似度对应的第一段落和第二目标相似度对应的第二段落进行整合,得到目标问题对应的目标答案。

9、第二方面,本申请提供一种文本检索装置,该装置包括:

10、获取模块,用于获取用户输入的目标问题分别与预设知识库中各文档之间的多个第一相似度;

11、第一选择模块,用于从多个第一相似度对应的文档中选取符合预设规则的至少两个第一文档以供用户进行选择,预设知识库包括第一文档;

12、接收模块,用于接收用户发送的第一输入,第一输入用于从多个第一文档中选择第一目标文档;

13、确定模块,用于响应于第一输入,基于第一相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第二相似度,以及基于第二相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第三相似度;

14、第二选择模块,用于针对每个第二相似度,按照从大到小的顺序,选取第二相似度在前n位的第一目标相似度,以及针对每个第三相似度,按照从大小的顺序,选取第三相似度在前n位的第二目标相似度,n为大于1的正整数;

15、整合模块,用于将第一目标相似度对应的第一段落和第二目标相似度对应的第二段落进行整合,得到目标问题对应的目标答案。

16、第三方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器以及存储有计算机程序指令的存储器;

17、处理器执行计算机程序指令时实现如第一方面中任意一个实施例中的文本检索方法。

18、第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面中任意一个实施例中的文本检索方法。

19、第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行实现如上述第一方面中任意一个实施例中的文本检索方法。

20、在本申请实施例提供的一种文本检索方法、装置、设备、介质及产品中,通过获取用户输入的目标问题分别与预设知识库中各文档之间的多个第一相似度;从多个第一相似度对应的文档中选取符合预设规则的至少两个第一文档以供用户进行选择,预设知识库包括第一文档;接收用户发送的第一输入,第一输入用于从多个第一文档中选择第一目标文档;响应于第一输入,基于第一相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第二相似度,以及基于第二相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第三相似度;针对每个第二相似度,按照从大到小的顺序,选取第二相似度在前n位的第一目标相似度,以及针对每个第三相似度,按照从大小的顺序,选取第三相似度在前n位的第二目标相似度,n为大于1的正整数;将第一目标相似度对应的第一段落和第二目标相似度对应的第二段落进行整合,得到目标问题对应的目标答案。通过上述方式,首先根据目标问题初步检索得到多个第一文档以供用户进行选择,让用户从初步检索到的第一文档中选取最相关的文档,再基于选中的第一目标文档进行与目标问题相关内容的进一步检索,得到目标答案,从而提高了检索的准确率。



技术特征:

1.一种文本检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取用户输入的目标问题分别与预设知识库中各文档之间的多个第一相似度,包括:

3.根据权利要求1所述的方法,其特征在于,所述响应于所述第一输入,基于第一相似度算法,确定所述目标问题分别与所述第一目标文档中各段落之间的多个第二相似度,以及基于第二相似度算法,确定所述目标问题分别与所述第一目标文档中各段落之间的多个第三相似度,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述第一目标相似度对应的第一段落和所述第二目标相似度对应的第二段落进行整合,得到所述目标问题对应的目标答案,包括:

5.根据权利要求4所述的方法,其特征在于,在所述将所述第一目标相似度对应的第一段落和所述第二目标相似度对应的第二段落进行整合,得到所述目标问题对应的目标答案之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,在所述获取用户输入的目标问题分别与预设知识库中各文档之间的多个第一相似度之前,所述方法还包括:

7.一种文本检索装置,其特征在于,所述装置包括:

8.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的文本检索方法。

10.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-6任意一项所述的文本检索方法。


技术总结
本申请提供了一种文本检索方法、装置、设备、介质及产品,通过获取用户输入的目标问题分别与预设知识库中各文档之间的多个第一相似度;从多个第一相似度对应的文档中选取至少两个第一文档以供用户进行选择;基于第一相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第二相似度,以及基于第二相似度算法,确定目标问题分别与第一目标文档中各段落之间的多个第三相似度;针对每个第二相似度,按照从大到小的顺序,选取第二相似度在前N位的第一目标相似度,前N位的第二目标相似度;将第一目标相似度对应的第一段落和第二目标相似度对应的第二段落进行整合,得到目标问题对应的目标答案。本申请实施例能够提高文本检索的准确性。

技术研发人员:蔡素贤,颜世江,詹超群,俞泱,夏成扬,马堃
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1