疾病搜索排序方法、装置、设备及存储介质与流程

文档序号:35425907发布日期:2023-09-13 15:09阅读:24来源:国知局
疾病搜索排序方法、装置、设备及存储介质与流程

本发明涉及人工智能技术及医疗健康领域,尤其涉及一种疾病搜索排序方法、装置、电子设备及存储介质。


背景技术:

1、在医疗健康领域,为了根据用户输入检索的疾病搜索关键词,搜索用户想要的疾病内容或知识文本,需要进行疾病搜索排序。

2、但是现有的疾病搜索排序方法,直接根据疾病搜索关键词与待检索内容的语义匹配度,进行待检索内容的匹配筛选排序,匹配筛选的维度单一,无法准确的将用户需要的待检索内容排在前列,导致疾病搜索排序的准确率较低。


技术实现思路

1、本发明提供一种疾病搜索排序方法、装置、电子设备及存储介质,其主要目的在于疾病搜索排序的准确率。

2、接收用户的疾病搜索关键词,根据所述疾病搜索关键词对预设的候选数据集中的所有候选数据进行语义匹配筛选,得到一个或多个初始候选数据;

3、对所述疾病搜索关键词进行疾病名称组成部分划分,得到一个或多个疾病名称组成关键词及每个所述疾病名称组成关键词对应的第一名称组成类别;

4、基于所述第一名称组成类别对所述初始候选数据进行关键词提取,得到所述初始候选数据的候选关键词及每个所述候选关键词对应的第二名称组成类别;

5、基于所述第一名称组成类别与所述第二名称组成类别,计算相同名称组成类别对应的疾病名称组成关键词与候选关键词的词语相似度,以得到所述初始候选数据对应的每个第一名称组成类别的相似度分数;

6、根据每个所述第一名称组成类别对应的预设权重阈值及所述初始候选数据对应的每个第一名称组成类别的相似度分数进行加权计算,得到所述初始候选数据的目标相似度分数;

7、基于所述目标相似度分数对所有所述初始候选数据进行排序,得到搜索排序结果,并将所述搜索排序结果发送至所述用户的预设终端设备。

8、可选地,所述根据所述疾病搜索关键词对预设的候选数据集中的所有候选数据进行语义匹配筛选,得到一个或多个初始候选数据,包括:

9、将所述疾病搜索关键词转换为搜索向量;

10、获取每个所述候选数据的候选向量;

11、计算每个所述候选向量与所述搜索向量的向量相似度,得到每个所述候选向量的语义匹配度;

12、基于所述语义匹配度对所述候选数据集中所有候选数据进行筛选,得到所述初始候选数据。

13、可选地,所述基于所述语义匹配度对所述候选数据集中所有候选数据进行筛选,得到所述初始候选数据,包括:

14、将大于预设的语义匹配阈值的语义匹配度确定目标语义匹配度;

15、将所述目标语义匹配度对应的候选向量确定为目标候选向量;

16、筛选所述候选数据集中所述目标候选向量对应的候选数据,得到所述初始候选数据。

17、可选地,所述对所述疾病搜索关键词进行疾病名称组成部分划分,得到一个或多个疾病名称组成关键词及每个所述疾病名称组成关键词对应的第一名称组成类别,包括:

18、获取不同预设名称组成类别的名称字典树;

19、对所述疾病搜索关键词进行分词,得到一个或多个分词词语;

20、将在任意所述名称字典树中存在的分词词语,确定为所述疾病名称组成关键词;

21、将存在所述疾病名称组成关键词的名称字典树对应的预设名称组成类别,确定为该疾病名称组成关键词对应的第一名称组成类别。

22、可选地,所述基于所述第一名称组成类别对所述初始候选数据进行关键词提取,得到所述初始候选数据的候选关键词及每个所述候选关键词对应的第二名称组成类别,包括:

23、将所述候选数据进行分词,得到一个或多个候选分词;

24、将在任意所述第一名称组成类别的名称字典树中存在的候选分词词语,确定为候选关键词;

25、将存在所述候选关键词的名称字典树对应的第一名称组成类别,确定为该候选关键词对应的第二名称组成类别。

26、可选地,所述基于所述第一名称组成类别与所述第二名称组成类别,计算相同名称组成类别对应的疾病名称组成关键词与候选关键词的词语相似度,以得到所述初始候选数据对应的每个第一名称组成类别的相似度分数,包括:

27、汇总所有所述第一名称组成类别,得到第一名称组成类别集;

28、汇总所述初始候选数据的所有候选关键词对应的所述第二名称组成类别,得到该初始候选数据对应的第二名称组成类别集;

29、计算所述第二名称组成类别集在所述第一名称组成类别集中的差集,得到第三名称组成类别集;

30、获取每个所述第一名称组成类别对应的预设相似度初始分数;

31、将所述第三名称组成类别集中的所述第一名称组成类别对应的预设相似度初始分数,确定为该第一名称组成类别的相似度分数;

32、计算所述第二名称组成类别集中的所述第一名称组成类别对应的疾病名称组成关键词及所述初始候选数据中相同名称组成类别对应的候选关键词的词语相似度,得到该第一名称组成类别的相似度分数。

33、可选地,所述基于所述目标相似度分数对所有所述初始候选数据进行排序,得到搜索排序结果,并将所述搜索排序结果发送至所述用户的预设终端设备,包括:

34、将所有所述初始候选数据按照对应的目标相似度分数从大到小进行排序,得到搜索排序结果;

35、将所述搜索排序结果发送至所述用户的预设终端设备。

36、为了解决上述问题,本发明还提供一种疾病搜索排序装置,所述装置包括:

37、关键词提取模块,用于接收用户的疾病搜索关键词,根据所述疾病搜索关键词对预设的候选数据集中的所有候选数据进行语义匹配筛选,得到一个或多个初始候选数据;对所述疾病搜索关键词进行疾病名称组成部分划分,得到一个或多个疾病名称组成关键词及每个所述疾病名称组成关键词对应的第一名称组成类别;基于所述第一名称组成类别对所述初始候选数据进行关键词提取,得到所述初始候选数据的候选关键词及每个所述候选关键词对应的第二名称组成类别;

38、相似度分类计算模块,用于基于所述第一名称组成类别与所述第二名称组成类别,计算相同名称组成类别对应的疾病名称组成关键词与候选关键词的词语相似度,以得到所述初始候选数据对应的每个第一名称组成类别的相似度分数;根据每个所述第一名称组成类别对应的预设权重阈值及所述初始候选数据对应的每个第一名称组成类别的相似度分数进行加权计算,得到所述初始候选数据的目标相似度分数;

39、疾病搜索排序模块,用于基于所述目标相似度分数对所有所述初始候选数据进行排序,得到搜索排序结果,并将所述搜索排序结果发送至所述用户的预设终端设备。

40、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

41、存储器,存储至少一个计算机程序;及

42、处理器,执行所述存储器中存储的计算机程序以实现上述所述的疾病搜索排序方法。

43、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的疾病搜索排序方法。

44、本发明实施例根据所述疾病搜索关键词对预设的候选数据集中的所有候选数据进行语义匹配筛选,得到一个或多个初始候选数据;对所述疾病搜索关键词进行疾病名称组成部分划分,得到一个或多个疾病名称组成关键词及每个所述疾病名称组成关键词对应的第一名称组成类别;基于所述第一名称组成类别对所述初始候选数据进行关键词提取,得到所述初始候选数据的候选关键词及每个所述候选关键词对应的第二名称组成类别;基于所述第一名称组成类别与所述第二名称组成类别,计算相同名称组成类别对应的疾病名称组成关键词与候选关键词的词语相似度,以得到所述初始候选数据对应的每个第一名称组成类别的相似度分数;在利用疾病搜索关键词进行语义筛选匹配的基础上,从疾病搜索关键词的不同组成部分计算与初始候选数据的匹配程度,匹配的维度更加多元,与直接利用疾病搜索关键词进行语义匹配筛选排序相比,疾病搜索排序的准确率更高。因此本发明实施例提出的疾病搜索排序方法、装置、电子设备及可读存储介质提高了疾病搜索排序的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1