二叉堆构造方法、装置、设备和介质与流程

文档序号:37418765发布日期:2024-03-25 19:06阅读:14来源:国知局
二叉堆构造方法、装置、设备和介质与流程

本技术涉及检索的,尤其是涉及一种二叉堆构造方法、装置、设备和介质。


背景技术:

1、elasticsearch索引是数据的组织和搜索方式,它使用倒排索引来支持高效的全文搜索,并提供了丰富的查询功能和灵活的数据操作方式。

2、目前,当用户有在其收录的专利中进行检索的需求时,系统只能基于elasticsearch方式进行相关度计算,得到专利文档中的关键词与用户检索需求中的关键词之间的相关程度;然后,基于用户收录的全部专利各自对应的相关程度,得到与用户检索需求相关性相关的二叉堆。需要了解的是,二叉堆可以为最大堆或最小堆,且,二叉堆包括预设数量的与用户检索需求相关的专利文档。

3、但是,当用户存在除专利内容之外的需求时,用户需要进行多次检索操作才能得到理想内容,其中,上述专利内容对应的需求可以通过用户在专利检索平台中输入的检索词语得到。

4、故,如何通过确定二叉堆来使检索结果更加满足用户需求,从而提升检索效率,是本领域技术人员亟待解决的技术问题。


技术实现思路

1、为了减少用户不必要的检索次数,本技术提供一种二叉堆构造方法、装置、设备和介质。

2、第一方面,本技术提供一种二叉堆构造方法,采用如下的技术方案:

3、一种二叉堆构造方法,包括:

4、当接收到检索请求信息时,基于所述检索请求信息,获取多个关联专利信息,其中,所述检索请求信息至少包括用户选择的目标排序字段;

5、在多个字段值提取规则中,确定所述目标排序字段对应的目标字段值提取规则;

6、根据所述目标字段值提取规则,对每一所述关联专利信息进行关于所述目标排序字段的字段值提取,得到每一所述关联专利信息对应的目标字段值;

7、基于全部所述目标字段值,对所述多个关联专利信息进行排序,得到排序后的所述多个关联专利信息;

8、根据所述排序后的所述多个关联专利信息,确定目标二叉堆,其中,所述目标二叉堆包括按顺序排列的预设数量的所述关联专利信息各自对应的预设专利文档。

9、本技术在一较佳示例中可以进一步配置为:所述检索请求信息还包括用户id,根据所述目标字段值提取规则,

10、对每一所述关联专利信息进行关于所述目标排序字段的字段值提取,得到每一所述关联专利信息对应的目标字段值,包括:

11、获取全部预存正排数据,其中,每一所述预存正排数据包括预存专利文档id和所述预存专利文档id对应的预存专利号;

12、将所述用户id与每一所述预存专利号组合,得到每一用户索引id;并利用每一所述用户索引id,得到每一所述用户索引id对应的用户索引数据;

13、对每一所述用户索引数据进行字段值提取,得到所述目标排序字段对应的每一所述目标字段值。

14、本技术在一较佳示例中可以进一步配置为:

15、在接收到检索请求信息之前,还包括:

16、编写排序规则自定义类,以对预设排序构建器的关于定义排序规则的功能进行继承;

17、相应的,获取全部预存正排数据,包括:

18、基于所述排序规则自定义类,获取所述全部预存正排数据。

19、本技术在一较佳示例中可以进一步配置为:

20、在接收到检索请求信息之前,还包括:

21、编写基于用户索引的字段值获取方式的类,以对预设字段值获取方式构建器的关于定义字段值获取方式的功能进行继承;

22、相应的,对每一所述用户索引文档进行字段值提取,得到所述目标排序字段对应的每一所述目标字段值,包括:

23、基于所述基于用户索引的字段值获取方式的类,对每一所述用户索引文档进行字段值提取,得到所述目标排序字段对应的每一所述目标字段值。

24、本技术在一较佳示例中可以进一步配置为:

25、利用每一所述用户索引id,得到每一所述用户索引id对应的用户索引数据,包括:

26、针对每一所述用户索引id,在内存中确定所述用户索引id对应的内容结果;

27、当所述内容结果为存在时,自所述内存中提取所述用户索引id对应的所述用户索引数据;

28、当所述内容结果为不存在时,自磁盘中提取所述用户索引id对应的所述用户索引数据。

29、本技术在一较佳示例中可以进一步配置为:

30、所述检索请求信息还包括排序规则,所述排序规则为升序或降序,所述目标二叉堆为目标最大堆或目标最小堆,

31、基于全部所述目标字段值,对所述多个关联专利信息进行排序,得到排序后的所述多个关联专利信息,包括:

32、基于所述排序规则和全部所述目标字段值,对所述多个关联专利信息进行排序,得到排序后的所述多个关联专利信息;

33、相应的,从所述排序后的所述多个关联专利信息中,确定目标二叉堆,包括:

34、当所述排序规则为所述升序时,从所述排序后的所述多个关联专利信息中,确定所述目标最小堆;

35、当所述排序规则为所述降序时,从所述排序后的所述多个关联专利信息中,确定所述目标最大堆。

36、本技术在一较佳示例中可以进一步配置为:

37、专利信息包括至少一个预存排序字段的预存字段值,

38、所述二叉堆构造方法,还包括:

39、当检测到用户的收录信息时,获取收录专利的写入排序字段和所述写入排序字段对应的写入字段值;

40、将所述写入排序字段作为新的预存排序字段,将所述写入排序字段对应的写入字段值作为所述新的预存排序字段的预存字段值,以对所述收录专利的专利信息进行预先存储。

41、第二方面,本技术提供一种二叉堆确定装置,采用如下的技术方案:

42、一种二叉堆确定装置,包括:

43、关联专利信息获取模块,用于当接收到检索请求信息时,基于所述检索请求信息,获取多个关联专利信息,其中,所述检索请求信息至少包括用户选择的目标排序字段;

44、字段值提取规则模块,用于确定在多个字段值提取规则中,确定所述目标排序字段对应的目标字段值提取规则;

45、目标字段值提取模块,用于根据所述目标字段值提取规则,对每一所述关联专利信息进行关于所述目标排序字段的字段值提取,得到每一所述关联专利信息对应的目标字段值;

46、排序模块,用于基于全部所述目标字段值,对所述多个关联专利信息进行排序,得到排序后的所述多个关联专利信息;

47、二叉堆确定模块,用于根据所述排序后的所述多个关联专利信息,确定目标二叉堆,其中,所述目标二叉堆包括按顺序排列的预设数量的所述关联专利信息各自对应的预设专利文档。

48、第三方面,本技术提供一种电子设备,采用如下的技术方案:

49、至少一个处理器;

50、存储器;

51、至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行如第一方面任一项所述的二叉堆构造方法。

52、第四方面,本技术提供一种计算机可读存储介质,采用如下的技术方案:

53、一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行如第一方面任一项所述的二叉堆构造方法。

54、综上所述,本技术至少包括以下有益技术效果:

55、相较于相关技术中只能获取用户检索关键词,即关于专利文字部分的需求,本方案通过接受的检索请求信息中的目标排序字段,可以以直接确定用户除关于专利文字部分的需求之外的其他检索需求;获取多个关联专利信息,以确定与上述关于专利文字部分的需求相关的用户收录的专利;在多个预设字段值提取规则中,为目标排序字段确定适配的目标字段值提取规则;根据目标字段值提取规则,对每一关联专利信息进行关于目标排序字段的字段值提取,得到全部多个关联专利信息各自对应的目标字段值后;基于全部目标字段值,对多个关联专利信息进行排序,得到排序后的多个关联专利信息,并从排序后的多个关联专利信息中,直接确定能够满足用户除关于专利文字部分的需求之外的其他检索需求的目标二叉堆,以减少用户不必要的检索次数。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1