信息检索系统的排序方法及装置的制造方法

文档序号:9750801阅读:468来源:国知局
信息检索系统的排序方法及装置的制造方法
【技术领域】
[0001] 本发明涉及信息检索技术领域,特别是涉及一种信息检索系统的排序方法及装 置。
【背景技术】
[0002] 信息检索系统在现实中有着广泛的应用,例如互联网搜索引擎、垂直领域搜索引 擎(如购物搜索、视频搜索)等。同时,信息检索系统也是构成其它很多系统的重要组件, 例如智能问答系统、企业知识管理系统、移动应用商店等。
[0003] 排序是信息检索系统的关键问题之一,以文档搜索为例,用户向信息检索系统提 交查询关键词,系统检索返回若干个候选文档,并根据每个候选文档与查询关键词的相关 性进行打分,然后按照该分值对候选文档进行排序,相关性越高的文档排位越靠前,最后将 该排序后的文档序列返回给用户。在实际的信息检索应用中,在初始相关性排序之后,还需 要根据每个查询上特有的知识和规则对排序进行调整,即后排序。例如:商业搜索引擎中在 相关性排序之后,加入一系列人工编写的代码规则,控制最终的排序结果;规则之间通常以 链式串联,在获得相关性排序的文档序列,即初始排序文档集合后,按照人工规则,逐个对 排序进行调整,并将最终的序列返回给用户。
[0004] 在实际应用中,上述基于人工知识规则的方案由于规则固定、规则之间的顺序固 定,因此难以满足复杂多样且动态变化的需求,且难以自动化的管理和维护规则库。

【发明内容】

[0005] 本发明主要解决的技术问题是提供一种信息检索系统的排序方法及装置,能够满 足复杂多样且动态变化的检索需求,且能够自动化的管理和维护规则库。
[0006] 第一方面,本发明提供一种信息检索系统的排序方法,所述方法包括:接收查询信 息;根据所述查询信息进行检索得到初始排序的文档集合,所述初始排序的文档集合是按 照检索结果文档与所述查询信息的相关性的大小,将所述检索结果文档进行排序后的文档 集合;在排序规则库中,获取与所述查询信息、所述初始排序的文档集合相关联的排序规则 集合;根据所述初始排序的文档集合和所述排序规则集合进行后排序,生成最终排序的文 档集合。
[0007] 在第一方面的第一种可能的实现方式中,所述根据所述初始排序的文档集合和所 述排序规则集合进行后排序,生成最终排序的文档集合,包括:根据所述初始排序的文档集 合和所述排序规则集合,利用最优化方法进行后排序,生成最终排序的文档集合。
[0008] 结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式 中,所述根据所述初始排序的文档集合和所述排序规则集合,利用最优化方法进行后排序, 生成最终排序的文档集合,包括:通过融合所述初始排序的文档集合和所述排序规则集合, 构造优化目标函数;求解所述优化目标函数,获得所述优化目标函数的最优解;根据所述 优化目标函数的最优解确定所述最终排序的文档集合。
[0009] 结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式 中,所述通过融合所述初始排序的文档集合和所述排序规则集合,构造优化目标函数,包 括:获取所述排序规则集合中各个排序规则的优先级别;通过融合所述初始排序的文档集 合、所述排序规则集合中各个排序规则以及所述各个排序规则的优先级别,构造优化目标 函数。
[0010] 结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式 中,所述通过融合所述初始排序的文档集合、所述排序规则集合中各个排序规则以及所述 各个排序规则的优先级别,构造优化目标函数,包括:根据Bradley-Terry模型,通过融合 所述初始排序的文档集合、所述排序规则集合中各个排序规则以及所述各个排序规则的优 先级别,构造优化目标函数,所述优化目标函数是:
[0011]
[0012] 其中,所述C是所述排序规则集合,所述c是所述排序规则集合C中的各个排序规 贝1J,所述〇 (i),〇 (j)是所述初始排序的文档集合中N个文档各自的初始排序得分,所述Θ 是优化向量,且θ = ( Θ d . . .,θ N),所述Θ . . .,θ N分别表示所述初始排序的文档集合 中N个文档各自的最终排序得分,所述θ = ( Θ . . .,θ N)表示将所述初始排序的文档集 合中N个文档按照所述得分排序后生成的最终排序的文档集合,所述P是所述排序规则集 合C中各个排序规则的优先级别,所述P表示排序规则集合导出的所有文档间的偏序关系 的集合,1彡i彡N,1彡j彡N。
[0013] 结合第一方面、第一方面的第一至第四种中任一种可能的实现方式,在第一方面 的第五种可能的实现方式中,所述方法还包括:在用户界面,展示所述最终排序的文档集 合。
[0014] 第二方面,本发明提供一种信息检索系统的排序装置,所述装置包括:接收模块、 初始文档集合获取模块、排序规则集合获取模块以及最终文档集合生成模块;所述接收模 块用于接收查询信息;所述初始文档集合获取模块用于根据所述接收模块接收的所述查询 信息进行检索得到初始排序的文档集合,所述初始排序的文档集合是按照检索结果文档与 所述查询信息的相关性的大小,将所述检索结果文档进行排序后的文档集合;所述排序规 则集合获取模块用于在排序规则库中,获取与所述接收模块接收的查询信息、所述初始文 档集合获取模块得到的初始排序的文档集合相关联的排序规则集合;所述最终文档集合生 成模块用于根据所述初始文档集合获取模块得到的初始排序的文档集合和所述排序规则 集合获取模块获取的排序规则集合进行后排序,生成最终排序的文档集合。
[0015] 在第二方面的第一种可能的实现方式中,所述最终文档集合生成模块具体用于根 据所述初始排序的文档集合和所述排序规则集合,利用最优化方法进行后排序,生成最终 排序的文档集合。
[0016] 结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式 中,所述最终文档集合生成模块包括:构造单元、求解单元以及确定单元;所述构造单元用 于通过融合所述初始排序的文档集合和所述排序规则集合,构造优化目标函数;所述求解 单元用于求解所述构造单元构造的优化目标函数,获得所述优化目标函数的最优解;所述 确定单元用于根据所述求解单元获得的优化目标函数的最优解确定所述最终排序的文档 集合。
[0017] 结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式 中,所述构造单元具体用于:获取所述排序规则集合中各个排序规则的优先级别;通过融 合所述初始排序的文档集合、所述排序规则集合中各个排序规则以及所述各个排序规则的 优先级别,构造优化目标函数。
[0018] 结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式 中,所述构造单元具体用于根据Bradley-Terry模型,通过融合所述初始排序的文档集合、 所述排序规则集合中各个排序规则以及所述各个排序规则的优先级别,构造优化目标函 数,所述优化目标函数是:
[0019]
[0020] 其中,所述C是所述排序规则集合,所述c是所述排序规则集合C中的各个排序规 贝1J,所述〇 (i),〇 (j)是所述初始排序的文档集合中N个文档各自的初始排序得分,所述Θ 是优化向量,且θ = ( Θ d . . .,θ N),所述Θ . . .,θ N分别表示所述初始排序的文档集合 中N个文档各自的最终排序得分,所述θ = ( Θ . . .,θ N)表示将所述初始排序的文档集 合中N个文档按照所述得分排序后生成的最终排序的文档集合,所述P是所述排序规则集 合C中各个排序规则的优先级别,所述P表示排序规则集合导出的所有文档间的偏序关系 的集合,1彡i彡N,1彡j彡N。
[0021] 结合第二方面、第二方面的第一至第四种中任一种可能的实现方式,在第二方面 的第五种可能的实现方式中,所述装置还包括展示模块,所述展示模块用于在用户界面,展 示所述最终排序的文档集合。
[0022] 本发明的有益效果是:区别于现有技术的情况,本发明根据查询信息进行检索得 到初始排序的文档集合;在排序规则库中,获取与查询信息、初始排序的文档集合相关联的 排序规则集合;根据初始排序的文档集合和排序规则集合进行后排序,生成最终排序的文 档集合。由于进行后排序所需要的排序规则集合可以从排序规则库中获取,且与查询信息、 初始排序的文档集合相关联,即排序规则集合不是固定不变的,能够根据查询信息、初始排 序的文档集合的变化而变化,通过这种方式,能够使排序规则集合满足复杂多样且动态变 化的需求,且排序规则库是独立存在的,能够实现排序规则库的自动化的管理和维护。
【附图说明】
[0023] 图1是本发明信息检索系统的排序方法一实施方式的流程图;
[0024] 图2是本发明信息检索系统的排序方法另一实施方式的流程图;
[0025] 图3是本发明信息检索系统的排序方法又一实施方式的流程图;
[0026] 图4是本发明信息检索系统的排序方法又一实施方式的流程图;
[0027] 图5是本发明信息检索
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1