信息检索系统的排序方法及装置的制造方法_4

文档序号:9750801阅读:来源:国知局
终排序的文档集合能够满足实际 应用中复杂多变且动态变化的需求。
[0103] 本发明实施方式根据查询信息进行检索得到初始排序的文档集合;在排序规则库 中,获取与查询信息、初始排序的文档集合相关联的排序规则集合;根据初始排序的文档集 合和排序规则集合进行后排序,生成最终排序的文档集合。由于进行后排序所需要的排序 规则集合可以从排序规则库中获取,且与查询信息、初始排序的文档集合相关联,即排序规 则集合不是固定不变的,能够根据查询信息、初始排序的文档集合的变化而变化,这样使得 整个后排序成为一个动态的过程,而非固定的链式策略,能够自动适应排序规则的变更,通 过这种方式,能够使排序规则集合满足复杂多样且动态变化的需求;而且,在查询信息、初 始排序的文档集合发生变化后,各个规则能够自然解耦,这样使得规则管理和维护的成本 大大降低;进一步,由于排序规则库是独立存在的,能够实现排序规则库的自动化的管理和 维护。
[0104] 其中,图1中的最终文档集合生成模块104具体用于根据初始排序的文档集合和 排序规则集合,利用最优化方法进行后排序,生成最终排序的文档集合。
[0105] 本发明实施方式中,采用最优化方法的目的在于针对所研究的系统,求得一个从 全局角度考虑的、将各种排序需求进行综合和折衷的方案,从而以最低成本解决各个排序 规则之间的冲突,最终达到系统的最优目标。最优化方法包括但不限于:梯度下降法,牛顿 法,线性规划、二次规划、遗传算法等等。
[0106] 在本发明实施方式中,不需要将排序规则"排列",而是将排序规则集合中的规则, 全部输入,利用最优化方法统筹优化。在现有技术中的串联规则中,规则之间通常以链式串 联,后面的规则一定会覆盖之前的规则,而在本发明实施方式中,不会有这种情况出现,而 是折衷选择出对排序规则集合中所有规则集体最优的排序,也因此认为是规则的冲突被最 大程度的解决了;在串联规则情况下,新增、修改、或删除一条规则都需要考虑对前后规则 的影响,而在本发明实施方式中,每个规则在实时排序之前都是独立的,故维护时只需要考 虑单独的每个规则。
[0107] 参阅图6,图6是本发明信息检索系统的排序装置另一实施方式的结构示意图,本 实施方式的装置和图5的装置基本相同,相同之处请参见图5以及相关的文字说明,不同 之处在于:在最终文档集合生成模块104具体用于根据初始排序的文档集合和排序规则集 合,利用最优化方法进行后排序,生成最终排序的文档集合时,图5中的最终文档集合生成 模块104包括:构造单元201、求解单元202以及确定单元203。
[0108] 构造单元201用于通过融合初始排序的文档集合和排序规则集合,构造优化目标 函数。
[0109] 将初始排序的文档集合和排序规则集合作为自变量,构建一个目标函数,即为优 化目标函数。
[0110] 求解单元202用于求解构造单元201构造的优化目标函数,获得优化目标函数的 最优解。
[0111] 需要说明的是,优化目标函数可以有多种形式,每一种形式的优化目标函数都有 其对应的最优解,本方案的优化目标函数不是唯一形式,本方案获取的最优解也不是唯一 最优解。
[0112] 确定单元203用于根据求解单元202获得的优化目标函数的最优解确定最终排序 的文档集合。
[0113] 优化目标函数的最优解即为初始排序的文档集合中各个文档的最终排序得分,按 照该最终排序得分排序即可以生成最终排序的文档集合。
[0114] 由于本实施方式将初始排序的文档集合和排序规则集合同时纳入一个优化目标 函数中,所以能够从全局考虑各种排序需求的综合和折衷,并以最低成本解决各个规则间 的冲突。
[0115] 其中,图6中构造单元201具体可以用于:获取排序规则集合中各个排序规则的优 先级别;通过融合初始排序的文档集合、排序规则集合中各个排序规则以及各个排序规则 的优先级别,构造优化目标函数。
[0116] 每个排序规则的优先级是通过业务的重要性、数据可信度等综合权衡的。如果排 序规则库中已经预设了每个排序规则的优先级,则可以直接获取。如果预先没有设置每个 排序规则的优先级,则在获取排序规则集合中各个排序规则的优先级别之前,可以基于检 索业务的需求事先确定每个排序规则的优先级别。规则间的优先关系可以通过权重表示。
[0117] 针对不同的用户、或者不同的需求,对排序规则集合中各个规则的考虑的优先级 别是不一样的,由于本实施方式将各个排序规则的优先级也以参数形式加入该优化的目标 函数中,从而能够灵活而有效控制不同优先级的排序规则对最终排序的影响。
[0118] 其中,构造单元201具体用于根据Bradley-Terry模型,通过融合初始排序的文档 集合、排序规则集合中各个排序规则以及各个排序规则的优先级别,构造优化的目标函数, 优化目标函数是:
[0119]
[0120] 其中,C是排序规则集合,c是排序规则集合C中的各个排序规则,〇 (i),〇 (j) 是初始排序的文档集合中N个文档各自的初始排序得分,Θ是优化向量,且Θ = (Θ . . .,θ Ν),Θ . . .,θ N分别表示初始排序的文档集合中N个文档各自的最终排序得 分,θ = ( Θ . . .,θ N)表示将初始排序的文档集合中N个文档按照得分排序后生成的最 终排序的文档集合,P是排序规则集合C中各个排序规则的优先级别,P表示排序规则集合 导出的所有文档间的偏序关系的集合,1彡i彡N,1彡j彡N。
[0121] 其中,本装置100还可以包括展示模块,展示模块用于在用户界面,展示最终排序 的文档集合。通过这种方式,可以最大程度使用户获得满足自己需求的文档集合。
[0122] 参阅图7,图7是本发明信息检索系统的排序装置一实施方式的实体结构示意图, 该装置包括接收器11、处理器12、与处理器12耦联的存储器13以及连接接收器11、处理器 12和存储器13的数据线14。
[0123] 接收器11用于接收查询信息,并将接收的查询信息存储在存储器13中。
[0124] 所述存储器13还用于存储排序规则库。
[0125] 处理器12用于调取所述存储器13中的查询信息,根据所述查询信息进行检索得 到初始排序的文档集合,所述初始排序的文档集合是按照检索结果文档与所述查询信息的 相关性的大小,将所述检索结果文档进行排序后的文档集合;调取所述存储器13的排序规 则库,在排序规则库中,获取与所述查询信息、所述初始排序的文档集合相关联的排序规则 集合;根据所述初始排序的文档集合和所述排序规则集合进行后排序,生成最终排序的文 档集合。
[0126] 其中,处理器12还用于根据所述初始排序的文档集合和所述排序规则集合,利用 最优化方法进行后排序,生成最终排序的文档集合。
[0127] 进一步地,处理器12用于通过融合所述初始排序的文档集合和所述排序规则集 合,构造优化目标函数;求解所述优化目标函数,获得所述优化目标函数的最优解;根据所 述优化目标函数的最优解确定所述最终排序的文档集合。
[0128] 其中,处理器12还用于获取所述排序规则集合中各个排序规则的优先级别;通过 融合所述初始排序的文档集合、所述排序规则集合中各个排序规则以及所述各个排序规则 的优先级别,构造优化目标函数。
[0129] 其中,处理器12还用于根据Bradley-Terry模型,通过融合所述初始排序的文档 集合、所述排序规则集合中各个排序规则以及所述各个排序规则的优先级别,构造优化目 标函数,所述优化目标函数是:
[0130]
2=1
[0131] 其中,所述C是所述排序规则集合,所述c是所述排序规则集合C中的各个排序规 贝lj,所述〇 (i),〇 (j)是所述初始排序的文档集合中N个文档各自的初始排序得分,所述Θ 是优化向量,且θ = ( Θ d . . .,θ N),所述Θ . . .,θ N分别表示所述初始排序的文档集合 中N个文档各自的最终排序得分,所述θ = ( Θ . . .,θ N)表示将所述初始排序的文档集 合中N个文档按照所述得分排序后生成的最终排序的文档集合,所述P是所述排序规则集 合C中各个排序规则的优先级别,所述P表示排序规则集合导出的所有文档间的偏序关系 的集合,1彡i彡N,1彡j彡N。
[0132] 所述装置还包括显示器15,所述显示器15用于在用户界面,展示所述最终排序的 文档集合。
[0133] 本发明实施方式接收用户输入的查询信息;根据查询信息获取初始排序的文档集 合;在排序规则库中,通过查询信息和初始排序的文档集合,获取在查询信息下、与初始排 序的文档集合相关联的排序规则集合;通过优化算法,融合初始排序的文档集合和排序规 则集合,自动生成最终排序的文档集合。由于采用优化算法且融合初始排序的文档集合和 排序规则集合,因而能够从全局考虑各种排序需求的综合和折衷,并以最低成本解决各个 规则间的冲突;由于排序规则库中获取的是在查询信息
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1