一种对搜索结果进行排序的方法和设备的制作方法

文档序号:6487658阅读:117来源:国知局
一种对搜索结果进行排序的方法和设备的制作方法
【专利摘要】本发明的实施方式涉及一种对搜索结果进行排序的方法,该方法包括针对每个结果建立属性向量X(x1,x2,......,xn),n为自然数;为每个向量分配权重ω(ω1,ω2,......,ωn);按照ω·X对结果进行排序。本发明的实施方式还涉及一种对搜索结果进行排序的设备,包括用于针对每个结果建立属性向量X(x1,x2,......,xn)的装置,n为自然数;用于为每个向量分配权重ω(ω1,ω2,......,ωn)的装置;用于按照ω·X对结果进行排序的装置。
【专利说明】一种对搜索结果进行排序的方法和设备
【技术领域】
[0001]本发明涉及网络搜索,更具体地涉及对搜索结果进行排序。
【背景技术】
[0002]随着互联网的高速发展和普及,在互联网中包含了海量的信息内容。用户要从中找到自己关注的信息就需要依靠网络搜索技术。搜索技术是对互联网上的信息资源进行搜集整理,然后供用户查询的技术,它包括信息搜集、信息整理和用户查询三部分。然而由于搜索引擎的工作方式和因特网的快速发展,其搜索的结果让人越来越不满意。
[0003]具体而言,以在社交网络SNS(Social Network Service)中搜人时遇到的问题作为示例对现有问题进行说明。社交网络的用户会在社交网络中搜索人以寻找同学、同事、朋友等。然而,以人人网为例,如果搜索一个叫王伟的人,人人网的用户中有80000多个王伟,这就涉及到如何辨别哪个王伟才是搜索者的搜索目标的问题。由此需要按照搜索结果与搜索者的相关性对搜索结果进行合理排序以使搜索者尽快找到自己关注的搜索目标,从而提高搜索效率,改善用户体验。

【发明内容】

[0004]针对上述技术问题,提出了本发明。本发明的目的包括提供一种对搜索结果进行排序的方法和设备。
[0005]根据本发明的一个方面的某些实施例,提供了一种对搜索结果进行排序的方法:
针对每个结果建立属性向量X(x1;x2,......,xn),n为自然数;为每个向量分配权重ω (CO1,
ω2,......,ωη);按照ω.X对结果进行排序。
[0006]在本发明的一些实施例中,所述属性向量包括家乡、小学、中学、大学、专业、单位、所在地中的至少一个。按照结果的属性与搜索者的同一属性的相关性,将属性向量取值为O到I之间的值。
[0007]在本发明的一些实施例中,根据搜索者的选择来训练权重的取值。优选地使用线性分类器进行训练。优选地使用支持向量机进行训练。优选地针对线性不可分性引入惩罚因子C,根据搜索者的选择来训练C的取值。
[0008]在本发明的一些实施例中,在训练过程中使用了交叉验证模型。在训练过程中采用Hadoop并行训练方式。
[0009]根据本发明的一个方面的某些实施例,提供了一种对搜索结果进行排序的设备,
包括:用于针对每个结果建立属性向量X(Xl,x2,......,xn)的装置,η为自然数;用于为每
个向量分配权重ω (ω17 ω2,......,ωη)的装置;用于按照ω.Χ对结果进行排序的装置。
[0010]在本发明的一些实施例中,所述属性向量包括家乡、小学、中学、大学、专业、单位、
所在地中的至少一个。用于针对每个结果建立属性向量X(xi,x2,......,Xn)的装置按照结
果的属性与搜索者的同一属性的相关性,将属性向量取值为O到I之间的值。
[0011]在本发明的一些实施例中,用于为每个向量分配权重ω (CO1, ω2,......,ωη)的装置配置用于根据搜索者的选择来训练权重的取值。用于为每个向量分配权重ω(ωι,
ω2,......,ωη)的装置配置用于使用线性分类器进行训练。用于为每个向量分配权重
ω (ω17 ω2,......,ωη)的装置配置用于使用支持向量机进行训练。对搜索结果进行排序
的设备还包括用于根据搜索者的选择来训练C的取值的装置,其中惩罚因子C是针对线性不可分性引入的。
[0012]在本发明的一些实施例中,用于为每个向量分配权重ω (CO1, ω2,......,ωη)
的装置配置用于在训练过程中使用了交叉验证模型。用于为每个向量分配权重ω(ωι,ω2,......,ωη)的装置配置用于在训练过程中采用HadOOp并行训练方式。
【专利附图】

【附图说明】
[0013]通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
[0014]图1是示出了根据本发明一个实施例的对搜索结果进行排序的方法流程的示意流程图。
[0015]图2示出了使用线性分类器对样本进行训练的示意示图。
[0016]图3示出了将样本点分开的超平面的示意示图。
[0017]图4示出了支持向量机的超平面示意示图。
[0018]图5示出了处于线性不可分情况中的样本点的示意示图。
[0019]图6示出了根据本发明的实施例的训练结果的交叉验证CV(Cross Validation)曲线。
[0020]图7示出了根据本发明的一个实施例的对搜索结果进行排序的设备的结构框图。
[0021]图8示意性示出了可以实现根据本发明的实施方式的计算设备的结构框图。
[0022]在附图中,相同或对应的标号表不相同或对应的部分。
【具体实施方式】
[0023]下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
[0024]根据本发明的一个方面的实施例提供了一种对搜索结果进行排序的方法。图1是示出了根据本发明一个实施例的对搜索结果进行排序的方法流程的示意流程图。参见图1,
在该排序方法100的步骤SllO处,针对每个结果建立属性向量X (X1, X2,......,Xn),η为
自然数。
[0025]具体来说,针对对搜索结果进行排序的问题,直观的做法是考虑优先找跟搜索者有相关信息的搜索结果。这些相关信息例如:同校、同专业、入学年度相同或者接近(师兄弟)、同乡等等。用属性向量表示待选搜索结果如下:
[0026]X= (X1,..., Xn)
[0027]其中例如,X1代表大学,同校则X1 = 1,不同校X1 = O ;
[0028]X2代表专业,同专业则X2 = I,不同专业X2 = O ;[0029]X3代表学年相近度,假设入学年度差距为d,则
【权利要求】
1.一种对搜索结果进行排序的方法: 针对每个结果建立属性向量XU1, X2,......,Xn),η为自然数; 为每个向量分配权重ω (ω1; ω2,......,ωη); 按照ω.X对结果进行排序。
2.根据权利要求1所述的方法,其中所述属性向量包括家乡、小学、中学、大学、专业、单位、所在地中的至少一个。
3.根据权利要求2所述的方法,其中按照结果的属性与搜索者的同一属性的相关性,将属性向量取值为O到I之间的值。
4.根据权利要求1所述的方法,其中根据搜索者的选择来训练权重的取值。
5.根据权利要求4所述的方法,其中使用线性分类器进行训练。
6.根据权利要求5所述的方法,其中使用支持向量机进行训练。
7.根据权利要求6所述的方法,其中针对线性不可分性引入惩罚因子C,根据搜索者的选择来训练C的取值。
8.根据权利要求4所述的方法,其中在训练过程中使用了交叉验证模型。
9.根据权利要求4所述的方法,其中在训练过程中采用Hadoop并行训练方式。
10.一种对搜索结果进行排序的设备,包括: 用于针对每个结果建立属性向量X(Xl,x2,......,xn)的装置,η为自然数; 用于为每个向量分配权重ω (CO1, ω2,......,ωη)的装置; 用于按照ω.X对结果进行排序的装置。
11.根据权利要求10所述的设备,其中所述属性向量包括家乡、小学、中学、大学、专业、单位、所在地中的至少一个。
12.根据权利要求11所述的设备,其中所述用于针对每个结果建立属性向量X(Xl,χ2,......,χη)的装置按照结果的属性与搜索者的同一属性的相关性,将属性向量取值为O到I之间的值。
13.根据权利要求10所述的设备,其中所述用于为每个向量分配权重ω(ω17ω2,......,ωη)的装置配置用于根据搜索者的选择来训练权重的取值。
14.根据权利要求13所述的设备,其中所述用于为每个向量分配权重ω(ω17ω2,......,ωη)的装置配置用于使用线性分类器进行训练。
15.根据权利要求14所述的设备,其中所述用于为每个向量分配权重ω(ω17ω2,......,ωη)的装置配置用于使用支持向量机进行训练。
16.根据权利要求15所述的设备,所述设备还包括用于根据搜索者的选择来训练惩罚因子C的取值的装置,其中惩罚因子C是针对线性不可分性引入的。
17.根据权利要求13所述的装置,其中所述用于为每个向量分配权重ω(ω17ω2,......,ωη)的装置配置用于在训练过程中使用了交叉验证模型。
18.根据权利要求13所述的装置,其中所述用于为每个向量分配权重ω(ω17ω2,......,ωη)的装置配置用于在训练过程中采用Hadoop并行训练方式。
【文档编号】G06F17/30GK103577486SQ201210279565
【公开日】2014年2月12日 申请日期:2012年8月2日 优先权日:2012年8月2日
【发明者】王建新 申请人:北京千橡网景科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1