搜索方法、装置、系统以及搜索结果调序依据的确定方法

文档序号:9547285阅读:206来源:国知局
搜索方法、装置、系统以及搜索结果调序依据的确定方法
【技术领域】
[0001] 本发明涉及搜索领域,特别是涉及一种搜索方法、装置、系统以及搜索结果调序依 据的确定方法。
【背景技术】
[0002] 随着网络的发展,Internet上存储着越来越多的网络资源,而搜索引擎作为网络 资源的重要检索工具正在被人们广泛使用。
[0003] 目前,大部分搜索引擎主要是基于网站与搜索关键词的匹配度、网站点击量、网站 质量、网站排名等指标来对搜索结果进行排序。另外,用户对搜索结果的操作行为(如点 击、浏览、跳过等操作信息)反映了用户对搜索结果的需求和满足程度,也是当前主流搜索 引擎在对搜索结果进行排序时的一个重要参考因素。参考用户对搜索结果的操作行为,来 对搜索结果进行排序,可以在一定程度上反映用户的搜索需求。
[0004] 另一方面,用户在不同的环境下(如身处场所、网络接入类型、时间)使用搜索引 擎时,用户的搜索需求也会有所不同。例如,当用户在wifi下使用手机等登终端设备进行 搜索时,会倾向于点击流量消耗较多的搜索结果,如音乐、视频、APP下载、在线游戏等等。而 当用户在非wifi网络环境下搜索时,则倾向于点击流量消耗较少的搜索结果,如百科、小 说N歌词等等。
[0005] 举例来说,对于同一个搜索词"花千骨",当用户连着wifi进行搜索时,可以预测 其倾向于点击包含有"花千骨"的视频的搜索结果,而当用户使用2G、3G等网络进行搜索 时,则其倾向于点击花千骨小说、花千骨剧情等耗费流量较少的搜索结果。
[0006] 综上可知,用户在不同的环境下,其对搜索结果的需求是不一样的。但是,目前的 搜索引擎以及现有的搜索结果的排序方法在对搜索结果进行排序时,并没有考虑到用户所 处的环境。使得用户在不同环境下搜索时,搜索引擎呈献给用户的搜索结果都是统一的,没 有满足用户的个性化需求。
[0007] 因此,需要一种可以根据用户所处的环境对搜索结果进行排序的方法,以更好地 满足用户的搜索需求,提升用户的搜索体验。

【发明内容】

[0008] 本发明要解决的一个技术问题是提供一种搜索方法、装置、系统及搜索结果调序 依据的确定方法,其能够根据用户所处的环境,对搜索结果进行排序,以更好地满足用户的 搜索需求。
[0009] 根据本发明的一个方面,公开了一种搜索结果调序依据的确定方法,包括:获取多 个用户在一段时间内的搜索记录,搜索记录包括搜索词、基于搜索词得到的多个搜索结果、 用户对各个搜索结果执行的操作信息以及用户对搜索结果执行操作时所处的操作环境;基 于操作信息,计算针对搜索词在操作环境下的各个搜索结果的满意度分值,作为搜索结果 调序依据。
[0010]由此,可以基于用户对搜索结果的操作信息和执行操作时所处的操作环境,生成 不同操作环境下的搜索结果的满意度分值,以此作为搜索结果在该操作环境下的调序依 据。这样,就可以得到不同操作环境下搜索结果的调序依据。
[0011] 用户在进行搜索时,可以使用与用户所处的操作环境相对应的调序依据来对搜索 结果进行调序,使得搜索结果的最终排序可以满足用户在该操作环境下的搜索需求,从而 可以提升用户的搜索体验。
[0012] 优选地,基于操作信息计算针对搜索词在操作环境下的各个搜索结果的满意度分 值的步骤可以包括:将操作信息归一化,以获得表示对该搜索结果进行的相应操作次数占 对同一操作环境下针对同一搜索词得到的所有搜索结果进行的相应操作次数的比率的操 作特征值;基于操作特征值,计算针对搜索词在操作环境下的每个搜索结果的满意度分值。
[0013] 由此,可以根据搜索结果的操作特征值,来计算该搜索结果在相应的操作环境下 的满意度分值。
[0014] 优选地,基于操作特征值计算满意度分值的步骤可以包括:建立不同操作环境下 的满意度模型;基于操作特征值和满意度模型,得到不同操作环境下的搜索词的各个搜索 结果的满意度分值。
[0015] 由此,可以通过建立满意度模型的方式,计算不同操作环境下的搜索词的各个搜 索结果的满意度分值。
[0016] 优选地,满意度模型可以如下式表示
其中,Score为满意 度分值,F1为操作特征值,W i为相应操作特征值的权重,η为操作特征值的个数。
[0017] 由此,满意度模型给出了不同操作环境下的操作特征值的权重(系数)。此时,搜 索结果的满意度分值可以通过计算该搜索结果的多个操作特征值和与相应的操作特征值 对应的操作环境下的权重的乘积之和得到。
[0018] 因此,根据得到的满意度模型,就可以计算不同操作环境下的搜索结果的满意度 分值。
[0019] 优选地,建立不同操作环境下的满意度模型的步骤可以包括:针对每个操作环境, 从对应于该操作环境的搜索结果中选取部分搜索结果作为训练样本;为训练样本中的每个 搜索结果赋予样本满意度分值;基于训练样本和样本满意度分值,使用支持向量机学习模 型建立不同操作环境下的满意度模型。
[0020] 由此,可以选取多个用户的部分搜索记录作为训练样本,基于该训练样本就可以 建立不同操作环境下的满意度模型。
[0021] 优选地,在建立满意度模型的过程中,可以采用人工标注和/或点击标注的方式, 为训练样本中的每个搜索结果赋予样本满意度分值。
[0022] 其中,人工标注和点击标注都是用来标注表示用户对搜索结果的需求满意度。不 同之处在于,人工标注是基于自然结果来对搜索结果进行赋值的。换句话说,人工标注是根 据搜索结果与搜索词的文本匹配度、搜索结果的权威性、质量等信息来赋予该搜索结果一 个样本满意度分值。而点击标注则是根据用户对搜索结果的操作信息(也可以是操作特征 值)来对搜索结果进行赋值。
[0023] 因此,可以优选地,采用人工标注和点击标注相结合的方式进行赋值,这样,使得 赋值结果可以更加接近用户的满意度。
[0024] 优选地,方法中的操作信息可以包括下述至少一种:点击次数、浏览次数、停留时 长、导航点击次数、最后点击次数、被跳过次数;操作特征值包括下述至少一种:点击率、浏 览率、长点击率、导航点击率、最后点击率、被跳过率。
[0025] 其中,操作特征值与操作信息相对应。例如,当操作信息是点击次数时,基于操作 信息得到的操作特征值就是点击率。
[0026] 优选地,方法还可以包括:以key-value的形式存储满意度分值,其中,key为搜索 词及执行搜索时所处的操作环境,value为针对所述搜索词在所述操作环境下的各个搜索 结果的满意度分值。
[0027] 由此,可以将计算得到的满意度分值存储起来,在对搜索结果进行排序时,可以从 存储的满意度分值中调用与该搜索结果所处的操作环境对应的满意度分值作为该搜索结 果的调序依据。
[0028] 优选地,方法中的操作环境可以包括下述至少一种:网络接入类型、地理位置、时 间、预设的搜索模式。
[0029] 由此,可以记录用户操作时的网络接入类型、地理位置、时间、预设的搜索模式作 为操作环境,以更好地满足用户的个性化需求。
[0030] 优选地,在上述确定方法中,获取多个用户在一段时间内的搜索记录中的一段时 间可以是能够体现时效性的短期时间;还可以是能够得到足够多的搜索记录的长期时间。
[0031] 获取短期时间内用户的搜索记录来确定搜索结果调序依据,可以使得调序依据具 有时效性,可以满足最近时间段内用户的搜索需求。获取长期时间内用户的搜索记录来确 定搜索结果调序依据,可以使得调序依据可靠性更强,可以更全面地满足用户的搜索需求。
[0032] 优选地,在计算满意度分值的步骤中,可以计算基于搜索词得到的多个搜索结果 中前预定数量的搜索结果的满意度分值。
[0033] 在实际搜索时,根据现有的排列方式,排列在较后的搜索结果一般不是用户所需 求的搜索结果。因此,为了简化计算过程,可以计算基于搜索词得到的多个搜索结果中前预 定数量的搜索结果的满意度分值,作为搜索结果调序依据。
[0034] 根据本发明的另一个方面,公开了一种搜索方法,包括:基于用户输入的当前搜索 词搜索得到多个当前搜索结果;获取用户对当前搜索结果进行操作时所处的当前操作环 境;使用与当前操作环境相对应的调序依据对当前搜索结果进行调序。
[0035] 由此,可以选用与当前操作环境对应的调序依据对搜索结果进行调序,使得搜索 结果的最终排序可以满足用户在当前操作环境下的搜索需求。
[0036] 优选地,调序依据可以是使用上文所述的搜索结果调序依据的确定方法得到当前 操作环境下针对当前搜索词的多个当前搜索结果的满意度分值,其中,按照每个当前搜索 结果所对应的满意度分值的大小,对多个所述当前搜索结果进行调序。
[0037] 优选地,方法还可以包括:在用户的搜索日志和/或搜索结果操作日志中,记录用 户执行当前搜索结果时所处的当前操作环境信息。
[0038] 这样,可以基于记录的当前操作环境信息,找出与该当前操作信息对应的调序依 据,对搜索结果进行调序。另外,记录的当前操作环境信息和当前操作信息还可以作为建立 不同操作环境下的调序依据的数据或者作为建立满意度模型的样本。
[0039] 根据本发明的另一个方面,公开了一种搜索结果调序依据的确定装置,包括:搜索 记录获取单元,用于获取多个用户在一段时间内的搜索记
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1