搜索方法和搜索设备的制造方法_2

文档序号:9646621阅读:来源:国知局
搜索结果页面上显示的各语言(或说搜索结果集合)对应的搜索结果条目数。
[0028]在步骤S240,对于至少一个搜索结果页面中的每一个搜索结果页面,从至少两个搜索结果集合中的每一个搜索结果集合中选择数目等于与该搜索结果集合对应的搜索结果条目数的搜索结果,用于在该搜索结果页面上显示。
[0029]在确定在搜索结果页面上显示的各语言对应的搜索结果条目数之后,即可以从各语言对应的搜索结果集合中选择搜索结果。
[0030]根据预设的语言权重来确定要显示的搜索结果,可以使得最终显示的搜索结果的布置更加合理和符合用户需要,从而能够提高用户体验。
[0031]可选地,上述预设的语言权重可以是默认权重。默认权重可以根据用户习惯来设定。用户习惯可以根据地域或其他因素来区分。例如,对于中国用户,可以设定中文与英文作为默认语言,默认权重是中文与英文的比例为5:5。类似地,对于日本用户,可以设定日文与英文作为默认语言,默认权重可以是日文与英文的比例为5:5。根据以上示例,可以理解默认权重的设定方式,在此不再一一列举。对于新的用户来说,尚没有收集到该用户的相关信息,在这种情况下,可以使用默认权重来为用户提供搜索服务。
[0032]可选地,在设定预设的语言权重时,对于某些特定语言,可以进行一些特殊设定。例如,可以保证英文所占比例为至少0.1,或者保证在每个搜索结果页面上至少显示一条英文搜索结果。
[0033]可选地,预设的语言权重是由用户经由相关用户界面所选择或输入的权重。
[0034]相关用户界面可以是例如上文所述的浏览器界面。在浏览器界面上,可以为用户提供关于语言权重的选项。例如,可以显示关于中文、英文、日文、俄文等语言种类的选项,并显示关于各语言比例的选项。这样,用户可以根据需要选择自己偏好的语言种类及语言比例。
[0035]此外,在浏览器界面上,还可以为用户提供自定义接口,例如文字输入框。用户可以将偏好的语言种类和语言比例直接输入到文字输入框中。
[0036]客户端在接收到用户选择或输入的权重之后,可以将权重传送到服务器端,由服务器端将权重存储在其存储器中。
[0037]通过上述方式,可以由用户对预设的语言权重进行自定义,这样可以更好地满足用户需求。
[0038]可选地,预设的语言权重是根据用户在特定时段内输入与不同语言中的每一种语言对应的搜索关键词的次数以及选择与不同语言中的每一种语言对应的搜索结果的次数而确定的。
[0039]可以收集用户在特定时段内的搜索信息,例如收集用户在半个月内输入的搜索关键词以及其选择并浏览的网页。假设在半个月内,用户输入英文关键词的次数是20次,中文关键词是10次,日文关键词是1次。并且,在这半个月内,用户选择英文搜索结果的次数为5次,中文搜索结果为10次,日文搜索结果为1次。这样,用户输入英文关键词的次数与选择英文搜索结果的次数之和为25次,输入中文关键词的次数与选择中文搜索结果的次数之和为20次,输入日文关键词的次数与选择日文搜索结果的次数之和为2次。因此,英文、中文与日文的搜索关键词输入次数与搜索结果选择次数之和的比例为12.5:10:1。假设每个搜索结果页面上一共显示十条搜索结果,由于需要显示日文搜索结果,因此可以使日文搜索结果占据一个条目。这样,可以将预设的语言权重设定为英文、中文与日文的比例为 5:4:1。
[0040]上述方法可以利用所收集的用户信息来分析用户的语言习惯和偏好,并自动设定预设的语言权重,这种方法无需用户参与,比较人性化。
[0041]可选地,在步骤S240之前,搜索方法100可以进一步包括:对于至少两个搜索结果集合中的每一个搜索结果集合,根据预设规则对该搜索结果集合中的搜索结果执行第一排序步骤。步骤S240可以包括:对于至少两个搜索结果集合中的每一个搜索结果集合,按照第一排序步骤所确定的顺序从该搜索结果集合中选择数目等于与该搜索结果集合对应的搜索结果条目数的搜索结果。
[0042]在搜索到与搜索关键词匹配的搜索结果集合之后,可以分别对每个搜索结果集合中的搜索结果进行排序。排序主要是为了使搜索结果中的较为重要的搜索结果排在前面,以使用户能够尽快找到自己需要的信息,避免浪费用户时间。评判搜索结果的重要性的标准可根据需要而定,并且可以综合考虑多方面因素,为每个搜索结果打分,将分数高的搜索结果排在前面。加入考虑的因素可以包括但不限于:关键词在搜索结果对应的网页中出现的频率、搜索结果对应的网页的点击量、用户在搜索结果对应的网页上的停留时间等。
[0043]在对搜索结果进行排序之后,可以按照排好的顺序选择搜索结果用于显示。这样,可以优先选择并显示重要性较高的搜索结果,从而可以节约用户的时间和精力,提高用户体验。
[0044]可选地,在步骤S130(或S250)之前,搜索方法100 (或200)可以进一步包括:根据预设的语言权重对至少两个搜索结果集合执行第二排序步骤;以及根据第二排序步骤所确定的顺序以及第一排序步骤所确定的顺序对所选择的所有搜索结果进行综合排序。步骤S130(或S250)可以包括:输出所选择的所有搜索结果以在该搜索结果页面上按照综合排序所确定的顺序显示所选择的所有搜索结果。
[0045]可以根据预设的语言权重对搜索到的搜索结果集合进行排序。例如,假设预设的语言权重是中文、英文和日文的比例为5:3:2。则可以将搜索到的中文搜索结果排在前面,英文搜索结果排在中间,日文搜索结果排在最后面。也就是说,可以按照所占据的比例逐渐减小的顺序对搜索结果集合进行排序。在搜索结果页面上显示时,最上面全是中文搜索结果,中间是英文搜索结果,最下方全是日文搜索结果。当然,可以理解的是,这种排序方法仅是示例而非限制,还可以采用其他方式对搜索结果集合进行排序。
[0046]在将搜索结果集合排好顺序之后,再根据每个搜索结果集合中的搜索结果的顺序进行一次综合排序。例如,假设预设的语言权重是中文、英文和日文的比例为5:3:2,则对于第一个搜索结果页面来说,可以将中文搜索结果中的重要性排在前五名的五个搜索结果按照排名顺序作为该搜索结果页面上的第一条至第五条搜索结果,将英文搜索结果中的重要性排在前三名的三个搜索结果按照排名顺序作为该搜索结果页面上的第六条至第八条搜索结果,并且将英文搜索结果中的重要性排在前两名的两个搜索结果按照排名顺序作为该搜索结果页面上的第九条和第十条搜索结果输出。可以理解的是,可以按照综合排序所确定的顺序将针对该第一个搜索结果页面所选择的这十个搜索结果以诸如列表的形式输出到客户端,以使客户端按照综合排序所确定的顺序显示这十个搜索结果。
[0047]通过以上排序方式,可以使得不同语言所对应的搜索结果能够按照语言比例的顺序显示,例如可以使占比例大的语言所对应的搜索结果排在前面。由于占比例大的语言可能是用户比较偏好的语言,因此这种显示方式能够方便用户查看与其偏好的语言相关的网页,是一种非常贴合用户实际需要的方法。
[0048]可选地,搜索关键词以特定语言表示。步骤S120(或S220)可以包括:将搜索关键词翻译为以不同语言中的、除特定语言以外的语言表示的同义词;以及根据搜索关键词和同义词分别在不同服务器或与不同语言对应的不同搜索引擎中搜索相匹配的网页资源,以获得至少两个搜索结果集合。所述不同服务器用于基于语言种类分开存储网页资源。
[0049]如上文所述,可以定期抓取全球网站上的网页资源,随后在对这些网页资源进行一些处理和分析之后,将它们存储在服务器上。随后,可以从服务器中搜索需要的信息。具体地,在抓取网页资源之后,可以进行如下处理:淘汰垃圾网页、提取文字、去停止词、消除噪声(搜索引擎需要识别并消除噪声,诸如版权声明文字、导航条、广告等……)、正向索引、倒排索引、链接关系计算、特殊文件处理等。随后将处理后的网页资源存储在服务器上。在存储网页资源时,可以基于语言种类分开存储。例如,将中文网页资源存储在单独的中文专用服务器上,将英文网页资源存储在单独的英文专用服务器上,等等。
[0050]如果用户输入中文搜索关键词“旅游景点”,并且预设的语言权重指定需要搜索中文
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1