搜索结果速度排名方法

文档序号:6333864阅读:355来源:国知局
专利名称:搜索结果速度排名方法
技术领域
本发明涉及计算机及通信技术领域,特别是涉及一种网络搜索结果速度排名方法。
背景技术
目前的网络搜索结果一般是针对关键字相似度进行分屏和排名。但这种方案存在不足和缺点,即按关键字相似度进行排名,会出现大量相同或相似信息,这些信息之间都是乱序排列的,就有可能会出现排名靠前的信息访问速度很慢,甚至无法打开,这种情况在搜索大文件情况更为明显,如音乐、视频、游戏,因为这类文件本身比较大,对网络速度比较高,如果速度不够会严重影响到用户体验。

发明内容
本发明要解决的技术问题是提供一种搜索结果速度排名方法。该方法通过搜索结果中大量的相同信息以访问速度进行排名,解决了目前网络搜索结果中大量相同信息,或相似信息乱序排列问题。为解决上述技术问题,本发明的搜索结果速度排名方法,是在原有网络搜索排名因子不变的情况下,增加访问速度的排名因子,具体步骤包括(1)根椐搜索结果的性质,测试出各个地区访问此结果的访问速度,将结果保存到数据库;(2)用户搜索某个关键字时,先得到用户的IP,计算出用户所在的电信运营商和地区;(3)得出用户搜索出来的海量结果;(4)计算出关键字相似度相同或相近的记录;(5)根据用户的电信运营商和地区查找数据库中搜索结果的访问速度;(6)在关键字相似度相同或相似的情况下把访问速度快的信息排在前面。所述步骤(1)中的搜索结果的性质是根椐对访问速度是否敏感来划分,分为不敏感、敏感、非常敏感三个级别,其中,不敏感级别是指普通的小的静态页面或图片,包括 html、js、ess、gif、jpg或png格式的页面或图片;敏感级别是文件下载,包括各类游戏客户端、升级包的下载、常用软件和工具的下载;非常敏感级别是指需要实时交互的互联网应用,包括在线音乐或视频,实时语音,视频聊天,直播。所述步骤(1)中的测速的方法是根据电信运营商、区域或城市部署的测速机器进行网络测速。本发明通过在海量的搜索结果排名中,增加访问速度因子,这样搜索出来的结果不但是用户最想要的,而且还是最流畅的。


下面结合附图与具体实施方式
对本发明作进一步详细的说明图1是本发明的具体流程图。
具体实施例方式本发明的搜索结果速度排名方法,其具体流程图可参见图1,包括步骤(1)根椐搜索结果的性质,测试出各个地区访问此结果的访问速度,将结果保存到数据库。其中,搜索结果的性质是根椐对访问速度是否敏感来划分,分为不敏感、敏感、非常敏感三个级别。其中,不敏感级别是指普通的小的静态页面或图片,如html、js、css、gif、 jpg或png格式的页面或图片;敏感级别是文件下载,如各类游戏客户端、升级包的下载、常用软件和工具的下载;非常敏感级别是指需要实时交互的互联网应用,如在线音乐或视频, 实时语音,视频聊天,直播。测速的方法是根据电信运营商、区域或城市部署的网络测速机器进行测速。目前主要的电信运营商有电信、联通、移动、校园等。而区域,可以划分到省级别,如江苏,广东等。至于城市,则可根据现有国内城市,如苏州,广州等。测速机器的数量可根据用户分布确定,以游戏下载为例,广东用户最多,测速机器就越多,测速频率也是最高,西藏用户最少, 测速的机器就少,甚至没有,以用户邻近区域代替。其中,对于不敏感级别,只做一次基本的测速,并将测速结果存储到数据库中,而不做定时测速,具体可采用smok印ing进行轻量级测速。使用smok印ing时,每次测试比较轻,速度非常快。对于敏感级别,在网络第一次抓取时进行轻量级测速(smok印ing),并定时利用 smok印ing对已存储到数据库的数据进行轻量级测速。对于非常敏感级别,在网络第一次抓取时进行轻量级测速(smok印ing),并定时对已存储到数据库的数据进行轻量级测速,而且定时对数据模拟真实用户进行测速。由于该级别对速度非常敏感,访问速度的好坏严重影响到用户体验,因此,该级别除了进行前面二种测试外,还进行详细测速,如某部电影,测试程序会模拟一个播放器,请求一段数据进行播放,还实测下载和播入速度。(2)用户搜索某个关键字时,先得到用户的IP,计算出用户所在的电信运营商和地区。例如,用户输入的关键字为“永恒之塔下载”,从服务器端得到用户的IP为 210. 51. 28. *,通过查表可以得出此用户是属于上海联通用户。(3)得出用户搜索出来的海量结果。以“永恒之塔”为例,可以得到相关记录上百万
条ο(4)计算出关键字相似度相同或相近的记录。如把搜索出来的记录按关键字等因子进行排序,找出结果中值相同或相近的记录。(5)根据用户的电信运营商和地区查找数据库中搜索结果的访问速度。如下载中心1和下载中心2两个结果值相同,通过查过数据库中的访问速度记录得出下载中心1的访问速度为10ms,下载中心2的访问速度为50ms。(6)在关键字相似度相同或相似的情况下把访问速度快的信息排在前面。如根椐上一步查出的结果,下载中心1就排在下载中心2的前面。
本发明的网络搜索结果排序方案,在现有的排名以外,增加一个用户访问、下载速度的因子,作为排序的依据,使搜索出来的结果不但是用户最想要的,而且还是最流畅的。 如用户搜索某部电影,搜索结果成千上万,在相似度相同,或相近的搜索结果中按用户的访问速度进行排名,这样用户不但可以搜索到用户最需要的,也是最流畅的。
权利要求
1.一种搜索结果速度排名方法,是在原有排名因子不变的情况下,增加访问速度的排名因子,具体步骤包括(1)根椐搜索结果的性质,测试出各个地区访问此结果的访问速度,将结果保存到数据库;(2)用户搜索某个关键字时,先得到用户的IP,计算出用户所在的电信运营商和地区;(3)得出用户搜索出来的海量结果;(4)计算出关键字相似度相同或相近的记录;(5)根据用户的电信运营商和地区查找数据库中搜索结果的访问速度;(6)在关键字相似度相同或相似的情况下把访问速度快的信息排在前面。
2.如权利要求1所述的搜索结果速度排名方法,其特征在于所述步骤(1)中的搜索结果的性质是根椐对访问速度是否敏感来划分,分为不敏感、敏感、非常敏感三个级别。
3.如权利要求2所述的搜索结果速度排名方法,其特征在于所述不敏感级别是指普通的小的静态页面或图片;敏感级别是文件下载;非常敏感级别是指需要实时交互的互联网应用。
4.如权利要求3所述的搜索结果速度排名方法,其特征在于所述不敏感级别包括 html、js、ess、gif、jpg或png格式的页面或图片;敏感级别包括各类游戏客户端、升级包的下载、常用软件和工具的下载;非常敏感级别包括在线音乐或视频,实时语音,视频聊天,直播。
5.如权利要求1所述的搜索结果速度排名方法,其特征在于所述步骤(1)中的测速的方法是根据电信运营商、区域或城市部署的测速机器进行网络测速。
6.如权利要求5所述的搜索结果速度排名方法,其特征在于所述测速机器的数量根据用户分布确定。
7.如权利要求2所述的搜索结果速度排名方法,其特征在于所述对于不敏感级别,只做一次基本的轻量级测速,并将测速结果存储到数据库中,而不做定时测速;对于敏感级别,在网络第一次抓取时进行轻量级测速,并定时对已存储到数据库的数据进行轻量级测速;对于非常敏感级别,在网络第一次抓取时进行轻量级测速,并定时对已存储到数据库的数据进行轻量级测速,而且定时对数据模拟真实用户进行测速。
8.如权利要求7所述的搜索结果速度排名方法,其特征在于所述轻量级测速是利用 smokeping进行测速。
全文摘要
本发明公开了一种搜索结果速度排名方法,包括步骤1)根椐搜索结果的性质,测试出各个地区访问此结果的访问速度,将结果保存到数据库;2)用户搜索某个关键字时,先得到用户的IP,计算出用户所在的电信运营商和地区;3)得出用户搜索出来的海量结果;4)计算出关键字相似度相同或相近的记录;5)根据用户的电信运营商和地区查找数据库中搜索结果的访问速度;6)在关键字相似度相同或相似的情况下把访问速度快的信息排在前面。利用本发明搜索出来的结果不但是用户最想要的,而且还是最流畅的。
文档编号G06F17/30GK102446200SQ20101050987
公开日2012年5月9日 申请日期2010年10月15日 优先权日2010年10月15日
发明者季昕华, 袁巧燕, 贾路, 邓宇龙 申请人:盛大计算机(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1