一种搜索方法及设备的制作方法

文档序号:6427009阅读:170来源:国知局
专利名称:一种搜索方法及设备的制作方法
技术领域
本申请涉及计算机捜索技术领域,尤其涉及一种搜索方法及设备。
背景技术
随着计算机网络技术以及无线通信网络技术的不断发展,捜索业务得到了越来越普遍的应用,除了在专业的捜索网站进行全网的搜索外,大多数的网站上也具有对本网站内数据内容进行搜索的功能,特别是对于购物网站等数据内容较丰富的网站,根据用户输入的关键词查找出用户希望查看的页面,这对网站业务的开展尤为重要。在常规的搜索方式中,捜索服务器根据关键词对网站数据库中的大量数据对象(包括但不限于页面、数据包等网站数据库中的数据内容)进行搜索,查找与关键词匹配的数据对象作为搜索结果向用户展示,为了使用户能够快速地找到有用信息,可以分别计算查找出的捜索结果与关键词的相关度,按照相关度由高到低的顺序向用户展示查找出的搜索結果。在上述搜索方式得到搜索结果并排序展示的方案中,仅按照与关键词在字面上的相关度进行排序,可能使某些有用信息排在靠后的位置。例如,关键词为“A品牌手机”,搜索服务器搜索出了两个搜索结果,第一个搜索结果是简单介绍该“A品牌手机”的页面,第ニ个搜索结果是“A品牌手机”和“B品牌手机”的包含图文的发布页面,仅从字面相关度而言,第一个搜索结果的相关度要高于第二个搜索结果,但是在购物网站等特定网站中,第二个搜索结果比第一个搜索结果中的内容更加丰富,更能满足用户的搜索需求。如果仅按照与关键词在字面上的相关度进行排序得到的排序结果,并不能很好地与用户的搜索需求匹配。因此,在按照与关键词在字面上的相关度进行排序的基础上,又进ー步提出按照对网站的日志信息进行挖掘,对一段时间内用户点击率的高低来间接表示相关度的排序方案,使得最終展示给用户的捜索结果的各项搜索结果中,排列在前面的捜索结果一方面是与关键词在字面上相关度较高的捜索结果,另一方面也是在使用上与关键词的相关度较高的捜索结果,即很可能是用户感兴趣的捜索结果,使用户能够根据排序的捜索结果快速查找出有用信息。上述两种对捜索结果进行排序的方式是按照与关键词的字面相关性和使用相关性的高低进行的,但在诸如网络购物的业务中,仅仅按照上述两种方式的要求进行排序时,排序所依靠的条件有限,排列结果也不一定能够满足用户信息查询需求,由此,在向用户推送按照上述排列方式得到的捜索结果后,用户只能多次点击查看捜索结果,直至找到有用信息。由于目前向用户输出的捜索结果的排序还存在排序结果不准确的问题,因此,对于用户而言,増加了用户查找信息的时间开销,降低了搜索效率;另ー方面,对于网络服务器而言,用户每次点击搜索结果中的一个搜索结果时,网络服务器都需要响应用户的点击操作,若用户不能从排列在前的捜索结果中快速查找出有用信息,则网络服务器需要为该用户的多次点击搜索结果的操作分配大量的系统资源,造成系统资源的浪费。

发明内容
本申请实施例的目的在于提供一种搜索方法及设备,用以解决现有技术中存在搜索效率低、为多次点击搜索结果的操作分配大量的系统资源,造成系统资源浪费的问题。一种搜索方法,包括在接收到包含关键词的捜索请求时,以该关键词为搜索条件,从数据库服务器中搜索出M个搜索结果,以及根据关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定接收到的关键词对应的成交參数满足设定条件的N个搜索结果;将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他搜索结果排列在后,并返回排列后的捜索结果,所述M和N为正整数。·ー种搜索设备,包括第一捜索模块,用于在接收到包含关键词的捜索请求时,以该关键词为搜索条件,从数据库服务器中捜索出M个搜索结果;第二捜索模块,用于根据关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定接收到的关键词对应的成交參数满足设定条件的N个搜索结果;排序模块,用于将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他捜索结果排列在后,所述M和N为正整数;结果返回模块,用于返回排列后的捜索結果。本申请有益效果如下本申请实施例的方案中,一方面以接收到的关键词为搜索条件,从数据库服务器中搜索出与关键词的相关度较高的M个搜索结果;另一方面,根据预先学习的关键词、搜索结果和捜索结果的成交參数三者的对应关系,确定成交參数较高的N个搜索结果,将与成交转化效果有关的捜索结果排列在前,与相关度有关的搜索结果排列在后,由于排列在前的搜索结果是产生购买行为概率高的捜索结果,因此,排列在前的捜索结果满足用户查询需求的概率也较高,可以有效減少用户的搜索时长,提高搜索效率,同吋,由于用户根据排列在前的捜索结果就能够完成搜索过程,无需再多次点击查询捜索结果,可以减少网络服务器为用户的点击查询操作分配的系统资源,減少系统资源的浪费;并且,通过本方案可以有效提高用户搜索后的成交转换率,用户只需要尝试很少的关键词,就能选定想要购买的商品,由于用户使用的关键词少,则可以减少服务器为用户的搜索过程分配的资源,因此,服务器有限的资源可以支持更多用户的搜索访问。


图I为本申请实施例一中搜索方法步骤示意图;图2(a)和图2(b)为本申请实施例ニ中搜索设备结构示意图;图3为本申请实施例ニ中搜索设备应用的系统架构示意图。
具体实施例方式本申请实施例提出一种新的捜索方案,通过对两方面内容的查询对捜索结果进行排序一方面,按照常规的搜索方式,以接收到的关键词为搜索条件,从数据库服务器中搜索出与关键词的相关度较高的M个搜索结果;另一方面,根据预先学习的关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定N个搜索结果,所述N个搜索结果在以本次接收到的关键词为搜索条件吋,对应的成交參数较高,表示根据这N个搜索结果产生购买行为的概率较高。在查找出所述M个搜索结果和所述N个搜索结果后,将与成交转化效果有关的N个搜索结果作为重要的搜索结果排列在前,与相关度有关的M个搜索结果中除与N个捜索结果相同的其他捜索结果排列在后。其目的是,在向用户展示排列的搜索结果时,由于排列在前的捜索结果是在之前的设定时长内被多数用户查询后产生购买行为概率高的搜索结果,因此,排列在前的捜索结果满足用户查询需求的概率也较高,可以有效減少用户的捜索时长,提高搜索效率,同时,由于用户无需再多次点击查询展示的捜索结果,可以减少网络服务器为用户的点击查询操作分配的系统资源,減少系统资源的浪费;并且,通过本方案可以有效提高用户搜索后的成交转换率,用户只需要尝试很少的关键词,就能选定想要购买的商品,由于用户使用的关键词少,则可以减少服务器为用户的搜索过程分配的资源,因此,服务器有限的资源可以支持更多用户的搜索访问。

本申请各实施例中涉及的搜索结果是指网站数据库中的数据对象,如网站中的页面、数据包等。本申请各实施例中涉及的成交參数是指用户在以特定关键词为搜索条件的情况下得到某一捜索结果时,用户查询该搜索结果并最终产生购买行为的概率,即用户在特定的关键词下查询特定捜索结果后的成交转化效果。下面结合说明书附图对本申请实施例进行详细描述。实施例一如图I所示,为本申请实施例一中捜索方法步骤示意图,所述方法包括以下步骤步骤101 :接收包含关键词(query)的搜索请求。在本步骤的方案中,当有用户希望进行搜索操作时,将发起搜索请求,并在搜索请求中携帯作为搜索条件的关键词。步骤102 以该关键词为捜索条件,从数据库服务器中捜索出M个搜索结果,所述M为正整数。读取搜索请求中的关键词,并与数据库服务器建立链接,从数据库服务器中捜索出与关键词的相关度较高的M个搜索请求,由于这M个搜索结果与关键词的相关度较高,因此可能是用户希望查看的捜索結果。本步骤的搜索过程可以是按照与关键词在字面上的相关度高低进行搜索的过程,也可以是在按照与关键词在字面上的相关度进行捜索的基础上,进ー步按照对网站的日志信息的挖掘,捜索出用户感兴趣的捜索結果。需要说明的是,本步骤并不限于上述两种搜索方式,其他能够根据关键词捜索出捜索结果的所有方式都可应用在本步骤中。步骤103 :根据关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定接收到的关键词对应的成交參数满足设定条件的N个搜索结果,所述N为正整数。在接收到搜索请求时,一方面按照步骤102的方式从数据库服务器中捜索出与关键词相关的M个搜索结果,另一方面,根据本地学习后得到的关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定接收到的关键词对应的成交參数满足设定条件的N个搜索結果。本步骤可以根据所述对应关系从数据库服务器中确定所述N个搜索结果,也可以根据所述对应关系从本地存储的搜索结果中确定所述N个搜索結果。本步骤中得到的N个搜索结果是指成交转化率较高的搜索結果,即在之前的设定时长内,这N个搜索结果被用户查询后产生购买行为的概率较高。由于这N个搜索结果能够在之前的设定时长内很好地满足用户的查询、购买需求,因此,这N个搜索结果能够满足本次发送搜索请求的用户的查询、购买需求的概率较大。需要说明的是,本申请实施例一的步骤102和步骤103的执行先后顺序可以不固定,也可以先执行步骤103,后执行步骤102,还可以同时执行步骤102和步骤103。步骤104 :将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他捜索结果排列在后。 由于步骤103中得到的N个搜索结果是以成交參数为条件查询出的,相比于步骤102中以与关键词的相关性为条件搜索出的M个搜索结果,这N个搜索结果在一定程度上既能反映与关键词的相关性,又能够表示捜索结果本身的可用性,因此,所述N个搜索结果更能够反映用户的查询需求,本步骤将N个搜索结果排在所述M个搜索结果之前。例如用户登录购物网站,在网站的捜索对话框里输入“A品牌手机”作为关键词发起搜索请求。在接收到所述搜索请求后,在网站的数据库服务器中以“A品牌手机”为条件,搜索出3个搜索结果,分别为搜索结果I、搜索结果2和搜索结果3。同时,再根据之前I周时间内,其他用户以“A品牌手机”为关键词搜索后得到的捜索結果,以及得到的各捜索结果在“A品牌手机”为关键词的情况下被用户查询、购买的行为,最終确定2个成交參数较高的捜索结果,分别为搜索结果2和捜索结果4。此时,捜索结果2和捜索结果4是多用户查询、购买的捜索結果,因此,捜索结果2和捜索结果4是可用、有效的搜索结果,应排在前列;搜索结果I、捜索结果2和捜索结果3与关键词的相关性虽然高,但搜索结果本身可能存在可用性和有效性的问题,如捜索结果I链接商品的质量较差、价格过高或者价格过低等不真实情形,因此,捜索结果I和捜索结果3应排列在后。由于数据库服务器中存储的捜索结果在不断地发生变化,因此,当前数据库服务器中存储的捜索结果,与之前设定时长内用于学习得到对应关系的捜索结果不一定完全相同;同时,根据对应关系确定的N个搜索结果是根据成交參数的大小确定的,而在步骤102中捜索的M个搜索结果是根据与关键词的相关性确定的,因此,步骤102中的M个搜索结果与步骤103中的N个搜索结果很可能不完全相同。但由于所述N个搜索结果中也可能存储与关键词的相关度较高的捜索结果,因此,所述N个搜索结果和所述M个搜索结果之间也可能存在重叠,为避免搜索结果重复展示,本步骤在进行排序时,将互相不重复的N个搜索结果先排列在前,再将M个搜索结果中与N个搜索结果相同的捜索结果剔除后,剰余的捜索结果排列在后。特殊的情况下,所述N个搜索结果和所述M个搜索结果完全相同,则直接将所述N个搜索结果或M个搜索结果作为搜索结果即可。步骤105 :向发起搜索请求的用户设备返回排列后的捜索結果。在步骤104中对各搜索结果进行排列后,可以将排列的捜索结果以列表的方式向返回给用户设备,如向用户设备推送排列好的各捜索结果的摘要或链接地址的页面等。通过本申请实施例一的方案,将成交转化率高的搜索结果排列在前,也就是将可用性和有效性较高的捜索结果排列在捜索结果展示页面的前列,由于越靠前列的捜索结果被用户浏览、查询的概率越大,因此,发起搜索请求的用户会首先浏览、查询成交转化率高的捜索结果,使用户快速捜索出有用信息,提高用户搜索效率,减少网络服务器为用户分配的用于进行查询的系统资源。另外,由于用户首先查询的是成交转化率高的捜索结果,用户针对查询的捜索结果产生购买行为的可能性也较高,因此,针对搜索过程的成交转化率也将会提高,用户只需要尝试很少的关键词,就能选定想要购买的商品,由于用户使用的关键词少,则可以减少服务器为用户的搜索过程分配的资源,因此,在服务器资源相同的情况下,可以支持更多用户的搜索访问。
下面对本申请实施例的各步骤的详细方案进行说明。本申请实施例一的步骤103中所使用的关键词、捜索结果和捜索结果的成交參数三者的对应关系,是对之前设定时长内大量用户查询捜索結果、以及针对搜索结果发生的购买行为学习后确定的,下面具体说明所述对应关系的确定方式第一歩在设定时长内采集各用户发送的包含关键词的搜索请求。本步骤中的设定时长可以根据需要设定,如需要得到数据量更加丰富的用于确定所述对应关系的数据时,可以将所述设定时长设置一个较长的时间;如需要得到最新的用于确定所述对应关系的数据时,可以将所述设定时长设置一个较短的时间,并周期性地更新采集的数据。第二歩分别从数据库服务器中以每个关键词为搜索条件进行搜索,确定每个关键词对应的包含至少ー个搜索结果的搜索结果组。假设在设定时长内接收到的关键词有“ A品牌”和“手机”。以“A品牌”为搜索条件进行搜索,得到捜索结果组1,其中的捜索结果有“A手机”、“A显示器”和“A游戏机”;以“手机”为搜索条件进行搜索,得到捜索结果组2,其中的捜索结果有“A手机”、“B手机”和“手机配件”。第三歩针对每个搜索結果,确定以所在的捜索结果组对应的关键词为搜索条件时,该搜索结果的点击指标、点击该搜索结果后产生的购买指标。以搜索结果“A手机”为例,“ A手机”所在的捜索结果组为搜索结果组I和搜索结果组2,当用户以搜索结果组I对应的关键词“A品牌”为搜索条件得到捜索结果“A手机”时,确定在此情况下“A手机”的点击指标和购买指标。当用户以搜索结果组2对应的关键词“手机”为搜索条件得到捜索结果“A手机”时,确定在此情况下“A手机”的点击指标和购买指标。以此类推,得到第二步中的每ー个捜索结果在特定的关键词下的点击指标和购买指标。本实施例中涉及的点击指标是表示某一捜索条件在特定的关键词下被查询的次数信息,也就是说,在以搜索结果所在的捜索结果组对应的关键词为搜索条件时,得到的搜索结果被查询的次数信息。所述被查询的次数信息包括查询该捜索结果的用户数量或该搜索结果被查询的次数。例如当有50个用户以“A品牌”为搜索条件对得到的捜索结果“A品牌手机”进行点击查询时,共点击查询了 200次,则“A品牌手机”在关键词“A品牌”下的点击指标可以预置为用户数50或者点击查询数200。本实施例中涉及的购买指标是表示某一捜索条件在特定的关键词下被查询后产生购买行为的次数信息,也就是说,在以搜索结果所在的捜索结果组对应的关键词为搜索条件时,得到的捜索结果被用户查询后,用户根据查询结果购买了相应产品的次数信息。所述产生购买行为的次数信息包括产生购买行为的用户数量或根据查询该搜索结果产生购买行为的次数。例如当有50个用户以“A品牌”为搜索条件对得到的捜索结果“A品牌手机”进行点击查询时,共点击查询了 200次,有8个用户点击查询后购买了 A品牌手机,这8个用户共购买了 12次A品牌手机,则“A品牌手机”在关键词“A品牌”下的购买指标为购买用户数8或者累计购买数12。按照上述生成点击指标和购买指标的方式,可以得到第二步中各捜索结果在特定搜索词下的点击指标和购买指标,每ー个搜索结果在一个搜索词下的点击指标和购买指标记录成ー个字段,该字段至少包括く关键词 >、〈捜索结果 >、〈搜索结果在该关键词下的点击指标〉、〈搜索结果在该关键词下的购头指标〉。将第~■步中米集的所有搜索结果在各自的关键词下的点击指标和购买指标的字段组合在一起,可以形成如表I所示的列表结构,表I所示的列表结构是以搜索结果被查询的次数作为该搜索结果的点击指标,根据查询搜索结果产生购买行为的次数作为该搜索结果的购买指标。
关键词搜索结果点击指标购头指标
A品牌A手机20012
A品牌A显示器 1506
A品牌A游戏机 3009
手机A手机2008
手机B手机50050
手机手机配件 25010表I第四歩根据所述点击指标和购买指标生成成交參数,作为以所在的捜索结果组对应的关键词为搜索条件时,该搜索结果对应的成交參数。在得到表I所示的列表结构后,可以对表I中每一字段中的点击指标和购买指标进行运算,得到捜索结果在特定关键词下的成交參数。计算成交參数的方式包括但不限于以下三种方式以及这三种方式的变形第一种计算成交參数的方式根据公式(I)生成成交參数Z = — ( I )
7其中,Z表示搜索结果的成交參数;X表示搜索结果的购买指标;Y表示搜索结果的点击指标。第二种计算成交參数的方式根据公式(2)生成成交參数
权利要求
1.一种搜索方法,其特征在于,包括 在接收到包含关键词的捜索请求时,以该关键词为搜索条件,从数据库服务器中捜索出M个搜索结果,以及 根据关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定接收到的关键词对应的成交參数满足设定条件的N个搜索结果; 将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他搜索结果排列在后,并返回排列后的捜索结果,所述M和N为正整数。
2.如权利要求I所述的方法,其特征在于,所述关键词、捜索结果和捜索结果的成交參数三者的对应关系通过以下方式建立的 采集设定时长内接收到的包含关键词的搜索请求,分别从数据库服务器中以每个关键词为搜索条件进行搜索,确定每个关键词对应的包含至少ー个捜索结果的搜索结果组; 针对每个搜索結果,确定以所在的捜索结果组对应的关键词为搜索条件时,该搜索结果的点击指标、点击该搜索结果后产生的购买指标; 根据所述点击指标和购买指标生成成交參数,作为以所在的捜索结果组对应的关键词为搜索条件吋,该搜索结果对应的成交參数。
3.如权利要求2所述的方法,其特征在于,搜索结果的点击指标是以搜索结果所在的捜索结果组对应的关键词为搜索条件吋,查询该捜索结果的用户数量,或,该搜索结果被查询的次数; 购买指标是查询该捜索结果的用户中,根据该搜索结果产生购买行为的用户数量,或,根据查询该搜索结果产生购买行为的次数。
4.如权利要求3所述的方法,其特征在于,根据以下公式生成成交參数 其中,Z表示成交參数;X表示成交參数对应搜索结果的购买指标;Y表示成交參数对应捜索结果的点击指标;或 根据以下公式生成成交參数 其中,X7表示成交參数对应搜索结果所在搜索结果组内所有搜索结果的购买指标的方差;或 根据以下公式生成成交參数 其中,Y7表示成交參数对应搜索结果所在搜索结果组内所有搜索结果的点击指标的方差。
5.如权利要求I所述的方法,其特征在于,若所述M个搜索结果按照与关键词的相关性由高至低排列,所述N个搜索结果对应的成交參数按照由大至小排列,则将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他捜索结果按照与关键词的相关性由高至低的顺序排列在后。
6.如权利要求I所述的方法,其特征在于,所述方法还包括 确定M个搜索结果中每个搜索结果的相关度评分; 所述将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他搜索结果排列在后,具体包括 将M个搜索结果作为待处理队列中的捜索结果,并按照对应的成交參数按照由大至小的顺序依次读取N个搜索结果中的每个搜索結果,针对读取的每个搜索结果执行以下操作 判断待处理队列中是否有读取的第i个搜索结果,所述i是取值为I至N的正整数;若没有,则将为第i个搜索结果分配的权重值作为该搜索结果的相关度评分,并写入待处理队列;若有,则将为第i个搜索结果分配的权重值和第i个搜索结果的相关度评分之和作为第i个搜索结果新的相关度评分; 在读取的N个搜索结果都执行以上操作后,将待处理队列中的捜索结果按照相关度评分由高到低的顺序排列。
7.如权利要求6所述的方法,其特征在于,所述N个搜索结果中,对应的成交參数越大的搜索結果,分配的权重值越大。
8.如权利要求I所述的方法,其特征在于,所述方法还包括 确定M个搜索结果中每个搜索结果的相关度评分,以及N个搜索结果中每个搜索结果的成交量评分; 所述将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他搜索结果排列在后,具体包括 将M个搜索结果作为待处理队列中的搜索結果,并读取N个搜索结果中的每个搜索结果,针对读取的每个搜索结果执行以下操作 判断待处理队列中是否有读取的第i个搜索结果,所述i是取值为I至N的正整数;若没有,则将第i个搜索结果的成交量评分作为该搜索结果的相关度评分,并写入待处理队列;若有,则将第i个搜索结果的成交量评分和第i个搜索结果的相关度评分之和作为第i个搜索结果新的相关度评分; 在读取的N个搜索结果都执行以上操作后,将待处理队列中的捜索结果按照相关度评分由高到低的顺序排列。
9.ー种搜索设备,其特征在于,包括 第一捜索模块,用于在接收到包含关键词的捜索请求时,以该关键词为搜索条件,从数据库服务器中捜索出M个搜索结果; 第二捜索模块,用于根据关键词、捜索结果和捜索结果的成交參数三者的对应关系,确定接收到的关键词对应的成交參数满足设定条件的N个搜索结果; 排序模块,用于将N个搜索结果排列在前,并将M个搜索结果中除与N个搜索结果相同的其他搜索结果排列在后,所述M和N为正整数; 结果返回模块,用于返回排列后的捜索結果。
10.如权利要求9所述的设备,其特征在于,还包括 关系建立模块,用于采集设定时长内接收到的包含关键词的搜索请求,分别从数据库服务器中以每个关键词为搜索条件进行搜索,确定每个关键词对应的包含至少ー个搜索结果的搜索结果组,针对每个搜索結果,确定以所在的捜索结果组对应的关键词为搜索条件时,该搜索结果的点击指标、点击该搜索结果后产生的购买指标,井根据所述点击指标和购 买指标生成成交參数,作为以所在的捜索结果组对应的关键词为搜索条件吋,该搜索结果对应的成交參数。
全文摘要
本申请公开了一种搜索方法及设备,主要内容包括以接收到的关键词为搜索条件,从数据库服务器中搜索出与关键词的相关度较高的M个搜索结果,并根据关键词、搜索结果和搜索结果的成交参数三者的对应关系,确定成交参数高的N个搜索结果,然后将与成交转化效果有关的搜索结果排列在前,与相关度有关的搜索结果排列在后,由于排列在前的搜索结果是产生购买行为概率高的搜索结果,因此,排列在前的搜索结果满足用户查询需求的概率也较高,提高搜索效率,且由于减少了用户点击查询次数,因此,可以减少网络服务器为用户的点击查询操作分配的系统资源,减少系统资源的浪费;用户使用很少的关键词就产生购买行为,减少服务器为用户搜索过程分配的资源。
文档编号G06F17/30GK102841904SQ20111017271
公开日2012年12月26日 申请日期2011年6月24日 优先权日2011年6月24日
发明者刘健 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1