一种基于点击量的搜索方法和装置的制造方法_2

文档序号:8457332阅读:来源:国知局
例1的步骤流程图,具体可以包括如下步骤:
[0061]步骤101,当接收到客户端发送的搜索对象时,根据所述搜索对象查找第一搜索结果;
[0062]在具体实现中,用户可以从任何一种电子设备访问服务器(如搜索引擎),该电子设备具体可以包括移动设备,例如手机、PDA (Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑等等,也可以包括固定设备,例如个人计算机、智能电视等等,本发明实施例对此不加以限制。
[0063]这些电子设备可以支持包括Android (安卓)、10S>WindowsPhone或者windows等的操作系统,通常可以运行浏览器或内置微型浏览器的应用程序。
[0064]在实际应用中,浏览器或内置微型浏览器的应用程序可以将请求头信息通过HTTP (Hypertext transfer protocol,超文本传送协议)协议向搜索引擎所在的服务器发起搜索请求。
[0065]即在本发明实施例中,服务器(如搜索引擎)可以接收从浏览器或内置微型浏览器的应用程序发送的搜索请求,该搜索请求可以是指搜索与某个搜索对象相关信息的指不O
[0066]例如,用户可以通过在搜索引擎的网页中输入某个搜索对象发起搜索请求,或者在浏览器的搜索插件(plug-1ns,可以通过与浏览器、搜索引擎等进行交互,在浏览器中增加搜索功能)等输入某个搜索对象发起搜索请求等等。当用户在搜索引擎网页中点击搜索控件时,就相当于接收到发起基于搜索引擎的搜索请求的指示;同样,当在搜索插件中输入某个搜索对象并点击确定按钮或按下回车键时,也相当于接收到发起基于搜索引擎的搜索请求的指示。
[0067]搜索对象可以包括文本信息、图片信息、音频信息等等,本发明实施例对此不加以限制。
[0068]该服务器(如搜索引擎)接收到该搜索请求之后等待处理,则可以根据该搜索对象在数据库中快速检出相关的信息,获得第一搜索结果,其中,该第一搜索结果可以包括搜索结果项。
[0069]相对于服务器(如搜索引擎)而言,该浏览器或内置微型浏览器的应用程序可以称之为客户端,因此,该第一搜索结果可以为基于当前客户端,根据所述搜索对象查找到的搜索结果,即该第一搜索结果可以为针对当前用户而言的。
[0070]若搜索对象为文本信息,则可以基于倒排索引等方式搜索相关的网页。
[0071]以搜索引擎为例进行说明,搜索引擎的搜索流程分为二个部分,一是前端用户请求过程,二是后端制作数据过程。
[0072]一、前端用户请求过程:
[0073]1.接收请求:接收用户在搜索引擎输入的文本信息;
[0074]2.查询词分析:对文本信息进行分词处理;
[0075]3.检索:根据分词结果,从预先制作的倒排索引中,查找与分词结果相关的候选的网页;
[0076]4.排序:针对候选的网页,根据内容相关性、时效性等维度进行排序。
[0077]二、后端制作数据过程:
[0078]1.网页抓取:采用爬虫技术,通过网页间的链接关系,抓取互联网的网页并保存。
[0079]2.索引制作:对已抓取保存的网页进行分析,例如对网页标题和页面文本进行分词处理,根据分词结果制作倒排索引,供前端用户请求过程使用。
[0080]若搜索对象为音频数据,则可以识别出该音频数据对应的文本信息,再基于倒排索引等方式搜索相关的网页。
[0081]若第一搜索对象为图片信息,则可以通过图片相似度等方式查找相似或相同的网页图像信息。
[0082]当然,上述搜索对象及其搜索方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他搜索对象及其搜索方式,本发明实施例对此不加以限制。另外,除了上述搜索对象及其搜索方式外,本领域技术人员还可以根据实际需要采用其它搜索对象及其搜索方式,本发明实施例对此也不加以限制。
[0083]步骤102,至少查找所述搜索结果项对应的首次点击量;
[0084]其中,所述首次点击量可以为在所述搜索对象对应的第二搜索结果中,首次点击所述搜索结果项的点击量;
[0085]在本发明实施例中,所述第二搜索结果可以为基于不同客户端,根据所述搜索对象查找到的搜索结果,即第二搜索结果针对群体用户而言的,首次点击量也是针对群体用户而言的,并不一定针对当前用户而言的。
[0086]步骤103,至少根据所述首次点击量调整所述搜索结果项的排序权重;
[0087]在实际应用中,用户输入搜索对象时,不管有没有用文字来表达意图,用户的意图一般是明确的。
[0088]用户输入“金星”,所得到的搜索结果可能包括与“太阳系的行星金星”相关的搜索结果项,也可能包括与“舞蹈家金星”相关的搜索结果项,由于搜索结果项一般包括摘要信息,用户可以从摘要信息中明确该搜索结果项是与“太阳系的行星金星”相关,还是与“舞蹈家金星”相关。
[0089]如果用户的搜索意图是“太阳系的行星金星”,那么,按照用户的行为习惯,用户第一次(即首次)点击的搜索结果项很大概率是与“太阳系的行星金星”相关的搜索结果项,而不会点击与“舞蹈家金星”相关的搜索结果项;
[0090]反之,如果用户的搜索意图是“舞蹈家金星”,那么,按照用户的行为习惯,用户第一次(即首次)点击的搜索结果项很大概率是与“舞蹈家金星”相关的搜索结果项,而不会点击与“太阳系的行星金星”相关的搜索结果项。
[0091]因此,在本发明实施例中,搜索结果项的排序权重可以与首次点击量正相关。
[0092]步骤104,按照所述排序权重对所述搜索结果项进行排序;
[0093]在本发明实施例中,若搜索结果项的首次点击量较高,则可以提升其排序,以优先显示与群体用户搜索意图相符的搜索结果项。
[0094]步骤105,将排序之后的第一搜索结果返回所述客户端。
[0095]在HTTP协议下,浏览器或内置微型浏览器的应用程序(客户端)可以从服务器(如搜索引擎)接收到HTML (Hypertext Markup Language,超文本标记语言)类型的文档。
[0096]浏览器或内置微型浏览器的应用程序(客户端)可以解析该HTML文档,生成树状结构的对象,即DOM(Document Object Model,文件对象模型),每个对象是DOM上的一个结点,而这些对象可以代表文字、图片等网页资源。
[0097]浏览器或内置微型浏览器的应用程序(客户端)可以开始显示此HTML文档,并获取其中内嵌的网页资源的地址,然后再向服务器(如搜索引擎)发起请求来获取这些网页资源,并在浏览器或内置微型浏览器的应用程序(客户端)的HTML文档中显示第一搜索结果O
[0098]本发明实施例按照搜索结果项的首次点击量计算排序权重,以对搜索结果项进行排序,根据用户的行为习惯,优先显示符合群体用户意图的搜索结果项,减少冗余的搜索结果项,可以大大减少用户翻页查找所需的结果的操作频次,提高了操作的简便性,提高了搜索效率。
[0099]参照图2,示出了根据本发明一个实施例的一种基于点击量的搜索方法实施例2的步骤流程图,具体可以包括如下步骤:
[0100]步骤201,记录在第二搜索结果中,搜索结果项的点击量;
[0101]在本发明实施例中,可以预先累积不同客户端(即群体用户)在该搜索对象对应的第二搜索结果中,搜索结果项的点击量。
[0102]在本发明的一种可选实施例中,步骤201可以包括如下子步骤:
[0103]子步骤S11,输出所述搜索对象对应的第二搜索结果;
[0104]在具体实现中,服务器(如搜索引擎)可以向不同客户端(即群体用户)输出第二搜索结果,其中,第二搜索结果中可以包括所述搜索结果项;
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1