基于当前浏览页面的关键词搜索系统的制作方法

文档序号:6519285阅读:181来源:国知局
基于当前浏览页面的关键词搜索系统的制作方法
【专利摘要】本发明涉及一种基于当前浏览页面的关键词搜索系统。该系统包括:客户端、云服务器以及搜索引擎服务器。其中,客户端用于向云服务器发送包含当前浏览页面的页面标识的第一请求消息,并接收云服务器返回的第一响应消息;获取第一响应消息中包含的关键词以及关键词的属性信息;在当前浏览页面上推送关键词以及搜索入口元素;在接收到搜索入口元素触发的搜索请求后,向搜索引擎服务器发送包含搜索入口元素对应的关键词及其属性信息的搜索请求消息;接收并显示搜索结果。云服务器用于接收并解析客户端发送的第一请求消息,并确定页面内容中包含的关键词以及关键词的属性信息;向浏览器发送包含关键词以及关键词的属性信息的第一响应消息。
【专利说明】基于当前浏览页面的关键词搜索系统
【技术领域】
[0001]本发明涉及网络通信【技术领域】,具体涉及一种基于当前浏览页面的关键词搜索系统。
【背景技术】
[0002]随着网络的普及,越来越多的用户习惯于通过网络浏览器来获取信息。
[0003]目前,当用户通过网络浏览器浏览网页时,如果对某一网页中的特定关键词感兴趣,希望进一步了解该关键词的具体含义及更多相关信息,则往往只能采用如下方式实现:首先,通过浏览器另外打开一个空白搜索页;然后,在该空白搜索页的搜索栏内手动输入该关键词;最后,还要从众多的搜索结果中挑选出感兴趣的结果。
[0004]由此可见,在上述方式中,首先需要由用户主动去发现感兴趣的关键词,而这往往需要用户在仔细阅读并深入理解网页内容的前提下才能发现;另外,当用户发现了感兴趣的关键词之后,还需要经过上述一系列复杂的操作才能获取到该关键词相关的信息,以便进行扩展阅读。因此,导致用户的阅读体验较差,无法高效地获取到更多的信息。

【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于当前浏览页面的关键词搜索系统。
[0006]一种基于当前浏览页面的关键词搜索系统,包括:客户端、云服务器以及搜索引擎服务器,其中,所述客户端进一步包括:通信接口模块,适于向云服务器发送包含所述当前浏览页面的页面标识的第一请求消息,并接收所述云服务器根据所述第一请求消息返回的第一响应消息;获取模块,适于获取所述第一响应消息中包含的与所述当前浏览页面相对应的关键词以及所述关键词的属性信息;推送模块,适于在所述当前浏览页面上推送所述关键词以及所述关键词对应的搜索入口元素;搜索模块,适于在接收到所述搜索入口元素触发的搜索请求后,向预设的搜索引擎服务器发送包含所述搜索入口元素对应的关键词以及所述关键词的属性信息的搜索请求消息;接收并显示所述搜索引擎服务器返回的所述搜索请求消息的搜索结果;所述云服务器进一步包括:通信接口模块,适于接收并解析客户端发送的第一请求消息,得到所述第一请求消息中包含的当前浏览页面的页面标识;确定模块,适于根据所述页面标识获取所述当前浏览页面的页面内容,确定所述页面内容中包含的关键词以及所述关键词的属性信息;所述通信接口模块还适于向所述浏览器发送包含所述关键词以及所述关键词的属性信息的第一响应消息;所述搜索引擎服务器适于根据客户端发送的搜索请求消息,向该客户端返回所述搜索请求消息的搜索结果,其中,所述搜索结果的属性信息与所述关键词的属性信息相同。
[0007]在本发明提供的基于当前浏览页面的关键词搜索系统中,首先由浏览器主动向云服务器发送包含当前浏览页面的页面标识的第一请求消息,然后由云服务器基于该页面标识获取到当前浏览页面的具体内容,并据此确定当前浏览页面对应的关键词,最后由浏览器在当前浏览页面上推送该关键词。由此可见,使用该浏览器的用户不需要主动去发现页面中的关键词,因此,不需要对页面内容进行仔细阅读或深入理解就可以直接获取到浏览器推送的关键词,进而能够获取到更多的有用信息,从而提高了用户的阅读体验。
[0008]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0009]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0010]图1示出了根据本发明实施例提供的用于实现基于当前浏览页面的关键词搜索服务的系统架构图;
[0011]图2示出了本发明一个实施例提供的基于当前浏览页面的关键词搜索方法的流程图;
[0012]图3a示出了未显示搜索区域的当前浏览页面的示意图;
[0013]图3b示出了显示出搜索区域的当前浏览页面的示意图;
[0014]图4示出了本发明一个实施例提供的基于当前浏览页面的关键词搜索装置的结构图;
[0015]图5示出了本发明另一个实施例提供的基于当前浏览页面的关键词搜索装置的结构图;
[0016]图6示出了本发明另一个实施例提供的基于当前浏览页面的关键词搜索系统的结构图。
【具体实施方式】
[0017]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0018]本发明实施例提供了一种基于当前浏览页面的关键词搜索方法、装置及系统,用以解决现有技术中用户只有在仔细阅读并深入理解网页内容的前提下才能主动发现网页内容中的关键词并进行扩展阅读的问题。
[0019]图1示出了本发明实施例中,用于实现基于当前浏览页面的关键词搜索服务的系统架构图。如图1所示,客户端200包括但不仅限于各种PC、平板设备、智能手机等,客户端200与云服务器300通过各种有线或无线方式连接,且客户端200进一步与一个或多个搜索引擎服务器400连接。本发明基于该系统架构为用户提供关键词搜索服务。在图1中,示意性画出了两个客户端和两个搜索引擎服务器,实际上,客户端的数量可以更多,搜索引擎服务器的数量以及搜索引擎服务器与某一客户端之间的连接关系也可以根据需要灵活调整。
[0020]图2示出了本发明一个实施例提供的基于当前浏览页面的关键词搜索方法的流程图。如图2所示,本方法包括如下步骤:
[0021]步骤SlOl:客户端判断当前浏览页面的显示时间是否超过预设阈值,并在判断结果为是时,触发步骤S102。
[0022]具体地,上述步骤SlOl的执行主体通常是指客户端上安装的浏览器,该浏览器首先根据用户输入的网址向用户展现该网址对应的页面。当浏览器判断出当前浏览页面的显示时间超出了预设阈值(例如5秒)时,可以初步确定用户对当前浏览页面比较感兴趣,因而浏览器触发步骤S102及其后续步骤,以便实现本发明的关键词推送服务。其中,步骤SlOl并不是一个必需的步骤,而是一个可选的步骤。通过步骤SlOl可以从用户浏览的众多页面中过滤掉用户匆匆略过的页面,只在用户感兴趣的页面中推送关键词,这样更能迎合用户的需求,也避免了客户端和云服务器之间不必要的数据传输。
[0023]步骤S102:客户端向云服务器发送包含当前浏览页面的页面标识的第一请求消
肩、O
[0024]具体地,在步骤S102中,首先由客户端的浏览器获取当前浏览页面的页面标识,该页面标识例如可以是当前浏览页面的URL地址。然后,浏览器将该页面标识作为第一请求消息中所包含的参数传递给云服务器。其中,第一请求消息的形式包括但不限于http消息中的get/post请求或socket连接请求等。
[0025]步骤S103:云服务器接收并解析客户端浏览器发送的上述第一请求消息,得到上述第一请求消息中包含的浏览器的当前浏览页面的页面标识,即上述的当前浏览页面的URL地址。
[0026]步骤S104:云服务器根据上述页面标识获取当前浏览页面的页面内容,确定该页面内容中包含的关键词。
[0027]具体地,在步骤S104中,云服务器首先要根据步骤S103中获取到的URL地址,向预设的网页服务器请求该URL地址对应的页面内容。之后,云服务器基于网页服务器返回的页面内容来确定该页面内容中包含的关键词。其中,在具体确定页面内容中的关键词时,可以通过多种方式来实现,下面给出常用的两种方式:
[0028]在第一种方式中,云服务器首先对该页面内容中的概要性内容(例如标题和/或摘要等)进行分词处理,得到该概要性内容中包含的各个字词。然后,云服务器计算该概要性内容中包含的各个字词在正文中的同现率,将同现率高于设定阈值的字词确定为关键词。由于概要性内容中往往包含了一篇文章的核心字词,且核心字词往往会反复出现在正文中(即同现率较高),因此,通过这种方式确定关键词的准确率较高。而且,只对概要性内容进行分词处理还可以显著降低分词处理的工作量,提高确定关键词的效率。
[0029]在第二种方式中,云服务器主要通过查询预设的关键词数据库来确定页面内容中的关键词:首先,云服务器对上述的页面内容进行分词处理,得到该页面内容中包含的字词。其中,分词处理的目的主要在于从一整段内容中提取出单个的字词,以便于后续的查询。然后,云服务器根据分词处理后得到的字词,查询上述预设的关键词数据库,以便确定该页面内容中包含的关键词。
[0030]具体地,上述关键词数据库中存储有:特征词,以及与特征词对应的推荐词。其中,特征词与其对应的推荐词之间可以通过双向映射的方式存储,例如,假设特征词A对应的推荐词为B,这时,可以在关键词数据库中存储“A— B”,其一方面表示特征词A的推荐词为B,另一方面还表示特征词B的推荐词为A。相应地,云服务器根据该关键词数据库来确定关键词时,首先,确定页面内容中包含的各个字词是否与该关键词数据库中存储的特征词匹配,将与特征词匹配的字词确定为第一类关键词,由此可见,第一类关键词通常是直接包含在当前浏览页面的显示内容中的信息;然后,进一步判断上述第一类关键词对应的特征词是否存在对应的推荐词,如果存在,将对应的推荐词确定为第二类关键词,由此可见,第二类关键词通常并不是直接出现在当前浏览页面的显示内容中的信息,而是与当前浏览页面的显示内容相关联的信息。通过上面的方式,可以同时确定出上述两类关键词,从而确保推送的关键词的全面性。在本发明其他的实施例中,也可以只确定其中的一类关键词。
[0031]另外,上面介绍的两种确定关键词的方式既可以单独使用,也可以结合使用,本发明对此不作限定。
[0032]步骤S105:云服务器确定上述的关键词的属性信息,其中,属性信息包括文字、图片和视频等各类属性信息。其中,步骤S105为可选步骤,而且,步骤S105也可以与步骤S104调换顺序。
[0033]具体地,云服务器分析当前浏览页面的属性信息,并把当前浏览页面的属性信息作为该页面所对应的关键词的属性信息。其中,云服务器可以根据当前浏览页面所对应的网络资源的类型来确定当前浏览页面的属性信息。通常情况下,网页服务器中存储有多个类型的网络资源,例如,文字类型的网络资源、图片类型的网络资源、以及视频类型的网络资源等。这样,云服务器根据当前浏览页面在网页服务器中对应的网络资源的类型就可以确定出当前浏览页面的属性信息,进而确定出关键词的属性信息。
[0034]步骤S106:云服务器向上述的客户端浏览器发送包含上述关键词的第一响应消息。其中,当本发明实施例进一步包括步骤S105时,该第一响应消息中进一步包含上述关键词的属性信息。
[0035]步骤S107:客户端浏览器接收云服务器返回的上述第一响应消息,获取第一响应消息中包含的与当前浏览页面相对应的关键词,并在当前浏览页面上推送该关键词。
[0036]其中,客户端浏览器在当前浏览页面上推送关键词时,可以通过多种方式实现。例如,可以直接在当前浏览页面中将关键词以高亮方式(或其他能够引起用户注意的方式)显示,这种方式尤其适用于上述的第一类关键词;或者,也可以预先在当前浏览页面上设置搜索区域,然后将关键词显示在该搜索区域内,这种方式尤其适用于上述的第二类关键词。
[0037]例如,图3a的显示界面是未显示搜索区域的当前浏览页面,图3b的显示界面是显示了搜索区域的当前浏览页面,该搜索区域中显示的内容即为图中右上角的“搜索更多网购节的新闻”及“搜索更多光棍劫的新闻”。在实际情况中,上述两种方式既可以单独使用,也可以结合使用。
[0038]另外,为了便于用户对浏览器推送的关键词进行搜索,从而实现扩展阅读,在具体推送关键词时,可以通过将上述关键词以及上述关键词对应的搜索入口元素显示在当前浏览页面上的方式进行推送。也就是说,浏览器在当前浏览页面上推送关键词之前,还需要为所有的关键词或其中的部分关键词分别设置对应的搜索入口元素。通俗地说,搜索入口元素也可以称作搜索按钮,其实现形式包括但不限于以下方式:关键词对应的超链接,以及关键词对应的搜索键。其中,超链接主要通过关键词下方的下划线实现,搜索键主要通过关键词旁边显示的三角形或其他形状的按键实现。[0039]具体地,在显示上述关键词以及关键词对应的搜索入口元素时,可以通过网页动态语言,例如 ASP (Active Server Pages), JSP (Java Server Pages), PHP (HypertextPr印rocessor)等语言,修改当前浏览页面的显示内容的方式实现;或者,也可以通过浏览器程序和/或浏览器插件来实现上述关键词以及关键词对应的搜索入口元素的显示。
[0040]步骤S108:在接收到上述搜索入口元素触发的搜索请求后,向预设的搜索引擎(也叫搜索引擎服务器)发送包含该搜索入口元素对应的关键词的搜索请求消息,并显示该搜索引擎返回的搜索结果。其中,步骤S108为可选步骤,其仅在浏览器推送的关键词包含搜索入口元素,且用户点击了某一搜索入口元素的情况下被触发。
[0041]具体地,用户点击搜索入口元素的动作将触发一个事件,即:搜索入口元素向浏览器发送搜索请求的事件。浏览器接收到该搜索请求之后,则构造对应的搜索请求消息。其中,当搜索入口元素为超链接形式时,该搜索入口元素触发的搜索请求为一个URL链接,该链接中包含“Q=关键词”的字段,其中,Q表示查询词(query),因此,浏览器直接将该URL链接作为搜索请求消息发送给对应的搜索引擎即可;当搜索入口元素为搜索键形式时,该搜索入口元素触发的搜索请求中只包含对应的关键词,因此,浏览器需要提取出搜索请求中包含的关键词,并根据该关键词创建包含“Q=关键词”字段的URL链接,然后将创建的URL链接作为搜索请求消息发送给对应的搜索引擎。之后,搜索引擎根据浏览器发送的URL链接确定该链接所对应的搜索结果,并将该搜索结果发送给浏览器。
[0042]优选地,为了提高搜索引擎的处理速度和准确度,可以预先在搜索引擎中存储各个关键词对应的搜索请求消息与相应的搜索结果之间的映射,这样,当搜索引擎接收到一个搜索请求消息后,只需查询预设的映射表,找出该搜索请求消息对应的搜索结果即可,这样可以大幅提高搜索引擎的处理效率。而且,这样还便于搜索引擎将最贴近当前浏览内容的搜索结果提供给用户,与现有技术中需要由用户从众多的搜索结果中查找与当前浏览内容最贴近的搜索结果的方式相比 ,避免了用户的查找时间。
[0043]另外,当本发明实施例进一步包括步骤S105时,由于第一响应消息中进一步包含了关键词的属性信息,因此,在步骤S108中,浏览器在构造上述的搜索请求消息时,进一步在搜索请求消息中包含关键词的属性信息,这样,搜索引擎返回的搜索结果是与关键词的属性信息相同属性的搜索结果。也就是说,如果当前浏览页面的属性为文字,则搜索结果也是文字内容;如果当前浏览页面的属性为图片,则搜索结果也是图片内容;如果当前浏览页面的属性为视频,则搜索结果也是视频内容,由此更能满足用户的需求。具体实现时,可以在搜索引擎上设置多个存储区域,每个存储区域用于存储相应属性的搜索结果;或者,也可以分别设置多个搜索引擎,每个搜索引擎用于存储相同属性的搜索结果。
[0044]为了便于理解本发明,下面给出上述方法中的部分步骤的示意性代码:
[0045]ffebview.1oadUrl ( “http://www.s0.com/.....”);// 显不网页
[0046]ffebview.1oadUrl( ujavascript:showSearchBarffithKeyword (
[0047]......[0048]Button.0nClick (
[0049]Il
[0050]http://www.s0.com/s?ie=utf-8&bs=网购节 &f=8&rsv_bp=l&wd=gggg&inputT=0
[0051]);[0052]......[0053])”);//当取得服务器返回的关键词时,在网页上注入javascript显示该关键词的搜索栏
[0054]通过上述代码,浏览器可以实现当前浏览页面以及该页面上的关键词及其搜索入口元素的显示。具体地,上述代码中的ffebview.1oadUrl ( “http://www.s0.com/.....”)
用于展不 360 搜索的页面,Webview.1oadUrl (“javascript: showSearchBarffithKeyword 用于定义带有搜索入口元素的关键词,Button.0nClick中的语句用于定义该按钮被点击时所触发的事件,在上述示例中,当搜索入口元素被点击时会打开URL为“http://www.s0.com/s?ie=utf-8&bs=网购节 &f=8&rsv_bp=l&wd=gggg&inputT=0” 的搜索结果页面。
[0055]下面结合图3a、图3b以及上述代码对本发明提供的上述关键词推送方法的整体流程给予直观地介绍:首先,用户通过浏览器阅读图3a所显示的关于网购节的新闻,当用户阅读该新闻的时间超过预设阈值时,根据本发明实施例提供的方法,将触发浏览器所在的客户端向云服务器发送包含该新闻的URL地址的第一请求消息。然后,云服务器根据该第一请求消息中的URL地址,向预设的网页服务器请求该URL地址对应的页面内容(也就是图3a所显示的新闻内容)。接下来,云服务器对该新闻的内容进行分析,确定出其中包含的关键词。具体分析时,可以采用步骤S104中提到的两种方式中的任意一种来实现。例如,当采用第一种方式时,先对新闻的标题进行分词处理,得到标题中包含的“网购节”这一字词,然后,计算该字词在新闻正文中的同现率,因该字词出现了多次,因此同现率必然大于设定阈值,因此,通过第一种方式可以确定出“网购节”为一个关键词。当采用第二种方式时,先对新闻的标题及正文进行分词处理,得到其中包含的各个字词,然后查询这些字词是否与关键词数据库中的特征词或推荐词匹配,将匹配的字词作为关键词,例如,通过第二种方式确定出“双十一”、“网购节”和“光棍节”三个字词为第一类关键词;另外,假设在关键词数据库中还存储有特征词“光棍节”与推荐词“光棍劫”之间的映射,此时,还会进一步将“光棍劫”确定为第二类关键词。进一步地,云服务器还可以根据这篇新闻对应的网络资源类型确定出该新闻页面的属性为文字,因此,云服务器确定上述各个关键词的属性也为文字。之后,云服务器将确定出的四个关键词“双十一”、“网购节”、“光棍节”和“光棍劫”及其对应的文字属性封装在第一响应消息中发送给客户端浏览器。客户端浏览器解析出该响应消息中所包含的四个关键词及其属性信息之后,在当前浏览的新闻页面上推送这些关键词,如图3b所示。从图3b中可以看出,浏览器在推送上述关键词时,同时采用了超链接和搜索键这两种形式的搜索入口元素。例如,新闻正文中出现的“双十一”、“网购节”以及“光棍节”这三个关键词所对应的的搜索入口元素是采用超链接形式实现的,当用户点击这些关键词时,就会通过下划线所标识的超链接触发搜索请求,相应地,浏览器根据该搜索请求向预设的搜索引擎发送包含相应的关键词的搜索请求消息,并显示搜索引擎返回的搜索结果。另外,在图3b中还显示有预设的搜索区域,该搜索区域中的“搜索更多网购节的新闻”对应的搜索框就是通过搜索键的形式实现的,类似的,“搜索更多光棍劫的新闻”对应的搜索框也是通过搜索键的形式实现的。当用户点击“搜索更多网购节的新闻”对应的搜索框时,将触发该搜索框发送搜索请求,浏览器根据该搜索请求向预设的搜索引擎发送包含网购节的搜索请求消息,并显示搜索引擎返回的搜索结果。其中,该搜索框的上述功能是通过上述代码段中的代码“Button.0nClick(//http://www.s0.com/s?ie=utf-8&bs=网购节&f=8&rsv_bp=l&wd=gggg&inputT=0) ”来实现的。通过代码看出,当用户点击该搜索框时,浏览器将会向搜索引擎发送”“http://www.s0.com/s?ie=utf-8&bs=网购节&f=8&rsv_bp=l&wd=gggg&inputT=0”的请求消息,相应的,搜索引擎中预存了上述请求消息中的链接所对应的网页内容,因此,搜索引擎直接向客户端浏览器返回对应的网页内容即可,由于该网页内容是预存的,因此,一般是与该请求消息最为相关的内容,从而更能迎合用户的需求。另外,在上面提到的搜索请求消息中还会进一步包含关键词的文字属性信息,因此,搜索引擎返回的搜索结果的属性信息也均为文字。通常情况下,阅读文字的用户在同一时间段内更倾向于阅读其他的文字,浏览视频的用户在同一时间段内更倾向于浏览其他的视频,所以,通过属性信息确定搜索结果的方式更能满足用户的当前需求。
[0056]综上所述,通过本发明实施例提供的基于当前浏览页面的关键词搜索方法,使浏览器用户不需要主动去发现页面中的关键词,因此,不需要对页面内容进行仔细阅读或深入理解就可以直接获取到浏览器推送的关键词,进而能够获取到更多的有用信息,从而提高了用户的阅读体验。
[0057]另外,本发明实施例中进一步为关键词设置了对应的搜索入口元素,用户只需点击该搜索入口元素即可得到对应的搜索结果。由此避免了现有技术中需要由用户重新打开一个搜索空白页并手动输入关键词进行搜索的繁琐操作,这样尤其方便了移动终端使用者以及老年使用者:由于移动终端的屏幕较小,且往往采用触摸屏实现,导致现有技术中的用户在移动终端上操作时,需要预先选中并拷贝关键词,然后还要打开一个空白搜索页,定位到搜索栏之后将关键词粘贴到该搜索栏内,这样的操作方式非常繁琐,尤其对于不擅长操作电子设备的老年使用者来说更是困难重重。相应地,本发明实施例中的搜索入口元素则很好的解决了上述问题,用户只需点击一下搜索入口元素即可得到想要的搜索结果,操作非常便捷、简单。而且,由于本发明实施例中还可以预先在搜索引擎服务器中存储搜索请求消息和搜索结果之间的映射,因此,本发明中得到的搜索结果通常是最贴近用户需求的结果,避免了现有技术中用户从大量的搜索结果中筛选自己需要的结果的繁琐操作。
[0058]而且,在本发明实施例中,还可以根据当前浏览页面来确定关键词的属性,从而返回属性相同的搜索结果。其中,属性信息的划分除了采用上面提到的几种划分方式之外,还可以根据实际情况进行其他方式的灵活划分`。例如,可以根据页面的具体内容将其划分为新闻属性、游戏属性、科普属性、电商属性和购物属性等多种属性。总之,通过上述方式,可以结合用户当前浏览内容的类型,为用户推荐相同类型的搜索结果,以便满足用户的实际需求。甚至,在其他的实施例中,还可以进一步根据每个关键词所表示的内容来灵活确定某一关键词的属性,例如,“日全食”这一关键词的属性既可以确定为文字,也可以确定为图片,为此,可以将一些特定关键词的属性一并存储在关键词数据库中。
[0059]进一步地,对于上述实施例,本领域技术人员还可以进行各种变形。例如,当步骤S104中的云服务器没有确定出有效的关键词时,可以不返回第一响应消息,或者仅返回内容为空的第一响应消息,此时浏览器无需推送关键词。或者,也可以在浏览器上设置一个控制开关,用于控制浏览器是否推送关键词,用户可以通过该控制开关选择打开或关闭这一功能,从而在用户不需要此项服务时能够专注阅读,以满足用户的多样化需求。
[0060]图4示出了本发明一个实施例提供的基于当前浏览页面的关键词搜索装置的结构图。图4所示的搜索装置主要是指客户端200,该客户端200包括:通信接口模块210、获取模块220、推送模块230、判断模块240、设置模块250以及搜索模块260。上述的各个模块既可以集成在客户端的浏览器程序内,也可以通过浏览器插件的方式实现。
[0061]其中,判断模块240判断当前浏览页面的显示时间是否超过预设阈值,并在判断结果为是时,通知通信接口模块210发送第一请求消息。其中,判断模块240是一个可选的模块。
[0062]通信接口模块210用于向云服务器发送包含当前浏览页面的页面标识的第一请求消息。具体地,通信接口模块210首先获取当前浏览页面的页面标识,该页面标识例如可以是当前浏览页面的URL地址;然后,通信接口模块210将该页面标识作为第一请求消息中所包含的参数传递给云服务器。其中,第一请求消息的形式包括但不限于http消息中的get/post请求或socket连接请求等。另外,通信接口模块210还用于接收云服务器返回的第一响应消息。
[0063]获取模块220用于获取上述第一响应消息中包含的与当前浏览页面相对应的关键词。
[0064]推送模块230用于在当前浏览页面上推送上述的关键词。其中,推送模块230在当前浏览页面上推送关键词时,可以通过多种方式实现。例如,可以直接在当前浏览页面中将关键词以高亮方式(或其他能够引起用户注意的方式)显示。或者,也可以预先在当前浏览页面上设置搜索区域,然后将关键词显示在该搜索区域内。在预先设置搜索区域的方式中,需要由设置模块250预先设置搜索区域。
[0065]另外,为了便于用户对浏览器推送的关键词进行搜索,从而实现扩展阅读,推送模块230在具体推送关键词时,可以通过将上述关键词以及上述关键词对应的搜索入口元素显示在当前浏览页面上的方式进行推送。也就是说,推送模块230在当前浏览页面上推送关键词之前,还需要为所有的关键词或其中的部分关键词分别设置对应的搜索入口元素。其中,搜索入口元素的实现形式包括但不限于以下方式:关键词对应的超链接,以及关键词对应的搜索键。其中,超链接主要通过关键词下方的下划线实现,搜索键主要通过关键词旁边显示的三角形或其他形状的按键实现。具体地,在显示上述关键词以及关键词对应的搜索入口元素时,可以通过网页动态语言,例如ASP (Active Server Pages), JSP (JavaServer Pages),PHP (Hypertext Preprocessor)等语言,修改当前浏览页面的显示内容的方式实现;或者,也可以通过浏览器程序和/或浏览器插件来实现上述关键词以及关键词对应的搜索入口元素的显示。
[0066]搜索模块260用于在接收到上述搜索入口元素触发的搜索请求后,向预设的搜索引擎发送包含该搜索入口元素对应的关键词的搜索请求消息,并显示该搜索引擎返回的搜索结果。优选地,为了提高搜索引擎的处理速度和准确度,可以预先在搜索引擎中存储各个关键词对应的搜索请求消息与相应的搜索结果之间的映射,这样,当搜索引擎接收到一个搜索请求消息后,只需查询预设的映射列表,找出该搜索请求消息对应的搜索结果即可,这样可以大幅提高搜索引擎的处理效率。而且,这样还便于搜索引擎将最贴近当前浏览内容的搜索结果提供给用户,与现有技术中需要由用户从众多的搜索结果中查找与当前浏览内容最贴近的搜索结果的方式相比,避免了用户的查找时间。
[0067]另外,当第一响应消息中进一步包含了关键词的属性信息时,搜索模块260在构造上述的搜索请求消息时,进一步在搜索请求消息中包含关键词的属性信息,这样,搜索引擎返回的搜索结果是与关键词的属性信息相同属性的搜索结果。也就是说,如果当前浏览页面的属性为文字,则搜索结果也是文字内容;如果当前浏览页面的属性为图片,则搜索结果也是图片内容;如果当前浏览页面的属性为视频,则搜索结果也是视频内容,由此更能满足用户的需求。
[0068]图5示出了本发明另一个实施例提供的基于当前浏览页面的关键词搜索装置的结构图。图5所示的搜索装置主要是指云服务器300,该云服务器300包括:通信接口模块310和确定模块320。其中,确定模块320又可以进一步包括:分词子模块321、查询子模块322、属性子模块323以及关键词数据库324。
[0069]其中,通信接口模块310用于接收并解析浏览器发送的第一请求消息,得到该第一请求消息中包含的浏览器的当前浏览页面的页面标识。
[0070] 确定模块320根据该页面标识获取当前浏览页面的页面内容,确定页面内容中包含的关键词。具体地,确定模块320在确定页面内容中的关键词时,可以通过多种方式来实现,下面给出常用的两种方式:
[0071]在第一种方式中,确定模块320首先对该页面内容中的概要性内容(例如标题和/或摘要等)进行分词处理,得到该概要性内容中包含的各个字词。然后,确定模块320计算该概要性内容中包含的各个字词在正文中的同现率,将同现率高于设定阈值的字词确定为关键词。由于概要性内容中往往包含了一篇文章的核心字词,且核心字词往往会反复出现在正文中(即同现率较高),因此,通过这种方式确定关键词的准确率较高。而且,只对概要性内容进行分词处理还可以显著降低分词处理的工作量,提高确定关键词的效率。
[0072]在第二种方式中,确定模块320主要通过查询预设的关键词数据库来确定页面内容中的关键词。具体地,确定模块320进一步包括分词子模块321、查询子模块322、以及关键词数据库324。首先,分词子模块321对上述的页面内容进行分词处理,得到该页面内容中包含的字词。其中,分词处理的目的主要在于从一整段内容中提取出单个的字词,以便于后续的查询。然后,查询子模块322根据分词处理后得到的字词,查询上述预设的关键词数据库324,以便确定该页面内容中包含的关键词。
[0073]具体地,上述关键词数据库中存储有:特征词,以及与特征词对应的推荐词。其中,特征词与其对应的推荐词之间可以通过双向映射的方式存储,例如,假设特征词A对应的推荐词为B,这时,可以在关键词数据库中存储“A— B”,其一方面表示特征词A的推荐词为B,另一方面还表示特征词B的推荐词为A。相应地,查询子模块322根据该关键词数据库来确定关键词时,首先,确定页面内容中包含的各个字词是否与该关键词数据库中存储的特征词匹配,将与特征词匹配的字词确定为第一类关键词,由此可见,第一类关键词通常是直接包含在当前浏览页面的显示内容中的信息;然后,进一步判断上述第一类关键词对应的特征词是否存在对应的推荐词,如果存在,将对应的推荐词确定为第二类关键词,由此可见,第二类关键词通常并不是直接出现在当前浏览页面的显示内容中的信息,而是与当前浏览页面的显示内容相关联的信息。通过上面的方式,可以同时确定出上述两类关键词,从而确保推送的关键词的全面性。在本发明其他的实施例中,也可以只确定其中的一类关键
ο
[0074]可选地,确定模块320进一步包括属性子模块323,用于确定上述的关键词的属性信息,其中,属性信息包括文字、图片和视频等各类属性信息。[0075]上述的通信接口模块310还适于向浏览器发送包含上述关键词的第一响应消息。当确定模块320进一步包括属性子模块323时,上述的第一响应消息中还包括关键词的属性信息。
[0076]图6示出了根据本发明一个实施例的提供的基于当前浏览页面的关键词搜索系统的结构框图。如图6所示,该系统包括:客户端200、云服务器300以及搜索引擎服务器400。其中客户端200、云服务器300以及搜索引擎服务器400的具体结构和功能可参见上述实施例的描述,在此不再赘述。
[0077]在本发明提供的基于当前浏览页面的关键词搜索方法、装置及系统中,首先由浏览器主动向云服务器发送包含当前浏览页面的页面标识的第一请求消息,然后由云服务器基于该页面标识获取到当前浏览页面的具体内容,并据此确定当前浏览页面对应的关键词,最后由浏览器在当前浏览页面上推送该关键词。由此可见,使用该浏览器的用户不需要主动去发现页面中的关键词,因此,不需要对页面内容进行仔细阅读或深入理解就可以直接获取到浏览器推送的关键词,进而能够获取到更多的有用信息,从而提高了用户的阅读体验。
[0078]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0079]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0080]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0081 ] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0082]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0083]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP )来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0084]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
【权利要求】
1.一种基于当前浏览页面的关键词搜索系统,包括:客户端、云服务器以及搜索引擎服务器,其中, 所述客户端进一步包括:通信接口模块,适于向云服务器发送包含所述当前浏览页面的页面标识的第一请求消息,并接收所述云服务器根据所述第一请求消息返回的第一响应消息;获取模块,适于获取所述第一响应消息中包含的与所述当前浏览页面相对应的关键词以及所述关键词的属性信息;推送模块,适于在所述当前浏览页面上推送所述关键词以及所述关键词对应的搜索入口元素;搜索模块,适于在接收到所述搜索入口元素触发的搜索请求后,向所述搜索引擎服务器发送包含所述搜索入口元素对应的关键词以及所述关键词的属性信息的搜索请求消息;接收并显示所述搜索引擎服务器返回的所述搜索请求消息的搜索结果; 所述云服务器进一步包括:通信接口模块,适于接收并解析客户端发送的第一请求消息,得到所述第一请求消息中包含的当前浏览页面的页面标识;确定模块,适于根据所述页面标识获取所述当前浏览页面的页面内容,确定所述页面内容中包含的关键词以及所述关键词的属性信息;所述通信接口模块还适于向所述浏览器发送包含所述关键词以及所述关键词的属性信息的第一响应消息; 所述搜索引擎服务器适于根据客户端发送的搜索请求消息,向该客户端返回所述搜索请求消息的搜索结果,其中,所述搜索结果的属性信息与所述关键词的属性信息相同。
2.如权利要求1所述的系统,其中,所述客户端进一步包括:判断模块,适于判断所述当前浏览页面的显示时间是否超过预设阈值,并在判断结果为是时,通知所述通信接口模块向云服务器发送包含所述当前浏览页面的页面标识的第一请求消息。
3.如权利要求1所述的系统,其中,所述关键词对应的搜索入口元素包括:所述关键词对应的超链接和/或所述关键词对应的搜索键。
4.如权利要求1所述的系统,其中,所述客户端的推送模块通过网页动态语言修改所述当前浏览页面的显示内容来实现所述关键词以及所述关键词对应的搜索入口元素的显示;和/或,所述推送模块调用浏览器程序和/或浏览器插件来实现所述关键词以及所述关键词对应的搜索入口元素的显示。
5.如权利要求1所述的系统,其中,所述客户端进一步包括: 设置模块,适于在所述当前浏览页面上设置搜索区域,则所述推送模块将所述关键词以及所述关键词对应的搜索入口元素显示在所述搜索区域内。
6.如权利要求1所述的系统,其中,所述关键词是包含在所述当前浏览页面的显示内容中的信息,或者,所述关键词是与所述当前浏览页面的显示内容相关联的信息。
7.如权利要求1所述的系统,其中,所述云服务器中的确定模块进一步适于:对所述页面内容中的标题和/或摘要进行分词处理,得到所述标题和/或摘要中包含的各个字词;计算所述标题和/或摘要中包含的各个字词在正文中的同现率,将同现率高于设定阈值的字词确定为关键词。
8.如权利要求7所述的系统,其中,所述确定模块进一步包括: 分词子模块,适于对所述页面内容进行分词处理,得到所述页面内容中包含的字词; 查询子模块,适于通过查询预设的关键词数据库,确定所述页面内容中包含的关键词;其中,所述关键词数据库中存储有:特征词,以及与所述特征词对应的推荐词,则所述查询子模块适于:确定所述页面内容中包含的各个字词是否与所述关键词数据库中存储的特征词匹配,将与所述特征词匹配的字词确定为第一类关键词;进一步判断所述第一类关键词对应的特征词是否存在对应的推荐词,如果存在,将所述推荐词确定为第二类关键词。
9.如权利要求1所述的系统,其中,所述关键词的属性信息根据所述当前浏览页面对应的网络资源的资源类型确定,其中,所述关键词的属性信息包括:文字、图片和视频;或者, 所述关键词的属性信息根据所述当前浏览页面的页面内容确定,其中,所述关键词的属性信息包括:新闻、游戏、电商、购物和科普。
10.如权利要求1所述的系统,其中,所述搜索引擎服务器中预先存储有映射表,该映射表用于存储搜索请求消息与搜索结果之间的映射。
【文档编号】G06F17/30GK103577597SQ201310575282
【公开日】2014年2月12日 申请日期:2013年11月15日 优先权日:2013年11月15日
【发明者】蔡劲彦 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1