一种信息搜索的方法和装置的制作方法

文档序号:6424125阅读:391来源:国知局
专利名称:一种信息搜索的方法和装置的制作方法
技术领域
本发明涉及互联网搜索技术领域,特别是涉及一种信息搜索的方法和装置。
背景技术
目前,大规模网络数据搜索,已经成为互联网最主要的应用之一。以典型的网页搜索为例,其通常利用内部的搜索机器人蜘蛛(Spider)程序,自动搜索互联网上大大小小的网站内容,按照网页相关性原理在每一个关键词和所有相关的网页之间建立一个对应关系,储存在其网络服务器的数据库中;用户只要输入关键词就可以找到符合该关键词特征的所有被搜索的网页,并且以超级链接的方式对搜索结果列表排序展示,并有简单介绍,点击相应的链接就可以进入相应的网络资源网站,从而找到所需信肩、O 上述搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表位置中的位置越靠前。例如,谷歌会通过网页与关键词之间的若干相关性指标,计算出每个网页的得分;当用户在搜索窗口输入某个关键词的时候,会依据各自得分对含有这个关键词的所有网页进行排序,分高者排在前面。搜索引擎能够给用户带来了很大的便利,避免了陷入数据的海洋。但同时由于各种搜索引擎的排序方案,往往具有自己的局限,在排序靠前的网页中可能存在用户并不需要的网页(如竞价排名方式等),而排序靠后的网页可能恰恰是用户所需要的。即现有的各种搜索引擎的排序方案仍然存在需要改进的地方。总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够改善现有的搜索排序方案,提供给用户更为精准的搜索结果。

发明内容
本发明所要解决的技术问题是提供一种信息搜索的方法和装置,能够针对网页实现有效的搜索排序,改善现有的搜索排序方案,提高对网页搜索的准确度,使得排序在前的搜索结果页面更加接近于用户的真实搜索需求。为了解决上述问题,本发明公开了一种信息搜索的方法,包括接收用户输入的搜索关键词;搜索与所述关键词相匹配的网页,得到搜索结果;在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;依据排序结果,对所述搜索结果进行展现。优选的,所述用户针对所匹配网页的个性化反馈信息的收集过程,包括由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息;以及,将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。优选的,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,可以包括通过基础排序方案得到所匹配网页的基础排序参数;基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;对各网页的基础排序参数和辅助排序参数进行加权平均;依据各网页的加权平均结果,对所述搜索结果进行排序。优选的,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,可以包括通过基础排序方案得到所匹配网页的基础排序参数;基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,可以包括通过基础排序方案得到所匹配网页的 基础排序参数;当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,通过以下方式获得一网页的辅助排序参数基于所收集的各用户针对该网页的个性化反馈信息的数目,得到该网页的辅助排序参数;或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目总和,得到该网页的辅助排序参数;或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目占全部反馈数目的比例,得到该网页的辅助排序参数;或者,所收集的各用户针对该网页的个性化反馈信息包括用户针对该网页的评分,基于所述评分得到该网页的辅助排序参数。优选的,所述的方法还可以包括在搜索结果页面中展示与搜索结果页相应的个性化反馈信息。优选的,所述的方法还可以包括在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。依据本发明的另一实施例,还公开了一种信息搜索的系统,可以包括搜索单元,用于基于所接收的用户输入的搜索关键词,搜索与所述关键词相匹配的网页,得到搜索结果;排序单元,用于在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;展现单元,用于依据排序结果,对所述搜索结果进行展现。优选的,所述信息搜索的系统还可以包括反馈信息收集子系统,用于收集用户针对所匹配网页的个性化反馈信息,具体包括收集单元,用于由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息;存储单元,用于将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。优选的,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;组合排序子模块,用于对各网页的基础排序参数和辅助排序参数进行加权平均;依据各网页的加权平均结果,对所述搜索结果进行排序。优选的,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;排序调整子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;排序优化子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,所述信息搜索的系统还可以包括第一反馈信息展示单元,用于在搜索结 果页面中展示与搜索结果页相应的个性化反馈信息。优选的,所述信息搜索的系统还可以包括第二反馈信息展示单元,用于在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。与现有技术相比,本发明具有以下优点本发明的信息搜索方法,在现有的各种搜索排序方案的基础上(在本专利中称为基础排序方案),引入了用户针对网页的个性化反馈信息,以优化现有的搜索排序方案。由于所述个性化反馈信息能够在一定程度上反映用户对网页的关注度以及用户对该网页浏览后的反馈信息等等,即通过用户反馈可以过滤掉大部分的无效网页。因此,本发明能够在克服现有的各种搜索排序方案仅仅依靠自身算法,排序方式过于单一的缺陷,提高对网页搜索的准确度,使得搜索结果更加接近于用户的真实搜索需求。其次,本发明还可以将个性化反馈信息关联展现在搜索结果页面上,这样,用户可以根据所展现的个性化反馈信息,选择性地打开搜索结果,能够进一步降低用户打开无效网页的几率,能够减少网页垃圾信息的传播,减少垃圾信息传播对网络带宽流量的占用,而且能够提高网络带宽的利用有效性。


图I是本发明一种信息搜索的方法实施例I的流程图;图2是本发明一种信息搜索的方法实施例2的流程图;图3是本发明一种信息搜索的方法实施例3的流程图;图4是本发明一种信息搜索系统实施例的结构示意图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明作进一步详细的说明。参照图1,示出了本发明一种信息搜索的方法实施例I的流程图,具体可以包括步骤101、接收用户输入的搜索关键词;
步骤102、搜索与所述关键词相匹配的网页,得到搜索结果;本发明可以应用于各种为用户提供搜索服务,将用户搜索相关的信息展示给用户的应用场景,比如百度、谷歌、雅虎、搜狗等搜索引擎或者具有搜索功能的其他场景,比如某些具有其他功能的输入框也可兼具搜索功能,因此本发明对具体的搜索场景不加以限制。下面为叙述方便,以搜索引擎为例进行说明。搜索引擎可以应用公知技术获取搜索引擎服务器中与关键词相应的内容;例如,可通过释放大量的抓取程序,获取互联网上的网页,并按照网页相关性原理在每一个关键词和所有相关的网页之间建立一个对应关系,储存在其搜索引擎服务器的数据库中。这样,在用户在搜索引擎中输入关键词(例如“糖醋排骨”)时,就可以在搜索引擎服务器中搜索找到相匹配的搜索结果,假设搜索结果的数目为4,810,000。 步骤103、在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;在获得搜索结果之后,接下来就是如何对4,810, 000个搜索结果进行排序。现有的各个搜索弓I擎都具有自己的排序方案,因为本发明是在针对现有排序方案的优化,因此,在下面的说明中,为了方便描述,将各个搜索引擎的排序方案作为基础排序方案,本发明作为辅助排序方案。另外,本发明不需要限定具体的基础排序方案,即本发明可以应用在各种可行的基础排序方案上。常用的排序方案都是以网页与查询关键词之间的相关性参数为主的。例如,排序方案可以采用网页与查询关键词之间的如下相关性指标I、概率指标根据关键词在网页中出现的频率来判断二者的相关性;例如,对关键词出现的次数进行统计,关键词出现的次数越多,则表示该网页与关键词的相关性越闻;2、位置指标根据关键词在网页中出现的位置来判定文件的相关性;例如,关键词在网页中出现的越早,二者的相关性越高。现有技术以基础排序参数作为排序依据,可以在一定程度上将相关性高的网页排序靠前,以便用户浏览和获取所需信息。但是由于这些相关性的分词、解析等过程都是基于固定规则由计算机完成的,而人类语言表达是模糊的、复杂的、随意的,因此,这些相关性计算结果中可能包括较多的不准确之处。例如,某些无效网页仅仅列举了多个高频查询关键词,却没有任何实际的相关内容,对于用户而言,该网页不能获取任何信息,属于无效网页,但基于相关性计算,其排序却会比较靠前。即使得排在前面的却不是用户最想得到的搜索结果;这样,用户不得不在搜索结果页面进行翻页以得到想要的搜索结果,因此既浪费了大量的搜索时间,又降低了搜索效率。本发明就是希望在现有的各种排序方案基础上,基于针对各网页的用户反馈信息,对各网页的基础排序进行优化;即将用户的阅读反馈和现有排序方案结合,由于用户的阅读反馈能够在一定程度上更准确的反映用户对网页的关注度以及对该网页的评价或评论等,因而能够在克服现有搜索排序方案的局限性,提闻排序科学性和准确性。当然,针对同一网页,可能存在多个用户给予了反馈信息,但本发明并不限定为需要所有用户都给予反馈信息。另外,对于所匹配的网页,用户可能仅针对一部分网页给予了反馈信息,本发明并不需要限定所有网页都具有反馈信息;本发明只要基于具有反馈信息的一部分网页进行辅助排序即可,同样也可以在一定程度和范围内达到优化排序的技术效果。需要说明的是,本发明的个性化反馈信息包括但不限于评论、批注等等,也不限于文字、图片、图像甚至声音等等,只要是用户表发的针对网页的反馈信息,都在本发明实施例的保护范围内。步骤104、依据排序结果,对所述搜索结果进行展现。本发明所述用户针对网页的个性化反馈信息的收集,可以采用各种可行方式。例如,现有在网页上设置评论或者调查窗口,以获取用户反馈信息;或者,在搜索结果页面,收集用户对无效网页的反馈信息等。总之,能够获得用户的个性化反馈信息即可,本发明无需限定具体的获取方式。下面本发明仅给出一种优选实施例,具体收集过程可以包括
步骤a、由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息;例如,在浏览某个网页时,用户就可发布针对该网页(此实例中即为当前浏览的网页)的个性化反馈信息;其中,即使所述当前浏览网页自身无收集用户个性化反馈信息的接口,本发明实施例也可以获取个性化反馈信息,因为本发明实施例是由独立于网页之外的应用程序来接收个性化反馈信息的,不依赖于网页上的预设区域和预设接口。对于现有技术而言,用户只能对具有反馈接口的网页进行个性化反馈信息的发布。通常的实现方式为,在网页上通过html代码或者其他语言代码(如JavaScript等)实现一个用于接收个性化反馈信息的预设区域和预设接口。一个网页需要接收反馈信息,则就必须在该网页上开辟预设区域和预设接口 ;而本发明实施例则不需要在网页上设置专门的功能代码。本发明实施例是通过一个独立于网页之外的应用程序来实现反馈信息的接收、传输和处理操作的,完全不依赖于网页上的预设区域和预设接口,因此即使网页自身没有用以针对用户评论的预设区域和预设接口,也可以实现用户对网页的评论。在具体实现中,用户发布的个性化反馈信息通常都是针对当前网页的。对于如何接收用户发送的针对当前网页的个性化反馈信息,本发明的具体实现方式是多种多样的。因为现有的浏览器已经能够获知哪个网页是当前网页,以及能够获知当前网页的网页标识(比如通常用的URL),只需要传输给本发明所述的独立于网页之外的应用程序就可以了 ;而对于反馈信息,由应用程序接收即可。下面给出几个本发明的实现方式作为例子进行说明。例如,本发明独立于网页之外的应用程序可以通过插件的方式与浏览器结合,在浏览器上设置一个评论按钮,当用户点击评论按钮时,获取当前网页的网页标识,并开启一个窗口供用户输入评论信息。当用户输入完毕后,将该评论信息和之前获取的网页标识对应存储起来。再例如,本发明独立于网页之外的应用程序可以通过插件的方式与浏览器结合,开启一个悬浮于当前网页上的评论窗口,无论用户如何变换网页,该评论窗口一直悬浮于当前浏览的网页上。这样,用户只需要在该评论窗口中输入评论信息,本发明的应用程序即可获取当前网页的标识及其评论信息。而对于当前网页的确定以及网页标识的获取,现有的浏览器技术已经完全可以实现,属于本领域的公知技术,在此不再赘述。再例如,本发明还可以在用户输入完毕反馈信息后,点击“上传”或者“确定”按钮时,通过浏览器获取当前网页的标识,进而将当前网页的标识与获得反馈信息相对应,并予以存储。总之,本发明独立于网页之外的应用程序可以通过独立窗口或者嵌入浏览器的窗口采集用户的反馈信息,并可以通过浏览器获取用户反馈信息所针对的网页标识。本发明对于具体实现过程并不需要加以更细致的限定,例如具体用以接收反馈信息的接口的展现形式,获取网页标识的时间点等等。此外需要说明的是,虽然通常情况下,用户是在浏览当前网页时对该网页进行评论,但也不排除用户对非当前网页进行评论,比如,用户直接输入网页URL(非当前网页)和评论内容,这样独立于网页之外的这个应用程序仍然可以获知评论是针对哪个网页的,进而不影响本发明实施例后续对个性化反馈信息的展现、应用等。步骤b、所述应用程序将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。
存储反馈信息的服务器可以和搜索服务器为同一服务器,也可以为两个独立的服务器,搜索服务器在需要时从反馈信息服务器获取所需数据即可。网页标识在现有技术中通常以网址(统一资源定位符(URL, Uniform UniversalResource Locator))的方式出现,当然本发明并不需要限制具体的标识方式,只要是能唯一标识特定网页的信息均可。应用本发明实施例,无论网页自身是否有评论区域和评论接口,用户都能对网页进行评论,因为本发明实施例是在页面之外对个性化反馈信息进行采集、传输和处理的。即本发明实施例的服务器能够接收各种网页的个性化反馈信息,并不局限于同一网站(域名)下的网页,因此是存储有多个不同域名下的网页的网页标识,比如不同域名下的网址信息。而现有的各种反馈信息(如评论)的收集,都是在页面之内预设反馈内容区域所获得的,这些反馈信息都是通过网页传输给该网页所属的网站实体的,即各个网站实体只能获得自己的网页传送回来的反馈信息,而无法获取其他域名下的网页的反馈信息,即现有技术中,每个网站服务器存储的都只是自己域名下的个性化反馈信息,而不是多个域名下的。上面个性化反馈信息收集过程的实例,相对于其他的收集方案而言,能够解决那些即使网页本身不支持评论,也能让用户评论的技术问题,解决了网页必须支持反馈功能才能让用户评论的技术问题,即扩大了用户评论的使用范围,并通过对评论信息的预阅读(例如,集中展示平台等),提高了用户浏览网页的有效率。具体如何将用户针对所匹配网页的个性化反馈信息,与基础排序方案结合,本领域技术人员可以依据实际情况和具体应用,采用各种可行的方案。下面给出本发明几种可行的优选实施例,但并不以此为限。方案I步骤a、通过基础排序方案得到所匹配网页的基础排序参数;步骤b、基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;步骤C、对各网页的基础排序参数和辅助排序参数进行加权平均;步骤d、依据各网页的加权平均结果,对所述搜索结果进行排序。
例如,对于一个网页,如果基础排序参数和辅助排序参数的得分分别为100和60,则可以首先赋予二者的权重分别为a和b,得到加权平均结果也即总权重参数的得分(100*a+60*b)/(a+b),其中,a、b分别为自然数或者小数均可;然后依据各自总权重参数的得分,对与关键词相匹配的若干个搜索结果进行排序,也即分高者排在前面。当然,上面给出的仅仅是加权平均的最简单实现。具体权重也可能随时间变化,例如,辅助排序参数所依据的用户个性化反馈信息在时间上是比较靠近现在的,则权重b可以适当增大;而当辅助排序参数所依据的用户个性化反馈信息是早前一段时间(离现在较远)的,则权重b可以适当减小。进一步,具体加权平均还可能引入其他因素,以动态调整权重值或者对权重值进行修正,提高准确性,在此本发明无需加以限定,本领域技术人员依据实际情况适用即可。方案2 步骤a、通过基础排序方案得到所匹配网页的基础排序参数;步骤b、基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;步骤C、当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。即本方案仅仅对基础排序参数差值或者距离在一定阈值范围内(极端情况就是相同)的两个或多个网页进行排序位置优化,而并不是优化调整所有搜索结果网页的排序参数。所述差值和距离以具体基础排序参数的算法而定,并不局限于线性距离或欧式距离等;所述阈值由本领域技术人员依据实际情况、具体应用和经验确定即可。方案3步骤a、通过基础排序方案得到所匹配网页的基础排序参数;步骤b、当搜索结果中两个或多个网页的基础排序位置的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;步骤C、依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。方案3和方案2是类似的,区别在于,方案2是先获取各个网页的辅助排序参数,而方案3是在需要时,才获取所需网页的辅助排序参数。本领域技术人员依据具体情况选用即可。例如,用户在搜索引擎中输入“糖醋排骨”后,得到4,810,000个搜索结果,其中,“美食天下”相应网页和“美食杰”相应网页的基础排序参数值差值小于预设阈值“ ±2”,例如,二者的得分分别为89、90,此时,如果“美食天下”相应网页的个性化反馈信息数目(例如100)多于“美食杰”相应网页的个性化反馈信息数目(例如90),则本发明实施例可以将“美食天下”相应网页排在“美食杰”相应网页的前面。在上面的实施例中,直接采用相应网页的用户个性化反馈信息数目作为该网页的辅助排序参数。实际上,基于反馈信息所得到的各网页的辅助排序参数可以基于实际情况和具体应用进行设计。、例如所述辅助排序参数具体可以包括网页所具有个性化反馈信息的数目;例如,目前为止被评论最多的网页;本维度其可反映用户对相应网页的关注度,关注度越高,说明该网页的信息有效性越强,故排序可以向前调整。所述辅助排序参数具体也可以包括用户针对该网页的个性化反馈信息中,赞同和/或推荐的数目总和。用户针对该网页赞同和/或推荐的越多,说明该网页的有效性越强。例如,各用户针对一网页可能存在多个反馈信息,有些反馈信息得到其他用户的赞同,则其他用户可能对该反馈信息进行推荐操作。具体的,可以在某条个性化反馈信息的显示区域位置(如末尾)提供点击“推荐”按钮,用户一旦通过点击该“推荐”按钮来输入推荐动作。记录这些推荐操作的次数,即可以统计汇总得到赞同和/或推荐的数目总和。当然,具体的赞同或者推荐,也可以基于用户个性化反馈信息(如评论)内容语义分析得到。即通过语义分析,得知该用户是对该网页赞同或者推荐,还是不赞同或者推荐,或者中立。所述辅助排序参数具体也可以包括用户针对该网页的个性化反馈信息中,赞同和/或推荐的占比多少(如所有评论中推荐该网页的有多少,不推荐该网页的有多少)。用户针对该网页赞同和/或推荐的比例越高,说明该网页的有效性越强。 所述辅助排序参数具体也可以基于用户对该网页的评分得到,例如,所收集的各用户针对该网页的个性化反馈信息包括用户针对该网页的评分。用户评分的高低可以代表该网页的有效性。参照图2,示出了本发明一种信息搜索的方法实施例2的流程图,具体可以包括步骤201、接收用户输入的搜索关键词;步骤202、搜索与所述关键词相匹配的网页,得到搜索结果;步骤203、在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;步骤204、依据排序结果,对所述搜索结果进行展现;步骤205、在搜索结果页面中展示与搜索结果页相应的个性化反馈信息。本实施例进一步可以将个性化反馈信息关联展现在搜索结果页面上,这样,用户可以根据所展现的个性化反馈信息,选择性地打开搜索结果,不但能够降低用户打开无效网页的几率,能够减少网页垃圾信息的传播,减少垃圾信息传播对网络带宽流量的占用,而且能够提高网络带宽的利用有效性。在本发明的一种优选实施例中,可在搜索结果页面展示网页的个性化反馈信息时,可以只引用最热门的前X条(例如,点击查看次数或者推荐数目最多的前X条),具体地,所述搜索结果中展现的个性化反馈信息可以为针对相应网页的权值最大的一条或X条个性化反馈信息,这里,X为自然数。优选的,为了避免在搜索结果页面中展示的个性化反馈信息影响用户的浏览,本发明可以采用一些优化措施,例如,在搜索结果页上设置入口,即不直接展现评论内容,用户点击这个该入口再展现具体的个性化反馈信息。参照图3,示出了本发明一种信息搜索的方法实施例3的流程图,具体可以包括步骤301、接收用户输入的搜索关键词;步骤302、搜索与所述关键词相匹配的网页,得到搜索结果;步骤303、在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;
步骤304、依据排序结果,对所述搜索结果进行展现;步骤305、在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。例如,可以通过位于所述网页之外的显示窗口展现个性化反馈信息,如热门评论、最新评论、相关评论以及评论的查询结果等。当然,在该窗口中,还可以提供一系列的操作按钮,用户在浏览当前网页时,点击这些操作按钮,即可进行相应的操作,例如,用户点击“我要评论”按钮,即可提供用户输入个性化反馈信息的接口。再例如,在展示个性化反馈信息时,可以采用在网页上加载一个类似于透明蒙版的层,此层上显示对该页的热门评论(权值最大的一条或多条个性化反馈信息等)。该展示层在技术上可以由浏览器在解析当前网页时,通过临时添加html代码的方式实现,html代码具体实现透明蒙版的过程属于本领域的熟知技术,在此不再赘述。这种展示方式给用户的感觉,就如同直接在网页上展示了各种评论信息。
在展示个性化反馈信息时,不仅可以包括当前用户的个性化反馈信息,还可以包括其他用户的个性化反馈信息。在展示个性化反馈信息时,可以展现针对当前网页的个性化反馈信息,也可以展现针对其他网页的个性化反馈信息,例如,热门评论(针对其他网页)。从技术角度而言,由于本发明实施例将网页的个性化反馈信息和对应的网址保存至服务器,即用户的个性化反馈信息能够脱离网页本身而存在、传输和展现,即通过对各个反馈信息的浏览(例如集中展示平台或者搜索结果的关联展示等),其他用户在未打开该网页时,也可以看到针对该网页的用户个性化反馈信息,以帮助用户确定是否要打开该页面;这样,能够降低用户打开无效网页的几率,能够减少网页垃圾信息的传播,减少垃圾信息传播对网络带宽流量的占用,提高网络带宽的利用有效性。在本发明的另一实施例中,用户针对网页的个性化反馈信息可以是针对网页整体的,也可以是针对网页的部分元素的(例如,部分内容、某个图片、某个子栏目或子窗口等)。如果所述个性化反馈信息针对网页的部分元素,则所述应用程序保存至服务器的信息除了个性化反馈信息和对应的网址之外,还包括所述个性化反馈信息针对的所述部分元素在网页中的元素标识(即用于表示该元素具体是页面上的什么元素)。例如,用户不作特殊操作,则认为个性化反馈信息是针对网页整体的,而基于当前光标的位置或者用户选择,则可以将个性化反馈信息与该网页上的元素对应起来。通常的,网页的不同元素(如某个图片或者某个子栏目或子窗口等)都是通过不同的代码块实现的,并且不同元素在页面上具有不同的展示位置。因此,基于当前光标的位置或者用户选择,可以确定反馈信息所针对的元素。例如,光标落在哪个元素范围内,就确定该元素为反馈信息所针对的(比如,浏览器可以感知光标落在哪里,并且通过对网页的分析,可以知道光标所在位置对应的是哪个或哪些元素)。对于用户选择而言,用户可以通过光标选择一段文字,也可以选择一个图片或者视频,或者其他网页上的特定元素,进而针对选择的内容进行评论等操作。具体而言,浏览器可以获知用户的选择行为,进而结合网页分析,即可知道用户选择是哪个或哪些元素。进而再结合用户输入的个性化反馈信息内容,就可以知道该个性化反馈信息针对的是哪部分元素了。
在知道个性化反馈信息针对的网页上的哪部分元素之后,就需要在服务器存储个性化反馈信息以及标识该个性化反馈信息针对的是哪部分元素了,简称元素在网页上的元素标识。元素标识可以采用各种可行方式,只要能通过该标识定位到评论对应的是网页上的哪个或哪些元素即可,比如元素在网页中的位置标识,或者元素的内容标识等等,因此元素标识本质上也就是一种元素的定位标识。下面给出几种简单实现。例如,可以采用该元素在页面上的位置信息(比如坐标)进行标识,即位置标识。浏览器可以分析获知元素在网页上的位置信息,比如坐标(可以为相对坐标,也可以为绝对坐标)。进而,在存储时就可以利用元素的位置信息作为元素在网页上的元素标识。再例如,也可以采用元素的标题或者名称等进行标识,作为元素标识,即内容标识。所述标题或名称可以从网页中获得,在网页中,各个元素通常会具有自己的标题或者名称,例如一张图片具有自己的名称,一个子栏目或子窗口具有自己的名称,一个文章具有自己的标题。 对于用户选择的一段文字而言,可以直接采用该段文字(后台对应的是代码)作为标识,如果缩略存储的话,可以仅存储开头若干文字和结尾若干文字对这段文字进行标识。如果用户选择的是一整段文字,则还可以用这段文字的开头若干文字进行标识,作为元素标识。即用元素所选范围内的部分或全部内容作为元素标识。由此可见,如果用户针对的是网页部分元素的个性化信息反馈,则应用程序保存至服务器的信息除了个性化反馈信息和对应的网页标识之外,还包括所述个性化反馈信息针对的所述部分元素在网页中的元素标识。元素标识的具体实现有前面所述的各种实例,但不限于此,只要能够标识清楚用户个性化反馈信息针对的是网页上的哪部分元素,都是可行的。对于针对网页上部分元素的个性化反馈信息的具体展示,也可以采用各种可行的实现方案。例如,当采用位置坐标为标识时,个性化反馈信息可以直接以标引的方式进行展示(如基于蒙版,采用批注的方式实现,虚线指向对应位置)。当采用元素标题或者名称作为标识时,可以在个性化反馈信息上标明,该反馈信息是针对某个标题或名称的元素的(如集中展示平台),当然,也可以先根据元素标识(元素标题或名称)先定位到网页上的具体元素位置,然后也同样以标引的方式进行展示。使得用户一目了然,就可以知道这条反馈信息针对是哪个或哪些元素。当以用户所选择的一段文字为反馈对象时,则即可以采用标引方式进行展示,也可以在反馈信息前增加对象说明,以指明反馈对象。参照图4,示出了本发明一种信息搜索的系统实施例,具体可以包括搜索单元401,用于基于所接收的用户输入的搜索关键词,搜索与所述关键词相匹配的网页,得到搜索结果;排序单元402,用于在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;展现单元403,用于依据排序结果,对所述搜索结果进行展现。在实际应用中,图4所示的信息搜索系统的搜索单元和排序单元可以位于后台的搜索服务器上,而展现单元可以通过客户端界面进行展现。当然,搜索关键词也可以由客户端接收然后传输给搜索服务器。需要说明的是,展现单元也可以在服务器端实现,例如,在搜索服务器上完成的关键词输入和搜索结果展现。对于用户针对所匹配网页的个性化反馈信息,可以通过各种途径获得(例如,存储反馈信息的服务器和搜索服务器位于同一物理位置),本发明的排序单元获取这些信息进行优化排序即可。在本发明的一个实施例中,图4所示的信息搜索系统还可以包括反馈信息收集子系统,用于收集用户针对所匹配网页的个性化反馈信息。在本发明的优选实施方式中,反馈信息收集子系统具体可以包括收集单元,用于由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息; 存储单元,用于将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。具体如何将用户针对所匹配网页的个性化反馈信息,与基础排序方案结合,本领域技术人员可以依据实际情况和具体应用,采用各种可行的方案。在本发明的一种实现方案中,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;组合排序子模块,用于对各网页的基础排序参数和辅助排序参数进行加权平均;依据各网页的加权平均结果,对所述搜索结果进行排序。在本发明的另一种实现方案中,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;排序调整子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。在本发明的再一种实现方案中,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;排序优化子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,为了帮助用户提前大致了解某个搜索结果的情况,图4所示的信息搜索系统还可以包括第一反馈信息展示单元,用于在搜索结果页面中展示与搜索结果页相应的个性化反馈信息。而对于反馈信息的展示,也可以采用其他可行的各种方案,例如,图4所示的信息搜索系统还可以包括第二反馈信息展示单元,用于在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。以上对本发明所提供的一种信息搜索的方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本 发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种信息搜索的方法,其特征在于,包括 接收用户输入的搜索关键词; 搜索与所述关键词相匹配的网页,得到搜索结果; 在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序; 依据排序结果,对所述搜索结果进行展现。
2.如权利要求I所述的方法,其特征在于,所述用户针对所匹配网页的个性化反馈信息的收集过程,包括 由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息; 以及,将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。
3.如权利要求I所述的方法,其特征在于,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,包括 通过基础排序方案得到所匹配网页的基础排序参数; 基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数; 对各网页的基础排序参数和辅助排序参数进行加权平均; 依据各网页的加权平均结果,对所述搜索结果进行排序。
4.如权利要求I所述的方法,其特征在于,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,包括 通过基础排序方案得到所匹配网页的基础排序参数; 基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数; 当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。
5.如权利要求I所述的方法,其特征在于,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,包括 通过基础排序方案得到所匹配网页的基础排序参数; 当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数; 依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。
6.如权利要求1、3、4或5所述的方法,其特征在于,通过以下方式获得一网页的辅助排序参数 基于所收集的各用户针对该网页的个性化反馈信息的数目,得到该网页的辅助排序参数; 或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目总和,得到该网页的辅助排序参数; 或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目占全部反馈数目的比例,得到该网页的辅助排序参数; 或者,所收集的各用户针对该网页的个性化反馈信息包括用户针对该网页的评分,基于所述评分得到该网页的辅助排序参数。
7.如权利要求I或2所述的方法,其特征在于,还包括 在搜索结果页面中展示与搜索结果页相应的个性化反馈信息。
8.如权利要求I或2所述的方法,其特征在于,还包括 在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。
9.一种信息搜索的系统,其特征在于,包括 搜索单元,用于基于所接收的用户输入的搜索关键词,搜索与所述关键词相匹配的网页,得到搜索结果; 排序单元,用于在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序; 展现单元,用于依据排序结果,对所述搜索结果进行展现。
10.如权利要求9所述的信息搜索系统,其特征在于,还包括反馈信息收集子系统,用于收集用户针对所匹配网页的个性化反馈信息,具体包括 收集单元,用于由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息; 存储单元,用于将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。
11.如权利要求9所述的信息搜索系统,其特征在于,所述排序单元具体包括 基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数; 辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数; 组合排序子模块,用于对各网页的基础排序参数和辅助排序参数进行加权平均;依据各网页的加权平均结果,对所述搜索结果进行排序。
12.如权利要求9所述的信息搜索系统,其特征在于,所述排序单元具体包括 基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数; 辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数; 排序调整子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。
13.如权利要求9所述的信息搜索系统,其特征在于,所述排序单元具体包括 基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数; 排序优化子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。
14.如权利要求9或10所述的信息搜索系统,其特征在于,还包括 第一反馈信息展示单元,用于在搜索结果页面中展示与搜索结果页相应的个性化反馈信息。
15.如权利要求9或10所述的信息搜索系统,其特征在于,还包括 第二反馈信息展示单元,用于在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。
全文摘要
本发明提供了一种信息搜索的方法和系统,所述方法包括接收用户输入的搜索关键词;搜索与所述关键词相匹配的网页,得到搜索结果;在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;依据排序结果,对所述搜索结果进行展现。本发明的信息搜索方法,在现有的各种搜索排序方案的基础上,引入了用户针对网页的个性化反馈信息,以优化现有的搜索排序方案。由于所述个性化反馈信息能够在一定程度上反映用户对网页的关注度以及用户对该网页浏览后的反馈信息等等,因此,本发明能够提高对网页搜索排序的准确度,使得搜索结果排序更加接近于用户的真实搜索需求。
文档编号G06F17/30GK102779136SQ201110124479
公开日2012年11月14日 申请日期2011年5月13日 优先权日2011年5月13日
发明者车东, 郭柱 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1