一种搜索结果的展示方法、装置和系统的制作方法

文档序号:6544873阅读:148来源:国知局
一种搜索结果的展示方法、装置和系统的制作方法
【专利摘要】本发明实施例提供了一种搜索结果的展示方法、装置和系统,所述的方法包括:接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。本发明实施例不仅减少时间和精力的耗费,而且也减少客户端与搜索端的系统资源消耗,减少网络带宽的占用。
【专利说明】一种搜索结果的展示方法、装置和系统
【技术领域】
[0001]本发明涉及搜索的【技术领域】,特别是涉及一种搜索结果的展示方法、一种搜索结果的展示装置和一种搜索结果的展示系统。
【背景技术】
[0002]随着网络的迅速发展,网络信息急剧增加。用户为了在海量的网络信息中寻找所需的网络信息,通常使用搜索引擎进行搜索。
[0003]搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。网络信息浩瀚万千,而且毫无秩序,所有的网络信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。
[0004]但是,网络信息增长的速度和人们获取所需信息能力之间的矛盾越来越突出,过量的网络信息使得用户在搜索网络信息的时候要进行繁琐的人工过滤,耗费大量时间和精力,网络信息的搜索效率很低。

【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种搜索结果的展示方法和相应的一种搜索结果的展示装置、一种搜索结果的展示系统。
[0006]依据本发明的一个方面,提供了一种搜索结果的展示方法,包括:
[0007]接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0008]搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;
[0009]将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
[0010]可选地,所述搜索与所述搜索关键词匹配的网站信息的步骤包括:
[0011]对所述搜索关键词进行分词处理,获得搜索分词;
[0012]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0013]当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0014]可选地,所述网站信息通过以下方式获得:
[0015]分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0016]分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;
[0017]采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;[0018]当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0019]可选地,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计
算获得。
[0020]根据本发明的另一方面,提供了一种搜索结果的展示装置,包括:
[0021]搜索请求接收模块,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0022]网站信息搜索模块,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;
[0023]网站信息返回模块,适于将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
[0024]可选地,所述网站信息搜索模块还适于:
[0025]对所述搜索关键词进行分词处理,获得搜索分词;
[0026]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0027]当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0028]可选地,所述网站信息通过以下方式获得:
[0029]分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0030]分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;
[0031]采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;
[0032]当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0033]可选地,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计
算获得。
[0034]根据本发明的另一方面,提供了一种搜索结果的展示系统,所述系统包括服务器和客户端;
[0035]所述服务器包括:
[0036]搜索请求接收模块,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0037]网站信息搜索模块,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;
[0038]网站信息返回模块,适于将所述网站信息返回所述客户端;
[0039]所述客户端包括:
[0040]搜索请求发送模块,适于向所述服务器发送的搜索请求;
[0041]网站信息接收模块,适于接收所述服务器返回的网站信息;
[0042]网站信息显示模块,适于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
[0043]可选地,所述网站信息搜索模块还适于:
[0044]对所述搜索关键词进行分词处理,获得搜索分词;
[0045]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0046]当匹配成功时,提取匹配成功的特征词对应的网站信息。
[0047]本发明实施例使用客户端发送的搜索请求中的搜索关键词,搜索匹配的多个网站信息,并将网站信息返回客户端,而网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于该类别信息的网页信息,而且,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目,使得客户端可以按照排序信息在当前界面展示网站信息,并且,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域,从而形成了结构化的搜索结果,一方面,对于归类后的网页信息,使得用户避免重复对网站信息进行繁琐的人工过滤,不仅减少时间和精力的耗费,而且也减少客户端与搜索端的系统资源消耗,减少网络带宽的占用,另一方面,对于排序在先的网站信息具有更多的类别条目以及展示位置,提高了展示用户所需的信息的几率,增加了用户的点击转化率,从而提高了搜索、展示效率。
[0048]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0049]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0050]图1示出了根据本发明一个实施例的一种搜索结果的展示方法实施例的步骤流程图;
[0051]图2示出了根据本发明一个实施例的一种搜索结果的展示结构示意图;
[0052]图3示出了根据本发明一个实施例的一种搜索结果的展示示例图;
[0053]图4示出了根据本发明一个实施例的一种搜索结果的展示示例图;
[0054]图5示出了根据本发明一个实施例的一种搜索结果的展示装置实施例的结构框图;以及
[0055]图6示出了根据本发明一个实施例的一种搜索结果的展示系统实施例的结构框图。
【具体实施方式】
[0056]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0057]参照图1,示出了根据本发明一个实施例的一种搜索结果的展示实施例的步骤流程图,具体可以包括如下步骤:[0058]步骤S110,接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0059]需要说明的是,客户端可以为非独立的客户端,例如浏览器(可以用于加载网页搜索引擎)、浏览器中用于搜索的插件、其他应用程序中用于搜索的组件等等,也可以为独立的客户端,例如专门用于搜索的客户端,本发明实施例对此不作限制。
[0060]搜索请求可以是指用户发出的搜索某个搜索关键词匹配的网络信息的指示。例如,当用户在浏览器中打开的网页搜索引擎的搜索栏中输入某个搜索关键词并点击确定按钮或按下回车键时,相当于接收到了用户的搜索请求。又例如,当用户在即时搜索引擎中输入某个搜索关键词时,就相当于接收到了发送的搜索请求。
[0061]步骤S120,搜索与所述搜索关键词匹配的多个网站信息;
[0062]应用本发明实施例,可以在网站信息数据库中搜索与所述搜索关键词匹配的多个网站信息,该网站信息数据库可以按照一定的结构目录存储大量的网络信息。
[0063]一方面,可以预先派出一个能够在网上发现新网站并抓文件的应用程序,这个应用程序通常称之为蜘蛛。蜘蛛从已知的数据库出发,就像正常用户的浏览器一样访问这些网站并抓取文件。蜘蛛搜索引擎会跟踪网站中的链接,访问更多的网站,而抓取的文件会被存入网站信息数据库。
[0064]另一方面,可以接收网站主提交的网站信息(例如广告主提交广告数据),在进行了结构化处理(例如分类)之后,存入网站信息数据库。
[0065]在本发明的一种可选实施例中,步骤S120可以包括如下子步骤:
[0066]子步骤SI I,对所述搜索关键词进行分词处理,获得搜索分词;
[0067]下面介绍一些常用的分词方法:
[0068]1、基于字符串匹配的分词方法:是指按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。实际使用的分词系统,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。
[0069]2、基于特征扫描或标志切分的分词方法:是指优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再来进机械分词,从而减少匹配的错误率;或者将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而提高切分的准确率。
[0070]3、基于理解的分词方法:是指通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。
[0071]4、基于统计的分词方法:是指,中文信息中由于字与字相邻共现的频率或概率能够较好的反映成词的可信度,所以可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息,以及计算两个汉字Χ、y的相邻共现概率。互现信息可以体现汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典。[0072]子步骤S12,采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0073]在本发明实施例中,可以预先选取一个或多个特征词组成一个集合,特征词组成的集合可以设置对应的网站信息。
[0074]例如,在电子商务中,可以预置竞价词(即特征词)的集合,该竞价词的集合可以与广告数据(即网站信息)进行捆绑。具体地,竞价词可以为广告主为自己的广告所购买的词,一旦用户通过这个词搜索到了广告主的广告(造成曝光)并造成点击,则可以按照广告主购买的这个竞价词的计价扣取广告主账户的单次点击广告费。
[0075]在具体实现中,当搜索分词与特征词内容一样时,可以判定该搜索分词与该特征词匹配。
[0076]当搜索分 词与特征词内容不一样时,可以将搜索分词改成一个或多个查询意图一致的搜索相近词,例如,可以将搜索分词“爸比”改写为“爸爸”、“Dady”和“父亲”,再采用搜索相近词在特征词组成的集合中进行匹配,在搜索相近词与特征词内容一样时,可以判定该搜索分词与该特征词匹配。
[0077]子步骤S13,当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0078]当成功匹配时,可以在网站信息数据库中提取匹配成功的特征词所属的集合对应的网站信息。
[0079]在本发明的一种可选实施例中,所述网站信息中可以包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目可以多于排序在后的网站信息的类别条目;
[0080]在本发明实施例的一种可选示例中,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计算获得。
[0081]需要说明的是,在不同的行业中,面对的业务对象也不尽相同,例如在电子商务行业中面对的业务对象可以为广告数据、在媒体行业中面对的业务对象可以为新闻数据等等,而不同的业务对象具有不同的价值标准,因此,在不同的行业中,根据不同的影响因素设置权重,以对网站信息进行排序。
[0082]以下以电子商务中的广告数据为示例进行说明。
[0083]在本示例中,预置权重可以为广告主的出价,则本示例可以通过以下公式计算排
序信息:
[0084]RS(RankScore) = CTR^BidPrice
[0085]其中,RS为排序信息,BidPrice为广告主出价,CTR为广告的点击率。
[0086]而CTR具体可以为广告的有效点击量与广告的曝光量的比值,在排序时CTR是未知的,因此需要预估。具体地,可以采用逻辑回归模型进行预估,其中用于预估的特征数据可以包含很多,例如,文字描述、行业、价格区间、成交、访问量等数据,同时也可以会考虑时间,假期等因素。
[0087]在本发明的一种可选实施例中,所述网站信息可以通过以下方式获得:
[0088]子步骤S21,分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0089]子步骤S22,分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;[0090]子步骤S23,采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;
[0091]子步骤S24,当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0092]应用本发明实施例,早期可以通过自身收集或网站主(例如电子商务中的广告主)提交分类信息和网页信息的对应关系来积累数据;当分类信息和网页信息的对应匹配关系达到一定数量后,可以将通过搜索查询相关网页中与已知内容相关的内容,并与已知的分类信息和网页信息配搭来进行进一步训练,从而自动扩展出新的分类信息和网页信息的匹配关系。
[0093]在本发明实施例的一种可选示例中,训练过程可以如下:
[0094]1、各个分类信息中网页信息中包含大量的文本信息,可以用于训练各个分类信息的类别模型M(i) (i = 1...Ν),类别模型可以包括朴素贝叶斯模型、N-Gram(大词汇连续语音识别中常用的一种语言模型)模型等等;
[0095]2、计算新的网页信息T归属于类别模型M(i) (i = L..,)的概率CP(i),基于CP(i)计算网页信息T归属各个类别模型M(i) (i = Ρ..Ν)上的置信度;
[0096]具体地,可以通过以下公式计算置信度:
[0097]Conf (i) = CP ⑴/sum(CP (i))
[0098]其中,Conf (i)为置信度,CP⑴为概率,sum O为求和函数,i为正整数且i小于
或等于类别信息的数量。
[0099]3、若置信度最高的网页信息m的置信度Conf (m)大于或等于预设的置信度阈值Thresh,则将该网页信息m添加至该类别信息中,若小于置信度阈值Thresh则可以转至人
工整理。
[0100]步骤S130,将所述网站信息返回所述客户端;
[0101]在具体实现中,所述客户端用于按照所述排序信息在当前界面展示所述网站信息;
[0102]其中,排序在先的网站信息的展示区域可以大于排序在后的网站信息的展示区域。
[0103]当用户点击该网页信息时,可以加载该网页信息对应的网页,获取更加详细的信
肩、O
[0104]例如,如图2所示的客户端展示界面中,区域A、区域B和区域C可以分别用于展示三个不同的网站信息。区域A排序比区域B前,区域B排序比区域C前,因此,区域A的展示区域比区域B的展示区域大,区域B的展示区域比区域C的展示区域大,区域A的类别条目比区域B的类别条目多,区域B的的类别条目比区域C的的类别条目多。
[0105]在区域A中,区域D可以用于展示网站标题信息,在区域D下方,可以在最左侧位置展示类别信息,例如区域E,在类别信息之后的位置,可以用于展示归属于该类别信息的一个或多个网页信息,例如区域F。此外,本示例中可以设置第一功能按键,例如按键G,当用户通过鼠标点击等方式触发该第一功能按键时,可以展示更多的,属于该类别信息的网页信息。
[0106]在区域B、C中,可以设置第二功能按键,例如按键H,当用户通过鼠标点击等方式触发该第二功能按键时,可以展示更多的类别信息,以及,属于该类别信息的网页信息。
[0107]本发明实施例使用客户端发送的搜索请求中的搜索关键词,搜索匹配的多个网站信息,并将网站信息返回客户端,而网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于该类别信息的网页信息,而且,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目,使得客户端可以按照排序信息在当前界面展示网站信息,并且,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域,从而形成了结构化的搜索结果,一方面,对于归类后的网页信息,使得用户避免重复对网站信息进行繁琐的人工过滤,不仅减少时间和精力的耗费,而且也减少客户端与搜索端的系统资源消耗,减少网络带宽的占用,另一方面,对于排序在先的网站信息具有更多的类别条目以及展示位置,提高了展示用户所需的信息的几率,增加了用户的点击转化率,从而提高了搜索、展示效率。
[0108]以下通过几种应用场景的示例对本发明实施例作进一步说明:
[0109]应用场景一:用户请求搜索“招商加盟”;
[0110]对“招商加盟”进行分词处理,获得“招商”和“加盟”,同时预置有一个集合{ “招商加盟”、“加盟招商”、“加盟”、“项目加盟”……},“招商”和“加盟”在这个集合中匹配成功,则可以获取如图3所示 的该集合对应的网站信息。其中一个网站信息包括类别信息“月艮饰鞋包”、“饰品玩具”和“家具建材”,在类别信息“服饰鞋包”中包括网页信息“女装”、“童装”、“男装”、“女装”、“内衣”、“牛仔”等等。当用户点击“女装”时,则可以加载“女装”对应的网页,获取更多关于“女装”的信息。
[0111]应用场景二:用户请求搜索“英语培训”;
[0112]对“英语培训”进行分词处理,获得“英语”和“培训”,同时预置有一个集合{ “英语培训”、“雅思”、“托福”、“商务英语”……},“英语”和“培训”在这个集合中匹配成功,则可以获取如图4所示的该集合对应的网站信息。其中一个网站信息包括类别信息“热门课程”、“出国考试”、“大学英语”和“优能中学”,在类别信息“大学英语”中包括网页信息“考研”、“四级”、“六级”、“考研无忧计划”等等。当用户点击“六级”时,则可以加载“六级”对应的网页,获取更多关于“六级”的信息。
[0113]对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0114]参照图5,示出了根据本发明一个实施例的一种搜索结果的展示装置实施例的结构框图,具体可以包括如下模块:
[0115]搜索请求接收模块510,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0116]网站信息搜索模块520,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中可以包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目可以多于排序在后的网站信息的类别条目;
[0117]网站信息返回模块530,适于将所述网站信息返回所述客户端;所述客户端可以用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域可以大于排序在后的网站信息的展示区域。
[0118]在本发明的一种可选实施例中,所述网站信息搜索模块520还可以适于:
[0119]对所述搜索关键词进行分词处理,获得搜索分词;
[0120]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0121]当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0122]在本发明的一种可选实施例中,所述网站信息可以通过以下方式获得:
[0123]分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0124]分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;
[0125]采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;
[0126]当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0127]在本发明实施例的一种可选示例中,所述排序信息可以通过执行所述网站信息的预期点击率和预置权重的乘积计算获得。
[0128]参照图6,示出了根据本发明一个实施例的一种搜索结果的展示系统实施例的结构框图,该系统可以包括服务器610和客户端620
[0129]所述服务器610可以包括如下模块:
[0130]搜索请求接收模块611,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0131]网站信息搜索模块612,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中可以包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目可以多于排序在后的网站信息的类别条目;
[0132]网站信息返回模块613,适于将所述网站信息返回所述客户端;所述客户端可以用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域可以大于排序在后的网站信息的展示区域;
[0133]所述客户端620可以包括如下模块:
[0134]搜索请求发送模块621,适于向所述服务器发送的搜索请求;
[0135]网站信息接收模块622,适于接收所述服务器返回的网站信息;
[0136]网站信息显示模块623,适于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域可以大于排序在后的网站信息的展示区域。
[0137]在本发明的一种可选实施例中,所述网站信息搜索模块612还可以适于:
[0138]对所述搜索关键词进行分词处理,获得搜索分词;
[0139]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0140]当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0141]在本发明的一种可选实施例中,所述网站信息可以通过以下方式获得:
[0142]分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0143]分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;
[0144]采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;
[0145]当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0146]在本发明实施例的一种可选示例中,所述排序信息可以通过执行所述网站信息的预期点击率和预置权重的乘积计算获得。
[0147]对于装置、系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0148]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0149]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0150]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0151 ] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0152]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0153]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的搜索结果的展示设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0154]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0155]本发明的实施例公开Al、一种搜索结果的展示方法,包括:
[0156]接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0157]搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;
[0158]将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
[0159]A2、如Al所述的方法,所述搜索与所述搜索关键词匹配的网站信息的步骤包括:
[0160]对所述搜索关键词进行分词处理,获得搜索分词;
[0161]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0162]当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0163]A3、如Al所述的方法,所述网站信息通过以下方式获得:
[0164]分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0165]分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;
[0166]采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;
[0167]当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0168]A4、如Al所述的方法,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计算获得。
[0169]本发明的实施例还公开了 B5、一种搜索结果的展示装置,包括:
[0170]搜索请求接收模块,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0171]网站信息搜索模块,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;
[0172]网站信息返回模块,适于将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
[0173]B6、如B5所述的装置,所述网站信息搜索模块还适于:
[0174]对所述搜索关键词进行分词处理,获得搜索分词;
[0175]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0176]当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
[0177]B7、如B5所述的装置,所述网站信息通过以下方式获得:
[0178]分别采用一个或多个类别对应的网页信息训练一个或多个类别模型;
[0179]分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率;
[0180]采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度;
[0181]当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
[0182]Β8^Π B5所述的装置,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计算 得。
[0183]本发明的实施例还公开了 C9、一种搜索结果的展示系统,所述系统包括服务器和客户端;
[0184]所述服务器包括:
[0185]搜索请求接收模块,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词;
[0186]网站信息搜索模块,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目;
[0187]网站信息返回模块,适于将所述网站信息返回所述客户端;
[0188]所述客户端包括:
[0189]搜索请求发送模块,适于向所述服务器发送的搜索请求;
[0190]网站信息接收模块,适于接收所述服务器返回的网站信息;
[0191]网站信息显示模块,适于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
[0192]C10、如C9所述的系统,所述网站信息搜索模块还适于:
[0193]对所述搜索关键词进行分词处理,获得搜索分词;
[0194]采用所述搜索分词在预置的特征词组成的集合中进行匹配;
[0195]当匹配成功时,提取匹配成功的特征词对应的网站信息。
【权利要求】
1.一种搜索结果的展示方法,包括: 接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词; 搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目; 将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
2.如权利要求1所述的方法,其特征在于,所述搜索与所述搜索关键词匹配的网站信息的步骤包括: 对所述搜索关键词进行分词处理,获得搜索分词; 采用所述搜索分词在预置的特征词组成的集合中进行匹配; 当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
3.如权利要求1所述的方法,其特征在于,所述网站信息通过以下方式获得: 分别采用一个或多个类别对应的网页信息训练一个或多个类别模型; 分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率; 采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度; 当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
4.如权利要求1所述的方法,其特征在于,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计算获得。
5.一种搜索结果的展示装置,包括: 搜索请求接收模块,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词; 网站信息搜索模块,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目; 网站信息返回模块,适于将所述网站信息返回所述客户端;所述客户端用于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
6.如权利要求5所述的装置,其特征在于,所述网站信息搜索模块还适于: 对所述搜索关键词进行分词处理,获得搜索分词; 采用所述搜索分词在预置的特征词组成的集合中进行匹配; 当匹配成功时,提取匹配成功的特征词所属的集合对应的网站信息。
7.如权利要求5所述的装置,其特征在于,所述网站信息通过以下方式获得: 分别采用一个或多个类别对应的网页信息训练一个或多个类别模型; 分别计算新的网页信息归属于所述一个或多个类别的一个或多个概率; 采用所述一个或多个概率计算所述新的网页信息,分别归属于所述一个或多个类别的置信度; 当最高的置信度大于预设的置信度阈值时,判定所述网页信息归属于最高的置信度对应的类别。
8.如权利要求5所述的装置,其特征在于,所述排序信息通过执行所述网站信息的预期点击率和预置权重的乘积计算获得。
9.一种搜索结果的展示系统,所述系统包括服务器和客户端; 所述服务器包括: 搜索请求接收模块,适于接收客户端发送的搜索请求;所述搜索请求中包括搜索关键词; 网站信息搜索模块,适于搜索与所述搜索关键词匹配的多个网站信息;其中,所述网站信息中包括排序信息、一个或多个类别信息,以及,分别归属于所述类别信息的网页信息;其中,排序在先的网站信息的类别条目多于排序在后的网站信息的类别条目; 网站信息返回模块,适于将所述网站信息返回所述客户端; 所述客户端包括: 搜索请求发送模块,适于向所述服务器发送的搜索请求; 网站信息接收模块,适于接收所述服务器返回的网站信息; 网站信息显示模块,适于按照所述排序信息在当前界面展示所述网站信息;其中,排序在先的网站信息的展示区域大于排序在后的网站信息的展示区域。
10.如权利要求9所述的系统,其特征在于,所述网站信息搜索模块还适于: 对所述搜索关键词进行分词处理,获得搜索分词; 采用所述搜索分词在预置的特征词组成的集合中进行匹配; 当匹配成功时,提取匹配成功的特征词对应的网站信息。
【文档编号】G06F17/30GK103984705SQ201410171945
【公开日】2014年8月13日 申请日期:2014年4月25日 优先权日:2014年4月25日
【发明者】李刚, 王磊 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1