检索方法和装置与流程

文档序号:13013799阅读:145来源:国知局
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉
及检索方法和装置。


背景技术:

搜索引擎排名是指搜索引擎派出一个能够在网上发现新网页并抓
取文件的程序,这个程序通常被称为网络爬虫。网络爬虫从数据库中
已知的网页开始出发,就像正常用户的浏览器一样访问这些网页并抓
取文件。对搜索词进行处理后,搜索引擎排序程序开始工作,从索引
数据库中找出所有包含搜索词的网页,并根据排名算法计算出哪些网
页应该排在前面,然后按一定的格式返回“搜索”页面。这样搜索引擎
只须一两秒之内就能完成并返回用户所要的搜索结果。
目前,搜索结果中会有大量的社交网站原创内容,而现有的搜索
引擎排名算法主要是以内容相关性、网站级别、时效性等因素对包含
搜索词的网页进行排名,并没有考虑原创内容的作者因素,从而,存
在着社交网站相关数据利用不足,使得检索结果缺乏针对性。


技术实现要素:

本申请的目的在于提出一种改进的检索方法和装置,来解决以上
背景技术部分提到的技术问题。
第一方面,本申请提供了一种检索方法,所述方法包括:接收用
户的检索请求,其中,所述检索请求中包括检索关键词;根据所述检
索关键词对至少一个预定社交网站进行检索操作,生成检索信息集合;
对所述检索信息集合中的每一条检索信息,根据该检索信息对应的社
交网站的网站信息和该检索信息对应的社交网站的内容的作者信息,
对该检索信息进行评分;根据评分,对各条检索信息进行排序,生成

经排序的检索信息的集合作为检索结果。
在一些实施例中,所述网站信息包括所述网站的网站级别。
在一些实施例中,在所述对所述检索信息集合中的每一条检索信
息,根据该检索信息对应的社交网站的网站信息和该检索信息对应的
社交网站的内容的作者信息,对该检索信息进行评分之前,所述方法
还包括:获取所述检索信息对应的社交网站的网站信息和所述检索信
息对应的社交网站的内容的作者信息。
在一些实施例中,所述获取所述检索信息对应的社交网站的网站
信息和所述检索信息对应的社交网站的内容的作者信息,包括:通过
网络爬虫技术抓取所述检索信息对应的社交网站的网站信息和所述检
索信息对应的社交网站的内容的作者信息。
在一些实施例中,所述方法还包括:接收所述至少一个预定社交
网站主动推送的网站信息、内容信息和/或内容的作者信息。
在一些实施例中,所述作者信息包括以下至少一项:作者基本信
息和作者行为信息;其中,所述作者基本信息包括以下至少一项:作
者名、作者在对应的社交网站的等级、作者在对应的社交网站的关注
数量和作者是否通过社交网站的官方认证;所述作者行为信息包括以
下至少一项:作者在对应的社交网站上发布的内容的发布时间、作者
在对应的社交网站上发布的内容的回复数量、作者在对应的社交网站
上发布的内容的转发数量、作者在对应的社交网站上发布的内容的点
击数量和作者在对应的社交网站上发布的内容的展现数量。
第二方面,本申请提供了一种检索装置,所述装置包括:接收单
元,配置用于接收用户的检索请求,其中,所述检索请求中包括检索
关键词;检索单元,配置用于根据所述检索关键词对至少一个预定社
交网站进行检索操作,生成检索信息集合;评分单元,配置用于对所
述检索信息集合中的每一条检索信息,根据该检索信息对应的社交网
站的网站信息和该检索信息对应的社交网站的内容的作者信息,对该
检索信息进行评分;排序单元,配置用于根据评分,对各条检索信息
进行排序,生成经排序的检索信息的集合作为检索结果。
在一些实施例中,所述网站信息包括所述网站的网站级别。
在一些实施例中,所述装置还包括:获取单元,配置用于获取所
述检索信息对应的社交网站的网站信息和所述检索信息对应的社交网
站的内容的作者信息。
在一些实施例中,所述获取单元进一步配置用于:通过网络爬虫
技术抓取所述检索信息对应的社交网站的网站信息和所述检索信息对
应的社交网站的内容的作者信息。
在一些实施例中,所述装置还包括:接收单元,配置用于接收所
述至少一个预定社交网站主动推送的网站信息、内容信息和/或内容的
作者信息。
在一些实施例中,所述作者信息包括以下至少一项:作者基本信
息和作者行为信息;其中,所述作者基本信息包括以下至少一项:作
者名、作者在对应的社交网站的等级、作者在对应的社交网站的关注
数量和作者是否通过社交网站的官方认证;所述作者行为信息包括以
下至少一项:作者在对应的社交网站上发布的内容的发布时间、作者
在对应的社交网站上发布的内容的回复数量、作者在对应的社交网站
上发布的内容的转发数量、作者在对应的社交网站上发布的内容的点
击数量和作者在对应的社交网站上发布的内容的展现数量。
本申请提供的检索方法和装置,通过利用用户检索请求中的检索
关键词对预定社交网站进行检索生成检索信息集合,而后根据检索信
息集合中的每条检索信息对应的社交网站和该检索信息对应的作者信
息对该检索信息进行评分,最后根据评分对各个检索信息进行排序,
并将排序后的检索信息集合作为检索结果,从而有效的利用了社交网
站的作者信息,使得检索结果更具有针对性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描
述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的检索方法的一个实施例的流程图;
图3是根据本申请的检索方法的一个应用场景的示意图;
图4是根据本申请的检索方法的又一个实施例的流程图;
图5是根据本申请的检索装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构
示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解
的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发
明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与
有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例
中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本
申请。
图1示出了可以应用本申请的检索方法或检索装置的实施例的示
例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,
网络104和服务器105。网络104用以在终端设备101、102、103和
服务器105之间提供通信链路的介质。网络104可以包括各种连接类
型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105
交互,以接收或发送消息等。终端设备101、102、103上可以安装有
各种通讯客户端应用,例如网页浏览器应用、搜索类应用、社交平台
软件等。
终端设备101、102、103可以是具有显示屏并且支持检索和网页
浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅
读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态
影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroup
AudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便
携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、

102、103上生成的检索请求提供支持的具有搜索引擎功能的后台检索
服务器。后台检索服务器可以对接收到的检索请求等数据进行分析等
处理,并将检索结果(例如网页页面数据)反馈给终端设备。
需要说明的是,本申请实施例所提供的检索方法一般由服务器
105执行,相应地,检索装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意
性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的检索方法的一个实施例的流
程200。所述的检索方法,包括以下步骤:
步骤201,接收用户的检索请求。
在本实施例中,检索方法运行于其上的电子设备(例如图1所示
的服务器,尤其是具有搜索引擎功能的服务器)可以通过有线连接方
式或者无线连接方式从用户利用其进行检索的终端接收用户的检索请
求,其中,上述检索请求中包括了检索关键词。上述检索请求的请求
内容包括但不限于文字、图片和语音。作为示例,当上述用户的检索
请求为图片时,上述电子设备可以调用OCR(OpticalCharacter
Recognition,光学字符识别)软件接口来对检索请求中的图片进行文
字识别,并取得包含至少一个检索关键词的识别结果;当上述用户的
检索请求为语音时,上述电子设备可以通过语音识别软件(例如,
Viavoice)的接口来对检索请求中的语音进行文字识别,并取得包含至
少一个检索关键词的识别结果。
步骤202,根据检索关键词对至少一个预定社交网站进行检索操
作,生成检索信息集合。
在本实施例中,检索方法运行于其上的电子设备上可以预先存储
多条预定社交网站的内容,可以对这些内容进行检索操作,以便作为
检索信息在浏览器上呈现。
在本实施例中,上述电子设备基于步骤201中接收到的用户的检
索请求中的检索关键词,对至少一个预定社交网站进行检索操作,生
成检索信息集合,其中,上述检索信息可以是网页信息,也可以是网
页快照。
在本实施例中,上述预定社交网站可以是人工手动设定的网站;
也可以是上述电子设备默认的网站;还可以是当网站满足预定条件时,
上述电子设备自行设定的网站,例如,当网站的总发帖量大于一百万
时,上述电子设备可以将该网站设定为社交网站;当网站的总用户量
大于五十万时,上述电子设备也可以将该网站设定为社交网站;当网
站的总访问量大于五百万时,上述电子设备还可以将该网站设定为社
交网站。
在本实施例中,上述电子设备可以将搜索关键词与来自预定社交
网站的检索信息分别进行逐一匹配,并根据每条社交网站的检索信息
所包括的关键词的数目来确定该条检索信息是否可以放入到检索信息
集合中。例如,如果某条社交网站的检索信息中包括至少一个检索关
键词,则可以将该检索信息放入到检索信息集合中。
步骤203,对检索信息集合中的每一条检索信息,根据该检索信
息对应的社交网站的网站信息和该检索信息对应的社交网站的内容的
作者信息,对该检索信息进行评分。
在本实施例中,上述电子设备针对步骤202中生成的检索信息集
合中的每一条检索信息,根据该检索信息对应的社交网站的网站信息
和该检索信息对应的社交网站的内容的作者信息对该检索信息进行评
分。
在本实施例的一些可选的实现方式中,网站信息可以包括该网站
的网站级别(PR值,PageRank值)。需要说明的是,PR值也可以是上
述网站信息对应的网站所包含的网页的网页级别。PR值是用来表现网
页或网站等级的一个标准,级别分别是0到10。例如,PR值为1的
网站表明这个网站不太重要,而PR值为7到10的网站表明这个网站
很重要。
在本实施例的一些可选的实现方式中,作者信息可以包括以下至
少一项:作者基本信息和作者行为信息。其中,作者基本信息可以包
括以下至少一项:作者名(作者ID)、作者在对应的社交网站的等级、
作者在对应的社交网站的关注数量(粉丝数量)和作者是否通过网站
的官方认证;作者行为信息可以包括以下至少一项:作者在对应的社

交网站上发布的内容的发布时间、作者在对应的社交网站上发布的内
容的回复数量、作者在对应的社交网站上发布的内容的转发数量,作
者在对应的社交网站上发布的内容的点击数量和作者在对应的社交网
站上发布的内容的展现数量。
在本实施例中,可以根据检索信息对应的社交网站的PR值和该
检索信息对应的社交网站的内容的作者的关注数量,对该检索信息进
行评分。
可以利用以下公式计算检索信息的分数。
K=Rfans(EfansMaxfans)*R1*K1]]>其中,K为检索信息的分数,Rfans为作者的关注数量在社交网站的
排名中的调权系数,Efans为作者的关注数量,Maxfans为检索信息中与上
述作者来源于同一个社交网站的作者的最高关注数量,R1为作者的关
注数量在检索信息排名中的调权系数,K1为该社交网站的PR值。其
中,调权系数可以是上述电子设备预先设定的用于衡量一个参数的重
要性的系数。作为示例,当Rfans为0.8,K1为6,Efans为1000,Maxfans为
10000,R1为2时,该检索信息的分数为0.96。
在本实施例中,也可以根据检索信息对应的社交网站的PR值和
该检索信息对应的社交网站的内容的作者在该社交网站上发布的内容
的回复数量,对该检索信息进行评分。
可以利用以下公式计算检索信息的分数。
K=RreplyΣi=1n(TioldTinowNireply)*K1*R2]]>其中,K为检索信息的分数,Rreply为作者在对应的社交网站上发
布的内容的回复数量在社交网站的排名中的调权系数,Tiold为作者发布
第i项内容时的时间,Tinow为当前时间,Nireply为第i项内容的回复数量,
K1为该社交网站的PR值,R2为内容的回复数量在检索信息排名中的
调权系数,其中,i与n都为自然数。作为示例,当Rreply为1.2,为
0.999,N1reply为1000,为0.998,N2reply为500,K1为8,R2为0.9
时,该检索信息的分数为12942.72。
在本实施例中,还可以根据检索信息对应的社交网站的PR值和
该检索信息对应的社交网站的内容的作者在该社交网站的用户等级、
作者在该社交网站的关注数量(粉丝数量)、作者是否通过该社交网站
的官方认证、作者在该社交网站上发布的内容的发布时间、作者在该
社交网站上发布的内容的回复数量、作者在该社交网站上发布的内容
的转发数量和作者在该社交网站上发布的内容的点击数量和作者在该
社交网站上发布的内容的展现数量,对该检索信息进行评分。此时,
检索信息的分数与作者等级在社交网站中的排名分数、作者在社交网
站中的历史活跃度的排名分数和作者在上述具有搜索引擎功能的电子
设备中的历史影响力的排名分数相关。
首先,可以利用以下公式计算检索信息中的作者等级在对应的社
交网站中的排名分数。
K2=Rgrade(EgradeMaxgrade)+Rfans(EfansMaxfans)+V]]>其中,K2为作者等级在社交网站中的排名分数,Rgrade为作者的用
户等级在社交网站的排名中的调权系数,Egrade为作者的用户等级,
Maxgrade为检索信息中与上述作者来源于同一个社交网站的作者的最
高用户等级,Rfans为作者的关注数量在社交网站的排名中的调权系数,
Efans为作者的关注数量,Maxfans为检索信息中与上述作者来源于同一
个社交网站的作者的最高关注数量,V为作者通过该社交网站的官方
认证在社交网站的排名中的调权系数。
然后,可以利用以下公式计算检索信息中的作者在社交网站中的
历史活跃度的排名分数。
K3=RreplyΣi=1n(TioldTinowNireply)+RshareΣi=1n(TioldTinowNishare)]]>其中,K3为作者在社交网站中的历史活跃度的排名分数,Rreply为
作者在对应的社交网站上发布的内容的回复数量在社交网站的排名中
的调权系数,Tiold为作者发布第i项内容时的时间,Tinow为当前时间,Nireply为第i项内容的回复数量,Rshare为作者在对应的社交网站上发布的内容
的转发数量在社交网站的排名中的调权系数,Nishare为第i项内容的转发
数量,其中,i与n都为自然数。
接着,可以利用以下公式计算检索信息中的作者在上述具有搜索
引擎功能的电子设备中的历史影响力的排名分数。具有搜索引擎功能

的服务器
K4=Σi=1n(NiclickNishow*TioldTinow)]]>其中,K4为作者在上述具有搜索引擎功能的电子设备中的历史影
响力的排名分数,Niclick为第i项内容在上述电子设备中的点击量,Nishow为第i项内容在上述电子设备中的展现量,Tiold为作者发布第i项内容时
的时间,Tinow为当前时间,其中,i与n都为自然数。
最终,可以利用以下公式计算检索信息的分数。
K=R1*K1*K2+R2*K1*K3+R3*K4其中,K为检索信息的分数,R1为作者等级在社交网站中的排名
在检索信息排名中的调权系数,R2为作者在社交网站中的历史活跃度
的排名在检索信息排名中的调权系数,R3为作者在上述具有搜索引擎
功能的电子设备中的历史影响力的排名在在检索信息排名中的调权系
数,K1为该社交网站的PR值,K2为作者等级在社交网站中的排名分
数,K3为作者在社交网站中的历史活跃度的排名分数,K4为作者在上
述具有搜索引擎功能的电子设备中的历史影响力的排名分数。
步骤204,根据评分,对各条检索信息进行排序,生成经排序的
检索信息的集合作为检索结果。
在本实施例中,上述电子设备根据步骤203中得到的检索信息的
分数,按照上述分数由大到小的顺序对各条检索信息进行排序,并将
排序后的包含上述各条检索信息的至少一条检索信息的集合作为检索
结果。
本申请的上述实施例提供的方法,通过根据接收用户的检索请求
中的检索关键词对至少一个预定社交网站进行检索操作,再根据检索
操作得到的检索信息集合中的每一条检索信息对应的社交网站信息和
检索信息对应的作者信息对该检索信息进行评分,根据评分结果对检
索信息进行排序,得到经排序后的检索信息集合作为检索结果。该方
法有效的利用了社交网站的作者信息,使得检索结果更具有针对性。
继续参见图3,图3是根据本实施例的检索方法的应用场景的一
个示意图。在图3的应用场景中,用户首先通过终端设备(客户端)
发起一个检索请求“丽江古城”;之后,上述电子设备根据检索请求“丽

江古城”中的检索关键词“丽江古城”、“丽江”和“古城”对至少一
个预定社交网站进行检索,并生成包含至少一个“丽江古城”、“丽江”
或“古城”的检索信息301、检索信息302和检索信息303,并将其放
入到检索信息集合中;然后,上述电子设备根据检索信息集合中的检
索信息301对应的A博客的网站信息和该检索信息对应的A作者的作
者信息对该检索信息进行评分,分数为6.8,根据检索信息302对应的
B博客的网站信息和该检索信息对应的B作者的作者信息对该检索信
息进行评分,分数为5.3,根据检索信息303对应的C博客的网站信
息和该检索信息对应的C作者的作者信息对该检索信息进行评分,分
数为4.7;最后,上述电子设备根据检索信息301、检索信息302和检
索信息303的评分对其进行排序,生成的检索结果如图3所示。
本申请的上述实施例提供的方法通过检索信息对应的社交网站的
网站信息和检索信息对应的内容的作者信息对检索信息集合中的各个
检索信息进行排序,使得检索结果更具有针对性。
进一步参考图4,其示出了检索方法的又一个实施例的流程400。
该检索方法的流程400,包括以下步骤:
步骤401,接收用户的检索请求。
在本实施例中,检索方法运行于其上的电子设备(例如图1所示
的服务器)可以通过有线连接方式或者无线连接方式从用户利用其进
行检索的终端接收用户的检索请求,其中,上述检索请求中包括了检
索关键词。
步骤402,根据检索关键词对至少一个预定社交网站进行检索操
作,生成检索信息集合。
在本实施例中,上述电子设备基于步骤401中接收到的用户的检
索请求中的检索关键词,对至少一个预定社交网站进行检索操作,生
成检索信息集合。其中,上述预定社交网站可以是人工手动设定的网
站;也可以是上述电子设备默认的网站;还可以是当网站满足预定条
件时,上述电子设备自行设定的网站。
步骤403,获取检索信息对应的社交网站的网站信息和检索信息

对应的社交网站的内容的作者信息。
在本实施例中,上述电子设备获取步骤402中生成的检索信息集
合中的每一条检索信息对应的社交网站的网站信息和每一条检索信息
对应的社交网站的内容的作者信息。
在本实施例的一些可选的实现方式中,上述电子设备可以通过网
络爬虫技术抓取检索信息对应的社交网站的网站信息和检索信息对应
的社交网站的内容的作者信息,其中,网络爬虫又被称为网页蜘蛛、
网络机器人或网页追逐者,它是一种按照一定的规则,自动地抓取万
维网信息的程序或者脚本。
在本实施例的一些可选的实现方式中,上述电子设备也可以被动
地接收至少一个预定社交网站主动推送的网站信息、内容信息和/或内
容的作者信息。
步骤404,对检索信息集合中的每一条检索信息,根据该检索信
息对应的社交网站的网站信息和该检索信息对应的社交网站的内容的
作者信息,对该检索信息进行评分。
在本实施例中,上述电子设备针对步骤403中获取到的检索信息
对应的社交网站的网站信息和检索信息对应的社交网站的内容的作者
信息,对该检索信息进行评分。
在本实施例中,可以根据检索信息对应的社交网站的PR值和该
检索信息对应的社交网站的内容的作者的关注数量,对该检索信息进
行评分。
在本实施例中,也可以根据检索信息对应的社交网站的PR值和
该检索信息对应的社交网站的内容的作者在该社交网站上发布的内容
的回复数量,对该检索信息进行评分。
在本实施例中,还可以根据检索信息对应的社交网站的PR值和
该检索信息对应的社交网站的内容的作者在该社交网站的用户等级、
作者在该社交网站的关注数量(粉丝数量)、作者是否通过该社交网站
的官方认证、作者在该社交网站上发布的内容的发布时间、作者在该
社交网站上发布的内容的回复数量、作者在该社交网站上发布的内容
的转发数量和作者在该社交网站上发布的内容的点击数量和作者在该

社交网站上发布的内容的展现数量,对该检索信息进行评分。
步骤405,根据评分,对各条检索信息进行排序,生成经排序的
检索信息的集合作为检索结果。
在本实施例中,上述电子设备根据步骤404中得到的检索信息的
分数,按照上述分数由大到小的顺序对各条检索信息进行排序,并将
排序后的包含上述各条检索信息的至少一条检索信息的集合作为检索
结果。
从图4中可以看出,与图2对应的实施例相比,本实施例中的检
索方法的流程400突出了对网站信息和作者信息进行获取的步骤。由
此,本实施例描述的方案可以引入更多的网站信息和作者信息的相关
数据,从而实现更全面检索信息的选取和更有效的检索结果。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供
了一种检索装置的一个实施例,该装置实施例与图2所示的方法实施
例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的检索装置500包括:接收单元501、
检索单元502、评分单元503和排序单元504。其中,接收单元501
配置用于接收用户的检索请求,其中,检索请求中包括检索关键词;
检索单元502配置用于根据检索关键词对至少一个预定社交网站进行
检索操作,生成检索信息集合;评分单元503配置用于对检索信息集
合中的每一条检索信息,根据该检索信息对应的社交网站的网站信息
和该检索信息对应的社交网站的内容的作者信息,对该检索信息进行
评分;而排序单元504配置用于根据评分,对各条检索信息进行排序,
生成经排序的检索信息的集合作为检索结果。
在本实施例中,检索装置500的接收单元501可以通过有线连接
方式或者无线连接方式从用户利用其进行检索的终端接收用户的检索
请求,其中,上述检索请求中包括了检索关键词。
在本实施例中,检索装置500上可以预先存储多条预定社交网站
的内容,可以对这些内容进行检索操作,以便作为检索信息在浏览器
上呈现。由此,检索装置500的检索单元502可以基于接收单元501

得到的检索关键词对至少一个预定社交网站进行检索操作,生成检索
信息集合。其中,上述预定社交网站可以是人工手动设定的网站;也
可以是上述电子设备默认的网站;还可以是当网站满足预定条件时,
上述电子设备自行设定的网站。
在本实施例中,检索装置500的评分单元503可以针对检索单元
502中生成的检索信息集合中的每一条检索信息,根据该检索信息对
应的社交网站的网站信息和该检索信息对应的社交网站的内容的作者
信息对该检索信息进行评分。
在本实施例中,上述排序单元504可以根据上述评分单元503中
得到的检索信息的分数,按照上述分数由大到小的顺序对各条检索信
息进行排序,并将排序后的包含上述各条检索信息的至少一条检索信
息的集合作为检索结果。
在本实施例的一些可选的实现方式中,上述网站信息可以包括该
网站的网站级别(PR值,PageRank值)。需要说明的是,PR值也可以
是上述网站信息对应的网站所包含的网页的网页级别。PR值是用来表
现网页或网站等级的一个标准,级别分别是0到10。
在本实施例的一些可选的实现方式中,上述检索装置500还包括:
获取单元(图中未示出),用于获取上述检索信息集合中的每一条检索
信息对应的社交网站的网站信息和每一条检索信息对应的社交网站的
内容的作者信息。
在本实施例的一些可选的实现方式中,上述获取单元可以通过网
络爬虫技术抓取检索信息对应的社交网站的网站信息和检索信息对应
的社交网站的内容的作者信息,其中,网络爬虫又被称为网页蜘蛛、
网络机器人或网页追逐者,它是一种按照一定的规则,自动地抓取万
维网信息的程序或者脚本。
在本实施例的一些可选的实现方式中,上述检索装置500还包括:
接收单元(图中未示出),用于接收至少一个预定社交网站主动推送的
网站信息、内容信息和/或内容的作者信息。
在本实施例的一些可选的实现方式中,上述作者信息包括以下至
少一项:作者基本信息和作者行为信息;其中,上述作者基本信息包

括以下至少一项:作者名、作者在对应的社交网站的等级、作者在对
应的社交网站的关注数量和作者是否通过社交网站的官方认证;上述
作者行为信息包括以下至少一项:作者在对应的社交网站上发布的内
容的发布时间、作者在对应的社交网站上发布的内容的回复数量、作
者在对应的社交网站上发布的内容的转发数量、作者在对应的社交网
站上发布的内容的点击数量和作者在对应的社交网站上发布的内容的
展现数量。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的
计算机系统600的结构示意图。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其
可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608
加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作
和处理。在RAM603中,还存储有系统600操作所需的各种程序和数
据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入
/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;
包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的
输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、
调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如
因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口
605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,
根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据
需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以
被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程
序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计
算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施
例中,该计算机程序可以通过通信部分609从网络上被下载和安装,
和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元

(CPU)601执行时,执行本申请的方法中限定的上述功能。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、
方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点
上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码
的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于
实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的
实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发
生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们
有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的
是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的
组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,
或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实
现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理
器中,例如,可以描述为:一种处理器包括接收单元、检索单元、评
分单元和排序单元。其中,这些单元的名称在某种情况下并不构成对
该单元本身的限定,例如,接收单元还可以被描述为“接收用户的检
索请求的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,
该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的
非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非
易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或
者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述
设备:接收用户的检索请求,其中,所述检索请求中包括检索关键词;
根据所述检索关键词对至少一个预定社交网站进行检索操作,生成检
索信息集合;对所述检索信息集合中的每一条检索信息,根据该检索
信息对应的社交网站的网站信息和该检索信息对应的社交网站的内容
的作者信息,对该检索信息进行评分;根据评分,对各条检索信息进
行排序,生成经排序的检索信息的集合作为检索结果。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说

明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限
于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离
所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合
而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)
具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1