利用微博短链的网页搜索系统及网页搜索方法

文档序号:6491224阅读:411来源:国知局
利用微博短链的网页搜索系统及网页搜索方法
【专利摘要】本发明是有关一种利用微博短链的网页搜索系统及网页搜索方法。该网页搜索系统,包括短链网页搜索子系统,该短链网页搜索子系统获取微博中短链指向的网页及该微博信息建立短链网页索引,在接到搜索请求时返回符合搜索请求的短链网页搜索结果,该短链网页搜索结果包括短链网页链接及与短链网页关联的微博信息。该网页搜索方法在接到搜索请求时对短链网页及微博信息建立的短链网页索引进行检索,并返回符合搜索请求的短链网页搜索结果,该短链网页搜索结果包括短链网页链接及与短链网页关联的微博信息。本发明可以提高搜索质量和用户体验。
【专利说明】利用微博短链的网页搜索系统及网页搜索方法
【技术领域】
[0001]本发明涉及网页搜索系统及搜索方法,特别是涉及一种利用微博短链的网页搜索系统及网页搜索方法。
【背景技术】
[0002]目前网页搜索引擎通常采用通过网页爬虫收集网页,对网页做信息提取,并分析网页之间的链接关系作为网页排序的信号来源,在服务端根据用户的输入查询和信号做匹配,并给出最终的排序结果。
[0003]随着微博的流行,通用网页搜索引擎也尝试将微博结果加入到所有搜索结果中,但通常是作为额外的信息来源,微博和网页之间没有任何关联,这样的做法一定程度上提高了用户的体验,但微博和网页还是作为两种不同来源的数据,之间并没有建立任何联系。
[0004]现有的搜索引擎中都没有建立网页和带有短链网页链接的微博之间的联系,也没有将微博中的信号应用在网页搜索中。

【发明内容】

[0005]有鉴于上述现有技术所存在的缺陷,本发明的目的在于,提供一种利用微博短链的网页搜索系统及网页搜索方法,使其搜索结果中包含微博信息,以提高用户体验。
[0006]为了实现上述目的,依据本发明提出的一种利用微博短链的网页搜索系统,其包括短链网页搜索子系统,该短链网页搜索子系统获取微博中短链指向的网页及该微博信息建立短链网页索引,在接到搜索请求时返回符合搜索请求的短链网页搜索结果,该短链网页搜索结果包括短链网页链接及与短链网页关联的微博信息。
[0007]本发明还可采用以下技术措施进一步实现。
[0008]前述的利用微博短链的网页搜索系统,其还包括网页搜索子系统,搜索并返回符合该搜索请求的网页搜索结果。
[0009]前述的利用微博短链的网页搜索系统,其还包括,搜索整合模块,以整合短链网页与该短链网页关联的微博信息;及索结果返回模块,对整合有关联微博信息的短链网页和/或网页搜索结果排序后返回。
[0010]前述的利用微博短链的网页搜索系统,其还包括用户状态判断模块,以判断提出搜索请求的用户是否为登录用户,提出搜索请求的用户为登录用户时提取提出搜索请求的用户信息,根据该用户信息对短链网页搜索结果和/或网页搜索结果加权排序。
[0011]前述的利用微博短链的网页搜索系统,其中所述的该短链网页搜索结果包括若干个短链网页链接,所述短链网页链接整合有关联的微博信息,所述微博信息包括微博内容、微博发布时间、微博发布者信息和/或与该短链网页关联的所有微博链接。
[0012]为了实现上述目的,依据本发明提出的一种利用微博短链的网页搜索方法,在接到搜索请求时对短链网页及微博信息建立的短链网页索引进行检索,并返回符合搜索请求的短链网页搜索结果,该短链网页搜索结果包括短链网页链接及与短链网页关联的微博信肩、O
[0013]前述的利用微博短链的网页搜索方法,在接到搜索请求时同时还包括网页搜索步骤,搜索并返回符合该搜索请求的网页搜索结果。
[0014]前述的利用微博短链的网页搜索方法,其还包括以下步骤,搜索整合步骤,以整合短链网页与该短链网页关联的微博信息;及搜索结果返回步骤,对整合有关联微博信息的短链网页和/或网页搜索结果排序后返回。
[0015]前述的利用微博短链的网页搜索方法,其还包括用户状态判断步骤,判断提出搜索请求的用户是否为登录用户,提出搜索请求的用户为登录用户时提取提出搜索请求的用户信息,并根据该用户信息对短链网页搜索结果和/或网页搜索结果加权排序。
[0016]前述的利用微博短链的网页搜索方法,其中所述的该短链网页搜索结果包括若干个短链网页链接,所述短链网页链接整合有关联的微博信息,所述微博信息包括微博内容、微博发布时间、微博发布者信息和/或与该短链网页关联的所有微博链接。
[0017]本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明的利用微博短链的网页搜索系统及网页搜索方法,至少具有下列优点:1)本发明的利用微博短链的网页搜索系统及网页搜索方法,搜索结果中包含微博信息,提高搜索质量和用户体验。2)本发明的利用微博短链的网页搜索系统及网页搜索方法,搜索结果中引入了微博信息,网页搜索结果具有了社交属性。3)本发明的利用微博短链的网页搜索系统及网页搜索方法,用户信息影响搜索结果的排序,不同的用户搜索结果并不完全相同,搜索结果具有个性化。
【专利附图】

【附图说明】
[0018]图1是本发明第一实施例的利用微博短链的网页搜索系统的方框示意图。
[0019]图2是本发明第一实施例的利用微博短链的网页搜索系统的搜索结果的示意图。
[0020]图3是本发明第二实施例的利用微博短链的网页搜索系统的方框示意图。
[0021]图4是本发明第二实施例的利用微博短链的网页搜索系统的搜索结果的示意图。
[0022]图5是本发明第三实施例的基于微博信息的网页搜索方法的流程图。
[0023]图6是本发明第四实施例的基于微博信息的网页搜索方法的流程图。
[0024]图7是本发明第五实施例的利用微博短链的网页搜索系统的方框示意图。
【具体实施方式】
[0025]为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的利用微博短链的网页搜索系统及网页搜索方法其【具体实施方式】、步骤、结构、特征及其功效详细说明。
[0026]本发明中,短链是指将长的URL网址,通过程序计算等方式,转换为简短的网址字符串;微博是指微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。但并不以此为限。
[0027]请参阅图1所示,是本发明的利用微博短链的网页搜索系统的第一实施例的方框示意图。本发明第一实施例的利用微博短链的网页搜索系统,包括:搜索请求接收模块50、短链网页搜索子系统20、搜索整合模块30及搜索结果返回模块40。
[0028]所述的搜索请求接收模块50用于接收用户输入的搜索请求。用户可以利用电脑、手机等终端设备,利用互联网、局域网等网络输入搜索请求。
[0029]所述的短链网页搜索子系统20对微博中的短链指向的网页(简称短链网页)及该微博信息建立短链网页索引并存于短链网页索引库25。短链网页搜索子系统20在接到搜索请求时返回符合搜索请求的短链网页及微博信息。所述的微博信息,包括微博内容、微博发布时间、微博发布者和/或微博发布者关联人员信息。
[0030]所述的搜索整合模块30整合短链网页与该短链网页关联的微博信息。
[0031]所述的索结果返回模块40对整合有关联微博信息的短链网页排序,并把搜索结果返回给搜索用户。该搜索结果中包含多个短链网页链接,所述短链网页链接整合有与该网页关联的至少一个微博信息。如图2所示,是短链网页搜索结果的示意图,搜索结果包括若干个短链网页链接101,短链网页链接101整合有若干个关联的微博内容103、微博的链接105、微博发布者信息(未图示)和/或所有关联微博链接107。所述微博发布者信息,例如是姓名、ID等。
[0032]本实施例的利用微博短链的网页搜索系统,搜索结果中的网页链接整合有微博信息,使得搜索结果具有社交属性,提高了用户体验。
[0033]请参阅图3所示,是本发明的利用微博短链的网页搜索系统的第二实施例的方框示意图。本发明第二实施例的利用微博短链的网页搜索系统,包括是:搜索请求接收模块50、、短链网页搜索子系统20、用户状态判断模块60、搜索整合模块30及搜索结果返回模块40。
[0034]第二实施例与第一实施例相比,还包括用户状态判断模块60。该用户状态判断模块60用于判断提出搜索请求的用户是否为登录用户,如果是登录用户则提取提出搜索请求的用户信息(例如用户的性别、好友关系、个人爱好、地址等),与搜索请求同时提供给该短链网页搜索子系统20。该短链网页搜索子系统20搜索符合该搜索请求的短链网页及关联微博信息。该搜索整合模块30整合短链网页与该短链网页关联的微博信息。搜索结果返回模块40返回的搜索结果包括若干个短链网页链接101,短链网页链接101整合有若干个关联的微博信息103、微博的链接105和/或所有关联微博链接107。较佳的,搜索结果还包括与提出搜索请求的用户关联人员的微博信息,例如好友微博信息109 (如图4所示)。较佳的该搜索结果返回模块40根据提出搜索请求的用户信息对搜索到的短链网页加权排序,例如,提出搜索请求的用户的朋友发表的微博中所指向的短链网页排序上升。
[0035]本实施例的利用微博短链的网页搜索系统,搜索结果不仅有社交属性,而且不同搜索用户其搜索结果不完全相同。
[0036]请参阅图5所示,是本发明第三实施例的基于微博信息的网页搜索方法的流程图。本实施例的基于微博信息的网页搜索方法,包括,步骤S10:接受搜索请求;步骤S20:搜索短链网页及微博信息建立的短链网页索引,返回符合搜索请求的短链网页及微博信息;步骤S30:整合短链网页与微博信息;步骤S40:对整合有关联微博信息的短链网页排序,并把搜索结果返回给搜索用户。如图2所示,是搜索结果的示意图,搜索结果包括若干个短链网页链接101,短链网页链接101整合有若干个关联的微博信息103、微博的链接105和/或所有关联微博链接107。[0037]请参阅图6所示,是本发明第四实施例的基于短链信息的网页搜索方法的流程图。第四实施例的基于微博信息的网页搜索方法与第三实施例的基于微博信息的网页搜索方法相比,步骤SlO之后还包括用户登录状态判断步骤S11。该步骤Sll判断提出搜索请求的用户是否为登录用户,如果是登录用户则提取用户信息,与搜索请求同时提供给步骤S20。该步骤S20返回符合搜索请求的短链网页及微博信息。步骤S30:整合短链网页与微博信息。步骤S40 ;对整合有关联微博信息的短链网页排序,并把搜索结果返回给搜索用户;返回的搜索结果包括若干个短链网页链接101,短链网页链接101整合有若干个关联的微博信息103、微博的链接105和/或所有关联微博链接107。较佳的,搜索结果还包括与提出搜索请求的用户关联人员的微博信息,例如好友微博信息109 (如图4所示)。较佳的该搜索结果返回模块40根据提出搜索请求的用户信息对搜索到的短链网页加权排序,例如,提出搜索请求的用户的朋友发表的微博中所指向的短链网页排序上升。
[0038]请参阅图7所示,是本发明第五实施例的利用微博短链的网页搜索系统的方框示意图。本发明第五实施例的利用微博短链的网页搜索系统,包括:搜索请求接收模块50、网页搜索子系统10、短链网页搜索子系统20、用户状态判断模块60、搜索整合模块30及搜索结果返回模块40。
[0039]所述网页搜索子系统10用于搜索符合该搜索请求的网页,其可以是现有技术的网页搜索引擎。该网页搜索子系统10包括,网页获取模块11、网页索引模块13、网页库15、网页搜索叶节点模块17及网页整合模块19。该网页获取模块11 (例如网页爬虫)从互联网上获取网页存储于网页库15。该网页索引模块13提取网页中的信号建立网页索引文件。该网页搜索叶节点模块17在网页索引文件中找到和搜索相关的候选网页,根据索引中该文档的各种信号结合查询词对网页排序,将网页搜索结果返回给网页整合模块19。该网页整合模块19合并搜索叶节点的结果并返回搜索到的网页。
[0040]所述的短链网页搜索子系统20在接到搜索请求时返回符合搜索请求的短链网页及微博信息。短链网页搜索子系统20包括社交爬虫模块21,短链网页库模块22,微博库模块23,短链索引库模块25,短链搜索叶节点模块26,短链整合模块27、微博用户库模块29。[0041 ] 该社交爬虫模块21从各微博平台(例如新浪,腾讯,搜狐,网易,FACEB00K等)抓取微博信息,将微博内容,存入微博库23中;将微博用户信息,存入微博用户库模块29 ;将微博中的短链转换为长链,并抓取该短链指向的网页,存入短链网页库22中。
[0042]该短链网页索引库模块25根据短链网页、微博信息及网页存储库15中的普通网页建立短链网页索引。短链网页索引可分为实时短链网页索引和批处理短链网页索引。实时短链网页索引是社交爬虫模块21实时获取短链网页及微博信息建立的实时索引,以提供实时的短链网页搜索结果。批处理短链网页索引是以预定时间为周期(例如一天),获取短链网页库22的短链网页,微博库23的微博内容以及网页存储库模块15中的网页所建立的索引;批处理短链网页索引以普通网页搜索的信号(例如,pagerank,作弊信息等),使短链网页库的搜索结果更精确,合理。短链网页索引包括网页索引外还包括该短链网页对应的微博列表、发布微博用户的用户ID列表和/或微博发布的时间。该短链网页索引库模块25将其存储的短链网页索引均匀的分成N份,推送给短链网页搜索叶子节点模块26 ;该短链网页搜索叶子节点模块26读取短链网页索引,整合提出搜索请求的用户的用户信息,提供带有社交属性的搜索结果给短链网页整合模块27。该短链网页整合模块27主要负责路由短链网页搜索请求,并整合归并短链搜索叶子节点模块26的短链搜索结果后返回给搜索整合模块30。
[0043]所述的搜索整合模块30用于接受搜索请求接受模块50发送的搜索请求,归并网页搜索结果、短链网页搜索结果以及微博内容,将搜索结果返回给搜索结果返回模块40。具体的,该搜索整合模块30接收到搜索请求接受模块50的搜索请求后,判断该用户是否处于登陆状态,对于登录用户提取该用户的用户信息(例如用户的性别、好友关系、个人爱好和/或地址等)加入搜索请求中,并将搜索请求发送给网页搜索子系统10和短链网页搜索子系统20。搜索整合模块30接到短链网页搜索结果后将从微博库23中获取微博内容整合到关联短链网页搜索结果中;之后将整合的短链网页搜索结果以及网页搜索子系统10搜索到的网页搜索结果返回给搜索入口及展现模块40。
[0044]所述的搜索结果返回模块40在获取到从搜索整合模块30返回的搜索结果后进行排序并返回最终搜索结果。排序原则包括(但不限于)以下策略及其组合:短链网页搜索结果优先的策略,例如,如果某一网页同时出现在网页结果和短链网页结果中,将该网页在网页结果中的得分和短链结果中的得分进行叠加,也就是说有越多的微博讨论的网页,或者有越多与搜索请求关键词相关微博评论的网页将获得高的得分和靠前的排名;搜索用户的用户信息关联搜索结果优先策略,例如,如果有提出搜索用户的好友对其中一条短链网页发布微博进行评论,那么该短链网页结果将获得高的得分和靠前的排名;时效性高的短链网页优先策略,例如,如果搜索结果中的短链网页在近期有密集的微博对它进行评论,将其判定为近期热点短链网页,对于时效性强的查询词,该热点短链网页获得高的得分和靠前的排名。
[0045]本实施例的利用微博短链的网页搜索系统,搜索结果不仅有社交属性,而且不同搜索用户其搜索结果不完全相同。
[0046]本领域的技术人员应该理解,上述实施例有多种变化。例如,对搜索结果排序可以由搜索整合模块30完成,而不仅限于由搜索结果返回模块40排序;实施例中虽然有各个模块的划分但不是用以限定的,在某些硬件条件下各个模块是可以合并或进一步拆分。
[0047]虽然本发明已以较佳实施例揭露如上,然并非用以限定本发明实施的范围,依据本发明的权利要求书及说明内容所作的简单的等效变化与修饰,仍属于本发明技术方案的范围内。
【权利要求】
1.一种利用微博短链的网页搜索系统,其特征在于包括短链网页搜索子系统,该短链网页搜索子系统获取微博中短链指向的网页及该微博信息建立短链网页索引,在接到搜索请求时返回符合搜索请求的短链网页搜索结果,该短链网页搜索结果包括短链网页链接及与短链网页关联的微博信息。
2.如权利要求1所述的利用微博短链的网页搜索系统,其特征在于其还包括网页搜索子系统,搜索并返回符合该搜索请求的网页搜索结果。
3.如权利要求1或2的利用微博短链的网页搜索系统,其特征在于其还包括, 搜索整合模块,以整合短链网页与该短链网页关联的微博信息;及 索结果返回模块,对整合有关联微博信息的短链网页和/或网页搜索结果排序后返回。
4.如权利要求1或2所述的利用微博短链的网页搜索系统,其特征在于其还包括用户状态判断模块,以判断提出搜索请求的用户是否为登录用户,提出搜索请求的用户为登录用户时提取提出搜索请求的用户信息,根据该用户信息对短链网页搜索结果和/或网页搜索结果加权排序。
5.如权利要求1所述的利用微博短链的网页搜索系统,其特征在于其中所述的该短链网页搜索结果包括若干个短链网页链接,所述短链网页链接整合有关联的微博信息,所述微博信息包括微博内容、微博发布时间、微博发布者信息和/或与该短链网页关联的所有微博链接。
6.一种利用微博短链的网页搜索方法,其特征在于在接到搜索请求时对短链网页及微博信息建立的短链网页索引进行检索,并返回符合搜索请求的短链网页搜索结果,该短链网页搜索结果包括短链网页链接及与短链网页关联的微博信息。
7.如权利要求6所述的利用微博短链的网页搜索方法,其特征在于在接到搜索请求时同时还包括网页搜索步骤,搜索并返回符合该搜索请求的网页搜索结果。
8.如权利要求6或7的利用微博短链的网页搜索方法,其特征在于其还包括以下步骤, 搜索整合步骤,以整合短链网页与该短链网页关联的微博信息 '及 搜索结果返回步骤,对整合有关联微博信息的短链网页和/或网页搜索结果排序后返回。
9.如权利要求6或7所述的利用微博短链的网页搜索方法,其特征在于其还包括用户状态判断步骤,判断提出搜索请求的用户是否为登录用户,提出搜索请求的用户为登录用户时提取提出搜索请求的用户信息,并根据该用户信息对短链网页搜索结果和/或网页搜索结果加权排序。
10.如权利要求6所述的利用微博短链的网页搜索方法,其特征在于其中所述的该短链网页搜索结果包括若干个短链网页链接,所述短链网页链接整合有关联的微博信息,所述微博信息包括微博内容、微博发布时间、微博发布者信息和/或与该短链网页关联的所有微博链接。
【文档编号】G06F17/30GK103823808SQ201210466526
【公开日】2014年5月28日 申请日期:2012年11月16日 优先权日:2012年11月16日
【发明者】刘骏, 李大海, 孙峥, 盛佳, 项锟, 马俊 申请人:云壤(北京)信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1