一种用于基于扩展推荐事件更新网页权威值的方法与设备的制作方法

文档序号:6341094阅读:176来源:国知局
专利名称:一种用于基于扩展推荐事件更新网页权威值的方法与设备的制作方法
技术领域
本发明涉及网络搜索技术领域,尤其涉及一种用于基于扩展推荐事件更新网页权威值的技术。
背景技术
现有的网页排序算法,大多数都是基于页面之间的链接关系,他们将超链接视为一种推荐行为,并基于此计算这些超链接指向的页面的权威值。但是,随着互联网的发展,网页被推荐已经不仅仅表现为超链接,而是具有多种表现形式,例如,在即时通信消息中推荐网页、用户收藏网页、在社区网络中发布网页、以及网页转载等等。由于搜索引擎的网页抓取工具,如“网络蜘蛛(spider)”、“网络爬虫 (crawler) ”或者“机器人(robot) ”等的功能限制,搜索引擎无法获取上述除了超链接以外的其他形式的网页推荐行为,而仅就页面链接关系得出的页面权威值已经不能全面反映页面的真实权威值,从而降低了搜索引擎的准确率和召回率,同时影响搜索结果的排序质量。因此,如何提供一种基于扩展推荐事件更新网页权威值的方法,成为目前急需解决的问题之一。

发明内容
本发明的目的是提供一种用于基于扩展推荐事件更新网页权威值的方法与设备。根据本发明的一个方面,提供了一种由计算机实现的用于基于扩展推荐事件更新网页权威值的方法,其中,该方法包括以下步骤a获取权威值待更新的第一网页;b获取所述第一网页的扩展推荐事件;c根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;d根据所述第一权威值,更新所述第一网页的当前权威值。根据本发明的另一个方面,还提供了一种用于基于扩展推荐事件更新网页权威值的设备,其中,该设备包括第一获取装置,用于获取权威值待更新的第一网页;第二获取装置,用于获取所述第一网页的扩展推荐事件;确定装置,用于根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;更新装置,用于根据所述第一权威值,更新所述第一网页的当前权威值。与现有技术相比,本发明基于扩展推荐事件更新网页权威值,将扩展推荐事件纳入到网页排序算法中,使得网页权威值的参考因素更为全面,从而使得网页权威值计算更为准确,提高了搜索引擎的准确率和召回率,以及搜索结果的排序质量,同时提升了用户的使用体验。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图1示出根据本发明一个方面的用于基于扩展推荐事件更新网页权威值的更新设备的示意图;图2示出根据本发明另一个方面的用于基于扩展推荐事件更新网页权威值的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1为根据本发明一个方面的设备示意图,示出用于基于扩展推荐事件更新网页权威值的更新设备。其中,更新设备1包括第一获取装置11、第二获取装置12、确定装置13 和更新装置14。具体地,第一获取装置11获取权威值待更新的第一网页;随后,第二获取装置12获取所述第一网页的扩展推荐事件;接着,确定装置13根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;随后,更新装置14根据所述第一权威值,更新所述第一网页的当前权威值。在此,更新设备1包括但不限于搜索引擎服务器或者与之相连的专用服务器。更具体地,第一获取装置11获取权威值待更新的第一网页。具体地,第一获取装置11从诸如搜索引擎服务器、与之相连的其他设备或者可经由网络访问的第三方服务器, 获取权威值待更新的第一网页。例如,第一获取装置11根据搜索引擎服务器提供的应用程序接口(API),向其发送获取权威值待更新的第一网页的请求,接收该搜索引擎服务器基于该请求返回的权威值待更新的第一网页。本领域技术人员应能理解上述获取第一网页的方式仅为举例,其他现有的或今后可能出现的获取第一网页的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。随后,第二获取装置12获取所述第一网页的扩展推荐事件。具体地,第二获取装置12根据第一获取装置11获取的权威值待更新的第一网页,获取该第一网页的扩展推荐事件,如即时通信消息中推荐该第一网页,或者用户收藏该第一网页等。例如,第一获取装置11获取的权威值待更新的第一网页,第二获取装置12根据该第一网页,按照约定的通信方式,如Http、Https等通信协议,定期向即时通信服务器发送获取该第一网页的扩展推荐事件的请求,接收该即时通讯服务器返回的扩展推荐事件。又如,用户收藏第一网页,该第一网页相应的网站服务器通过其应用程序接口(API),将该扩展推荐事件推送至更新设备 1,相应地,更新设备1的第二获取装置12接收该扩展推荐事件。本领域技术人员应能理解上述获取扩展推荐事件的方式仅为举例,其他现有的或今后可能出现的获取扩展推荐事件的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。接着,确定装置13根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值。具体地,第二获取装置12获取第一网页的扩展推荐事件,确定装置13根据这 (些)扩展推荐事件的相关信息,诸如即时通讯消息的推荐用户的等级、社区网络中发布用户的等级等,确定该第一网页的第一权威值。例如,第二获取装置12获取的扩展推荐事件为用户在即时通信消息中推荐该第一网页,确定装置13根据该扩展推荐事件的相关信息, 如该推荐用户在该即时通信消息所属即时通信系统中的等级为2级,确定该第一网页的第一权威值为2。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。随后,更新装置14根据所述第一权威值,更新所述第一网页的当前权威值。具体地,更新装置14根据确定装置13确定的第一网页的第一权威值,更新该第一网页的当前权威值。例如,对不同的扩展推荐事件赋予不同的权重,各扩展推荐事件对应的权威值加权后得到该第一网页的第一权威值,将该第一权威值与第一网页的当前权威值相累加,以更新该第一网页的当前权威值。在此,每次扩展推荐事件不但可以对应一个第一权威值,作为第一网页的权威值参考量以更新该第一网页的当前权威值;还可以被视为一次对该第一网页的引用,也即可以作为一个第一网页的虚拟导入页面,从而将该第一权威值作为该第一网页的导入链接的传导权威值,纳入现有的各种基于页面链接关系的网页排序算法,如 pagerank, HITS等算法,以更精确的计算该第一网页的权威度。本领域技术人员应能理解上述更新当前权威值的方式仅为举例,其他现有的或今后可能出现的更新当前权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,第一获取装置11、第二获取装置12、确定装置13和更新装置14是持续不断工作的。具体地,第一获取装置11获取权威值待更新的第一网页;随后,第二获取装置12 获取所述第一网页的扩展推荐事件;接着,确定装置13根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;随后,更新装置14根据所述第一权威值,更新所述第一网页的当前权威值。在此,本领域技术人员应理解“持续”是指第一获取装置11、第二获取装置12、确定装置13和更新装置14分别按照设定的或实时调整的工作模式要求进行第一网页的获取、扩展推荐事件的获取、第一权威值的确定及当前权威值的更新,直至更新设备1在较长时间内停止获取第一网页的扩展推荐事件。优选地,所述扩展推荐事件包括但不限于,以下至少任一项1)即时通信消息中推荐所述第一网页;2)用户收藏所述第一网页;3)社区网络中发布所述第一网页;4)其他网页转载所述第一网页的内容。具体地,即时通信消息中推荐所述第一网页指即时通信用户在与其他即时通信用户的即时通信消息中包括该第一网页的URL,在即时通信消息中包括该第一网页的行为即为该即时通信用户的推荐行为。用户收藏所述第一网页指用户在浏览第一网页时,对该第一网页进行收藏,该收藏行为可以是基于浏览器,将该第一网页收藏在浏览器的收藏夹中, 也可以是基于站点,将该第一网页收藏在其所属站点的收藏夹中,还可以是基于网络收藏夹,将该第一网页收藏在专门的网络收藏夹中,以便在任何可以访问该网络收藏夹的地方访问该第一网页。社区网络中发布所述第一网页指社区网络用户在社区网络中发布该第一网页,该发布行为包括用户转帖、用户分享等将该第一网页的URL呈现在该社区网络中的行为。其他网页转载所述第一网页的内容指其他网页对该第一网页的内容进行全文转载, 根据各网页的产生时间判断原创网页和转载网页,产生时间最早的网页被视为原创网页。本领域技术人员应能理解上述扩展推荐事件仅为举例,其他现有的或今后可能出现的扩展推荐事件的如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。更优选地,所述扩展推荐事件包括即时通信消息中推荐所述第一网页;其中,所述事件相关信息包括所述即时通信消息的推荐用户在所述即时通信消息所属即时通信系统中的等级。具体地,当扩展推荐事件包括即时通信消息中推荐该第一网页时,确定装置13 根据该即时通信消息的推荐用户在该即时通信消息所属即时通信系统中的等级,来确定该第一网页的第一权威值。例如,当用户在与其他用户进行即时通信时,该用户在其发送的即时通信消息中包括该第一网页,此时即视为发生第一网页的扩展推荐事件,根据该用户在该即时通信系统中的等级,如2级,确定该第一网页的第一权威值为2。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。在此,需要说明的是,举例中的各项数值作为说明作用的示例,仅供理解本发明, 不作为实际应用时的真实数据。如无特别说明,本文中其他地方出现的数值的功用与此处相同,为简明起见,不再赘述、更优选地,所述扩展推荐事件还包括用户收藏所述第一网页;其中,所述事件相关信息包括用户收藏方式。具体地,当扩展推荐事件包括用户收藏该第一网页时,确定装置13 根据用户收藏方式,确定该第一网页的第一权威值。例如,将用户收藏方式分别浏览器收藏、站点收藏和网络收藏夹收藏,其分别对应的第一权威值为1、2、3 ;当用户在浏览器中收藏该第一网页时,确定装置13确定该第一网页的第一权威值为1 ;当用户在第一网页所属的站点中收藏该第一网页时,确定装置13确定该第一网页的第一权威值为2 ;当用户在网络收藏夹中收藏该第一网页时,确定装置13确定该第一网页的第一权威值为3。本领域技术人员应能理解上述用户收藏方式以及确定第一权威值的方式仅为举例,其他现有的或今后可能出现的用户收藏方式或者确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。更优选地,所述扩展推荐事件还包括社区网络中发布所述第一网页;其中,所述事件相关信息包括所述第一网页所在发布信息的等级信息。具体地,当扩展推荐事件包括社区网络中发布该第一网页时,确定装置13根据该第一网页所在的发布信息的等级信息,诸如发布用户在该社区网络中的等级、好友数等,确定该第一网页的第一权威值。在此,所述发布信息包括但不限于日志、转帖、分享等形式。例如,用户在社区网络的转帖中包括第一网页的URL,确定装置13根据该发布用户在该社区网络中的等级,如3级,确定该第一网页的第一权威值为3。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,所述等级信息包括但不限于,以下至少任一项1)所述发布信息的发布用户在该社区网络中的等级;2)所述发布信息的发布用户在该社区网络中的好友数;3)所述发布信息在该社区网络中的分享次数;4)所述发布信息在该社区网络中的被阅读数;5)所述发布信息在该社区网络中的回复数。
具体地,发布信息的发布用户在该社区网络中的等级指该发布用户在该社区网络中的用户等级,该等级表明该用户使用该社区网络的时间和/或参与度,例如该用户使用该社区网络的时间越久,等级就越高,相应地,该用户发布的第一网页的第一权威值也越高。发布信息的发布用户在该社区网络中的好友数表明该发布用户在该社区网络中的活跃程度和一定的信誉程度,例如好友数越多,相应的该用户的发布的第一网页的第一权威值也越高。发布信息在该社区网络中的分享次数指该发布信息在该社区网络中被其他用户分享的次数,该分享次数越多,相应的该发布信息中包括的第一网页的第一权威值也越高。发布信息在该社区网络中的被阅读数指该发布信息在该社区网络中被其他用户阅读的次数, 该被阅读数越高,相应的该发布信息中包括的第一网页的第一权威值也越高。发布信息在该社区网络中的回复数指该发布信息在该社区网络中被其他用户回复的次数,该回复数越高,相应的该发布信息中包括的第一网页的第一权威值也越高。本领域技术应能理解上述每项等级信息不仅可以单独确定第一网页的第一权威值,还可以相互结合后用以加权确定第一网页的第一权威值。本领域技术人员还应能理解上述等级信息仅为举例,其他现有的或今后可能出现的等级信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。更优选地,所述扩展推荐事件还包括其他网页转载所述第一网页的内容;其中, 所述事件相关信息包括所述其他网页的网络属性。具体地,当扩展推荐事件包括其他网页转载该第一网页的内容时,确定装置13根据该转载网页的网络属性,诸如转载网页的权威值、转载网页与该第一网页的相关度等,确定该第一网页的第一权威值。例如,其他网页转载该第一网页的内容,该转载网页的网络属性包括该转载网页的权威值为4,该转载网页与该第一网页的相关度为7,分别对应权重为0. 4和0. 6,据此,确定装置13确定该第一网页的第一权威值=4*0. 4+7*0. 6 = 5. 8。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明, 也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,所述网络属性包括但不限于,以下至少任一项-所述其他网页的权威值;-所述其他网页与所述第一网页的相关度;-所述其他网页的产生时间。具体地,其他网页的权威值可以从搜索引擎服务器的索引信息库中获取,该其他网页可视为第一网页的引用页面,可以将其权威值直接赋予第一网页的第一权威值。其他网页与该第一网页的相关度包括其他网页与该第一网页的内容相关度、其他网页与该第一网页是否属于同一站点、其他网页与该第一网页是否属于同类型站点等,该相关度越高,相应的该第一网页的第一权威值也越高。其他网页的产生时间越晚,表明该第一网页的内容越活跃,相应的该第一网页的第一权威值也越高。本领域技术应能理解上述每项网络属性不仅可以单独确定第一网页的第一权威值,还可以相互结合后用以加权确定第一网页的第一权威值。本领域技术人员还应能理解上述网络属性仅为举例,其他现有的或今后可能出现的网络属性如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。需要说明的是,上述第一网页的扩展推荐事件不是互相排斥的,而是可以共同出现的,例如,第一网页既可以在即时通信消息中被推荐,也可以同时被发布在社区网络中, 还可以同时被其他网页转载其内容。根据不同的扩展推荐事件赋予不同的权重,加权确定相应的第一网页的第一权威值。例如,即时通信消息中推荐第一网页的权重为0. 1,用户收藏第一网页的权重为0. 2,社区网络中发布第一网页的权重为0. 3,其他网页转载第一网页的内容的权重为0.4,假设当上述扩展推荐事件同时发生时,相应的权威值分别为3、4、5、 6,据此得出第一网页的第一权威值=0. 1*3+0. 2*4+0. 3*5+0. 4*6 = 5。
在一个优选实施例中(参照图1),更新设备1还包括权重确定装置(未示出), 该权重确定装置根据所述扩展推荐事件,确定所述第一权威值相对所述当前权威值的参考权重;随后,更新装置14还根据所述第一权威值,并结合所述参考权重,更新所述当前权威值。具体地,权重确定装置根据不同的扩展推荐事件,确定相应的第一网页第一权威值相对该第一网页当前权威值的参考权重;随后,更新装置14还根据该第一权威值,并结合该参考权重,更新该第一网页的当前权威值。例如,权重确定装置根据不同的扩展推荐事件, 确定相应的第一网页第一权威值相对该第一网页当前权威值的参考权重,如即时通信消息中推荐第一网页对应的第一权威值相对当前权威值的参考权重为0. 1,用户收藏第一网页对应的第一权威值相对当前权威值的参考权重为0. 2,社区网络中发布第一网页对应的第一权威值相对当前权威值的参考权重为0. 3,其他网页转载第一网页的内容对应的第一权威值相对当前权威值的参考权重为0.4,如果只有一个扩展推荐事件,如用户收藏第一网页,则权重确定装置确定参考权重为0. 2 ;如果有多个扩展推荐事件,如即时通信消息中推荐第一网页、用户收藏第一网页和社区网络中发布第一网页,相应的参考权重分别为0. 1、 0. 2和0. 3,对这些权重取均值,权重确定装置得到第一网页的第一权威值的参考权重= (0. 1+0. 2+0. 3)/3 = 0. 2 ;随后,更新装置14还根据该第一网页的第一权威值及其参考权重,更新该第一网页的当前权威值。本领域技术人员还应能理解上述确定参考权重的方式仅为举例,其他现有的或今后可能出现的确定参考权重的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在另一个优选实施例中(参照图1),更新设备1还包括映射装置(未示出),该映射装置将所述扩展推荐事件映射为所述第一网页的虚拟导入链接;将所述第一权威值映射为所述虚拟导入链接的传导权威值;随后,更新装置14还根据所述传导权威值,结合所述第一网页的其他导入链接的传导权威值,执行网页排序算法,以更新所述当前权威值。具体地,映射装置将每次扩展推荐事件映射为第一网页的一个虚拟导入链接,将该第一网页对应于该扩展推荐事件的第一权威值映射为该虚拟导入链接的传导权威值;随后,更新装置 14还根据该传导权威值,结合该第一网页的其他导入链接的传导权威值,执行网页排序算法,诸如pagerank算法、HITS算法、信任指数算法(TrustRank)等,以更新该第一网页的当前权威值。例如,假设扩展推荐事件为即时通信消息中推荐第一网页,映射装置将该扩展推荐事件映射为该第一网页的一个虚拟导入链接,并将该第一网页对应于该扩展推荐事件的第一权威值映射为该虚拟导入链接的传导权威值,更新装置14根据该传导权威值,结合该第一网页基于页面链接关系的其他导入链接的传导权威值,执行pagerank算法,以更新该第一网页的当前权威值。本领域技术人员还应能理解上述网页排序算法以及更新当前权威值的方式仅为举例,其他现有的或今后可能出现的网页排序算法或者更新当前权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。10
图2为根据本发明另一个方面的方法流程图,示出用于基于扩展推荐事件更新网页权威值的过程。具体地,在步骤Sl中,更新设备1获取权威值待更新的第一网页;随后, 在步骤S2中,更新设备1获取所述第一网页的扩展推荐事件;接着,在步骤S3中,更新设备 1根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;随后,在步骤 S4中,更新设备1根据所述第一权威值,更新所述第一网页的当前权威值。在此,更新设备 1包括但不限于搜索引擎服务器或者与之相连的专用服务器。
更具体地,在步骤Sl中,更新设备1获取权威值待更新的第一网页。具体地,在步骤Sl中,更新设备1从诸如搜索引擎服务器、与之相连的其他设备或者可经由网络访问的第三方服务器,获取权威值待更新的第一网页。例如,在步骤Sl中,更新设备1根据搜索引擎服务器提供的应用程序接口(API),向其发送获取权威值待更新的第一网页的请求,接收该搜索引擎服务器基于该请求返回的权威值待更新的第一网页。本领域技术人员应能理解上述获取第一网页的方式仅为举例,其他现有的或今后可能出现的获取第一网页的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,在步骤S2中,更新设备1获取所述第一网页的扩展推荐事件。具体地,在步骤S2中,更新设备1根据其在步骤Sl中获取的权威值待更新的第一网页,获取该第一网页的扩展推荐事件,如即时通信消息中推荐该第一网页,或者用户收藏该第一网页等。例如, 在步骤Sl中,更新设备1获取权威值待更新的第一网页;在步骤S2中,更新设备1根据该第一网页,按照约定的通信方式,如Http、Https等通信协议,定期向即时通信服务器发送获取该第一网页的扩展推荐事件的请求,接收该即时通讯服务器返回的扩展推荐事件。又如, 用户收藏第一网页,该第一网页相应的网站服务器通过其应用程序接口(API),将该扩展推荐事件推送至更新设备1,相应地,更新设备1接收该扩展推荐事件。本领域技术人员应能理解上述获取扩展推荐事件的方式仅为举例,其他现有的或今后可能出现的获取扩展推荐事件的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,在步骤S3中,更新设备1根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值。具体地,在步骤S2中,更新设备1获取第一网页的扩展推荐事件, 在步骤S3中,更新设备1根据这(些)扩展推荐事件的相关信息,诸如即时通讯消息的推荐用户的等级、社区网络中发布用户的等级等,确定该第一网页的第一权威值。例如,更新设备1根据其在步骤S2中获取的扩展推荐事件为用户在即时通信消息中推荐该第一网页, 在步骤S3中,根据该扩展推荐事件的相关信息,如该推荐用户在该即时通信消息所属即时通信系统中的等级为2级,确定该第一网页的第一权威值为2。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,在步骤S4中,更新设备1根据所述第一权威值,更新所述第一网页的当前权威值。具体地,在步骤S4中,更新设备1根据其在步骤S3中确定的第一网页的第一权威值, 更新该第一网页的当前权威值。例如,对不同的扩展推荐事件赋予不同的权重,各扩展推荐事件对应的权威值加权后得到该第一网页的第一权威值,将该第一权威值与第一网页的当前权威值相累加,以更新该第一网页的当前权威值。在此,每次扩展推荐事件不但可以对应一个第一权威值,作为第一网页的权威值参考量以更新该第一网页的当前权威值;还可以被视为一次对该第一网页的引用,也即可以作为一个第一网页的虚拟导入页面,从而将该第一权威值作为该第一网页的导入链接的传导权威值,纳入现有的各种基于页面链接关系的网页排序算法,如pagerank、HITS等算法,以更精确的计算该第一网页的权威度。本领域技术人员应能理解上述更新当前权威值的方式仅为举例,其他现有的或今后可能出现的更新当前权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,步骤Si、步骤S2、步骤S3和步骤S4是持续不断工作的。具体地,在步骤 Sl中,更新设备1获取权威值待更新的第一网页;随后,在步骤S2中,更新设备1获取所述第一网页的扩展推荐事件;接着,在步骤S3中,更新设备1根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;随后,在步骤S4中,更新设备1根据所述第一权威值,更新所述第一网页的当前权威值。在此,本领域技术人员应理解“持续”是指更新设备1在步骤Si、步骤S2、步骤S3和步骤S4分别按照设定的或实时调整的工作模式要求进行第一网页的获取、扩展推荐事件的获取、第一权威值的确定及当前权威值的更新,直至更新设备1在较长时间内停止获取第一网页的扩展推荐事件。
优选地,所述扩展推荐事件包括但不限于,以下至少任一项
1)即时通信消息中推荐所述第一网页;
2)用户收藏所述第一网页;
3)社区网络中发布所述第一网页;
4)其他网页转载所述第一网页的内容。
具体地,即时通信消息中推荐所述第一网页指即时通信用户在与其他即时通信用户的即时通信消息中包括该第一网页的URL,在即时通信消息中包括该第一网页的行为即为该即时通信用户的推荐行为。用户收藏所述第一网页指用户在浏览第一网页时,对该第一网页进行收藏,该收藏行为可以是基于浏览器,将该第一网页收藏在浏览器的收藏夹中, 也可以是基于站点,将该第一网页收藏在其所属站点的收藏夹中,还可以是基于网络收藏夹,将该第一网页收藏在专门的网络收藏夹中,以便在任何可以访问该网络收藏夹的地方访问该第一网页。社区网络中发布所述第一网页指社区网络用户在社区网络中发布该第一网页,该发布行为包括用户转帖、用户分享等将该第一网页的URL呈现在该社区网络中的行为。其他网页转载所述第一网页的内容指其他网页对该第一网页的内容进行全文转载, 根据各网页的产生时间判断原创网页和转载网页,产生时间最早的网页被视为原创网页。 本领域技术人员应能理解上述扩展推荐事件仅为举例,其他现有的或今后可能出现的扩展推荐事件的如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,所述扩展推荐事件包括即时通信消息中推荐所述第一网页;其中,所述事件相关信息包括所述即时通信消息的推荐用户在所述即时通信消息所属即时通信系统中的等级。具体地,当扩展推荐事件包括即时通信消息中推荐该第一网页时,在步骤S3中, 更新设备1根据该即时通信消息的推荐用户在该即时通信消息所属即时通信系统中的等级,来确定该第一网页的第一权威值。例如,当用户在与其他用户进行即时通信时,该用户在其发送的即时通信消息中包括该第一网页,此时即视为发生第一网页的扩展推荐事件, 根据该用户在该即时通信系统中的等级,如2级,更新设备1确定该第一网页的第一权威值为2。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,需要说明的是,举例中的各项数值作为说明作用的示例,仅供理解本发明, 不作为实际应用时的真实数据。如无特别说明,本文中其他地方出现的数值的功用与此处相同,为简明起见,不再赘述、
更优选地,所述扩展推荐事件还包括用户收藏所述第一网页;其中,所述事件相关信息包括用户收藏方式。具体地,当扩展推荐事件包括用户收藏该第一网页时,在步骤S3 中,更新设备1根据用户收藏方式,确定该第一网页的第一权威值。例如,将用户收藏方式分别浏览器收藏、站点收藏和网络收藏夹收藏,其分别对应的第一权威值为1、2、3 ;当用户在浏览器中收藏该第一网页时,更新设备1确定该第一网页的第一权威值为1 ;当用户在第一网页所属的站点中收藏该第一网页时,更新设备1确定该第一网页的第一权威值为2 ;当用户在网络收藏夹中收藏该第一网页时,更新设备1确定该第一网页的第一权威值为3。本领域技术人员应能理解上述用户收藏方式以及确定第一权威值的方式仅为举例,其他现有的或今后可能出现的用户收藏方式或者确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,所述扩展推荐事件还包括社区网络中发布所述第一网页;其中,所述事件相关信息包括所述第一网页所在发布信息的等级信息。具体地,当扩展推荐事件包括社区网络中发布该第一网页时,在步骤S3中,更新设备1根据该第一网页所在的发布信息的等级信息,诸如发布用户在该社区网络中的等级、好友数等,确定该第一网页的第一权威值。在此,所述发布信息包括但不限于日志、转帖、分享等形式。例如,用户在社区网络的转帖中包括第一网页的URL,更新设备1根据该发布用户在该社区网络中的等级,如3级,确定该第一网页的第一权威值为3。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述等级信息包括但不限于,以下至少任一项
1)所述发布信息的发布用户在该社区网络中的等级;
2)所述发布信息的发布用户在该社区网络中的好友数;
3)所述发布信息在该社区网络中的分享次数;
4)所述发布信息在该社区网络中的被阅读数;
5)所述发布信息在该社区网络中的回复数。
具体地,发布信息的发布用户在该社区网络中的等级指该发布用户在该社区网络中的用户等级,该等级表明该用户使用该社区网络的时间和/或参与度,例如该用户使用该社区网络的时间越久,等级就越高,相应地,该用户发布的第一网页的第一权威值也越高。发布信息的发布用户在该社区网络中的好友数表明该发布用户在该社区网络中的活跃程度和一定的信誉程度,例如好友数越多,相应的该用户的发布的第一网页的第一权威值也越高。发布信息在该社区网络中的分享次数指该发布信息在该社区网络中被其他用户分享的次数,该分享次数越多,相应的该发布信息中包括的第一网页的第一权威值也越高。发布信息在该社区网络中的被阅读数指该发布信息在该社区网络中被其他用户阅读的次数, 该被阅读数越高,相应的该发布信息中包括的第一网页的第一权威值也越高。发布信息在该社区网络中的回复数指该发布信息在该社区网络中被其他用户回复的次数,该回复数越高,相应的该发布信息中包括的第一网页的第一权威值也越高。本领域技术应能理解上述每项等级信息不仅可以单独确定第一网页的第一权威值,还可以相互结合后用以加权确定第一网页的第一权威值。本领域技术人员还应能理解上述等级信息仅为举例,其他现有的或今后可能出现的等级信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,所述扩展推荐事件还包括其他网页转载所述第一网页的内容;其中,所述事件相关信息包括所述其他网页的网络属性。具体地,当扩展推荐事件包括其他网页转载该第一网页的内容时,在步骤S3中,更新设备1根据该转载网页的网络属性,诸如转载网页的权威值、转载网页与该第一网页的相关度等,确定该第一网页的第一权威值。例如,其他网页转载该第一网页的内容,该转载网页的网络属性包括该转载网页的权威值为4,该转载网页与该第一网页的相关度为7,分别对应权重为0. 4和0. 6,据此,更新设备1确定该第一网页的第一权威值=4*0. 4+7*0. 6 = 5. 8。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述网络属性包括但不限于,以下至少任一项
-所述其他网页的权威值;
-所述其他网页与所述第一网页的相关度;
-所述其他网页的产生时间。
具体地,其他网页的权威值可以从搜索引擎服务器的索引信息库中获取,该其他网页可视为第一网页的引用页面,可以将其权威值直接赋予第一网页的第一权威值。其他网页与该第一网页的相关度包括其他网页与该第一网页的内容相关度、其他网页与该第一网页是否属于同一站点、其他网页与该第一网页是否属于同类型站点等,该相关度越高,相应的该第一网页的第一权威值也越高。其他网页的产生时间越晚,表明该第一网页的内容越活跃,相应的该第一网页的第一权威值也越高。本领域技术应能理解上述每项网络属性不仅可以单独确定第一网页的第一权威值,还可以相互结合后用以加权确定第一网页的第一权威值。本领域技术人员还应能理解上述网络属性仅为举例,其他现有的或今后可能出现的网络属性如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,上述第一网页的扩展推荐事件不是互相排斥的,而是可以共同出现的,例如,第一网页既可以在即时通信消息中被推荐,也可以同时被发布在社区网络中, 还可以同时被其他网页转载其内容。根据不同的扩展推荐事件赋予不同的权重,加权确定相应的第一网页的第一权威值。例如,即时通信消息中推荐第一网页的权重为0. 1,用户收藏第一网页的权重为0. 2,社区网络中发布第一网页的权重为0. 3,其他网页转载第一网页的内容的权重为0.4,假设当上述扩展推荐事件同时发生时,相应的权威值分别为3、4、5、 6,据此得出第一网页的第一权威值=0. 1*3+0. 2*4+0. 3*5+0. 4*6 = 5。
在一个优选实施例中(参照图1),该过程还包括步骤S5 (未示出),在步骤S5中, 更新设备1根据所述扩展推荐事件,确定所述第一权威值相对所述当前权威值的参考权重;随后,在步骤S4中,更新设备1还根据所述第一权威值,并结合所述参考权重,更新所述当前权威值。具体地,在步骤S5中,更新设备1根据不同的扩展推荐事件,确定相应的第一网页第一权威值相对该第一网页当前权威值的参考权重;随后,在步骤S4中,更新设备1 还根据该第一权威值,并结合该参考权重,更新该第一网页的当前权威值。例如,更新设备 1根据不同的扩展推荐事件,确定相应的第一网页第一权威值相对该第一网页当前权威值的参考权重,如即时通信消息中推荐第一网页对应的第一权威值相对当前权威值的参考权重为0. 1,用户收藏第一网页对应的第一权威值相对当前权威值的参考权重为0. 2,社区网络中发布第一网页对应的第一权威值相对当前权威值的参考权重为0. 3,其他网页转载第一网页的内容对应的第一权威值相对当前权威值的参考权重为0. 4,如果只有一个扩展推荐事件,如用户收藏第一网页,则更新设备1确定参考权重为0. 2 ;如果有多个扩展推荐事件,如即时通信消息中推荐第一网页、用户收藏第一网页和社区网络中发布第一网页,相应的参考权重分别为0. 1,0. 2和0. 3,对这些权重取均值,更新设备1得到第一网页的第一权威值的参考权重=(0. 1+0. 2+0. 3)/3 = 0. 2 ;随后,更新设备1还根据该第一网页的第一权威值及其参考权重,更新该第一网页的当前权威值。本领域技术人员还应能理解上述确定参考权重的方式仅为举例,其他现有的或今后可能出现的确定参考权重的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在另一个优选实施例中(参照图1),该过程还包括步骤S6(未示出),在步骤S6 中,更新设备1将所述扩展推荐事件映射为所述第一网页的虚拟导入链接;将所述第一权威值映射为所述虚拟导入链接的传导权威值;随后,在步骤S4中,更新设备1还根据所述传导权威值,结合所述第一网页的其他导入链接的传导权威值,执行网页排序算法,以更新所述当前权威值。具体地,在步骤S6中,更新设备1将每次扩展推荐事件映射为第一网页的一个虚拟导入链接,将该第一网页对应于该扩展推荐事件的第一权威值映射为该虚拟导入链接的传导权威值;随后,在步骤S4中,更新设备1还根据该传导权威值,结合该第一网页的其他导入链接的传导权威值,执行网页排序算法,诸如pagerank算法、HITS算法、信任指数算法(TrustRank)等,以更新该第一网页的当前权威值。例如,假设扩展推荐事件为即时通信消息中推荐第一网页,更新设备1将该扩展推荐事件映射为该第一网页的一个虚拟导入链接,并将该第一网页对应于该扩展推荐事件的第一权威值映射为该虚拟导入链接的传导权威值,更新设备1根据该传导权威值,结合该第一网页基于页面链接关系的其他导入链接的传导权威值,执行pagerank算法,以更新该第一网页的当前权威值。本领域技术人员还应能理解上述网页排序算法以及更新当前权威值的方式仅为举例,其他现有的或今后可能出现的网页排序算法或者更新当前权威值的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
权利要求
1.一种由计算机实现的用于基于扩展推荐事件更新网页权威值的方法,其中,该方法包括以下步骤a获取权威值待更新的第一网页; b获取所述第一网页的扩展推荐事件;c根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值; d根据所述第一权威值,更新所述第一网页的当前权威值。
2.根据权利要求1所述的方法,其中,所述扩展推荐事件包括以下至少任一项 -即时通信消息中推荐所述第一网页;-用户收藏所述第一网页; -社区网络中发布所述第一网页; -其他网页转载所述第一网页的内容。
3.根据权利要求2所述的方法,其中,所述扩展推荐事件包括即时通信消息中推荐所述第一网页;其中,所述事件相关信息包括所述即时通信消息的推荐用户在所述即时通信消息所属即时通信系统中的等级。
4.根据权利要求2或3所述的方法,其中,所述扩展推荐事件还包括用户收藏所述第一网页;其中,所述事件相关信息包括用户收藏方式。
5.根据权利要求2至4中任一项所述的方法,其中,所述扩展推荐事件还包括社区网络中发布所述第一网页;其中,所述事件相关信息包括所述第一网页所在发布信息的等级信息。
6.根据权利要求5所述的方法,其中,所述等级信息包括以下至少任一项 -所述发布信息的发布用户在该社区网络中的等级;-所述发布信息的发布用户在该社区网络中的好友数; -所述发布信息在该社区网络中的分享次数; -所述发布信息在该社区网络中的被阅读数; -所述发布信息在该社区网络中的回复数。
7.根据权利要求2至6中任一项所述的方法,其中,所述扩展推荐事件还包括其他网页转载所述第一网页的内容;其中,所述事件相关信息包括所述其他网页的网络属性。
8.根据权利要求7所述的方法,其中,所述网络属性包括以下至少任一项 -所述其他网页的权威值;-所述其他网页与所述第一网页的相关度; -所述其他网页的产生时间。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括-根据所述扩展推荐事件,确定所述第一权威值相对所述当前权威值的参考权重; 其中,所述步骤d还包括-根据所述第一权威值,并结合所述参考权重,更新所述当前权威值。
10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括-将所述扩展推荐事件映射为所述第一网页的虚拟导入链接; -将所述第一权威值映射为所述虚拟导入链接的传导权威值; 其中,所述步骤d还包括-根据所述传导权威值,结合所述第一网页的其他导入链接的传导权威值,执行网页排序算法,以更新所述当前权威值。
11.一种用于基于扩展推荐事件更新网页权威值的设备,其中,该设备包括 第一获取装置,用于获取权威值待更新的第一网页;第二获取装置,用于获取所述第一网页的扩展推荐事件;确定装置,用于根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;更新装置,用于根据所述第一权威值,更新所述第一网页的当前权威值。
12.根据权利要求11所述的设备,其中,所述扩展推荐事件包括以下至少任一项 -即时通信消息中推荐所述第一网页;-用户收藏所述第一网页; -社区网络中发布所述第一网页; -其他网页转载所述第一网页的内容。
13.根据权利要求12所述的设备,其中,所述扩展推荐事件包括即时通信消息中推荐所述第一网页;其中,所述事件相关信息包括所述即时通信消息的推荐用户在所述即时通信消息所属即时通信系统中的等级。
14.根据权利要求12或13所述的设备,其中,所述扩展推荐事件还包括用户收藏所述第一网页;其中,所述事件相关信息包括用户收藏方式。
15.根据权利要求12至14中任一项所述的设备,其中,所述扩展推荐事件还包括社区网络中发布所述第一网页;其中,所述事件相关信息包括所述第一网页所在发布信息的等级信息。
16.根据权利要求15所述的设备,其中,所述等级信息包括以下至少任一项 -所述发布信息的发布用户在该社区网络中的等级;-所述发布信息的发布用户在该社区网络中的好友数; -所述发布信息在该社区网络中的分享次数; -所述发布信息在该社区网络中的被阅读数; -所述发布信息在该社区网络中的回复数。
17.根据权利要求12至16中任一项所述的设备,其中,所述扩展推荐事件还包括其他网页转载所述第一网页的内容;其中,所述事件相关信息包括所述其他网页的网络属性。
18.根据权利要求17所述的设备,其中,所述网络属性包括以下至少任一项 -所述其他网页的权威值;-所述其他网页与所述第一网页的相关度; -所述其他网页的产生时间。
19.根据权利要求11至18中任一项所述的设备,其中,该设备还包括权重确定装置,所述权重确定装置用于-根据所述扩展推荐事件,确定所述第一权威值相对所述当前权威值的参考权重; 其中,所述更新装置还用于-根据所述第一权威值,并结合所述参考权重,更新所述当前权威值。
20.根据权利要求12至19中任一项所述的设备,其中,该设备还包括映射装置,所述映射装置用于-将所述扩展推荐事件映射为所述第一网页的虚拟导入链接; -将所述第一权威值映射为所述虚拟导入链接的传导权威值; 其中,所述更新装置还用于-根据所述传导权威值,结合所述第一网页的其他导入链接的传导权威值,执行网页排序算法,以更新所述当前权威值。
全文摘要
本发明的目的是提供一种用于基于扩展推荐事件更新网页权威值的方法与设备。其中,更新设备获取权威值待更新的第一网页;获取所述第一网页的扩展推荐事件;根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;根据所述第一权威值,更新所述第一网页的当前权威值。与现有技术相比,本发明基于扩展推荐事件更新网页权威值,将扩展推荐事件纳入到网页排序算法中,使得网页权威值的参考因素更为全面,从而使得网页权威值计算更为准确,提高了搜索引擎的准确率和召回率,以及搜索结果的排序质量,同时提升了用户的使用体验。
文档编号G06F17/30GK102541947SQ201010620019
公开日2012年7月4日 申请日期2010年12月31日 优先权日2010年12月31日
发明者姚旭, 杨宣 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1