一种确定站点文档的连载状态信息的方法与设备的制作方法

文档序号:6432086阅读:212来源:国知局
专利名称:一种确定站点文档的连载状态信息的方法与设备的制作方法
技术领域
本发明涉及网络搜索技术领域,尤其涉及一种用于确定站点文档的连载状态信息的技术。
背景技术
随着网络应用的普及,越来越多的网络文档通过连载的方式呈现给用户,如连载的网络小说和技术专栏等。相应地,同一份网络文档可能被多个网络站点以不同进度所转载;一般,文档访问用户相对连载中的网络文档,更倾向访问已完结的网络文档。然而,现有技术中,各网络站点对于其站点上连载的网络文档的连载状态的标识可能存在错误,例如,有些网络站点为提高站点访问量将连载中的网络小说标记为“全本”。 显然,这样的情况会误导用户对网络文档的访问,从而降低了用户的使用体验。因此,如何更准确地确定网络文档的连载状态,以提高用户的文档访问效率,并提升用户的使用体验,成为本领域技术人员亟需解决的一个问题。

发明内容
本发明的目的是提供一种用于确定站点文档的连载状态信息的方法与设备。根据本发明的一个方面,提供了一种由计算机实现的用于确定站点文档的连载状态信息的方法,其中,该方法包括a获取对应于同一个目标文档的一个或多个站点文档;b获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数;c根据所述资源相关信息,确定所述目标文档的文档最大章节数;d根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。根据本发明的另一方面,还提供了一种用于确定站点文档的连载状态信息的状态确定设备,其中,该设备包括文档获取装置,用于获取对应于同一个目标文档的一个或多个站点文档;信息获取装置,用于获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数;章节数确定装置,用于根据所述资源相关信息,确定所述目标文档的文档最大章节数;状态确定装置,用于根据所述一个或多个站点文档中至少一个的资源相关信息, 以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。与现有技术相比,本发明通过根据对应于同一个目标文档的一个或多个站点文档的资源相关信息确定目标文档的文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息,从而提高了用户的文档访问效率,并提升了用户的使用体验。进一步地,本发明还可以根据所确定的站点文档的连载状态信息,将搜索引擎所获得的搜索结果展现给用户,以提升用户的搜索使用体验。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图1示出根据本发明一个方面的用于确定站点文档的连载状态信息的设备示意图;图2示出根据本发明一个优选实施例的用于确定站点文档的连载状态信息的设备示意图;图3示出根据本发明另一个优选实施例的用于确定站点文档的连载状态信息的设备示意图;图4示出根据本发明另一个方面的用于确定站点文档的连载状态信息的方法流程图;图5示出根据本发明一个优选实施例的用于确定站点文档的连载状态信息的方法流程图;图6示出根据本发明另一个优选实施例的用于确定站点文档的连载状态信息的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示出根据本发明一个方面的用于确定站点文档的连载状态信息的设备示意图;状态确定设备1包括文档获取装置101、信息获取装置102、章节数确定装置103和状态确定装置104。状态确定设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述状态确定设备仅为举例,其他现有的或今后可能出现的状态确定设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。其中,文档获取装置101获取对应于同一个目标文档的一个或多个站点文档。具体地,文档获取装置101根据目标文档的文档名称、作者名称或文档内容标记等可用于标识文档的信息,通过在搜索引擎或者文档库中进行匹配查询,以获得与该目标文档相对应的一个或多个站点文档。例如,假设目标文档为“明朝那些事儿”,文档获取装置101根据该目标文档的文档名称“明朝那些事儿”或作者名称“当年明月”,在搜索引擎或文档库中进行匹配查询,以获得与该目标文档“明朝那些事儿”相对应的多个站点文档“明朝那些事儿一**在线书库”、“明朝那些事儿连载读书**网”等。在此,文档库中存储有大量站点文档及所述站点文档的文档名称、作者名称或文档内容标记等可用于标识文档的信息,该文档库既可以位于状态确定设备1中,也可以位于与该状态确定设备1通过网络相连接的第三方设备中。本领域技术人员应能理解上述获取站点文档的方式仅为举例,其他现有的或今后可能出现的获取站点文档的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。信息获取装置102获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数。具体地,对于文档获取装置101所获取的一个或多个站点文档中的每一个站点文档,信息获取装置102通过对该站点文档的页面分析或文档分析,分别获取该站点文档的连载标记信息与资源最大章节数,以作为所述站点文档的资源相关信息。在此,连载标记信息例如可以是在站点文档中所标识出的该站点文档的连载情况,如已完结的站点文档的连载标记信息可以为“全本标记”、未完结的站点文档的连载标记信息可以为“连载标记”等;资源最大章节数例如可以是站点文档中所有章节的数量、有效章节的数量等。接上例,文档获取装置101获取与目标文档“明朝那些事儿”相对应的多个站点文档“明朝那些事儿——**在线书库”、“明朝那些事儿连载读书 **网”;信息获取装置102通过对这多个站点文档进行页面分析或文档分析,分别获取到站点文档“明朝那些事儿——**在线书库”的连载标记信息为“全本标记”,资源最大章节数为150章,站点文档“明朝那些事儿连载读书**网”的连载标记信息为“连载标记”,资源最大章节数为100章。本领域技术人员应能理解上述获取站点文档的资源相关信息的方式仅为举例,其他现有的或今后可能出现的获取站点文档的资源相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解上述资源相关信息仅为举例,其他现有的或今后可能出现的资源相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。章节数确定装置103根据所述资源相关信息,确定所述目标文档的文档最大章节数。具体地,章节数确定装置103根据信息获取装置102所获取的一个或多个站点文档的资源相关信息,确定所述目标文档的文档最大章节数,如从这一个或多个站点文档的资源最大章节数中取最大值,将该最大值作为所述目标文档的文档最大章节数,或者从根据这些站点文档的连载标记信息将其分为两类,“全本标记”站点文档集合与“连载标记”站点文档集合,分别确定这两个集合中站点文档的资源最大章节数的最大值,再取这两个最大值中较大的为所述目标文档的文档最大章节数。接上例,信息获取装置102分别获取到站点文档“明朝那些事儿——**在线书库”的资源最大章节数为150章,站点文档“明朝那些事儿连载读书**网”的资源最大章节数为100章,其他对应于目标文档“明朝那些事儿”的站点文档的资源最大章节数都小于150章,则章节数确定装置103确定该目标文档“明朝那些事儿”的文档最大章节数为150章。状态确定装置104根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。具体地,对于所述一个或多个站点文档中至少一个站点文档,状态确定装置104确定该站点文档的连载状态信息的方式包括但不限于1)根据该站点文档的资源相关信息,以及所述文档最大章节数,确定该站点文档的连载状态信息,如当该站点文档的连载标记信息为“全本标记”,且该站点文档的资源最大章节数与文档最大章节数的比值超过第一章节比值阈值,确定该站点文档的连载状态信息为全本状态。优选地,若该比值低于所述第一章节比值阈值,则确定该站点文档的连载状态信息为连载状态。在此,所述第一章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以由大量的目标文档及其对应的站点文档的资源相关信息与连载状态信息来确定。2)首先根据所述一个或多个站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当根据所述目标文档的文档状态信息为全本状态, 根据该站点文档的资源相关信息,确定该站点文档的连载状态信息。3)首先根据所述一个或多个站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当所述目标文档的文档状态信息为连载状态,根据该站点文档的资源相关信息,以及所述文档最大章节数,确定该站点文档的连载状态信息。本领域技术人员应能理解上述确定站点文档的连载状态信息的方式仅为举例,其他现有的或今后可能出现的确定站点文档的连载状态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。与现有技术相比,本发明通过根据对应于同一个目标文档的一个或多个站点文档的资源相关信息确定目标文档的文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息,从而提高了用户的文档访问效率,并提升了用户的使用体验。进一步地,本发明还可以根据所确定的站点文档的连载状态信息,将搜索引擎所获得的搜索结果展现给用户,以提升用户的搜索使用体验。优选地,状态确定设备1的各个装置之间是持续不断地工作的。具体地,文档获取装置101持续获取对应于同一个目标文档的一个或多个站点文档;信息获取装置102持续获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数;章节数确定装置103持续根据所述资源相关信息,确定所述目标文档的文档最大章节数;状态确定装置104持续根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。在此,本领域技术人员应理解“持续”是指上述各个装置分别不断地进行站点文档的获取、资源相关信息的获取、文档最大章节数的确定及连载状态信息的确定,直至状态确定设备1在较长时间内停止获取对应于同一个目标文档的一个或多个站点文档。优选地,若根据信息获取装置102所获取的所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第一章节比值阈值,则所述状态确定装置104确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。例如,假设第一章节比值阈值为0. 9,信息获取装置102获取到对应于目标文档“明朝那些事儿”的其中一个站点文档“明朝那些事儿——**在线书库”,其连载标记信息为“全本标记”,且其资源最大章节数为150 章,而由章节数确定装置103所确定的文档最大章节数为150章,则状态确定装置104根据该站点文档的连载标记信息为“全本标记”,且该站点文档的资源最大章节数与文档最大章节数的比值1.0(150/150 = 1.0)超过第一章节比值阈值0.9,确定该站点文档“明朝那些事儿一**在线书库”的连载状态信息为全本状态。在此,所述第一章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以由大量的目标文档及其对应的站点文档的资源相关信息与连载状态信息来确定。
图2示出根据本发明一个优选实施例的用于确定站点文档的连载状态信息的设备示意图;其中,状态确定装置204还包括目标文档确定单元2041和站点文档确定单元 2042 ;其中,文档获取装置201、信息获取装置202和章节数确定装置203分别与图1所示对应装置相同或基本相同,故此处不再赘述,并通过弓I用的方式包含于此。其中,目标文档确定单元2041根据所述资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息。具体地,目标文档确定单元2041根据信息获取装置202所获取的一个或多个对应于同一个目标文档的站点文档的资源相关信息,结合由章节数确定装置203所确定的文档最大章节数,确定所述目标文档的文档状态信息。在此,目标文档确定单元2041确定所述目标文档的文档状态信息的方式包括但不限于1)若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第四章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。在此,全本标题模式包括但不限于最新章标题包含新书预告、完结、终结、后记、全书、全文、结局、结束、完本、尾声、番外、尾章、结尾、全一章、终章、最后章、外篇等关键词。在此,所述第四章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以根据大量的目标文档及其文档状态信息和与之对应的站点文档及其资源相关信息来确定。例如,假设第四章节比值阈值为0. 85,章节数确定装置203所确定的文档最大章节数为150章,若对应于目标文档“明朝那些事儿”的一个或多个站点文档中,存在一个站点文档“明朝那些事儿—— #在线书库”,其最新章标题包含关键词“后记”,且该站点文档的资源最大章节数为150 章,则目标文档确定单元2041根据该站点文档的资源最大章节数与文档最大章节数的比值1. 0 (150/150 = 1. 0)超过第四章节比值阈值0. 85,确定该目标文档“明朝那些事儿”的文档状态信息为全本状态。2)若所述一个或多个站点文档中全本站点文档的数量与所述一个或多个站点文档的总数量的比值超过第五全本站点比例阈值,其中,所述全本站点文档的连载标记信息为全本标记,则确定所述目标文档的文档状态信息为全本状态。具体地,目标文档确定单元 2041根据由信息获取装置202所获取的对应于同一个目标文档的所述一个或多个站点文档的连载标记信息,通过使用计数器等方式,计算出其中连载标记信息为“全本标记”的站点文档的数量,即全本站点文档的数量,同时也计算出这一个或多个站点文档的总数量,当全本站点文档的数量与该总数量的比值超过第五全本站点比例阈值,则目标文档确定单元 2041确定目标文档的文档状态信息为全本状态。在此,所述第五全本站点比例阈值可以是预先设置的全本站点文档的数量与站点文档的总数量的比值阈值,其可以根据大量的目标文档及其文档状态信息和与之对应的站点文档及其连载标记信息来确定。例如,假设第五全本站点比例阈值为0. 55,文档获取装置201获取到多个对应于目标文档“明朝那些事儿” 的站点文档,目标文档确定单元2041通过计数器,确定共有100个对应于目标文档“明朝那些事儿”的站点文档,且根据信息获取装置202所获取的资源相关信息,计算得到其中连载标记信息为全本标记的站点文档(即,全本站点文档)共有60个,则目标文档确定单元 2041根据全本站点文档的数量60与站点文档的总数量100的比值0. 6 (60/100 = 0. 6)超过第五全本站点比例阈值0. 55,确定该目标文档“明朝那些事儿”的文档状态信息为全本状态。
3)若所述全本站点文档的资源最大章节数中的最大值与所述文档最大章节数的比值超过第六章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。具体地,目标文档确定单元2041根据由信息获取装置202所获取的对应于同一个目标文档的一个或多个站点文档的资源相关信息,将资源相关信息中所包括的连载标记信息为“全本标记”的站点文档确定为全本站点文档,接着,根据所述全本站点文档的资源相关信息中所包括的资源最大章节数,从中取最大值,将该最大值与由章节数确定装置203所确定的文档最大章节数进行比较,当所述最大值与所述文档最大章节数的比值超过第六章节比值阈值,目标文档确定单元2041确定所述目标文档的文档状态信息为全本状态。在此,所述第六章节比值阈值可以是预先设置的资源最大章节数中的最大值与文档最大章节数的比值阈值,其可以根据大量的目标文档及其文档状态信息和与之对应的站点文档及其资源相关信息来确定。例如,假设第六章节比值阈值为0. 91,文档获取装置201获取到多个对应于目标文档“明朝那些事儿”的站点文档;信息获取装置202获取该多个站点文档的连载标记信息、 资源最大章节数等资源相关信息;目标文档确定单元2041根据所述站点文档的连载标记信息,将连载标记信息为“全本标记”的站点文档“明朝那些事儿——**在线书库”、“明朝那些事儿文化读书频道**网,,确定为全本站点文档,而全本站点文档“明朝那些事儿—— **在线书库”的资源最大章节数为150、全本站点文档“明朝那些事儿文化读书频道**网” 的资源最大章节数为130,则目标文档确定单元2041从中取出最大值150,而章节数确定装置203所确定的文档最大章节数为150,目标文档确定单元2041根据该最大值与文档最大章节数的比值1. 0(150/150 = 1. 0)超过第六章节比值阈值0. 91,确定所述目标文档“明朝那些事儿”的文档状态信息为全本状态。4)目标文档确定单元2041综合上述任意两种方法,或综合上述全部三种方法,确定所述目标文档的文档状态信息。以结合方法幻和方法幻为例,若所述一个或多个站点文档中全本站点文档的数量与所述一个或多个站点文档的总数量的比值超过第五全本站点比例阈值,其中,所述全本站点文档的连载标记信息为全本标记,且所述全本站点文档的资源最大章节数中的最大值与所述文档最大章节数的比值超过第六章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。本领域技术人员应能理解上述确定目标文档的文档状态信息的方式仅为举例,其他现有的或今后可能出现的确定目标文档的文档状态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。当所述目标文档的文档状态信息为全本状态,站点文档确定单元2042根据所述一个或多个站点文档中至少一个的资源相关信息,确定所述一个或多个站点文档中至少一个的连载状态信息。具体地,当由目标文档确定单元2041确定所述目标文档的文档状态信息为全本状态,站点文档确定单元2042确定所述一个或多个站点文档中至少一个的连载状态信息的方式包括但不限于1)当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式且资源最大章节数超过第二章节数阈值,则所述站点文档确定单元2042确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。具体地,当由目标文档确定单元2041确定所述目标文档的文档状态信息为全本状态, 站点文档确定单元2042通过分词匹配或语义分析等方式,确定所述一个或多个对应于目标文档的站点文档中,存在一个站点文档,其最新章标题包含新书预告、完结、终结、后记、 全书、全文、结局、结束、完本、尾声、番外、尾章、结尾、全一章、终章、最后章、外篇等关键词, 且该站点文档由信息获取装置202所获取的资源最大章节数超过第二章节数阈值,则所述站点文档确定单元2042确定该站点文档的连载状态信息为全本状态。在此,所述第二章节数阈值可以是预先设置的,其可以根据大量站点文档的最新章标题、资源最大章节数与连载状态信息的关系来确定。例如,假设第二章节数阈值为0,目标文档确定单元2041确定目标文档“明朝那些事儿”的文档状态信息为全本状态,对应于该目标文档的其中一个站点文档“明朝那些事儿——**在线书库”的最新章标题包含关键词“后记”,且信息获取装置202 获取该站点文档的资源最大章节数不为0,则所述站点文档确定单元2042确定该站点文档 “明朝那些事儿一**在线书库”的连载状态信息为全本状态。2)当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第三章节比值阈值,则所述站点文档确定单元2042 确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。具体地,当目标文档确定单元2041确定所述目标文档的文档状态信息为全本状态,对于所述一个或多个站点文档中的任一站点文档,若根据信息获取装置202所获取的该站点文档的连载标记信息为“全本标记”,且该站点文档的资源最大章节数与由章节数确定装置203所确定的文档最大章节数的比值超过第三章节比值阈值,则所述站点文档确定单元2042确定该站点文档的连载状态信息为全本状态。在此,所述第三章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以由大量的目标文档及其文档状态信息和站点文档及其资源相关信息与连载状态信息来确定。例如,假设第三章节比值阈值为0.9,目标文档确定单元2041确定目标文档“明朝那些事儿”的文档状态信息为全本状态,信息获取装置202获取到对应于目标文档“明朝那些事儿”的其中一个站点文档“明朝那些事儿—— #在线书库”的连载标记信息为全本标记,资源最大章节数为150章,而由章节数确定装置 203所确定的文档最大章节数为150章,则站点文档确定单元2042根据该站点文档的连载标记信息为全本标记,该站点文档的资源最大章节数与文档最大章节数的比值1(150/150 =1)超过第三章节比值阈值0.9,确定该站点文档“明朝那些事儿——**在线书库”的连载状态信息为全本状态。3)站点文档确定单元2042结合上述两种方式,确定所述一个或多个站点文档中至少一个的连载状态信息。当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式且资源最大章节数超过第二章节数阈值,且该站点文档的连载标记信息为全本标记,及其资源最大章节数与所述文档最大章节数的比值超过第三章节比值阈值,则所述站点文档确定单元2042确定该站点文档的连载状态信息为全本状态。本领域技术人员应能理解上述确定站点文档的连载状态信息的方式仅为举例,其他现有的或今后可能出现的确定站点文档的连载状态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明首先根据站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当根据所述目标文档的文档状态信息为全本状态,再根据所述一个或多个站点文档中至少一个的资源相关信息,确定所述一个或多个站点文档中至少一个的连载状态信息,进一步优化了确定站点文档的连载状态信息的方式,提高了站点文档的连载状态信息的准确率,从而提高了用户的文档访问效率,并提升了用户的使用体验。优选地,当所述目标文档的文档状态信息为连载状态,所述状态确定装置204还根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。具体地,当目标文档确定单元 2041确定所述目标文档的文档状态信息为连载状态,状态确定装置204还根据信息获取装置202所获取的与该目标文档相对应的所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且该站点文档的资源最大章节数与由章节数确定装置203所确定的文档最大章节数的比值超过第一章节比值阈值,则所述状态确定装置204确定该站点文档的连载状态信息为全本状态。例如,假设第一章节比值阈值为0.9,目标文档确定单元2041确定目标文档“明朝那些事儿”的文档状态信息为连载状态,信息获取装置202获取到对应于该目标文档的其中一个站点文档“明朝那些事儿——**在线书库”的连载标记信息为“全本标记”,资源最大章节数为150章,而由章节数确定装置203所确定的文档最大章节数为150 章,则状态确定装置204根据该站点文档的连载标记信息为“全本标记”,该站点文档的资源最大章节数与文档最大章节数的比值1.0(150/150 = 1.0)超过第一章节比值阈值0.9, 确定该站点文档“明朝那些事儿——**在线书库”的连载状态信息为全本状态。在此,本发明首先根据站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当所述目标文档的文档状态信息为连载状态,再根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息,进一步优化了确定站点文档的连载状态信息的方式,提高了站点文档的连载状态信息的准确率,从而提高了用户的文档访问效率,并提升了用户的使用体验。图3示出根据本发明另一个优选实施例的用于确定站点文档的连载状态信息的设备示意图;状态确定设备1还包括提供装置305,其中,信息获取装置302、章节数确定装置303和状态确定装置304分别与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。文档获取装置301获取与用户的查询序列相对应的所述一个或多个站点文档,其中,所述一个或多个站点文档对应于同一个目标文档。具体地,用户通过与用户设备的交互,在浏览器或客户端软件的搜索框内输入文档名称、作者名称或文档内容标记等可用于标识文档的信息,以作为查询序列,文档获取装置301通过调用该状态确定设备的应用程序接口(API)或其他约定的通信方式,如http或https等传输协议,或者通过诸如JSP、ASP 或PHP等动态网页技术,获取所述查询序列,并根据所述查询序列,在搜索引擎或文档库中进行匹配查询,以获得与该查询序列相对应的一个或多个站点文档,其中,所述一个或多个站点文档对应于同一个目标文档。例如,用户通过与用户设备的交互,在浏览器的输入框内输入查询序列“当年明月”,文档获取装置301通过动态网页技术,获取该查询序列,在搜索引擎或文档库中进行匹配查询,获得与该查询序列“当年明月”相匹配的多个站点文档“明朝那些事儿——当年明月**在线书库”、“明朝那些事儿当年明月读书**网”,其中,这多个站点文档对应于同一个目标文档“明朝那些事儿”。提供装置305根据所述一个或多个站点文档的连载状态信息,将所述一个或多个站点文档提供给所述用户。具体地,提供装置305根据状态确定装置304所确定的所述一个或多个站点文档的连载状态信息,通过诸如JSP、ASP或PHP等动态网页技术,将所述一个或多个站点文档随机或按一定的顺序和格式提供给所述用户,供用户浏览。例如,提供装置 305根据状态确定装置304所确定的所述一个或多个站点文档的连载状态信息,确定所述一个或多个站点文档的优先级,再通过诸如JSP、ASP或PHP等动态网页技术,将所述一个或多个站点文档按照其优先级提供给所述用户;或者,提供装置305根据状态确定装置304所确定的所述一个或多个站点文档的连载状态信息,筛选出连载状态信息为全本状态的站点文档,再通过诸如JSP、ASP或PHP等动态网页技术,将这些筛选出来的站点文档提供给所述用户,供用户浏览。本领域技术人员应能理解上述将站点文档提供给用户的方式仅为举例, 其他现有的或今后可能出现的将站点文档提供给用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明与应用相结合,根据用户输入的查询序列匹配相对应的站点文档,并根据站点文档所对应的连载状态信息,将所述站点文档提供给用户,提升用户的搜索使用体验。优选地,所述提供装置305将所述一个或多个站点文档与所述连载状态信息提供给所述用户。具体地,提供装置305通过诸如JSP、ASP或PHP等动态网页技术,将文档获取装置301所获取的一个或多个站点文档与状态确定装置304所确定的连载状态信息一起提供给所述用户,如在站点文档提供给用户的标题、摘要或锚文本中标记该站点文档所对应的连载状态信息,以供用户浏览。在此,本发明将站点文档与连载状态信息一起提供给用户,方便用户根据连载状态信息选择站点文档进行浏览,提升用户的搜索使用体验。优选地,所述文档获取装置301获取与所述用户的查询序列相对应的文档搜索结果;根据所述文档搜索结果的文档标识信息,对所述文档搜索结果进行分类处理,以获得一个或多个站点文档分类,其中,每一个站点文档分类包括所述一个或多个站点文档,所述一个或多个站点文档对应于同一个目标文档;其中,所述提供装置305根据所述站点文档分类,并结合与所述站点文档分类所对应的一个或多个站点文档的连载状态信息,将所述文档搜索结果提供给所述用户。具体地,文档获取装置301根据用户的查询序列,通过在搜索引擎或文档库中进行匹配查询,获得与该查询序列相对应的多个文档搜索结果,或者,通过与搜索引擎或文档库等第三方设备的交互,获取与该查询序列相对应的多个文档搜索结果,该多个文档搜索结果包括对应于不同目标文档的多个站点文档;随后,文档获取装置 301再通过对所述一个或多个文档搜索结果进行页面分析,或者,从文档库中该文档搜索结果所对应的文档记录,获得其所对应的文档标识信息,根据该文档标识信息,对所述文档搜索结果进行分类处理,如根据文档标识信息中所述包含的目标文档的文档名称、作者名称或文档内容标记等可用于标识文档的信息,将所述一个或多个文档搜索结果按照目标文档进行分类处理,以获得一个或多个站点文档分类,其中,每一个站点文档分类包括所述一个或多个站点文档,所述一个或多个站点文档对应于同一个目标文档;随后,所述提供装置 305根据文档获取装置301所获得的站点文档分类,并结合由状态确定装置304所确定的与所述站点文档分类所对应的一个或多个站点文档的连载状态信息,通过JSP、ASP或PHP的动态网页技术,将所述站点文档分类提供给所述用户,以实现将文档搜索结果提供给所述用户,如将包括连载状态信息为全本状态的站点文档数量最多的站点文档分类优先提供给用户,供用户浏览,或筛选出所包括的站点文档的连载状态信息全部为全本状态的站点文档分类,并将所述筛选出的站点文档分类提供给用户,供用户浏览。优选地,提供装置305 还可以将由状态确定装置304所确定的连载状态信息,与文档搜索结果一起提供给所述用户,如当所述站点文档分类中所述包括的各站点文档的连载状态信息相同时,在文档分类结果中标记该连载状态信息;当所述站点文档分类中所述包括的各站点文档的连载状态信息不同时,在每一个提供给用户的文档搜索结果的标题、摘要或锚文本中标记该文档搜索结果所对应的站点文档的连载状态信息,以供用户浏览。本领域技术人员应能理解上述对文档搜索结果进行分类处理的方式仅为举例,其他现有的或今后可能出现的对文档搜索结果进行分类处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明首先将匹配得到的文档搜索结果进行分类,再将分类处理后的文档搜索结果提供给用户,方便用户根据分类结果选择浏览,提升用户的搜索使用体验。图4示出根据本发明另一个方面的用于确定站点文档的连载状态信息的方法流程图。状态确定设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述状态确定设备仅为举例,其他现有的或今后可能出现的状态确定设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在步骤S401中,状态确定设备1获取对应于同一个目标文档的一个或多个站点文档。具体地,在步骤S401中,状态确定设备1根据目标文档的文档名称、作者名称或文档内容标记等可用于标识文档的信息,通过在搜索引擎或者文档库中进行匹配查询,以获得与该目标文档相对应的一个或多个站点文档。例如,假设目标文档为“明朝那些事儿”,在步骤 S401中,状态确定设备1根据该目标文档的文档名称“明朝那些事儿”或作者名称“当年明月”,在搜索引擎或文档库中进行匹配查询,以获得与该目标文档“明朝那些事儿”相对应的多个站点文档“明朝那些事儿——**在线书库”、“明朝那些事儿连载读书**网”等。在此, 文档库中存储有大量站点文档及所述站点文档的文档名称、作者名称或文档内容标记等可用于标识文档的信息,该文档库既可以位于状态确定设备1中,也可以位于与该状态确定设备1通过网络相连接的第三方设备中。本领域技术人员应能理解上述获取站点文档的方式仅为举例,其他现有的或今后可能出现的获取站点文档的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在步骤S402中,状态确定设备1获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数。具体地,对于状态确定设备1在步骤S401中所获取的一个或多个站点文档中的每一个站点文档,在步骤S402中, 状态确定设备1通过对该站点文档的页面分析或文档分析,分别获取该站点文档的连载标记信息与资源最大章节数,以作为所述站点文档的资源相关信息。在此,连载标记信息例如可以是在站点文档中所标识出的该站点文档的连载情况,如已完结的站点文档的连载标记信息可以为“全本标记”、未完结的站点文档的连载标记信息可以为“连载标记”等;资源最大章节数例如可以是站点文档中所有章节的数量、有效章节的数量等。接上例,在步骤S401 中,状态确定设备1获取与目标文档“明朝那些事儿”相对应的多个站点文档“明朝那些事儿——**在线书库”、“明朝那些事儿连载读书**网”;在步骤S402中,状态确定设备1通过对这多个站点文档进行页面分析或文档分析,分别获取到站点文档“明朝那些事儿—— **在线书库”的连载标记信息为“全本标记”,资源最大章节数为150章,站点文档“明朝那些事儿连载读书**网”的连载标记信息为“连载标记”,资源最大章节数为100章。本领域技术人员应能理解上述获取站点文档的资源相关信息的方式仅为举例,其他现有的或今后可能出现的获取站点文档的资源相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解上述资源相关信息仅为举例,其他现有的或今后可能出现的资源相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在步骤S403中,状态确定设备1根据所述资源相关信息,确定所述目标文档的文档最大章节数。具体地,在步骤S403中,状态确定设备1根据在步骤S402中所获取的一个或多个站点文档的资源相关信息,确定所述目标文档的文档最大章节数,如从这一个或多个站点文档的资源最大章节数中取最大值,将该最大值作为所述目标文档的文档最大章节数,或者从根据这些站点文档的连载标记信息将其分为两类,“全本标记”站点文档集合与 “连载标记”站点文档集合,分别确定这两个集合中站点文档的资源最大章节数的最大值, 再取这两个最大值中较大的为所述目标文档的文档最大章节数。接上例,在步骤S402中, 状态确定设备1分别获取到站点文档“明朝那些事儿——**在线书库”的资源最大章节数为150章,站点文档“明朝那些事儿连载读书**网”的资源最大章节数为100章,其他对应于目标文档“明朝那些事儿”的站点文档的资源最大章节数都小于150章,则在步骤S403 中,状态确定设备1确定该目标文档“明朝那些事儿”的文档最大章节数为150章。在步骤S404中,状态确定设备1根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。具体地,对于所述一个或多个站点文档中至少一个站点文档,在步骤S404中,状态确定设备1确定该站点文档的连载状态信息的方式包括但不限于1)根据该站点文档的资源相关信息,以及所述文档最大章节数,确定该站点文档的连载状态信息,如当该站点文档的连载标记信息为“全本标记”,且该站点文档的资源最大章节数与文档最大章节数的比值超过第一章节比值阈值,确定该站点文档的连载状态信息为全本状态。优选地,若该比值低于所述第一章节比值阈值,则确定该站点文档的连载状态信息为连载状态。在此,所述第一章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以由大量的目标文档及其对应的站点文档的资源相关信息与连载状态信息来确定。2)首先根据所述一个或多个站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当根据所述目标文档的文档状态信息为全本状态, 根据该站点文档的资源相关信息,确定该站点文档的连载状态信息。3)首先根据所述一个或多个站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当所述目标文档的文档状态信息为连载状态,根据该站点文档的资源相关信息,以及所述文档最大章节数,确定该站点文档的连载状态信息。本领域技术人员应能理解上述确定站点文档的连载状态信息的方式仅为举例,其他现有的或今后可能出现的确定站点文档的连载状态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。与现有技术相比,本发明通过根据对应于同一个目标文档的一个或多个站点文档的资源相关信息确定目标文档的文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息,从而提高了用户的文档访问效率,并提升了用户的使用体验。进一步地,本发明还可以根据所确定的站点文档的连载状态信息,将搜索引擎所获得的搜索结果展现给用户,以提升用户的搜索使用体验。优选地,状态确定设备1的各个步骤之间是持续不断地工作的。具体地,在步骤 S401中,状态确定设备1持续获取对应于同一个目标文档的一个或多个站点文档;在步骤 S402中,状态确定设备1持续获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数;在步骤S403中,状态确定设备1持续根据所述资源相关信息,确定所述目标文档的文档最大章节数;在步骤S404中,状态确定设备1持续根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。在此,本领域技术人员应理解“持续”是指上述各个步骤分别不断地进行站点文档的获取、资源相关信息的获取、文档最大章节数的确定及连载状态信息的确定,直至状态确定设备1在较长时间内停止获取对应于同一个目标文档的一个或多个站点文档。优选地,若根据状态确定设备1在步骤S402中所获取的所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第一章节比值阈值,则在步骤S404中,状态确定设备1确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。例如,假设第一章节比值阈值为0. 9,在步骤S402中,状态确定设备1获取到对应于目标文档“明朝那些事儿”的其中一个站点文档“明朝那些事儿——**在线书库”,其连载标记信息为“全本标记”,且其资源最大章节数为150章,而在步骤S403中,状态确定设备1所确定的文档最大章节数为150章,则在步骤S404中,状态确定设备1根据该站点文档的连载标记信息为“全本标记”,且该站点文档的资源最大章节数与文档最大章节数的比值1.0(150/150 = 1. 0)超过第一章节比值阈值0. 9,确定该站点文档“明朝那些事儿——**在线书库”的连载状态信息为全本状态。在此,所述第一章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以由大量的目标文档及其对应的站点文档的资源相关信息与连载状态信息来确定。图5示出根据本发明一个优选实施例的用于确定站点文档的连载状态信息的方法流程图;其中,步骤S504还包括子步骤S5041和子步骤S5042 ;其中,步骤S501、S502和 S503分别与图4所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。其中,在子步骤S5041中,状态确定设备1根据所述资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息。具体地,在子步骤S5041中,状态确定设备1根据在步骤S502中所获取的一个或多个对应于同一个目标文档的站点文档的资源相关信息,结合由状态确定设备1在步骤S503中所确定的文档最大章节数,确定所述目标文档的文档状态信息。在此,在子步骤S5041中,状态确定设备1确定所述目标文档的文档状态信息的方式包括但不限于1)若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第四章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。在此,全本标题模式包括但不限于最新章标题包含新书预告、完结、终结、后记、全书、全文、结局、结束、完本、尾声、番外、尾章、结尾、全一章、终章、最后章、外篇等关键词。在此,所述第四章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以根据大量的目标文档及其文档状态信息和与之对应的站点文档及其资源相关信息来确定。例如,假设第四章节比值阈值为0. 85,在步骤S503中,状态确定设备1所确定的文档最大章节数为150章,若对应于目标文档“明朝那些事儿”的一个或多个站点文档中,存在一个站点文档“明朝那些事儿——**在线书库”,其最新章标题包含关键词“后记”,且该站点文档的资源最大章节数为150章,则在子步骤S5041中,状态确定设备1根据该站点文档的资源最大章节数与文档最大章节数的比值1.0(150/150 = 1.0)超过第四章节比值阈值0. 85,确定该目标文档“明朝那些事儿”的文档状态信息为全本状态。2)若所述一个或多个站点文档中全本站点文档的数量与所述一个或多个站点文档的总数量的比值超过第五全本站点比例阈值,其中,所述全本站点文档的连载标记信息为全本标记,则确定所述目标文档的文档状态信息为全本状态。具体地,在子步骤S5041 中,状态确定设备1根据由状态确定设备1在步骤S502中所获取的对应于同一个目标文档的所述一个或多个站点文档的连载标记信息,通过使用计数器等方式,计算出其中连载标记信息为“全本标记”的站点文档的数量,即全本站点文档的数量,同时也计算出这一个或多个站点文档的总数量,当全本站点文档的数量与该总数量的比值超过第五全本站点比例阈值,则在子步骤S5041中,状态确定设备1确定目标文档的文档状态信息为全本状态。在此,所述第五全本站点比例阈值可以是预先设置的全本站点文档的数量与站点文档的总数量的比值阈值,其可以根据大量的目标文档及其文档状态信息和与之对应的站点文档及其连载标记信息来确定。例如,假设第五全本站点比例阈值为0. 55,在步骤S501中,状态确定设备1获取到多个对应于目标文档“明朝那些事儿”的站点文档,在子步骤S5041中,状态确定设备1通过计数器,确定共有100个对应于目标文档“明朝那些事儿”的站点文档,且根据状态确定设备1在步骤S502中所获取的资源相关信息,计算得到其中连载标记信息为全本标记的站点文档(即,全本站点文档)共有60个,则在子步骤S5041中,状态确定设备 1根据全本站点文档的数量60与站点文档的总数量100的比值0. 6(60/100 = 0. 6)超过第五全本站点比例阈值0. 55,确定该目标文档“明朝那些事儿”的文档状态信息为全本状态。3)若所述全本站点文档的资源最大章节数中的最大值与所述文档最大章节数的比值超过第六章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。具体地,在子步骤S5041中,状态确定设备1根据在步骤S502中所获取的对应于同一个目标文档的一个或多个站点文档的资源相关信息,将资源相关信息中所包括的连载标记信息为“全本标记”的站点文档确定为全本站点文档,接着,根据所述全本站点文档的资源相关信息中所包括的资源最大章节数,从中取最大值,将该最大值与状态确定设备1在步骤S503中所确定的文档最大章节数进行比较,当所述最大值与所述文档最大章节数的比值超过第六章节比值阈值,在子步骤S5041中,状态确定设备1确定所述目标文档的文档状态信息为全本状态。在此,所述第六章节比值阈值可以是预先设置的资源最大章节数中的最大值与文档最大章节数的比值阈值,其可以根据大量的目标文档及其文档状态信息和与之对应的站点文档及其资源相关信息来确定。例如,假设第六章节比值阈值为0.91,在步骤S501中,状态确定设备1获取到多个对应于目标文档“明朝那些事儿”的站点文档;在步骤S502中,状态确定设备1获取该多个站点文档的连载标记信息、资源最大章节数等资源相关信息;在子步骤S5041中,状态确定设备1根据所述站点文档的连载标记信息,将连载标记信息为“全本标记”的站点文档“明朝那些事儿——**在线书库”、“明朝那些事儿文化读书频道**网” 确定为全本站点文档,而全本站点文档“明朝那些事儿——**在线书库”的资源最大章节数为150、全本站点文档“明朝那些事儿文化读书频道**网”的资源最大章节数为130,则在子步骤S5041中,状态确定设备1从中取出最大值150,而在步骤S503中,状态确定设备 1所确定的文档最大章节数为150,状态确定设备1根据该最大值与文档最大章节数的比值 1.0(150/150 = 1.0)超过第六章节比值阈值0.91,确定所述目标文档“明朝那些事儿”的文档状态信息为全本状态。4)在子步骤S5041中,状态确定设备1综合上述任意两种方法,或综合上述全部三种方法,确定所述目标文档的文档状态信息。以结合方法幻和方法幻为例,若所述一个或多个站点文档中全本站点文档的数量与所述一个或多个站点文档的总数量的比值超过第五全本站点比例阈值,其中,所述全本站点文档的连载标记信息为全本标记,且所述全本站点文档的资源最大章节数中的最大值与所述文档最大章节数的比值超过第六章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。本领域技术人员应能理解上述确定目标文档的文档状态信息的方式仅为举例,其他现有的或今后可能出现的确定目标文档的文档状态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。当所述目标文档的文档状态信息为全本状态,在子步骤S5042中,状态确定设备1 根据所述一个或多个站点文档中至少一个的资源相关信息,确定所述一个或多个站点文档中至少一个的连载状态信息。具体地,当在子步骤S5041中,状态确定设备1确定所述目标文档的文档状态信息为全本状态,在子步骤S5042中,状态确定设备1确定所述一个或多个站点文档中至少一个的连载状态信息的方式包括但不限于1)当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式且资源最大章节数超过第二章节数阈值,则在子步骤S5042中,状态确定设备1确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。具体地,当在子步骤S5041中,状态确定设备1确定所述目标文档的文档状态信息为全本状态,在子步骤S5042中,状态确定设备1通过分词匹配或语义分析等方式,确定所述一个或多个对应于目标文档的站点文档中,存在一个站点文档,其最新章标题包含新书预告、完结、终结、后记、全书、全文、结局、结束、完本、尾声、番外、尾章、结尾、全一章、终章、最后章、外篇等关键词,且该站点文档由状态确定设备1在步骤S502中所获取的资源最大章节数超过第二章节数阈值,则在子步骤S5042中,状态确定设备1确定该站点文档的连载状态信息为全本状态。在此,所述第二章节数阈值可以是预先设置的,其可以根据大量站点文档的最新章标题、资源最大章节数与连载状态信息的关系来确定。例如,假设第二章节数阈值为0,在子步骤S5041中,状态确定设备1确定目标文档“明朝那些事儿”的文档状态信息为全本状态,对应于该目标文档的其中一个站点文档“明朝那些事儿——**在线书库” 的最新章标题包含关键词“后记”,且在步骤S502中,状态确定设备1获取该站点文档的资源最大章节数不为0,则在子步骤S5042中,状态确定设备1确定该站点文档“明朝那些事儿——**在线书库”的连载状态信息为全本状态。2)当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第三章节比值阈值,则在子步骤S5042中,状态确定设备1确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。具体地, 当在子步骤S5041中,状态确定设备1确定所述目标文档的文档状态信息为全本状态,对于所述一个或多个站点文档中的任一站点文档,若根据状态确定设备1在步骤S502中所获取的该站点文档的连载标记信息为“全本标记”,且该站点文档的资源最大章节数与由状态确定设备1在步骤S503中所确定的文档最大章节数的比值超过第三章节比值阈值,则在子步骤S5042中,状态确定设备1确定该站点文档的连载状态信息为全本状态。在此,所述第三章节比值阈值可以是预先设置的资源最大章节数与文档最大章节数的比值阈值,其可以由大量的目标文档及其文档状态信息和站点文档及其资源相关信息与连载状态信息来确定。 例如,假设第三章节比值阈值为0. 9,在子步骤S5041中,状态确定设备1确定目标文档“明朝那些事儿”的文档状态信息为全本状态,在步骤S502中,状态确定设备1获取到对应于目标文档“明朝那些事儿”的其中一个站点文档“明朝那些事儿——**在线书库”的连载标记信息为全本标记,资源最大章节数为150章,而在步骤S503中,状态确定设备1所确定的文档最大章节数为150章,则在子步骤S5042中,状态确定设备1根据该站点文档的连载标记信息为全本标记,该站点文档的资源最大章节数与文档最大章节数的比值1(150/150 = 1) 超过第三章节比值阈值0.9,确定该站点文档“明朝那些事儿——**在线书库”的连载状态信息为全本状态。3)在子步骤S5042中,状态确定设备1结合上述两种方式,确定所述一个或多个站点文档中至少一个的连载状态信息。当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式且资源最大章节数超过第二章节数阈值,且该站点文档的连载标记信息为全本标记,及其资源最大章节数与所述文档最大章节数的比值超过第三章节比值阈值,则在子步骤S5042中,状态确定设备1确定该站点文档的连载状态信息为全本状态。本领域技术人员应能理解上述确定站点文档的连载状态信息的方式仅为举例,其他现有的或今后可能出现的确定站点文档的连载状态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明首先根据站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当根据所述目标文档的文档状态信息为全本状态,再根据所述一个或多个站点文档中至少一个的资源相关信息,确定所述一个或多个站点文档中至少一个的连载状态信息,进一步优化了确定站点文档的连载状态信息的方式,提高了站点文档的连载状态信息的准确率,从而提高了用户的文档访问效率,并提升了用户的使用体
优选地,当所述目标文档的文档状态信息为连载状态,在步骤S504中,状态确定设备1还根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。具体地,当在子步骤 S5041中,状态确定设备1确定所述目标文档的文档状态信息为连载状态,在步骤S504中, 状态确定设备1还根据在步骤S502中所获取的与该目标文档相对应的所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且该站点文档的资源最大章节数与由状态确定设备1在步骤S503中所确定的文档最大章节数的比值超过第一章节比值阈值,则在步骤S504中,状态确定设备1确定该站点文档的连载状态信息为全本状态。例如,假设第一章节比值阈值为0.9,在子步骤S5041中,状态确定设备1确定目标文档“明朝那些事儿” 的文档状态信息为连载状态,在步骤S502中,状态确定设备1获取到对应于该目标文档的其中一个站点文档“明朝那些事儿——**在线书库”的连载标记信息为“全本标记”,资源最大章节数为150章,而在步骤S503中,状态确定设备1所确定的文档最大章节数为150 章,则在步骤S504中,状态确定设备1根据该站点文档的连载标记信息为“全本标记”,该站点文档的资源最大章节数与文档最大章节数的比值1.0(150/150 = 1.0)超过第一章节比值阈值0. 9,确定该站点文档“明朝那些事儿——**在线书库”的连载状态信息为全本状态。在此,本发明首先根据站点文档的资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;当所述目标文档的文档状态信息为连载状态,再根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息,进一步优化了确定站点文档的连载状态信息的方式,提高了站点文档的连载状态信息的准确率,从而提高了用户的文档访问效率,并提升了用户的使用体验。图6示出根据本发明另一个优选实施例的用于确定站点文档的连载状态信息的方法流程图;其中,步骤S602、S603和S604分别与图4所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。在步骤S601中,状态确定设备1获取与用户的查询序列相对应的所述一个或多个站点文档,其中,所述一个或多个站点文档对应于同一个目标文档。具体地,用户通过与用户设备的交互,在浏览器或客户端软件的搜索框内输入文档名称、作者名称或文档内容标记等可用于标识文档的信息,以作为查询序列,在步骤S601中,状态确定设备1通过调用该状态确定设备的应用程序接口(API)或其他约定的通信方式,如http或https等传输协议,或者通过诸如JSP、ASP或PHP等动态网页技术,获取所述查询序列,并根据所述查询序列,在搜索引擎或文档库中进行匹配查询,以获得与该查询序列相对应的一个或多个站点文档,其中,所述一个或多个站点文档对应于同一个目标文档。例如,用户通过与用户设备的交互,在浏览器的输入框内输入查询序列“当年明月”,在步骤S601中,状态确定设备1通过动态网页技术,获取该查询序列,在搜索引擎或文档库中进行匹配查询,获得与该查询序列“当年明月”相匹配的多个站点文档“明朝那些事儿——当年明月**在线书库”、“明朝那些事儿当年明月读书**网”,其中,这多个站点文档对应于同一个目标文档“明朝那些事儿”。在步骤S605中,状态确定设备1根据所述一个或多个站点文档的连载状态信息,将所述一个或多个站点文档提供给所述用户。具体地,在步骤S605中,状态确定设备1根据在步骤S604中所确定的所述一个或多个站点文档的连载状态信息,通过诸如JSP、ASP或 PHP等动态网页技术,将所述一个或多个站点文档随机或按一定的顺序和格式提供给所述用户,供用户浏览。例如,在步骤S605中,状态确定设备1根据在步骤S604中所确定的所述一个或多个站点文档的连载状态信息,确定所述一个或多个站点文档的优先级,再通过诸如JSP、ASP或PHP等动态网页技术,将所述一个或多个站点文档按照其优先级提供给所述用户;或者,在步骤S605中,状态确定设备1根据在步骤S604中所确定的所述一个或多个站点文档的连载状态信息,筛选出连载状态信息为全本状态的站点文档,再通过诸如JSP、 ASP或PHP等动态网页技术,将这些筛选出来的站点文档提供给所述用户,供用户浏览。本领域技术人员应能理解上述将站点文档提供给用户的方式仅为举例,其他现有的或今后可能出现的将站点文档提供给用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明与应用相结合,根据用户输入的查询序列匹配相对应的站点文档,并根据站点文档所对应的连载状态信息,将所述站点文档提供给用户,提升用户的搜索使用体验。优选地,在步骤S605中,状态确定设备1将所述一个或多个站点文档与所述连载状态信息提供给所述用户。具体地,在步骤S605中,状态确定设备1通过诸如JSP、ASP或 PHP等动态网页技术,将在步骤S601中所获取的一个或多个站点文档与在步骤S604中所确定的连载状态信息一起提供给所述用户,如在站点文档提供给用户的标题、摘要或锚文本中标记该站点文档所对应的连载状态信息,以供用户浏览。在此,本发明将站点文档与连载状态信息一起提供给用户,方便用户根据连载状态信息选择站点文档进行浏览,提升用户的搜索使用体验。优选地,在步骤S601中,状态确定设备1获取与所述用户的查询序列相对应的文档搜索结果;根据所述文档搜索结果的文档标识信息,对所述文档搜索结果进行分类处理, 以获得一个或多个站点文档分类,其中,每一个站点文档分类包括所述一个或多个站点文档,所述一个或多个站点文档对应于同一个目标文档;随后,在步骤S605中,状态确定设备 1根据所述站点文档分类,并结合与所述站点文档分类所对应的一个或多个站点文档的连载状态信息,将所述文档搜索结果提供给所述用户。具体地,在步骤S601中,状态确定设备 1根据用户的查询序列,通过在搜索引擎或文档库中进行匹配查询,获得与该查询序列相对应的多个文档搜索结果,或者,通过与搜索引擎或文档库等第三方设备的交互,获取与该查询序列相对应的多个文档搜索结果,该多个文档搜索结果包括对应于不同目标文档的多个站点文档;随后,在步骤S601中,状态确定设备1再通过对所述一个或多个文档搜索结果进行页面分析,或者,从文档库中该文档搜索结果所对应的文档记录,获得其所对应的文档标识信息,根据该文档标识信息,对所述文档搜索结果进行分类处理,如根据文档标识信息中所述包含的目标文档的文档名称、作者名称或文档内容标记等可用于标识文档的信息, 将所述一个或多个文档搜索结果按照目标文档进行分类处理,以获得一个或多个站点文档分类,其中,每一个站点文档分类包括所述一个或多个站点文档,所述一个或多个站点文档对应于同一个目标文档;随后,在步骤S605中,状态确定设备1根据在步骤S601中所获得的站点文档分类,并结合在步骤S604中所确定的与所述站点文档分类所对应的一个或多个站点文档的连载状态信息,通过JSP、ASP或PHP的动态网页技术,将所述站点文档分类提供给所述用户,以实现将文档搜索结果提供给所述用户,如将包括连载状态信息为全本状态的站点文档数量最多的站点文档分类优先提供给用户,供用户浏览,或筛选出所包括的站点文档的连载状态信息全部为全本状态的站点文档分类,并将所述筛选出的站点文档分类提供给用户,供用户浏览。优选地,在步骤S605中,状态确定设备1还可以将在步骤 S604中所确定的连载状态信息,与文档搜索结果一起提供给所述用户,如当所述站点文档分类中所述包括的各站点文档的连载状态信息相同时,在文档分类结果中标记该连载状态信息;当所述站点文档分类中所述包括的各站点文档的连载状态信息不同时,在每一个提供给用户的文档搜索结果的标题、摘要或锚文本中标记该文档搜索结果所对应的站点文档的连载状态信息,以供用户浏览。本领域技术人员应能理解上述对文档搜索结果进行分类处理的方式仅为举例,其他现有的或今后可能出现的对文档搜索结果进行分类处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此, 本发明首先将匹配得到的文档搜索结果进行分类,再将分类处理后的文档搜索结果提供给用户,方便用户根据分类结果选择浏览,提升用户的搜索使用体验。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
权利要求
1.一种由计算机实现的用于确定站点文档的连载状态信息的方法,其中,该方法包括a获取对应于同一个目标文档的一个或多个站点文档;b获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数;c根据所述资源相关信息,确定所述目标文档的文档最大章节数;d根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。
2.根据权利要求1所述的方法,其中,所述步骤d包括-若所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第一章节比值阈值,则确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。
3.根据权利要求1所述的方法,其中,所述步骤d包括dl根据所述资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态 fn息;d2当所述目标文档的文档状态信息为全本状态,根据所述一个或多个站点文档中至少一个的资源相关信息,确定所述一个或多个站点文档中至少一个的连载状态信息。
4.根据权利要求3所述的方法,其中,所述步骤d2包括_当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式且资源最大章节数超过第二章节数阈值,则确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。
5.根据权利要求3所述的方法,其中,所述步骤d2包括_当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第三章节比值阈值,则确定所述一个或多个站点文档中至少一个的的连载状态信息为全本状态。
6.根据权利要求3至5中任一项所述的方法,其中,所述步骤dl基于以下至少任一项来确定所述目标文档的文档状态信息-若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第四章节比值阈值,则确定所述目标文档的文档状态信息为全本状态;_若所述一个或多个站点文档中全本站点文档的数量与所述一个或多个站点文档的总数量的比值超过第五全本站点比例阈值,其中,所述全本站点文档的连载标记信息为全本标记,则确定所述目标文档的文档状态信息为全本状态;_若所述全本站点文档的资源最大章节数中的最大值与所述文档最大章节数的比值超过第六章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。
7.根据权利要求3至6中任一项所述的方法,其中,所述步骤d还包括_当所述目标文档的文档状态信息为连载状态,根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤a包括-获取与用户的查询序列相对应的所述一个或多个站点文档,其中,所述一个或多个站点文档对应于同一个目标文档;其中,该方法还包括r根据所述一个或多个站点文档的连载状态信息,将所述一个或多个站点文档提供给所述用户。
9.根据权利要求8所述的方法,其中,所述步骤r包括-将所述一个或多个站点文档与所述连载状态信息提供给所述用户。
10.根据权利要求8或9所述的方法,其中,所述步骤a包括-获取与所述用户的查询序列相对应的文档搜索结果;-根据所述文档搜索结果的文档标识信息,对所述文档搜索结果进行分类处理,以获得一个或多个站点文档分类,其中,每一个站点文档分类包括所述一个或多个站点文档,所述一个或多个站点文档对应于同一个目标文档;其中,所述步骤r包括-根据所述站点文档分类,并结合与所述站点文档分类所对应的一个或多个站点文档的连载状态信息,将所述文档搜索结果提供给所述用户。
11.一种用于确定站点文档的连载状态信息的状态确定设备,其中,该设备包括文档获取装置,用于获取对应于同一个目标文档的一个或多个站点文档;信息获取装置,用于获取所述站点文档的资源相关信息,其中,所述资源相关信息包括所述站点文档的连载标记信息与资源最大章节数;章节数确定装置,用于根据所述资源相关信息,确定所述目标文档的文档最大章节数;状态确定装置,用于根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。
12.根据权利要求11所述的状态确定设备,其中,所述状态确定装置用于_若所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第一章节比值阈值,则确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。
13.根据权利要求11所述的状态确定设备,其中,所述状态确定装置包括目标文档确定单元,用于根据所述资源相关信息,结合所述文档最大章节数,确定所述目标文档的文档状态信息;站点文档确定单元,用于当所述目标文档的文档状态信息为全本状态,根据所述一个或多个站点文档中至少一个的资源相关信息,确定所述一个或多个站点文档中至少一个的连载状态信息。
14.根据权利要求13所述的状态确定设备,其中,所述站点文档确定单元用于_当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式且资源最大章节数超过第二章节数阈值,则确定所述一个或多个站点文档中至少一个的连载状态信息为全本状态。
15.根据权利要求13所述的状态确定设备,其中,所述站点文档确定单元用于-当所述目标文档的文档状态信息为全本状态,若所述一个或多个站点文档中至少一个的连载标记信息为全本标记,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第三章节比值阈值,则确定所述一个或多个站点文档中至少一个的的连载状态信息为全本状态。
16.根据权利要求13至15中任一项所述的状态确定设备,其中,所述目标文档确定单元基于以下至少任一项来确定所述目标文档的文档状态信息-若所述一个或多个站点文档中至少一个的最新章标题符合全本标题模式,且所述一个或多个站点文档中至少一个的资源最大章节数与所述文档最大章节数的比值超过第四章节比值阈值,则确定所述目标文档的文档状态信息为全本状态;-若所述一个或多个站点文档中全本站点文档的数量与所述一个或多个站点文档的总数量的比值超过第五全本站点比例阈值,其中,所述全本站点文档的连载标记信息为全本标记,则确定所述目标文档的文档状态信息为全本状态;-若所述全本站点文档的资源最大章节数中的最大值与所述文档最大章节数的比值超过第六章节比值阈值,则确定所述目标文档的文档状态信息为全本状态。
17.根据权利要求13至16中任一项所述的状态确定设备,其中,所述状态确定装置还用于-当所述目标文档的文档状态信息为连载状态,根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息。
18.根据权利要求11至17中任一项所述的状态确定设备,其中,所述文档获取装置用于-获取与用户的查询序列相对应的所述一个或多个站点文档,其中,所述一个或多个站点文档对应于同一个目标文档;其中,该设备还包括提供装置,用于-根据所述一个或多个站点文档的连载状态信息,将所述一个或多个站点文档提供给所述用户。
19.根据权利要求18所述的状态确定设备,其中,所述提供装置用于-将所述一个或多个站点文档与所述连载状态信息提供给所述用户。
20.根据权利要求18或19所述的状态确定设备,其中,所述文档获取装置用于-获取与所述用户的查询序列相对应的文档搜索结果;-根据所述文档搜索结果的文档标识信息,对所述文档搜索结果进行分类处理,以获得一个或多个站点文档分类,其中,每一个站点文档分类包括所述一个或多个站点文档,所述一个或多个站点文档对应于同一个目标文档;其中,所述提供装置用于-根据所述站点文档分类,并结合与所述站点文档分类所对应的一个或多个站点文档的连载状态信息,将所述文档搜索结果提供给所述用户。
全文摘要
本发明的目的是提供一种用于确定站点文档的连载状态信息的方法与设备,通过获取对应于同一个目标文档的一个或多个站点文档及其资源相关信息;据此确定该目标文档的文档最大章节数;根据所述一个或多个站点文档中至少一个的资源相关信息,以及所述文档最大章节数,确定该站点文档的连载状态信息。与现有技术相比,本发明根据对应于同一个目标文档的一个或多个站点文档的资源相关信息确定目标文档的文档最大章节数,确定所述一个或多个站点文档中至少一个的连载状态信息,从而提高用户的文档访问效率,并提升用户的使用体验。进一步地,本发明根据所确定的站点文档的连载状态信息,将搜索引擎获得的搜索结果展现给用户,以提升用户的搜索使用体验。
文档编号G06F17/30GK102314501SQ20111025498
公开日2012年1月11日 申请日期2011年8月31日 优先权日2011年8月31日
发明者林帆, 洪庚伟 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1