一种异常数据分析方法及装置的制造方法_3

文档序号:9887726阅读:来源:国知局
二获取子单元,用于当目标URL为产品URL时,获得产品URL对应的产品标识信息,其中产品标识信息作为产品的标识符,其可以将不同产品进行区分,也就是说每个产品具有唯一的产品标识信息,且对于不同产品来说具有不同的产品标识信息。第二确定子单元,用于基于产品标识信息,确定产品状态,在获得产品标识信息后,可以从产品信息数据库中查找到与产品标识信息相对应的产品状态,以进一步触发第二判断子单元,用于基于产品状态,对产品URL进行判断。
[0077]在本发明实施例中,基于产品状态对产品URL进行判断时,会依据产品状态的不同,得到不同的判断结果,例如当产品状态为删除状态时,直接确定产品URL引起的404故障是相应的搜索引擎导致。其中当产品状态为删除状态,说明产品已经被下架,那么搜索引擎是无法提供产品对应的网站的,因此在产品状态为删除状态时,可以直接确定产品URL引起的404故障是相应的搜索引擎导致。
[0078]当产品状态是拘审状态时,自动向相应的搜索引擎发送产品URL,来测试是否能够接收到搜索引擎反馈的与产品URL对应的页面,如果没有接收到搜索引擎反馈的页面,则说明404故障是搜索引擎导致的;如果接收到搜索引擎反馈的页面,则说明之前出现的404故障是因为网速等非搜索引擎问题导致的,对于此类404故障不进行处理,并且对于非搜索引擎问题导致的404故障,可以向用户反馈提示信息以提醒用户404故障是由网速问题导致,例如可能是由访问浏览器较慢导致的,因此对于非搜索引擎问题导致的404故障可以提醒用户更改访问浏览器。
[0079]从上述技术方案可知,本发明实施例提供的异常数据分析装置可以从网站运行日志中获取指示引起404故障的记录信息,当记录信息中的目标URL为企业URL时,基于第一预设规则对企业URL进行判断;当记录信息中的目标URL为产品URL时,基于第二预设规则对产品URL进行判断,实现通过不同预设规则分别对企业URL和产品URL的判断,并且当判断出企业URL或产品URL引起的404故障是相应的搜索引擎导致时,则会指示删除引起404故障的企业URL或产品URL,避免在使用这些URL时再次引起404故障,使得网站的稳定性提高,并且在网站的稳定性提高的情况下,搜索引擎被用户收录的概率增加,进而提高搜索引擎的收录率。
[0080]最后,需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0081]对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
[0082]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种异常数据分析方法,其特征在于,所述方法包括: 从网站运行日志中获取指示引起404故障的记录信息; 当所述记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对所述企业URL进行判断; 当判断出所述企业URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的企业URL; 当所述记录信息中的目标URL为产品URL时,基于第二预设规则对所述产品URL进行判断; 当判断出所述产品URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的产品URL。2.根据权利要求1所述的方法,其特征在于,所述当所述记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对所述企业URL进行判断,包括: 当所述目标URL为企业URL时,获得所述企业URL对应的企业标识信息; 基于所述企业标识信息,确定企业状态; 基于所述企业状态,对所述企业URL进行判断。3.根据权利要求2所述的方法,其特征在于,所述基于所述企业状态,对所述企业URL进行判断,包括: 当所述企业状态为禁言状态或关闭状态时,确定所述企业URL引起的404故障是相应的搜索引擎导致; 当所述企业状态是拘审状态时,自动向相应的搜索引擎发送所述企业URL; 当未接收到所述搜索引擎反馈的与所述企业URL对应的页面时,确定所述企业URL引起的404故障是相应的搜索引擎导致。4.根据权利要求1所述的方法,其特征在于,所述当所述记录信息中的目标URL为产品URL时,基于第二预设规则对所述产品URL进行判断,包括: 当所述目标URL为产品URL时,得所述产品URL对应的产品标识信息; 基于所述产品标识信息,确定产品状态; 基于所述产品状态,对所述产品URL进行判断。5.根据权利要求4所述的方法,其特征在于,所述基于所述产品状态,对所述产品URL进行判断,包括: 当所述产品状态为删除状态时,确定所述产品URL引起的404故障是相应的搜索引擎导致; 当所述产品状态为拘审状态时,自动向相应的搜索引擎发送所述产品URL; 当未接收到所述搜索引擎反馈的与所述产品URL对应的页面时,确定所述产品URL引起的404故障是相应的搜索引擎导致。6.一种异常数据分析装置,其特征在于,所述装置包括: 获取单元,用于从网站运行日志中获取指示引起404故障的记录信息; 第一判断单元,用于当所述记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对所述企业URL进行判断; 第一删除单元,用于当判断出所述企业URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的企业URL; 第二判断单元,用于当所述记录信息中的目标URL为产品URL时,基于第二预设规则对所述产品URL进行判断; 第二删除单元,用于当判断出所述产品URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的产品URL。7.根据权利要求6所述的装置,其特征在于,所述第一判断单元,包括: 第一获取子单元,用于当所述目标URL为企业URL时,获得所述企业URL对应的企业标识信息; 第一确定子单元,用于基于所述企业标识信息,确定企业状态; 第一判断子单元,用于基于所述企业状态,对所述企业URL进行判断。8.根据权利要求7所述的装置,其特征在于,所述第一判断子单元用于,当所述企业状态为禁目状态或关闭状态时,确定所述企业URL引起的404故障是相应的搜索引擎导致,以及用于当所述企业状态是拘审状态时,自动向相应的搜索引擎发送所述企业URL,并且当未接收到所述搜索引擎反馈的与所述企业URL对应的页面时,确定所述企业URL引起的404故障是相应的搜索引擎导致。9.根据权利要求6所述的装置,其特征在于,所述第二判断单元,包括: 第二获取子单元,用于当所述目标URL为产品URL时,获得所述产品URL对应的产品标识信息; 第二确定子单元,用于基于所述产品标识信息,确定产品状态; 第二判断子单元,用于基于所述产品状态,对所述产品URL进行判断。10.根据权利要求9所述的装置,其特征在于,所述第二判断子单元用于,当所述产品状态为删除状态时,确定所述产品URL引起的404故障是相应的搜索引擎导致,以及用于当所述产品状态为拘审状态时,自动向相应的搜索引擎发送所述产品URL,并且当未接收到所述搜索引擎反馈的与所述产品URL对应的页面时,确定所述产品URL引起的404故障是相应的搜索引擎导致。
【专利摘要】本发明提供一种异常数据分析方法及装置,可以从网站运行日志中获取指示引起404故障的记录信息,当记录信息中的目标URL为企业URL时,基于第一预设规则对企业URL进行判断;当记录信息中的目标URL为产品URL时,基于第二预设规则对产品URL进行判断,实现通过不同预设规则分别对企业URL和产品URL的判断,并且当判断出企业URL或产品URL引起的404故障是相应的搜索引擎导致时,则会指示删除引起404故障的企业URL或产品URL,避免在使用这些URL时再次引起404故障,使得网站的稳定性提高,并且在网站的稳定性提高的情况下,搜索引擎被用户收录的概率增加,进而提高搜索引擎的收录率。
【IPC分类】G06F17/30
【公开号】CN105653625
【申请号】
【发明人】乔景亮
【申请人】郑州悉知信息科技股份有限公司
【公开日】2016年6月8日
【申请日】2015年12月23日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1