一种异常数据分析方法及装置的制造方法

文档序号:9887726阅读:284来源:国知局
一种异常数据分析方法及装置的制造方法
【技术领域】
[0001 ]本发明属于数据处理技术领域,更具体的说,尤其涉及一种异常数据分析方法及
目.0
【背景技术】
[0002]网站运行日志是一个记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件,通过网站运行日志可以清楚的得到用户在什么IP(InternetProtocol,网络互连协议)地址、什么时间下采用什么操作系统以及何种浏览器的情况下访问了哪个网站提供的页面以及可以清楚的获知访问是否成功,因此通过网站运行日志中记载的信息可以确定网站运行过程中发生的异常故障。
[0003]目前在异常故障中最主要的故障是404故障,其中404故障是客户端在浏览404页面时无法得到正确信息,其无法得到正确信息的原因是:服务器无法正常提供信息,或是服务器无法回应且不知道要返回哪个页面,如果404故障频发,将影响访问者的访问次数和搜索引擎的收录率,因此需要及时分析404故障的原因并处理,保证网站的稳定性。

【发明内容】

[0004]有鉴于此,本发明的目的在于提供一种异常数据分析方法及装置,用于对404故障进行分析以删除导致404故障的页面,从而提高搜索引擎的收录率以及网站的稳定性。技术方案如下:
[0005]本发明提供一种异常数据分析方法,所述方法包括:
[0006]从网站运行日志中获取指示引起404故障的记录信息;
[0007]当所述记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对所述企业URL进行判断;
[0008]当判断出所述企业URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的企业URL;
[0009]当所述记录信息中的目标URL为产品URL时,基于第二预设规则对所述产品URL进行判断;
[0010]当判断出所述产品URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的产品URL。
[0011 ]优选地,所述当所述记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对所述企业URL进行判断,包括:
[0012]当所述目标URL为企业URL时,获得所述企业URL对应的企业标识信息;
[0013]基于所述企业标识信息,确定企业状态;
[0014]基于所述企业状态,对所述企业URL进行判断。
[0015]优选地,所述基于所述企业状态,对所述企业URL进行判断,包括:
[0016]当所述企业状态为禁言状态或关闭状态时,确定所述企业URL引起的404故障是相应的搜索引擎导致;
[0017]当所述企业状态是拘审状态时,自动向相应的搜索引擎发送所述企业URL;
[0018]当未接收到所述搜索引擎反馈的与所述企业URL对应的页面时,确定所述企业URL引起的404故障是相应的搜索引擎导致。
[0019]优选地,所述当所述记录信息中的目标URL为产品URL时,基于第二预设规则对所述产品URL进行判断,包括:
[0020]当所述目标URL为产品URL时,得所述产品URL对应的产品标识信息;
[0021 ]基于所述产品标识信息,确定产品状态;
[0022]基于所述产品状态,对所述产品URL进行判断。
[0023]优选地,所述基于所述产品状态,对所述产品URL进行判断,包括:
[0024]当所述产品状态为删除状态时,确定所述产品URL引起的404故障是相应的搜索引擎导致;
[0025]当所述产品状态为拘审状态时,自动向相应的搜索引擎发送所述产品URL;
[0026]当未接收到所述搜索引擎反馈的与所述产品URL对应的页面时,确定所述产品URL引起的404故障是相应的搜索引擎导致。
[0027]本发明提供一种异常数据分析装置,所述装置包括:
[0028]获取单元,用于从网站运行日志中获取指示引起404故障的记录信息;
[0029]第一判断单元,用于当所述记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对所述企业URL进行判断;
[0030]第一删除单元,用于当判断出所述企业URL引起的404故障是相应的搜索引擎导致时,指示删除弓I起404故障的企业URL;
[0031]第二判断单元,用于当所述记录信息中的目标URL为产品URL时,基于第二预设规则对所述产品URL进行判断;
[0032]第二删除单元,用于当判断出所述产品URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的产品URL。
[0033]优选地,所述第一判断单元,包括:
[0034]第一获取子单元,用于当所述目标URL为企业URL时,获得所述企业URL对应的企业标识信息;
[0035]第一确定子单元,用于基于所述企业标识信息,确定企业状态;
[0036]第一判断子单元,用于基于所述企业状态,对所述企业URL进行判断。
[0037]优选地,所述第一判断子单元用于,当所述企业状态为禁言状态或关闭状态时,确定所述企业URL引起的404故障是相应的搜索引擎导致,以及用于当所述企业状态是拘审状态时,自动向相应的搜索引擎发送所述企业URL,并且当未接收到所述搜索引擎反馈的与所述企业URL对应的页面时,确定所述企业URL引起的404故障是相应的搜索引擎导致。
[0038]优选地,所述第二判断单元,包括:
[0039]第二获取子单元,用于当所述目标URL为产品URL时,获得所述产品URL对应的产品标识信息;
[0040]第二确定子单元,用于基于所述产品标识信息,确定产品状态;
[0041]第二判断子单元,用于基于所述产品状态,对所述产品URL进行判断。
[0042]优选地,所述第二判断子单元用于,当所述产品状态为删除状态时,确定所述产品URL引起的404故障是相应的搜索引擎导致,以及用于当所述产品状态为拘审状态时,自动向相应的搜索引擎发送所述产品URL,并且当未接收到所述搜索引擎反馈的与所述产品URL对应的页面时,确定所述产品URL引起的404故障是相应的搜索引擎导致。
[0043]与现有技术相比,本发明提供的上述技术方案具有如下优点:
[0044]本发明提供的上述技术方案可以从网站运行日志中获取指示引起404故障的记录信息,当记录信息中的目标URL为企业URL时,基于第一预设规则对企业URL进行判断;当记录信息中的目标URL为产品URL时,基于第二预设规则对产品URL进行判断,实现通过不同预设规则分别对企业URL和产品URL的判断,并且当判断出企业URL或产品URL引起的404故障是相应的搜索引擎导致时,则会指示删除引起404故障的企业URL或产品URL,避免在使用这些URL时再次弓I起404故障,使得网站的稳定性提尚,并且在网站的稳定性提尚的情况下,搜索弓I擎被用户收录的概率增加,进而提高搜索引擎的收录率。
【附图说明】
[0045]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0046]图1是本发明实施例提供的异常数据分析方法的流程图;
[0047]图2是本发明实施例提供的异常数据分析装置的结构示意图。
【具体实施方式】
[0048]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]请参阅图1,其示出了本发明实施例提供的异常数据分析方法的流程图,可以包括以下步骤:
[0050]101:从网站运行日志中获取指示引起404故障的记录信息,前已述及,通过网站运行日志可以清楚的得到用户在什么IP地址、什么时间下采用什么操作系统以及何种浏览器的情况下访问了哪个网站提供的页面以及可以清楚的获知访问是否成功,这就意味着网站运行日志中存储有指示网站日常运行情况的记录信息,如记录信息包括但不限于:访问时间、访问浏览器、目标统一资源定位符(Uniform Resource Locator,URL)和访问来源等。
[0051]其中访问时间,用于指示用户在何时访问网站,访问浏览器则用于指示采用何种类型的浏览器对网站进行访问,目标URL则用于指示具体访问哪个网站的页面,访问来源指示由哪个搜索引擎提供网站。
[0052]102:当记录信息
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1