一种异常数据分析方法及装置的制造方法_2

文档序号:9887726阅读:来源:国知局
中的目标URL为企业URL时,基于第一预设规则对企业URL进行判断,以判断企业URL引起的404故障是否是相应的搜索引擎导致的,如果是,则执行步骤103,如果否,说明企业URL引起的404故障是在用户访问网站时由于网速问题导致的,对于由于网速问题导致的404故障的企业URL不进行处理。
[0053]在本发明实施例中,基于第一预设规则对企业URL进行判断的可行方式是:当目标URL为企业URL时,获得企业URL对应的企业标识信息,其中企业标识信息作为企业的标识符,其可以将不同企业进行区分,也就是说每个企业具有唯一的企业标识信息,且对于不同企业来说具有不同的企业标识信息。基于企业标识信息,确定企业状态,在获得企业标识信息后,可以从企业信息数据库中查找到与企业标识信息相对应的企业状态,以进一步基于企业状态,对企业URL进行判断。
[0054]在本发明实施例中,基于企业状态对企业URL进行判断时,会依据企业状态的不同,得到不同的判断结果,例如当企业状态为禁言状态或关闭状态时,直接确定企业URL引起的404故障是相应的搜索引擎导致。其中当企业状态为禁言状态或者关闭状态,说明企业自身出现问题,那么搜索引擎是无法提供企业对应的网站的,因此在企业状态为禁言或者关闭状态时,可以直接确定企业URL引起的404故障是相应的搜索引擎导致。
[0055]当企业状态是拘审状态时,自动向相应的搜索引擎发送企业URL,来测试是否能够接收到搜索引擎反馈的与企业URL对应的页面,如果没有接收到搜索引擎反馈的页面,则说明404故障是搜索引擎导致的;如果接收到搜索引擎反馈的页面,则说明之前出现的404故障是因为网速等非搜索引擎问题导致的,对于此类404故障不进行处理,并且对于非搜索引擎问题导致的404故障,可以向用户反馈提示信息以提醒用户404故障是由网速问题导致,例如可能是由访问浏览器较慢导致的,因此对于非搜索引擎问题导致的404故障可以提醒用户更改访问浏览器。
[0056]103:当判断出企业URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的企业URL,避免在使用这些URL时再次引起404故障,使得网站的稳定性提高。
[0057]104:当记录信息中的目标URL为产品URL时,基于第二预设规则对产品URL进行判断,以判断产品URL引起的404故障是否是相应的搜索引擎导致的,如果是,则执行步骤105,如果否,说明产品URL引起的404故障是在用户访问网站时由于网速问题导致的,对于由于网速问题导致的404故障的产品URL不进行处理。
[0058]在本发明实施例中,基于第二预设规则对产品URL进行判断的可行方式是:当目标URL为产品URL时,获得产品URL对应的产品标识信息,其中产品标识信息作为产品的标识符,其可以将不同产品进行区分,也就是说每个产品具有唯一的产品标识信息,且对于不同广品来说具有不同的广品标识?目息。基于广品标识?目息,确定广品状态,在获得广品标识?目息后,可以从产品信息数据库中查找到与产品标识信息相对应的产品状态,以进一步基于产品状态,对产品URL进行判断。
[0059]在本发明实施例中,基于产品状态对产品URL进行判断时,会依据产品状态的不同,得到不同的判断结果,例如当产品状态为删除状态时,直接确定产品URL引起的404故障是相应的搜索引擎导致。其中当产品状态为删除状态,说明产品已经被下架,那么搜索引擎是无法提供产品对应的网站的,因此在产品状态为删除状态时,可以直接确定产品URL引起的404故障是相应的搜索引擎导致。
[0060]当产品状态是拘审状态时,自动向相应的搜索引擎发送产品URL,来测试是否能够接收到搜索引擎反馈的与产品URL对应的页面,如果没有接收到搜索引擎反馈的页面,则说明404故障是搜索引擎导致的;如果接收到搜索引擎反馈的页面,则说明之前出现的404故障是因为网速等非搜索引擎问题导致的,对于此类404故障不进行处理,并且对于非搜索引擎问题导致的404故障,可以向用户反馈提示信息以提醒用户404故障是由网速问题导致,例如可能是由访问浏览器较慢导致的,因此对于非搜索引擎问题导致的404故障可以提醒用户更改访问浏览器。
[0061]105:当判断出产品URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的产品URL,避免在使用这些URL时再次引起404故障,使得网站的稳定性提高。
[0062]从上述技术方案可知,本发明实施例提供的异常数据分析方法可以从网站运行日志中获取指示引起404故障的记录信息,当记录信息中的目标URL为企业URL时,基于第一预设规则对企业URL进行判断;当记录信息中的目标URL为产品URL时,基于第二预设规则对产品URL进行判断,实现通过不同预设规则分别对企业URL和产品URL的判断,并且当判断出企业URL或产品URL引起的404故障是相应的搜索引擎导致时,则会指示删除引起404故障的企业URL或产品URL,避免在使用这些URL时再次引起404故障,使得网站的稳定性提高,并且在网站的稳定性提高的情况下,搜索引擎被用户收录的概率增加,进而提高搜索引擎的收录率。
[0063]与上述方法实施例相对应,本发明实施例还提供一种异常数据分析装置,其结构示意图如图2所示,可以包括:获取单元11、第一判断单元12、第一删除单元13、第二判断单元14和第二删除单元15。
[0064]获取单元11,用于从网站运行日志中获取指示引起404故障的记录信息,其中记录信息用于记录网站日常运行情况,其包括但不限于:访问时间、访问浏览器、目标URL和访问来源等。访问时间,用于指示用户在何时访问网站,访问浏览器则用于指示采用何种类型的浏览器对网站进行访问,目标URL则用于指示具体访问哪个网站的页面,访问来源指示由哪个搜索引擎提供网站。
[0065]第一判断单元12,用于当记录信息中的目标统一资源定位符URL为企业URL时,基于第一预设规则对企业URL进行判断。
[0066]第一删除单元13,用于当判断出企业URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的企业URL。
[0067]在本发明实施例中第一判断单元12基于第一预设规则对企业URL进行判断,可以判断出企业URL引起的404故障是否是相应的搜索引擎导致的,如果是则触发第一删除单元13指示删除引起404故障的企业URL,以避免在使用这些URL时再次引起404故障,使得网站的稳定性提尚。
[0068]其中第一判断单元12可以包括:第一获取子单元、第一确定子单元和第一判断子单元。
[0069]第一获取子单元,用于当目标URL为企业URL时,获得企业URL对应的企业标识信息,其中企业标识信息作为企业的标识符,其可以将不同企业进行区分,也就是说每个企业具有唯一的企业标识信息,且对于不同企业来说具有不同的企业标识信息。第一确定子单元,用于基于企业标识信息,确定企业状态,在获得企业标识信息后,可以从企业信息数据库中查找到与企业标识信息相对应的企业状态,以进一步触发第一判断子单元,用于基于企业状态,对企业URL进行判断。
[0070]在本发明实施例中,基于企业状态对企业URL进行判断时,会依据企业状态的不同,得到不同的判断结果,例如当企业状态为禁言状态或关闭状态时,直接确定企业URL引起的404故障是相应的搜索引擎导致。其中当企业状态为禁言状态或者关闭状态,说明企业自身出现问题,那么搜索引擎是无法提供企业对应的网站的,因此在企业状态为禁言或者关闭状态时,可以直接确定企业URL引起的404故障是相应的搜索引擎导致。
[0071]当企业状态是拘审状态时,自动向相应的搜索引擎发送企业URL,来测试是否能够接收到搜索引擎反馈的与企业URL对应的页面,如果没有接收到搜索引擎反馈的页面,则说明404故障是搜索引擎导致的;如果接收到搜索引擎反馈的页面,则说明之前出现的404故障是因为网速等非搜索引擎问题导致的,对于此类404故障不进行处理,并且对于非搜索引擎问题导致的404故障,可以向用户反馈提示信息以提醒用户404故障是由网速问题导致,例如可能是由访问浏览器较慢导致的,因此对于非搜索引擎问题导致的404故障可以提醒用户更改访问浏览器。
[0072]第二判断单元14,用于当记录信息中的目标URL为产品URL时,基于第二预设规则对产品URL进行判断。
[0073]第二删除单元15,用于当判断出产品URL引起的404故障是相应的搜索引擎导致时,指示删除引起404故障的产品URL。
[0074]在本发明实施例中第二判断单元14基于第二预设规则对产品URL进行判断,可以判断出产品URL引起的404故障是否是相应的搜索引擎导致的,如果是则触发第二删除单元15指示删除引起404故障的产品URL,以避免在使用这些URL时再次引起404故障,使得网站的稳定性提尚。
[0075]其中第二判断单元12可以包括:第二获取子单元、第二确定子单元和第二判断子单元。
[0076]第
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1