应用性能受影响的用户分布检测方法及系统的制作方法

文档序号:6374884阅读:237来源:国知局
专利名称:应用性能受影响的用户分布检测方法及系统的制作方法
应用性能受影响的用户分布检测方法及系统技术领域
本发明涉及一种应用性能受影响的用户分布检测方法及系统,尤其是涉及一种基于数据挖掘技术的应用性能受影响的用户分布检测方法及系统。背景技术
在一个大型局域网中,经常会出现局部网速比较慢甚至瘫痪的情况,影响正常的工作和学习。然而,因当前没有这样一种技术,可对网络日志进行挖掘分析,获取应用性能受影响用户的分布状况,故,无法优化受影响用户的网络,造成受影响用户的网络瘫痪。
发明内容
为了解决上述问题,本发明的目的是提供一种应用性能受影响的用户分布检测方法。该方法基于数据挖掘技术,通过对用户访问日志数据的挖掘和分析,获取网络性能较差用户的分布区域,以便及时优化网络性能差分布区域用户的网络。本发明的另一目的是提供一种应用性能受影响的用户分布检测系统。其中,本发明一实施方式的应用性能受影响的用户分布检测方法包括以下步骤
51、将用户根据IP划分区域,形成区域树;
52、设置访问时间阈值,记录超过所述阈值的超时时间;
53、获取并处理设备日志数据;
54、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间;
55、遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间;
56、遍历区域树,通过计算检测受影响用户分布。作为本发明的进一步改进,所述区域树的的叶子节点为IP,根节点为整个局域网顶层设备。作为本发明的进一步改进,所述S3步骤具体包括
获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应时间。作为本发明的进一步改进,所述S4步骤包括
将聚类汇总后的汇总值存储在区域树对应的叶子节点。作为本发明的进一步改进,所述S6步骤包括
根据计算结果标记所有区域树上的节点网络健康情况。相应地,本发明一实施方式的应用性能受影响的用户分布检测系统包括
划分单元,用于将用户根据IP划分区域,形成区域树;
设置单元,用于设置访问时间阈值,记录超过所述阈值的超时时间;
日志单元,用于获取并处理设备日志数据;
聚类单元,用于将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间;统计单元,用于遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间;
计算单元,用于遍历区域树,通过计算检测受影响用户分布。作为本发明的进ー步改进,所述区域树的的叶子节点为IP,根节点为整个局域网顶层设备。作为本发明的进ー步改进,所述日志単元具体用于
获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应时间。作为本发明的进ー步改进,所述聚类単元还用于
将聚类汇总后的汇总值存储在区域树对应的叶子节点。 作为本发明的进ー步改进,所述计算単元还用于
根据计算结果标记所有区域树上的节点网络健康情況。相比于现有技术,本发明通过对海量日志的分析,可以准确的定位应用性能受影响用户的分布情况,及时的发现网络性能不健康或潜在不健康的用户区域,防止网络瘫痪。

图I是本发明一实施例的应用性能受影响的用户分布检测方法的流程 图2是本发明一实施例的应用性能受影响的用户分布检测系统的模块图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。如图I所示,在本发明ー实施方式中,应用性能受影响的用户分布检测方法,包括以下步骤
51、将用户根据IP划分区域,形成区域树;优选地,区域标记为21,211,212,22,222···,树的叶子节点为IP,根节点为整个局域网顶层设备,区域树命名为ZoneTree ;
52、设置访问时间阈值RTT(Request time threshold),如果访问时间超过阈值,认为是网络性能较差的用户,记录访问超时时间RTO (Request time out);
53、获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应时间,提闻下一步统计的效率,以及内存的利用率;
54、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间,优选地,通过汇总条件的哈希算法进行数据归类,并求平均访问时间,将汇总值存储在区域树对应的叶子节点;
55、二次统计,自底向上遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间;
56、自顶向下遍历区域树,通过计算检测受影响用户分布,计算公式为,影响用户区域AVG>RTT&&MAX<RT0 ;健康度(1-AVG/RTT) *100% ;标记所有区域树上的节点网络健康情況,如果父区域不健康且该区域的所有子区域都不健康,则标记父区域不健康,否父区域健康,标记为不健康的字区域不健康,依次递归查找。如图2所示,在本发明ー实施方式中,应用性能受影响的用户分布检测系统,包括划分单元,用于将用户根据IP划分区域,形成区域树;优选地,区域标记为Z1,Zll, Z12,12, Z22···,树的叶子节点为IP,根节点为整个局域网顶层设备,区域树命名为ZoneTree ;
设置单元,用于设置访问时间阈值RTT(Request time threshold),如果访问时间超过阈值,认为是网络性能较差的用户,记录访问超时时间RTO (Request time out);
日志单元,用于获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应时间,提高下一步统计的效率,以及内存的利用率;
聚类单元,用于将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间,优选地,通过汇总条件的哈希算法进行数据归类,并求平均访问时间,将汇总值存储在区域树对应的叶子节点;
统计单元,用于二次统计,自底向上遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间; 计算单元,用于自顶向下遍历区域树,通过计算检测受影响用户分布,计算公式为,影响用户区域AVG>RTT&&MAX〈RTO ;健康度(1-AVG/RTT) *100% ;标记所有区域树上的节点网络健康情况,如果父区域不健康且该区域的所有子区域都不健康,则标记父区域不健康,否父区域健康,标记为不健康的字区域不健康,依次递归查找。综上所述,本发明通过对海量日志的分析,可以准确的定位应用性能受影响用户的分布情况,及时的发现网络性能不健康或潜在不健康的用户区域,防止网络瘫痪。应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
权利要求
1.一种应用性能受影响的用户分布检测方法,其特征在于,所述方法包括 51、将用户根据IP划分区域,形成区域树; 52、设置访问时间阈值,记录超过所述阈值的超时时间; 53、获取并处理设备日志数据; 54、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间; 55、遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间; 56、遍历区域树,通过计算检测受影响用户分布。
2.根据权利要求I所述的应用性能受影响的用户分布检测方法,其特征在于,所述区域树的的叶子节点为IP,根节点为整个局域网顶层设备。
3.根据权利要求I所述的应用性能受影响的用户分布检测方法,其特征在于,所述S3步骤具体包括 获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应时间。
4.根据权利要求I所述的应用性能受影响的用户分布检测方法,其特征在于,所述S4步骤包括 将聚类汇总后的汇总值存储在区域树对应的叶子节点。
5.根据权利要求I所述的应用性能受影响的用户分布检测方法,其特征在于,所述S6步骤包括 根据计算结果标记所有区域树上的节点网络健康情况。
6.一种应用性能受影响的用户分布检测系统,其特征在于,所述系统包括 划分单元,用于将用户根据IP划分区域,形成区域树; 设置单元,用于设置访问时间阈值,记录超过所述阈值的超时时间; 日志单元,用于获取并处理设备日志数据; 聚类单元,用于将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间; 统计单元,用于遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间; 计算单元,用于遍历区域树,通过计算检测受影响用户分布。
7.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述区域树的的叶子节点为IP,根节点为整个局域网顶层设备。
8.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述日志单元具体用于 获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应时间。
9.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述聚类单元还用于 将聚类汇总后的汇总值存储在区域树对应的叶子节点。
10.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述计算单元还用于 根据计算结果标记所有区域树上的节点网络健康情況。
全文摘要
本发明提供了一种应用性能受影响的用户分布检测方法及系统,其中,所述方法包括S1、将用户根据IP划分区域,形成区域树;S2、设置访问时间阈值,记录超过所述阈值的超时时间;S3、获取并处理设备日志数据;S4、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平均访问时间;S5、遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时间,和所有域名的平均访问时间;S6、遍历区域树,通过计算检测受影响用户分布。本发明可以准确的定位应用性能受影响用户的分布情况,及时的发现网络性能不健康或潜在不健康的用户区域,防止网络瘫痪。
文档编号G06F17/30GK102868548SQ20121028817
公开日2013年1月9日 申请日期2012年8月15日 优先权日2012年8月15日
发明者高华, 姚春秋 申请人:苏州迈科网络安全技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1