一种分布数据异动判断定位方法及系统的制作方法

文档序号:8395947阅读:650来源:国知局
一种分布数据异动判断定位方法及系统的制作方法
【技术领域】
[0001]本发明涉及分布数据异动相关技术领域,特别是一种分布数据异动判断定位系统。
【背景技术】
[0002]在互联网行业,尤其在电子商务网站业务中,每时每刻都在产生海量的数据,通常这些数据里包括各种指标,且每个指标有不同的维度视角。指标如订单量、订单金额等,维度如省份、订单类型、支付方式等等。当一个指标发生波动时,每个维度相应数据也会随之波动。举例来说,当在线支付系统出现故障时,订单量、订单金额等指标总体上会受到影响,相应地,各种支付方式对应的订单量和订单金额会有波动,此外在其他维度如省份、订单类型上的数据也同样受影响。此时,如何从数据中找出是支付系统出问题导致的异常呢?
[0003]在市场环境多变、业务的优化升级、促销的此起彼伏等因素叠加,也会造成这些数据跌宕起伏。数据发生波动时,能否判定为异动(异常波动);异动情况下,如何在众多数据中准确、快速地定位,即甄别出异动指标主要源于哪些维度,是数据异动挖掘的核心问题。
[0004]对于异动数据定位,现有的技术大致采用基于阈值比较波动幅度的方法。具体来说,该方法对近期(如最近一周、最近一月)数据(具体维度上的相应数据)做加权平均计算出历史基准值,比较最新数据和历史基准值这两组数据,考察每个数据波动幅度,如果波动幅度超出某个阈值(阈值一般是凭经验人为设定)时,则判定数据发生了异动,并选其中波动幅度最大的作为造成数据异动的主因。
[0005]现有数据异动定位技术方案的主要缺点:总体来说,现有人工异动监测与定位主观性强,从怀疑异动到逐层分解定位到具体明细的异动维度所涉及的环节多、流程长、过程繁杂低效。具体来说,首先是阈值的人为主观设定,不够科学客观;其次是某些场景下(如节假日数据的惯性走低),基于阈值比较的方法容易导致误判;最后是当多组数据同时超出相应阈值时,通常很难定位数据异动的主因。

【发明内容】

[0006]基于此,有必要针对现有技术对数据异动难以准确判断的技术问题,提供一种分布数据异动判断定位方法及系统。
[0007]一种分布数据异动判断定位方法,包括:
[0008]分布数据准备步骤,包括:获取多维度分布数据,以及多维度基准值分布数据,所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值,由多个维度交叉组合得到多个维度组合,根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据,以及多个关于维度组合的当前维度组合分布数据,根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据,以及多个关于维度组合的历史维度组合基准值分布数据;
[0009]异动判定步骤,包括:将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动,结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据,将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动,结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据,如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。
[0010]一种分布数据异动判断定位系统,包括:
[0011]分布数据准备模块,用于:获取多维度分布数据,以及多维度基准值分布数据,所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值,由多个维度交叉组合得到多个维度组合,根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据,以及多个关于维度组合的当前维度组合分布数据,根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据,以及多个关于维度组合的历史维度组合基准值分布数据;
[0012]异动判定模块,用于:将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动,结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据,将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动,结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据,如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。
[0013]本发明对多维度分布数据分别在一级维度及维度组合上进行检验,克服了现有异动判定与异动定位方法的各种不足,使得异动判断更为迅速准确。
【附图说明】
[0014]图1为本发明一种分布数据异动判断定位方法的工作流程图;
[0015]图2为本发明一种分布数据异动判断定位系统的结构模块图;
[0016]图3为本发明最佳实施例的模块示意图。
【具体实施方式】
[0017]下面结合附图和具体实施例对本发明做进一步详细的说明。
[0018]如图1所示为本发明一种分布数据异动判断定位方法的工作流程图,包括:
[0019]步骤S101,包括:获取多维度分布数据,以及多维度基准值分布数据,所述多维度基准值分布数据为所述多维度分布数据的每个数据对应的历史基准值,由多个维度交叉组合得到多个维度组合,根据所述多维度分布数据分别生成多个关于一级维度的当前一级维度分布数据,以及多个关于维度组合的当前维度组合分布数据,根据所述多维度基准值分布数据分别生成多个关于一级维度的历史一级维度基准值分布数据,以及多个关于维度组合的历史维度组合基准值分布数据;
[0020]步骤S102,包括:将所述当前一级维度分布数据与对应的历史一级维度基准值分布数据进行比较得到每个当前一级维度分布数据相对于对应的历史一级维度基准值分布数据的结构异动,结构异动超过异动阈值的当前一级维度分布数据为异动一级维度分布数据,将所述当前维度组合分布数据与历史维度组合基准值分布数据进行比较得到每个当前维度组合分布数据相对于对应的历史维度组合基准值分布数据的结构异动,结构异动超过异动阈值的当前维度组合分布数据为异动维度组合分布数据,如果有异动一级维度分布数据或异动维度组合分布数据则进行告警。
[0021]步骤SlOl中,将多维度分布数据分解为关于一级维度的当前一级维度分布数据,以及多个关于维度组合的当前维度组合分布数据。每一个维度下包括多个数据。以订单量指标作为维度的在线支付系统的分布数据为例,省份、订单类型、支付方式等维度为一级维度,“省份_订单类型”、“省份_支付方式”、“订单类型_支付方式”、“省份_订单类型_支付方式”则为维度组合。每一维包括多个数据,例如省份维中可以包括:省份A的数据、省份B的数据、省份C的数据,而订单类型维中可以包括:订单类型D的数据、订单类型E的数据、订单类型F的数据,支付方式维可以包括:支付方式G的数据、支付方式H的数据、支付方式I的数据。则“省份_订单类型”包括:省份A且订单类型D的数据、省份A且订单类型E的数据、省份A且订单类型F的数据、省份B且订单类型D的数据、省份B且订单类型E的数据、省份B且订单类型F的数据、省份C且订单类型D的数据、省份C且订单类型E的数据、省份C且订单类型F的数据。“省份_支付方式”、“订单类型_支付方式”、“省
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1