数据预测方法和系统以及报警方法和系统的制作方法

文档序号:8922772阅读:574来源:国知局
数据预测方法和系统以及报警方法和系统的制作方法
【技术领域】
[0001] 本发明涉及一种对网站多种指标的数据预测以及网站的运营状况的衡量,特别涉 及一种网站指标的数据预测方法和数据预测系统以及报警方法和报警系统。
【背景技术】
[0002] 目前很多网站监控只针对个别指标,且只能发现较为明显的异常,使用的方法也 比较单一,比如聚类、箱线图等。现有技术中,针对网站指标例如浏览量的数据预测这一块, 许多学者提出众多预测方法,比如利用一般的ARIMA模型(AutoregressiveIntegrated MovingAverageModel,差分自回归移动平均模型),但这一类模型很少考虑季节、节假日等 因素对数据预测的影响,所以较为简单的ARIMA模型预测出的数据相对不准确。并且其他 很多数据预测模型仅仅停留在理论讨论阶段,由于没有考虑到真实数据的杂乱性,这些数 据预测模型很少应用于实际应用中。另外还有类似卡尔曼滤波算法,但此类算法适用于实 时数据以及变化比较稳定的数据预测,并不适用于旅游网站(周末数据明显较低)等网站流 量的数据预测及监控。

【发明内容】

[0003] 本发明要解决的技术问题是为了克服现有技术中对网站指标的数据进行预测的 方法有些算法简单,预测出的数据不准确,有些算法无法应用至实际场合中的缺陷,提供一 种具有准确预测出网站指标的数据及多种指标出现异常时及时报警的功能的网站指标的 数据预测方法和系统以及报警方法和系统。
[0004] 本发明是通过下述技术方案来解决上述技术问题的:
[0005] 本发明提供一种网站指标的数据预测方法,其特点在于,其包括以下步骤:
[0006] Si、采集一预设区域内的一指标的历史数据,按照时间周期对该些历史数据进行 分类,且每一时间周期内的历史数据按照日期先后顺序分类;
[0007] S2、将每一时间周期内的历史数据划分为标准数据和待修正数据,根据标准数据 对待修正数据进行修正,修正后的数据和标准数据构成历史优化数据;
[0008] S3、根据该些历史优化数据通过ARIMAX模型(带有输入序列的一般ARIMA模型被 称为ARIMAX模型)计算一预测日期该指标的预测数据。
[0009] 历史数据是某一预测日期的数据预测的基础,例如网站的浏览量历史数据,由于 周末或国家法定节假日时浏览网页的用户明显减少,即这些时间的浏览量历史数据明显偏 低,这些明显偏低的数据的出现是不可避免的。若是通过未修正的浏览量历史数据进行预 测日期的数据预测,则会使得预测出的数据相对不准确,无法精确的反映出预测日期的浏 览量,影响预测体系的预测精度。因此在步骤S2中,对历史数据进行了修正。
[0010] 将修正后的历史优化数据带入ARIMAX模型进而预测出一预测日期某一指标例如 浏览量的预测数据,且预测出的该预测数据较为准确,能够相对真实的反映出该预测日期 的浏览量情况。
[0011] 较佳地,在步骤s2中,对于任一时间周期内的任一待修正数据,修正操作包括:
[0012] 利用公式
计算该待修正数据的修正参数,其中r为该时间周期内 标准数据的个数,R为该待修正数据,Rk为该时间周期内第k个标准数据,r为正整数且 1 ^k^r;
[0013] 修正后的数据为该待修正数据与该修正参数的乘积;
[0014] 在步骤s3之后,包括以下步骤:
[0015] S4、判断该预测数据是否需要修正,若是则进入步骤S5,若否则结束流程;
[0016] S5、利用公式
计算该预测数据的预测修正参数,其中S为该预测日期对 应的时间周期内标准数据的个数,F为该预测数据,Fm为该预测日期对应的时间周期内第m个标准数据,s为正整数且1 <m<s;
[0017] s6、该预测日期该指标的实际预测数据为该预测数据与该预测修正参数的商。
[0018] 较佳地,在步骤s2之后包括以下步骤,设定Xi为该预测日期之前的第i天的历史 优化数据,i为遍历1至n的整数,针对任一i:
[0019] 通过公式
计算该第i天对应的平均数,其中,yij表示该第i天所处时 间周期之前的第j个时间周期对应日期的历史优化数据,J为正整数且1彡j彡J;
[0020] 将历史优化数据yn至按照从小到大或从大到小顺序进行排序以形成一数据序 列;
[0021] 当J为奇数时,该第i天对应的中位数乂为该数据序列中处于中间位置的历史优 化数据,当J为偶数时,Mi为该数据序列中处于中间位置的两个历史优化数据的平均值;
[0022] 计算第一平均值
[0023] 计算第一相关性
、第二相关性
'并取A和r2中的较大值作为先验指标xt ;
[0024] 在步骤S3 中,利用模型 (B)C>s(Bs)yt =ii而+? (B) ?S(BS)eV(〇.of)计 算该预测数据,其中,〇(B)为自回归算子且〇(B) =l-chB-小忑2-…-ctpBp,p为自回归项 数,〇s(Bs)为季节性自回归算子且〇s(Bs) = --小PBPS,?⑶为移动平均 算子且?⑶=1-e0 2B2-- 0qB%q为移动平均项数,?s (Bs)为季节性移动平均算子 且?S(BS) = 1- 0 0 2B2s-0qB9S,yt为该预测数据,y和@ :为预设参数。
[0025] 其中,预设参数U和^均是一种经验值,通过R(R是一套完整的数据处理、计 算和制图软件系统)程序不断地训练可以实现对U和的预测。
[0026] 模型 〇 ⑶ 〇s (Bs)yt =ii+ 3 lXt+ ? ⑶ ?s (Bs)et 是对ARIMAX模型的优化,在 ARIMAX模型中加入了影响因子PlXt,将根据平均数计算出的第一相关性和根据中位数计 算出的第二相关性进行比较,并将比较出的较大值作为xt带入上述模型。
[0027] 较佳地,在步骤S2之后包括以下步骤,设定每年被划分为V个时间段,该预测日期 所处的时间段为第a个时间段,V为正整数且1彡a彡V:
[0028] 计算该预测日期所处时间段对应的时间段指数

[0029] 其中, U为正整数且1彡u彡U,1彡v彡V; f
[0030] Fau为该预测日期所处年份之前的第u年第a个时间段的历史优化数据,Uj该预 测日期所处年份之前的U年中各年第a个时间段的历史优化数据的平均值,Fvu为该预测日 期所处年份之前的第u年第v个时间段的历史优化数据,万为该预测日期所处年份之前的 U年中各年各时间段的历史优化数据的总平均值;
[0031 ] 在步骤S3中,利用模型①⑶①s (Bs)yt =ii+ @而+ @ 2ft+ ?⑶?s (Bs)et计算该 预测数据,其中,为预设参数,通过R程序预测出。
[0032] 模型①⑶ 〇s (Bs)yt =ii+ 3 lXt+ 3 2ft+ ? ⑶ ?s (Bs)et 是对ARIMAX模型的进一 步优化,在ARIMAX模型中又加入了影响因子P2ft。
[0033] 较佳地,在步骤S2之后包括以下步骤:
[0034] 判断该预测日期是否为一设定日期,若是则设定日期因子的信号指标gt为1,若否 则该信号指标gt为〇 ;
[0035] 在步骤S3中,利用模型①⑶①s(Bs)yt =ii+3而+3 2ft+3 3gt+?⑶?S(BS)et计 算该预测数据,其中,0 3为预设参数,通过R程序预测出。
[0036] 模型 〇 ⑶ 〇s (Bs)yt =ii+ 3 lXt+ 3 2ft+ 3 3gt+ ? ⑶ ?s (Bs)et 是对ARIMAX模型的 进一步优化,在ARIMAX模型中又加入了影响因子P3gt。
[0037] 较佳地,在步骤S3之后包括以下步骤:
[0038] 计算该预测日期对应的标准误差 则该预测数据的置信区间 f 为[F- 0Se,F+ 0SJ,其中W为正整数且1彡w彡W,Xw为该预测日期之前的第w天的历史优 化数据,FWS该预测日期之前的第w天的预测数据,F为该预测数据,0为标准正态分布的
分位数,a为置信度;
[0039] 判断该预测日期该指标的实际数据是否在该置信区间内,若是则输出一表示该指 标正常的第一信息,若否则输出一表不该指标异常的第二信息。
[0040] 较佳地,判断该实际数据是否在[(F-eSe) (l-stl),(F+ 0Se) (1+Stl)]内,若是则输 出该第一信息,若否则输出该第二信息,其中,stl为一第一设定阈值。
[0041] 较佳地,设该指标的现有置信区间为[cn,ci2],判断该实际数据是否同时在 [(F-@Se) (1-St2),(F+@Se) (1+St2)]和[Cn(l-St2),Ci2(l+St2)]外,若是则输出该第二信息, 若否则输出该第一信息,其中,st2为一第二设定阈值。
[0042] 本发明还提供一种报警方法,其特点在于,一预测日期N个指标中每一指标的置 信区间均通过上述的数据预测方法实现、每一指标均具有一现有置信区间,判断该N个指 标中是否存在d个指标的每一指标的实际数据在对应的置信区间和现有置信区间外、且该 d个指标的每一指标的实际数据与对应的置信区间的左区间或右区间的差值的绝对值大于 一第三设定阈值同时与对应的现有置信区间的左区间或右区间的差值的绝对值大于一第 四设定阈值,若是则输出报警信息;
[0043] 其中,d和N均为正整数。
[0044] 较佳地,指标为网页跳出率、转化率、浏览量、网页浏览率、浏览器浏览率或主要来 源浏览率。
[0045] 较佳地,每一指标的现有置信区间的获取方法为标准差方法、周次规律侦测方法 或分位数方法。
[0046] 本发明还提供一种网站指标的数据预测系统,其特点在于,其包括一分类模块、一 修正模块和一第一计算模块;
[0047] 该分类模块用于采集一预设区域内的一指标的历史数据,按照时间周期对该些历 史数据进行分类,且每一时间周期内的历史数据按照日期先后顺序分类;
[0048] 该修正模块用于将每一时间周期内的历史数据划分为标准数据和待修正数据,根 据标准数据对待修正数据进行修正,修正后的数据和标准数据构成历史优化数据;
[0049] 该第一计算模块用于根据该些历史优化数据通过ARIMAX模型计算一预测日期该 指标的预测数据。
[0050] 较佳地,该修正模块包括一第二计算模块和一第三计算模块,对于任一时间周期 内的任一待修正数据,该第二计算模块用于利用公式
计算该待修正数据的修正 参数,其中r为该时间周期内标准数据的个数,R为该待修正数据,Rk为该时间周期内第k个标准数据,1为正整数且1 <k< 1,该第三计算模块用于通过该待修正数据与该修正参 数的乘积计算修正后的数据;
[0051] 该数据预测系统还包括一第一判断模块、一第四计算模块和一第五计算模块,该 第一判断模块用于判断该预测数据是否需要修正,若是则调用该第四计算模块;
[0052] 该第四计算模块用于利用公式
计算该预测数据的预测修正参数,其中 s为该预测日期对应的时间周期内标准数据的个数,F为该预测数据,Fm为该预测日期对应 的时间周期内第m个标准数据,s为正整数且1彡m彡s;
[0053] 该第五计算模块用于通过该预测数据与该预测修正参数的商计算该预测日期该 指标的实际预测数据。
[0
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1