对序列进行处理的装置和方法

文档序号:6489860阅读:193来源:国知局
对序列进行处理的装置和方法
【专利摘要】本发明涉及一种对序列进行处理的装置和方法。对序列进行处理的装置包括:划分单元,被配置用于以多个不同的子序列长度,分别将序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使相似度的平均值最大的子序列长度作为序列的周期;识别单元,被配置用于在与周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对异常子序列进行校正以获得新的序列。
【专利说明】对序列进行处理的装置和方法
【技术领域】
[0001]本发明涉及数据处理领域,具体涉及对序列进行处理的装置和方法。
【背景技术】
[0002]短期负荷预测(Short Term Load Forecasting, STLF)的目的在于预测特定时间间隔(如,一天或一星期)内的系统负荷。短期负荷预测用于对系统的操作进行控制和规划。进一步的分析,如负荷流分析,也是基于短期负荷预测的结果。
[0003]大多数基于短期负荷预测的传统方法一般通过选择不同的预测模型,如线性回归(Linear Regression)模型、指数平滑(Exponential Smoothing)模型、随机处理(Stochastic Process)模型、自回归-滑动平均(Auto-Regressive Moving Average,ARMA)模型、数据挖掘模型、以及人工神经网络(Artificial Neural Networks,ANN)模型。然而,各种模型都可能受到数据中的噪声的影响。但在现存的技术中,很少考虑到识别数据中的噪声并去除噪声或异常,但这对于预测而言是很重要的。
[0004]因此,需要一种能够识别并去除数据中的噪声或异常的技术。

【发明内容】

[0005]在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
[0006]本发明的一个主要目的在于,提供一种对序列进行处理的装置和方法。
[0007]根据本发明的一个方面,提供了一种对序列进行处理的装置,包括:划分单元,被配置用于以多个不同的子序列长度,分别将序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使相似度的平均值最大的子序列长度作为序列的周期;识别单元,被配置用于在与周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对异常子序列进行校正以获得新的序列。
[0008]根据本发明的另一个方面,提供了一种对序列进行处理的方法,包括:以多个不同的子序列长度,分别将序列划分为多个子序列;针对每一个子序列长度,计算每两个子序列之间的相似度;确定使相似度的平均值最大的子序列长度作为序列的周期;在与周期对应的多个子序列中识别异常子序列;以及对异常子序列进行校正以获得新的序列。
[0009]另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
[0010]此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
[0011]通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。【专利附图】

【附图说明】
[0012]参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
[0013]图1是示出根据本发明的实施例的对序列进行处理的方法100的流程图;
[0014]图2示出了对电力负荷时间序列进行划分后的连续多个子序列的图;
[0015]图3是示出根据本发明的实施例的对序列进行处理的装置300的结构的框图;
[0016]图4是示出根据本发明的实施例的对序列进行处理的装置300’的结构的框图
[0017]图5是示出根据本发明的实施例的对序列进行处理的装置300”的结构的框图;
[0018]图6是示出根据本发明的实施例的对序列进行处理的装置300’ ”的结构的框图;以及
[0019]图7是示出可以用于实施本发明的对序列进行处理的方法和装置的计算设备的举例的结构图。
【具体实施方式】
[0020]在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
[0021]在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
[0022]图1是示出根据本发明的实施例的对序列进行处理的方法100的流程图。
[0023]如图1所示,在步骤S102中,可以按照多个不同的子序列长度,分别将序列划分为多个子序列。假设序列的总长度为100,则可以按照各种子序列长度1、2、3、4……分别对序列进行划分,从而分别得到100个子序列、50个子序列、33个子序列、25个子序列……
[0024]在步骤S104中,可以针对每一个子序列长度,计算每两个子序列之间的相似度。仍假设序列的总长度为100,可以计算划分出的100个子序列中每两个之间的相似度、50个子序列中每两个之间的相似度、33个子序列中每两个之间的相似度、25个子序列中每两个之间的相似度……
[0025]在步骤S106中,确定使相似度的平均值最大的子序列长度作为序列的周期。仍假设序列的总长度为100,如果用子序列长度4得到的25个子序列中每两个之间的相似度的平均值大于以其他子序列长度划分出的子序列每两个之间的相似度的平均值,则确定4作为序列的周期。也就是说,可以对各种可能的周期长度进行扫描,最可能的周期长度所得到的子序列之间总体来说应是最相似的,据此原理确定序列的周期。
[0026]假设序列X 被表示为Sl,S2,…,Sn,其中η为大于I的整数,则可以通过下式来确定周期m,m为大于等于I的整数,
[0027]
【权利要求】
1.一种对序列进行处理的装置,包括: 划分单元,被配置用于以多个不同的子序列长度,分别将所述序列划分为多个子序列; 相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度; 周期确定单元,被配置用于确定使所述相似度的平均值最大的子序列长度作为所述序列的周期; 识别单元,被配置用于在与所述周期对应的多个子序列中识别异常子序列;以及 校正单元,被配置用于对所述异常子序列进行校正以获得新的序列。
2.根据权利要求1所述的装置,其中,所述识别单元包括: 相似度计算子单元,被配置用于计算所述多个子序列中每两个子序列之间的相似度;以及 确定子单元,被配置用于确定下述子序列作为所述异常子序列:该子序列与其他子序列的相似度,总体上小于其他子序列中每两个子序列之间的相似度。
3.根据权利要求1所述的装置,其中,所述识别单元包括: 相似度计算子单元,被配`置用于计算待预测子序列所在周期中的已知部分与所述多个子序列中的每个子序列的对应部分的相似度;以及 确定子单元,被配置用于确定所述相似度较小的子序列作为所述异常子序列。
4.根据权利要求1所述的装置,其中,所述校正单元包括: 生成子单元,被配置用于至少基于所述多个子序列中的正常子序列来生成所述新的子序列;以及 替代子单元,被配置用于以所述新的子序列替代所述异常子序列,从而获得的新序列。
5.根据权利要求4所述的装置,其中,所述替代子单元被配置用于,在存在多个连续的异常子序列的情况下,以小于等于所述连续的异常子序列的数量的新的子序列来替代所述连续的异常子序列。
6.根据权利要求5所述的装置,其中,所述替代子单元被配置用于以相同的新的子序列替代所述连续的异常子序列中的各异常子序列。
7.根据权利要求4所述的装置,其中,所述生成子单元被配置用于根据在所述异常子序列之前的一个或多个正常子序列、和/或在所述异常子序列之后的一个或多个正常子序列来生成所述新的子序列。
8.根据权利要求4所述的装置,其中,所述生成子单元被配置用于根据所述正常子序列的变化幅度来缩放所述异常子序列的变化幅度,以生成所述新的子序列。
9.根据权利要求1至8中任一项所述的装置,还包括: 预测单元,被配置用于利用所述新的序列进行预测。
10.一种对序列进行处理的方法,包括: 以多个不同的子序列长度,分别将所述序列划分为多个子序列; 针对每一个子序列长度,计算每两个子序列之间的相似度; 确定使所述相似度的平均值最大的子序列长度作为所述序列的周期; 在与所述周期对应的多个子序列中识别异常子序列;以及对所述异常子序列进行校正以获得 新的序列。
【文档编号】G06F19/00GK103729530SQ201210391204
【公开日】2014年4月16日 申请日期:2012年10月15日 优先权日:2012年10月15日
【发明者】杨宇航, 夏迎炬, 于浩 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1