对序列进行处理的装置和方法

文档序号:6489847阅读:129来源:国知局
对序列进行处理的装置和方法
【专利摘要】本发明涉及对序列进行处理的装置和方法。对序列进行处理的装置包括:指示性子序列提取单元,被配置用于从序列中提取待预测子序列之前的、对待预测子序列有指示性作用的指示性子序列;种子提取单元,被配置用于从序列中提取与指示性子序列最相似的子序列作为种子;第一子序列提取单元,被配置用于从序列中提取跟随在种子之后的以下第一子序列:该第一子序列和种子之间的位置关系与待预测子序列和指示性子序列之间的位置关系相同,且该第一子序列与待预测子序列等长;以及类似子序列提取单元,被配置用于从序列中提取与第一子序列有类似的变化趋势的多个子序列,以用于预测待预测子序列。
【专利说明】对序列进行处理的装置和方法
【技术领域】
[0001]本发明涉及数据处理领域,具体涉及对序列进行处理的装置和方法。
【背景技术】
[0002]短期负荷预测(Short Term Load Forecasting, STLF)的目的在于预测特定时间间隔(如,一天或一星期)内的系统负荷。短期负荷预测用于对系统的操作进行控制和规划。进一步的分析,如负荷流分析,也是基于短期负荷预测的结果。
[0003]大多数基于短期负荷预测的传统方法一般通过选择不同的预测模型,如线性回归(Linear Regression)模型、指数平滑(Exponential Smoothing)模型、随机处理(Stochastic Process)模型、自回归-滑动平均(Auto-RegressiveMoving Average,ARMA)模型、数据挖掘模型、以及人工神经网络(ArtificialNeural Networks, ANN)模型。然而,对训练数据或历史数据的处理往往对最终所得到的结果有直接的影响,因而训练数据或历史数据的处理是很关键的。
[0004]因此,需要一种能够对训练数据或历史数据进行处理的技术。

【发明内容】

[0005]在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
[0006]本发明的一个主要目的在于,提供对序列进行处理的装置和方法。
[0007]根据本发明的一个方面,提供了一种对序列进行处理的装置,包括:指示性子序列提取单元,被配置用于从序列中提取待预测子序列之前的、对待预测子序列有指示性作用的指示性子序列;种子提取单元,被配置用于从序列中提取与指示性子序列最相似的子序列作为种子;第一子序列提取单元,被配置用于从序列中提取跟随在种子之后的以下第一子序列:该第一子序列和种子之间的位置关系与待预测子序列和指示性子序列之间的位置关系相同,且该第一子序列与待预测子序列等长;以及类似子序列提取单元,被配置用于从序列中提取与第一子序列有类似的变化趋势的多个子序列,以用于预测待预测子序列。
[0008]根据本发明的另一个方面,提供了一种对序列进行处理的方法,包括:从序列中提取待预测子序列之前的、对待预测子序列有指示性作用的指示性子序列;从序列中提取与指示性子序列最相似的子序列作为种子;从序列中提取跟随在种子之后的以下第一子序列:该第一子序列和种子之间的位置关系与待预测子序列和指示性子序列之间的位置关系相同,且该第一子序列与待预测子序列等长;以及从序列中提取与第一子序列有类似的变化趋势的多个子序列,以用于预测待预测子序列。
[0009]另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
[0010]此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
[0011]通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
【专利附图】

【附图说明】
[0012]参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
[0013]图1是示出根据本发明实施例的对序列进行处理的装置的结构的框图;
[0014]图2示出了电力负荷时间序列的图;
[0015]图3是示出根据本发明实施例的对序列进行处理的装置的结构的框图;
[0016]图4是示出根据本发明实施例的对序列进行处理的装置的结构的框图
[0017]图5是示出根据本发明实施例的对序列进行处理的装置的结构的框图;
[0018]图6是示出根据本发明实施例的对序列进行处理的装置的结构的框图;
[0019]图7是示出根据本发明实施例的对序列进行处理的方法的流程图;
[0020]图8是示出提取指示性子序列的步骤S702的过程的流程图;
[0021]图9是示出从序列中提取与第一子序列有类似的变化趋势的多个子序列的步骤S708的过程的流程图;以及
[0022]图10是示出可以用于实施本发明的对序列进行处理的装置和方法的计算设备的举例的结构图。
【具体实施方式】
[0023]下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
[0024]图1是示出根据本发明实施例的对序列进行处理的装置100的结构的框图。
[0025]如图1所示,装置100可以包括指示性子序列提取单元102、种子提取单元104、第一子序列提取单元106和类似子序列提取单元108。
[0026]指示性子序列提取单元102可以从序列中提取待预测子序列之前的、对待预测子序列有指示性作用的子序列,作为指示性子序列。指示性子序列可以紧邻在待预测子序列之前,或者可以与待预测子序列相隔一段距离。
[0027]如果序列的周期是已知的,则指示性子序列提取单元102可以将待预测子序列所在周期中的已知子序列确定为指示性子序列。
[0028]图2示出了电力负荷时间序列的图。如图2所示,指示性子序列提取单元102可以将待预测子序列P所在周期Sll中的已知部分I确定为指示性子序列I。或者,指示性子序列提取单元102可以将待预测子序列所在周期中的已知部分I的一部分确定为指示性子序列。
[0029]种子提取单元104可以从序列中提取与指示性子序列最相似的子序列作为种子。[0030]例如,种子提取单元104可以从序列中提取与指示性子序列等长的多个子序列,然后分别计算这些子序列与指示性子序列之间的相似度,最后提取相似度最大的子序列作为种子。
[0031]如图2所示,通过上述处理,种子提取单元104可以提取与指示性子序列I最相似的子序列I’作为种子。
[0032]第一子序列提取单元106可以从序列中提取跟随在种子之后的以下第一子序列:该第一子序列和种子之间的位置关系与待预测子序列和指示性子序列之间的位置关系相同,且该第一子序列与待预测子序列等长。
[0033]如图2所示,第一子序列提取单元106可以从序列中提取第一子序列P’,第一子序列P’和种子I’的位置关系与待预测子序列P和指示性子序列I之间的位置关系相同,并且第一子序列P’与待预测子序列P等长。如图2所示,第一子序列P’与种子I’紧密相邻,待预测子序列P和指示性子序列I紧密相邻。但是,容易理解到,只要第一子序列PlP种子I’的位置关系与待预测子序列P和指示性子序列I之间的位置关系相同就可以,而不一定局限于紧密相邻这种位置关系。
[0034]可以看出,通过种子提取单元104提取种子的目的在于,第一子序列提取单元106可以以种子为线索,去寻找在位置上在形状上有可能类似于待预测目标的子序列。
[0035]类似子序列提取单元108可以从序列中提取与第一子序列有类似的变化趋势的多个子序列,以用于预测待预测子序列。
[0036]类似子序列提取单元108可以基于以下各项中的至少一项来提取与第一子序列有类似的变化趋势的多个子序列:(1)与第一子序列相似的多个子序列的每个子序列与第一子序列的相似度;(2)与第一子序列相似的多个子序列中的每个子序列和之前的指示性子序列的结合与第一子序列和种子的结合之间的相似度;以及(3)与第一子序列相似的多个子序列中的每个子序列之前的指示性子序列与待预测子序列之前的指示性子序列之间的相似度。
[0037]在(I)中,通过与第一子序列相似的子序列与第一子序列之间的相似度来提取与第一子序列有类似的变化趋势的多个子序列。在(2)和(3)中描述的与第一子序列相似的多个子序列中的每个子序列之前的指示性子序列指的是,对与第一子序列相似的子序列有指示性作用的子序列。
[0038]如图2所示,类似子序列提取单元108可以从序列中提取与第一子序列P’有类似的变化趋势的子序列Pl和P2,以用于预测待预测子序列P。
[0039]尽管在以上的描述中,以电力负荷时间序列为例进行描述,但是容易理解到,本文所描述的序列不限于电力负荷序列,而可以是任意其他序列,如燃气负荷时间序列、用水负荷时间序列或交通负荷时间序列。此外,本文所描述的序列不局限于时间序列,而可以是具有某种变化趋势的任意其他序列。
[0040]图3是示出根据本发明实施例的对序列进行处理的装置100’的结构的框图。
[0041]图3所示的装置100’与图1所示的装置100的不同之处在于,装置100’还包括周期确定单元110。
[0042]周期确定单元110可以通过以下方式来确定周期。
[0043]首先,周期确定单元110可以按照多个不同的子序列长度,分别将序列划分为多个子序列。假设序列的总长度为100,则周期确定单元110可以按照各种子序列长度1、2、
3、4……分别对序列进行划分,从而分别得到100个子序列、50个子序列、33个子序列、25个子序列……
[0044]然后,周期确定单元110可以针对每一个子序列长度,计算每两个子序列之间的相似度。仍假设序列的总长度为100,周期确定单元110可以计算划分出的100个子序列中每两个之间的相似度、50个子序列中每两个之间的相似度、33个子序列中每两个之间的相似度、25个子序列中每两个之间的相似度……
[0045]最后, 周期确定单元110可以确定使相似度的平均值最大的子序列长度作为序列的周期。仍假设序列的总长度为100,如果用子序列长度4得到的25个子序列中每两个之间的相似度的平均值大于以其他子序列长度划分出的子序列每两个之间的相似度的平均值,则确定4作为序列的周期。也就是说,可以对各种可能的周期长度进行扫描,最可能的周期长度所得到的子序列之间总体来说应是最相似的,据此原理确定序列的周期。
[0046]假设序列X被表示为Sl,S2,…,Sn,其中η为大于I的整数,则可以通过下式来确定周期m,m为大于等于I的整数,
[0047]
【权利要求】
1.一种对序列进行处理的装置,包括: 指示性子序列提取单元,被配置用于从所述序列中提取待预测子序列之前的、对所述待预测子序列有指示性作用的指示性子序列; 种子提取单元,被配置用于从所述序列中提取与所述指示性子序列最相似的子序列作为种子; 第一子序列提取单元,被配置用于从所述序列中提取跟随在所述种子之后的以下第一子序列:该第一子序列和所述种子之间的位置关系与所述待预测子序列和所述指示性子序列之间的位置关系相同,且该第一子序列与所述待预测子序列等长;以及 类似子序列提取单元,被配置用于从所述序列中提取与所述第一子序列有类似的变化趋势的多个子序列,以用于预测所述待预测子序列。
2.根据权利要求1所述的装置,其中,所述指示性子序列提取单元还被配置用于将所述待预测子序列所在周期中的已知子序列确定为指示性子序列。
3.根据权利要求2所述的装置,还包括周期确定单元,所述周期确定单元被配置用于通过以下方式来确定所述周期: 以多个不同的子序列长度,分别将所述序列划分为多个子序列; 针对每一个子序列长度,计算每两个子序列之间的相似度;以及 确定使所述相似度的平均值最大的子序列长度作为所述序列的周期。
4.根据权利要求1所述的装置,其中,所述指示性子序列提取单元包括: 第一提取子单元,被配置用于从所述序列中提取多个第二子序列,其中所述第二子序列的长度与所述待预测子序列的长度相同; 第一相似度计算子单元,被配置用于计算每两个所述第二子序列之间的第一相似度;第二相似度计算子单元,被配置用于多次计算每两个第三子序列之间的第二相似度,其中,所述第三子序列与所述第二子序列具有一定位置关系,并且在每次计算时使用的位置关系不同; 相关性计算子单元,被配置用于计算所述第一相似度和所述第二相似度之间的相关性; 位置关系确定子单元,被配置用于确定与最强相关性对应的位置关系;以及第二提取子单元,被配置用于提取相对于所述待预测子序列有所述位置关系的子序列作为所述指示性子序列。
5.根据权利要求1所述的装置,其中,所述类似子序列提取单元包括: 聚类子单元,被配置用于将与所述第一子序列等长的多个子序列聚类;以及 选择子单元,被配置用于根据预定规则选择一类子序列,用于预测所述待预测子序列。
6.根据权利要求5所述的装置,其中,所述聚类子单元基于以下各项中的至少一项来执行聚类: 与所述第一子序列相似的多个子序列中的每个子序列与所述第一子序列之间的相似度, 与所述第一子序列相似的多个子序列中的每个子序列之前的指示性子序列与所述待预测子序列之前的指示性子序列之间的相似度, 以下两项之间的相似度:与所述第一子序列相似的多个子序列中的每个子序列和之前的指示性子序列的结合,以及所述第一子序列和所述种子的结合,以及 每类中的子序列之间的相似度。
7.根据权利要求1所述的装置,其中,所述类似子序列提取单元基于以下各项中的至少一项来提取与所述第一子序列有类似的变化趋势的多个子序列: 与所述第一子序列相似的多个子序列中的每个子序列与所述第一子序列的相似度, 与所述第一子序列相似的多个子序列中的每个子序列之前的指示性子序列与所述待预测子序列之前的指示性子序列之间的相似度,以及 以下两项之间的相似度:与所述第一子序列相似的多个子序列中的每个子序列和之前的指示性子序列的结合,以及所述第一子序列和所述种子的结合之间的相似度。
8.根据权利要求1所述的装置,还包括: 预测单元,被配置用于基于与所述第一子序列有类似的变化趋势的一个或多个子序列来预测所述待预测子序列。
9.根据权利要求1至8中任一项所述的装置,其中,所述序列为电力负荷时间序列、燃气负荷时间序列、用水负荷时间序列或交通负荷时间序列。
10.一种对序列进行处理的方法,包括: 从所述序列中提取待预测子序列之前的、对所述待预测子序列有指示性作用的指示性子序列; 从所述序列中提取与所述指示性子序列最相似的子序列作为种子; 从所述序列中提取跟随在所述种子之后的以下第一子序列:该第一子序列和所述种子之间的位置关系与所述待预测子序列和所述指示性子序列之间的位置关系相同,且该第一子序列与所述待预测子序列等长;以及 从所述序列中提取与所述第一子序列有类似的变化趋势的多个子序列,以用于预测所述待预测子序列。
【文档编号】G06F19/00GK103729528SQ201210390510
【公开日】2014年4月16日 申请日期:2012年10月15日 优先权日:2012年10月15日
【发明者】杨宇航, 夏迎炬, 张明明, 于浩 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1