基于多时序因子和序列因子支配的多时间序列查询方法

文档序号:6568295阅读:182来源:国知局
专利名称:基于多时序因子和序列因子支配的多时间序列查询方法
技术领域
本发明涉及一种基于多时序因子和序列因子支配的多时间序列查询方法,属于计算机数据处理技术领域。
背景技术
时间序列是现实生活中大量使用的一类数据,在自然界和人类社会中都有着极广泛的应用,如地震波采样等。时间序列可分为多时间序列和单时间序列。单时间序列仅仅从一个角度描述对象,而多时间序列则从多个角度描述对象本身,其数据信息会比单时间序列丰富得多。在有些领域中,虽然目前并没有使用基于多时序因子和序列因子支配的多时间序列查询方法,但是它们也适用这种方法,而且效果会更好。以土木业的地震最不利选波为例,目前的做法是对地震波的特征值进行Top-k查询,或直接人工观察选波。人工观察选波依赖于人的主观认识和选波经验,且仅适合于在少量地震波上选波;Top-k查询是在地震波特征值上进行查询,但特征值会受经验和模型所限制,因此查询结果会出现不少的误解和漏解。地震波谱(多时间序列)就没有这样的约束限制,所以对地震波谱进行查询,其查询效果(减少漏解、误解等)会好得多。因此最不利选波更适合使用基于多时序因子和序列因子支配的多时间序列查询方法。

发明内容
本发明的目的是提出一种基于多时序因子和序列因子支配的多时间序列查询方法,通过对多时间序列进行多时序因子和序列因子支配的比较,从而得到查询的结果。本发明提出的基于多时序因子和序列因子支配的多时间序列查询方法,包括以下步骤(1)定义两个单时间序列之间的序列因子支配关系设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序排列的序列,即一个单时间序列TS= [vi,v2,...,vn],一个单时间序列中共有|TS| = η个时戳,并且ti < t2 < . . . < tn,用TS [t]表示TS在时戳t时的数值,设定一个序列因子 k,0<k< 1,对于两个单时间序列TS和TS’,若3Γ&Φ·,|T|彡k|w|,且满足条件⑴vter, TS[t]彡TS,[t]和(2)丑er,TS[t] >TS,[t],则单时间序列ts在w上为序列因子支配单时间序列TS’,记作re>tra’,其中W为时间窗口,M^bG];(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系设多时间序列MTS由m个单时间序列组成=MTS= ITS1, TS2,. . .,Kj,其中m彡1, 对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0 < k,k’彡1,以及时间窗口 w,若满足条件⑴|{/财Γ邓或 MTS[i].w = MTS,[i].w} I 彡 k,m,和(2) Bj 使得j] >tMTS ’[ _/+],则多时间序列MTS在时间窗口 w上为多时序因子和序列因子支配多时间序列 MTS,,记作Mra>,Mra’,其中 MTS = MTS,| = m, MTS[i]. w 和 MTS,[i].w 分别为多时间序列MTS和多时间序列MTS’中第i个单时间序列在时间窗口 w中的子序列,当 MTS[i].w和MTS,[i]. w的每个互相对应时戳的值相等时,MTS[i]. w和MTS,[i].w相等;(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一个最大输出值,该最大输出值与该多时间序列相对应;(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一个最小输出值,该最小输出值与该多时间序列相对应;(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列的最大输出值和最小输出值;(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列MTS ;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS被其他多时间序列MTS’ 所支配,则不输出多时间序列MTS。本发明提出的基于多时序因子和序列因子支配的多时间序列处理方法,其优点是1、本发明方法可以在多时间序列上进行查询,而不必使用由多时间序列提取得到的特征值。因为经过采样得到的原始数据往往是以多时间序列的形式存储。原始数据含有较全面的数据信息,而经过提取得到的特征值,往往会损失一些数据信息。例如在地震波中,由于人们现在还无法完全认识地震波,因此提取得到的特征值并不能完全地反映原始的地震波,即在特征提取过程中损失了部分数据信息。所以直接对多时间序列进行查询的效果要好于对特征值查询。2、本发明方法由于直接使用原始数据(多时间序列的形式),避免了提取特征值等过程带来的额外代价,并通过限制时间窗口、计算各多时间序列的最大、最小输出值来提高查询效率,大大加快了查询的速度。
具体实施例方式本发明方法假定数值之间的比较,以取较大者为优。本发明提出的基于多时序因子和序列因子支配的多时间序列处理方法,包括以下步骤(1)定义两个单时间序列之间的序列因子支配关系
设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序排列的序列,即一个单时间序列TS= [vi,v2,...,vn],一个单时间序列中共有|TS| = η个时戳,并且ti < t2 < . . . < tn,用TS [t]表示TS在时戳t时的数值,设定一个序列因子 k,0<k< 1,对于两个单时间序列TS和TS’,若3Γ&Φ·,|T|彡k|w|,且满足条件⑴vter, TS[t]彡TS,[t]和(2)丑er,TS[t] >TS,[t],则单时间序列ts在w上为序列因子支配单时间序列TS’,记作re>tra’,其中W为单时间序列时间窗口,M^bG];(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系设多时间序列MTS由m个单时间序列组成=MTS= ITS1, TS2,. . .,Kj,其中m彡1, 对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0 < k,k’彡1,以及每个单时间序列的时间窗口 w,若满足条件⑴|{/财Γ邓]> Mra’[/]或MTS[i]. w = MTS,[i], w} I彡k’m,和⑵审使得^^[7'>>W[7'],则多时间序列MTS在单时间序列的时间窗口 w 上为多时序因子和序列因子支配多时间序列MTS,,记作Mra>t'ftMra’,其中IMTSI = |MTS, =m,MTS[i].w和MTS,[i]. w分别为多时间序列MTS和多时间序列MTS,中第i个单时间序列在时间窗口 w中的子序列,当MTS[i], w和MTS,[i].w的每个互相对应时戳的值相等时, MTS[i].w 和 MTS,[i].w 相等;(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一个最大输出值,该最大输出值与该多时间序列相对应;(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一个最小输出值,该最小输出值与该多时间序列相对应;(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列的最大输出值和最小输出值;(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列MTS ;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS被其他多时间序列MTS’ 所支配,则不输出多时间序列MTS。本发明方法中,首先定义多时间序列之间的多时序因子和序列因子支配关系。建立与多时间序列相对应的数值索引。给定了多时间序列数据集datMet,序列因子k,多时序因子k’和时间窗口 W,为每一个多时间序列MTS e dataSet计算其对应的数值索引,包括
对于MTS的每个单时间序列TS,计算第一输出值B(k|w|,TS)和第二输出值 W(k I w I,TS) ο 其中,W(k I w I,TS) = Σ s G Worst(kw, TS)F (χ),B (k | w |,TS) = Σ s G Best(kw, TS) F (χ), W表示时间窗口 W中包含的时戳数,Worst(k|W|,TS)表示单时间序列TS在W中的子序列中最小的k|w|个时戳数值,Best(k|w|, TS)表示单时间序列TS在w中的子序列中最大的 k|w|个时戳数值,F(x)为某个单调递增函数,如F(X) = sgn(x)ln(|x|+l),sgn(x)为符号函数,定义为 对于多时间序列MTS,包含了 m个单时间序列,因此多时间序列MTS包含m个第一输出值B(k|w|,TS)和m个第二输出值W(k|w|,TS),计算最小输出值W(k’m,MTS)和最大输出值 B(k,m,MTS)。其中,W(k,m,MTS) = Σ x e w。rst(k’ m,MTS)F (χ),B (k,m,MTS) = Σ x e Best(k’ m, mts)F(x),Worst (k’ m, MTS)表示多时间序列MTS中最小的k’ m个第二输出值W(k|w|,TS), Best(k' m, MTS)表示多时间序列MTS中最大的k,m个第一输出值B (k | w |,TS),F(χ)为单调递增函数。
权利要求
1. 一种基于多时序因子和序列因子支配的多时间序列处理方法,其特征在于该方法包括以下步骤(1)定义两个单时间序列之间的序列因子支配关系设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序排列的序列,即一个单时间序列TS= [vi,v2,...,vn],一个单时间序列中共有|TS| =n个时戳,并且、< t2 < ... < tn,用TS [t]表示TS在时戳t时的数值,设定一个序列因子k, 0 < k^ 1,对于两个单时间序列TS和TS,,若3Γ&Φ·,τ彡k|w|,且满足条件(1) VtET, TS[t]彡TS,[t]和(2)丑er,TS[t] >TS,[t],则单时间序列ts在w上为序列因子支配单时间序列TS’,记作re>tra’,其中W为时间窗口,M^bG];(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系设多时间序列MTS由m个单时间序列组成=MTS = ITS1, TS2, ... , TSj,其中m彡1,对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0 < k,k’彡1,以及每个单时间序列的时间窗口 w,若满足条件⑴I{/财Γ邓> Mra’[/]或MTS[i]. w = MTS,[i], w} I彡k’m,和⑵使得Mra[_/+>tM7^’[_/+],则多时间序列MTS在时间窗口 w上为多时序因子和序列因子支配多时间序列MTS’,记作Mra>t'ftMra’,其中MTS = MTS,=m,MTS[i]. w和MTS’ [i]. w分别为多时间序列MTS和多时间序列MTS’中第i个单时间序列在时间窗口 w中的子序列,当MTS[i]. w和MTS’[i]. w的每个互相对应时戳的值相等时,MTS[i]. w和 MTS,[i].w 相等;(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一个最大输出值,该最大输出值与该多时间序列相对应;(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一个最小输出值,该最小输出值与该多时间序列相对应;(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列的最大输出值和最小输出值;(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列MTS ;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS被其他多时间序列MTS’所支配,则不输出多时间序列MTS。
全文摘要
本发明涉及一种基于多时序因子和序列因子支配的多时间序列查询方法,属于计算机数据处理技术领域。首先定义两个单时间序列之间的序列因子支配关系和两个多时间序列之间的多时序因子和序列因子的支配关系然后计算多时间序列的数值和组成多时间序列的每个单时间序列的数值,最后根据各多时间序列的输出值和支配关系,输出查询结果。本发明方法可以在多时间序列上进行查询,而不必使用由多时间序列提取得到的特征值。所以直接对多时间序列进行查询的效果要好于对特征值查询。本方法直接使用原始数据,避免了提取特征值等过程带来的额外代价,并通过限制时间窗口、计算各多时间序列的最大、最小输出值来提高查询效率,大大加快了查询的速度。
文档编号G06F17/30GK102360384SQ20111031240
公开日2012年2月22日 申请日期2011年10月14日 优先权日2011年10月14日
发明者徐亚军, 施炜, 潘鹏, 王朝坤 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1