一种基于相邻数据特征的数据缺失填充方法与流程

文档序号:11829659阅读:来源:国知局

技术特征:

1.一种基于相邻数据特征的数据缺失填充方法,其特征在于:

读取一段按照时间顺序排列的数据序列;所述数据序列中,存在n个数据,所述数据序列为data(x1)、data(x2)……data(xn)表示,x1、x2……xn为时间序列Q,n为自然数;所述数据序列中,缺失了编号为i的数据,即data(i),i为等差数列Q中的一个值;

填充编号为i的数据,包括以下步骤:

1)读取与编号为i的数据相邻的数据data(i-1);在所述数据序列中,从头开始寻找与data(i-1)之差的绝对值小于0.02的数据;

如果没有找到这样的数据,则下一步直接进入步骤5);

如果找到这样的一个或多个数据,令其中一个数据的序列号为k-1,即该数据记为data(k-1),并进入下一步,k为时间序列Q中的一个值;

2)读取data(k)和data(i)左边的三个数据,将data(k-3)、data(k-2)和data(k-1)进行一次拟合,data(i-3)、data(i-2)和data(i-1)进行一次拟合;如果data(k-3)、data(k-2)和data(k-1)的变化趋势与data(i-3)、data(i-2)和data(i-1)的变化趋势相同,则进入下一步;否则,回到步骤1),重新选取data(k-1),但无法通过步骤1)选取data(k-1)时,则进入步骤5);

3)读取data(k)和data(i)右边的三个数据,将data(k+3)、data(k+2)和data(k+1)进行一次拟合,data(i+3)、data(i+2)和data(i+1)进行一次拟合;如果data(k+3)、data(k+2)和data(k+1)的变化趋势与data(i+3)、data(i+2)和data(i+1)的变化趋势相同,则进入下一步;否则,回到步骤1),重新选取data(k-1),但无法通过步骤1)选取data(k-1)时,则进入步骤5);

4)将data(k)保存到数据集K中,回到步骤1),重新选取data(k-1),直到无法通过步骤1)选取data(k-1)时,进入下一步;

5)若被保存数据只有1个数据data(k),则若没有数据被保存下来,则取缺失值data(i)左右两侧数据的平均值。如果数据集K存在j-1(j>2)个数据,则将数据集K里面的数据拟合为f(x),令M=f(j);

6)将数值M填充到data(i)的位置上。

2.根据权利要求1所述的一种基于相邻数据特征的数据缺失填充方法,其特征在于:步骤1)开始前,对data(x1)、data(x2)……data(xn)归一化处理。

3.根据权利要求1所述的一种基于相邻数据特征的数据缺失填充方法,其特征在于:若第一个数据缺失,则直接忽略该数据,从第二个缺失值开始填充。

4.根据权利要求1所述的一种基于相邻数据特征的数据缺失填充方法,其特征在于:所述数据序列为data(x1)、data(x2)……data(xn)为每间隔1个小时测得的变压器油温。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1