一种连续模拟量时间序列数据挖掘方法与流程

文档序号:12271638阅读:来源:国知局

技术特征:

1.一种连续模拟量时间序列数据挖掘方法,其特征在于包括以下步骤:

1)数据清洗,发现并纠正数据文件中可识别的错误,包括检查数据一致性、处理无效值和缺失值等;

2)确定周期划分;

3)确定傅立叶变换的输出点数和抽样数据的抽样点数n;

4)周期内数据进行傅立叶变换,设周期内数据为x,其中F(x)表示对x进行傅立叶变换,n表示抽样点数;

5)周期内数据抽样,每个周期与傅立叶变换相同的点数的抽样,作为代表时域的特征;

6)把傅立叶变换输出数据和抽样数据存储为一个节点;

7)计算整体平均节点密度;

8)标记所有节点为未访问;

9)随机选择一个未分类点Px并标已访问;

10)若点Px的S邻域至少有m个点,则创建一个新簇Cn并把Px添加到簇Cn中,其中S邻域表示距离点Px小于某个值的区域,m为S邻域中最少点的个数;

11)令N为Px的S邻域的节点集合;

12)对每个N中的每个节点PNi进行如下操作:

若节点PNi为未访问,则标记为已访问;

若节点PNi的S邻域至少有m个点,则把这些点添加到N中;

若节点PNi还不是任何簇的成员,则把节点PNi添加到簇Cn中;

把Cn添加到簇C中;

13)查看还有未访问节点吗,如有,则返回步骤9);

14)输出簇C。

2.如权利要求1所述一种连续模拟量时间序列数据挖掘方法,其特征在于在步骤2)中,所述周期划分根据自然周期设定为生产的一个周期。

3.如权利要求2所述一种连续模拟量时间序列数据挖掘方法,其特征在于所述自然周期采用日、星期、月、季度、年中的一种。

4.如权利要求1所述一种连续模拟量时间序列数据挖掘方法,其特征在于在步骤3)中,所述傅立叶变换的输出点数为8~24。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1