一种挖掘时序数据故障模式的系统及方法_4

文档序号:9453111阅读:来源:国知局
模式集。然后执行步骤3-15,从频繁模式集中依次取出两个相邻的频繁模式。然 后执行步骤3-16,相邻频繁模式之间的间隙就是潜在异常模式。最后输出所有潜在异常模 式,统计学习模块过程结束。
[0058] 4)、参照图4,DBSCAN聚类模块,把多个参数的异常模式聚集在一起形成故障模 式:
[0059] 首先执行步骤4-1,初始化每个数据点的簇标签集为空。然后执行步骤4-2,扫描 统计学习模块得到的所有非频繁模式把数据点分为核心点、边界点和噪音点,并把噪音点 和非噪音点分别放入两个集合。步骤4-3判断非噪音点集合中是否有簇标签集为空的数据 点。如果有则执行步骤4-4,取一个簇标签集为空的数据点。然后步骤4-5判断该点是否为 核心点。如果该点是核心点,则执行步骤4-6,把该点作为一个新簇,赋予新簇标签。然后执 行步骤4-7,把刚生成的新簇标签添加给该点邻域内的所有点。之后转至步骤4-3。如果该 点不是核心点,则直接转至步骤4-3。如果非噪音点集合中没有簇标签集为空的数据点,则 执行步骤4-8,初始化簇标签映射表为空。接着步骤4-9判断非噪音集合中是否有簇标签集 大于1的数据点。如果有簇标签集大于1的数据点,则执行步骤4-10,取一个簇标签集大于 1的数据点。然后步骤4-11,初始化新簇标签为空。步骤4-12判断该点簇标签集中的标签 是否处理完。如果未处理完,则执行步骤4-13,取一个未处理的簇标签。然后步骤4-14,判 断簇标签映射表中是否有该标签。如果映射表中没有该标签,则执行步骤4-15,判断新簇标 签是否为空。若新簇标签为空,则执行步骤4-16,生成一个新簇标签。然后执行步骤4-17。 若新簇标签不为空则直接执行步骤4-17,在标签映射表中添加一个从老标签到新标签的映 射。然后执行步骤4-18,从簇标签集中删除老标签,加入新标签。然后转至步骤4-12。如 果簇标签映射表中已经有当前数据点的簇标签,则执行步骤4-19,取出该标签所映射的目 标标签。然后步骤4-20,判断新簇标签是否为空。若新簇标签为空,则执行步骤4-21,把 刚取出的目标标签赋予新簇标签。然后转至步骤4-18。如果新簇标签不为空,则执行步骤 4-22,从簇标签集中删除老簇标签,加入目标标签。然后转至步骤4-12。如果当前数据点 簇标签集中的老标签已经处理完,则转至步骤4-9。如果非噪音集合中没有簇标签集大于1 的数据点,则执行步骤4-23,把噪音集合中的所有噪音点都标记为一个噪音簇。然后执行步 骤4-24,输出所有簇及簇内所有数据点。DBSCAN聚类过程结束。
[0060]5)、参照图5,故障模式生成模块,把故障模式写成形式化规则:
[0061] 参照图5,其显示了A、B、C、D、E共5个参数的时序数据曲线。这5个参数经过 TK-Means聚类模块和统计学习模块后得到的潜在异常模式如表1所示。经过DBSCAN聚类 模块之后得到的簇为:
[0062]簇0 :
[0063]A参数('bbbc',0),D参数('b',0),('bb',0)
[0064]簇1 :
[0065]A参数('aabbbbc',16),B参数('ab',16),C参数('aab',16),D参数('abb',17), E参数('bbb',18)
[0066]簇 2 :
[0067] A参数('aabbbbb',35),B参数('aab',34),C参数('aab',35),D参数 ('abb',36),E参数('bbb',37)
[0068]表1
[0069]
[0070] 在故障模式生成模块根据上述DBSCAN聚类结果生成形式化故障规则。由于在初 始阶段数据不完整,容易造成错误。所以抛弃簇〇及其所有模式。
[0071] 由簇1生成如下形式化规则:
[0072] A = (aabbbbc)&&B = (ab)&&C = (aab) - D = (abb) - E = (bbb)
[0073] 由簇2生成如下形式化规则:
[0074] B = (aab) - A = (aabbbbb) &&C = (aab) - D = (abb) - E = (bbb)。
【主权项】
1. 一种挖掘时序数据故障模式的系统,其特征在于,包括:数据预处理模块、TK-Means 聚类模块、统计学习模块和DBSCAN聚类模块; 数据预处理模块,用于对原始数据进行清洗、插值处理,获得归一化数据; TK-Means聚类模块,用于对数据预处理模块处理后的数据进行特征向量提取,然后采 用TK-means方法对特征向量进行聚类,然后根据聚类结果将数据转换成特征字符串; 统计学习模块,用于对特征字符串进行统计学习,找出频繁模式和非频繁模式,所述非 频繁模式对应着异常模式; DBSCAN聚类模块,用于把多个参数的异常模式聚集在一起形成故障模式。2. 根据权利要求1所述的一种挖掘时序数据故障模式的系统,其特征在于,所述系统 还包括故障模式生成模块;所述故障模式生成模块,用于把故障模式写成形式化规则。3. 根据权利要求1所述的一种挖掘时序数据故障模式的系统,其特征在于,数据预处 理模块包括去野值、生成单参数文件、等间隔处理以及归一化处理步骤;去野值的步骤包 括:对每个数据设定上下限,把大于上限的数值变为上限,小于下限的数值变为下限,以此 去野值;等间隔处理处理步骤中,默认对数据每隔1秒进行采样,等间隔处理后的数据,每 分钟都从O秒开始,59秒结束;数据经过等间隔处理之后进行归一化处理,将其取值范围转 换到[〇,1]区间上。4. 根据权利要求1所述的一种挖掘时序数据故障模式的系统,其特征在于,TK-Means 聚类模块首先对数据预处理模块处理后的数据进行特征向量提取,然后用TK-Means方法 对特征向量进行聚类,并将所得聚类结果的每一个簇表示成一个特征字符;在TK-Means方 法中,簇的数目是一个范围[min,max];设置一个最大相似度阈值t*,在聚类开始的时候, 随机选择一个初始阈值t;如果第一次聚类得到的簇数目大于max,且t小于最大阈值t*, 则将阈值t增大At,重新进行聚类,直到第一次聚类得到的簇的数目在[min,max]范围中; 如果第一次聚类得到的簇的数目小于min,且阈值t大于At,则将阈值t减小At,重新进 行聚类,直到第一次聚类得到的簇的数目在[min,max]范围中;TK-Means聚类的具体过程 为:(1)第一次聚类;(2)如果第一次聚类得到的簇的数目在[min,max]范围中,则执行第 (3) 步,否则按照调整阈值t并重复执行第(1)步;(3)聚类并调整簇心,迭代次数i递增; (4) 判断聚类结果是否稳定,如果聚类结果不稳定,则重复执行第(3)步,否则聚类结束;在 第一次聚类中,当簇每增加一条数据时,调整簇中心,直到处理完所有数据;在第(3)步的 聚类过程中,直到所有数据全部处理完后,才调整一次簇心。5. 根据权利要求1所述的一种挖掘时序数据故障模式的系统,其特征在于,统计学习 模块通过寻找频繁模式的间隙来确定非频繁模式,即异常模式;正常模式被打断的地方就 是异常模式;正常模式就是频繁发生的模式,对应特征字符串上的频繁模式;而异常模式 不是频繁发生,把特征字符串上的频繁模式去掉之后,剩下的片段就是非频繁模式,即潜在 异常模式;寻找异常模式的过程为:(1)把特征字符串划分为一系列长度为L的单词,并且 统计每个单词的出现频率;(2)如果一个单词的出现频率大于给定阈值,称作频繁单词,否 则为非频繁单词;(3)连续取L个字符构成当前单词;如果未达到字符串末尾,则执行下一 步;否则把当前频繁模式放入频繁模式集中,输出频繁模式集,然后执行第(7)步;(4)判断 当前单词是否为频繁单词;如果是执行下一步,否则执行第(6)步;(5)向后滑动L个字符 并更新当前频繁模式,然后执行第(3)步;(6)向后滑动一个字符,并判断前一个单词是否 为频繁单词;如果是,则更新频繁模式集,即把当前频繁模式放入频繁模式集中;然后执行 第(3)步;(7)按照起始位置取出频繁模式集中相邻的两个频繁模式;(8)相邻频繁模式的 间隙就是非频繁模式,即潜在异常模式;间隙就是从上一个模式末尾到下一个模式开头之 间的字符串。6. 根据权利要求1所述的一种挖掘时序数据故障模式
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1