一种挖掘时序数据故障模式的系统及方法_4

文档序号：9453111阅读：来源：国知局

模式集。然后执行步骤3-15,从频繁模式集中依次取出两个相邻的频繁模式。然后执行步骤3-16,相邻频繁模式之间的间隙就是潜在异常模式。最后输出所有潜在异常模式，统计学习模块过程结束。
[0058] 4)、参照图4,DBSCAN聚类模块，把多个参数的异常模式聚集在一起形成故障模式：
[0059] 首先执行步骤4-1，初始化每个数据点的簇标签集为空。然后执行步骤4-2,扫描统计学习模块得到的所有非频繁模式把数据点分为核心点、边界点和噪音点，并把噪音点和非噪音点分别放入两个集合。步骤4-3判断非噪音点集合中是否有簇标签集为空的数据点。如果有则执行步骤4-4,取一个簇标签集为空的数据点。然后步骤4-5判断该点是否为核心点。如果该点是核心点，则执行步骤4-6,把该点作为一个新簇，赋予新簇标签。然后执行步骤4-7,把刚生成的新簇标签添加给该点邻域内的所有点。之后转至步骤4-3。如果该点不是核心点，则直接转至步骤4-3。如果非噪音点集合中没有簇标签集为空的数据点，则执行步骤4-8,初始化簇标签映射表为空。接着步骤4-9判断非噪音集合中是否有簇标签集大于1的数据点。如果有簇标签集大于1的数据点，则执行步骤4-10,取一个簇标签集大于 1的数据点。然后步骤4-11，初始化新簇标签为空。步骤4-12判断该点簇标签集中的标签是否处理完。如果未处理完，则执行步骤4-13,取一个未处理的簇标签。然后步骤4-14,判断簇标签映射表中是否有该标签。如果映射表中没有该标签，则执行步骤4-15,判断新簇标签是否为空。若新簇标签为空，则执行步骤4-16,生成一个新簇标签。然后执行步骤4-17。若新簇标签不为空则直接执行步骤4-17,在标签映射表中添加一个从老标签到新标签的映射。然后执行步骤4-18,从簇标签集中删除老标签，加入新标签。然后转至步骤4-12。如果簇标签映射表中已经有当前数据点的簇标签，则执行步骤4-19,取出该标签所映射的目标标签。然后步骤4-20,判断新簇标签是否为空。若新簇标签为空，则执行步骤4-21，把刚取出的目标标签赋予新簇标签。然后转至步骤4-18。如果新簇标签不为空，则执行步骤 4-22,从簇标签集中删除老簇标签，加入目标标签。然后转至步骤4-12。如果当前数据点簇标签集中的老标签已经处理完，则转至步骤4-9。如果非噪音集合中没有簇标签集大于1 的数据点，则执行步骤4-23,把噪音集合中的所有噪音点都标记为一个噪音簇。然后执行步骤4-24，输出所有簇及簇内所有数据点。DBSCAN聚类过程结束。
[0060]5)、参照图5,故障模式生成模块，把故障模式写成形式化规则：
[0061] 参照图5,其显示了A、B、C、D、E共5个参数的时序数据曲线。这5个参数经过 TK-Means聚类模块和统计学习模块后得到的潜在异常模式如表1所示。经过DBSCAN聚类模块之后得到的簇为：
[0062]簇0 :
[0063]A参数（'bbbc'，0)，D参数（'b'，0)，（'bb'，0)
[0064]簇1 :
[0065]A参数（'aabbbbc'，16)，B参数（'ab'，16)，C参数（'aab'，16)，D参数（'abb'，17)， E参数（'bbb'，18)
[0066]簇 2 :
[0067] A参数（'aabbbbb'，35)，B参数（'aab'，34)，C参数（'aab'，35)，D参数 ('abb'，36)，E参数（'bbb'，37)
[0068]表1
[0069]
[0070] 在故障模式生成模块根据上述DBSCAN聚类结果生成形式化故障规则。由于在初始阶段数据不完整，容易造成错误。所以抛弃簇〇及其所有模式。
[0071] 由簇1生成如下形式化规则：
[0072] A = (aabbbbc)&&B = (ab)&&C = (aab) - D = (abb) - E = (bbb)
[0073] 由簇2生成如下形式化规则：
[0074] B = (aab) - A = (aabbbbb) &&C = (aab) - D = (abb) - E = (bbb)。
【主权项】
1. 一种挖掘时序数据故障模式的系统，其特征在于，包括：数据预处理模块、TK-Means 聚类模块、统计学习模块和DBSCAN聚类模块；数据预处理模块，用于对原始数据进行清洗、插值处理，获得归一化数据； TK-Means聚类模块，用于对数据预处理模块处理后的数据进行特征向量提取，然后采用TK-means方法对特征向量进行聚类，然后根据聚类结果将数据转换成特征字符串；统计学习模块，用于对特征字符串进行统计学习，找出频繁模式和非频繁模式，所述非频繁模式对应着异常模式； DBSCAN聚类模块，用于把多个参数的异常模式聚集在一起形成故障模式。2. 根据权利要求1所述的一种挖掘时序数据故障模式的系统，其特征在于，所述系统还包括故障模式生成模块；所述故障模式生成模块，用于把故障模式写成形式化规则。3. 根据权利要求1所述的一种挖掘时序数据故障模式的系统，其特征在于，数据预处理模块包括去野值、生成单参数文件、等间隔处理以及归一化处理步骤；去野值的步骤包括：对每个数据设定上下限，把大于上限的数值变为上限，小于下限的数值变为下限，以此去野值；等间隔处理处理步骤中，默认对数据每隔1秒进行采样，等间隔处理后的数据，每分钟都从O秒开始，59秒结束；数据经过等间隔处理之后进行归一化处理，将其取值范围转换到[〇，1]区间上。4. 根据权利要求1所述的一种挖掘时序数据故障模式的系统，其特征在于，TK-Means 聚类模块首先对数据预处理模块处理后的数据进行特征向量提取，然后用TK-Means方法对特征向量进行聚类，并将所得聚类结果的每一个簇表示成一个特征字符；在TK-Means方法中，簇的数目是一个范围[min，max];设置一个最大相似度阈值t*，在聚类开始的时候，随机选择一个初始阈值t;如果第一次聚类得到的簇数目大于max，且t小于最大阈值t*，则将阈值t增大At，重新进行聚类，直到第一次聚类得到的簇的数目在[min，max]范围中；如果第一次聚类得到的簇的数目小于min，且阈值t大于At，则将阈值t减小At，重新进行聚类，直到第一次聚类得到的簇的数目在[min，max]范围中；TK-Means聚类的具体过程为：（1)第一次聚类；（2)如果第一次聚类得到的簇的数目在[min，max]范围中，则执行第 (3) 步，否则按照调整阈值t并重复执行第（1)步；(3)聚类并调整簇心，迭代次数i递增； (4) 判断聚类结果是否稳定，如果聚类结果不稳定，则重复执行第（3)步，否则聚类结束；在第一次聚类中，当簇每增加一条数据时，调整簇中心，直到处理完所有数据；在第（3)步的聚类过程中，直到所有数据全部处理完后，才调整一次簇心。5. 根据权利要求1所述的一种挖掘时序数据故障模式的系统，其特征在于，统计学习模块通过寻找频繁模式的间隙来确定非频繁模式，即异常模式；正常模式被打断的地方就是异常模式；正常模式就是频繁发生的模式，对应特征字符串上的频繁模式；而异常模式不是频繁发生，把特征字符串上的频繁模式去掉之后，剩下的片段就是非频繁模式，即潜在异常模式；寻找异常模式的过程为：（1)把特征字符串划分为一系列长度为L的单词，并且统计每个单词的出现频率；(2)如果一个单词的出现频率大于给定阈值，称作频繁单词，否则为非频繁单词；（3)连续取L个字符构成当前单词；如果未达到字符串末尾，则执行下一步；否则把当前频繁模式放入频繁模式集中，输出频繁模式集，然后执行第（7)步；(4)判断当前单词是否为频繁单词；如果是执行下一步，否则执行第（6)步；（5)向后滑动L个字符并更新当前频繁模式，然后执行第（3)步；(6)向后滑动一个字符，并判断前一个单词是否为频繁单词；如果是，则更新频繁模式集，即把当前频繁模式放入频繁模式集中；然后执行第（3)步；（7)按照起始位置取出频繁模式集中相邻的两个频繁模式；(8)相邻频繁模式的间隙就是非频繁模式，即潜在异常模式；间隙就是从上一个模式末尾到下一个模式开头之间的字符串。6. 根据权利要求1所述的一种挖掘时序数据故障模式

完整全部详细技术资料下载

当前第4页1 2 3 4 5