一种基于编辑距离的相似水情数据挖掘方法及其应用与流程

文档序号:33329490发布日期:2023-03-04 00:08阅读:来源:国知局

技术特征:
1.一种基于编辑距离的相似水情数据挖掘方法,其特征在于,它包括以下过程:步骤1,确定要挖掘的水情数据,并将所述水情数据符号化处理为序列s1;步骤2,选定要查询历史数据的起止时间,从数据库中选定待查询数据,并将待查询数据符号化处理为序列s2,确定序列s2中候选子序列的个数m;步骤3,在序列s2的子序列中选取与序列s1等长的子序列,并计算每个所述子序列与序列s1之间的编辑距离,从所述子序列的第一个符号开始,若所述子序列与序列s1的符号相等,则editdt+0,否则editdt+1,其中editdt为编辑距离;步骤4,重复3)直到序列s2中所有与s1等长的子序列完成计算;步骤5,按照编辑距离从小到大选取前n个子序列构成候选集;步骤6,将候选集中每个子序列转换成原始格式序列,分别计算每个子序列对应的原始格式序列与所述要挖掘的水情数据的动态弯曲距离dtw;步骤8,按照编辑距离从小到大返回m个子序列;步骤9,输出返回的子序列。2.根据权利要求1所述的一种基于编辑距离的相似水情数据挖掘方法,其特征在于,步骤3计算判定如下:if(x
j-x
i
>d&x
j-x
k
>d&x
j-x
i-1
>d&x
j-x
k+1
>d)or(x
j-x
i
<-d&x
j-x
k
<-d&x
j-x
i-1
<-d&x
j-x
k+1
<-d)式中:i从3开始,定义j=i+1,k=j+1,d为分段阈值,x
i
,x
j
,x
k
为序列中的数据。3.根据权利要求1所述的一种基于编辑距离的相似水情数据挖掘方法,其特征在于,步骤6中动态弯曲距离dtw按照如下公式计算:式中:w=w1,...w
k
,...w
k
为翘曲路径,q
i
为序列s1中的数据,c
j
为序列s2中的数据。4.根据权利要求1所述的一种基于编辑距离的相似水情数据挖掘方法,其特征在于:步骤2中,按时间顺序从数据库中选定待查询数据。5.根据权利要求1所述的一种基于编辑距离的相似水情数据挖掘方法,其特征在于:所述水情数据包括上游水位、出库流量、出力和耗水率中的一个或多个。6.权利要求1-5任意一项所述的一种基于编辑距离的相似水情数据挖掘方法的应用,其特征在于:用于梯级水库的实时调度。

技术总结
本发明公开了一种基于编辑距离的相似水情数据挖掘方法及其应用,该方法包括以下步骤:确定要挖掘的水情数据,并将所述水情数据符号化处理为序列S1;选定要查询历史数据的起止时间,从数据库中选定待查询数据,并将待查询数据符号化处理为序列S2,确定序列S2中候选子序列的个数M;在序列S2的子序列中选取与序列S1等长的子序列,并计算每个所述子序列与序列S1之间的编辑距离;分别计算每个子序列对应的原始格式序列与所述要挖掘的水情数据的动态弯曲距离DTW;按照编辑距离从小到大返回M个子序列并输出。本发明的方法能客观、准确、高效的为调度人员提供相似调度场景下的决策参考。的为调度人员提供相似调度场景下的决策参考。的为调度人员提供相似调度场景下的决策参考。


技术研发人员:曹红伟 熊奇
受保护的技术使用者:中国长江电力股份有限公司
技术研发日:2022.11.29
技术公布日:2023/3/3
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1