针对居民异常用水的决策树判别方法与流程

文档序号:13760835阅读:来源:国知局
针对居民异常用水的决策树判别方法与流程

技术特征:

1.针对居民异常用水的决策树判别方法,其特征在于对居民用水数据运用K-means算法分析计算决策树节点的判别临界值,基于K-means算法确定重要指标临界值的异常用水决策树:首先确定判别异常用水的重要指标及其优先级作为决策树判别的节点,然后依次运行K-means算法分析计算节点的临界值,通过对居民用水数据的决策树判别,找到异常用水的居民用户,并根据对应异常用水的特点分析异常的原因,同时获取异常用水的时间。

2.根据权利要求1所述的针对居民异常用水的决策树判别方法,其特征在于所述确定判别异常用水的重要指标及其优先级具体是:对居民用户日常用水情况的剖析,逐步确定异常用水的表征在居民用水数据上的体现,首先确定判别异常用水与正常用水的用水数据特征变量,挖掘出异常用水的居民用户,再通过频率和平均用水量两个维度去识别判别出现居民异常用水的可能原因。

3.根据权利要求1所述的针对居民异常用水的决策树判别方法,其特征在于所述依次运行K-means算法分析计算节点的临界值具体是:首先对第一个特征变量使用K-means聚类后得到正常用水居民客户群体,取这个群体最大边界值作为正常与异常用水的临界值;随后依次计算异常用水用户频率和平均用水量两个变量的临界值。

4.根据权利要求3所述的针对居民异常用水的决策树判别方法,其特征在于使用簇类最大边界值作为变量临界值误差很大,为降低误差,对异常用水用户特征分析判别的临界值取K=2时两个中心点的均值。

5.根据权利要求4所述的针对居民异常用水的决策树判别方法,其特征在于具体包括如下步骤:

步骤1:将原始居民用水数据处理成所需要的输入评价指标集,得到重要评价指标;

步骤2:分析重要评价指标及确定其优先级;根据步骤1选取的重要评价指标,确定指标决策树节点的先后顺序;重要评价指标的优先级设定为:用户最大持续用水时长,用户用水时长超过个小时的频率,用户用水时平均每设定时间的用水量

步骤3:使用K-means算法确定决策树各节点的临界值,根据步骤2的结果依次确定评价指标的临界值,完成决策树参数确定的最后阶段,得到决策树模型;首先指标临界值的确定,使用K-means聚类结果中定义为正常居民用水类别的最大边界值为该指标的临界值,将数据分为正常用水与异常用水居民用户;剩下的指标F和AD,则是通过将设置K=2,取聚类结果里两个类别中心点的均值作为节点临界值,指标F和AD有助于分析居民异常用水可能的原因;

步骤4:决策树识别异常用水用户类型及结果分析;步骤3所述决策树参数设置已经完成,只需将居民用水数据代入决策树模型即可得到居民用水情况的分类结果;当持续用水时长T小于临界值时为正常用户,大于临界值时为异常用水用户;异常用水用户中F值大于临界值AD值也大于临界值时疑似用于商业用途;F值大于临界值AD值小于临界值时疑似经常长时间漏水;F值小于临界值AD值大于临界值时疑似经发生爆水管情况;F值小于临界值AD值小于临界值时疑似曾漏水。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1