本发明属于电能量量测数据采集与校核拟合,具体而言,涉及一种基于多点校核的量测数据拟合方法、介质及系统。
背景技术:
1、电能量数据的获取与应用在电力行业中十分重要。智能电表作为电力系统重要设备之一,承担着国家对电能量计量、互感器匹配及功率因数监测等功能,并可实时采集电量、电压、电流、功率等参数,将数据通过通信网络发送至信息系统,为用户用电分析、用电监测以及计费进行提供依据。在新一代信息化系统中,对用户收费业务数据、市场化交易数据以及系统分析类数据提出了更高要求。然而,在实际应用中,由于供电的不稳定、通信网络传输误码、仪器故障等原因,电能量曲线上常常会出现各种异常数据,主要包括:示值突增、突降、越限以及重复上报等。这类异常数据如果直接用于用户用电分析、结算等场景中,会带来较大误差。严重影响决策系统的绩效。
2、根据国网关于电力现货交易市场建设要求,市场化交易用户需参加电力现货交易,要求新一代用电信息采集系统对市场化交易用户采集的正、反向有功电能示值曲线数据进行拟合,保证曲线数据完整性与合理性。当前缺乏一种能够实现市场化交易用户采集的正、反向有功电能示值曲线数据进行拟合的高效方法。
技术实现思路
1、有鉴于此,本发明提供一种基于多点校核的量测数据拟合方法、介质及系统,能够解决现有技术缺乏能够实现市场化交易用户采集的正、反向有功电能示值曲线数据进行拟合的高效方法的技术问题。
2、本发明是这样实现的:
3、本发明的第一方面提供一种基于多点校核的量测数据拟合方法,其中,包括以下步骤:
4、数据准备:收集市场化交易用户的正、反向有功电能示值曲线数据,以及相关历史数据;
5、异常判定:运用四分位距规则对曲线数据进行异常值判定,判定越界值、示值突大、示值突小、示值倒走、曲线非递增和示值缺失;
6、异常分类:根据异常的类型和特点,将异常分为单一时刻异常、连续时刻异常、零点时刻异常;
7、异常拟合:根据不同的异常场景,采用相应的拟合规则进行数据修复;
8、拟合计算:执行具体的拟合公式,计算出异常时刻的拟合示值或拟合电量;
9、拟合修正:对拟合后的数据,检查是否存在倒走现象,存在则进行异常拟合数据的修复;
10、数据确认:对不拟合的数据场景,记录为异常数据,等待现场消缺确认;
11、高风险数据处理:存在突大、突小、倒走异常但次数少于10次的数据,如果拟合数据走向出现递减情况,则剔除拟合数据,视为不拟合。
12、在上述技术方案的基础上,本发明的一种基于多点校核的量测数据拟合方法还可以做如下改进:
13、其中,所述数据准备步骤包括:连接电力用户侧的智能电表,采集近一周的正、反向有功电能示值曲线原始数据;在电力用户基本信息数据库中,查询出参与市场化交易的用户列表;根据市场化交易用户列表,从收集到的全部用户的原始示值曲线数据中,筛选出符合列表内用户编号的正、反向有功电能示值曲线数据集;基于上一步获得的正、反向有功电能示值曲线数据集,连接拟合模型的训练数据库,检索过去2年的该用户的正、反向有功电能示值曲线历史数据集。
14、进一步的,所述异常检测步骤包括:基于四分位距理论,设置电能示值的上下阈值;遍历电能示值曲线中各个数据点,判断每个点的值是否在正常区间内;设定突增异常、突降异常和倒走异常的逻辑判断规则;判断电能示值曲线在时间轴上是否呈递增态势;
15、所述异常分类步骤包括:识别单点异常;识别连续多点异常;识别零点时刻异常;识别包含特殊时刻的连续多点异常;识别整日异常。
16、进一步的,所述拟合规则制定步骤包括:制定单点缺失、多点连续缺失、零点时刻数据缺失、包含非零点特殊时刻数据缺失和整日数据缺失的情况的拟合规则。
17、进一步的,所述拟合计算步骤包括:针对各种异常情况,调用numpy数学计算库,利用python语言编写程序,实现拟合规则的运算与数据替代。
18、进一步的,所述拟合检验步骤包括:依次取出每个时刻的数据,判断相邻两个时刻的数据变化关系;统计不合理的数据对的数量,判定是否需要进行修正;遍历不合理的数据对,调整拟合数据使其维持递增关系。
19、进一步的,所述特殊情况标识步骤包括:对抄表失败、特殊算法用户、数据波动标识以及同期空缺标识的情况,添加不同的特殊符号进行标识;
20、所述高风险数据识别步骤包括:统计数据的异常次数;检验拟合数据的走势;设置异常次数与降幅的参数模型识别高风险数据;将高风险数据剔除并记录日志。
21、进一步的,所述高风险数据处理步骤之后还包括总体检验的步骤,具体是:重新排序规范化数据集;进行值域校验、时间线校验、采样检验;如果全部检验通过,则数据集满足质量要求,形成拟合数据。
22、本发明的第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的一种基于多点校核的量测数据拟合方法。
23、本发明的第三方面提供一种基于多点校核的量测数据拟合系统,其中,包含上述的计算机可读存储介质。
24、与现有技术相比较,本发明提供的一种基于多点校核的量测数据拟合方法、介质及系统的有益效果是:拥有较高的拟合精度:通过设置分层准则与规则,对常见电量异常类型进行有监督约束,拟合结果能有效拟合曲线的真实趋势,拟合过程全流程数据化,所有中间态势、多样规则及补偿结果均有迹可循,经过拟合,保证曲线数据完整性与合理性。解决了现有技术缺乏能够实现市场化交易用户采集的正、反向有功电能示值曲线数据进行拟合的高效方法的技术问题。
1.一种基于多点校核的量测数据拟合方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述数据准备步骤包括:连接电力用户侧的智能电表,采集近一周的正、反向有功电能示值曲线原始数据;在电力用户基本信息数据库中,查询出参与市场化交易的用户列表;根据市场化交易用户列表,从收集到的全部用户的原始示值曲线数据中,筛选出符合列表内用户编号的正、反向有功电能示值曲线数据集;基于上一步获得的正、反向有功电能示值曲线数据集,连接拟合模型的训练数据库,检索过去2年的该用户的正、反向有功电能示值曲线历史数据集。
3.根据权利要求2所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述异常检测步骤包括:基于四分位距理论,设置电能示值的上下阈值;遍历电能示值曲线中各个数据点,判断每个点的值是否在正常区间内;设定突增异常、突降异常和倒走异常的逻辑判断规则;判断电能示值曲线在时间轴上是否呈递增态势;
4.根据权利要求3所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述拟合规则制定步骤包括:制定单点缺失、多点连续缺失、零点时刻数据缺失、包含非零点特殊时刻数据缺失和整日数据缺失的情况的拟合规则。
5.根据权利要求4所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述拟合计算步骤包括:针对各种异常情况,调用numpy数学计算库,利用python语言编写程序,实现拟合规则的运算与数据替代。
6.根据权利要求5所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述拟合检验步骤包括:依次取出每个时刻的数据,判断相邻两个时刻的数据变化关系;统计不合理的数据对的数量,判定是否需要进行修正;遍历不合理的数据对,调整拟合数据使其维持递增关系。
7.根据权利要求6所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述特殊情况标识步骤包括:对抄表失败、特殊算法用户、数据波动标识以及同期空缺标识的情况,添加不同的特殊符号进行标识;
8.根据权利要求7所述的一种基于多点校核的量测数据拟合方法,其特征在于,所述高风险数据处理步骤之后还包括总体检验的步骤,具体是:重新排序规范化数据集;进行值域校验、时间线校验、采样检验;如果全部检验通过,则数据集满足质量要求,形成拟合数据。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行权利要求1-8任一项所述的一种基于多点校核的量测数据拟合方法。
10.一种基于多点校核的量测数据拟合系统,其特征在于,包含权利要求9所述的计算机可读存储介质。