本发明属于评价方法,具体涉及一种基于电能表远程误差诊断的数据清洗与质量评价方法。
背景技术:
关口表是指把住一个关口的计量表,俗称总表。关口电能表是用于挂接在变电站母线出线处、线路t节点处用于计量该线路上的总供电量的,可用该计量值参与考核线损或者是考核高压计量计费用户的电量。
随着科技的发展,现阶段我国的关口表大多具备远程传输功能,即将关口表数据通过网络实时传输给数据处理中心。由于关口表长期使用,其采集的数据难免产生误差甚至错误。为了避免这种误差和错误带来的经济损失,现有技术中一般通过定期人工校验的方式对关口表数据进行修正,使之处于良好的运行状态。
由于我国关口表数量众多,不同地区关口表老化程度也并不相同,因此不同关口表的误差本身就相差很多。另外,由于关口表的数据时通过网络传输给数据处理中心的,无论有线传输还是无线传输,传输过程不可避免的也会产生相应的误差,因此数据处理中心的实测数据往往并不准确。
因此需要一种能够准确修正误差,使得关口表数据更为准确可靠的方法。
技术实现要素:
本发明针对现有技术的缺陷,提供一种基于电能表远程误差诊断的数据清洗与质量评价方法。
本发明是这样实现的:一种基于电能表远程误差诊断的数据清洗与质量评价方法,包括下述步骤:
步骤一:数据采集
需要采集的数据为数据中心接收到的关口表远程数据,
步骤二:校验
对关口表校验,记录校验后的关口表读数;
步骤三:校验数据远程传输
用已有网络传输校验后的数据,传输目的地为数据中心,
步骤四:计算
分别计算传输误差和关口表误差,
步骤五:归类
对不同关口表的传输误差进行比较,将同类传输误差归为一类;
步骤六:曲线通化
同一类传输误差的曲线进行曲线通化,
步骤七:新数据评价与清洗
当数据中心接收到新数据时,用前述标准进行评价和清洗。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤一包括,
所述的关口表远程数据记为f(i,t),其中i表示第i个关口表,t表示接收到该数据的时刻,f(i,t)的值即为关口表远程读数的值。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤二包括,
校验后的关口表读数记为f’(i,ta),其中i表示第i个关口表,ta表示该第i个校验后的关口表在ta时刻进行的数据读取。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤二包括,
在对关口表校验的时候连续取若干个的点时间,以这些时间点的平均值作为本步骤的f’(i,ta);
时间间隔的取值范围为50毫秒-5秒,时间点个数的范围为1个-1000个。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤三包括,
数据中心接到的ta时刻的关口表校验后读数记为f”(i,ta);
当步骤二取了多个连续时间点作为校验数据时,本步骤是将这多个时间点的数据均通过网络发送给数据中心,数据中心接收到数据后,取这些数据的平均值作为本步骤的f”(i,ta)。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤四包括,
传输误差用下述公式计算
ε传(i,tj)=f”(i,tj)-f(i,tj)
针对计算得到的传输误差进行曲线拟合g传(i),i表示第i个关口表,tj表示第j次校验后采样的时间;
关口表误差用下述方法求得
首先用步骤一的数据进行拟合,拟合仅对同一块关口表的数据进行,拟合将离散时间点的数据拟合称为曲线,拟合可以用任意现有技术进行,
然后在前述拟合的曲线上取特定时间点,求得该时间点上的关口表读数值,
最后用下述公式计算关口表误差ε关,
ε关(i,tj)=f’(i,tj)-f”’(i,tj)-ε传(i,tj)
用曲线拟合的方法得到关口表误差曲线g关(i),i表示第i个关口表,tj表示第j次校验后采样的时间。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤五包括,
如果符合下述条件,那么将这些关口表的传输误差归为一类;
首先任意取两个关口表传输误差曲线,该传输误差曲线由步骤四中拟合得到,分别ε传(m,tj)和ε传(n,tj),其中m和n是关口表序号,
如果对于任意时间点下述条件均成立,那么判定这两个传输误差曲线为同一类
对任意时间tj,
判定三条以上传输误差曲线为同一类的条件是,该类中的任意两条传输误差曲线均满足上述要求;
依次对所有关口表进行归类。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤六包括,
对同一类传输误差曲线中的每个传输误差曲线进行同时间点采样,然后对同时间点的采样值取平均值,得到该时间点的均值,然后用该均值进行曲线拟合,得到新的传输误差曲线,记为g’传,该类中的所有关口表均用g’传作为传输误差曲线。
如上所述的一种基于电能表远程误差诊断的数据清洗与质量评价方法,其中,所述的步骤七包括,
记该数据为f(i,t+1),用先验的关口表数据f(i,t)进行曲线拟合,用拟合的曲线预测接收到新数据时刻的数据值,记为f预(i,t+1);
类似的还可以得到f(i+1,t+1)和f预(i+1,t+1),设第i+1个关口表与第i个关口表为同一类;
同时对第i个关口表和第i+1个关口表,通过前述的第四步、第五步和第六步,可以得到传输误差曲线ε传(i,tj)和关口表误差ε关(i,tj),因此可以得到t+1时刻的误差值,ε传(i,t+1)、ε关(i,t+1)、ε传(i+1,t+1)、ε关(i+1,t+1)
若
|f(i,t+1)-f预(i,t+1)|≤ε传(i,t+1)+ε关(i,t+1),并且
|f(i+1,t+1)-f预(i+1,t+1)|
≤ε传(i+1,t+1)+ε关(i+1,t+1)
均成立,那么判定数据有效;
若
|f(i,t+1)-f预(i,t+1)|≤ε传(i,t+1)+ε关(i,t+1),并且
|f(i+1,t+1)-f预(i+1,t+1)|
≤ε传(i+1,t+1)+ε关(i+1,t+1)
中有一个不成立,那么在该类中再取一个新的关口表,进行上述判断,
如果判定结果是新的关口表上述条件成立,那么判定不符合上述判定条件的关口表损坏,数据有无效;
如果判定结果是新的关口表上述条件也不成立,那么判定传输网络有损坏,数据无效;
若
|f(i,t+1)-f预(i,t+1)|≤ε传(i,t+1)+ε关(i,t+1),并且
|f(i+1,t+1)-f预(i+1,t+1)|
≤ε传(i+1,t+1)+ε关(i+1,t+1)
中两个均不成立,那么判定网络和关口表均有损坏可能,数据无效,需要工作人员逐项排查。
本发明的显著效果是:通过对关口表历史远程数据的采集和处理,将关口表损坏,远程传输系统损坏分别做了归类。在进行新数据判定的时候,可以依据计算结果快速准确的判定是关口表和传输网络中的哪个出现了损坏。
具体实施方式
一种基于电能表远程误差诊断的数据清洗与质量评价方法,包括下述步骤:
步骤一:数据采集
需要采集的数据为数据中心接收到的关口表远程数据,该数据记为f(i,t),其中i表示第i个关口表,t表示接收到该数据的时刻,f(i,t)的值即为关口表远程读数的值。
步骤二:校验
对关口表校验,记录校验后的关口表读数f’(i,ta),其中i表示第i个关口表,ta表示该第i个校验后的关口表在ta时刻进行的数据读取。
由于一个关口表两次校验之间的时间间隔较长,仅取一个时间点ta,往往会产生较大误差,因此可以在对关口表校验的时候连续取若干个的点时间,例如以1秒为间隔,取100个时间点,然后用这100个时间点的平均值作为本步骤的f’(i,ta)。
当然本领域的技术人员,可以根据需要更改时间间隔和时间点的个数,一般来说时间间隔的取值范围为50毫秒-5秒,时间点个数的范围为1个-1000个。
另外对同一个关口表不同次的校验,应当作为不同的数据进行处理,例如对第i个关口表在ta时刻进行了一次校验,校验后该关口表经过一段时间使用后,又在tb时刻进行了另一次校验,那么f’(i,ta)和f’(i,tb)应当作为不同的数据进行分别处理。当然,第i个关口表的校验次数可能远超过两次,那么不同校验次数中得到的读数分别记为f’(i,ta)、f’(i,tb)、…、f’(i,tj),其中i表示第i个关口表,tj表示第j次校验后采样的时间。
步骤三:校验数据远程传输
用已有网络传输校验后的数据,传输目的地为数据中心,数据中心接到的ta时刻的关口表校验后读数记为f”(i,ta)。
当步骤二取了多个连续时间点作为校验数据时,本步骤是将这多个时间点的数据均通过网络发送给数据中心,数据中心接收到数据后,取这些数据的平均值作为本步骤的f”(i,ta),例如步骤二以1秒为间隔,取100个时间点,那么本步骤应当将这100个时间点的数据均发送给数据中心,数据中心接收到数据后取接收到数据的平均值作为本步骤的f”(i,ta)。
步骤四:计算
分别计算传输误差和关口表误差,
传输误差用下述公式计算
ε传(i,tj)=f”(i,tj)-f(i,tj)
当系统对同一块关口表记录了三次以上校验数据时,就可以针对计算得到的传输误差进行曲线拟合g传(i),i表示第i个关口表,tj表示第j次校验后采样的时间。
关口表误差用下述方法求得
首先用步骤一的数据进行拟合,拟合仅对同一块关口表的数据进行,拟合将离散时间点的数据拟合称为曲线,拟合可以用任意现有技术进行,例如最小二乘法。
然后在前述拟合的曲线上取特定时间点,求得该时间点上的关口表读数值,例如ta点的关口表读数值,该读数值记为f”’(i,ta)。
最后用下述公式计算关口表误差ε关,
ε关(i,tj)=f’(i,tj)-f”’(i,tj)-ε传(i,tj)
类似于传输误差的情况,当有三个以上关口表误差时,可以用曲线拟合的方法得到关口表误差曲线g关(i),i表示第i个关口表,tj表示第j次校验后采样的时间。
步骤五:归类
对不同关口表的传输误差进行比较,如果符合下述条件,那么将这些关口表的传输误差归为一类。
首先任意取两个关口表传输误差曲线,该传输误差曲线由步骤四中拟合得到,分别ε传(m,tj)和ε传(n,tj),其中m和n是关口表序号,
如果对于任意时间点下述条件均成立,那么判定这两个传输误差曲线为同一类
对任意时间tj,
判定三条以上传输误差曲线为同一类的条件是,该类中的任意两条传输误差曲线均满足上述要求。
依次对所有关口表进行归类。
步骤六:曲线通化
同一类传输误差的曲线进行曲线通化,用下述方法进行。
对同一类传输误差曲线中的每个传输误差曲线进行同时间点采样,然后对同时间点的采样值取平均值,得到该时间点的均值,然后用该均值进行曲线拟合,得到新的传输误差曲线,记为g’传,该类中的所有关口表均用g’传作为传输误差曲线。
步骤七:新数据评价与清洗
当数据中心接收到新数据时,记该数据为f(i,t+1),用先验的关口表数据f(i,t)进行曲线拟合,用拟合的曲线预测接收到新数据时刻的数据值,记为f预(i,t+1)。
类似的还可以得到f(i+1,t+1)和f预(i+1,t+1),设第i+1个关口表与第i个关口表为同一类。
同时对第i个关口表和第i+1个关口表,通过前述的第四步、第五步和第六步,可以得到传输误差曲线ε传(i,tj)和关口表误差ε关(i,tj),因此可以得到t+1时刻的误差值,ε传(i,t+1)、ε关(i,t+1)、ε传(i+1,t+1)、ε关(i+1,t+1)
若
|f(i,t+1)-f预(i,t+1)|≤ε传(i,t+1)+ε关(i,t+1),并且
|f(i+1,t+1)-f预(i+1,t+1)|
≤ε传(i+1,t+1)+ε关(i+1,t+1)
均成立,那么判定数据有效;
若
|f(i,t+1)-f预(i,t+1)|≤ε传(i,t+1)+ε关(i,t+1),并且
|f(i+1,t+1)-f预(i+1,t+1)|
≤ε传(i+1,t+1)+ε关(i+1,t+1)
中有一个不成立,那么在该类中再取一个新的关口表,进行上述判断,
如果判定结果是新的关口表上述条件成立,那么判定不符合上述判定条件的关口表损坏,数据有无效;
如果判定结果是新的关口表上述条件也不成立,那么判定传输网络有损坏,数据无效;
若
|f(i,t+1)-f预(i,t+1)|≤ε传(i,t+1)+ε关(i,t+1),并且
|f(i+1,t+1)-f预(i+1,t+1)|
≤ε传(i+1,t+1)+ε关(i+1,t+1)
中两个均不成立,那么判定网络和关口表均有损坏可能,数据无效,需要工作人员逐项排查。