一种基于主成分分析的数据压缩迭代计算方法与流程

文档序号：18197484发布日期：2019-07-17 05:56阅读：244来源：国知局

本发明属于互联电网数据测量领域，具体涉及一种基于主成分分析的数据压缩迭代计算方法。

背景技术：

随着我国电网规模越来越扩大化，电力系统建设也在加速进行，电网的可靠稳定运行也越来越依赖大量信息的支持，同时海量信息的产生也给数据存储、传输造成了很大负担，尤其是随着电力系统广域测量、广域控制和保护等技术的迅速发展，大批新型装置被广泛应用于电力系统中。各种装置采集的大量数据需要进一步地研究分析，并加以利用，需要从数据采集中心通过电力通信网传送到上级管理中心。其中广域信息传递需要通过远程通信网，这种网络的传输速率通常要比近距离局域网的传输速率低，因此通信速度慢，传输所花费的时间长，很难满足电力系统通信的实时性要求；同时，电力系统中监测设备的数据采样率很高，所产生的大量数据形成数据通信和存储的瓶颈，严重影响到电力系统的稳定运行和安全控制。

随着相量测量单元(phasormeasurementunit，pmu)装置的普遍应用，产生的数据信息量越来越大，同时数据压缩技术在电力系统广域测量数据压缩领域的应用，越来越引起人们广泛关注和研究。如何对同步测量数据进行更可靠、稳定高效率的压缩和传输，具有重要的现实意义。

现有技术中，用于数据压缩的主成分分析方法需要很大的数据窗来提供足够多的原始数据，以便于可以根据足够多的原始数据更加准确地且精确地提取出相同的特征。但是，大的数据窗显著地增加主成分分析方法的计算量，导致数据压缩的实时性差。同时，传统的主成分分析方法主要用于统计学，统计学中的随机变量通常是无序的，每次主成分分析的结果之间并没有显著的关联，并不完全适用于电力测量系统中具有很强相关性测量数据，不符合电力测量系统的实际数据特性。

为了解决这些问题，本发明方法提出用于电力系统数据压缩的主成分分析方法的迭代计算过程及方法，相比于传统的主成分分析方法显著减少了计算量，可实现基于主成分分析的电力系统数据高效压缩。

技术实现要素：

为了提高同步测量数据的压缩效率，克服主成分分析计算量大的问题，本发明提供了一种基于主成分分析的数据压缩迭代计算方法，充分利用电力系统测量数据之间的强相关性和关系一致性，通过迭代计算和判定条件的设定，不需要很大的数据窗就可以提取出原始数据的相同特征，可显著提高数据压缩的效率和实时性，减少计算量。

为了实现上述目的，本发明采取了如下技术方案。

一种基于主成分分析的数据压缩迭代计算方法，所述数据压缩计算方法包括如下步骤：

步骤s0，根据待压缩的测量数据m个时刻的n组的相量序列，构建m行n列的原始数据矩阵dr，归一化处理dr得到数据矩阵d，根据c＝d^hd计算d的协方差矩阵c并进一步计算c的全部特征值λi，i＝1......n，且λ1≥λ2≥…≥λn≥0，求线性方程组λii-c＝0的基础解系，得到c对于λi的一组特征向量ui，得到特征向量矩阵u＝[u1,u2,…,un]，且满足u^hcu＝λ，其中λ＝diag(λ1,λ2,…,λn)，选择主成分分量数n′，通常选取的方法有累积贡献率方法和kaiser-guttman准则两种，根据主成分分量数n′从特征向量矩阵u中选取出前n′个特征向量构成压缩特征向量矩阵u′；dr和d为m×n的复数矩阵，c和u为n×n的复数矩阵，u′为n×n′的复数矩阵；第n次数据压缩的压缩特征向量矩阵u′＝[u1,u2,…,un′]记为u′(n)；

步骤s1，令n＝n+1，设当前为第n次数据压缩，则已知第n-1次数据压缩的压缩特征向量矩阵u′(n-1)；

步骤s2，把第n-1次数据压缩的压缩特征向量矩阵u′(n-1)作为第n次的压缩特征向量矩阵u′(n)的近似，即u′(n)＝u′(n-1)；计算第n次数据压缩的近似主成分矩阵p′(n)，其计算公式为p′(n)＝d(n)u′(n-1)；再计算第n次数据压缩的重建数据矩阵

步骤s3，计算用于判定重建数据精度的判别条件；

步骤s4，判定u′(n)是否满足重建数据精度的判别条件，若判别条件成立，执行步骤s5；否则，转入步骤s8。

步骤s5，满足重建数据精度的要求，不需要重新计算主成分分析过程；通过从1到n′的循环判断方法，判断是否更少的主成分分量ui和pi能满足重建数据精度的判别条件；若更少的ui和pi满足判别条件，则执行步骤s6，否则，执行步骤s7；

步骤s6，设更新后的n′为通过循环判断得到的更少的主成分分量个数；则第n次数据压缩的压缩特征向量矩阵u′(n)为第n-1次数据压缩的压缩特征向量矩阵u′(n-1)的1到n′列，第n次数据压缩的主成分矩阵p(n)为近似主成分矩阵p′(n)的1到n′列，转入步骤s9；

步骤s7，第n次数据压缩的压缩特征向量矩阵u′(n)等于第n-1次数据压缩的压缩特征向量矩阵u′(n-1)，第n次数据压缩的主成分矩阵p(n)等于近似主成分矩阵p′(n)，转入步骤s9；

步骤s8，近似地将第n-1次数据压缩的压缩特征向量矩阵u′(n-1)作为第n次数据压缩的压缩特征向量矩阵u′(n)得到的重建数据矩阵不满足重建数据精度要求，需要计算一次全新的主成分分析，获得新的压缩特征向量矩阵u′(n)和新的主成分矩阵p(n)，进入步骤s9；

步骤s9，完成本次数据压缩，返回步骤s1进行下一次数据压缩。

进一步地，所述步骤s1中的归一化处理，具体为：

将dr归一化为模值为1的归一化数据矩阵d，其计算公式为d＝drλn^-1，d为m×n的复数矩阵，其中1≤j≤n。

进一步地，所述协方差矩阵c为hermitian矩阵和半正定矩阵，则c的特征值λi均为实数。

进一步地，所述步骤s3中用于判定重建数据精度的判别条件，采用综合矢量误差tve值作为衡量重建数据精度的判别方法。

进一步地，所述综合矢量误差tve的值为，

其中，是重构数据矩阵中的元素，dij(n)是归一化的数据矩阵d(n)中的元素。

进一步地，所述步骤s4中，所述判别条件为εtve(n)＜εtve,max；其中，εtve(n)为所有εij(n)的最大值，即取εtve(n)＝max{εij(n)}；εtve,max为数据压缩条件的综合矢量误差的最大值，εtve,max的取值由实际需求设定。

由上述本发明的实施例提供的技术方案可以看出，本发明实施例的基于主成分分析的数据压缩迭代计算方法，利用不同测量点的测量数据很强的一致性改进了基于主成分分析的数据压缩方法计算过程，通过迭代计算，使用前一次主成分分析数据压缩的特征向量矩阵来近似本次数据压缩的特征向量矩阵，在使用这种近似的基础上进行数据压缩；以重建数据精度为判定条件，判定是否可使用前一次的压缩特征向量矩阵近似地作为本次数据压缩的压缩特征向量矩阵，不需要很大的数据窗就可以提取出原始数据的相同特征，相比于传统主成分分析方法的数据窗长度具有显著优势，可显著提高数据压缩的效率和实时性；同时充分利用了电力系统测量数据之间的强相关性和关系一致性，实现了仅在扰动出现时重新计算一次、在扰动结束时再计算一次主成分分析数据压缩算法，相比于传统主成分分析数据压缩方法每次数据压缩都需要彻底地重新计算一遍主成分分析算法，本实施例的迭代计算过程计算量显著减少。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例基于主成分分析的数据压缩迭代计算方法流程示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

电力系统测量点之间是通过实际的电力系统互相连接的，测量点之间的电气距离的变化通常很小而仅在电力系统发生扰动时发生改变，在扰动结束后又恢复回正常水平。因此电力系统测量数据之间具有很强的相关性，在对电力系统测量数据进行压缩时，如果利用测量数据之间的相关性将显著提高数据压缩算法的效率。本发明提出了一种基于主成分分析的数据压缩迭代计算方法，利用不同测量点的测量数据很强的一致性改进了基于主成分分析的数据压缩计算过程，通过迭代计算，使用前一次主成分分析数据压缩的特征向量矩阵来近似本次数据压缩的特征向量矩阵，从而进行数据压缩，如果本次数据压缩的重建数据矩阵满足重建精度的要求，那么就不需要重新进行一次主成分分析的计算过程而使用上一次主成分分析的计算结果即可。因此，进行相同次数的数据压缩时，相比于不使用迭代过程的主成分分析方法，采用本发明所提供的数据压缩计算方法，可显著降低主成分分析方法的计算量。

为了便于对本发明实施例的理解，下面将结合附图以具体实施例为例做进一步的解释说明，且实施例并不构成对本发明的限定。

本实施例提供了一种基于主成分分析的数据压缩迭代计算方法。

在电力系统同步测量得到的数据中，电压和电流相量序列均由一一对应的幅值和相位组成，同步测量数据中通常包含若干组电压相量和若干组电流相量。本实施例中以电力系统中的电压相量为例进行说明，本实施例的步骤同样适用于电流相量。

图1所示为本实施例所述基于主成分分析的数据压缩迭代计算方法流程示意图。如图1所示，所述数据压缩计算方法包括如下步骤：

步骤s0，根据待压缩的测量数据m个时刻的n组的电压相量序列，构建m行n列的原始数据矩阵dr，归一化处理dr得到数据矩阵d，根据c＝d^hd计算d的协方差矩阵c并进一步计算c的全部特征值λi，i＝1......n，且λ1≥λ2≥…≥λn≥0，求线性方程组λii-c＝0的基础解系，得到c对于λi的一组特征向量ui，得到特征向量矩阵u＝[u1,u2,…,un]，且满足u^hcu＝λ，其中λ＝diag(λ1,λ2,…,λn)，选择主成分分量数n′，通常选取的方法有累积贡献率方法和kaiser-guttman准则两种，根据主成分分量数n′从特征向量矩阵u中选取出前n′个特征向量构成压缩特征向量矩阵u′；dr和d为m×n的复数矩阵，c和u为n×n的复数矩阵，u′为n×n′的复数矩阵。

本步骤中，电压相量为其中，j＝1,…,n，对应同步测量数据中的一个电压测量点(例如母线a相电压、母线正序电压等)，vj和αj分别为电压相量一一对应的幅值序列和相位序列；待压缩的测量数据共有m个时刻的数据，则有vj＝[v1j,v2j,…,vmj]^t，αj＝[α1j,α2j,…,αmj]^t，vij∠αij对应第j个电压相量在第i个时刻的相量，1≤i≤m，1≤j≤n。

进一步地，由电压相量数据构建m行n列的原始数据矩阵dr，dr为m×n的复数矩阵；根据d＝drλn^-1将dr归一化为模值为1的归一化数据矩阵d，d为m×n的复数矩阵，其中1≤j≤n；根据c＝d^hd计算d的协方差矩阵c，c为n×n的复数矩阵，协方差矩阵c为hermitian矩阵和半正定矩阵；计算协方差矩阵c的全部特征值λi，i＝1......n，且λ1≥λ2≥…≥λn≥0，由于c为hermitian矩阵和半正定矩阵，则c的特征值λi均为实数，进而对线性方程组λii-c＝0求解。第n次数据压缩的压缩特征向量矩阵u′＝[u1,u2,…,un′]记为u′(n)。

步骤s1，令n＝n+1，设当前为第n次数据压缩，则已知第n-1次数据压缩的压缩特征向量矩阵u′(n-1)。

步骤s3，计算用于判定重建数据精度的判别条件。

本步骤中，用于判定重建数据精度的判别条件可根据实际数据压缩需求选取具体的误差计算方法。本实施例示例性的采用综合矢量误差tve(totalvectorerror)值作为衡量重建数据精度的判别方法。

综合矢量误差tve的值为，

其中，是重构数据矩阵中的元素，dij(n)是归一化的数据矩阵d(n)中的元素。

设定采用误差最大值作为判定条件，误差最大值为εtve(n)＝max{εij(n)}，其中，εtve(n)为所有εij(n)的最大值。

步骤s4，判定u′(n)是否满足重建数据精度的判别条件，若判别条件成立，重建数据满足精度要求，执行步骤s5；否则，重建数据不满足精度要求，执行步骤s8。

进一步地，本步骤中所述判别条件为εtve(n)＜εtve,max。

步骤s5，满足重建数据精度的要求，不需要重新计算主成分分析过程；通过从1到n′的循环判断方法，判断更少的主成分分量数，即更少的ui和pi是否能满足重建数据精度的判别条件；若更少的ui和pi满足判别条件，则执行步骤s6，否则，执行步骤s7。

步骤s6，更少的主成分分量个数满足要求，设更新后的n′为通过循环判断得到的更少的主成分分量个数。则第n次数据压缩的压缩特征向量矩阵u′(n)为第n-1次数据压缩的压缩特征向量矩阵u′(n-1)的1到n′列，第n次数据压缩的主成分矩阵p(n)为近似主成分矩阵p′(n)的1到n′列，则转入步骤s9；

步骤s7，更少的主成分分量个数不满足要求，则第n次数据压缩的压缩特征向量矩阵u′(n)等于第n-1次数据压缩的压缩特征向量矩阵u′(n-1)，第n次数据压缩的主成分矩阵p(n)等于近似主成分矩阵p′(n)，则转入步骤s9；

步骤s9，完成本次数据压缩，返回步骤s1进行下一次数据压缩。

通过以上技术方案可以看出，本实施例的基于主成分分析的数据压缩迭代计算方法，以重建数据精度为判定条件，判定是否可使用前一次的压缩特征向量矩阵近似作为本次数据压缩的压缩特征向量矩阵，不需要很大的数据窗就可以提取出原始数据的相同特征，相比于传统主成分分析方法的数据窗长度具有显著优势，可显著提高数据压缩的效率和实时性；同时充分利用了电力系统测量数据之间的强相关性和关系一致性，实现了仅在扰动出现时重新计算一次、在扰动结束时再计算一次主成分分析数据压缩算法，相比于传统主成分分析数据压缩方法每次数据压缩都需要彻底重新计算一遍主成分分析算法，本实施例的迭代计算过程计算量显著减少。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本领域普通技术人员可以理解：实施例中的装置中的部件可以按照实施例描述分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的部件可以合并为一个部件，也可以进一步拆分成多个子部件。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张放;严英;王小君;和敬涵;许寅;吴翔宇
技术所有人：北京交通大学
我是此专利的发明人

上一篇：一种硒鼓刮刀及具有该硒鼓刮刀的硒鼓的制作方法
上一篇：一种高韧性环保再生塑料及其制备工艺的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。