一种数据驱动的感应电机参数在线辨识方法与流程

文档序号:14043685阅读:346来源:国知局

本发明涉及感应电机的参数辨识的技术领域,具体涉及一种数据驱动的感应电机参数在线辨识方法。



背景技术:

感应电机的参数辨识是电机控制领域的重点和难点问题。在感应电机的间接矢量控制中,最重要的辨识参数是转子时间常数,其辨识精度直接影响着电机的输出性能。因此,电机转子时间常数的辨识尤为重要。感应电机的转子时间常数由转子电阻和励磁电感组成。由于在电机长时间运行过程中,受到电机发热的影响,电机的转子电阻会发生变化;而如果电机运行在弱磁状态下,电机的励磁电感也会发生变化。因此,有必要在电机运行的过程中,对电机的转子时间常数进行在线辨识。

以往的感应电机参数辨识方法主要是基于模型的,如模型参考自适应法(发明专利:改进的异步电机模型参考自适应转速估计方法和装置。公开号:cn106685297a),扩展卡尔曼滤波器法(发明专利:带指数渐消因子的卡尔曼滤波器的感应电机转速观测方法,公开号:cn102176653a),滑模观测器法(发明专利:基于转子磁链观测器的异步电机参数在线矫正方法,公开号:cn106452256a),线性最小二乘法(发明专利:电机参数辨识方法及装置,公开号:cn104539211a)等等。这类方法最大的特点是辨识的精度和稳定性极大的依赖于电机的等效模型,容易受到模型误差的影响。因此,存在着辨识精度低,抗干扰能力差等缺点。近年来,随着人工智能技术的发展,数据驱动的参数在线辨识方法受到人们的关注,例如神经网络方法(发明专利:一种基于elman神经网络的感应电机转子电阻参数辨识方法,公开号:cn102937670a),支持向量机法(发明专利:一种无轴承异步电机无速度传感器构造方法,公开号:cn102629848a),粒子群算法(发明专利:一种基于改进粒子群优化算法的同步风力发电机参数辨识方法,公开号:cn103544525a)等等。数据驱动的参数辨识方法不依赖于模型,不会受到模型误差的影响,因此相比于基于模型的方法,更具精确性和鲁棒性。但是,数据驱动的参数辨识方法一直受到一个难点的制约,即成功的数据驱动参数辨识方法需要大量的带有标签的训练数据,而这种数据在实际工程中是很难获得的。



技术实现要素:

针对现有技术中上述问题,本发明提出了一种数据驱动的感应电机参数在线辨识方法,可以在离线状态下自动的产生带标签的训练数据,并加以训练,再根据训练结果在电机运行中在线地辨识电机参数。

本发明采用的技术方案为:一种数据驱动的感应电机参数在线辨识方法,该方法包括如下步骤:

步骤1、设计转子时间常数在线辨识的数据生成框架:框架由三部分组成:一个三层bp神经网络用于输出电机参数值,称之为动作网络;一个三层bp神经网络用于对参数变化后的电机性能进行评估,称之为价值评估网络;一个当前电机状态评价算法,称之为时间差分算法。将电机的d-q轴电压usd、usq以及无功功率q作为观测(observer),以当前转矩与平均转矩之差te-tref作为奖励(reward),以转子时间常数tr辨识值的变化作为动作(action),将观测usd、usq、q分别送入框架中的动作网络和价值评估网络。价值评估网络的输出值与时间差分算法的输出值相减,得到价值误差(td-error),td-error一方面用于价值评估网络的训练,另一方面与动作网络的输出相乘,作为动作网络的训练误差函数,同时,动作网络的输出便为动作的概率值,即转子时间常数辨识值的概率密度;

步骤2、在不同的转速n,不同的isd,isq状态下,进行步骤1,每个状态迭代若干次,得到不同转速n下的最优解,记录数据,数据格式为{n,isd,isq,usd,usq,q,tefinal,trfinal},其中,trfinal表示迭代完成后,转子时间常数辨识值;tefinal表示trfina对应的转矩值;

步骤3,步骤1辨识出的结果为电机的最优状态解,但是在线辨识的关键问题在于如何辨识出非最优状态,并矫正至最优状态,因此,仍然需要获取非最优状态下的数据。将步骤1、2每次迭代中的所有中间状态数据记录下来,数据格式为{n,isd,isq,usd,usq,q,t’e,t’r},其中,t’e表示当前状态下的转矩值,t’r表示当前状态下的辨识值。并将这些数据和步骤2记录下的数据合并为原始数据集;

步骤4,对原始数据集进行处理,设{n,isd,isq,usd,usq,q}为训练数据集的输入,设sign(t’r-trfinal)*|t’e-tefinal|作为训练数据集的标签,其中sign(t’r-trfinal)表示取t’r-trfinal的正负号,|t’e-tefinal|表示取t’e-tefinal的绝对值,使用三层bp神经网络对训练数据集进行训练,训练完成的神经网络的输出便为当前状态到最优状态的距离;

步骤5,将步骤4训练完成的神经网络模型输入至电机控制器的mcu中,在线辨识时,将mcu中的神经网络输出经过一个比例积分(pi)调节器,pi调节器的输出便为转子时间常数的矫正值。

本发明的方法的主要优点是:

(1)本发明提出的方法完全基于电机实际采样数据,与模型无关。因此,方法的精确性和稳定性不会受到模型误差的影响。

(2)本发明提出的方法虽然是数据驱动的,但是不需要提前准备标签数据,而是在电机运行过程中,自动产生标签数据。

(3)本发明提出的方法的标签数据的产生和训练是同时进行的,大大缩短了运算时间。

(4)本发明提出的方法存在离线和在线两个阶段,大部分的运算是在离线过程中通过电脑完成的,只有少量的计算进行于电机控制器中的mcu中,因此,不会对电机控制器的mcu造成额外的负担,易于工程实现。

附图说明

图1为本发明一种数据驱动的感应电机参数在线辨识方法的数据生成框架;

图2为动作网络和价值评估网络的结构;

图3为用于数据训练的多层bp神经网络;

图4为感应电机的转子常数在线辨识示意图。

具体实施方式

下面结合附图以及具体实施方式进一步说明本发明。

本发明的整体思路为:在不同的转速n,不同的d-q轴电流isd,isq下,设计一种数据生成框架对电机进行数据提取,辨识出的最终结果及其对应的观测值标记为一组训练数据,记标签为“0”。同时,将辨识过程中所有出现过的辨识值及其观测值也分别标记为一组训练数据,标签值为:

label=sign(t'r-trfinal)|t'e-tefinal|

其中,t’r表示当前的辨识值,trfinal表示最终的辨识结果。t’e表示当前的输出转矩,tefinal表示最终辨识结果时电机的输出转矩。再采用三层bp神经网络对所有训练数据进行最速梯度下降训练当训练完成后,将训练好的神经网络模型输入到电机控制器的mcu上。在电机实际运行中,可以根据电机控制器mcu中的神经网络输出结果,在线的更新转子时间常数值。

原理和步骤为:

1、设计转子时间常数在线辨识的数据生成框架:框架由三部分组成:一个三层bp神经网络用于输出电机参数值,称之为动作网络;一个三层bp神经网络用于对参数变化后的电机性能进行评估,称之为价值评估网络;一个当前电机状态评价算法,称之为时间差分算法。将电机的d-q轴电压usd、usq以及无功功率q作为观测(observer),以当前转矩与平均转矩之差te-tref作为奖励(reward),以转子时间常数辨识值的变化作为动作(action)。将观测usd、usq、q分别送入动作网络和价值评估网络。价值评估网络的输出值与时间差分算法的输出值相减,得到时间差分价值误差,记为td-error,td-error一方面用于价值评估网络的训练,另一方面与动作网络的输出相乘,作为动作网络的训练误差函数。同时,动作网络的输出便为动作的概率值,即转子时间常数辨识值的概率密度。

2、在不同的转速n,不同的isd,isq状态下,进行步骤1,每个状态迭代250次。得到不同转速n下的最优解。记录数据,数据格式为{n,isd,isq,usd,usq,q,tefinal,trfinal}。

3、步骤1辨识出的结果为电机的最优状态解,但是在在线辨识过程中,关键的问题在于如何辨识出非最优状态,并矫正至最优状态。因此,仍然需要获取非最优状态下的数据。将步骤1、2每次迭代中的所有中间状态数据记录下来,数据格式为{n,isd,isq,usd,usq,q,t’e,t’r},并将这些数据和步骤2记录下的数据合并为原始数据集。

4、对原始数据集进行处理,设{n,isd,isq,usd,usq,q}为训练数据集的输入,设sign(t’r-trfinal)*|t’e-tefinal|作为训练数据集的标签。其中sign(t’r-trfinal)表示取t’r-trfinal的正负号,|t’e-tefinal|表示取t’e-tefinal的绝对值。使用三层bp神经网络对训练数据集进行训练。训练完成的神经网络的输出便为当前状态到最优状态的距离。

5、将步骤4训练完成的神经网络模型输入至电机控制器的mcu中,在线辨识时,将mcu中的神经网络输出经过一个pi调节器,pi调节器的输出便为转子时间常数的矫正值。

实施例

1、电机在线参数辨识的数据生成框架

首先设计参数离线辨识的的数据生成框架。图1为框架的示意图,采集电机的d-q轴电压usd,usq,以及无功功率q作为框架的观测。其中usd,usq可以从电机控制器直接获得,无功功率可以由下式算得:

其中,表示估计参数,ψrα,ψrβ表示电机α、β轴转子磁链,isα,isβ表示电机α、β轴电流。ωr表示电机的电角速度。

采集电机的转矩信号作为框架的奖励。为了提高敏感性,可选用t’e-tref作为实际奖励。其中t’e为当前转矩,tref为迭代运算过程中的平均转矩。

转子时间常数辨识值为框架的动作,为了提高鲁棒性,采用转子时间常数值的概率作为实际动作。记为p(tr),其中p(·)表示概率函数。

将电机的观测送入动作网络和价值评估网络,动作网络和价值评估网络均为三层bp神经网络结构,包含3个输入层神经元,4个隐含层神经元,1个输出层神经元,如图2所示。输入层神经元和隐含层神经元的关系为:

其中h(i)为第i个隐含层神经元的输出,xn为输入,ω1i为隐含层神经元的权值,b1i为隐含层神经元的偏置,f为sigmoid激励函数,记为:

隐含层神经元和输出层神经元的关系为:

其中y为神经网络的输出,hi为隐含层神经元的输入,ω21为输出层神经元的权值,b21为输出层神经元的偏置。神经网络的训练采用最速梯度下降法。

价值评估网络的输出值为框架的价值函数的估计值td_est。使用时间差分(td)方法进行价值函数目标值的计算,将奖励送入td,并由下式算得价值函数的目标值td_target:

td_target←td(st,at)+α[reward+γmaxtd(st+1,a)-td(st,at)]

其中td(st,at)表示当前观测和动作下的价值函数,maxtd(st+1,a)表示在下一个观测状态下,价值函数的最大值,reward为当前奖励,α为学习率,γ为折扣因子。α,γ∈(0,1)。

令:

td_error=td_target-td_est

为价值函数的误差,将td_error送入价值评估网络作为其训练损失函数,使用梯度下降法对价值评估网络进行训练。同时td_error与动作网络的输出相乘,作为动作网络的训练损失函数,使用梯度下降法对动作网络进行训练。动作网络的输出便为转子时间常数辨识值的概率对数表现形式-log[p(tr)]。在实际中,可以选用出现概率最大的辨识值作为最终辨识值。

基于上述过程,在不同的转速n,不同的电机d-q轴电流isd,isq状态下,使用上述数据生成框架对每一个状态迭代250次,记录最终迭代的观测、动作和奖励,数据格式为{n,isd,isq,usd,usq,q,tefinal,trfinal}。同时,记录每一次迭代过程中的中间观测、动作和奖励,数据格式为{n,isd,isq,usd,usq,q,t’e,t’r},将所有的数据一起作为原始数据集。

2、基于bp神经网络的数据训练

将原始数据集进行处理,令输入数据为{n,isd,isq,usd,usq,q},标签数据为sign(t’r-trfinal)*|t’e-tefinal|,将输入和标签数据送入图3所示的3层bp神经网络中,输入层包含6个神经元,分别输入n,isd,isq,usd,usq,q,隐含层包含4个神经元,输出层包含一个神经元。

输入层神经元和隐含层神经元的关系为:

其中h(i)为第i个隐含层神经元的输出,xn为输入,ω1i为隐含层神经元的权值,b1i为隐含层神经元的偏置,f为sigmoid激励函数,记为:

隐含层神经元和输出层神经元的关系为:

其中y为神经网络的输出,hi为隐含层神经元的输入,ω21为输出层神经元的权值,b21为输出层神经元的偏置。

使用标签数据,结合最速梯度下降法对神经网络进行训练,最终输出的值为当前转矩与最优转矩的差值δte,也即当前状态到最优状态的距离。

3、电机参数的在线矫正过程。

步骤2中的神经网络训练完毕后,将神经网络模型输入电机控制器中的mcu中,在线矫正过程如图4所示。电机在线运行时,电机的n,isd,isq,usd,usq,q由电机控制器采样获得,将在线运行时的n,isd,isq,usd,usq,q送入mcu中的神经网络,经神经网络运算后,输出值δte与0比较,再将比较值送入pi调节器,pi调节器的输出变为转子时间常数的矫正值δtr。为了保证pi调节器输出值的收敛性,pi调节器的比例时间常数和积分时间常数需均为小于1的正数。

本发明中涉及到的本领域公知技术未详细阐述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1