无轴承永磁同步电机强化学习控制器及其构造方法与流程

文档序号:12488871阅读:来源:国知局

技术特征:

1.一种无轴承永磁同步电机强化学习控制器,包括悬浮绕组电流控制模块(3)和转矩绕组电流控制模块(4),电机的实时径向位移值x、y与转子位移指令值x*、y*分别对应地比较得到位移误差ex和ey,实际转速n与转速指令值n*比较得到转速误差en,其特征是:悬浮绕组电流控制模块(3)和转矩绕组电流控制模块(4)的输入端分别连接执行器-评价器模块(2),执行器-评价器模块(2)由执行器神经网络(5)、评价器神经网络(8)、强化信号模块(6)和瞬时差分模块(7)组成,评价器神经网络(8)和强化信号模块(6)的输出端连接瞬时差分模块(7)的输入端,瞬时差分模块(7)的输出端分别连接执行器神经网络(5)和评价器神经网络(8)的输入端;位移误差ex、ey和转速误差en是评价器神经网络(8)、强化信号模块(6)和执行器神经网络(5)的共同输入,执行器神经网络(5)的输出是d-q坐标系下的悬浮绕组给定电流iBd*、iBq*与转矩绕组给定电流iMd*、iMq*,悬浮绕组给定电流iBd*、iBq*是悬浮绕组电流控制模块(3)的输入,转矩绕组给定电流iMd*、iMq*是转矩绕组电流控制模块(4)的输入。

2.根据权利要求1所述无轴承永磁同步电机强化学习控制器,其特征是:评价器神经网络(8)根据输入值生成评价器神经网络输出值函数V(t),强化信号模块(6)根据输入值生成强化信号r(t),瞬时差分模块(7)根据强化信号r(t)和评价器神经网络输出值函数V(t)计算得到并输出瞬时差分信号δTD(t)。

3.一种如权利要求1所述无轴承永磁同步电机强化学习控制器的构造方法,其特征是包括以下步骤:

A.构造执行器神经网络(5)与评价器神经网络(8),采用一个有三层的执行器-评价器复合RBF神经网络,第一层为输入层节点数为3个,每个输入节点代表状态向量x(t)=[ex eyen]T的一个分量;第二层为隐含层节点数为8个,节点基函数采用高斯核函数;第三层为输出层节点数为4个,由执行器神经网络输出值函数Im(t)和评价器神经网络输出值函数V(t)两个部分组成;

B.构造强化信号模块(6),强化信号模块(6)的输出为强化信号r(t)=αxrx(t)+αyry(t)+αnrn(t),rx(t)、ry(t)和rn(t)分别为x轴向位移误差强化信号、y轴向位移误差强化信号和转子转速误差强化信号,αx、αy和αn分别为x轴向位移误差强化信号系数、y轴向位移误差强化信号系数和转子转速误差强化信号系数;

C.构造瞬时差分模块(7),瞬时差分模块(7)的两个输入分别为强化信号r(t)、评价器神经网络输出值函数V(t),两个输出都为瞬时差分信号δTD(t)=r(t)+γV(t+1)-V(t),TD表示瞬时差分,0≤γ≤1为折扣因子,V(t+1)和V(t)分别为更新前后的值函数;

D.由执行器-评价器模块(2)与悬浮绕组电流控制模块(3)、转矩绕组电流控制模块(4)共同组成无轴承永磁同步电机强化学习控制器。

4.根据权利要求3所述无轴承永磁同步电机强化学习控制器的构造方法,其特征是:步骤B中,x轴向位移误差强化信号rx(t)、y轴向位移误差强化信号ry(t)和转子转速误差强化信号rn(t)由以下公式计算得到:

<mrow> <msub> <mi>r</mi> <mi>x</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> <mo>,</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>x</mi> </msub> <mo>(</mo> <mi>t</mi> <mo>)</mo> <mo>|</mo> <mo>&le;</mo> <msub> <mi>&epsiv;</mi> <mi>x</mi> </msub> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mn>0.1</mn> <mo>,</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>x</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&gt;</mo> <msub> <mi>&epsiv;</mi> <mi>x</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>

<mrow> <msub> <mi>r</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> <mo>,</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>y</mi> </msub> <mo>(</mo> <mi>t</mi> <mo>)</mo> <mo>|</mo> <mo>&le;</mo> <msub> <mi>&epsiv;</mi> <mi>y</mi> </msub> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mn>0.1</mn> <mo>,</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&gt;</mo> <msub> <mi>&epsiv;</mi> <mi>y</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>

<mrow> <msub> <mi>r</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> <mo>,</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>n</mi> </msub> <mo>(</mo> <mi>t</mi> <mo>)</mo> <mo>|</mo> <mo>&le;</mo> <msub> <mi>&epsiv;</mi> <mi>n</mi> </msub> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mn>0.1</mn> <mo>,</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&gt;</mo> <msub> <mi>&epsiv;</mi> <mi>n</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>

εx为x轴向位移误差信号的容许误差带,εy为y轴向位移误差信号的容许误差带,εn为转子转速误差信号的容许误差带。

5.根据权利要求3所述无轴承永磁同步电机强化学习控制器的构造方法,其特征是:步骤A中,评价器神经网络(8)根据式vj(t+1)=vj(t)+αCδTD(t)Φj(t)更新神经网络权值并输出新的评价器神经网络输出值函数V(t),αC为评价器神经网络的学习率,vj(t)为第j个隐含层节点到评价器输出节点的权值,vj(t+1)为更新后的第j个隐含层节点到评价器输出节点的权值,Φj(t)为第j个隐含层节点的输出;执行器神经网络(5)根据式wjk(t+1)=wjk(t)+αAδTD(t)Φj(t)更新神经网络权值,αA为执行器神经网络的学习率,wjk(t)为第j个隐含层节点到执行器的第k个输出节点的权值,wjk(t+1)为更新后的第j个隐含层节点到执行器的第k个输出节点的权值。

6.根据权利要求5所述无轴承永磁同步电机强化学习控制器的构造方法,其特征是:执行器神经网络输出值函数评价器神经网络输出值函数m=1,2,3,4,j=1,2,3,4,5,6,7,8,wjk(t)为第j个隐含层节点到执行器的第k个输出节点的权值,I1(t)、I2(t)、I3(t)、I4(t)分别对应iBd*、iBq*、iMd*、iMq*,vj(t)为第j个隐含层节点到评价器输出节点的权值。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1