一种基于门控循环单元的迟滞建模与端对端补偿方法与流程

文档序号:21198408发布日期:2020-06-23 19:01阅读:207来源:国知局
一种基于门控循环单元的迟滞建模与端对端补偿方法与流程

本发明属于微纳米科学与技术领域中的显微工具——原子力显微镜,本发明主要涉及一种基于门控循环单元的迟滞建模与端对端补偿方法。



背景技术:

作为一种先进的微纳成像和操作工具,原子力显微镜(atomicforcemicroscopy,afm)已被广泛应用于众多领域之中[1-2]。为了实现在样品表面上的精确移动,原子力显微镜通常采用压电驱动器作为扫描装置。压电驱动器具有纳米级的位移分辨率[3-5],然而,其固有的铁电效应会引起迟滞现象,从而导致输入电压与输出位移之间存在复杂的非线性关系,进而影响afm系统的定位精度和成像质量[6-7]。

迟滞效应除了具有非线性特点,还具有记忆特性和频率相关性的特征[8-9]。记忆特性指的是压电驱动器的位移不仅取决于当前时刻的输入电压,还与输入电压的变化过程有关[10]。当输入电压的频率保持在一定范围内时,频率的增大会导致更明显的迟滞现象,这通常被称为频率相关性[11]。此外,记忆特性和频率相关性与非线性耦合在一起,形成更加复杂的非线性,这使得很难用特定函数描述迟滞效应,进而增加了迟滞建模的难度[12]。

根据建模原理的不同,迟滞模型主要分为基于物理特性的模型和基于现象的模型两类,物理模型利用基本物理原理描述迟滞特性,相反,基于现象的迟滞模型则是根据实验数据来建立的,不考虑压电驱动器的物理属性[13-14]。目前,典型的迟滞模型包括duhem模型,jiles-atherton模型,maxwell模型,bouc-wen模型,preisach模型,prandtl-ishlinskii模型,krasnoselskii-pokrovskii模型等。

duhem模型是一种被广泛使用的微分方程模型,并已被证明能够准确描述压电驱动器的迟滞特性[15],然而,duhem模型的参数辨识较难,限制了其在实际系统中的应用[16]。受duhem模型的启发,jiles-atherton模型采用一种清晰的物理解释来描述迟滞效应,这种方法存在结构复杂和参数辨识计算量大的问题[17]。作为另一种典型的物理模型,maxwell模型根据机械力和位移之间的关系,采用多个maxwell单元并行结构,能够在不增加模型阶数的情况下通过添加单元来模拟迟滞特性,然而,该模型求解过程复杂,计算成本较高[18]。此外,bouc-wen模型已被广泛用于对迟滞效应进行数学描述,其本质上由一阶非线性微分方程组成,微分形式的非线性表达式不可避免地增加了参数辨识的难度[19]。另外,作为一种被广泛使用的基于算子的迟滞模型,preisach模型通过采用基本算子的并联结构,准确描述迟滞效应,应用preisach模型的困难在于如何处理其积分形式和解析不可逆性[20-22]。作为preisach模型的子类,prandtl-ishlinskii模型通过采用单个阈值变量以及密度函数来描述迟滞,降低了建模复杂性并实现了可逆分析,从而使其能够被应用于实时系统中[23]。但是,经典的prandtl-ishlinskii模型仅限于描述对称迟滞现象,不能直接用于模拟非对称迟滞行为[24]。作为另一种基于算子的迟滞模型,krasnoselskii-pokrovskii模型能够描述更一般的迟滞行为,例如非对称迟滞和饱和迟滞效应,然而,该模型复杂的公式导致构造模型的逆矩阵难度较大,进而影响了其实际应用[25]。



技术实现要素:

本发明的目的是解决压电驱动器迟滞建模的难题,并解决迟滞效应所导致的原子力显微镜成像畸变问题,提供一种基于门控循环单元的迟滞建模与端对端补偿方法,建立更加符合迟滞效应非线性、记忆特性和频率相关性的迟滞模型,在保证建模精度的前提下,提高模型的泛化能力,并在此基础上,对迟滞效应所导致的原子力显微镜的成像畸变进行矫正,从而提升原子力显微镜的成像质量。

本发明提出的基于门控循环单元的迟滞建模与端对端补偿方法,具体步骤包括:

第1、结合压电驱动器迟滞效应的特点,设计合理的模型结构,并通过模型训练进行参数辨识:

第1.1、迟滞模型的总体结构设计:

压电驱动器迟滞效应的特点:压电驱动器的迟滞效应具有非线性、记忆特性和频率相关性的特点。非线性导致压电驱动器输入电压和输出位移之间存在复杂非线性关系,进而影响原子力显微镜系统的定位精度和成像质量;记忆特性导致驱动器的位移不但取决于当前时刻的输入电压,而且与之前时刻输入电压的变化过程有关;当输入电压的频率在一定范围内变化时,迟滞效应会随着电压频率的增大而更加明显,该现象即为频率相关性。在实际系统中,记忆特性和频率相关性与非线性耦合在一起,导致更加复杂的非线性,从而增加了迟滞建模的难度;

本发明所建立的迟滞模型由两层结构组成,即门控循环单元层和反向传播神经网络层。门控循环单元层包括t个具有相同结构和不同参数的门控循环单元,用以模拟压电驱动器迟滞效应的非线性和记忆特性。反向传播神经网络层由t个相同结构和参数的反向传播神经网络组成,通过将门控循环单元层的输出位移与输入电压的频率一起输入到反向传播神经网络层中,能够有效模拟迟滞效应的频率相关性;

第1.2、门控循环单元的结构及参数辨识:门控循环单元由更新门和重置门组成,更新门决定了前一时刻到当前时刻传递的信息量,重置门用以决定前一时刻被遗忘的信息量,更新门和重置门通过中间隐含状态进行连接,共同构建了记忆存储单元,从而有效模拟迟滞效应的非线性和记忆特性。在确定门控循环单元结构之后,通过构建包含t个不同频率的训练数据集,采用梯度下降法对门控循环单元进行参数辨识,从而得到所有门控循环单元的参数;

第1.3、反向传播神经网络的结构及参数辨识:为了在保证建模精度的同时,降低计算复杂度,反向传播神经网络被设计为紧凑的三层结构,包括输入层、隐含层和输出层。输入层由三个节点组成,分别对应于门控循环单元的输入电压和输出位移以及输入电压的频率,输出层则对应于整个迟滞模型的最终输出位移,隐含层的节点数量依据奥卡姆剃刀定律选定,节点数量设置为10。通过构建该反向传播神经网络,能够将频率相关性引入到迟滞模型中,提升模型的泛化能力。在参数辨识中,通过构建代价函数以及训练数据集,逐层进行反向训练,将误差作用于每一个神经元上,采用梯度下降法获得网络中的权重和阈值;

第2、通过利用所建立的迟滞模型,设计端对端的图像补偿算法,矫正迟滞效应导致的图像畸变,提升原子力显微镜的成像质量:

第2.1、利用迟滞模型计算扫描点的实际位移:通过坐标变换获得图像中每个像素在扫描区域中的实际位置,进而计算得到对应的驱动电压,将电压输入到所建立的迟滞模型中,得到正向扫描和反向扫描中每个扫描点的实际位置;

第2.2、基于改进埃尔米特插值的畸变图像矫正:在使用埃尔米特插值时,需要同时保证插值点处的函数值和导数值已知,针对该问题,提出了一种改进的分段埃尔米特插值方法,利用扫描点的实际位置以及扫描得到的样品高度信息,计算得到像素点处的样品实际形貌高度,从而实现对原子力显微镜畸变图像的矫正。

本发明的有益效果是:

1、本发明通过设计包含门控循环单元和反向传播神经网络的复合结构,同时模拟了迟滞效应的非线性、记忆特性和频率相关性,所提出的模型更加符合迟滞效应的特征;

2、本发明提高了迟滞模型的精度,并减少了模型参数辨识耗时。同时,提高了模型的泛化能力,能够准确模拟未用于模型训练的数据,缩短了应用耗时,提升了模型的应用效率;

3、本发明通过设计改进的埃尔米特插值算法,有效利用原子力显微镜正向扫描和反向扫描的数据,实现了对畸变图像的矫正。该矫正方法采用端对端的离线模式,在提升原子力显微镜成像质量的同时,简化了计算过程,提升了计算效率。

附图说明:

图1是本发明所提出算法的流程图;

图2是本发明所提出迟滞模型的结构图;

图3是本发明所建立的门控循环单元的结构图;

图4是本发明所设计的反向传播神经网络的结构图;

图5是本发明所建立的门控循环单元层模型训练结果;其中,(a)为所建立门控循环单元层的输出位移与实际输出位移的对比结果,(b)为所建立门控循环单元层的模型误差;

图6是本发明所建立的反向传播神经网络层模型训练结果;其中,(a)为反向传播神经网络层/所建立模型的输出位移、preisach模型的输出位移与实际输出位移的对比结果,(b)为所建立模型误差和preisach模型误差的对比结果;

图7是本发明所建立的迟滞模型测试结果;其中,(a)为所建立模型的输出位移、preisach模型的输出位移、重新训练的preisach模型的输出位移与实际输出位移的对比结果,(b)为所建立模型误差、preisach模型误差和重新训练的preisach模型误差的对比结果;

图8是端对端迟滞补偿算法的流程图;

图9是压电驱动器输入电压和输出位移之间的关系;

图10是光栅样品的迟滞补偿结果,其中,(a)为未补偿的正向扫描图像,(b)为未补偿的反向扫描图像,(c)为补偿后的图像;

图11是聚苯乙烯和聚烯烃弹性体混合物样品的迟滞补偿结果,其中,(a)为未补偿的正向扫描图像,(b)为未补偿的反向扫描图像,(c)为补偿后的图像;

图12是大肠杆菌样品的迟滞补偿结,其中,(a)为未补偿的正向扫描图像,(b)为未补偿的反向扫描图像,(c)为补偿后的图像。

具体实施方式

实验环境为i53.10ghzcpu,4gb内存,建模与实验软件为matlab。使用本原cspm4000系列原子力显微镜扫描样品表面获得样品形貌的扫描图像后,利用本发明的方法实现了迟滞建模与端对端的畸变图像矫正。

实施例1

基于门控循环单元的迟滞建模与端对端补偿方法,算法流程如图1所示。该方法的具体步骤如下:

第1、结合压电驱动器迟滞效应的特点,设计合理的模型结构,并通过模型训练进行参数辨识;

第1.1、迟滞模型的总体结构设计:

如图2所示,所建立的迟滞模型由两层结构组成,其中,门控循环单元层包括t个具有相同结构和不同参数的门控循环单元,反向传播神经网络层由t个相同结构和参数的反向传播神经网络组成,反向传播神经网络层的输入包括门控循环单元层的输出位移、输入电压以及输入电压的频率,其输出即为最终的模型输出位移;

第1.2、门控循环单元的结构及参数辨识:

门控循环单元为门控循环单元层的基本组成单元,其结构如图3所示,包括一个重置门、一个更新门以及中间状态计算过程;各门控循环单元的参数各有不同,参数具体取值通过模型训练和参数辨识得到,其模型训练结果如图5所示,其中,(a)为参数辨识后门控循环单元层输出位移与实际输出位移的对比结果,(b)为门控循环单元层输出位移的误差,训练结果表明了门控循环单元参数辨识的准确性;

第1.3、反向传播神经网络的结构及参数辨识:

反向传播神经网络为反向传播神经网络层的基本组成单元,其结构如图4所示,包括一个输入层、一个隐含层和一个输出层,输入层由三个节点组成,即为输入电压、门控循环单元的输出以及输入电压的频率,输出层即为整个迟滞模型的输出位移;各反向传播神经网络的参数均为一样,通过模型训练进行参数辨识,图6为参数辨识后的反向传播神经网络层建模结果,(a)为反向传播神经网络输出位移、preisach模型的输出位移与实际输出位移的对比结果,其中,反向传播神经网络的输出位移即为所建立的完整迟滞模型的输出位移,(b)为所建立模型误差和preisach模型误差的对比结果,训练结果表明了反向传播神经网络参数辨识的准确性,同时验证了本发明所建立的迟滞模型能够准确模拟迟滞效应;为进一步验证模型的泛化能力,利用未训练的数据对所建立迟滞模型进行测试,测试结果如附图7所示,测试结果表明,和常用的preisach模型测试结果相比,本发明所建立的模型仍能准确模拟迟滞效应,从而证明了本发明所建立模型具有较强的泛化能力;

第2、通过利用所建立的迟滞模型,设计端对端的图像补偿算法,算法的流程如图8所示,矫正迟滞效应导致的图像畸变,提升原子力显微镜的成像质量;

第2.1、利用迟滞模型计算扫描点的实际位移:

压电驱动器输入电压和输出位移之间的关系如图9所示,通过坐标变换获得图像中每个像素在扫描区域中的实际位置,进而计算得到对应的驱动电压,将电压输入到所建立的迟滞模型中,得到正向扫描和反向扫描中每个扫描点的实际位置;

第2.2、基于改进埃尔米特插值的畸变图像矫正:

利用扫描点的实际位置以及扫描得到的样品高度信息,计算得到像素点处的样品实际形貌高度,从而实现对原子力显微镜畸变图像的矫正;为了充分验证图像校正算法的性能,分别选取了三种不同样品进行实验验证:

1)利用原子力显微镜扫描光栅样品得到未补偿的样品图像,扫描范围为20μm×20μm,扫描频率为10hz。其中,正向扫描得到的图像如附图10(a)所示,反向扫描得到的图像如附图10(b)所示,由于迟滞效应的影响,正向和反向扫描图像中栅格的宽度均呈现明显差异,这与光栅样品栅格宽度均等这一事实不符,即迟滞效应导致了图像畸变;利用本发明补偿算法得到的矫正图像如附图10(c)所示,补偿结果表明,本发明能够有效矫正迟滞效应导致的原子力显微镜图像畸变。

2)利用原子力显微镜扫描聚苯乙烯和聚烯烃弹性体混合物样品得到畸变的样品图像,扫描范围为10μm×10μm,扫描频率为20hz。其中,附图11(a)为正向扫描得到的畸变图像,附图11(b)为反向扫描得到的畸变图像,附图11(c)为利用本发明补偿算法得到的矫正图像,补偿结果验证了本发明针对畸变图像具有良好的矫正效果。

3)利用原子力显微镜扫描大肠杆菌样品得到未补偿的样品图像,扫描范围为16μm×16μm,扫描频率为25hz。其中,正向扫描得到的图像如附图12(a)所示,反向扫描得到的图像如附图12(b)所示,利用本发明补偿算法得到的矫正图像如附图12(c)所示,补偿结果表明了本发明在实际生物应用中能够有效矫正图像畸变。

参考文献

[1]y.tian,k.cai,d.zhang,x.liu,f.wang,b.shirinzadeh,developmentofaxyzscannerforhome-madeatomicforcemicroscopebasedonfpaacontrol,mech.syst.signalprocess.131(2019)222–242.

[2]s.yuan,z.wang,n.xi,y.wang,l.liu,afmtippositioncontrolinsituforeffectivenanomanipulation,ieee/asmetrans.mechatron.23(6)(2018)2825–2836.

[3]k.cai,y.tian,x.liu,s.fatikow,f.wang,l.cui,d.zhang,b.shirinzadeh,modelingandcontrollerdesignofa6-dofprecisionpositioningsystem,mech.syst.signalprocess.104(2018)536–555.

[4]k.wang,m.g.ruppert,c.manzie,d.y.k.yong,adaptivescanforatomicforcemicroscopybasedononlineoptimization:theoryandexperiment,ieeetrans.controlsyst.technol.(2019)1–15.

[5]h.xie,y.wen,x.shen,h.zhang,l.sun,high-speedafmimagingofnanopositioningstagesusingh∞anditerativelearningcontrol,ieeetrans.ind.electron.(2019)1–10.

[6]x.dang,y.tan,rbfneuralnetworkshysteresismodellingforpiezoceramicactuatorusinghybridmodel,mech.syst.signalprocess.21(1)(2007)430–440.

[7]s.f.alem,i.izadi,f.sheikholeslam,m.ekramian,piezoelectricactuatorswithuncertainty:observer-basedhysteresiscompensationandjointstabilityanalysis,ieeetrans.controlsyst.technol.(2019)1–8.

[8]j.-d.wei,c.-t.sun,constructinghystereticmemoryinneuralnetworks,ieeetrans.syst.mancybern.partb30(4)(2000)601–609.

[9]m.h.m.ramli,m.a.m.dzahir,anewphenomenologicalbasedrate-dependenthysteresisoperatorforhysteresischaracterization,j.mech.eng.5(2018)142–153.

[10]y.wu,y.fang,x.ren,ahigh-efficiencykalmanfilteringimagingmodeforanatomicforcemicroscopywithhysteresismodelingandcompensation,mechatronics50(2018)69–77.

[11]m.a.janaideh,s.rakheja,c.-y.su,experimentalcharacterizationandmodelingofrate-dependenthysteresisofapiezoceramicactuator,mechatronics19(5)(2009)656–670.

[12]z.-y.nie,r.-j.liu,q.-g.wang,d.-s.guo,y.-j.ma,y.-h.lan,novelidentificationapproachfornonlinearsystemswithhysteresis,nonlineardyn.95(2)(2019)1053–1066.

[13]j.liu,q.zou,onsuperpositionofhammersteinsystems:applicationtosimultaneoushysteresis-dynamicscompensation,int.j.robustnonlinearcontrol28(14)(2018)4075–4092.

[14]l.cheng,w.liu,z.-g.hou,j.yu,m.tan,neural-network-basednonlinearmodelpredictivecontrolforpiezoelectricactuators,ieeetrans.ind.electron.62(12)(2015)7717–7727.

[15]g.-y.gu,l.-m.zhu,c.-y.su,modelingandcompensationofasymmetrichysteresisnonlinearityforpiezoceramicactuatorswithamodifiedprandtl-ishlinskiimodel,ieeetrans.ind.electron.61(3)(2013)1583–1595.

[16]c.j.lin,p.t.lin,trackingcontrolofabiaxialpiezo-actuatedpositioningstageusinggeneralizedduhemmodel,comput.math.appl.64(5)(2012)766–787.

[17]g.wang,g.chen,identificationofpiezoelectrichysteresisbyanovelduhemmodelbasedneuralnetwork,sens.actuatorsa264(2017)282–288.

[18]a.visintin,differentialmodelsofhysteresis,vol.111,springerscience&businessmedia,2013.

[19]d.c.jiles,d.l.atherton,theoryofferromagnetichysteresis,j.magn.magn.mater.61(1–2)(1986)48–60.

[20]f.al-bender,v.lampaert,j.swevers,thegeneralizedmaxwell-slipmodel:anovelmodelforfrictionsimulationandcompensation,ieeetrans.autom.control50(11)(2005)1883–1887.

[21]m.ismail,f.ikhouane,j.rodellar,thehysteresisbouc-wenmodel,asurvey,arch.comput.methodseng.16(2)(2009)161–188.

[22]z.li,j.shan,u.gabbert,inversecompensationofhysteresisusingkrasnoselskii-pokrovskiimodel,ieee/asmetrans.mechatron.23(2)(2018)966–971.

[23]m.aljanaideh,s.rakheja,c.-y.su,ananalyticalgeneralizedprandtl-ishlinskiimodelinversionforhysteresiscompensationinmicropositioningcontrol,ieee/asmetrans.mechatron.16(4)(2010)734–744.

[24]n.alatawneh,m.aljanaideh,afrequency-dependentprandtl-ishlinskiimodelofhysteresisloopunderrotatingmagneticfields,ieeetrans.powerdelivery(2019)1–3.

[25]y.liu,r.zhou,m.huo,longshorttermmemorynetworkiscapableofcapturingcomplexhystereticdynamicsinpiezoelectricactuators,electron.lett.55(2)(2018)80–82.

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1