基于具有离散限制软计算的非线性动态控制的系统和方法

文档序号:6288137阅读:420来源:国知局
专利名称:基于具有离散限制软计算的非线性动态控制的系统和方法
技术领域
本发明一般涉及非线性电子控制系统优化。
背景技术
反馈控制系统广泛用于维持动态系统的输出为一个期望值,尽管外部干扰可能会使该输出偏离期望值。例如,受自动调温器控制的家用空间加热炉就是反馈控制系统的一个例子。自动调温器不断测量房间内部的空气温度,并且当温度低于期望的最小温度时自动调温器开启加热炉。当内部温度达到期望的最低温度时,自动调温器关闭加热炉。不管外部干扰如何,例如外部温度的降低,自动调温器—加热炉系统保持房间内的温度为一个基本上不变的值。许多应用中使用到类似类型的反馈控制。
反馈控制系统内的主要元件是可定义为“设备”的、输出变量将受到控制的受控对象、机器、或过程。在上面例子中,该“设备”为房间,输出变量为房间的内部空气温度,干扰则为通过房间墙壁的热流动(分散)。该设备被一个控制系统控制。在上面的例子中,控制系统为自动调温器结合加热炉。自动调温器—加热炉系统使用简单的开启—关闭反馈控制系统来维持房间的温度。在许多控制环境下,例如电机轴位置或者马达速度控制系统,简单的开启—关闭反馈控制是不够的。更高级的控制系统则依靠比例反馈控制、积分反馈控制与微分反馈控制的结合。基于比例反馈、积分反馈、及微分反馈之和的反馈控制通常称为PID(比例积分微分)控制。
PID控制系统为一种基于设备的动力学模型的线性控制系统。在经典的控制系统中,线性动力学模型以通常是常微分方程的动态方程形式获得。该设备被假设为相对线性、非时变的、稳定的。然而,许多真实世界的设备是时变的、高度非线性的、且不稳定。例如,动力学模型可能包含一些参数(例如质量、电感、及空气动力学系数,等等),它们只是近似已知或者依赖于变化的环境。如果参数变化较小,且动力学模型稳定,那么PID控制器可能符合要求。然而,如果参数变化较大或者如果动力学模型不稳定,那么一般要给PID控制系统增加自适应或智能(AI)控制功能。
AI控制系统使用一种优化器,典型为非线性优化器,来程序控制PID控制器的运转,从而改善控制系统的总体运转。
经典的高级控制理论是基于下述假设靠近平衡点的所有受控“设备”都可以用线性系统近似。不幸的是,这个假设在真实世界中几乎不成立。绝大多数设备是高度非线性的,经常没有简单的控制算法。为了满足对非线性控制的这些需求,已经发展出了使用诸如遗传算法(GA)、模糊神经网络(FNN)、模糊控制器等软计算概念的系统。通过这些技术,控制系统及时进化(改变),使自身适应受控“设备”和/或工作环境内可能发生的变化。
许多受控设备必须以逐步的方式从一个控制状态转移到另一个控制状态。例如,步进马达通过按受控增量步进来移动,它不能任意地从第一个轴位置移动到第二个轴位置而不步进经过第一轴位置和第二轴位置之间的所有轴位置。基于具有遗传分析器软计算的现有技术控制系统不一定能很好地适合于必须以逐步方式改变或控制的设备,其部分原因在于遗传分析器的运转。遗传分析器的染色体典型地是按照用于控制设备的一个或多个控制参数的值来编码。遗传优化器发现新的控制参数,而不考虑先前控制参数的值或者从先前的控制参数移动到新控制参数时施加的限制。

发明内容
本发明通过提供基于离散限制(discrete constraints)的遗传分析器解决了这些或其它难题。在一个实施例中,具有步进编码染色体(step-codedchromosomes)的遗传算法用于获得教学信号(teaching signal),该信号为诸如步进限制控制器等具有离散限制的控制器提供了良好的控制质量。步进编码染色体是指至少部分染色体被限制在一个逐步字符列(stepwise alphabet)中的染色体。步进编码染色体也可以具有为位置编码(即以非步进限制的、相对更为连续的方式编码)的部分。
在一个实施例中,控制系统使用基于最小熵这一物理定律的适应(性能)函数。在一个实施方案中,遗传分析器在离线模式下使用,以便为形成知识库的模糊逻辑分类器系统提供一个教学信号。该教学信号可以通过使用知识库的知识来运转的模糊控制器被在线逼近。该控制系统可以用于控制由非线性、非稳定、耗散模型描述的复杂设备。在一个实施例中,步进限制控制系统被构造成用于控制步进马达、逐步致动器、或其它步进限制系统。
在一个实施例中,控制系统包含一个学习系统,例如由遗传分析器训练的神经网络。遗传分析器使用了可在最大化传感器信息的同时最小化熵产生的适应函数。
在一个实施例中,悬架控制系统使用来自学习控制单元的熵的时间微分(导数)与受控制过程(或受控制过程的模型)内熵的时间微分之差,作为对控制性能的度量。在一个实施例中,熵的计算是基于被视为开放式动态系统的受控制过程设备运动方程的热动力学模型。
该控制系统由遗传分析器训练,该遗传分析器为各个解空间产生一个教学信号。被优化的控制系统基于从一个或多个传感器获得的数据提供优化控制信号。例如,在悬架系统中,可以使用众多角度及位置传感器。在离线学习模式下(例如在实验室、工厂、服务中心等),使用车辆及其悬架系统的动力学模型(或模拟)制定出模糊规则。来自动力学模型的数据被提供给熵计算器,该熵计算器计算模型的输入和输出熵产生。输入和输出熵产生被提供给适应函数计算器,该适应函数计算器计算适应函数,作为受一个或多个约束限制的遗传分析器的熵产生之差。遗传分析器使用适应函数获得用于离线控制系统的训练信号。来自离线控制系统的控制参数(以知识库的形式)随后被提供至在设备内的、使用来自知识库的信息获得控制策略的在线控制系统。
一个实施例包括一种通过获得由控制器提供到设备的熵的时间微分(dSc/dt)与该设备的熵的时间微分(dSu/dt)之间的熵产生之差来控制非线性对象(设备)的方法。使用熵产生之差作为适应(性能)函数的步进编码遗传算法进化出在离线控制器中的控制规则。设备的非线性稳定性特性则使用Lyapunov函数来评估。遗传分析器使熵最小化,并最大化了传感器信息内容。
在一个实施例中,该控制方法也包括通过遗传算法发展出相对于控制器变量的控制规则。遗传算法使用基于提供到设备的熵的时间微分(dSc/dt)与该设备的熵的时间微分(dSu/dt)之间的差的适应函数。可以使用发展的控制规则来修正变量。
在一个实施例中,本发明包含一个适于控制非线性设备的自组织控制系统。该控制系统包括一个模拟器,该模拟器被设计成使用设备非线性运动方程的热动力学模型。在一个实施例中,该热动力学模型基于Lyapunov函数(V),并且该模拟器使用函数V来分析设备状态稳定性的控制。控制系统计算由控制设备的低电平控制器提供到设备的熵对时间的微分(dSc/dt)与该设备的熵对时间的微分(dSu/dt)之间的熵产生之差。熵产生之差被遗传算法所使用以获得一个适应函数,在该适应函数中该熵产生之差以受限制的方式被最小化。该教学信号被提供到模糊逻辑分类器,该模糊逻辑分类器通过使用学习过程决定一个或多个模糊规则。模糊逻辑控制器也被设计用于形成一个或多个设定车辆内控制器的控制变量的控制规则。
在一个实施例中,本发明包括一种基于最小化熵产生的对控制质量的新的物理估量(physical measure),并把该物理估量用于优化控制系统设计中遗传算法的适应函数。该方法在步进限制控制系统内提供一个局部熵反馈回路。熵反馈回路通过联系设备的稳定性(使用Lyapunov函数)和设备的可控制性(基于步进限制控制系统的产生熵)为优化控制结构设计做准备。步进限制控制系统适用于诸多控制系统,包括例如机械系统、生物机械系统、机器人技术、机电系统等控制系统。


图1示出了基于软计算的自组织智能控制系统的总体结构。
图2示出了控制质量模拟系统(SSCQ)。
图3示出了基于软计算的具有限制控制系统的自组织智能控制系统的一般结构。
图4示出了限制控制系统的控制质量模拟系统。
图5A示出了具有SSCQ动态系统模型的模拟方框图。
图5B示出了SSCQ模式的时间表示。
图6为SSCQ的流程图。
图7A为正常编码的染色体。
图7B示出了染色体的步进编码。
图7C为步进限制控制系统的示意图。
图8A示出了基因5为位置编码通配符的示意图。
图8B示出了与图8A对应的位置编码控制系统的输出。
图9A示出了基因5为步进编码通配符的示意图。
图9B示出了与图9A对应的步进编码控制系统的输出。
图10为遗传算法的编码及评估运算的流程图。
图11为轮盘式(roulette wheel)(蒙特—卡罗)选择运算的流程图。
图12为交叉运算的流程图。
图13为突变运算的流程图。
图14A至图14N是表示Holmes-Rand(Duffing-Van der Pol)动态系统吸引子的本质的曲线图。
图15A至图15C是表示Holmes-Rand(Duffing-Van der Pol)动态系统的三维吸引子的本质的曲线图。
图16A至图16N是表示具有正态概率分布的随机激发下Holmes-Rand(Duffing-Van der Pol)动态系统吸引子的本质的曲线图。
图17A至图17C是表示具有正态概率分布的随机激发下Holmes-Rand(Duffing-Van der Pol)动态系统三维吸引子的本质的曲线图。
图18示出了具有位置编码GA(根据表1进行编码)的Holmes-Rand(Duffing-Van der Pol)动态系统的SSCQ控制的GA优化动力学。
图19示出了具有步进GA(根据表2进行编码)的Holmes-Rand(Duffing-Van der Pol)动态系统的SSCQ控制的GA优化动力学。
图20A至图20N是表示使用根据表1的GA编码方法的控制信号优化结果的曲线图。
图21A至图21C是表示使用根据表1的GA编码方法的控制信号优化的三维结果的曲线图。
图22A至图22N是表示使用根据表2的GA编码方法的控制信号优化的结果的曲线图。
图23A至图23C是表示使用根据表2的GA编码方法的控制信号优化的三维结果的曲线图。
图24A至图24C是表示时间间隔为0到60秒时,比较使用根据表1编码方法与使用根据表2编码方法的控制之间的曲线图。
图25A至图25C是表示时间间隔为20到15秒时,比较使用根据表1编码方法与使用根据表2编码方法的控制之间的曲线图。
图26A至图26F是表示使用根据表1的编码方法获得的控制误差和控制信号的曲线图。
图27A至图27F是表示使用根据表2的编码方法获得的控制误差和控制信号的曲线图。
图28A至图28C是表示控制误差累积的比较的曲线图。
图29A至图29B是表示随机激发(限带白噪音的平均值为0.0,方差为1.0)的曲线图。
图30A至图30F是表示时间间隔为0到15秒时,车辆悬架系统模型的控制结果的曲线图。
图31A至图31D是表示时间间隔为0到15秒时,得到的用于控制车辆悬架系统模型的优化控制信号的曲线图。
图32A至图32F是表示图30A至30F中时间间隔为5到7秒时的控制的曲线图。
图33A至图33D是表示图31A至31D中时间间隔为5到7秒时的控制的曲线图。
图34A至图34D是表示适应函数分量累积的曲线图。
图35A示出了具有可调整阻尼器的悬架控制车辆的控制阻尼器布局。
图35B示出了用于悬架控制车辆的可调整阻尼器。
图35C示出了在图8B的可调整阻尼器中的用于软阻尼和硬阻尼的液体流。
图36示出了图35A至图35C所示可调整阻尼器的阻尼力特性。
具体实施例方式
图1为基于软计算的用于控制设备的控制系统100的方框图。在控制器100内,参考信号y被提供到加法器105的第一输入。加法器105的输出为一个误差信号ε,该误差信号并被提供到模糊控制器(FC)143的输入以及比例—积分—微分(PID)控制器150的输入端。PID控制器150的输出为控制信号u*,该控制信号被提供到设备120的控制输入以及熵计算模块132的第一输入。干扰m(t)110也被提供到设备120的输入。设备120的输出为响应x,该响应被提供到熵计算模块132的第二输入以及加法器105的第二输入。加法器105的第二输入被求反,使得加法器105的输出(误差信号)为第一输入的值减去第二输入的值。
熵计算模块132的输出被作为适应函数提供到遗传分析器(GA)131。GA131的输出解被提供到FNN(模糊神经网络)142的输入。FNN 142的输出作为知识库被提供到FC 143。FC 143的输出作为增益排表(gain schedule)被提供到PID控制器150。
GA 131与熵计算模块132为控制质量模拟系统(SSCQ)130的一部分。FNN 142及FC 143为模糊逻辑分类器系统(FLCS)140的一部分。
使用一组输入以及适应函数132,GA 131工作的方式类似于获得一个更靠近优化值的解的进化过程。GA 131产生多组“染色体”(即,可能的解),随后通过使用适应函数132评估各个解,对染色体进行分类。适应函数132决定各个解的适应程度等级。更为适应的染色体(解)则对应于适应程度排位高的解。较不适应的染色体则对应于适应程度排位低的解。
更为适应的染色体被保留(生存),较不适应的染色体被遗弃(死亡)。创建新的染色体替代被遗弃的染色体。通过交叉现存染色体的片断以及引入突变来创建新的染色体。
PID控制器150具有线性传递函数,因此是基于受控“设备”120的线性运动方程。用于程序控制PID控制器的现有技术遗传算法通常使用简单的适应函数,因此无法解决通常线性模型中可控制性差的问题。如同绝大多数优化器那样,优化的成功与否经常最终取决于性能(适应)函数的选择。
评估非线性设备的运动特性通常是困难的,部分原因在于缺乏普适的分析方法。按照惯例,控制具有非线性运动特性的设备时,通常是找到设备的几个特定的平衡点,设备的运动特性在靠近平衡点的附近区域被线性化。随后,控制则基于对平衡点附近的伪(线性化)运动特性进行评估。这种技术对于由不稳定或耗散的模型描述的设备即使有效,其效果也很小。
基于软计算的优化控制计算包括GA 131,作为在固定的正解空间内全面搜寻优化解的第一步。GA 131搜索设备的一组控制权重(control weight)K。在产生被施加到设备的信号δ(K)中,传统的比例—积分—微分(PID)控制器150使用权重向量K={k1,…,kn}。与在此信号下设备行为相关的熵S(δ(K))被假设为适应函数以最小化。GA 131以规则的时间间隔重复几次,以产生一组权重向量。GA 131产生的向量随后被提供到FNN 142,FNN 142的输出随后被提供到模糊控制器143。模糊控制器143输出为PID控制器150的增益排表的汇集。对基于GA的软计算系统,经典的控制中经常没有实际的控制定律,但相反地,本发明的控制是基于诸如最小熵产生的物理控制定律。
图2所示为SSCQ 130的一个实施例,它是为FLCS 140产生教学信号Ki的离线模块。图10示出了SSCQ 230的结构。SSCQ 230为SSCQ 130的一个实施例。除了SSCQ 230以外,图2还示出了随机激发信号发生器210、模拟模型220、PID控制器250、以及计时器20。SSCQ 230包含模式选择器229、缓冲器i2301、GA 231、缓冲器e2302、PID控制器234、适应函数计算器232及评估模型236。
计时器200控制SSCQ 230的激活时刻。计时器200的输出被提供至模式选择器2304的输入。模式选择器2304控制SSCQ 230的运行模式。在SSCQ230内,参考信号y被提供到适应函数计算器232的第一输入。适应函数计算器232的输出被提供到GA 231的输入。GA 231的输出CGSe通过缓冲器2302被提供到PID控制器234的训练输入。控制器234的输出Ue被提供到评估模型236的输入。评估模型236的输出Xe被提供到适应函数计算器232的第二输入。GA 231的输出CGSi(通过缓冲器2301)被提供到PID控制器250的训练输入。PID控制器250的控制输出被提供到悬架系统模拟模型220的控制输入。随机激发发生器210,为模拟模型220的干扰输入和评估模型236的干扰输入提供一个随机激发信号。系统模拟模型220的响应输出Xi被提供到评估模型236的训练输入。通过结合GA 1031(通过缓冲器2301)的CGSi输出和系统模拟模型220的响应信号Xi,获得SSCQ 230的输出向量Ki。
随机激发信号发生器210产生激发信号。激发信号可以是使用随机模拟获得的激发,或者它可以是真实的测量环境。块210针对计时器200产生的各个时刻产生激发信号。
模拟模型220为控制对象的动力学模型。控制质量的模拟系统(SSCQ)230是关于结构的主优化块。它是一个离散的时间块,其取样时间通常等于控制系统的取样时间。
在评估函数232的内部计算熵产生速率,其值包含在评估模型的输出(Xe)内。
下述时间变量被用到TSSCQ调用的时间;Tc控制系统的采样时间;TeSSCQ的评估(观察)时间;tc具有固定控制参数的模拟模型的积分间隔,tc∈[T;T+Tc];以及teSSCQ的评估(观察)时间间隔,te∈[T;T+Te]。
在许多实施例中,当控制系统单元用于产生离散脉冲至控制致动器,随后增大或减小与控制致动器(图3)规格相关的控制系数时,SSCQ 130可以用于执行不同类型非线性动态系统的优化控制。
图4示出了离散或步进限制控制致动器的SSCQ 430的结构,并在与图4相关的正文中对其进行更详细地描述。SSCQ 430与SSCQ 230类似,因此两者都可以用图5A的流程图来描述。图5A阐明了下述五个步骤1.在初始时刻(T=0),SSCQ模块230或430被激活,并产生初始控制信号2303 CGSi(T)。
2.使用来自随机激发发生器210的随机激发信号以及来自第一时间间隔tc的控制信号CGSi(T)2303对模拟模型220积分,模拟模型220产生输出Xi204。
3.输出Xi204以及输出CGSi(T)2301被作为教学信号Ki存储在数据文件内。
4.时间T以Tc为增量增加(伪码,T=T+Tc)。
5.重复步骤1至4,直到随机信号结束。
一般而言,SSCQ有两种工作模式1.使用遗传算法231更新缓冲器i2301;2.从缓冲器i2301提取CGSi(T)。
模式选择器2304使用当前时刻T的信息来控制SSCQ430的当前模式,如图5B所示。
图6为SSCQ调用流程图,它结合了下述步骤1.选择模式如果为GA模式则转到步骤2,否则转到步骤10;2.初始化GA、初始化评估模型参数、清除缓冲器i;
3.启动遗传算法231;4.产生初始群体;5.通过下述步骤为每个染色体指定适应值i.将当前状态Xi(T)204设定为评估模型236的初始状态;对当前染色体进行解码并把解码结果写入评估缓冲器e2302;ii.使用来自发生器210的随机信号和来自缓冲器e2302的控制信号CGSe(te)在时间间隔te上对评估模型236积分;iii.在块232内使用输出Xe来计算适应值,它是评估模型236对编码到当前染色体的控制信号CGSe(te)的响应。
6.执行GA终止测试。如果GA终止测试回答“是”,则随后结束GA转到步骤9;否则进入步骤7;7.对当前代执行遗传运算获得新一代;8.重复步骤5至7,直到GA终止测试结果为正;9.对最后一代的最佳染色体进行解码,把解码结果写入缓冲器i2301;10.从缓冲器i2301提取当前控制值CGSi(T)2303。
下表1的一组行向量示出了缓冲器i2301及缓冲器e2302的结构,其中各行的第一项为时间值,其它项为与时间值关联的控制参数。因此,缓冲器i2301存储了用于评估时间间隔te的优化控制值,以控制模拟模型,缓冲器e2302存储了用于评估时间间隔te的暂时控制值,以计算适应函数。
表<1>

模拟模型220及评估模型236通常使用类似的模型。系统微分方程的数值积分有多种不同方法。实践中,这些方法可以分为两大类a)具有积分误差控制的变步长积分方法;以及b)没有积分误差控制的固定步长积分方法。
使用a)型方法的数值积分非常准确,但较耗费时间。b)型方法较快,但精度相对较低。在GA模式中的各次SSCQ调用时,遗传算法231调用适应函数好几百次。各个计算通常包括对动态系统的模型积分,这引起计算复杂性的指数增长。
选择足够小的积分步长,可以调整固定步长的求解器,使得在相对短的时间间隔(例如评估间隔te)内的积分误差较小,从而在对评估模型236积分的评估回路内可使用固定步长积分。为减小总积分误差,可以在模拟模型220内使用高阶(high-order)变步长积分的结果作为评估模型积分的初始条件。
为了获得更高的精确度,使用变步长求解器对评估模型进行积分通常是有利的。不幸的是,这种变步长积分器的速度极慢,特别是动力学模型相对复杂时,例如悬架系统模型。
在SSCQ 230内,适应函数计算块232使用评估模型236对控制信号CGSe(te)和参考信号Y 238的响应(Xe)237来计算适应函数。
适应函数被看作是评估模型236的响应矩阵(xe)的选定分量的向量。其绝对值平方的通式如下Fitness2=Σt∈[T;Te][Σiwi(xite)2+Σjwj(yj-xjte)2+Σkwk(xkte)2]→min---(1)]]>其中i为绝对值应被最小化的状态变量的指数;j为控制误差应被最小化的状态变量的指数;k为频率分量应被最小化的状态变量的指数;yi为参考信号Y 238的分量;wr(r=i,j,k)为表达相应参数的相对重要性的权重因子。通过设定这些权重因子,可选择出那些与控制对象的要求行为更为相关的评估模型的输出单元。例如,为控制车辆悬架系统,这些系数可以用于代表从人的舒适度角度考虑的相应要素的重要性。在发展之初,权重因子具有一些经验值,随后可以使用实验结果来对其进行调整。
频率分量的提取可以使用用于获得滤波器参数的标准数字滤波技术来实现。标准差分方程可以用于矩阵Xe的xek列分量a(1)f(xke(te(N)))=b(1)xke(te(N))+b(2)xke(te(N-1))+...+b(nb+1)xke(te(N-nb))-]]>-a(2)xke(te(N-1))-...-a(na+1)xke(te(N-na))---(2)]]>其中a、b为滤波器参数;N为当前点的数目;na、nb为过滤器的级数。对于巴特渥斯(Butterworth)滤波器,nb=na。
每个机电控制系统具有一定的时间延迟,这通常是由传感器信号的模数转换、计算单元内控制增益的计算、以及控制致动器的机械特性等引起。此外,许多控制单元并没有连续特性。例如,当控制制动器为步进马达时,这些步进马达在一个控制周期内只能增加一步或减小一步。出于优化的考虑,这种步进限制可以限制SSCQ 130内遗传算法131的搜寻空间。换而言之,为了控制具有N个位置的步进马达,每次更新步进马达的位置时无需检查所有可能的N个位置。只要检查步进马达位置前进一步、后退一步或是保持原位时的情况就足够了。这只给出三种可能性,从而把搜寻空间从N个点减小到三个点。搜寻空间的减小将使遗传算法131的性能更佳,从而提高智能控制系统的总体性能。
如前所述,在许多实施例中,当控制系统单元用于产生离散脉冲至控制致动器,随后增大或减小与控制致动器(见图3)规格相关的控制系数时,SSCQ 130可以用于执行不同类型非线性动态系统的优化控制。
不失一般性地,(图1所示的)控制系统100内的传统PID控制器150可以用具有离散限制的PID控制器350替代,如图3所示,从而形成一个新的控制系统300。这类控制被称为步进限制控制。用于步进限制控制的SSCQ130的结构如图4所示,该图为步进限制SSCQ 430的方框图。SSCQ 430在许多方面类似于SSCQ 230。图2描述的SSCQ结构230与图4描述的SSCQ结构430之间的不同在于缓冲器i2301和缓冲器e2302的结构以及对PID控制器234及350的附加限制。此外,SSCQ 430内的PID控制器受离散限制所限制,且SSCQ 430内GA 231的染色体至少有一部分是步进编码而非位置编码。在步进限制控制的情况下,SSCQ缓冲器2301、2302具有表2所示的结构,它们可以通过针对GA 131内的离散限制的新编码方法来实现。
表<2>

表2中,时间列对应染色体解码之后的时间赋值,STEP表示在分别对应{前进、保持、后退}的逐步字符列(alphabet){-1,0,1}内的变化方向值。
为了把这些台阶状控制信号对应到控制器真实参数,通过添加下述变换发展出一个接受此类台阶状输入的控制系统的附加模型 图7A至图7C示出GA 231的染色体在步进编码情况和位置编码情况下的对比例子。
例如,在图7A中示出了由遗传算法231产生的用于控制比例步进限制控制器的染色体,其步进值为1,最小值为0,最大值为8(纵轴),控制器采样时间TC为1秒钟。图7A至图7C中的评估时间Te为20秒。
图7B示出了由使用步进编码的GA 231产生的染色体的值。
图7A及图7B所示的染色体随后被传递通过控制器,该控制器接收到的实际控制信号在图7中示出。该控制器接收到的信号与图7A及图7B所示的两个染色体相同。
在图8中,示出了当位置5为通配符(wildcard)时图7A所描述的染色体。图8A及图8B中在位置5处使用同心圆表示改变位置5的值可获得的各种组合。总共有9种不同的组合,如图8A所示,但控制系统的机械限制禁止了除了图8B所示三种组合以外的其它组合。注意,GA可以独立地检查所有9种组合,即使给出的控制器输出相同。还应注意到,控制器的步进限制将导致通配符效果的相对快速地消失。因此,诸如突变等后面将描述的遗传运算通常只产生局部效应。
在图9中,示出了当位置5为通配符时图7B所描述的染色体。各个同心圆表示改变位置5的值可获得的一种组合。总共有3种不同的组合(如图9A),所有组合都将对控制系统的输出产生影响(如图9B)。注意,GA 430可以仅检查3种组合,且其将具有不同的适应值。只有达到控制信号范围的极限,才会引起通配符效果的消失。因此,诸如突变等遗传运算通常产生全局效应,该染色体的结构单元(building blocks)更好地对应有效编码的Goldberg原则。
步进编码减小了GA 430的搜寻空间。在这种情况下,用于GA搜寻空间的控制信号的范围就相对不重要。相对更重要的参数则是评估时间Te、控制器采样时间TC、及用于优化的控制参数的数目。
GA理论遗传算法是基于自然进化机制的随机搜寻算法。一群个体一代一代地进化,最好的(最适应的)个体的数量和质量将提高,而最差的(较不适应的)个体将消失。从算术角度来说,任何进化算法可描述成下述元素的系统GA=<C,F,P0,μ,Ω,Γ,Δ,Ψ>
其中C为编码系统;F为适应函数(质量标准);P0为初始群体;μ为群体大小;Ω为选择运算;Γ为交叉运算;PCR为交叉运算的概率;Δ为突变运算;PMU为突变运算的概率;Ψ为终止条件。
编码系统C为一个酉变换(unitary transformation),它定义了物理解空间和定义进化(遗传)运算的数学空间之间的对应关系(map)。编码的一个简单例子为把实数映射到二进制字符(binary string)的二进制编码A→CB:A∈Rn,B∈Bl={0,1}l]]>其中Rn为n维的真实向量空间,Bl为长l的二进制字符空间。这种情况下,l值越大,对Rn的数学表示就越真实。在许多实现中,使用二进制编码是因为它易于定义诸多二进制字符的进化运算。此外,由于数字计算机是基于二进制逻辑,因此可以容易地把群体存储为一组二进制数。
初始群体P0是在编码空间内定义的一组元素。通常,在Bl的串的一个实施例中,它是从搜寻空间的所有元素的均匀分布内提取的。
群体大小μ是指群体内个体(染色体)的数目。
适应函数F为一质量标准,它定义群体内某个特定个体相对于该群体的其它元素的优良程度。适应函数通常被计算成一特定函数或特定动态系统对相应个体(染色体)内编码信息的响应。对于进化多个计算的复杂优化问题,适应函数计算是任何优化算法包括进化算法中的最耗时的部分。在绝大部分情况下,在计算适应函数的绝对值之后,使用相对的(归一化)值来分配群体内的重要性。
图10为遗传算法的编码和评估运算的流程图。选择运算Ω为概率运算,其被定义用于把更多的具有高适应值的染色体复制到下一代中。在一个实施例中,选择运算从初始群体中选择一组个体到一已知的配对库。该配对库通常是大小为μ的中间群体,从中提取用于遗传运算的个体。在绝大部分遗传算法实现中,选择是基于如图11所示的Monte-Carlo(蒙特—卡罗)方法,亦称为轮盘式方法。轮盘的各个扇区代表了群体内的一个体,各个扇区的大小正比于相应个体的相对适应度。如果轮盘旋转,则具有较高的相对适应度的个体被选择的概率正比于其相对适应度(轮盘的扇区的大小)。
图12为一典型遗传算法的交叉运算流程图。交叉运算Γ为概率运算,其目的在于共享群体内最佳个体之间的信息。交叉运算PCR的概率通常是预先定义的。交叉运算Γ的输入为从选择运算Ω得到的配对库。交叉运算的机制如下1.从配对库中选择两个染色体;2.从
中产生一个均匀分布的随机数字。如果产生的数小于PCR则继续下面的步骤;3.产生一个交叉点(来自[1 l]中的均匀分布的随机整数);4.替换从交叉点开始的被选择染色体的正确部分;5.把染色体放入新群体;6.重复步骤1至5,直到新群体完整。
图13为突变运算的流程图。突变运算Δ为一概率运算,其目的在于将新信息引入一群体中。突变运算PMU的概率是预定的,其取决于搜寻空间的参数。通常,突变概率小于交叉概率。交叉运算之后执行突变运算Δ。突变运算的输入是交叉运算之后得到的新一代。突变运算的机制如下1.从新一代中选择第一染色体;2.从
中产生一个均匀分布的随机数字,如果产生的数小于PMU则继续步骤3,否则转到步骤5;3.产生一个突变点(来自[1 l]中的均匀分布的随机整数);4.对突变点指向的基因进行如下变换基因(突变点)=基因(突变点)1,其中表示模2加法00=0,01=1,10=1,11=0;5.选择下一个染色体并重复步骤2至4,直到新群体的最后一个染色体经过突变过程。
遗传算法的终止条件可预先定义,且定义方式根据具体问题而各不相同。在一个实施例中,它可以是群体所赖以进化的一定数目的代。在某些情况下,它可以是说明算法在某种意义上是收敛的。在一个实施例中,收敛标准可以基于当前代和先前代的最佳适应度之间的差别。如果这个差别小于一预定数,则算法停止。在一个实施例中,当整个代包含相同或类似个体时,则认为算法是收敛的。
各个遗传算法都有特定的一组参数,包括群体大小μ、最大数目代GN、交叉运算概率PCR、以及突变运算概率PMU。
这些参数依赖于搜寻空间参数。利用Holland模式定理的原理可以获得这些参数。描述Holland定理需要如下所述的一些附加定义。模式(schemata)是用类似的基因型(例如,选择染色体的共同部分)来表示群体内的个体组,而用星号(表示通配符)替换不同部分。例如,对于一个二进制字符列,染色体[101111]及[101001]可以用模式S=[101**1]表示,其中“*”表示该位置可以为任意值。
在其定义位置上与模式匹配的个体被称作该模式的一个代表。
模式o(S)的级数就是被定义位置的数目。对于上面模式S,其级数为o(S)=4。
保持为1或0的最左边比特(bit)位置bleft与最右边比特(bit)位置bright之间的距离称为模式的定义长度δ(S),可以通过δ(S)=bright-bleft来计算。对于上面的例子,δ(S)=6-3=3。
遗传算法的隐藏平行(implicit parallelism)对于长为l的串,各串代表2l个模式。例如,串1101长度为4,因此代表下述24=16个模式1100、110*、11*0、11**、1*00、1*0*、1**0、1***、*100、*10*、*1*0、*1**、**00、**0*、***0、0***、****。
如果群体有n个串,模式的总数NS为2l≤NS≤n2l。由于各个串可以代表许多模式,所以这就意味着具有多个串的群体上定义的GA运算具有更多数目的平行模式。这种特性称为GA的隐藏平行。
如果在时间t时在一个群体中,模式S具有n(S,t)个代表串,那么就有可能计算出这些给定模式中有多少个将出现在下一代n(S,t+1)中。这个数目取决于选择运算、交叉运算及突变运算。接下来将先单独地,再组合起来考虑各个运算的效果。
选择运算根据选择运算的结构,个体xi被复制到新一代的概率p(xi)取决于其适应值f(xi)与群体内所有个体的总适应值F之比p(xi)=f(xi)/F (4)因此,代表模式S的一串Si被复制到下一代的概率p(Si)定义为p(Si)=f(Si)/F (5)其中f(Si)为串Si的适应值,F为群体内所有串的总适应值。
根据式(4),模式S的各个代表Si被复制到配对库Nf(Si)/F次。因此,n(S,t+1)=Σi=1nNf(Si)/F---(6)]]>考虑模式S的平均适应值,为f(S)=Σi=1nf(Si)n---(7)]]>由方程(7)可知Σi=1nf(Si)=f(S)n---(8)]]>利用方程(8)可以把方程(6)重新写成n(S,t+1)=n(S,t)Nf(S)/F (9)其中f(S)为模式S的适应函数的平均值;n为不重叠的代表串的数目;F为群体内所有串(N)的所有适应函数之和。
考虑群体内所有串的适应值的平均值f(P)=F/N。然后方程(9)可以写成n(S,t+1)=n(S,t)f(S)/f(P)(10)这表明模式代表的数目一代一代增加,增加的速率取决于其平均适应值与群体平均适应值之比。适应值高的模式,其代表数目增加。适应值小的模式数目减小。
例如,对于一个适应值大于群体平均值的模式f(S)=(1+k)f(P)=f(P)+kf(P) (11)于是,n(S,t+1)=n(S,t)[f(P)+kf(P)]/f(P)=n(S,t)(1+k)(12)
n代之后代表S的数目为n(S,t+n)=n(S,t)(1+k)n+1(13)方程(13)就是著名的Holland定理1。根据Holland定理1具有大于平均适应值(f(S)>f(P))模式代表的数目在群体内指数增长,而小于平均适应值(f(S)<f(P))模式代表的数目在群体内指数减小。
交叉运算尽管复制运算有效地提高了代表的百分比,但该过程基本上是不育的。它无法创建新的更好的串。交叉及突变算子实现此功能。
例如,假设群体包含串A和串B。串A为模式S1和S2的代表,而串B既不代表S1也不代表S2。于是,串和模式由下式给出S1=**0*|***1S2=****|01**A=0100|0101(S1、S2)B=1010|1000(没有S1、没有S2)交叉算子匹配随机的串对。该算子在随机确定的位置切断串,并把所有位(bit)与剪断点右边进行交换。对串A和B进行交叉后产生下述新串A’、B’A′=0100|1000(没有S1、没有S2)B′=1010|0101(S1)现在串A’不代表模式S1和S2,而串B’代表S2。这个事实表明交叉算子可以减小模式代表的数目。
模式S从随机选择的切断点(交叉点)失去一个代表的概率Plost可以表示如下Plost=PCRδ(S)/(l-1)其中PCR为交叉概率,l为串的长度。
Pretaining定义为保留代表的模式S的概率,于是,Pretaining=1-Plast=1-pcδ(S)/(l-1)(14)结合方程(9)、(14),得n(S,t+1)≥[n(S,t)f(S)/f(P)][1-PCRδ(S)/(l-1)] (15)方程(15)对应Holland定理2,它表明模式的增长取决于其代表的适应函数的值及其定义长度。
因此,适应函数大、定义长度短的模式更为多产。
突变运算串的各位有机会突变成其相反的值。假设PMU为任一位的突变概率。于是,位不变化的概率为(1-PMU)。如果串代表具有o(S)位为0或1的模式,那么串内所有相应的o(S)位不突变的概率为(1-PMU)o(S)。换而言之,突变后的串保留模式的一个代表的概率为(1-PMU)o(S)(16)由于PMU通常较小,于是式(16)可简化为(1-o(S)PMU)(17)复制、交叉及突变的组合效果可以写成如下。结合方程(15)、(17)可以得到下述Holland模式定理n(S,t+1)≥[n(S,t)f(S)/f(P)][1-PCRδ(S)/l-1][1-o(S)PMU] (18)如果模式适应值大、定义长度短、级数小,则模式会指数增长。
方程(18)中用到下述符号名称n(S,t)为模式S在时间t时的代表数目;f(S)为模式S的平均适应函数;f(P)为群体内的平均适应函数;PCR为交叉概率;l为串长度;δ(S)为模式S的定义长度;o(S)为模式S的级数;PMU为任一位处的突变概率。
编码问题上面的公开涉及到一种简单的编码方案,它使用二进制字符列,而不检查该二进制编码是否是优化的或有效的。实验观察显示,尽管编码不同,但GA不仅强壮,而且通常会产生好的结果。但是,该编码方法会对GA的精确度和效率产生重大影响。
1989年Goldberg提出有效编码的两条原则1.最小字符列的原则;以及2.有意义构建单元的原则用户应该选择一种编码,使得短定义长度及低级数模式与给定的问题相关联。
小的字符列产生的串可能较长。这种情况下,隐藏平行特性的效率增强。对于给定长度的串,二进制字符列可产生最大数目的模式,使得二进制字符列成为编码的优化选择。但是,并非一定要使用二进制编码。GA中也可使用其它编码方法。例如,可使用具有实数或整数数字的实数编码的染色体。
遵循遗传算法理论的结果,并将GA有效编码原则映射到限制控制问题,这种控制信号的最短字符列为步进字符列,诸如可解释为{“后退一步”,“保持原位”,“前进一步”}的{-1,0,1}。使用两个二进制位,并利用下述映射表解释这些数,可以更有效的计算机实现该字符列

Holmes-Rand(Duffing-Van der Pol)振荡器的控制Holmes-Rand(Duffing-Van der Pol)动态系统的运动方程具有如下形式x··+(x2-1)x·-x+x3=u(t)+ζ(t)---(19)]]>其中u(t)为控制信号,ζ(t)为随机激发信号。
在一个实施例中,可以由下述控制函数产生作为PID控制信号的控制信号u(t)u(t)=kP(t)e+kD(t)e·+kI(t)∫0te(t)dt---(20)]]>其中e=y(t)-x(t)为控制误差,y(t)为用户定义的参考信号。
在一个实施例中,控制增益kP、kD、kI具有逐步限制。因此,该实施例的控制系统优化结构可以描述成如图4所示,控制信号可以根据表2编码。
这种情况下,设备的熵产生速率为dSPdt=1T(x2-1)x·2---(21)]]>控制系统的熵产生速率为dSCdtkDe·2---(22)]]>动能为T=x·22---(23)]]>势能为
U=x44-x22---(24)]]>图14A至14N示出了方程(19)的非线性动态系统的自由动力学及热动力学运动的模拟结果。图14A示出了系统(19)坐标x的动力学进化。图14B示出了系统(19)速度 的动力学进化,其中x轴为系统坐标x,y轴为系统速度 图14D示出Holmes-Rand振荡器的动能进化。图14E示出Holmes-Rand振荡器的势能导数的相图。图14F示出动能的速度相图。图14G示出Holmes-Rand振荡器的势能进化。图14H示出Holmes-Rand振荡器势能的坐标相图。图14I、图14J及图14K分别示出Holmes-Rand振荡器的总能量进化、总能量的坐标相图、总能量的速度相图。
图14L示出设备熵产生进化。图14M示出设备熵进化。图14N示出Holmes-Rand振荡器的设备熵的相图。
图15A至图15C示出了非线性动态系统(19)的自由动力学及热动力学运动的模拟结果。图15A至图15C中各图的x轴及y轴分别为坐标x及速度 图15A示出吸引子的总能量。图15B示出吸引子的熵产生。图15C示出吸引子的熵。
图16A至图16N示出了对在随机激发下非线性动态系统(19)的动力学及热动力学运动的模拟。激发信号ζ(t)是平均值为零的限带白噪音。
图16A示出了系统(19)的坐标x的动态进化。图16B示出了系统(19)的速度 的动态进化,其中x轴为系统坐标x,y轴为系统速度 图16D示出Holmes-Rand振荡器的动能进化。图16E示出Holmes-Rand振荡器相图的势能导数。图16F示出动能的速度相图。图16G示出了Holmes-Rand振荡器的势能进化。图16H示出Holmes-Rand振荡器的势能坐标相图。图16I、图16J及图16K分别示出Holmes-Rand振荡器的总能量进化、总能量的坐标相图、总能量的速度相图。
图16L示出设备熵产生的进化。图16M示出设备熵的进化。图16N示出Holmes-Rand振荡器的设备熵的相图。
图17A至图17C示出了与图16A至图16N相应的模拟结果。图17A至图17C中各图的x轴及y轴分别为坐标x及速度 图17A示出吸引子的总能量。图17B示出吸引子的熵产生。图17C示出吸引子的熵。
图18示出了用于SSCQ 230的GA 231的性能。这种情况下,参考信号y(t)=sin(4π60t)]]>与存在随机激发ζ(t)时系统(19)的坐标x之间的误差信号的最小化即为适应函数,其中随机激发ζ(t)是平均值为零的限带高斯(Gaussian)白噪音。为了提高GA 231对适应函数变化的灵敏度,适应函数被表示成下述形式Fitness=11+Σt=Tt=T+TE(y(t)-x(t))2→max---(25)]]>此时控制系统具有如下参数Ki∈
,i={P,D,I}控制器每隔0.01秒钟就改变增益系数(gain coefficient)(TC=0.01秒),每个系数的步进为0.1。SSCQ 230的评估时间Te取为4秒钟。对于这个例子,GA 231群体大小设为50个染色体,GA 231应进化的代数(generationnumber)设为10。
图18示出了时间间隔t∈
(第一个SSCQ调用)内GA 231的性能,其中根据表1规定GA的搜寻空间。图16示出根据表2规定GA搜寻空间的相应情况。x轴代表代数。y轴代表适应函数(25)的值。各点代表单个染色体的适应值。在图18中,初始群体内染色体适应值的分布范围为
,10代之后GA达到适应值0.87。
在图19中,初始群体内染色体适应值的分布范围为
,10代之后GA达到适应值0.92。因此,根据表2的编码可得到更好的适应函数性能。
图20A至图20N以及图21A至图21C示出了系统(19)的、基于根据表1编码的控制结果。图22A至图22N以及图23A至图23C则对应根据表2的编码。
图20A示出系统(19)的坐标x的动态进化。图20B示出方程(19)的系统的速度 的动态进化,其中x轴为系统坐标x,y轴为系统速度 图20D示出Holmes-Rand振荡器的动能进化。图20E示出Holmes-Rand振荡器相图的势能导数。图20F示出动能的速度相图。图20G示出了Holmes-Rand振荡器的势能进化。图20H示出Holmes-Rand振荡器的势能坐标相图。图20I、图20J及图20K分别示出Holmes-Rand振荡器的总能量进化、总能量的坐标相图、总能量的速度相图。
图20L示出设备熵产生的进化。图20M示出设备熵的进化。图20N示出Holmes-Rand振荡器的设备熵的相图。
图21A至图21C示出了与图20A至图20N相应的模拟结果。图21A至图21C中各图的x轴及y轴分别为坐标x及速度 图21A示出吸引子的总能量。图21B示出吸引子的熵产生。图21C示出吸引子的熵。
图22A示出系统(19)的坐标x的动态进化。图22B示出方程(19)的系统的速度 的动态进化,其中x轴为系统坐标x,y轴为系统速度 图22D示出Holmes-Rand振荡器的动能进化。图22E示出Holmes-Rand振荡器相图的势能导数。图22F示出动能的速度相图。图22G示出了Holmes-Rand振荡器的势能进化。图22H示出Holmes-Rand振荡器的势能坐标相图。图22I、图22J及图22K分别示出Holmes-Rand振荡器的总能量进化、总能量的坐标相图、总能量的速度相图。
图22L示出设备熵产生的进化。图22M示出设备熵的进化。图22N示出Holmes-Rand振荡器设备熵的相图。
图23A至图23C示出了与图22A至图22N相对应的模拟结果。图23A至图23C中各图的x轴及y轴分别为坐标x及速度 图23A示出吸引子的总能量。图23B示出吸引子的熵产生。图23C示出吸引子的熵。
图20A至图20N、图21A至图21C、图22A至图22N、图23A至图23C中所示结果表明,使用两种方法对有噪音的系统(19)的SSCQ控制均具有良好的性能。图24至图28示出这些结果的更多分析。
图24A至图24C比较时间间隔为0到60秒时,使用位置编码和步进编码的动态结果。图24A示出对位置编码和步进编码过程的坐标x的进化。图24B示出对位置编码和步进编码过程的速度 的进化。图24C示出对位置编码和步进编码过程的平方控制误差信号(squared control error signal)的进化。
图25A至图25C比较了图24A至图24C中时间间隔为20到25秒时,使用位置编码和步进编码的动态结果。图25A示出对位置编码和步进编码过程的坐标x的进化。图25B示出对位置编码和步进编码过程的速度 的进化。图25C示出对位置编码和步进编码过程的平方控制误差信号的进化。
特别地,图24C和图25C表明,与位置编码相比,步进编码的控制误差更小,控制性能更佳。由于使用表2所示的编码缩减了搜寻空间,所以GA 430性能的提高,从而使得控制误差更小。
图26A至图26F示出使用表1所示方法的、用于位置编码控制的PID控制器的控制误差进化及增益系数进化。类似地,图27A至图27F示出使用表2所示方法的、用于位置编码控制的PID控制器的控制误差进化及增益系数进化。图26A及图27A示出了误差信号。图26B及图27B示出了误差信号的时间导数。图26C及图27C示出了误差信号的时间积分。图26D及图27D示出了PID控制器的比例增益(proportional gain)K1。图26E及图27E示出了PID控制器的微分增益(derivative gain)K2。图26F及图27F示出了PID控制器的积分增益(integral gain)K3。
图28A至图28C示出了使用位置编码和步进编码的平方控制误差累积(squared control error accumulation)。图28A至图28C的y轴被计算成相应的平方控制误差随模拟时间的累积之和。图28A示出平方误差累积。图28B示出平方微分误差累积(squared differential error accumulation)。图28C示出平方积分误差累积(squared integral error accumulation)。图28A至图28C中,与表1所描述的位置编码方法相比,表2所描述的步进编码方法使性能提高约50%。
图29A示出了上述的Holmes-Rand振荡器中用到的随机激发信号。图29B示出了图29A的随机激发信号的概率分布函数。
车辆悬架系统的控制标题为“INTELLIGENT MECHANTRONIC CONTROL SUSPENSIONSYSTEM BASED ON SOFT COMPUTING”的美国专利公开号10/033370描述了一种主动式车辆悬架控制系统,该专利在此被全部引用作为参考。
图35A示出了车辆主体3510、左侧车轮3532及3534、右侧车轮3531及3533。图8A也示出了分别为车轮3531至3534提供可调整阻尼的阻尼器3501至3504。在一个实施例中,阻尼器3501至3504为受电子控制器3536控制的电子控制阻尼器。在一个实施例中,各个阻尼器上的一步进马达致动器控制一个油阀。在各回转阀位置内的油流决定了由阻尼器提供的阻尼因子。
图35B示出一种可调整阻尼器3517,该阻尼器具有一个控制回转阀3512的致动器3518。硬阻尼阀3511允许液体流入可调整阻尼器3517以产生硬阻尼。软阻尼阀3513允许液体流入可调整阻尼器3517以产生软阻尼。回转阀3512控制流过软阻尼阀3513的液体的数量。致动器3518控制回转阀3512,以允许更多或更小的液体流过软阻尼阀3513,从而产生预期的阻尼。在一个实施例中,致动器3518为一个步进马达。该致动器3518接收来自控制器3510的控制信号。
图35C示出了当回转阀3512打开时,液体流过软阻尼阀3513。图35C还示出了当回转阀3512关闭时,液体流过硬阻尼阀3512。
图36示出了阻尼力特性,即当回转阀放置在硬阻尼位置及软阻尼位置时,阻尼力相对于活塞速度的特性。步进马达控制该阀,以将其放置在软阻尼位置和硬阻尼位置之间,以产生中等阻尼力。
下述例子展示了用于控制车辆阻尼器3501至3504(即车辆减震器)的步进编码方法的结果。该方法是悬架系统应用的示意性说明,因为各个控制阀在各控制周期内可以改变一个步进位置。在该示意例子中,最大控制阀的范围为0到8,控制系统的采样周期为7.5毫秒。
下述结果表明,步进编码方法对控制半主动车辆悬架性能的改进。这里示出的结果内的SSCQ模块(两种情况下)具有下述参数评估时间Te=1.5秒、GA 231共50代、GA 231群体大小为100。两种情况中优化的适应函数包含表3所示的各个分量。
表3 省略了权重分子的值表示将该参数排除掉形成了优化。
根据表3和广义的适应函数方程(1)、车辆悬架系统控制的适应函数可以描述为Fitness2=Σt∈[T;Tc][Σiwi(xite)2]→min---(26)]]>其中i为表3所示的系统状态变量的指数,这些分量的绝对值将被最小化。
在一个实施例中,xite代表相应状态变量的频率分量。可以根据乘客的舒适度要求来选择该频率分量。
图30A至图30F中示出了,具有从表SS1中选取的参数的适应函数(26)的优化模拟结果。图30A示出举起加速度输出 图30D示出举起速度输出(heave acceleration output) 图30B示出俯仰加速度输出(pitch accelerationoutput) 图30E示出俯仰速度输出 图30C示出翻滚加速度输出(rollacceleration output) 图30F示出翻滚速度输出 图31A至图31D分别示出了根据表1所示编码方法以及根据表2所示编码方法得到的左前、右前、左后、右后减震器的控制信号。
图32A至图32F分别为时间间隔为5到7秒时、图30A至图30F的放大版本。
图30A至图30F及图32A至图32F表明,当使用步进方法对控制信号进行编码时优化结果得到改进。优化的适应函数分量的幅度小于步进编码的情况。
图34A至图34D示出了基于控制信号累积误差的优化性能的比较。图34A及图34B示出使用表3中权重系数的适应函数的平方分量。结果表明,对于依赖于多个系统参数和状态变量的复杂适应函数,与使用通常的直接编码方法相比,表2所描述的步进编码方法使优化性能得到改进。
尽管结合特定实施例描述了本发明,但那些对于本领域的普通技术人员而言明显的实施例是在本发明范围内。在不离开本发明的精神和范围下,可进行诸多改变和修改。因此,本发明的范围由随后的权利要求定义。
权利要求
1.一种用于优化知识库的自组织控制系统,包括模糊神经网络,其被设计成为模糊控制器发展知识库;遗传分析器,其被设计成为所述模糊逻辑分类器发展教学信号,所述教学信号被设计成提供预期的一组控制质量,所述遗传分析器使用多个染色体,所述染色体的一部分被步进编码;及具有离散限制的PID控制器,所述PID控制器被设计成接收来自所述模糊控制器的增益排表。
2.根据权利要求1所述的自组织控制系统,其中,该系统还包括反馈模块,用于模拟所述模糊逻辑悬架控制器的查找表。
3.根据权利要求1所述的自组织控制系统,其中,所述遗传分析器模块使用适应函数,该适应函数降低由所述PID控制器控制的设备内的熵产生。
4.根据权利要求1所述的自组织控制系统,其中,所述遗传分析器模块包含基于最小熵物理定律的适应函数。
5.根据权利要求1所述的自组织控制系统,其中,所述遗传分析器在离线模式下使用,以提供所述训练信号。
6.根据权利要求1所述的自组织控制系统,其中,所述步进编码染色体包括前进、后退、及保持的字符列。
7.根据权利要求1所述的自组织控制系统,其中,该系统还包括评估模型,用于为基于熵的适应函数提供输入。
8.根据权利要求7所述的自组织控制系统,其中,该系统还包括模糊控制器,其使用来自该知识库的知识来近似该教学信号。
9.一种用于设备的控制系统,包括被设计成控制模糊控制器的神经网络,所述模糊控制器被设计成控制具有离散限制的线性控制器;被设计成训练所述神经网络的遗传分析器,所述遗传分析器使用步进编码染色体。
10.根据权利要求9所述的控制系统,其中,所述遗传分析器使用来自学习控制单元的控制信号中的熵的时间微分与该设备内的熵的时间微分之差,来作为对控制性能的度量。
11.根据权利要求10所述的控制系统,其中,所述设备内的熵的熵计算是基于被视为开放式动态系统的所述设备的运动方程的热动力学模型。
12.根据权利要求9所述的控制系统,其中,所述遗传分析器产生一个教学信号。
13.根据权利要求9所述的控制系统,其中,所述线性控制系统基于从测量所述设备的一个或多个传感器获得的数据产生控制信号。
14.根据权利要求13所述的控制系统,其中,所述设备包含悬架系统,并且所述一个或多个传感器包含测量该悬架系统的元件的角度和位置的角度和位置传感器。
15.根据权利要求9所述的控制系统,其中,所述模糊控制器使用的模糊规则是通过在离线学习模式下使用该设备的动力学模型来进化。
16.根据权利要求15所述的控制系统,其中,来自所述动力学模型的数据被提供到计算该设备的输入熵产生和输出熵产生的熵计算器。
17.根据权利要求16所述的控制系统,其中,所述输入熵产生和所述输出熵产生被提供到适应函数计算器,该计算器计算作为受一个或多个权重限制的熵产生速率之差的适应函数。
18.根据权利要求17所述的控制系统,其中,所述遗传分析器使用所述适应函数为离线控制系统发展一训练信号,该训练信号对应于操作环境。
19.根据权利要求18所述的控制系统,其中,所述步进编码染色体包含前进、后退、及保持的编码。
20.根据权利要求9所述的控制系统,其中,来自离线控制系统以知识库形式的控制参数被提供到使用来自所述数据库的信息的在线控制系统。
21.一种控制非线性设备的方法,其通过下述方式进行控制获得该设备的熵的时间微分(dSu/dt)与从控制器提供到该设备的熵的时间微分(dSc/dt)之间的熵产生之差;使用采用该熵产生之差作为性能函数的遗传算法来进化具有离散限制的离线控制器的控制规则;以及,为具有离散限制的在线控制器提供过滤控制规则,以控制该设备。
22.根据权利要求21所述的方法,其中,还包含使用所述在线控制器来控制步进马达,以改变车辆悬架系统中的一个或多个减震器的阻尼因子。
23.根据权利要求21所述的方法,其中,还包含通过使用遗传算法来进化出相对于该控制器的变量的控制规则,所述遗传算法使用基于所述熵产生之差的适应函数。
24.一种自组织控制系统,包括模拟器,其被设计成使用设备的非线性运动方程的热动力学模型;适应函数模块,其基于所述设备的熵的时间微分(dSu/dt)与由控制该设备的步进限制线性控制器提供到该设备的熵的时间微分(dSc/dt)之间的熵产生之差来计算适应函数;遗传分析器,其使用所述适应函数来提供教学信号;模糊逻辑分类器,其通过使用学习过程和所述教学信号来确定一个或多个模糊规则;以及,模糊逻辑控制器,其使用所述模糊规则来设定该步进限制线性控制器的步进控制变量。
25.根据权利要求24所述的自组织控制系统,其中,所述遗传分析器使用染色体,所述染色体的至少一部分被步进编码。
26.一种控制系统,包括步进编码遗传算法,其使用适应函数来计算教学信号,该适应函数基于减小熵产生来提供对控制质量的度量;局部熵反馈回路,其通过使设备的稳定性和该设备的可控制性相关联来提供控制。
27.根据权利要求26所述的控制系统,其中,所述步进编码遗传算法包含步进编码染色体,以限制该遗传算法的搜寻空间。
28.根据权利要求27所述的控制系统,其中,使用模糊神经网络,以便从所述教学信号来创建数据库。
29.根据权利要求28所述的控制系统,其中,所述设备为车辆悬架系统。
30.根据权利要求29所述的控制系统,其中,一知识库对应于用来发展该教学信号的选定随机激发信号的随机特性。
31.一种减震器的优化控制方法,包括下述步骤获得减震器内的熵的时间微分与从控制所述减震器的控制单元提供到所述减震器的熵的时间微分之差;通过使用离散限制遗传算法来优化所述控制单元的至少一个控制参数,所述离散限制遗传算法使用所述差作为适应函数,所述遗传算法受到染色体的至少一个步进限制所限制。
32.根据权利要求31所述的优化控制方法,其中,所述优化步骤的所述时间微分降低了从所述控制单元提供到所述减震器的熵。
33.根据权利要求31所述的优化控制方法,其中,所述控制单元包含模糊神经网络,并且通过使用所述遗传算法来优化用于模糊规则的耦合系数的值。
34.根据权利要求31所述的优化控制方法,其中,所述控制单元包含离线模块以及在线控制模块,所述方法进一步包含下述步骤使用所述性能函数、基于所述离散限制遗传算法来优化控制参数;基于所述控制参数来确定所述在线控制模块的控制参数;并使用所述在线控制模块来控制所述减震器。
35.根据权利要求34所述的优化控制方法,其中,所述离线模块使用模拟模型来提供优化,所述模拟模型是基于车辆悬架系统的动力学模型。
36.根据权利要求34所述的优化控制方法,其中,所述减震器被安排成通过改变由步进马达控制的油路的截面积来改变阻尼力,并且所述控制单元控制所述步进马达来调整所述油路的截面积。
37.一种控制设备的方法,包含下述步骤计算与提供到所述设备的模型的控制信号的熵产生速率相对应的第一熵产生速率;计算与所述设备的所述模型的熵产生速率相对应的第二熵产生速率;利用所述第一熵产生速率和所述第二熵产生速率来确定用于步进限制遗传优化器的适应函数;将所述适应函数提供给所述遗传优化器;将来自所述步进限制遗传优化器的教学输出提供给被设计成产生知识库的模糊神经网络;将所述知识库提供给模糊控制器,所述模糊控制器使用误差信号和所述知识库来生成系数增益排表;以及,将所述系数增益排表提供给步进限制线性控制器。
38.根据权利要求37所述的方法,其中,所述遗传优化器在一个或多个限制之下最小化熵产生。
39.根据权利要求38所述的方法,其中,所述限制的至少其中之一是与基于控制性能的用户感知评价的权重相关联。
40.根据权利要求37所述的方法,其中,所述设备的所述模型包含悬架系统的模型。
41.根据权利要求37所述的方法,其中,所述第二控制系统被设计成控制物理设备。
42.根据权利要求37所述的方法,其中,所述第二控制系统被设计成控制减震器。
43.根据权利要求37所述的方法,其中,所述第二控制系统被设计成控制减震器的阻尼速率。
44.根据权利要求37所述的方法,其中,所述线性控制器接收来自监控车辆悬架系统的一个或多个传感器的传感器输入数据。
45.根据权利要求44所述的方法,其中,所述传感器的至少其中之一是测量车辆垂直运动的垂直运动传感器。
46.根据权利要求44所述的方法,其中,所述传感器的至少其中之一是测量车辆垂直加速度的加速计。
47.根据权利要求44所述的方法,其中,所述传感器的至少其中之一是测量车辆加速度的至少一个分量的加速计。
48.根据权利要求44所述的方法,其中,所述传感器的至少其中之一是测量所述悬架系统的至少一部分的长度变化的长度传感器。
49.根据权利要求44所述的方法,其中,所述传感器的至少其中之一是测量所述悬架系统的至少一部分相对于所述车辆的角度的角度传感器。
50.根据权利要求44所述的方法,其中,所述传感器的至少其中之一是测量所述悬架系统的第一部分相对于所述悬架系统第二部分的角度的角度传感器。
51.根据权利要求44所述的方法,其中,所述适应函数包含所述悬架系统的一个或多个状态变量的加权组合。
52.根据权利要求44所述的方法,其中,所述适应函数包含与乘客舒适度相关联的一个或多个变量的加权组合。
53.根据权利要求44所述的方法,其中,所述适应函数包含与乘客舒适度相关联的一个或多个变量的加权组合,并且所述加权组合的一个或多个权重能根据乘客要求来调整。
54.根据权利要求44所述的方法,其中,所述适应函数包含车辆运动的加权组合,从而所述控制系统将减小所述车辆的一个或多个选定运动。
55.根据权利要求37所述的方法,其中,所述第二控制系统被设计成控制减震器中的节流阀。
56.根据权利要求37所述的方法,其中,所述适应函数包含一个或多个状态变量的加权组合。
57.根据权利要求37所述的方法,其中,所述适应函数包含一个或多个系统变量的加权组合。
58.一种控制装置,包括离线优化器件,用于由熵产生速率来决定控制参数,以从步进限制遗传分析器发现的教学信号产生知识库;以及,在线控制器件,用于使用所述知识库来发展控制设备的控制参数。
全文摘要
本发明描述了一种使用基于离散限制的遗传分析器的控制系统。在一个实施方案中,具有步进编码染色体的遗传算法用于获得教学信号,该信号为例如诸如步进限制控制器等具有离散限制的控制器提供良好控制。在一个实施方案中,控制系统使用了基于熵最小这一物理定律的适应(性能)函数。在一个实施方案中,遗传分析器用于离线模式下,为形成知识库的模糊逻辑分类器系统提供一个教学信号。教学信号可以被使用知识库的知识来运转的模糊控制器在线逼近。控制系统可用于控制由非线性、非稳定、耗散模型描述的复杂设备。在一个实施方案中,步进限制控制系统被设计用于控制步进马达。
文档编号G05B13/04GK1672103SQ03818112
公开日2005年9月21日 申请日期2003年7月29日 优先权日2002年7月30日
发明者谢尔盖·V·乌里扬诺夫, 谢尔盖·潘菲洛夫, 高桥一树 申请人:雅马哈发动机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1