用于非线性系统中的反馈误差学习的系统和方法

文档序号:5156077阅读:160来源:国知局
用于非线性系统中的反馈误差学习的系统和方法
【专利摘要】本发明涉及用于非线性系统中的反馈误差学习的系统和方法。公开了一种用于使致动器运转的方法。致动器可以是线性或非线性致动器。在一个示例中,响应于反馈控制器的输出而适应伪逆分段双线性模型,以改善前馈控制。
【专利说明】用于非线性系统中的反馈误差学习的系统和方法

【技术领域】
[0001] 本发明涉及用于非线性系统中的反馈误差学习的系统和方法。

【背景技术】
[0002] 反馈误差学习(FEL)已经被认为是一种识别逆线性或神经网络被控对象/设备 (plant)模型的方法。逆被控对象模型可以用作前馈控制系统的一部分,以控制被控对象。 例如,致动器的期望的轨迹可以被输入到逆被控对象模型里,并且自逆被控对象模型输出 遵循期望的轨迹的控制命令。可以经由FEL通过基于反馈控制器的输出适应前馈逆线性模 型或神经网络的参数来识别逆被控对象模型。逆线性模型或神经网络模型是控制命令的基 础,而反馈控制器输出被用来适应线性模型或神经网络模型参数,并纠正源于逆被控对象 模型的控制动作。因此,考虑两种类型的FEL,即,具有神经网络模型的FEL和具有线性模型 的FEL。
[0003]FEL起初作为一种类似于人脑控制手臂或腿的运动的方式的方式控制装置或设备 的方法被提出。包括大脑的生物控制系统可以具有迟缓的或延迟的反馈。然而,一些研究 者认为,大脑基于逆被控对象模型的认知来提供快速且顺畅的控制动作。通过这种认知,大 脑可以将四肢命令到期望的轨迹,而不必等待接收来自神经或感觉的反馈。
[0004] 最初,FEL的研究仅包括神经网络模型。神经网络模型可以被用来控制任何非线性 的被控对象。然而,神经网络模型具有复杂结构,并且因此非常难以进行由神经网络模型提 供的控制的理论分析。例如,当应用神经网络时,难以进行控制系统的稳定性分析。同样, 就其性质而言,神经网络模型在某种程度上是黑盒或灰盒。因此,当FEL与神经网络模型组 合时,该方法不适合实际使用。
[0005] 控制理论家后来提出了具有线性模型的FEL,并且论证得出具有线性模型的FEL 能够对稳定性进行分析。然而,当FEL与线性模型组合时,它只适用于线性的被控制对象。 因此,具有神经网络模型或线性模型的FEL在应用以及实施中已经有些受限。


【发明内容】

[0006] 发明人在此已经认识到上述缺点,并且已经开发了具有分段(piecewise)双线性 模型的FEL。这是一种用于控制系统的方法,其包含:提供被控对象的伪逆分段双线性模 型;基于反馈控制器的输出适应伪逆分段双线性模型;以及响应于伪逆分段双线性模型而 调整致动器的运转。
[0007] 通过响应于反馈控制器的输出而适应伪逆分段双线性模型,提供改善非线性系统 的前馈控制的技术效果是可能的。具体地,可以在N维查询表中描述致动器的逆模型。可 以经由自反馈控制器的输入来调整查询表的入口和顶点,以便最终使反馈控制器的输出趋 于零。在反馈控制器的输出到达零时的控制下,查询表提供接近精确的被控对象的逆模型。 因此,自查询表输出的致动器或被控对象命令会引起被控对象遵循期望的轨迹,该期望的 轨迹是在查询表中给数据编索引的基础。
[0008] 此外,通过应用具有分段双线性模型的FEL,可以控制任何非线性的被控对象,如 用神经网络模型,但以更透明的方式。例如,分段双线性模型是白盒,因为它由查询表表示。 因此,具有分段双线性模型的FEL非常适合实际使用。同样,分段双线性模型的参数与线性 模型完全相同。因此,很容易作出由系统提供的控制的理论分析。
[0009] 本说明可以提供若干优点。例如,该方法可以允许致动器更接近地遵循期望的轨 迹。此外,该方法试图改善控制系统中的致动器性能。另外,该方法可以应用于现有的车辆 控制系统,其中非线性的被控对象是常用的,并且查询表被广泛用于控制。
[0010] 当单独或结合附图参照以下【具体实施方式】时,本说明的上述优点和其它优点以及 特征将是显而易见的。
[0011] 应当理解,提供以上概述是为了以简化的形式介绍一些概念,这些概念在具体实 施方式中被进一步描述。这并不意味着确定所要求保护的主题的关键或基本特征,要求保 护的主题的范围被紧随【具体实施方式】之后的权利要求唯一地限定。另外,要求保护的主题 不限于解决在上面或在本公开的任何部分中提及的任何缺点的实施方式。

【专利附图】

【附图说明】
[0012] 图1示出了发动机的示意图;
[0013] 图2示出了发动机可以在其中运转的车辆;
[0014] 图3示出了控制器的示例方框图;以及
[0015] 图4示出了用于使线性或非线性的被控对象运转的示例方法。

【具体实施方式】
[0016] 本说明涉及改善非线性致动器和系统的运转。致动器和系统可以是更大系统的一 部分。在如图1和图2所示的一个示例中,致动器和系统可以被并入车辆和动力传动系统。 图3示出了示例控制器的简化的方框图。图4示出了用于实施控制器的方法的一个示例, 其提供了适应正被控制的被控对象的逆分段双线性模型。
[0017] 参照图1,内燃发动机10由电子发动机控制器12控制,其中内燃发动机10包含多 个汽缸,在图1中示出了多个汽缸中的一个汽缸。发动机10包括燃烧室30和汽缸壁32,活 塞36被设置在其中并且被连接至曲轴40。燃烧室30被显示为经由各自的进气门52和排 气门54与进气歧管44和排气歧管48连通。可以通过进气凸轮51和排气凸轮53使每一 个进气门和排气门运转。可以经由进气凸轮驱动器81和排气凸轮驱动器83使进气凸轮51 和排气凸轮53相对于曲轴40旋转。进气凸轮51的位置可以由进气凸轮传感器55确定。 排气凸轮53的位置可以由排气凸轮传感器57确定。
[0018] 燃料喷射器66被示为设置为将燃料直接喷射到燃烧室30内,本领域技术人员称 之为直接喷射。燃料喷射器66与来自控制器12的脉冲宽度信号成比例地输送燃料。燃烧 室30中的空气-燃料混合物可以被火花塞68点燃。在一些示例中,节气门62、火花塞68、 凸轮51和53以及燃料喷射器66可以被称为发动机转矩致动器。
[0019] 进气歧管44被示为与可选电子节气门62连通,节气门62调整节流板64的位置以 控制来自进气升压室46的气流。压缩机162从进气口 42吸入空气以供应升压室46。排气 使经由轴161耦接至压缩机162的涡轮164旋转。在一些示例中,可提供增压空气冷却器。 可以通过调整可变叶片控制装置72或压缩机旁通阀158的位置来调整压缩机速度。在替 代的示例中,除可变叶片控制装置72之外,废气门74可以代替或被使用。可变叶片控制装 置72调整可变几何形状涡轮叶片的位置。当叶片处于打开位置时,排气能够经过涡轮164, 供应使涡轮164旋转的少量能量。当叶片处于闭合位置时,排气能够经过涡轮164并且将 增强的力施加给涡轮164。可替换地,废气门74允许排气在涡轮164周围流动以便减少供 应给涡轮的能量的量。压缩机旁通阀158允许在压缩机162的出口处压缩空气回到压缩机 162的输入口。以此方式,可以降低压缩机162的效率以便影响压缩机162的流量,并降低 压缩机喘振的可能性。
[0020] 在一些示例中,如图所示,通用排气氧(UEGO)传感器126可以被耦接至排放装置 70上游的排气歧管48。在其他的示例中,UEGO传感器可以位于一个或更多个排气后处理 装置的下游。
[0021] 排放装置70可以包括多块催化剂砖形式的三元催化剂。在另一示例中,能够使用 各具有多块砖的多个排放控制装置。在一个示例中,排放装置70可以包括氧化催化剂。在 其他的示例中,排放装置可以包括稀NOx捕集器或选择性催化还原法(SCR)、和/或微粒过 滤器(DPF)、和/或碳氢化合物捕集器。
[0022] 在发动机10是柴油发动机的示例中,66可以是电热塞,而68可以是燃料喷射器。 可以相对于曲轴40的位置调整燃料喷射正时,以控制燃烧正时。
[0023] 控制器12在图1中被示为传统的微型计算机,其包括:微处理器单元(CPU) 102、 输入/输出端口(I/O) 104、只读存储器(ROM) 106、随机存储器(RAM) 108、保活存储器 (KAM) 110和常规数据总线。控制器12被示为接收来自耦接至发动机10的传感器的各种信 号,除之前讨论的那些信号之外,还包括:来自耦接至冷却套筒114的温度传感器112的发 动机冷却液温度(ECT);耦接至加速器踏板130用于感测足部132调整的加速器位置的位 置传感器134 ;来自耦接至进气歧管44的压力传感器121的发动机歧管压力(MP)的测量; 来自压力传感器122的升压压力;来自氧传感器126的排气氧浓度;来自感测曲轴40位置 的霍尔效应传感器118的发动机位置传感器;来自传感器120(例如,热线式空气流量计) 的进入发动机的空气质量的测量;以及来自传感器58的节气门位置的测量。大气压力传感 器135可以为控制器12指示周围环境的大气压力。在本说明的优选方面中,发动机位置传 感器118在曲轴的每一个旋转均产生预定数量的等间距的脉冲,根据其能够确定发动机转 速(RPM)。
[0024] 在运转期间,发动机10内的每个汽缸通常经历四冲程循环:该循环包括进气冲 程、压缩冲程、膨胀冲程和排气冲程。在进气冲程期间,一般地,排气门54关闭并且进气门 52打开。经由进气歧管44将空气引入燃烧室30中,并且活塞36移动至汽缸的底部以便增 加燃烧室30内的体积。活塞36接近汽缸的底部并且在其冲程的末端处(例如当燃烧室30 处于其最大体积时)的位置,本领域技术人员通常称之为下止点(BDC)。在压缩冲程期间, 进气门52和排气门54关闭。活塞36朝汽缸盖移动以便压缩燃烧室30内的空气。活塞36 在其冲程末端处并且最接近汽缸盖(例如当燃烧室30处于其最小体积时)的点,本领域技 术人员通常称之为上止点(TDC)。在以下称为喷射的过程中,燃料被引入燃烧室。在一些示 例中,在单个汽缸循环期间可以多次将燃料喷射到汽缸。在以下称为点火的过程中,提供火 花以使汽缸中的空气-燃料混合物燃烧。可代替地,可以经由压缩点火开始燃烧。在膨胀 冲程期间,膨胀气体推动活塞36回到BDC。曲轴40将活塞运动转换为旋转轴的转动转矩。 最后,在排气冲程期间,排气门54打开以便将燃烧过的空气-燃料混合物释放到排气歧管 48,并且活塞回到TDC。注意,上述内容仅作为示例描述,并且进气和排气门打开和/或关闭 正时可以改变,诸如以提供正或负气门重叠、进气门延迟关闭或各种其他示例。此外,在一 些示例中,可以使用两冲程循环而不是四冲程循环。
[0025] 现在参照图2,示出了发动机10可以在其中运转的的车辆。车辆202被示为包括 发动机10。在一些示例中,车辆202还可以包括马达/发电机255,用于选择性地向车辆的 传动系供应转矩。车辆202还可以包含物体传感器290,用于感测车辆的路径中的物体,并 且用于响应于该物体而调整车辆运转。例如,如果在车辆的路径中的感测到物体,可以应用 制动器226并且可以调整发动机10的转矩致动器的运转。可以通过经由液压泵228增加 制动管路中的压力来自动应用制动器226。另外,悬架致动器224可以调整相对于道路的车 辆的高度,并且可以通过改变车辆悬架阻尼使车辆的乘坐变硬或变软。
[0026] 现在参照图3,示出了控制器的示例方框图。控制器300包括指示为参考(ref)的 参考信号或轨迹。参考信号被输入到查询表302和求和点306。在304处获得参考信号关 于时间的导数(d/ft),并被输入到查询表302。
[0027] 查询表302包括描述被控对象320的逆或伪逆模型的表入口和顶点。查询表302 作为分段双线性模型起作用。在这个示例中,参考输入及其关于时间的导数被输入到索引 查询表302。如果被控对象320是线性且可逆的,则查询表302是被控对象320的逆。如果 被控对象320是非线性且不可逆的,则查询表302是被控对象320的伪逆或近似逆,因为被 控对象320是不可逆的。自查询表302的输出为被控对象320提供控制输出u的前馈成分 Uff。反馈控制器308为被控对象320提供控制输出u的反馈成分Ufb。参数Uff和Ufb在被 输入到被控对象320之前在求和点310处加在一起。被控对象320可以是如在图1和图2 中所描述的系统中的致动器。可替代地,被控对象320可以是任何系统中的被控对象,其中 可以经由分段双线性模型近似被控对象320。被控对象320的响应y被回馈到求和点306, 其中从参考输入或信号减去它以提供误差值。误差值被输入到反馈控制器308。反馈控制 器308可以是比例积分控制器或其他类型的已知控制器。自反馈控制器308的输出被引 导至查询表302与求和点310。响应于反馈控制器308的输出适应查询表302的表值和顶 点。因此,反馈控制器308的输出起作用为从由查询表302所表示的逆或伪逆模型去除误 差,并且它还起作用为稳定被控对象320的运转,并降低误差的影响,其中所述误差可以在 查询表302中,同时正朝向被控对象320的改善的逆或伪逆模型适应查询表302。
[0028] 现在参照图4,描述了使可以被描述为逆或伪逆分段双线性模型的线性或非线性 被控对象运转的示例方法。分段双线性模型是用于表示线性和非线性系统的全参数化模 型。图4的方法可以被提供为存储在系统(诸如图1和2所示的系统)的非临时性存储器 中的可执行指令。
[0029] 在402处,方法400确定用于使被控对象运转的前馈控制器。被控对象可以是如 图1和图2所示的车辆系统中的致动器。可替代地,被控对象可以在任何系统中,其中可以 经由分段双线性模型来描述被控对象。另外,被控对象可以是线性的或非线性的。
[0030] 在一个示例中,可以从离线被控制对象数据识别并构建前馈控制器。另外,前馈控 制器可以被实施为逆或伪逆分段双线性模型。分段双线性模型始终由矩阵形成,并且矩阵 中的每一个值均被称为分段双线性模型中的顶点。在一个示例中,其中前馈模型使用被表 示并被实施为经由一个或更多个变量索引的查询表的分段双线性模型,表的轴线可以定义 为一个或更多个索引变量的预期极限(例如,其中表的Y轴线是发动机转速,且表的X轴线 是发动机负荷,Y轴线可以从O延伸至1,而X轴线可以从O延伸至7000RPM)。可以基于表 的尺寸与X轴线和Y轴线的范围来均匀地分开查询表的入口顶点。然而,在其他示例中,可 以提供用于识别逆或伪逆模型的更复杂的方法。例如,可以通过最小化基于被控对象输入 与输出的m样本的性能指标来识别分段双线性模型。前馈控制器被确定之后,方法400进 入到404。
[0031] 在404处,方法400确定用于命令被控对象并提供适应前馈控制器的输入的反馈 控制器。在一个示例中,反馈控制器可以被实施为比例/积分控制器,其中供应给被控对象 的命令基于根据被控对象命令与被控对象响应之差确定的误差。被控对象命令通过误差的 比例量被调整。另外,基于积分误差调整被控对象命令。具体地,误差的比例量和积分误差 加在一起,并作为控制命令输入到被控对象。在其他示例中,其他类型的控制器可以是反馈 控制器的基础。例如,比例/积分/微分(PID)控制器可以是反馈控制器。在其他示例中, 反馈控制器是车辆驾驶员。例如,当车辆性能不满足驾驶员的期望的或感觉的性能时,驾驶 员可以改变控制动作。提供给反馈控制器的误差可以是由于标称被控对象模型中的误差、 环境状况自标称环境状况的偏离、不正确的标称前馈控制器的或前馈控制器自标称校准的 偏离。在确定反馈控制器之后,方法400进入到406。
[0032] 在406处,方法400接收期望的被控对象轨迹或命令输入。期望的被控对象轨迹 可以基于提供期望的被控对象响应的期望的预定轨迹。例如,在406处,停止车辆而不会引 起车轮打滑的期望的车辆制动作用速率可以被输入到控制系统。在其他示例中,取决于正 被控制的被控对象,用于其他致动器(诸如凸轮轴致动器、节气门致动器、燃料喷射器、车 辆速度致动器、转矩控制致动器、涡轮增压器废气门致动器、气候控制致动器和车辆悬架致 动器)的其他期望的命令输入可以被输入到系统。
[0033] 期望的被控对象轨迹被输入到前馈控制器。期望的被控对象轨迹还被输入到反馈 控制器,作为通过从如图3所示的期望的被控对象轨迹减去被控对象的响应而确定的误差 的一部分。方法400进入到408。
[0034] 在408处,方法400将前馈控制器的输出与反馈控制器的输出求和,以向被控对象 提供控制命令U。因此,对被控对象的命令信号包括命令U的前馈部分和命令U的反馈部 分。如果命令的前馈部分不包括误差,被控对象命令的反馈部分变为零。在前馈与反馈控 制命令被加在一起之后,方法400进入到410。
[0035] 在410处,方法400调整被控对象的运转。被控对象可以是致动器、或诸如发动机 转矩致动器、车辆悬架致动器、车辆速度控制致动器的致动器、或可以通过分段双线性模型 描述的一些其他致动器。另外,可以同时调整本文所描述的致动器中的若干致动器,以控制 车辆速度、发动机转矩、发动机转速和遵循特性的车辆交通。此外,若干形式的图4的方法 可以被并入到控制发动机或车辆中。例如,可以通过分开形式的图4的方法或单一形式的 图4的方法同时控制发动机节气门和进气凸轮。可以经由电能、气动能、化学能或其他已知 的致动器类型来命令致动器。在被控对象或致动器被命令之后,方法400进入到412。
[0036] 在412处,方法400确定期望的致动器或被控对象轨迹与实际致动器或被控对象 轨迹之间的误差。具体地,从期望的被控对象轨迹减去被控对象的轨迹以提供被控对象误 差。在被控对象误差被确定之后,方法400进入到414。
[0037] 在414处,方法400适应查询表的入口和顶点以改善已经以查询表的形式表示的 逆或伪逆分段双线性模型。在一个示例中,可以经由在线的顺序学习算法来适应查询表,并 且查询表的入口与顶点之间的差值基于双线性差值。
[0038] 简化的被控对象模型可以被表示为y=p(U),其中y是输出,而u是控制输入。逆 可以被表示为u=K1 (y),假设被控对象是可逆的。用于FEL中的前馈控制器的逆模型可 以被表示为《// = /^(〃,/;),其中r是期望的输出yd,并且其中/?是九。在这个示例中的前馈 控制器包括两个输入y和> 以及一个输出uff。另外,在这个示例中的前馈控制器包括伪逆 模型,因为被控对象一般是不可逆的,除非其相关程度为零。
[0039] 学习前馈控制参数,以最小化通过以下公式描述的性能指标:
[0040] / =(〃〃 - 2
[0041] 其中Uff是前馈输出,Utl是理想的前馈控制输出,其中Wr =户?,Ο,并且其中V 是顶点的矩阵。前馈控制器的分段双线性表示是:
[0042] Uff =ρ\rj\V)=ΣΣW1 \{r)wJι{ιΛ)ν{?^j) ?=σJ=T
[0043] I的导数可以被表示为: (3/ου7 / \
[0044]
[0045] 能够利用其导数继续地最小化变量I;然而,误差(Uff-Utl)是不可用的,因为Utl是 未知的。相反,反馈控制器Ufb的输出可以代替(Uff-Utl)使用。I的导数变为: duIIΦ'(/%/%I7)
[0046] -Γ1//, =-~iUfi OVOVOV
[0047] 经由以下算法来实现顺序学习:
[0048]Vnm=Vold-Sdp 'i^nUfb QV
[0049] 其中δ是用于自适应学习速率的可调整参数。如果学习成功,Vnew =Vtjlt^pufb变 为零。对应于区域的每一个顶点的模型参数被更新为: Buff
[0050] KenVJ, =V0IdiiJ) - --Ufb 〇V(i,i)
[0051] 变量Vnew和Vtjld指的是区域的四个顶点的值。因此,Uff相对于各个顶点的偏导数 变为:

【权利要求】
1. 一种用于控制系统的方法,其包含: 提供被控对象的伪逆分段双线性模型; 基于反馈控制器的输出适应所述伪逆分段双线性模型;以及 响应于所述伪逆分段双线性模型而调整致动器的运转。
2. 根据权利要求1所述的方法,其中经由查询表来实施伪逆分段双线性模型,并且其 中所述被控对象是所述致动器。
3. 根据权利要求1所述的方法,其中所述伪逆分段双线性模型表示不可逆被控对象模 型的近似逆。
4. 根据权利要求1所述的方法,其中所述致动器是发动机转矩致动器。
5. 根据权利要求4所述的方法,其中所述发动机转矩致动器是凸轮轴致动器、节气门 致动器或燃料喷射器中的一个。
6. 根据权利要求1所述的方法,其中所述致动器是车辆速度控制致动器。
7. 根据权利要求6所述的方法,其中所述车辆速度控制致动器是车辆制动致动器或节 气门致动器中的一个。
8. 根据权利要求1所述的方法,其中所述致动器是涡轮增压器废气门致动器。
9. 一种用于控制系统的方法,其包含: 提供被控对象的分段双线性模型; 响应于反馈控制器的输出而适应所述分段双线性模型;以及 响应于所述分段双线性模型和所述反馈控制器的所述输出而调整致动器的运转。
10. 根据权利要求9所述的方法,其还包含,通过适应所述分段双线性模型而使所述反 馈控制器的输出趋于零。
11. 根据权利要求10所述的方法,其中所述分段双线性模型是以查询表的形式,并且 其中所述被控对象是所述致动器。
12. 根据权利要求11所述的方法,其中适应所述分段双线性模型包括调整所述查询表 的表条目。
13. 根据权利要求11所述的方法,其中适应所述分段双线性模型包括调整一个或更多 个表顶点。
14. 根据权利要求9所述的方法,其中参考轨迹被输入到所述被控对象的所述分段双 线性模型,并且其中所述分段双线性模型的输出被加到所述反馈控制器的输出。
15. 根据权利要求9所述的方法,其中所述致动器是车辆制动系统致动器。
16. 根据权利要求9所述的方法,其中所述致动器是车辆气候控制致动器。
17. -种用于控制非线性系统的方法,其包含: 提供非线性被控对象的分段双线性模型; 响应于反馈控制器的输出通过最小化性能指标来适应所述分段双线性模型;以及 响应于所述分段双线性模型和所述反馈控制器的所述输出而调整致动器的运转。
18. 根据权利要求17所述的方法,其还包含向所述反馈控制器提供所述致动器的状 态,并且其中所述致动器是所述非线性被控对象。
19. 根据权利要求17所述的方法,其中所述致动器是车辆的致动器。
20. 根据权利要求19所述的方法,其中所述致动器是发动机转矩致动器。
【文档编号】F02D45/00GK104279069SQ201410304844
【公开日】2015年1月14日 申请日期:2014年6月30日 优先权日:2013年7月9日
【发明者】D·P·菲尔沃, 菅野道夫, 王沿, L·艾西欧拉扎, 谷口唯成, J·O·米歇里尼 申请人:福特环球技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1