第五章 章线性系统二次型指标的最优控制ppt课件.ppt
《第五章 章线性系统二次型指标的最优控制ppt课件.ppt》由会员分享,可在线阅读,更多相关《第五章 章线性系统二次型指标的最优控制ppt课件.ppt(108页珍藏版)》请在三一办公上搜索。
1、第五章 线性系统二次型指标的最优控制 线性二次型问题,返回主目录,5.1 引言5.2 线性二次型问题的提法5.3 终端时间有限时连续系统的状态调节器问题5.4 稳态时连续系统的状态调节器问题5.5 离散系统的线性二次型问题5.6 伺服跟踪问题5.7 设计线性二次型最优控制的若干问题5.8 小结,5.1 引言,用极小值原理解非线性系统的最优控制将导致非线性两点边值问题,这类问题求解是很困难的。即使系统是线性的,但当指标函数是最短时间、最少燃料这种形式,要求得到最优控制的解析表达式,并构成反馈控制(即把 表示为 的函数)也是非常困难的。,返回子目录,的确定归结为求解一个非线性矩阵黎卡提(Ricca
2、ti)微分方程或代数方程。而黎卡提方程的求解已研究得很透彻,有标准的计算机程序可应用,因此,求解既规范又方便。这种问题简称为线性二次型(Linear Quadratic 简称LQ)问题,目前应用得十分广泛,是现代控制理论最重要的结果之一。,下面我们将看到,若系统是线性的,指标函数是二次型的(指标函数是 和 的二次函数),则可以求得线性最优反馈控制律 。,线性二次型问题的实用意义还在于:,例如,在飞行器的轨迹优化问题中,根据飞行器的状态方程(一般是非线性的)用极小值原理计算出名义的最优控制和最优状态轨迹,设分别 用 和 表示。,把它所得到的最优反馈控制与非线性系统的开环最优控制结合起来,可减小开
3、环控制的误差,达到更精确的控制的目的。,因为状态方程只能是对飞行器实际动力学特性的近似描绘,这里存在着模型误差,把 加到飞行器上去,所产生的实际状态 将不同于 (这里我们还未考虑作用在飞行器上的其它扰动作用)。(这里我们还未考虑作用在飞行器上的其它扰动作用)。,令状态误差为 ,我们要使 愈小愈好,为此,可根据 构成一个最优反馈控制 ,作为校正信号加到 上去,得到的实际控制信号 将使飞行器尽可能沿着 飞行。,由于 、 应该比较小,它们将满足线性的状态方程,所以可用线性二次型问题设计出反馈控制 。我们可用图5-1表示上面的思想。,图5-1 线性二次最优反馈控制的应用,5.2 线性二次型问题的提法,
4、一般情况的线性二次型问题可表示如下:,其中, 为 维状态向量, 为 维控制向量, 为 维输出向量。设 不受约束。,设线性时变系统的方程为,(5-1),(5-2),返回子目录,其中, 为 维理想输出向量。寻找最优控制,使下面的性能指标最小,(5-4),令误差向量 为,(5-3),其中, 是 对称半正定常数阵, 是 对称半正定阵, 是 对称正定阵。 一般将 、 、 取成对角阵。,下面对性能指标 中的每一项作一说明。因 为正定阵,则当 ,就有 。例如,设 , ,则 为正定阵,于是,它与消耗的控制能量成正比,消耗得越多,则性能指标值 越大。故性能指标中这一项表示了对消耗控制能量的惩罚。 、 可看作加权
5、系数,如认为 的重要性大于 ,则可加大 。将 选成时间函数,是为了对不同时刻的 加权不一样。实际上,为了简单起见常选用常数阵 。,为半正定阵,则当 ,就有 , 表示误差平方和积分,故这项表示对系统误差的惩罚。 表示对终端误差的惩罚,当对终端误差要求较严时,可将这项加到性能指标中。,总之,性能指标 最小表示了要用不大的控制量来保持较小的误差,以达到能量和误差的综合最优。,这时 (单位阵),理想输出 ,则 ,这时,问题归结为用不大的控制量使 保持在零值附近。因而称为状态调节器问题。,下面讨论几种特殊情况:,1)调节器问题。,例如电机转速调节系统中,由于外加电压波动使转速偏离要求值,通过施加控制使转
6、速偏差趋于零。,这时 , ,这时要用不大的控制量使 跟踪 ,因而称为跟踪问题。例如,用雷达跟踪飞行器的运动,通过控制使跟踪误差趋于零。,2) 伺服机问题。,5.3 终端时间有限时连续系统的状态调节器问题,要求寻找最优控制 ,使 最小。这里 无约束。 、 为对称半正定阵, 为对称正定阵。终端时间 为有限值。,(5-5),(5-6),考虑下面的系统状态方程和性能指标,返回子目录,5.3.1 用极小值原理求解上面的问题,因 无约束,故等同于用经典变分法求解。取哈密顿函数为,协态方程为,最优解的必要条件如下:,(5-8),因 正定,故 存在,由上式可确定最优控制 。为寻求最优反馈控制律还需把 与状态
7、联系起来。,(5-9),控制方程为,但这里处理的是线性微分方程,可找到更简单的解法。从(5-10)可见,协态 和状态 在终端 时刻成线性关系。,(5-10),横截条件为,然后再来求出 (这种方法称为扫描法)。将(5-11)代入(5-9),再代入(5-5),得,(5-11),(5-12),(5-13),由(5-11)和(5-8)可得,这启发我们假定:,上式对任意 都应成立,故方括号内的项应为零,这就得出,(5-14),将(5-12)代入(5-13)可得,上式是 的非线性矩阵微分方程,称为黎卡提(Riccati)矩阵微分方程。一般来说得不出 的解析表达式,但可用计算机程序算出 的数值解。为了求解
8、,要知道它的边界条件。比较(5-11)和(5-10)可知,因此可从 到 逆时间积分黎卡提微分方程,求出 。由(5-9)和(5-11)就可构成最优反馈控制,又称为最优反馈增益矩阵。最优反馈系统的结构图如图5-2所示。,(5-16),图5-2 最优反馈系统的结构图,注意到 与状态 无关,故可在系统未运行前,将 先计算出来(称为离线计算),把它存储在计算机中。,在系统运行时,将 从计算机存储元件中取出,与同一时刻测量到的 相乘,就可构成最优控制 。,由此可见,系统运行时的计算量(称为在线计算量)只是一个乘法计算,故可用简单的微计算机来完成。,5.3.2 矩阵黎卡提微分方程的求解及的性质,1、,于是可
9、用下面的差分方程来近似黎卡提微分方程,(5-17),矩阵黎卡提微分方程是非线性的,一般不能求得闭合形式的解。在数字机上求解时,可用一阶差分代替微分,2、,求解上式时,以 为初始条件,取 为负的小量,从 到 逆时间递推计算,即可出 。,是对称矩阵,即 , 表示转置。这可证明如下:因为 、 、 都是对称的,将(5-14)式转置一下,可得,因此 和 一样满足同一黎卡提方程,并且边界条件一样,即 。于是,由微分方程解的唯一性可知,利用这个对称性,求 维 的元时,只需积分 个方程即可。,3、,即使系统是定常的,即系统矩阵A,输入矩阵B为常数阵,加权阵 和 也是常数阵,但 仍为时变阵。,例5-1 设系统状
10、态方程为,解,考虑到 是对称阵,设,为简单起见,上式右端省略了自变量 。把上面的 、 、 、 和 代入黎卡提方程(5-14)式,可得,(5-20),(5-21),把状态方程(5-18)和(5-5)式相比较,把性能指标(5-19)和(5-6)式相比较,可得,令上式等号左右端的对应元相等,得,(5-23),(5-22),由 到 逆时间积分上面的非线性微分方程组,即可求得 。于是最优控制为,(5-24),这是一组非线性微分方程。由边界条件,、 、 、 和 随时间变化的曲线可求出,如图5-3(a)、(b)、(c)所示。,图5-3 、 、 、 和 的时间曲线,由图5-3可见,定常系统的反馈系数 、 都是
11、时变的。当 比系统的过渡过程时间大很多时, 、 只在接近 时才有较大的变化,其它时间接近于常数。当 时, 、 和 都趋于零,则黎卡提微分方程变为黎卡提代数方程,解上面的方程组可得 、 、 的稳态值,于是最优控制律可表示为,(5-27),最优控制系统的结构图如图5-4所示。,图5-4 重积分系统最优控制的结构图,5.4 稳态时连续系统的状态调节器问题,对于稳态问题,当系统状态方程和性能指标中的加权阵满足一定条件时,可得出常数的最优反馈增益阵,这样在实现时非常方便,因此有很大的实际意义。,我们不加证明地列出下面的结果,然后再对问题中的条件作一些说明。,现在来研究工程实践中经常碰到的情况:系统是定常
12、的,积分指标的上限为无穷大。这种线性二次型问题称为稳态问题。,返回子目录,为 维, 为 维,系统是可控的或至少是可稳的(可稳指不可控的状态是渐近稳定的)。性能指标为,(5-28),(5-29),线性定常系统,其中 不受约束, 和 为常数对称正定阵。或者可将对 的要求改为对称半正定, 可观测,或至少可检测(可检测指不可观测的状态是渐近稳定的), 是 的矩阵平方根:。,上节我们已经证明了:使 为 极小的最优控制是存在和唯一的,且可表示为:,(5-30),其中 为 维常数阵,称为反馈增益阵, 为 维正定对称阵,满足下面的矩阵黎卡提代数方程,对照有限时间调节器的公式(5-14)可见,令 ,并将时变阵换
13、成常数阵即得到(5-31)式。在5.5中将针对离散型系统求取与(5-30)对应的线性二次型状态调节器的控制规律。,(5-31),可以看到,与有限时间的调节器不同,稳态调节器问题附加了两个条件:系统可控或至少可稳; 为对称正定阵,或 对称半正定并且 可观,至少可检测, 。下面对这些条件作些解释。,也就是受控系统的状态变量必须是渐近稳定的(这时由 产生的反馈控制 也收敛到零)。,因为稳态问题的性能指标积分上限为无穷,为了保证积分值为有限, 和 要收敛到零。,1)系统可控或至少可稳。这个要求是为了保证性能指标的积分为有限值(不趋于无穷)而提出的。,如果系统可控,则通过状态反馈可任意配置闭环系统极点,
14、使系统渐近稳定。可控的条件可减弱为可稳,即不可控的状态是渐进稳定的。对有限时间调节器来讲,因为积分上限 为有限值,即使系统不可控,状态变量不稳定,但积分指标仍可为有限值,故仍旧有最优解。,2) 为正定或 为半正定并且 可观测至少可检测, 。,这个条件是保证最优反馈系统稳定而提出的,因性能指标 取有限值,还不能保证系统稳定。,例如只要不稳定的状态变量在性能指标中不出现(未被指标函数所“观测”到)即可。 为半正定时就可能出现这种情况,所以 必须正定。或者半正定,但还有 可观,至少可检。下面用例子来说明。,例5-2 已知系统方程,要寻找最优控制使 最小。,(5-32),性能指标是,(5-33),解,
15、设 ,即未控系统是不稳的,但系统是可控的。若 , ,即 、 为正定。黎卡提代数方程(5-31)化为,(5-34),(5-35),取正定解,由(5-30)求得最优控制,代入状态方程(5-32),得,闭环特征根变为,即最优反馈系统是稳定的。,(5-37),从 的形式立即可判断出 时 最小。这时无反馈控制作用,系统保持为开环不稳定。从黎卡提方程来看,这时有,有两个解: 和 。只有 可使 ,从而性能指标为最小,但这时系统不稳定。,若 (相当于为半正定),则指标蜕化为,例5-3 考虑下面的不可控系统,要求出最优控制使 为最小。,(5-38),(5-39),(5-40),性能指标为,解,显然,这个系统的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五章 线性系统二次型指标的最优控制ppt课件 第五 线性 系统 二次 指标 最优 控制 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1433994.html