描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302456490
全书共分13章,基本内容由6部分组成。第1部分介绍*系统的统计分析,并着重介绍利用统计线性化方法研究*非线性系统的统计分析理论;第2部分详细介绍了*线性系统与*非线性系统的*状态估计与预测理论,重点讨论了利用统计线性化方法获得*非线性系统的准*估计算法及条件*滤波器设计方法等;第 3部分介绍了基于**值原理和动态规划法研究*系统*控制算法以及*系统*预测控制理论等内容;第4部分首先介绍了*均方实用稳定性的概念及判据,然后重点介绍了带有加性噪声和混合噪声情况下*线性系统开环及闭环稳定性判据和鲁棒控制方法。第5部分着重介绍了*系统*控制的数值解法——非梯度*搜索法。*后一章详细介绍了*系统*状态估计理论及*控制理论分别在惯性导航初始对准、船舶运动航迹估计、弹载被动测量系统距离估计、导弹自寻的制导、航天飞行器再入弹头制导、无线电自动测距仪等方面的应用实例。
本书可作为高等院校自动控制、信息处理、系统工程以及其他相关专业的高年级本科生和研究生教材,也可供从事自动控制、*系统分析、滤波等领域科技工作者和工程技术人员等阅读参考。
目录
第 1章绪论 …………………………… 1
1.1随机系统控制的研究历史与现状
………………………………………………….. 1
1.2随机系统控制的研究内容
…………………………………………………………… 2
1.3随机系统控制的研究方法
…………………………………………………………… 2
1.4内容分布
…………………….. 3
第 2章随机线性系统分析 …………. 5
2.1引言 ……………………………
5
2.2随机线性系统数学模型 …… 5
2.2.1连续时间随机线性系统
………………………………………………………….. 5
2.2.2离散时间随机线性系统
………………………………………………………….. 6
2.3连续时间随机线性系统状态向量概率矩
……………………………………………….. 7
2.3.1问题描述 ……………
7
2.3.2冲激响应函数法 ….. 9
2.3.3概率矩微分方程 ….11
2.3.4状态对有色噪声的响应
………………………………………………………….14
2.4离散时间随机线性系统状态向量概率矩
……………………………………………….15
2.5随机线性系统状态向量分布函数
………………………………………………………..19
2.5.1特征函数计算
………………………………………………………………..19
2.5.2概率密度函数计算 ………………………………………………………………..23
第 3章随机非线性系统分析 ………27
3.1引言
…………………………..27
3.2随机非线性系统数学模型 ..27
3.2.1连续时间随机非线性系统
……………………………………………………….27
3.2.2离散时间随机非线性系统
……………………………………………………….28
3.3随机非线性系统统计线性化
……………………………………………………………..29
3.3.1非线性函数的一般线性化
……………………………………………………….30
3.3.2非线性函数的统计线性化
……………………………………………………….30
3.3.3随机非线性系统统计线性化系统模型
………………………………………..36
3.4随机非线性系统的矩分析 ..37
3.4.1冲激响应法 ………..37
3.4.2逼近概率矩微分方程
……………………………………………………………..38
3.4.3离散时间随机非线性系统状态向量概率矩
…………………………………..41
3.5随机非线性系统的状态向量分布函数
………………………………………………….44
3.6状态向量分布转移函数 …..49
3.7逼近概率特征函数
…………51
3.8逼近概率密度函数
…………57
3.9中心矩及累积量
……………58
第 4章随机线性系统状态估计……61
4.1引言
…………………………..61
4.2连续随机系统卡尔曼滤波 ..61
4.3噪声信号相关时的线性滤波器
…………………………………………………….64
4.4带有有色量测噪声的线性滤波器
………………………………………………….68
4.5带有惯性量测的滤波器
……………………………………………………………..76
4.6线性滤波器的一般形式
……………………………………………………………..78
4.7线性预测
………………79
4.8离散时间随机系统的滤波器
………………………………………………………..80
4.8.1量测噪声为一般白噪声情形
…………………………………………………….80
4.8.2惯性量测情形 ……..83
4.8.3有色噪声情形 ……..85
4.9离散时间随机线性系统预测
………………………………………………………..88
第 5章随机非线性系统估计 ..91
5.1引言
…………………………..91
5.2后验概率
…………………….92
5.3后验概率密度函数方程 …..97
5.4非线性滤波的逼近算法 … 104
5.5高斯逼近法
……………….. 106
5.6条件滤波器 ………….
109
5.7逼近条件滤波器 …… 111
5.8准非线性滤波器 …… 113
5.8.1直接线性化法 …… 113
5.8.2统计线性化法 …… 115
5.9带有不完全确定参数的准非线性滤波器
………………………………………. 116
5.9.1直接线性化法 …… 116
5.9.2统计线性化法 …… 118
5.10非线性无迹滤波 ………..
119
5.10.1无迹变换 ……… 119
5.10.2算法描述 ……… 120
5.11非线性粒子滤波 ………..
122
5.11.1标准粒子滤波算法
…………………………………………………………… 122
5.11.2标准粒子滤波的缺点
……………………………………………………….. 124
5.12非线性高斯和滤波 …….. 126
5.13结构随机跳变系统滤波
……………………………………………………………….. 128
5.13.1带有混合噪声的结构随机跳变系统滤波
………………………………… 128
5.13.2仅带有加性噪声的结构随机跳变系统滤波
…………………………….. 130
5.13.3基于结构随机跳变系统滤波和交互多模型
(IMM)滤波算法比较 … 130
第 6章随机系统控制的一般理论………………………………………………………….
133
6.1引言
………………………… 133
6.1.1问题描述 ………… 133
6.1.2准则 (代价函数)………………………………………………………
134
6.1.3控制方法 …… 137
6.2随机值原理 ………….
140
6.2.1随机系统控制算法
……………………………………………………….. 140
6.2.2短时间控制 …… 142
6.2.3终值控制问题 …… 146
6.2.4小能量控制问题
……………………………………………………………… 151
6.3随机值原理证明 …… 154
6.3.1必要性条件证明 .. 154
6.3.2充分条件的证明 .. 158
6.4随机系统局部控制 … 160
6.5离散随机系统的值原理
…………………………………………………………… 163
6.6离散随机系统动态规划法
………………………………………………………………. 166
6.6.1完全状态信息情形
……………………………………………………………… 167
6.6.2不完全信息情况 .. 172
6.7连续时间随机系统的动态规划
………………………………………………………… 178
6.7.1固定终时情形 …… 178
6.7.2不固定终时情形 .. 183
第 7章随机线性系统控制…. 186
7.1引言
………………………… 186
7.2无控制约束情形 ………….
186
7.2.1问题描述 ………… 186
7.2.2解析综合控制算法
……………………………………………………………… 187
7.3控制受约束情形 ………….
192
7.3.1问题描述 ………… 192
7.3.2逼近解析综合控制算法
……………………………………………………….. 192
7.4连续随机线性系统控制的动态规划法
…………………………………………. 198
7.5离散时间随机系统控制的动态规划法
…………………………………………. 199
7.5.1完全状态信息情况
……………………………………………………………… 199
7.5.2不完全状态信息情况
…………………………………………………………… 204
7.6局部控制
……………. 209
7.6.1控制不受约束情形
……………………………………………………………… 209
7.6.2控制受约束情形 .. 212
第 8章随机非线性系统控制
………………………………………………………………. 214
8.1引言
………………………… 214
8.2值原理
……………….. 214
8.2.1问题提出 ………… 214
8.2.2准控制的解析结构
……………………………………………………….. 215
8.3动态规划法
……………….. 219
8.4局部控制
……………. 222
8.4.1控制不受约束情形
……………………………………………………………… 222
8.4.2控制受约束情形 .. 224
第 9章基于扩展二次型代价函数的控制解析综合 ……………………………………. 225
9.1扩展二次型代价函数 …… 225
9.2固定终时的随机线性系统控制
………………………………………………….. 226
9.3不固定终时随机线性系统控制
………………………………………………….. 232
9.4非线性随机系统的准控制
………………………………………………………… 237
9.4.1固定终时情形 …… 237
9.4.2不固定终时情形 .. 239
9.5有控制约束条件的随机系统控制
……………………………………………….. 240
9.5.1随机线性系统控制
……………………………………………………….. 240
9.5.2随机非线性系统控制
…………………………………………………….. 245
第 10章随机系统预测控制.. 247
10.1引言
………………………. 247
10.2基于灵敏度方程的固定终时预测控制
………………………………………… 247
10.2.1随机线性预测控制
…………………………………………………….. 247
10.2.2固定终时的随机非线性预测控制
…………………………………… 253
10.3基于灵敏度方程的不固定终时随机预测控制
……………………………….. 255
10.3.1随机线性预测控制一般理论
…………………………………………. 255
10.3.2随机非线性预测控制一般理论
……………………………………… 257
10.4随机线性系统状态反馈滚动预测控制
………………………………………… 257
10.4.1随机时不变线性系统预测控制
……………………………………… 258
10.4.2随机时变线性系统预测控制
…………………………………………. 267
10.5随机非线性系统的状态反馈滚动预测控制
………………………………….. 272
10.5.1带有加性噪声的随机非线性预测控制
…………………………………… 272
10.5.2带有混合噪声的随机非线性系统预测控制
…………………………….. 278
10.5.3具有饱和输入约束的随机非线性系统预测控制
……………………….. 284
第 11章随机系统稳定性………… 291
11.1随机稳定性概念 ………..
291
11.1.1随机微分公式 .. 291
11.1.2随机系统稳定性
……………………………………………………………… 292
11.2连续时间随机系统的均方稳定性
……………………………………………………. 293
11.2.1线性 It.o随机系统均方稳定性的充要条件 ………………………………. 294
11.2.2随机定常系统闭环控制系统稳定性分析
………………………………… 296
11.3带有加性噪声的随机线性系统均方实用稳定性判据 ……………………………. 300
11.3.1带有加性噪声的随机系统均方实用稳定性
…………………………….. 300
11.3.2 Peuteman-Aeyels均方实用稳定性定理
………………………………… 302
11.4带有加性噪声的随机线性闭环系统均方实用稳定性及鲁棒控制 ……………… 304
11.4.1预备知识 ……… 304
11.4.2时不变随机线性系统均方实用稳定性及鲁棒控制
……………………. 305
11.4.3带加性噪声随机线性时变系统均方实用稳定性
……………………….. 309
第 12章随机控制系统的参数估计………………………………………………………..
314
12.1参数优化的任务及方法
……………………………………………………………….. 314
12.1.1引言 …………….
314
12.1.2参数优化问题的提出
……………………………………………………….. 314
12.2参数优化的随机搜索法
……………………………………………………………….. 317
12.2.1随机搜索法分类
……………………………………………………………… 317
12.2.2随机逼近法 …… 318
12.2.3带有线性策略的随机搜索法
………………………………………………. 320
12.3非梯度随机搜索法 …….. 322
12.3.1问题提出 ……… 322
12.3.2非自学习搜索法
……………………………………………………………… 324
12.3.3搜索速度 ……… 325
12.3.4自学习搜索过程
……………………………………………………………… 327
12.4非梯度搜索解析算法 ….. 329
12.4.1自学习搜索过程的收敛性
………………………………………………….. 329
12.4.2概率矩分析法 .. 331
12.4.3自学习搜索过程 ………………………………………………………………
334
12.5非梯度随机搜索法在求解中的应用
…………………………………………… 337
12.5.1问题提出 ……… 337
12.5.2非自学习随机搜索法
……………………………………………………….. 339
12.5.3自学习算法 …… 339
12.5.4自学习过程的概率变化
…………………………………………………….. 342
12.5.5自学习搜索结构图
…………………………………………………………… 343
12.6应用实例
………………… 344
12.6.1定常线性系统的参数优化问题
……………………………………………. 344
12.6.2可调电路的结构和参数优化问题
…………………………………………. 348
12.6.3基于非梯度随机搜索的导弹自寻的控制参数优化算法 ………………. 351
12.6.4算法仿真与分析
……………………………………………………………… 355
第 13章随机控制系统应用实例.. 360
13.1惯性导航系统初始状态对准
………………………………………………………….. 360
13.1.1数学模型 ……… 360
13.1.2状态估计应用
…………………………………………………………… 363
13.1.3仿真研究 ……… 367
13.2船舶运动航迹估计 …….. 369
13.2.1系统模型 ……… 369
13.2.2船舶航迹估计
…………………………………………………………… 373
13.3弹载被动测量系统距离估计
………………………………………………………….. 374
13.3.1被动系统距离估计模型
…………………………………………………….. 376
13.3.2基于结构随机跳变滤波理论的被动系统距离估计算法 ………… 377
13.3.3仿真验证 ……… 383
13.4空空导弹自寻的控制
…………………………………………………………….. 384
13.4.1数学模型 ……… 384
13.4.2解析综合算法 .. 387
13.5航天器再入弹头制导律
………………………………………………………….. 394
13.5.1问题描述 ……… 394
13.5.2再入弹头制导律设计
………………………………………………….. 396
13.5.3再入弹头随机制导仿真分析
…………………………………………. 397
13.6无线电测距仪 …….. 399
参考文献 ……………………………….. 403
本书全面介绍了俄罗斯控制专家以及作者和其指导的博士、硕士研究生十余年在此领域的成果,详细讨论了随机系统统计分析、状态估计、控制及参数优化等新的理论和方法。它的特点在于: (1)研究方法独特,例如,使用统计线性化方法求解随机非线性系统的控制问题;同时,侧重于使用值原理,而不像欧美作者仅侧重于使用动态规划法来研究控制问题。
(2)内容新颖,本书许多内容都是近十年来的研究成果,如随机系统预测控制、随机系统稳定性等。
(3)实用性强,如随机系统参数估计就是讨论如何在实际工程应用中获得控制律的参数等。
全书共分 13章,基本内容由 6部分组成。第 2、3章介绍随机系统的统计分析,并着重介绍利用统计线性化方法研究随机非线性系统的统计分析理论。第 4、5章详细介绍了随机线性系统与随机非线性系统的状态估计与预测理论,重点讨论了利用统计线性化方法获得随机非线性系统的准估计算法及条件滤波器设计方法等。第 6~10章介绍了本书的核心内容 ——随机系统控制算法,首先基于随机值原理和动态规划法讨论了随机线性系统与随机非线性系统控制的一般算法;然后,在此基础上更深入地研究了上述两类随机系统的控制的解析结构,为避免求解复杂的微分方程两点边值问题,在第 9章讨论了基于扩展二次型代价函数的随机系统控制算法;在第 10章讨论了随机系统控制的一个新分支 ——随机系统预测控制,此方法不但能预测被控对象的运动轨迹,提高控制效果,同时,既可能避免求解复杂的微分方程的两点边值问题,又能获得控制律的解析式。第 11章介绍了随机系统控制的开、闭环稳定性理论,给出了一系列随机稳定性判据。第 12章主要介绍了随机系统控制的数值方法 ——非梯度随机搜索法,利用前面的方法获得控制律的结构时,可利用非梯度随机搜索法快速有效地获得参数,从而满足实际工程应用中的实时性要求。第 13章介绍了随机系统控制在航空与航天飞行器控制、惯导初始对准、船舶状态估计、红外被动测距系统、无线电测距仪等多领域的应用实例。本书作者从 1995年在西安交通大学攻读博士学位开始就进行非线性系统控制理论、控制等方面的研究,并与他人合作撰写了《非线性系统理论及应用》,在博士后期间还从事非线性系统辨识与滤波器设计等研究,特别是 2001年至 2004年在俄罗斯留学期间,在随机系统分析与随机控制方面进行了深入细致的研究。深入研究了苏联六七位院士和多位博士在随机系统控制方面的成果,并结合本人多年研究工作,于 2005年撰写了《随机系统控制》。但时间已过去十多年,随机系统控制理论与技术有了很大的发展,从事随机系统控制理论与应用研究的科技工作者越来越多,涌现了大量有关随机系统控制理论与应用的研究成果。本书作者及其团队近十多年先后主持了国家自然科学基金项目《随机跳变系统控制理论及其应用基础研究》(编号:60674031)、《近空间飞行器的结构随机跳变控制理论研究》(编号: 60874040)以及国防预研重点基金项目“具有强对抗能力的 XX制导与控制技术”等,取得了一系列有关随机系统非线性状态估计、随机系统稳定性理论、随机系统预测控制及相关应用等研究成果,本书正是在《随机系统控制》一书的基础上进行扩充和修订而成的。首先本书从《随机系统控制》的 12章内容扩充成 13章内容,增加了“随机系统稳定性”章节,并将原书中一些俄文书籍中的通用符号改为适合我国控制领域中的通用符号。其次,对大部分章节进行了扩充,增加了很多的研究成果,具体如下:第 2章“随机线性系统分析”增加了状态对有色噪声的响应章节;第 3章“随机非线性系统分析”增加了单输入非线性随机输入函数统计线性化函数列表;第 5章“随机非线性系统估计”增加了“非线性无迹滤波”“非线性粒子滤波”“非线性高斯和滤波”“结构随机跳变系统滤波”等章节;第 7章“随机线性系统控制”增加分离定理相关内容;第 10章“随机系统预测控制”增加了基于流动状态反馈的随机线性系统和随机非线性系统的预测控制内容;第 11章“随机系统稳定性”是原书没有的,是新增加的内容;第 12章“随机控制系统的参数估计”为原书的第 11章,并充实了应用实例;第 13章“随机控制系统应用实例”为原书的第 12章,增加了“惯性导航系统初始状态对准”“船舶运动航迹估计”“弹载被动测量系统距离估计”“航天器再入弹头制导律” 4个方面的应用实例。由于随机系统控制理论内容丰富,应用广泛,而且本身还在不断的发展中,因此,本书不可能对随机系统控制理论进行全面的介绍。鉴于篇幅限制,本书对随机分布参数系统尚未涉及,只是基于基本的随机系统模型讨论其控制理论。本书矢量和矩阵统一用白体字表示。
致谢
本书在撰写出版过程中,得到了清华大学张贤达教授、西安交通大学韩崇昭教授和西安电子科技大学焦李成教授的支持和帮助,还得到了空军工程大学于雷教授、李学仁教授、魏贤志教授、肖明清教授等的关心和帮助。作者在此向他们表示衷心的感谢。在撰写本书的过程中,作者的研究团队及博士、硕士生们对随机系统控制理论及应用研究做出了积极的贡献,他们还在书稿准备和完成过程中做了大量事务性工作,在此对他们的辛勤工作表示诚挚的谢意。本书引用了一些作者的论著及其研究成果,在此,向他们表示深深的谢意。作者感谢空军工程大学及其航空航天工程学院领导、同仁和清华大学出版社编辑,正是由于他们的大力支持,才能保证本著作按期高质量地出版。作者后还要感谢国家自然科学基金、国防预研重点项目基金、军队 “2110”重点学科实验室建设项目以及空军工程大学航空航天工程学院优势学科基金的资助。由于本书涉及许多新的内容,且作者水平有限,不妥之处在所难免,请读者批评指正。方洋旺 2016年 7月 30日于空军工程大学航空航天工程学院
1.1随机系统控制的研究历史与现状确定性控制系统控制理论是从 20世纪 50年代开始真正发展的,以 1956年苏联数学家庞特利亚金提出的极大值原理 [60]和 1957年贝尔曼提出的动态规划法 [87]为标志。这些理论一开始应用到航空航天领域,然后广泛应用到其他很多领域。而对于随机系统控制理论来说,应从苏联数学家科尔莫戈罗夫 [28]与美国数学家维纳 [98]发展起来的滤波和预测理论开始,它是随机系统控制的一个重要理论基础,具有重大的理论价值。 1960年,卡尔曼和布西提出了求解滤波和预测问题的递推算法 [91, 92],对滤波器和预测理论的发展作出重要贡献 [27, 94];接着,在 1961年约瑟夫和陶提出分离定理 [99],根据此定理,可将线性随机系统分为独立的两部分来求解,一部分是状态估计器,另一部分是求解控制律。同时,还可以证明,随机控制律与确定性控制律相同,这就是所谓的确定性等价原理。进入 20世纪七八十年代,苏联控制论专家普加乔夫在随机非线性系统的估计方面作了大量工作 [68, 69, 70, 95, 71, 72],提出了条件滤波器算法;卡扎科夫利用统计线性化方法 [13, 14, 45, 58, 59, 77, 78]研究了随机非线性系统的控制问题,获得了随机非线性系统准控制算法 [20, 18, 26, 22, 23, 24];柯拉索夫斯基通过研究二次型代价函数与求解控制律之间的关系,提出了扩展二次型代价函数的概念 [31, 32],并通过使用此扩展二次型代价函数,可使求解控制律算法大大简化,避免了求解复杂的微分方程的边值问题,并成功地将其应用到飞行器的控制中 [33, 34];戈拉得科夫深入研究了随机系统控制的数值解法,在利用解析方法求得控制律和状态估计器的结构之后,利用此数值方法,可以确定它们的参数 [7, 8, 22]。这样,就能保证随机系统控制算法在实际应用中满足实时性的要求;此外,随机控制系统在机载无线电测量及导引系统中也获得了广泛的应用 [41]~[44],[46]~[49]。进入 20世纪 90年代,马瑟耶夫根据火控系统的特点,提出了随机系统预测控制理论 [54]~[56],通过研究发现,此理论不但能预测被控对象的运动轨迹,达到控制效果,同时,还避免了在一般随机系统控制中需要求解微分方程的两点边值问题。近年来,基于状态反馈滚动策略,出现了大量有关随机预测控制的研究成果 [151]~[154]。此外,在随机系统稳定性方面,特别是均方使用稳定性研究方面取得一系列重要成果 [164]~[166],[173]~[175]。总体来看,在我国,对于随机系统控制的研究相对较少,在此研究领域作出重要贡献的有陈翰馥 [105]、解学书 [109]、韩崇昭 [107]及蔡尚峰 [103]、郭尚来 [106]、方洋旺 [132, 133, 180]等。随着数字技术和电子计算机的快速发展,人们对随机系统控制提出了更高的要求,需要解决基于更复杂模型的控制问题,例如,模型具有高度非线性 [104, 100, 101, 120, 90]、具有分布参数 [26];或要求随机控制具有自适应性 [3, 24],即自适应随机控制等。这些都是随机系统控制有待进一步深入研究的重要课题。
1.2随机系统控制的研究内容随机系统控制与确定性系统控制不同,前者不但要考虑被控对象所受到的各种随机扰动的影响,还要考虑状态在量测过程中所受到的噪声干扰。因此,随机控制系统的量测量和被控量都是随机过程,从而,随机系统控制除了要研究确定性系统的控制问题之外,还要研究动力学的统计特性与状态变量估计 (滤波 )的问题,具体地说,包括: (1)动力学系统和系统变量的统计特性。由于随机动力学系统的状态和量测 (输出 )向量都受到各种噪声的干扰,因而都是随机过程。要研究随机系统的控制问题,就必须先分析和了解随机动力学系统和系统变量的统计特性,它是研究随机系统控制问题的基础。
(2)状态变量估计 (滤波 )。控制的目的就是要根据所给定的代价函数 (准则 ),求出使此代价函数达到小的状态反馈控制律。而在随机控制系统中,状态向量与测量向量都是随机过程,要获得随机系统的控制律,必须根据测量向量,来对状态向量进行估计,将状态向量中的噪声信号滤掉,得到有用的状态估计向量。
(3)随机系统控制。随机系统控制就是根据给定的代价函数 (准则 ),求出与状态向量估计有关的反馈控制律,使所给定的代价函数的条件数学期望达到小。
此外,系统辨识与参数估计也是随机系统控制不可或缺的内容之一,只有通过系统辨识与参数估计,才能获得系统的结构与参数,从而列出被控对象的数学表达式。这部分内容除用于随机系统控制外,在故障诊断、预测预报等其他领域也有广泛的应用,已作为一个专题被广泛研究。在本书中将不涉及此内容。
1.3随机系统控制的研究方法一般情况下,动态系统的优化问题使用差分法,但是在控制系统中所出现的优化问题与确定调节器的控制律有关,通常不能直接使用差分法求解,主要原因有: (1)控制器及状态向量存在某种限制条件,不能用解析函数来表示。
(2)所使用的代价函数 (准则)可能不具有解析形式。
(3)在随机系统中,过程向量的随机特性将导致代价函数值也是随机的。
基于以上原因,必须构造特殊的算法来求解随机系统的控制问题。对于确定性系统的控制问题,广泛采用的方法就是庞特利亚金的值原理和贝尔曼的动态规划法 [109, 114]。对于随机系统的控制问题,控制论专家基于马尔可夫理论将其推广到随机系统控制中,得到随机值原理与随机动态规划法 [22],从而构成了随机系统控制的现代理论基础。用于求解随机系统控制律及参数的方法不外乎两类:解析方法 [22]与数值方法 [7]。使用解析方法可以找出系统的控制律及系统结构。但是,在确定控制律及结构参数的过程中,需要进行大量的困难的数学计算,而且还必须要求其代价函数具有解析形式。即使上述条件都能得到满足,也不能保证获得精确解,特别是对于非线性系统,终的求解还是要通过使用统计线性化的方法求出它的逼近解 [13, 14]。数值解法是借助计算机来求解系统参数优化的方法。在实际工程中具有非常广泛的应用;此方法不要求代价函数具有解析结构,但是,必须要求首先使用解析算法求出系统控制律及状态估计的解析结构。因此,在随机系统控制中,好将两种方法结合起来使用,在使用解析方法时,可对实际模型及代价函数作必要的简化,求出关于此简化模型的控制律及状态估计的解析结构;然后,利用数值方法求控制律及状态估计的参数。但是,在利用数值方法求解参数时,必须针对实际的复杂系统模型和代价函数,只有这样,才能确保所求的控制律及状态估计的结构与参数。
1.4内容分布全书共分 13章。第 1章绪论,介绍随机控制系统的研究内容与研究方法,同时介绍了随机系统控制的发展历史与现状。第 2章随机线性系统分析,主要讨论连续时间与离散时间线性系统概率矩、状态向量矩、状态向量分布函数等内容,它们都是后续章节要用到的基础知识。第 3章随机非线性系统分析。首先介绍了统计线性化方法,此方法是本书中用于研究非线性系统的主要工具;接着,针对连续时间与离散时间非线性系统模型,介绍了它们的矩分析方法、状态向量分布函数特性、逼近特征函数、逼近概率密度函数、中心矩和累积量等内容。这些内容是后续章节中讨论随机非线性系统估计与控制时要反复用到的内容。第 4章随机线性系统状态估计。首先介绍连续时间与离散时间随机线性系统的卡尔曼滤波算法;然后,根据模型噪声与测量噪声的不同类型及相互关系分别讨论了此模型的线性滤波器算法;后,讨论了带有惯性测量的滤波器设计等。第 5章随机非线性系统估计。介绍了后验概率及后验概率密度函数方程等内容,并根据此方法,讨论了几种特殊情况下的逼近算法,如高斯逼近法等;还讨论了准滤波器及条件滤波器等内容;后介绍了随机非线性状态估计的研究成果,包括无迹滤波、粒子滤波、高斯和滤波以及结构随机跳变滤波等内容。第 6章随机系统控制的一般理论。首先引出随机系统控制的代价函数的定义及介绍各种控制方法等;其次,讨论随机值原理,并利用此原理研究了 3种常见的随机系统控制问题 ——时间短控制、终值控制和小能量控制问题;再次,给出随机值原理的必要条件及充要条件的证明;接着,讨论了随机系统局部控制问题;后,针对系统具有不完全信息和完全信息,使用动态规划法分别讨论了离散时间和连续时间控制的求解算法。第 7章随机线性系统控制。根据控制向量有、无约束情况,分别使用随机值原理和动态规划法来求解控制问题,并给出控制向量的解析表达式。此外,还讨论了随机线性系统的局部控制问题等。第 8章随机非线性系统控制。基于随机值原理与动态规划法讨论了随机非线性系统的准控制问题,并具体给出了准控制的解析结构,同时,还研究了随机非线性系统的局部控制问题。第 9章基于扩展二次型代价函数的控制解析综合。首先给出扩展二次型代价函数的定义;然后,根据此定义,分别讨论了固定与不固定终时的随机线性系统的控制问题,并给出不需要求解微分方程两点边值问题的控制的解析解。后,在控制向量受约束的情况下,给出了基于扩展二次型代价函数的控制向量的解析结构。第 10章随机系统预测控制。详细介绍了经典的和的有关随机系统预测控制方面的内容。部分介绍基于灵敏度方程的随机预测线性和非线性预测控制方法,这其中又包括固定终时和不固定终时情形;第二部分介绍了随机线性系统与随机非线性系统状态反馈滚动的预测控制理论。第 11章随机系统稳定性。首先给出了随机系统均方实用稳定性的定义,并提出了其开环均方实用稳定性判据;然后讨论并证明了带有加性噪声随机线性系统均方实用稳定性的两类判据;后,讨论了带有加性噪声线性闭环系统均方实用稳定性及鲁棒性。第 12章随机控制系统的参数估计。介绍了参数优化的任务及方法以及参数优化的各种随机搜索法。重点讨论了非梯度随机搜索法,包括自学习与非自学习随机搜索法,并研究了自学习搜索过程的收敛性、概率变化特性以及概率矩方法等。第 13章随机控制系统应用实例。详细介绍了两个方面的应用。部分介绍状态估计理论在惯性导航系统初始状态对准、船舶运动航迹估计、弹载被动测量系统距离估计等方面的应用;第二部分介绍随机控制理论在空空导弹自寻的制导律、航天器再入弹头制导律以及无线电测距仪等方向的应用。
第 2章随机线性系统分析
2.1引言由于随机动力学系统的状态和量测 (输出)向量都受到各种噪声的干扰,因而都是随机过程。要研究随机系统的控制问题,就必须先分析和了解随机动力学系统和系统变量的统计特性,它是研究随机系统控制问题的基础 [17, 18, 107, 106]。本章主要讨论连续时间和离散时间随机线性系统的统计特性。全章共分五节。第 2.2节引进本书所要使用的连续时间和离散时间随机线性系统模型以及一些必要的假设;第 2.3节讨论了连续时间随机线性系统状态向量矩,并给出了计算状态向量矩的冲激响应函数法和概率矩微分方程方法;第 2.4节讨论了离散时间随机线性系统状态向量矩,并给出了类似于连续时间情形的状态向量矩计算方法;第 2.5节分析了随机线性系统状态向量的分布特性,给出了它的特征函数和概率密度函数的计算公式。
2.2随机线性系统数学模型 2.2.1连续时间随机线性系统本书所讨论的连续时间随机线性系统的状态模型(方程)一般可以表示为 ˙
X = g(X, X1, u, t),X(t0)= X0 (2.1)式中, t为时间, t0为初始时间, X0为系统的初始状态, X为 n维状态向量, X1为 n维随机输入向量,u为 r维控制向量。假设状态向量可以被测量,它由下列量测方程表示 Y (t)= ξ(X, t) N(t) (2.2)式中, N(t)为连续时间高斯白噪声信号,且均值为 0,强度为 Q(t),记为 N (0,Q(t)δ(t)),在后面的所有章节中,若不另外加以说明,此记号表示相同意思。对式 (2.1)和式 (2.2)进行卡申 (Коши)变换(见第 3章),并使用线性化方法 (包括一般线性化方法或统计线性化方法),则上述模型可以转化为如下较为简单的连续时间随机线性系统的状态模型 ˙X(t)= A(t)X(t) B(t)u(t) V (t),X(t0)= X0 (2.3) Y (t)= C(t)X(t) N(t) (2.4) 上述方程也可以表示为增量的形式,参见文献 [106],由方程和所确定的模型称为线性控制系统的标准形式或称为卡申形式。但在本书中,主要使用上述两种模型。为了研究上述模型,通常作如下假设: (1)假设 V (t)及 N(t)分别为连续时间高斯白噪声 N (0,G(t)δ(t))和 N (0,Q(t)δ(t))。 (2)假设 V (t)与 N(t)以及它们分别与初始状态 X(t0)互不相关,即 E[V (t)XT(t0)] = 0; E[N(t)XT(t0)] = 0; (t > t0) E[V (t1)NT(t2)] = 0,任意t1、t2》 t0 (2.5) (2.6) 式中,E[ ]表示求均值运算,XT表示对任意向量或矩阵 X进行转置运算。 (3)随机初始状态 X(t0)服从高斯分布。 2.2.2 离散时间随机线性系统
离散时间随机系统线性模型通常有两种,即离散时间随机状态模型与受控自回归平移平均模型 (过程 ),英文缩写为 CARMA (Controlled Auto Regressive Moving Average processing)或 ARMA,参见文献 [106, 116],本书主要使用离散时间随机状态模型。离散时间随机状态模型 (过程)的一般形式可表示为 X(k 1) = X(k) g(X(k),X1(k),u(k),k),X(0) = X0, (k =0, 1, 2, ··· ) (2.7)测量方程为 Y (k)= ξ(X(k),k) N(k) (2.8)式中, X0为离散系统的初始状态, X(k)为 n维状态向量序列, X1(k)为 n维随机输入向量序列,u(k)为 r维控制向量序列。 N(k)为零均值且强度为 Q(k)的离散时间高斯白噪声向量序列,记为 N(0,Q(k))。在后面的所有章节中,若不另外加以说明,此记号表示相同意义。而且,假设它与 X1(k)互不相关。类似于连续时间情形,利用卡申变换及线性化方法,可以将上述模型转化为较为简单的离散时间线性随机状态模型 X(k 1) = Φ(k 1,k)X(k) B(k)u(k) V (k) X(0) = X0, (k =0, 1, 2, ··· ) (2.9) Y (k)= C(k)X(k) N(k) (2.10)
式中 , X(k)为 n维状态向量, V (k)为白噪声过程, Φ(k 1,k)为 n×n状态转移矩阵,其余符号同上述一般模型相同。与不含噪声干扰的确定性状态模型类似,状态转移矩阵具有下列性质 Φ(k, k)= I (2.11) Φ(k3,k2)Φ(k2,k1)= Φ(k3,k1) (2.12) Φ.1(k2,k1)= Φ(k1,k2) (2.13) 除此之外,状态转移矩阵还有其他性质,有兴趣的读者可参看文献 [106]。在使用模型即式 (2.9)及式 (2.10)时,常作以下假设:
(1)假设噪声 V (k)及 N(k)分别为独立同分布的高斯白噪声向量序列 N (0,G(k))和 N (0,Q(k))。也就是 E[V (k)] = 0; M[V (k)V T(j)] = G(k)δkj E[N(k)] = 0,M[N(k)NT(j)] = Q(k)δkj
δkj =/ 1,当 j = k时 0,当 j= k时式中,G(k)及 Q(k)为非负定对称矩阵。 (2)假设噪声 V (k)及 N(k)以及它们分别与初始状态 X0相互独立,即
E[V (k)X0T] = 0; E[N(k)X0T] = 0 (2.14) E[V (k)NT(j)] = 0, (.k, j =0, 1, ··· ) (2.15)
(3)假设初始状态 X0服从高斯分布。
由于 X0和 X(k)都服从高斯分布,由式 (2.9)及式 (2.10)知,向量 X(k)及 Y (k)也服从高斯分布。
2.3连续时间随机线性系统状态向量概率矩 2.3.1问题描述随机动力学系统概率分析的基本任务包括两个方面的内容: (1)从被噪声污染的信号中恢复或重新再现有用信号; (2)当被控对象存在振动干扰,并且存在参数量测随机误差时,研究系统的稳定性及控制过程的精确性等。对这些问题的讨论不可避免地涉及关于随机向量 (包括状态向量、输入和输出向量 )的概率分布特性,如:数学期望、协方差函数以及高阶矩等特性的研究。上述所列举的问题对于随机线性系统来说不难解决。在实际应用中,大多数情况下只需要估计随机状态向量的一、二阶概率矩。在对第 1个问题进行讨论时,通常需要对向量的数学期望函数、协方差函数矩阵或协方差矩进行估计,即 mX (t)= E[X(t)] RX (t, t’)= E[(X(t) . mX (t))(X(t’) . mX (t’))T] RX (t, t)= E[(X(t) . mX (t))(X(t) . mX (t))T] := θX (t)
至于第 2个问题,若要对系统控制过程精确性进行估计,就必须讨论系统误差的概率矩,即确定误差向量的数学期望向量及协方差矩。它的误差表示为 E(t)= X(t) . XT(t) (2.16)式中,X(t)为系统的输出向量,XT(t)为理论输出向量。为了给出精度估计,通常使用标量 η作为判别准则,即 η(t)= E[ET(t)E(t)] = tr{E[E(t)ET(t)]} (2.17)若误差向量表示为 E(t)= m二(t) E0(t)式中 m二(t)= mX (t) . mXT (t)为数学期望,E0(t)为中心化随机误差向量。由式 (2.17),得 η(t)= m二T(t)m二(t) tr{θ二(t)} (2.18)式中,θ二(t)为误差向量 E(t)的协方差函数矩阵,即 θ二(t)= E[E0(t)E0T(t)] tr表示矩阵的迹运算,即 tr(θ二(t)) = tr(E[E0(t)E0T(t)]) K= E[E0T(t)E0(t)] = K θ二i二i (t)i=1 显然,tr(θ二(t))为矩阵 E[E0(t)E0T(t)]对角线元素之和。将式 (2.18)写成标量形式,得 ηi(t)= m 2二 (t) θ二i二i (t) (2.19)式中 m二i (t)= mXi (t) . mXTi (t) θ二i二i (t)= θii(t) θTiTi (t) . 2θiTi (t)并且,方差函数阵 θii、θTiTi和协方差函数阵 θiTi分别为 θii(t)= E[X02],θTiTi (t)= E[X0 (t)X0 (t)]iTi Ti θiTi (t)= E[Xi 0(t)XT0 i (t)]注意,在实际应用中,通常使用标准差 √ ηi,即当 m二i (t)=0时,有 √ σ二i = Ji二i (t)= ηiθ二
2.3.2冲激响应函数法考虑随机线性系统即式 (2.3),在本节中,讨论当输入 u(t)=0时的情形。根据线性系统理论,式 (2.3)的解为 [119] lt X(t)= g(t, τ)V (τ)dτ g(t, t0)X0 (2.20)t0 式中,g(t, τ)为状态转移函数矩阵。对式 (2.20)两边取均值,得 lt mX (t)= g(t, τ)mν (τ)dτ g(t, t0)mX0 (2.21)t0 下面,分别计算协方差函数阵及协方差矩。记 l t X0(t)= X(t) . mX (t)= g(t, τ)V 0(τ)dτ g(t, t0)X00 (2.22)t0 式中,V 0(t)及 X00 分别为随机向量 V (t)及 X0的中心化随机向量。因此,有 E[X0(t)] = 0则向量 X0(t)互相关函数阵可表示为 θX = RX (t, t)= E[X0(t)X0T(t)]通过计算,可得 l t l t θX = RX (t, t)= g(t, τ)RV (τ, τ ‘)g T(t, τ)dτdτ ‘ g(t, t0)θX0 g T(t, t0) (2.23)t0 t0 注意到 V 0(t)∈N (0,G(t)δ(t))则有 RV (τ, τ ‘)= G(τ)δ(τ . τ ‘) (2.24)将式 (2.23)代入式 (2.22),得 lt θX = RX (t, t)= g(t, τ)G(τ)g T(t, τ)dτ g(t, t0)θX0 g T(t, t0) (2.25)t0 在许多问题中,只知道数学期望、自相关函数及谱密度函数是不够的。还需要知道更多的概率特性及相关函数矩阵。下面给出互协方差函数阵的计算方法。由互协方差函数阵的定义,得 RX (t, t ‘)= E[X0(t)X0T(t ‘)] = E[E[X0(t)|X0(t ‘)]·X0T(t ‘)] = E[X言0(t)X0T(t ‘)] (2.26)式 (2.26)中的条件数学期望函数由下列方程确定 ˙对式 (2.27)求积分,得X言0 = AX言0 ,X言0(t ‘)= X0(t ‘) (2.27)X言0(t)= g(t, t ‘)I(t . t ‘)X0(t ‘) (2.28)式中,g(t, t ‘)为方程的冲激响应函数。矩阵 I(t . t ‘)为 . I,当 t》 t ‘时 I(t . t ‘)= .0,时. 当 tt的情形,将式 (2.29)中的 t、t ‘分别用 t ‘、t替换,并使用等式 g(t, t ‘)= g T(t ‘ ,t)得 RX (t, t ‘)= θX (t)g T(t, t ‘)I(t ‘ . t),t ‘》 t (2.30)对于所有关于 t、t ‘的区域,必须对式 (2.29)和式 (2.30)进行对称化处理,这样就可获得所有关于 t、t ‘区域的函数。 RX (t, t ‘)= g(t, t ‘)θX (t ‘)I(t . t ‘) θX (t)g T(t, t ‘)I(t ‘ . t) (2.31)由于 1 g(t, t)= I(t),I(t . t)= I2 故,当 t ‘ = t时,有 RX (t, t)= θX (t)由以上分析可知,要计算互协方差函数阵 RX (t, t ‘),首先应计算方差函数阵 θX (t),然后利用式 (2.30),可求出互协方差函数阵。
评论
还没有评论。