对偶控制理论
对偶控制理论(dual control theory)是控制理论的一个分支,常用在控制初始特性不明的系统。名为对偶是因为控制系统有以下二个目的:
- 动作(Action):依现有的资讯,尽可能的控制此系统。
- 调试(Investigatio):以此系统进行测试,以了解此系统,并设法在未来可以控制的更好。
这二个目的有时会互相冲突。
对偶控制理论是Alexander Aronovich Fel'dbaum在1960年代发展的。他证明了可以用动态规划找到最佳控制法则,但在实际上是不可行的。因此发展了许多设计亚最佳(Suboptimal)对偶控制器的方法。
例子
以汽车来举例,若有人要开一部新车,希望可以又便宜又平顺的到达目的地,但又想知道汽车的加速性能、方向盘及刹车的情形,以便知道如何驾驶这部车,这情形下会依此目的有一些测试性的驾驶行为。同様的,对偶控制会在系统中加入所谓探测性的信号,可能会影响短期的特性,但收集到的资料可能会对长期的特性有帮助。
参考资料
- Feldbaum, A.A. Dual control theory, Part I. Automation and Remote Control. April 1961, 21 (9): 874–880 [September 1960 (in Russian, pp. 1240–1249)].
- Feldbaum, A.A. Dual control theory, Part II. Automation and Remote Control. May 1961, 21 (11): 1033–1039 [November 1960 (in Russian, pp. 1453–1464)].
- Wittenmark, B. Adaptive Dual Control (PDF). Lund University. [2015-12-11]. (原始内容 (Seminar handout)存档于2015-09-23).
- Wittenmark, B. Adaptive Dual Control Methods: An Overview. Lund University. CiteSeerX: 10.1.1.25.7446 .