“人狮搏斗”中的控制论思想
意大利古罗马斗兽场挤满了人,人声鼎沸。这里正在进行一场人与狮子之间的残酷竞争。我看见“百兽之王”大吼一声,带着狂奔,直奔角斗士们而去,而那个强壮有力的年轻人却敏捷地闪开了...奴隶主们看着这惊心动魄的一幕,不禁大声叫喊,或者得意忘形,或者后悔不已。原来,他们正在进行一场奇怪的赌博,并下了相当大的赌注。
在狮子和奴隶之间的这场生死搏斗中,狮子总是想尽快抓住他的对手,吃一顿美餐,而男人则试图逃脱以求和平。这是一场激动人心的战斗。然而,谁能想到在这一事件背后有一个深刻简单的博弈论思想呢?
在当今的世界文明中,拿活人和残忍的狮子搏斗取乐是不可思议的,但在古罗马的奴隶制社会中却很常见。如果你读过小说《斯巴达克斯》,你不会感到惊讶。
对抗双方应该利用自己的聪明才智,充分发挥自己的优势,充分利用对方的弱点,选择最佳策略,最终击败对方。博弈论是一门运用数学观点和方法来研究一方是否存在击败另一方的最优策略,以及如何在竞争或斗争中制定最优策略的科学。自古以来,中国称这种活动为下棋和纸牌游戏,博弈论也被称为博弈论。
博弈论的相互思想可以追溯到公元前几个世纪。赛马的故事在中国古代的田忌已经成为众所周知的对策的例子。这个故事给了我们这样一个启示:只要策略得当,实力不是取胜的唯一因素。这也深刻反映了反措施的极端重要性。
尽管博弈论有着悠久的历史,但在1944年数学家冯·诺伊曼和经济学家摩根·斯坦所著的《博弈论与经济行为》一书出版后,它真正成为了一门独立的学科。这本书被认为是博弈论发展的里程碑。冯·诺依曼不仅创立了博弈论,而且还是电子计算机的创始人。自1946年以来,电子计算机的发明和应用大大简化了博弈论中复杂的计算,从而使博弈论不再只是一句空话。20世纪60年代,博弈论和最优控制相互渗透,使得博弈论发展迅速。
在博弈论发展的基础上,美国的艾萨克斯博士通过深入研究军事中的追击和逃跑问题,开创了微分对策的研究工作,并提出了一种新的策略——微分对策理论,即双方可以*地做出追击和逃跑的决策。
各种对策一般都有三个基本要素:(1)内部人。具有决策权的参与对策的各方称为内部人。游戏中的玩家可以理解为个人(如狮子和奴隶、王琦和田吉等。)或作为集体(如参加比赛的团队)。从人与自然斗争的角度来看,我们也可以把自然看作一个游戏者,把那些与游戏者有相同得失的参与者看作一个游戏者。(2)策略集。在对策的过程中,每个参与者可以采取的方案称为参与者的策略。一个玩家可能采用的所有策略被称为他的策略集。(3)损益函数。游戏结束后,每个玩家都有自己的得失。它与每个玩家所采取的策略有关,所以被称为得失函数。
只有两个玩家被称为两个玩家,三个以上的玩家被称为多个玩家。在两人游戏中,如果赢家的收益是输家的损失,并且收益和损失的总和为零,那么这种游戏被称为两人零和游戏。现实生活中的许多问题可以归结为两人零和博弈问题,如人与狮子的争斗、田忌的赛马以及各种跟踪问题。如果对策中各方的得失之和大于零,即互助合作,则对策称为合作对策。
博弈论被广泛应用,尤其是作为新一代更复杂的微分博弈论。由于它与控制理论,特别是最优控制理论有着密切的联系,它已经能够解决许多实际问题,并被广泛应用于军事部署、自动控制、海洋捕捞、农业防灾、贸易竞争、外交谈判、疾病治疗和各种体育比赛。进入20世纪70年代后,博弈论进一步发展。例如,模糊数学是数学的一个新发展的分支,也已经应用于博弈论。借助模糊数学,可以开辟博弈论研究的新领域,探讨模糊条件下的对策,如周围环境、对策、合作关系等。
不用说,博弈论,尤其是微分博弈论,毕竟还是一门年轻的科学。其理论和应用在广度和深度上都存在许多问题,有待广大有识之士去培养、探索和探索。我相信在不久的将来,越来越多美丽的花朵将在这片博弈论的土地上绽放。