欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

纳什博弈论的原理与应用

科普小知识2022-07-31 11:10:22
...

纳什在1950年和1951年发表的两篇关于非合作博弈论的重要论文彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在,即著名的纳什均衡。这揭示了博弈均衡和经济均衡之间的内在联系。纳什的研究奠定了现代非合作博弈论的基石,随后的博弈论研究基本遵循这一主线。然而,纳什天才的发现被冯·诺伊曼断然拒绝,他以前被爱因斯坦拒绝过。然而,他挑战权威和蔑视权威的天性使纳什坚持自己的观点,并最终成为大师。如果不是30多年的严重精神折磨,恐怕他早就站在诺贝尔奖的领奖台上了,也绝不会与他人分享这一荣誉。

纳什是一位非常有天赋的数学家,他的主要贡献是在1950年至1951年在普林斯顿攻读博士学位时做出的。然而,他的天才发现非合作博弈的均衡,即“纳什均衡”,并不是一帆风顺的。

1948年,纳什去普林斯顿大学攻读数学博士学位。那年他不到20岁。那时,普林斯顿是一个杰出人才和大师的地方。爱因斯坦、冯·诺依曼、列夫塞斯(数学系系主任)、阿尔伯特·塔克、阿伦佐·车臣、哈罗德·库恩、诺曼·斯汀·罗兹、精灵·福克斯等。都在这里。博弈论主要是由冯·诺伊曼(1903-1957)建立的。他是出生在匈牙利的天才数学家。他不仅创立了经济博弈论,还发明了计算机。早在20世纪初,策梅洛、博雷尔和冯·诺依曼就开始研究博弈论的精确数学表达式。直到1939年,冯·诺依曼遇到了经济学家奥斯卡·莫根施特恩,并与他合作,博弈论才进入经济学的广阔领域。

1944年,他与奥斯卡·摩根斯坦合著的巨著《博弈论与经济行为》出版,标志着现代系统博弈论的初步形成。虽然对游戏本质问题的研究可以追溯到19世纪甚至更早。例如,在1838年古诺的简单双头游戏;伯特兰在1883年和埃奇沃斯在1925年研究了两个寡头的产量和价格垄断。2000多年前,中国著名军事家孙武的后代孙膑用博弈论帮助田忌赢得了这场赛马。所有这些都是早期博弈论的种子。它们的特点是零星分散的研究,极有可能且不系统。冯·诺伊曼和摩根·斯特恩在《博弈论与经济行为》一书中提出的标准、扩展和合作博弈模型解的概念和分析方法为这一学科奠定了理论基础。合作游戏在20世纪50年代达到顶峰。然而,诺依曼博弈论的局限性日益暴露。由于过于抽象,其应用范围受到很大限制。长期以来,人们对博弈论的研究知之甚少,这只是少数数学家的专利,因此其影响有限。正是在这个时候,非合作博弈——“纳什均衡”应运而生,标志着博弈论新时代的开始!纳什不是一个循序渐进的学生。他经常旷课。他的同学回忆说,他们不记得什么时候和纳什上过必修课,但纳什认为他们至少从斯汀·罗兹那里学过代数拓扑学。斯汀·罗德斯正是这门学科的创始人,但是纳什认为这门课程如果没有几节课就不适合他的口味。所以,他又离开了。然而,纳什毕竟是一个具有杰出天赋的非凡人物。他涉足数学王国的每一个分支,如拓扑学、代数几何、逻辑学、博弈论等等,并深深地被它迷住了。纳什经常表现出他与众不同的自信和自负,充满了侵略性的学术野心。纳什在1950年整个夏天忙于应付紧张的考试,他的博弈论研究工作被中断了。他觉得这是极大的浪费。然而,这种暂时的“放弃”在潜意识的持续思考下逐渐形成了清晰的思路,并突然激发了许多原本模糊、混乱和无组织的想法。今年10月,他感到天赋和梦想突然激增。最令人眼花缭乱的亮点之一是非合作博弈均衡的概念,这在未来将被称为“纳什均衡”。纳什的主要学术贡献反映在1950年和1951年的两篇论文中(包括一篇博士论文)。直到1950年,他才把自己的研究成果写成一篇名为《非合作博弈》的长篇博士论文,这篇论文于1950年11月发表在《国家科学院月报》上,立即引起了轰动。说到这,一切都取决于大卫·盖尔兄弟。就在被冯·诺依曼轻视的几天后,他遇到了盖尔,并告诉他,他已经把冯·诺依曼的“极小极大解”推进到非合作博弈领域,并找到了一个广义的方法和平衡点。盖尔仔细听着。他终于意识到纳什的思想,比冯·诺依曼的合作博弈理论,能够更好地反映真实情况,并对其严谨而优雅的数学证明印象深刻。盖尔建议他把它整理出来并立即出版,以免被其他人超越。纳什,一个初出茅庐的男孩,不知道竞争的险恶本质,也从未想过要这么做。结果,盖尔作为他的“代理人”为他起草了一份给科学院的短信,而主席列夫·萨尔茨则亲自将手稿提交给科学院。纳什只写了几篇文章,但那已经足够了,因为它们都是最好的。这也值得深思。在中国,教授被要求在“核心期刊”上发表许多文章。根据这个标准,纳什可能不合格。

1996年诺贝尔经济学奖得主莫里斯在牛津埃奇沃思大学担任经济学教授时,没有发表任何文章。特殊人才必须有特殊的选拔方法。

纳什在大学时开始学习纯数学博弈论,并于1948年顺利进入普林斯顿大学。在他20岁出头的时候,他成为了世界著名的数学家。尤其在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他著名的纳什均衡概念在非合作博弈理论中起着核心作用。后来的研究者对博弈论的贡献都是基于这个概念。纳什均衡的提出和不断完善,为博弈论在经济学、管理学、社会学、政治学、军事科学等领域的广泛应用奠定了坚实的理论基础。

囚犯的困境

达利理论中的小故事

要理解纳什的贡献,我们首先必须知道什么是非合作博弈的问题。几乎所有的博弈论教科书现在都有“囚徒困境”的例子,而且每本书里的例子都是一样的。

毕竟,博弈论是数学,更准确地说,是运筹学的一个分支。当谈论经典和理论时,数学语言自然是不可或缺的。门外汉似乎只是一大堆数学公式。幸运的是,博弈论关注的是日常经济生活中的问题,所以它不能脱离现实。事实上,这一理论是从国际象棋、扑克和战争等具有竞争、对抗和决策性质的问题中借用来的术语。这听起来有点神秘,但实际上它有重要的现实意义。博弈论大师将经济和社会问题视为象棋游戏,游戏中往往蕴含着深刻的真理。因此,从日常生活中普通人的琐事开始,以我们身边的故事为例,并不无聊。一天,一个富人在家中被杀,他的财产被盗。在破案过程中,警方抓获了两名嫌疑人,斯卡菲和纳克,并从受害者家中找到了丢失的财产。然而,他们否认曾杀过人,称他们首先发现富人被杀,然后偷了东西。所以警察把他们分开,放在不同的房间里审问。地方检察官单独和每个人交谈。检察官说,“既然有确凿的证据证明你盗窃,你可以被判一年。不过,我可以和你做个交易。如果你只承认谋杀罪,我只会判你三个月监禁,但你的搭档会被判十年监禁。如果你拒绝承认并被你的伴侣举报,你将被判处十年监禁,而他只会被判处三个月监禁。但是,如果你们俩都认罪,那么你们俩都将被判处五年徒刑。”斯卡菲和纳克斯应该怎么做?他们面临着两难的境地——坦白还是否认。显然,最好的策略是双方都否认这一点。因此,每个人将只被判处一年。然而,由于两者是孤立的,他们不能勾结。因此,根据亚当·斯密的理论,每个人都从自身利益出发,选择坦白作为最佳策略。因为坦白可以预期三个月的短期监禁,但前提是伴侣否认,这显然比10年监禁要好。这种策略是以牺牲他人利益为代价的。不仅如此,忏悔还有更多的优势。如果对方承认并否认,他将不得不入狱10年。这不是一笔好交易!因此,在这种情况下,一个人还是应该选择坦白。即使两个人同时认罪,他们最多只能被判5年,这比判10年要好。因此,对这两个人来说,合理的选择是坦白,而原本对双方都有利的策略(否认)和结果(一年的判决)将不会出现。这样,两人都选择了坦诚的策略,5年刑期的结果被称为“纳什均衡”,也称为非合作均衡。这是因为各方在选择策略时没有“串通”。他们只选择最适合自己的策略,而没有考虑社会福利或任何其他对手的利益。换句话说,这种策略组合是由所有参与者(也称为当事人和参与者)的最佳策略组合组成的。没有人会为了获得更大的利益而主动改变策略。“囚徒困境”具有广泛而深刻的意义。个人理性和集体理性的冲突导致了“纳什均衡”,对所有人都不利。他们两人在忏悔和否认的策略中都首先想到自己,因此他们注定要服长期徒刑。只有当他们首先想到对方,或相互合谋(共谋),他们才能获得最短的监禁时间。“纳什均衡”首先挑战亚当·斯密的“看不见的手”原则。根据史密斯的理论,在市场经济中,每个人都从自身利益出发,最终整个社会都实现了利他效应。让我们回顾一下这位睿智的经济学家在《国富论》中的名言:“通过追求(个人)私利,他常常比他实际想要的更有效地促进社会利益。”从“纳什均衡”我们得出了“看不见的手”原则的一个悖论:从利己目的出发,结果是伤害他人而不是利己,既不是利己也不是对他不利。这是两个囚犯的命运。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,我们也可以从“纳什均衡”中认识到一个真理:合作是一种有益的“自利战略”。但它必须符合以下黄金律原则:以你希望别人对待你的方式对待别人,但前提是他们也这样做。中国人是这么说的:“对别人做你不想对自己做的事”。但前提是人们不想对我做。其次,“纳什均衡”是非合作博弈均衡。事实上,不合作比合作更常见。因此,“纳什均衡”是冯·诺依曼和摩根·斯特恩合作博弈理论的重大发展,甚至是一场革命。

从纳什均衡的普遍意义上,我们可以深刻理解经济、社会、政治、国防、管理和日常生活中常见的博弈现象。我们将举出许多类似“囚徒困境”的例子。如价格战、军事竞争、污染等。一般的游戏问题由三个要素组成:玩家,也称为一组当事人,参与者,策略等。、策略以及每对玩家做出的一系列选择和回报。其中,所谓的胜利是指如果选择了特定的战略关系,人们在每一轮中获得的效用。所有的游戏问题都会遇到这三个因素。

价格战游戏:

现在我们经常会遇到各种各样的家电价格战、彩电战、冰箱战、空调战、微波炉战...这些战争的受益者首先是消费者。每当看到一场家电价格战,老百姓就会“无事偷乐”。在这里,我们可以解释说,制造商价格战的结束也是一个“纳什均衡”,而价格战的结果是没有人能赚钱。因为游戏双方的利润完全为零。竞争的结果是稳定的,即“纳什均衡”。这一结果可能对消费者有利,但对制造商却是灾难性的。因此,价格战意味着制造商的自杀。从这个案例中,我们可以引出两个问题。一个是竞争性降价或“纳什均衡”的结果可能导致有效的零利润结果。第二,如果不采用价格战,敌对博弈的结果会是什么?每个企业都会考虑是采用正常价格策略还是高价格策略来形成垄断价格,并尽最大努力获取垄断利润。如果垄断能够形成,博弈双方的共同利润是最大的。这种情况是由垄断经营造成的,通常会抬高价格。另一个极端的情况是,双方都能以正常价格获利。从这一点出发,我们制定了一个基本原则:“把你自己的战略建立在你的对手会以他的最佳利益行事的假设上。”事实上,完全竞争的均衡是“纳什均衡”或非合作博弈均衡。在这种状态下,每个制造商或消费者根据所有其他人设定的价格做出决定。在这种均衡中,每个企业应最大化其利润,消费者应最大化其效用,结果是零利润,即价格等于边际成本。在完全竞争条件下,非合作行为导致预期的经济效率。如果制造商采取合作行动,并决定转向垄断价格,社会的经济效率将被摧毁。这就是为什么世贸组织和各国*应该加强反垄断措施。

污染游戏:

如果市场经济存在污染,但*不控制环境,企业宁愿牺牲环境,也不愿自愿增加环保设备的投资,以实现利润最大化。根据看不见的手的原理,所有企业都会从自私的目的出发,采取忽视环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他目的出发,投资于污染控制,而其他企业仍然忽视环境污染,企业的生产成本就会增加,价格就会上涨,其产品就没有竞争力,甚至企业就会破产。这是一个“看不见的手,有效的完全竞争机制”失败的例子。直到20世纪90年代中期,中国乡镇企业的盲目发展导致了严重的污染。只有*加强污染控制,企业才会采取低污染战略组合。在这种情况下,企业将获得与高污染一样的利润,但环境会更好。

贸易*和壁垒;

这个问题对刚刚加入世贸组织的中国尤为重要。任何国家在国际贸易中都面临着维护贸易*和实施贸易保护主义的两难境地。贸易*和壁垒问题也是一个“纳什均衡”。这种均衡是贸易双方之间的一种非合作博弈策略,它会因贸易战而对双方造成损害。如果x国试图对y国实施进口贸易限制,比如提高关税,y国将不可避免地进行报复并提高关税。结果,没有人从中受益。相反,如果X和Y能达成合作均衡,即从互利原则出发,双方将减少关税限制。因此,每个人都将从贸易*中获得最大利益,全球贸易的总利益也将增加。