描述
开 本: 32开纸 张: 轻型纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787544181846
⊙ 学点儿博弈论,在竞争中保护自己
如果你不想在竞争中受到伤害,那就用博弈论武装自己!
⊙ 学点儿博弈论,识破事态格局
别人还在当局者迷,你早已看破真相!
⊙ 学点儿博弈论,掌握先发优势
是竞争,也是合作。博弈论让你化被动为主动,掌控人生的节奏!
本书是“博弈论之父”冯·诺依曼的代表作,囊括了迄今为止除演化博弈之外的所有博弈论的理论和方法,代表了博弈论发展的高阶水平。
《博弈论》一书既包含了博弈数学理论的细致说明,又包含了该理论多方面的应用与实践。书中用丰富详实的案例,介绍了零和博弈、三人博弈、混合策略、囚徒困境等经典的博弈理论,每个博弈案例背后,都有一个可以运用的策略帮你解决人生难题。
怎样找到合适的合伙人?怎样合理分配利益达到各方均衡?怎样在变幻莫测的局势中,摸清对手的意图?《博弈论》将带领读者走进博弈的赛局中,开始一场特殊的“博弈”之旅。
前言
博弈论的思想在古代便产生了,只是它在初期仅研究象棋、赌博中的一些胜负问题,并未形成专业的理论系统。当时的人们对于博弈的认识只停留在经验的认知和积累上,并未形成专业的理论基础,正式成为一门学科则是在20世纪初期。
20世纪20年代末期,约翰·冯·诺依曼正式证明了博弈的基础原理,在此基础上宣告博弈论诞生,因此,冯·诺依曼被称为“博弈论之父”。再到20世纪40年代中期,一本跨越时代的巨著《博弈论与经济行为》问世,而作者正是冯·诺依曼和摩根斯坦。这两位卓越的数学家经过不断研究,终将初的二人博弈理论推广到了n人博弈理论,还将博弈论成功应用到经济领域,他们奠定了博弈论的基础和理论体系。
“假设现在有人能够让博弈行为接近野蛮,或者让人类之间的友善行为和凶残行为之间的差距无限大,那么谁就更容易在博弈中取胜。”这是《博弈圣经》中提到的一段话。
提起博弈论,便需要说起“孤独的天才”——约翰·纳什,他更是博弈论的天才。约翰·纳什在20世纪中期正式发表了一篇论文——《n人博弈的均衡点》,对博弈论起到了良好的推动作用。除此之外,哈桑尼与赛尔顿对博弈论的研究和贡献,也为博弈论的发展起到了催化作用。再到《博弈圣经》问世,它与原有的博弈论有着极大的区别,的差异在于《博弈圣经》中论述了博弈的文化理论,突出表现了人类博弈占据的优势。
事实上,《博弈圣经》的优点是,它能够将原有的博弈理论正式应用到现实中,还能帮助普通大众通过自身的学习和研究成为博弈的真正高手。它还能将博弈论应用到政治、经济、文化等多个领域,对于个人的生活和发展也能起到促进和推动作用。
简单来说,博弈的基本构成要素分为决策人、对抗者、生物亲序、局中人、策略、得失、次序。所谓决策人,指的是在博弈的赛局中率先做出选择的一方,决策人往往会根据自己的经验、自身在对局中的感受、自身的状态等,率先做出一种具有方向性的选择。
在二人博弈对局中的对抗者,往往是选择滞后的那个人,需要做出与决策人的行为相反的选择,而且这个对抗者不仅选择落后,连行为与动作也是落后的,而且他的选择几乎是默认的、被动的,但是这将成为他后的优势。简单说,他所做的选择极有可能是基于决策者选择中的劣势而做出的,由此一来,便具有了空间优势,这样看来对抗者便成了二人博弈中占优的一方。
所谓生物亲序,从字面理解,就是生物会主动寻找有序的一种亲近行为。由于自然界的所有生物,当它们处在陌生、恶劣、未知环境中时,它们会发挥出主动寻找规律和有序环境的本能。同理,在博弈对局中,所有的参与者都会自发地产生寻找或者等待有序的亲近行为。
我们知道一场竞赛会由参与者组成,而在博弈中,这些有决策权力的参与者,则被称为博弈赛局中的一个局中人;若在博弈中有两个局中人,那么便称为“两人博弈”;若在博弈中有多个局中人,则称为“多人博弈”。
当我们参加较为正规的比赛时,在遵守规则的前提下,还会为自己制订一定的计划或者策略,帮助自己取胜,博弈亦是如此。在一场博弈赛局中,任意一个局中人都会制订自己在实际情况中所要施行的计划或者策略,简单来说,局中人的方案与计划并不只是针对某一个阶段,而是针对整个对局过程,即任何一个局中人的能够贯穿整个赛局的可行计划被称为一个局中人的策略。假设在一个博弈赛局中,局中人的策略是有限的,便称其为“有限博弈”,相反则称为“无限博弈”。
在博弈赛局中,结果无非胜负两种,这种结果便是博弈中的得失。任何一个局中人在博弈中的终得失,都与局中人的决策密切相关,甚至还与全局中的人所做出的一组决策密不可分。因此,每场博弈中的局中人的终得失,都由全部的局中人做出的一组策略的函数决定,这组函数便是通常意义上的支付函数。
比赛次序有先后,博弈策略亦是如此。博弈中的决策方在一个赛局中需要做出多次决策,此时便会出现决策的次序问题。在此过程中,只有决策的次序是不同的,但是其他要素是相同的,而后出现的是不同的博弈结果。
根据不同的标准产生了不同的博弈种类。我们可以将其大致分为两类,即通常意义上的合作博弈和非合作博弈。二者的差别在于参与博弈的人并没有达成一个相对具有约束力的协议。假设有协议可以参照,便是“合作博弈”;反之,则是“非合作博弈”。
若以时间顺序为基准,博弈论可以分为两类:静态博弈和动态博弈。前者是指在博弈中,所有的参与者共同选择或者非同时做出选择,但是所有的后参与者对此并不知情,即后参与者不知道初的参与者做出了怎样的决策和实际行动。后者是指在博弈中,所有的参与者采取的具体行动有先后之分,而且后来加入的参与者能够非常清晰地看到前面的参与者的具体行动。
简言之,“囚徒困境”属于静态博弈,而棋牌类的博弈,或者那些行动、决策有先后的博弈则是“动态博弈”。事实上,博弈论根据不同的基准还有不同的分类,在此列举较为基础的几种。本书《博弈论》将带领读者走进博弈的赛局中,开始一场特殊的“博弈”之旅。
译者序
策略博弈论,我们通常将它称为博弈论,有些时候也会用“竞赛论”或者“对策论”来表示。但是,只有博弈论更符合原意,因为它能够更好地表达出此理论所要探究的基本概念和相关问题,同时,它是在近十几年间逐渐发展起来的,还是运筹学的主要组成部分,本书是博理博弈论的经典著作。
约翰·冯·诺依曼的这本思想史上的经典之作已经问世20年之久。本书《博弈论》不仅是成千上万读者的审美享受,还支撑着约翰·冯·诺依曼之后的研究者。与此同时,《博弈论》还直接推动了个人概率、统计决策、运筹学等诸多问题的研究进程。实际上,这本经典著作在各个领域都产生了一定的影响。
为了让读者能够更加直观地看到博弈中的逻辑推理,冯·诺依曼先构造出一个概念,其包含了所有参与者的策略选择。通俗意义上说,一个参与者的一个策略选择就是一套简单的行动法则,同时是提供给这个参与者所有可能情况下的行动指导。假设任意一名参与者需要遵循给定的各种策略,那么博弈的整个过程可以说是已知的,显而易见所有参与博弈的人在博弈结束时,能够获得的收益其实是确定的。
按照作者约翰·冯·诺依曼的观点,博弈论的方法是适合研究经济方面的问题的数学方法。尽管博弈论的提出没有能够帮助作者完成解决经济问题的任务,但这一数学理论的提出与建立仍然是具有里程碑意义的。因为博弈论研究的是斗争,因此,在无数的斗争场景中,都有可能通过使用博弈论来解决相关的技术问题。例如人对自然财富的索取,人对自然灾害的抵抗,人对于未知领域的探索,以及军事上的斗争,等等。博弈论可以使人们在有限的条件和既定的要求下,从繁多的数量关系里寻找出适宜、效的解决方案。
约翰·冯·诺依曼创作《博弈论》的初衷是推动经济学理论的革命,但是它在很长一段时间内没有完成这个伟大的目标。不过,在它的影响下,人们发起了对整个时代经济学理论的质疑。从这一方面来看,《博弈论》确实是天才之作,因此它必将被世人永远铭记。
经济学在未来是什么样子的?这在《博弈论》中已经予以回答。它必将是充满数学符号的。对不少人来说,《博弈论》更像一部希腊文著作,只有当我们理解它超过理解一种文化时,我们才能真正读懂它。或者,如果说《博弈论》是贝多芬的一部乐曲,那么还需要懂乐谱的人才能理解它。对于音盲来说,再好的音乐也无异于噪音。《博弈论》中好的工具是数学,如果有人对数学一无所知,那么他很难进入现代科学的大门,或迈入现代哲学的世界,这无疑是令人遗憾的。数学不同于街头俗论,它关系着许多方面的思维能力。一般来说,拥有数学潜力的孩子往往具有更好的语言和逻辑能力。
能否理解博弈论可以作为衡量21世纪文化人的标准。约翰·冯·诺依曼在《博弈论》中对多人博弈和个体化问题进行了区分,并指出了两者的主要差异。例如,研究一个典型的化问题:如何用周长1英里的篱笆围出的面积?对于这个问题,我们只需要利用代数或微积分知识便可给出答案。若缩小范围,只允许在三角形中做选择,那么等边三角形要比其他三角形更优;若只允许在四边形中做选择,那么正方形是的答案。若在所有正多边形中做选择,那么边数越多越接近解。而如果没有边数限制,用周长1英里的篱笆围出的面积,圆形无疑是选择。
而在多人博弈中,比如当两个理性头脑为了一个目标而产生冲突的时候,终的答案总是会同时依赖于两者的决定,所以这时的形势与个人化问题的形势便不再相同。两个人一起玩井字棋时,如果甲方先行,且行棋方式完全正确,那么乙方将永远无法击败他;同样,若乙方先行,且行棋方式完全正确,那么甲方也永远无法击败他。这种博弈的方式是随机的,它的解也是随机的。
如果两个人一起玩向圆桌上放硬币的游戏:双方轮流向桌子上放硬币,率先放不下硬币的人就算失败。在这个博弈中,若A是先行者,他便可以用这样的策略获胜,即首先将一枚硬币放在桌子的正中央,接着每当对方放下一枚硬币,就在与之对称的位置上放上一枚硬币,这样一来,他便永远不会输。所以谁后放谁就会输。这是一个完美的信息博弈,只要知道谁先谁后就能知道谁赢谁输。
同样,象棋也是一个完美信息博弈,它与上面两种博弈一样简单。若两个计算能力完美的人一起下象棋,那么只会有三种可能:一是先行者必胜,二是后行者必胜,三是平局。初看之下,我们并不知道终的结局究竟属于哪一个,但只要我们反向推导,就能推算出这一博弈结局与开始信息的关系。象棋的这种简单属性可由博弈论予以证明。
在大多数人看来,猜硬币与下象棋一样都是简单的博弈。但实际上,猜硬币并非人们想象的那样简单。如果一个人要想与另一个人保持一样,他就会在对方选择正面时跟着选择正面,在对方选择背面时跟着选择背面。但是,如果他一开始就知道对方准备选择正面,好胜心就会驱使他去选择背面,而若对方选择的是背面,他就会毅然选择正面。这就形成了一个无法跳出的循环。
约翰·冯·诺依曼在处理这个无限循环问题时表现出了自己的天赋。在他看来,不让别人知道你的秘密的前提是,你自己也不知道;在投掷硬币的时候,你只需要以正反面来决定你的行动,这样一来,在这个随意策略中,即使你的对手始终保持着理性,并能提前知晓你的策略,他也不可能以超过半数的概率战胜你。
约翰·冯·诺依曼给我们呈现的是一个二人零和博弈。他用这个经典的博弈向我们证明了他的理论:参与这个零和博弈的人都试图使自己的利益化,于是他们都想尽可能地使对方的利益小化,因为只有这样才能化自己的利益。
要判断一条铁链的强度,我们首先要知道它弱的一环,要判断一个木桶能盛多少水,首先要知道它的短板在哪里。在坏的情况下,可能获得的收益取决于脆弱的一点。这个时候,参与者只需采用一种随机策略,就能在坏的情况下化自己的收益。这一意义深远的定理可以在扑克牌游戏中显露其冰山一角:我们在玩扑克牌时常常会见到虚张声势的对手,甚至我们自己有时为了赢得后的胜利,也会采取虚张声势的策略。我们发现一旦有人虚张声势就意味着他可能有一手差牌,而那些不动声色的人则很可能拿到一手好牌。如果你的对手为了化自己的收益采取了随机策略,那么你在面对这样的对手时有一个的虚张声势率可以确保使你的利益化。这种情况也出现在考试中,一个老师在为学生出考试题时会随机从教科书中抽取内容,这样一来,学生就需要复习整本教科书才能保证自己考到的分数。
除了简单的两人零和博弈外,其他博弈中的理论更加复杂,也更加具有不确定性。比如,赛马、股票交易、国际谈判等多参与者形式的博弈会存在更多的可能性。或许博弈论会给我们的生活带来许多助益,但是是否有人愿意用博弈论来决定自己孩子的未来呢?比如,一场手术可能让你生病的孩子完全治愈,也可能使他出现生命危险。这个时候,你是否还会以博弈论来给出终的判断呢?对于这样的问题,人们可能会永久地争论下去,因为它直到现在仍没有答案。或许有人会说这是个哲学问题,所以不能用数学来予以解决。但是,在博弈论面前,如果你没有规划和尺度,你甚至无法成为它的观众。
《博弈论》一书既包含了博弈数学理论的细致说明,又包含了该理论多方面的应用与实践。博弈数学理论于1928年开始发展和出版,它主要应用于博弈本身以及经济学和社会学问题。约翰·冯·诺依曼也希望用数学方法来研究这些问题。
如果想要应用博弈论,我们至少要在所研究的简单博弈中印证这个理论,随着约翰·冯·诺依曼研究的深入,其中的相互关系表现得愈加明显。不过,对约翰·冯·诺依曼来说,博弈论的终归宿应该在经济学和社会学上。他从一些简单博弈问题深入浅出地阐述了这个理论,尽管这些问题不如实际问题复杂,但它们都具有根本性和代表性,利用它们可以进一步证明:不管是平行利益问题和相反利益问题、完全信息问题和不完全信息问题,还是自由合理的决定、机会影响问题,等等,都能够用一个精确的方法来加以解决。
你真的会打扑克吗?——“叫价”的艺术
我们在前面的研究中多次强调指出,让博弈中的两个局中人的策略选择相等,是零和二人博弈中简单的一种方式。在这种博弈中,局中人的策略选择被称为纯策略。事实上我们不应该用这个名称,用“着”来表示似乎并没有显得太夸张。而且,在上面已经讲到的问题中,它们之间存在的广阔形式和正规化之间似乎没有任何明显的区别。因此,在这些类型的博弈中,我们会将“着”和策略等同起来,而这些原本就属于正规化的形式特征。但是我们现在将对一个广阔形式的博弈进行探究,这类博弈中的局中人有若干个“着”,而且这些“着”能够更直观地向正规化的形式和策略进行过渡。
扑克本身具有很多规则,正是这些技术性的规则才避免了赛局中的局中人进行无限次的加叫,保证叫价的次数是有限的。参与扑克博弈的双方,都会自动避免不现实的叫高价,为了避免对手在叫价的过程中出现超人意料的叫价,所以在每局博弈中,都规定了一个叫价的数值。除此之外,还规定不能出现过小的叫价,这种规定保证了博弈顺利进行。
在实际进行扑克博弈时,参与赛局中的任意一个人率先叫价,紧接着剩下的局中人进行轮流叫价。在这种博弈过程中,所包含的有利因素和不利因素自身就是一个非常有趣的问题。而且扑克本身是一个比较复杂的博弈,但是为了方便研究叫价和加叫次数的限制,我们将其进行简化。
扑克自身就具有一种不对称性,正是受到这种因素的影响,所以希望在研究的过程中不受这种情况的干扰,这样便能够研究出扑克在简单的形式下的主要特征。基于此,我们假设参与博弈赛局的两个局中人,在博弈进行中都会根据自己的选择开叫,而且他们不知道另一个局中人做何决策,当这两个局中人分别选择完自己的叫价后,才让对方知道自己的叫价结果,简单说就是让对手知道自己的叫价究竟是“高”还是“低”。
在此基础上,我们再对此种扑克博弈进行简化:假设我们规定参与赛局的每个人都只有两种决策权,即“不看牌”和“看牌”。这就意味着,在进行此次博弈时,排除了“加叫”这种决策。简言之,“加叫”只是在用一种更加巧妙和激烈的方式来达成局中人的某种意图,只是早在其中的一个局中人进行高叫价的时候,便能展现出他的这种意图。由于我们想要更加直白、明了地看待扑克博弈的问题,所以要尽可能避免使用多种意图来表示此次博弈中的一种意图。
参照上面的方式,我们设定下面这些条件:除了赛局中的参与者不让对方知道自己的真实意图外,还要考虑到其中的一个局中人的决策被对方知道的情况。试想,当参与扑克博弈的局中人的叫价同为“高”或者同为“低”时,便需要两个参与者将自己手上的牌同时摊开,比较它们的大小。这时,某个局中人手上如果握有强牌,那么他将获得对方手上的数额;假设双方手上握有的牌大小相同,那么便不需要其中的一方进行支付。
除此之外,当其中的一个局中人选择了“高”的叫价,而另一个人选择了“低”叫价时,那么选择“低”叫价的一方便会有两种选择,即选择“不看牌”或者“看牌”。此时,当“低”叫价的一方选择“不看牌”时,而且在不考虑到手上的牌的强弱的前提下,便意味着他将付给对方自己低叫价的数值;当“低”叫价的一方选择“看牌”时,那就意味着他的选择发生了改变,即由“低”叫价变成了“高”叫价,针对这种情况的处理方式便会和初都选择“高”叫价时一样。
我们再次对扑克的技术性规则进行讨论:在扑克博弈中,我们为了避免局中人会没有限制地加叫,便规定了局中人叫价次数是有限的,这便是终止规则。为了避免不切实际的叫高价发生,因为这对于对手而言将会产生不可预料的后果,所以在博弈赛局中规定了叫价以及加叫的一个上限数值,同时通常情况下,还会规定禁止过小的加叫。因此,我们将会给予叫价和加叫一个限制性的条件,我们在博弈进行前,就设定两个数目,a和b,而且让a>b>0。
同时,我们还规定博弈中的局中人的每次叫价,即要么叫价“高”,要么叫价“低”。在这种情况下,我们将前者定义为a,后者定义为b。叫价高低之间的比值是此次博弈中有联系,并且会发生变化的因素。
假设在进行扑克博弈的过程中,a与b的比值明显比1大,那么这就说明博弈的风险和冒险性极高;相反地,若是a与b的比值仅仅比1大一点,那么这就意味着此次博弈较为安全。
现在,我们将叫价和加价的次数限制对整个博弈过程进行简化。实际上,在日常生活中进行扑克游戏时,其中的一个局中人率先开始叫价,之后局中人开始轮流叫价。
由于在扑克博弈中,其中的一个局中人拥有次叫加权,同时他也要个做出行动。这时,不仅有有利因素,还有不利因素,这自身就是一个非常有趣的问题。我们已经对扑克不对称形式进行过讨论,而且这个问题占有一定地位。只是我们在初研究这个问题时,希望能够避开这个带有困扰性的问题。换言之,我们避免在此博弈中研究所有的不对称情况。由此一来,我们将会得到扑克博弈的纯粹、简单的形式下的重要特征。
为此,我们可以在进行扑克博弈前假设,赛局中的每个局中人都拥有自己的开叫,而且每个局中人在博弈中并不知道其他局中人的选择,当博弈的双方都做出自己的叫价后,其中一个局中人的选择才被另一个局中人得知,即让每个局中人清楚另外一个局中人的选择,这时才知道对手的叫价究竟是“高”还是“低”。
除此之外,我们还能对此种博弈进行简化:我们提供给赛局中的局中人两种选择,一种是选择“看牌”,另一种是选择“不看”。这就意味着,我们在进行此次扑克博弈时,并没有“加叫”这个选择。“加叫”在某种程度上只是局中人巧妙、强烈地表达自己的某种意图的方式,尤其是在一个高开叫价的博弈局中,更明显地表达出了这种意图。我们的研究目的是希望问题能够变得简单,所以会尽可能地避开这些用不同方式表达同种意图的情况。
根据上面的这些前提条件,我们对此做出下面的规定:当两个局中人所做出的选择被对方得知时,假设两个人都选择了“高”的叫价,或者同时选择了“低”的叫价,此时两个局中人手上的牌必须摊开,那么手上拥有较强牌的局中人,将从他的对手那里获得a或者b的数额。假设这两个局中人手上所拥有的牌是相等的,那么双方不需要进行支付。
除此之外,还有另外一种情况,当其中的一个局中人选择了叫“高”价,而另外一个局中人选择了叫“低”价。这时,选择了叫“低”价的人拥有两个选择,即选择“不看”或者选择“看牌”。当另外一个局中人选择了“不看”之后,在不考虑两手牌的强弱的情形下,他将支付给对手低价的数额;若他选择了“看牌”,则表示他的选择发生了改变——由叫“低”价转换成了叫“高”价。而对这种情况的处理方式,则与两个局中人都选择叫“高”价时一样。
我们对于上面提到的简化版的扑克博弈规则加以总结:参与博弈赛局的每个局中人,能够通过一个“机会的着”获得他的一“手”牌;然后,每个局中人可以通过一个“人的着”对a、b进行选择,简单说就是选择叫“高”价还是叫“低”价;后,赛局中的每个局中人都了解了另外一个局中人的选择,但是他并不知道他手上的牌,即双方都知道自己手中的一手牌以及自己的选择。假设其中的一个局中人在博弈中选择了叫“高”价,而另外一个局中人的选择是叫“低”价,那么后者将会拥有两种选择,即“看牌”或者“不看”。
这是一场博弈赛局的过程,当一场赛局结束时,他们的支付方式如何呢?假设两个局中人同时选择了叫“高”价,或者一个局中人选择叫“高”价,而另外一个局中人选择叫“低”价,并且在后来还选择了“看牌”,那么前一个局中人将从后一个局中人那里获得三个数额,即a、0、-a;假设两个局中人都选择了叫“低”价,那么前一个局中人将从后一个局中人那里获得三个数额,即b、0、-b;假设另外一个局中人选择了叫“低”价,并且在后来选择了“不看”,那么,“人的着”属于选择了叫“低”价的人。
评论
还没有评论。