博弈生存

　博弈生存
再版前言
人是行动的动物，因而是策略选择的动物。我们每天的所见所闻无时不体现出人行为的策略选择性。
社会中的每个人都在努力用自己的理性选择策略来达到自己的生存目的。这也是研究多个理性人互动决策
的博弈论能够用于解释社会现象的原因。掌握了博弈论的理论，我们就能自觉地用它来分析我们所见到的
社会现象。我们熟知的是，革命导师马克思、恩格斯在《共产党宣言》中号召无产阶级起来革命，他们豪迈
地宣称：“让统治阶级在共产主义革命面前发抖吧！无产者在这个革命中失去的只是锁链，他们获得的
将是整个世界！”如果
用博弈论术语来分析，革命导师是在告诉无产者：“革命”行动与“不革命”行动相比，“革命”是“
占优的”行动策略；“革命”将使无产者失去锁链并得到整个世界，而如果“不革命”，无产者仍然是
一无所有的奴隶！
　　当然，博弈论有它的局限。在某些博弈中，人的实际行为不完全符合博弈论的理论结果(实验经济学
力图用实验来验证博弈论的演绎结果)，它们之间的偏差有一些不能用理性的有界性来解释，这使人们怀
疑博弈论的理性人假设是否能够站得住脚。许多哲学家认为人是自由的，而博弈论专家假定人是理性的。
人是自由的还是受理性法则所支配？如果人是理性的，那么他便不是自由的。理性人假设下的人是一个“
机械装置”。一个博弈是多个这样的装置的互动：对于某个博弈参与人来说，如果给定他的策略空间、目
标函数以及博弈参与人的个数、信息分布等，他能够确定自己的最优策略，或者至少能够排除掉某些策略。
此时人便不是自由的———理性的行为选择预设了某个正确的行动方向，而自由是不预设任何方向的。理
性法则规定无产者必须选择“革命”，而无产者作为自由的主体，尽管他知道“革命”的结果优于“不
革命”的结果，也完全可以不选择“革命”，如果他愿意做奴隶的话。
　　物理学是不完美的，这并不妨碍我们用它来观察和解释我们周围的世界，博弈论的局限也并不妨碍
我们用它来分析和解释社会现象。《博弈生存》是一本深受读者欢迎的博弈论普及读本，自出版以来在全国
许多书店(包括网上书店)长期位于畅销书排行榜之上，其畅销程度是本人写作时所未能料及的。本书的读
者群体非常广泛，从中学生到大学教授，其中大多数读者是大学生。许多读者来信或来电，与本人探讨书
中涉及博弈论的问题，并提出一些建设性的意见……本人对读者的厚爱表示感谢。
　　鉴于《博弈生存》一书引起的广泛关注，以及博弈论本身的重要意义，本人决定对原来的版本进行修
订。最新的版本对第一版的部分章节作了修改和删减，纠正了第一版中的错误和不确切之处。同时，增加
了“诸葛亮、周瑜的掌中之‘火’”和“将军的困境”两小节，以及新的一章———“公平分配可能吗？
”，并且补充了附录———论述纳什均衡定义和纳什均衡存在定理。本书力图通过比较浅显的例子普及博
弈论的知识和方法，阐发博弈论的思想，为普及博弈论作出绵薄之贡献，因而修订版仍保持科普风格。如
果读者想借用博弈论工具进行学术研究或解决实际问题，请查阅有关的博弈论学术著作。
　　感谢中央编译出版社领导、编辑和发行人员，尤其是贾宇琰编辑，感谢他们为本书的出版和发行所付
出的辛勤劳动。
　　潘天群
　　2004 年 8 月于南京
导言：失火了，你往哪个门跑 (1)

失火了，你往哪个门跑——这就是博弈论
　　一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无
法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要
争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如
果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？
　　这就是博弈论！
　　你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，
不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个
博弈（game）。
　　上述博弈是一个叫张翼成的中国人在 1997 年提出的一个博弈论模型，被称之为少数者博弈或少数派
博弈（Minority Game）。当然，原来的博弈形式不是这么简单，这里我把它简化了，我们在第三部分论
述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。
　　生活中博弈的案例很多，你会见到很多例子。只要涉及到人群的互动，就有博弈。
　　什么叫博弈？博弈的英文为 game，我们一般将它翻译成“游戏”。而在西方，game 的意义不同于汉
语中的游戏。在英语中，game 即是人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥
林匹克运动会叫 Olympic Games。在英文中，game 有竞赛的意思，进行 game 的人是很认真的，不同于汉语
中游戏的概念。在汉语中，游戏有儿戏的味道。因此将关于 game 的理论，即 game theory 翻译成博弈论或
者对策论，是恰当的。本书下面统称 game theory 为博弈论。
　　博弈论的出现只有 50 多年的历史。博弈论的开创者为诺意曼与摩根斯坦，他们 1944 年出版了《博弈论
与经济行为》。诺意曼是著名的数学家，他同时对计算机的发明作出了巨大贡献，他去世时博弈论还未对
经济学产生广泛影响，否则经济学的诺贝尔奖肯定有他的名字，因为诺贝尔奖有规定，只颁发给在世的
学者。谈到博弈论，不能忽略博弈论天才纳什（John Nash）。纳什的开创性论文《n 人博弈的均衡点》
（1950）、《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一
个较完善的学科。
　　博弈论对于社会科学有着重要的意义，它正成为社会科学研究范式中的一种核心工具，以至于我们
可称博弈论是“社会科学的数学”，或者说是关于社会的数学。从理论上讲，博弈论是研究理性的行动者
（agents）相互作用的形式理论，而实际上它正深入到经济学、政治学、社会学等等，被各门社会科学所
应用。甚至有学者声称要用博弈论重新改写经济学。1994 年经济学诺贝尔奖颁发给三位博弈论专家：纳什、
塞尔屯(R.Selten)、哈桑尼（J.Harsanyi），而像 1985 年获得诺贝尔奖的公共选择学派的领导者布坎南，
1995 年获得诺贝尔奖的理性主义学派的领袖卢卡斯（Lukas），其理论与博弈论都有着较深的联系。现在
博弈论正渗透到各门社会科学，更重要的是它正深刻地改变着人们的思维。二、博弈论能解释所有社会现
象吗？
　　社会由不同的人群的集合体所构成。不同的人群集合体形成不同的结构，一个结构中的群体之间的相
互作用（interactions）就构成一个博弈。这个博弈是广义上的。社会中有不同的文化，人类有文明、道德，
如果说文明、文化、道德是宏观的社会现象，那么还存在着微观的社会现象，如：群体为什么有合作又有
不合作？为什么人群之间或集团之间有“威胁”或“承诺”？这些都是博弈论研究的对象。本书下面将努
力用博弈论的基本思想来解释社会中的这些现象。
　　博弈论对人的基本假定是：人是理性的（rational）。所谓理性的人是指行动者具有推理能力，在具
体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的人之间如何进行策略选择的。
　　博弈论力图在这个最简单的假定下得到丰富的结论，正如我们下面所看到的，它确实做到了。博弈论
专家的这种做法如同物理学家对自然的假定一样。大家知道，物理学家往往假定几个最基本的假设，这最
基本的假设构成公设，其余的结论由它们推得，如爱因斯坦的狭义相对论只有两条假设：（1）物理定律
在所有参考系中不变；（2）在所有参考系中光速保持常数。多么简单的公设！在这两个公设下得出了惊
奇的结论，如运动的参照系中尺子收缩，时钟变慢，等等。相对论的这两条公设改变了物理学的整个构架，
也改变了人们对自然的整个看法！
　　博弈论当然不是关于自然的，它是关于社会的，它不能构成人们对自然看法的革命。博弈论的假定是
非常简单的，它能得出令人惊奇的结论吗？它能改变人们关于社会的看法吗？——这些是伟大科学的要
求！我们将发现，博弈论确实如此！
本书力图用“科学的”方法来解读社会现象。经济学是对社会现象进行研究的科学，社会学、政治学
等等也都是社会科学。然而今天经济学已成了帝国主义，它的领域没有疆界。不仅仅经济行为是它的研究
领域，它的研究范围是“经济的”行为，在经济学家看来人类的几乎所有社会行为都是“经济的”。这里
我们用“经济的”等同于“理性的”，也就是“计算的”，理性的人即是计算的人。
导言：失火了，你往哪个门跑 (2)
　本书的写作方式是科普式的（popular science）。提到的理论有时缺少来龙去脉的交代，也未对博
弈论作系统的论述，如读者对所涉及的理论感兴趣，请查找有关的书籍或资料。
　　这里讲一个小小的插曲。在与朋友聊博弈论时，他随意说了一句话给我启发很深。他说，中国人研究
其他学问难说，但研究博弈论是有优势的。这句话是褒义，也是贬义。说它是
褒义，是因为中国古代有很多这方面的著述与实践，春秋战国时期七国争雄，其实也是谋士之间的角逐，
而罗贯中的《三国演义》在今天看来就是一部博弈论教材！无论是兵书如《孙子兵法》、
《三十六计》，还是现
代流行的所谓“商战策略”、“公共关系”以及所谓“厚黑学”都是关于如何赢得与人交往的胜利的，或
者说如何获取成功的。说它是贬义，是因为，中国人走关系、相互算计是出了名的，中国人对博弈论有天
生的了解。正如中国人常说的“事事洞明皆学问，人情练达即文章”，即是说人与人之间的关系、社会交
往均是学问。而中国很多“做人”的道理，道出了如何在人与人的博弈中获取成功，如：在任何场合下都
不要得罪人，不要锋芒毕露（如“枪打出头鸟”），等等。不过，在中国文化传统中，人与人之间的所谓
关系并不像西方那样是科学，而更像一门艺术。
　　本书下面将尝试着用博弈论解读人类的社会行动或集体行动——这里的社会行动或集体行动意指互
动的人群集合体。读者将发现，原本复杂的人类社会的行动是容易得到理解的，并且会发现其中蕴藏着的
一些道理。
本书是解释社会现象的，其中的方法、理论与事例许多是经济学中的，然而本书不完全是经济学的。
如果是经济学的，必须是用完善的经济学理论来阐述和分析确定的研究对象，必须讲“供给”、“需求”、
“价格”、“效用”、“边际”等概念及原理，否则是对读者不负责的。本书力图用科学的方法，即对各种
社会现象作出解释。当然经济学也是科学的，但是经济学已经形成固定的研究程式。我们这里只是告诉读
者许多现象背后的东西。本书有些地方是哲学的，有的地方是逻辑的。我想说的是，我们所看到的社会现
象其背后有着深刻的科学道理——本人认为这些现象的背后是理性和逻辑。如果本书能给读者带来一些启
发，本人就满意了。
基本术语 (1)
前面已经指出，博弈论研究的对象是理性的行动者或参与者如何选择策略或如何作出行动的决定。理性的
人是对现实的人的基本假定，即假定参与者努力用自己的推理能力使自己的目标最大化。“理性的”与“
道德的”不是一回事，理性的与道德的有时会发生冲突，但是理性的人不一定是不道德的。我们在第八章
会阐述理性的人怎么会产生道德的行为。
　　博弈涉及哪些内容呢？
　　第一，博弈涉及至少两个独立的博弈参与者（player）。
　　每个参与者通过采取行动，努力使自己的效用或利益最大化。但是，他的行动的好处或支付的获得取
决于另外的参与者。下文有时将参与者称为行动者。
　　“囚徒博弈”或“囚徒困境”是一个被广泛谈论和研究的博弈。两个共同作案偷窃的小偷被带进警察
局单独关押，如果一方与警方合作，招认并供出自己与对方以前所做违法之事，而对方不招认，招认方
将不受重刑，无罪释放，另一方则会被判重刑 10 年；如果双方都与警方合作共同招认，各被判刑 5 年；
而如果双方均不承认有罪，因警察找不到其他证明他们以前违法的证据，则只能对他们的小偷行为进行
惩戒，各判刑 3 个月。这两个小偷如何作出选择？
　　在这个囚徒困境中，囚徒的最后结果——是当场释放还是被判刑（10 年、5 年、3 个月），不仅取决于
该囚徒的决定，而且还取决于另外一个囚徒的决定。
　　而在买卖的交换行为中，买东西的人要尽量以低的价格买到，但是他是否能买到取决于卖者是否能
卖；卖东西的人尽量想以高的价格将东西卖出去，但价格太高，买者不接受，因此卖东西的人能否将物
品卖出去取决于买者。
　　第二，博弈涉及行动者存在着策略（strategy）选择的可能，博弈论用策略空间来表示参与者可以
选择的策略。
　　赤壁一战，曹兵大败，曹操落荒而逃，在选择是走通往华容道的小路，还是选择大路时，他面临着
在两个策略之间进行选择。囚徒困境中的小偷面临着“不招认”还是“招认”的选择。每个参与者从策略
空间中选取他的策略，如果没有选择的可能，理性的人是无法作出计算的，对自己的目标也就无能为力。
从这个意义上来讲，我国改革开放走向市场经济，就是使得每个经济主体发挥其理性的作用，使之发挥
主动性，而在计划经济下则没有可选择的余地。
　　第三，参与者在不同策略组合下会得到一定的支付（payoff）。
　　我们往往用支付矩阵来表示参与者在各种策略组合下的支付，有时用函数来表示。囚徒困境的支付矩
阵为：
　　甲乙不招认招认不招认各判刑 3 个月乙：判刑 10 年，
　　甲：当场释放招认甲：判刑 10 年
　　乙：当场释放各判刑 5 年我们再来分析一交易过程的支付矩阵。在一卖主甲和一买主乙之间的“买—
卖”博弈中——这是一讨价还价过程，假定通过讨价还价后确定了一价格。在此价格下，卖者卖成后获得
的效用为 6，卖不成的效用为 0；买者买成的效用为 4，买不成的效用为 0。而如果他们之间的交易不成功，
无论是买主还是卖主都要等待和进行讨价还价，假定等待和讨价还价的成本均为 1，则支付矩阵为：
　　乙甲买成买不成卖成(6，4)(5，0)卖不成(0，3)(0，0)
　　第四，对于博弈参与者来说，存在着一博弈结果。
　　所谓结果是参与者最终对策略的选择造成的确定性的支付。如在曹操败走华容道的博弈中，诸葛亮在
“埋伏大路”与“埋伏通往华容道的小路”之间进行选择，而曹操在“走大路”和“走通往华容道的小
路”之间进行选择。在这个博弈中，双方猜测对方的行为，看谁猜得准。博弈的最终结果是，诸葛亮派关
羽埋伏在通往华容道的小路，而曹操选择走小路，被诸葛亮抓住。这就是曹操与诸葛亮之间的博弈的结果。
　　第五，博弈涉及均衡。
　　均衡是经济学中的重要概念。那么什么是均衡，它的含义是什么？
　　均衡即是平衡的意思，在英文中是 equilibrium。在经济学中，均衡意即相关量处于稳定值。在供求关
系中，如果在某一商品市场的某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能将商品
卖出去，此时我们就说，该商品的供求达到了均衡。此时的价格可称之为均衡价格，产量可称之为均衡产
量。均衡分析是经济学中的重要分析。
　　那么什么是博弈论的均衡呢？所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一种结果，但不
是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。
　　纳什均衡是一种最常见的均衡。它的含义是：在对方策略确定的情况下，每个参与者的策略是最好的，
此时没有人愿意先改变或主动改变自己的策略。
　　在上面的“买—卖”的博弈中，（卖出，买进）是一纳什均衡，这个博弈可以解释为什么在现实中
讨价还价后买卖能做成，因为这对双方来说都是最优选择。同时在“买—卖”博弈中，其均衡对双方来说
是全局最优的。
　　第六，重要的均衡——纳什均衡。
纳什均衡（Nash Equilibrium）是博弈分析中的重要概念。1950 年身为研究生的纳什写了一篇论文—
—《n 人博弈的均衡问题》，该文只有短短一页纸，可就是这短短一页纸成了博弈论的经典文献。在这篇论
文中，纳什给出了博弈均衡的定义，这样的均衡被人们称之为纳什均衡。
基本术语 (2)
那么什么是纳什均衡呢？简单说就是，一策略组合中，所有的参与者面临这样的一种情况：当其他
人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什
均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。
　　在囚徒困境中存在惟一的纳什均衡点，即两个囚犯均选择“招认”，这是一稳定的结果。
　　有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”（或称性别之战）中有两个纳什均衡点。丈夫
帕特和妻子克里斯商量晚上的活动。丈夫喜欢看拳击，而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜
晚，双方的支付矩阵如下：
　　丈夫妻子歌剧拳击歌剧(2，1)(0，0)拳击(0，0)(1，2)
　　在这个“夫妻博弈”中有两个纳什均衡点：（歌剧，歌剧），（拳击，拳击）。在有两个或两个以上
纳什均衡点的博弈中，其最后结果难以预测。在“夫妻博弈”中，我们无法知道，最后结果是一同欣赏歌
剧还是一起去看拳击。
　　是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点——所谓纯策略是指参与者
在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略（mixed strategy）均衡点——所谓混
合策略是指参与者采取的不是惟一的策略，而是其策略空间上的一种概率分布。这就是纳什于 1950 年证
明了的纳什定理。我们下面将在“警察与小偷的故事”例子中给出混合策略的说明。
　　我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达了纳什均衡含义：给定你的
策略，我的策略是最好的策略；给定我的策略，你的策略也是你最好的策略。这就是说，双方在对方的策
略下自己现有的策略是最好的策略。即：此时双方在对方给定的策略下不愿意调整自己的策略。这里的策
略包括混合策略。
　　纳什均衡是博弈论中的重要概念，同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一
句幽默的话：你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词：供给与需求。博弈论
专家坎多瑞（Kandori）引申说：要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是“纳什
均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大，对其他社会科学
意义同样重大。我在书后的附录中用数学语言给出了纳什均衡及纳什均衡存在定理。
博弈的类型
根据参与者能否形成约束性的协议，以便集体行动，博弈可分为合作性博弈和非合作性博弈。纳什等博弈
论专家研究得更多的是非合作性博弈。
　　所谓合作性博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟，其结果对联
盟方均有利；而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活
动就是合作性的博弈，而囚徒困境以及在第八章讨论的公共资源悲剧都是非合作性的博弈。
　　博弈又分静态博弈和动态博弈。静态博弈指参与者同时采取行动，或者尽管参与者行动的采取有先后
顺序，但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指参与者的行动有先后顺序，并
且后采取行动的人可以知道先采取行动的人所采取的行动。
　　从知识的拥有程度来看，博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。完
全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有“完全的了解”，否则是不完全信
息博弈。严格地讲，完全信息博弈是指参与者的策略空间及策略组合下的支付，是博弈中所有参与者的“
公共知识”的博弈。对于不完全信息博弈，参与者所做的是努力使自己的期望支付或期望效用最大化。
　　这只是对博弈论的简单介绍。关于其中的详细内容，读者需参阅有关书籍。
博弈案例 (1)
1 囚徒博弈与我国应试教育的困境
　　囚徒困境可以用来说明许多现象。我国目前的应试教育就是一个囚徒困境。
　　囚徒博弈是完全信息下的静态博弈，两个小偷各种策略组合下的支付是他们之间的“公共知识”
（我们在下一章中将讨论什么是“公共知识”）。
　　我们上面已经分析了囚徒对局下各个策略下的结果或支付，以及它的均衡。它的均衡是双方均选择“
招认”的策略。
　　可以这么说，最近 10 多年来，我国基础教育的问题是如何摆脱应试教育的困境问题。目前给中小学
生“减负”不仅是学生家长的呼声，也是教育专家和教育管理部门的呼声，也可以说是全社会的呼声。教
育管理部门这几年做了一系列的工作，但收效甚微，并没有从根本上解决问题。学校不断给学生增加负担
是目前教育的实际状况。
　　大家普遍认为应试教育是扼杀学生的创造性，无论是专家还是家长，都在呼吁改变应试教育的模式。
但是无论是专家，还是意识到教育问题的普通老百姓以及没有意识到教育问题的老百姓，其小孩都在接
受着这种教育。
　　在现有的教育体制下，学生（或学生家长）有两个可选择的策略：“减负”和“增负”。学生的精力
是有限的，如果选择“减负”策略，意味着学生有更多的时间学习课本以外的东西，这样学生的素质得
到提高，因此，“减负”策略往往与素质教育联系在一起；而如果选择“增负”策略，则意味着学生花
大量的时间做大量的习题，以“学透”、“学精”课本规定的东西，此时，学生没有时间学习课本以外的
没有规定的内容。“减负”的结果是学生的全面发展；而“增负”的结果是学生获得高的分数。
　　在这样的博弈结构下，学生（或学生家长）如何选择呢？每个学生这样想：其他人采取的是“增负
”教育策略的话，如果我采取“减负”教育策略，我的考试分数不如他人，在求学方面我会落后，接受
不了好的教育，在未来求职时我也赶不上他人。在他人采取“增负”的策略下，我也应当采取“增负”策
略。如果其他人采取的是“减负”策略，我应当采取什么策略呢？还是应当采取“增负”策略！因为，如
果其他人采取的是“减负”策略的话，如果我采取的是“增负”策略，我的考试分数会比其他人高，我
会上好的学校，在未来的职业竞争中我会处于优势。因此，无论其他人采取的是什么策略，我采取“增负
”策略都是最好的。当每个学生都这样想的时候，全社会便进入了应试教育这样一个囚徒困境之中。
　　如果我国现有的考试制度没有改变，现在假设所有的学生都选择“减负”策略，即除了做少量的巩
固性的作业外，不补课、不做其他的练习题，情况会是什么样子？
　　假设这种状态会出现，我们说，这种状态会很快消失，而立即会出现所有学生都进入“增负”的这
样一个状态。可以说，均选择“减负”策略的状态是不稳定的，而“增负”的状态是稳定的均衡。原因就
是，目前的教育的博弈结构规定了各种行动或行为的收益或好处：获得高分的会进入好的初中、高中，进
入好的初中、高中的学生可以考高分进入好的大学。在这个博弈中，对于教师来说，学生的升学率高意味
着其成绩大、奖金高，对自己的学生采取“增负”策略，对于自己而言是占优策略。
　　我国基础教育的博弈与囚徒困境有共同的结构，大家均选择“增负”策略构成基础教育博弈的纳什
均衡。纳什均衡是一个稳定的博弈结果，这也是为什么我国目前的应试教育难以改变的原因。
　　2．斗鸡博弈与古巴的导弹危机
　　试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一是退下来，一是进攻。如果一方退下来，而
对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来，双方则打个平手；如果自
己没退下来，而对方退下来，自己则胜利，对方则失败；如果两只公鸡都前进，那么则两败俱伤。因此，
对每只公鸡来说，最好的结果是，对方退下来，而自己不退。支付矩阵如下：
　　鸡乙鸡甲前进后退前进(-2，-2)(1，-1)后退(-1，1)(-1，-1)
　　上表中的数字的意思是：两者如果均选择“前进”，结果是两败俱伤，两者均获得-2 的支付；如果
一方“前进”，另外一方“后退”，前进的公鸡获得 1 的支付，赢得了面子，而后退的公鸡获得-1 的支
付，输掉了面子，但没有两者均“前进”受到的损失大；两者均“后退”，两者均输掉了面子，获得-1
的支付。当然表中的数字只是相对的值。
　　这个博弈有两个纳什均衡：一方前进，另一方后退。但关键是谁进谁退？一博弈，如果有惟一的纳什
均衡点，那么这个博弈是可预测的，即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈
有两个或两个以上的纳什均衡点，则任何人无法预测出一个结果来。因此，我们无法预测斗鸡博弈的结果，
即不能知道谁进谁退，谁输谁赢。
　　用这个博弈来解释 20 世纪 60 年代初发生在美苏两个超级大国之间的一场导弹危机，是最合适不过的
了。
　　二战结束后，形成了对峙的两个超级大国，美国和苏联。这两个超级大国是两个核心，在其周围有各
自的盟友，它们一起组成了两大敌对的阵营。1962 年赫鲁晓夫偷偷地将导弹运送到加勒比海上的岛国古巴，
卡斯特罗政权是苏联这个超级大国的盟友，是美国的敌人。苏联的目的是将导弹部署在美国的眼皮底下，
以对付美国。然而苏联的行动被美国的 U-2 飞机侦察到了，美国发现古巴建立了导弹发射场。此事震动美
国，肯尼迪总统指责苏联，并发出严重警告，而苏联方面矢口否认。美国决定对古巴进行军事封锁，派遣
了舰艇、空军及航空母舰，并集结了登陆部队。美国进入戒备状态，，美苏之间的战争一触即发。
博弈案例 (2)
面对美国的反应，苏联面临着是将导弹撤回国还是坚持部署在古巴的选择？而对于美国，则面临着是挑
起战争还是容忍苏联的挑衅行为的选择？也就是说，这两只“大公鸡”均在考虑采取进的策略还是退的
策略？
　　战争的结果当然是两败俱伤，而任何一方退下来（而对方不退）则是不光彩的事。结果是苏联将导弹
从古巴撤了下来，做了丢面子的“撤退的鸡”。美国坚持了自己的策略，做了
“不退的鸡”。当然，为了给苏联一点面子，同时也担心苏联坚持不退而发生美苏战争——这是美国不愿
意看到的，美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重
的一次危机。
　　这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说，退下来的结果是丢了面子，但总比战争
要好；对美国而言，既保全了面子，又没有发生战争。这就是这两只“大公鸡”博弈的结果。3．骑虎难下
博弈与美苏武器竞赛
　　我们经常碰到的一类博弈是，行动者进也不是，退也不是。笔者将这样的博弈称为骑虎难下博弈。
　　有一个拍卖，其规则是：轮流出价，谁出得最高，谁就将得到该物品，但是出价少的人不仅得不到
该物品，并且要按他所叫的价付给拍卖方。
　　假定有两人竞价争夺价值 100 元的物品，只要双方开始叫价，在这个博弈中双方就进入了骑虎难下
的状态。因为，每个人都这样想，如果我退出，我将失去我出的钱，若不退出，我将有可能得到这价值
100 元的物品，但是，随着出价的增加，他的损失也可能越大。每个人面临着两难：是继续叫价还是退出？
　　你会说，这个拍卖的规则不合理，在实际中这样的拍卖不会出现。当然这只是一个模型，但我们经常
会看到此类型的博弈案例。这个博弈有一个纳付均衡：第一个出价人叫出 100 元的竞标价，另外一个人不
出价（因为在对方叫出 100 元的价格后，他继续叫价将是不理性的），出价 100 元的参与人得到该物品。
　　在冷战期间，美苏为争夺霸权拼命发展武器，无论是原子弹、氢弹等核武器的研制，还是如隐形战斗
机这样的常规武器的研制，双方均不甘落后。20 世纪 80 年代，里根在位时准备启动“星球大战”计划，
此举意味着两个超级大国的武器竞赛将进一步升级。美苏之间的武器竞赛就相当于拍卖中轮番出价，双方
均不断出更高的价，如果一方没有出最高的价钱，退了下来，即没有继续竞赛下去，那么意味着它在军
备上的投入没有效果，而对方将赢得整个局面。但如果继续竞赛下去，一旦支撑不住，损失也就越大。
　　1991 年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上，而民用建设无
法跟上，国力不济，最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。
　　一旦进入骑虎难下的博弈，及早退出是明智之举，然而当局者往往做不到，这就是所谓当局者迷。这
种骑虎难下的博弈经常出现在国家之间，也出现在企业或组织之间，当然个人之间也经常碰到。20 世纪
60 年代，美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本，也是
骑虎难下博弈，其实，赌徒进入赌场开始赌博时，他已经进入了骑虎难下的状态，因为，赌场从概率上
讲是肯定赢的。从理论上讲，赌徒与赌场之间的博弈如果是多次的，那么赌徒肯定输的，因为赌徒的“资
源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大，那么赌场有可能输的；如
果你的资源无限大，只要赌徒有非 0 的赢的可能性，那么赌徒肯定会赢的。因此，像葡京这样的赌场要设
定赌博数额的限制。
　　博弈论专家将这里的骑虎难下博弈称为协和谬误。20 世纪 60 年代，英国和法国政府联合投资开发大
型超音速客机，即协和飞机。该种飞机机身大、设计豪华并且速度快。但是，英法政府发现：继续投资开发
这样的机型，花费会急剧增加，但是这样的设计定位能否适应市场还不知道；而停止研制将使以前的投
资付诸东流。随着研制工作的深入，他们更是无法作出停止研制工作的决定。协和飞机最终研制成功，但
因飞机的缺陷（如耗油大、噪音大、污染严重等等），它不适合市场，最终被市场淘汰，英法政府为此蒙
受很大的损失。在这个研制过程中，如果英法政府能及早放弃飞机的开发工作，会使损失减少，但他们没
能做到。
　　4．警察与小偷的故事——混合策略问题
　　纳什在《n 人博弈的均衡点》这篇论文中，给出了均衡存在的简单证明，纳什说，在 n 个人的博弈中至
少存在着一个均衡，在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为
纳什定理。
　　什么是混合策略？
　　警察部门负责一城市中某一区的治安。警察要对该区的 A、B 两地进行巡逻。假定该区有一群小偷，要
实施偷盗。警察要防止小偷的偷盗，但因为设备有限，只有一部警车，因此，警察只能一次在一个地方巡
逻。而对于小偷而言，他们也只能去一个地方。假定 A 地需要保护的财产价值为 2 万元，B 地的财产价值为
1 万元。若警察在某地进行巡逻，而小偷也选择了去该地，因警察在场，小偷无法偷盗该地的财物；若警
察没有去某地巡逻而小偷选择了去该地，则小偷偷盗成功。警察怎么巡逻才能使效果最好？
博弈案例 (3)
一个明显的做法是，警察对 A 地进行巡逻，小偷去 B 地，这样，警察可以保住 2 万元的财产不被偷窃，小
偷的收益为 1 万元。但是这种做法是警察的最好做法吗？有没有对这种策略改进的措施？
　　我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地，偷盗者在该地无法实施
偷盗，假定此时小偷的得益为 0(没有收益)，此时警察的得益为 3(保住 3 万元)。
　　这个博弈也是常和博弈，它没有纯策略纳什均衡点，而有混合策略均衡点。这个混合策略均衡点下的
策略选择是每个参与者的最优（混合）策略选择。
　　由此可见：纯策略是参与者一次性选取的，并且坚持他选取的策略；而混合策略是参与者在各种备
选策略中采取随机选取的。在博弈中，参与者可以改变他的策略，而使得他的策略选取满足一定的概率。
　　当博弈是零和博弈与常和博弈时，即一方所得是另外一方的所失时，此时只有混合策略均衡。对于任
何一方来说，此时不可能有纯策略的占优策略。
　　5 《三国演义》中的空城计与信息不对称的博弈
　　如果我们用博弈论的眼光看《三国演义》，三国演义完全是一部记载着许多博弈案例的著作。当然，罗
贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》，这个词就是“计”。计，即计策或策略
也。用计，即用策略赢对方。用计算敌，不仅要自己选择恰当的计策，而且要算准对方用什么计策，这不
就是博弈？现在让我们看《三国演义》中著名的空城计博弈。
　　诸葛亮误用马谡，致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将，只有一班
文官，五千军士，已分一半先运粮草去了，只剩二千五百军士在城中。众官听得这个消息，尽皆失色。孔
明登城望之，果然尘土冲天，魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿，诸军各收城铺。打开城门，
每一门用二十军士，扮作百姓，洒扫街道。而孔明乃披鹤氅，戴纶巾，引二小童携琴一张，于城上敌楼前
凭栏而坐，焚香操琴。司马懿自飞马上远远望之，见诸葛亮焚香操琴，笑容可掬。司马懿顿然怀疑其中有
诈，立即叫后军作前军，前军作后军，急速退去。司马懿之子司马昭问：“莫非诸葛亮无军，故作此态，
父亲何故便退兵？”司马懿说：“亮平生谨慎，不曾弄险。今大开城门，必有埋伏。我兵若进，中其计也。
”孔明见魏军退去，抚掌而笑，众官无不骇然。诸葛亮说，司马懿“料吾生平谨慎，必不弄险；见如此模
样，疑有伏兵，所以退去。吾非行险，盖因不得已而用之”，我兵只有二千五百，若弃城而去，必为之所
擒。
　　这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。
　　这里，司马懿不知道自己和对方在不同行动策略下的支付，而诸葛亮是知道的，他们对博弈结构的
了解是不对称的，诸葛亮拥有比司马懿更多的信息，当然有。这种信息的不对称完全是诸葛亮“制造出来
的”。因此这是一个信息不对称的博弈。
　　在这里，孔明可以选择的策略是“弃城”或“守城”。无论是“弃”还是“守”，只要司马懿明确知
道他自己的支付，那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。他的
空城计是降低司马懿进攻的可能收益，使得司马懿认为，后退比进攻要好。
　　司马懿孔明进攻后退守城(被擒，大胜)(逃脱，不胜不败)弃城(被擒，大胜)(逃脱，不胜不败)
　　在信息不充分的情况下，博弈参与者不是使自己的支付或效用最大，而是使自己的“期望支付（或
效用）”最大。比如：如果让你在“有 50%的可能获得 100 元”与“有 10%的可能获得 200 元”两者之间进
行选择，你当然选前者，因为前者的“期望所得”为：50%×100=50 元，而后者为：10%×200 元=20 元。
理性的人是选择前者的。
　　在孔明—司马懿的博弈中，孔明了解双方的局势，制造空城假象的目的就是让司马懿感到进攻有较
大的失败的可能。如果我们用概率论的术语来说，诸葛亮的做法是加大司马懿对进攻失败的主观概率。此
时，在司马懿看来，进攻失败的可能性较大，而退兵的期望效用大于进攻的期望效用。即：司马懿认为进
攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法，才能让司马懿退兵。
　　司马懿想，诸葛亮一生谨慎，不做险事，只有设定埋伏才可能如此镇定自若，焚香操琴。此时，司马
懿觉得“退”比“进攻”更合理，或者说期望效用更大。于是后军变前军，前军变后军，后退而去。结果
是诸葛亮得以逃脱。
　　司马懿对局势的判断不是没有道理的，他对诸葛亮的判断是基于以前的认识，这就是“归纳法”，
我们会在第六章中讨论归纳法在博弈中的作用及其局限。
　　空城计博弈是不完全信息博弈，我们说过《三国演义》是一本博弈实战教材，在该书中有完全信息博
弈实例吗？当然，曹操与诸葛亮的华容道博弈就是一个完全信息博弈。
　　曹操亲领八十万大军进攻东吴，孙权和刘备联合破曹，曹军大败。曹操引兵而逃。经过一路厮杀，来
到一处，军士报：前方有两条道路，请问丞相走哪条路？曹操问：哪条路近？军士说：大路稍平，却远
五十余里。小路投华容道，却近五十多里。曹操令人上山观望，回报：小路山边有数处狼烟，大路并无动
静。曹操叫走华容道。诸将问：烽烟起处必有军马，何故反走这条路？曹操说：岂不闻兵书有云：“实则
虚之，虚则实之”。诸葛亮多谋，故使人于山僻放烟，使我军不敢从这条路走，他却伏兵于大路等着。吾
已料定，偏不教中他计。诸将皆曰：丞相妙算，人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华
容道等着曹操，于是关羽上演了一场“只为当初恩义重，放开金锁走蛟龙”的捉放曹的义举。逃过华容道
大难，曹操只剩二十七骑！
博弈案例 (4)
在曹操与诸葛亮之间的这一华容道博弈中，曹操的策略是在走华容道还是走大路之间进行选择，而诸葛
亮派关羽埋伏时，要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。
　　华容道博弈曹操诸葛亮华容道大路——0.1 华容道(捉住曹操，被捉)(白等，逃脱)大路(白等，逃脱)
(捉住曹操，被捉)
　　这个博弈如同猜硬币的游戏一样，是一“零和博弈”所谓“零和博弈”是指双方的得益之和为一常
数零，一方所得增加，另一方所得便减少。而“变和博弈”是指博弈双方的所得之和为一变数。，它没有
纳什均衡点。双方对博弈有完全的信息，各种策略下的博弈支付是公共知识——我们下一章将说明什么是
公共知识。但双方无法知道对方的策略选择，而只能进行猜测。曹操要选择走诸葛亮的军队不在的路，这
是他的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。
　　诸葛亮制造埋伏在大路的假象，其实则派关羽埋伏在小路。这里关键是谁能真正猜到对方的策略，谁
就是赢家。诸葛亮胜曹操一筹。这个博弈不存在纯策略纳什均衡点，博弈结果是：曹操选择了走华容道，
结果被抓；关羽在华容道守候，抓住了曹操。
公共知识与博弈
　博弈专家们发现在博弈中存在着公共知识的问题。让我们来看一下什么是公共知识。
　　要弄清什么是公共知识，首先要弄清什么是知识。
　　所谓知识是人对真的信念。知识是人们对自然中某个事实的认识，我们说某人拥有某种知识，意指某
人知道某个事实。“地球绕着太阳转”是个事实，但哥白尼之前的人们并不知
道这个事实，而今天这个事实已几乎被所有人熟知，并且人们相信这个事实，于是“地球绕着太阳转”
构成人们的知识。因此知识涉及三个因素：
　　第一，人们了解的事实对象要是真的，假的事实不能成为知识。人们可能相信虚假的东西，但它们不
能构成相信它们的人的知识。在偏僻的乡村，人们相信，人的病是由鬼怪引起的，巫婆通过某些迷信活动
能够驱除鬼怪从而达到治病的目的，这当然只是错误的信念，而不是知识。再比如：在古代，中国人认为
雷电是由掌管雷电的雷公行云布雨的结果，这当然也不是真的事实。假的信念有时对信念拥有者有一定的
效果，但不构成相信者的知识。
　　第二，某个人要知道这个真的事实。许多存在着的真的事实我们并不知道，它们并不能构成我们（人
类）的知识。我们常说知识如大海一样，我们知道的只是知识海洋中的一滴水。我们不知道的东西太多了。
　　第三，人们要相信他所知道的事实。如果他不相信某些事实，尽管他知道，也不构成他的知识。哥白
尼提出地球围绕太阳转的日心说观点，那时许多人知道了这个事实，但并不相信，因此“日心说”就不
能构成他们的知识。
　　逻辑学家研究人的“知道”的结构，他们发现，当某人知道某个事实时，这意味着：他知道他知道
该事实，他知道他知道他知道该事实……这是一个无穷的过程。将这个结构推广到某一人群就构成公共知
识的概念。
　　公共知识这个概念最初由逻辑学家刘易斯提出，之后由经济学家阿曼等用于博弈分析。公共知识是一
个群体人们之间的对某个事实“知道”的关系。
　　假定一个人群由 A、B 两个人构成，A、B 均知道一件事实 f，f 是 A、B 的知识，但此时 f 还不是他们的公
共知识。当 A、B 双方均知道对方知道 f，并且他们各自都知道对方知道自己知道 f……此时我们说，f 成了
A、B 间的公共知识。
　　这个人群是由两个人组成，如果由多人组成，这不仅指任意两个人这样一个双方“知道”的过程，
而且指，其中任何一个人知道其他人知道其他人知道……事实 f。
　　因此，公共知识涉及一群体的对某个事实“知道”的结构。
　　在日常生活中，许多事实是公共知识，如：“所有人均会死”、“所有鸟均能飞（鸵鸟除外）”，对
于它们，所有人均知道（智力有障碍者及婴儿除外），并且所有人知道其他人知道，当然其他人也知道
别人知道他知道……
　　有许多知识只有一些人知道。科学家知道的知识是其他人所不知道的，而且科学家之中各个科学家知
道的知识不同。可以这么说，知识的分布在各个人那里是不同的。
　　在博弈中，“每个参与者是理性的”，这是公共知识。为什么？因为这是博弈前提——当然也是我们
的假定。在具体博弈中，参与者知道对方是理性的，同时知道对方知道自己知道对方是理性的，等等。参
与者知道自己是理性的，他知道自己知道自己是理性的……同时参与者知道对方知道自己知道自己是理
性的……
　　对博弈来说，“参与者是理性的”是起码的公共知识要求。对于像囚徒困境这样的博弈，双方的不同
策略下的支付也是公共知识；曹操和诸葛亮在华容道上的博弈双方的策略下的支付也是公共知识。
　　在有些博弈中，各种策略下的支付不能成为公共知识。比如在商战中，相互竞争的双方不知道对方在
各种产量下的利润，此时，策略下的支付不是公共知识。
　　这里不分析社会行动者的知识的结构，因为这非常困难。只是想说明，知识的不同是非常重要的。
　　一个群体中的每个人的知识是其现实行动的因素。在社会中知识分布决定了社会的结构，当然权力的
分布和信息的分布是另外的决定行动的因素。在一群体的行动中，公共知识改变了，群体的均衡便发生了
改变。
　　上述分析有些抽象，读起来令人乏味，现在让我们来看看公共知识的具体应用例子，通过这些例子，
读者就能明白什么是公共知识，并且可以用它来分析身边的社会现象。
一个寓言——村庄里的大屠杀
在一个偏僻的山里，有一个村庄。这里是女人掌权，女人对一切事务说了算。村里有 100 对夫妇。
　　在这个村里已经形成了约定俗成的规定。如果女人发现自己的丈夫对自己不忠的话，就会毫不犹豫地
将他杀死，而且就在当天执行。当然，她必须有确切的证据来证明她丈夫不忠。由于这个因素，某个女人
发现某个男人不忠，她不会将之告诉那个不忠男人的妻子。但是，她会告诉其他人的妻子，并且女人
们会相互传递这一信息，因此最后，一个男人不忠，除了其妻子不知道外，其他女人都知道。
　　而事实上是，村子里的这 100 对夫妇的男人都不忠，但由于女人不会将她知道的事实告诉不忠男人
的妻子，每个女人都不知道自己的男人不忠。因此，该村子一直很稳定，而没有发生妻子杀死丈夫的行为。
　　村子里有一个辈份很高的老太太，她德高望重，诚实可敬。每个人都向她汇报村里的情况，因此她对
村里的情况了如指掌，她知道每个男人都不忠，当然，其他女人不知道她所知道的。
　　一天，这位老人对这 100 个女人说了一句很平常的话：“你们的男人当中至少有一个是不忠的。”于
是，村里发生了这样一个事情：前 99 天，村里风平浪静，但到了第 100 天，村里发生了一场大屠杀，所
有的女人都杀死了她们的丈夫。
　　故事就是这样的。
　　为什么会这样？
　　公共知识与行动均衡的打破这是一个推理和行动的过程。如果她的丈夫不忠的话，她就杀死他；如果
没有证据证明她的丈夫不忠的话，她便相信他，不杀死他。这是女人的策略。
　　在老太太作了宣布之后的第一天，如果村里只有一个男人是不忠的话，这个男人的妻子在老太太宣
布之后就能知道。因为，她会作这样一个推理：如果其他男人不忠的话，她应当事先知道，既然不知道并
且至少有一个男人不忠，那么这个不忠的男人肯定就是她的丈夫。因此，村里如果只有一个男人不忠的话，
老太太宣布之后，当天这个男人就会被杀死。
　　如果村里有两个男人不忠，那么，这两个男人的妻子第一天都不会怀疑到自己的丈夫，因为她知道
另外一个女人的丈夫不忠。但是当第一天过后她没有发现那个不忠诚的男人被杀死，那么她会想，肯定有
两个男人是不忠的，否则她知道的那个不忠的男人会被他的妻子当天杀死的。既然有两个男人不忠，但这
两个不忠的男人的妻子想，她只知道一个，那么另一个不忠的男人肯定是她的丈夫！……
　　事实上这个村子里的 100 个男人不忠，那么，这样推理会继续到 99 天，就是说，前 99 天每个女人都
没怀疑到自己的丈夫，而当第 100 天的时候，每个女人都确定地推理出她的丈夫不忠，于是村子里便发
生了一场大屠杀，所有的男人都被他们的妻子杀死。
　　这里，在老太太宣布“至少一个男人是不忠的”这样一个事实时，每个女人其实都知道这个事实
（村子里的规则她们也知道），老太太对这个事实的宣布似乎并没有增加这些女人的知识——关于村里
男人不忠行为的知识。但为什么老太太的宣布使得村里的女人产生了对她们丈夫的屠杀行为呢？这是因为，
老太太的宣布使得这个群体里的女人的知识结构发生了变化，本来“至少一个男人是不忠的”对每个女
人都是知识，但不是公共知识，而老太太的宣布使得这个事实成为公共知识。
　　所谓公共知识是指，一群体的每个人不仅知道这个事实，而且每个人知道该群体的其他人知道这个
事实，并且其他人也知道其他的每个人都知道这个事实……这涉及一个无穷的知道过程。
　　在上述例子中，老太太未宣布之前，对村子里的女人来说，“至少一个男人是不忠的”不是一个公
共知识。设想一下，假定共有 3 个女人 A、B、C，那么在未宣布之前，A 想：由于自己不知道自己的丈夫不忠，
其他两个女人 B、C 也同样不知道，那么 A 想 B 不知道 C 是否知道“至少有一个男人是不忠的”。而当老太
太宣布了“至少一个男人是不忠的”之后，“至少一个男人是不忠的”便成了 A、B、C 之间的公共知识。
　　在这个 100 人组成的小村里，老太太的宣布使得“至少一个男人是不忠的”成了公共知识。于是，推
理与行动便开始了。这是大屠杀的原因！
帽子：红色的还是白色的？ (1)
与上述故事相同结构的一个事例是“帽子的颜色问题”。在“帽子的颜色问题”中，同样是公共知识不断
公布，推理不断进行的过程。
　　有一群人围坐在一起，为了便于分析，假定只有 4 人（这与人数多少无关，可作同样分析）。每个人
头戴一顶帽子，帽子为红色的还是白色的红色和白色两种，每个人看不到自己帽子的颜色，但能看到别
人帽子的颜色。因此此时他不能判定出自己头上的帽子的颜色。
　　为了分析的方便，我们假定这 4 个人均戴的是红色的帽子。这时候，一个局外人来到他们的群体当中，
对他们说：“你们其中至少一位头戴的是红色的帽子。”当他说了这句话后，他问：“你们知道你们头上
的帽子的颜色吗？”4 个人都说“不知道”；这个局外人第二次问：“你们知道你们头上的帽子的颜色吗?
”4 个人又都说“不知道”。局外人第三次问：“你们知道你们头上的帽子的颜色吗?”4 个人又说“不知
道”。局外人又问第四次：“你们知道你们头上的帽子的颜色吗?”这时 4 个人均说：“知道了!”
　　你能知道为什么吗?
　　当局外人未宣布“至少一个人戴的是红帽子”时，这个事实其实每个人都知道了，因为每个人看到
其他 3 个人的帽子都是红色的，但每个人不知道其他人是否知道这个事实，即这个事实没有成为公共知
识。而当这个局外人宣布了之后，“至少一个人帽子是红色的”便成了公共知识。此时不仅每个人知道“
至少一个人的帽子是红色的”，每个人还知道其他人知道他知道这个事实……
　　局外人第一次问时，由于每个人面对的其他 3 个人都是红色的帽子，每个人当然不能肯定自己头上
的帽子是什么颜色，于是均回答“不知道”。此时，如果只有 1 个人戴红色的帽子，那么这个人因面对 3
个戴白色的帽子，他肯定知道自己的帽子颜色。因此，当 4 个人均回答“不知道”时意味着“至少有 2 人
戴的是红色的帽子”，而且这也是公共知识。
　　当局外人第二次问时，如果只有 2 人戴的是红色的帽子，这 2 人就会回答说“知道”——因为他们各
自面对的是 1 个戴红色帽子的人。由于每个人面对的是不止一个戴红色帽子的人，因此当局外人第二次问
时，他们只能回答“不知道”。——此时的“不知道”，意味着“至少 3 个人戴红色的帽子”，并且它成
为公共知识。
　　同样，局外人第三次问时，他们均回答“不知道”，意味着 4 个人均戴的是红色的帽子。因此，当局
外人第四次问时，他们就知道宣布每个人头上均戴的是红色的帽子，于是，他们回答“知道”。
　　在这个过程中，当局外人首先宣布“其中至少一个人的帽子是红色的”，以及第二、第三、第四次回
答的时候，无论是回答“知道”还是“不知道”——它们构成公共知识——构成所有人推理的前提，在
这个过程中，每个人均在推理。
　　这就是“帽子的颜色问题”。本人将这个问题简化了。原来的问题比较复杂。它是这样的：
　　有一个游戏，有一个主持人和一群人(假定有 n 人)，戴了两种颜色的帽子，每个人的帽子的颜色或
者是红色或者是白色，但每个人不能看到自己的帽子的颜色却看得到其他人的帽子的颜色。游戏的主持人
说：“你们中至少一个人的帽子是红色的。”主持人开始一次次地问：“你们知道不知道自己的帽子的颜
色?”现在的问题是：当主持人问到第几次时，才有人说“知道”?并且多少人说“知道”？
　　据说，这个问题在 20 世纪曾风靡欧美。四、皇帝新装的新解读
　　我们都熟悉安徒生的童话《皇帝的新装》。
　　从前，一个皇帝爱穿漂亮的衣裳，有两个骗子对皇帝说，他们能做出世界上最漂亮的衣服，这衣服
不仅华丽，而且穿上它后能知道谁是愚蠢的人，因为愚蠢的人是看不见这衣服的。皇帝相信他们的话，给
了他们许多金子，让他们开始织布。两个骗子在织机旁煞有其事地忙碌着。皇帝派他的宠臣去看看工作的
进度，然而他们惊呆了：天啊，我什么也看不见！他们想，难道我是愚蠢的人？我不胜任自己现有的权
位？这是多么可怕的事啊！但好在其他人不知道。于是他们装着看见的样子，称赞布是多么多么的漂亮，
骗子向他们描述衣服的色彩和图样，他们点头称是。回去后，他们将骗子的话汇报给皇帝。皇帝亲自来看
衣服制作的进度，他也同样被眼前的情景惊呆了，因为他什么也没看见！事实上确实什么也没有。皇帝也
怀疑自己是愚蠢的人，但他想，千万不能让别人知道我看不见衣服，千万不能让我的臣民知道我是愚蠢
的人，于是他也同样夸赞起衣服来。
　　全城庆典的那天，骗子装模作样地赶好了衣服，皇帝脱掉了他原来的衣服，骗子做出给他穿衣服的
样子。当骗子给皇帝穿好所谓的“新衣服”后，皇帝步出宫殿向他的臣民致意。皇帝什么也没穿，在大街
上被他的臣子们簇拥着，他的臣民们都看着没穿衣服的皇帝，然而他们不敢承认，怕别人知道自己是愚
蠢的人，他们不说自己看不到皇帝的衣服。
　　这时，一个小孩突然说：“其实皇帝什么也没穿啊！”这一声无疑是晴天霹雳。于是，老百姓私下传
着这个天真无邪的小孩的话，人们开始相信小孩说的话是对的。皇帝也知道了老百姓们的窃窃私语，他想
老百姓的话可能是对的，但他没办法就此回头，他坚持把游行进行下去，于是他更加高傲地向前走去。
帽子：红色的还是白色的？ (2)
在这个童话中，骗子们所谓的皇帝的新衣服其实什么也没有，每个人都知道这是事实。也就是说，对每个
人来说，“皇帝什么都没穿”是知识。但是，每个人不知道其他人是否知道这个事实，即每个人不知道其
他人拥有这个知识。同时每一个人知道，只要他不说，其他人不知道他知道这个事实。即“皇帝什么都没
穿”不是皇帝、大臣及老百姓之间的“公共知识”。
　　这里有一个虚假前提：如果我没看见皇帝的新衣服意味着我是愚蠢的。因此，每个人尽量地不让其他
人了解自己没看见皇帝的新装。此时，每个人，包括皇帝都在说着假话，硬说自己看见了新衣服。每个人
都在谎言下生活。这就是一个均衡，一个大家都“说谎的均衡”。
　　然而，小孩说出“其实皇帝什么也没穿”，小孩意味着不会说假话。当小孩的话传到每个人那里时，
“其实皇帝什么也没穿”便成了公共知识。原来的均衡打破了。安徒生的这个童话里让小孩子说出真话有
他的用意，小孩子是最真诚的和不受污染的。这个故事中的说真话的小孩与村庄里的大屠杀里的老太太起
着相同的作用：使一个知识成为公共知识。
“教—学”均衡的公共知识条件
——教育的知识结构分析我们每个人都有老师，上小学时有小学教师，中学有中学教师，大学有大学教
师，等等。并且在同一时候有不同的教师，如在中学有数学教师、语文教师、物理教师、化学教师，等等。这
是众所周知的事情，没有什么特别的地方。
　　然而，如果我们对学生—教师的知识结构作一分析，我们会发现，教育有着特别的知识结构。
　　教育有什么样的结构？我们每个人都知道，学校的教师知道他或她应该知道的知识，学生知道他们
的老师知道他们想学的知识，老师也知道学生知道他或她拥有某些知识，即：老师知道某些要求的知识
是公共知识。我们用 K1 表示“教师知道某些学科的知识”，K1 为公共知识。
　　同时，学生不知道教师知道的学科性知识，学生对这些知识的无知也成为公共知识。即：教师知道学
生对这些知识的无知，成为学生和老师间的公共知识，同时也是全社会的公共知识。我们用 K2 表示“学
生不知道某个学科的知识”，K2 也是公共知识。
　　K1 和 K2 不仅是老师和学生间的公共知识，同时也是社会的公共知识。
　　因此，我们看到，之所以教师站在讲台上，处于“教”或“传授”的位置，而学生坐在课桌前处于
“学”或“聆听”的位置，就是因为有这样的公共知识存在。“教—学”或“讲授—聆听”构成一博弈均
衡。如果没有这样的知识构成，“教—学”或“讲授—聆听”的均衡便不会形成。
　　这样的均衡何时会打破呢？
　　我们说，既然“教—学”的均衡依赖于公共知识 K1 和 K2，一旦这样的知识构成被打破，“教—学”
之间的关系将被终结。这里有两种可能情况：一是 K1 不是公共知识，或者因为教师不具有这些知识，或
者教师具有这些知识但没有成为公共知识，也就是说学生或社会不知道。那么，“教—学”的均衡不能形
成，这个教师便不能站在讲台上。第二种情况是，通过一定时间的学习，教师将知识教给了学生，学生也
知道了教师讲授的东西，此时“教—学”均衡也被打破了。
　　当然，K1 和 K2 只是“教—学”均衡形成的必要条件，而非充分条件。
诸葛亮、周瑜的掌中之“ 火”
《三国演义》描写了这样的故事：曹操带领大军进攻东吴，诸葛亮来到东吴，劝说东吴与刘备一起抵抗曹
操大军，都督周瑜向诸葛亮请教如何破曹操的百万大军。周瑜说，我昨天察看曹操水寨，极为严整、有章
法，不是一般人所能够攻破的。我想了一个计策，不知道是否可行，请先生为我决策。孔明则说：都督暂
不要说，我们各自写在手上，看一看是否一样。
　　瑜大喜，教取笔砚来，先自暗写了，却送与孔明；孔明亦暗写了，两人移近坐榻，各出掌中之字互
相观看，皆大笑。原来周瑜掌中字，乃一“火”字；孔明掌中亦一“火”字。瑜曰：“既我两人所见相同，
更无疑矣。幸勿漏泄。”
　　在诸葛亮和周瑜未在掌中写出“火”字之前，或者尽管他们在掌中写出“火”字但没有互相观看之
前，火攻曹操为一个致胜的妙计是他们两个人所知道的，但不是公共知识。因为周瑜不知道诸葛亮知道这
个策略。此时很有可能的是，诸葛亮知道周瑜知道这个策略，但周瑜以为诸葛亮不知道他知道这个策略。
而当两人在手中写出“火”字，并“互相观看”之后，这个策略可以取胜为他们的公共知识。
　　诸葛亮与周瑜将“火”字写在掌中，并互相观看，这样的行为使他们的知识结构发生变化。在这个过
程，知识结构发生变化的群体只有诸葛亮和周瑜两个人，而无其他人，“诸将皆不知其事”。如果其他
（尤其是曹操）知道火攻为诸葛亮和周瑜之间的公共知识，那么火攻策略便不能战胜曹操，赤壁一战便
会出现另外的结果。知识的分布关系到战争的成败。
将军的困境
我们在生活中经常见到某些场合下，两个人为某件事情会心一笑，此时两人达到了默契。
　　如果用公共知识的概念来解释，就是两人都知道了将军的困境——协同攻击难题识，而且他们知道
对方知道自己知道了该事情,即该事情是他们的公共知识。他们不通过语言传达了这些信息。
　　两个默契的双方不用语言就可形成某个公共知识，而在有些时候，即使用语言多次传递某个信息，
该信息也难以成为公共知识。我们看一个“协同攻击难题”。
　　两个将军各带领自己的部队埋伏在相距一定距离的两个山上，等候敌人。将军 A 得到可靠情报说，敌
人刚刚到达，立足未稳。如果敌人没有防备，两股部队一起进攻的话，就能够获得胜利；而如果只有一方
进攻的话，进攻方将失败。这是两位将军都知道的。A 遇到了一个难题：如何与将军 B 协同进攻？那时没有
电话之类的通讯工具，而只有通过派情报员来传递消息。将军 A 派遣一个情报员去了将军 B 那里，告诉将
军 B：敌人没有防备，两军于黎明一起进攻。然而可能发生的情况是，情报员失踪或者被敌人抓获。即：将
军 A 虽然派遣情报员向将军 B 传达“黎明一起进攻”的信息，但他不能确定将军 B 是否收到他的信息。事
实上，情报员回来了。将军 A 又陷入了迷茫：将军 B 怎么知道情报员肯定回来了？将军 B 如果不能肯定情
报员回来的话，他必定不会贸然进攻的。于是将军 A 又将该情报员派遣到 B 地。然而，他不能保证这次情报
员肯定到了将军 B 那里……
　　这就是“协同攻击难题”，它是由格莱斯（J.Gray）于 1978 年提出。更为糟糕的是，有学者证明，
不论这个情报员来回成功地跑多少次，都不能使两个将军一起进攻。
　　问题在于，两个将军协同进攻的条件是：“于黎明一起进攻”是将军 A、B 之间的公共知识，然而，
无论情报员跑多少次，都不能够使 A、B 之间形成这个公共知识！如果你是这两位将军中的一个，你有什
么办法？
什么是公平分配？
分配是任何时代、任何社会的重要问题。在中国传统中有这样的思维：“不患贫，而患不均”，即是说，
人们能够忍受贫穷，而不能忍受社会财富分配的不均等。微观经济学通常涉及三个方面的内容：“生产什
么”、“如何生产”以及“如何分配”，即：分配是经济学的一个重要内容。
　　公平分配是人们追求的目标。然而，什么是公平的分配？
　　首先要确定一个分配的公平标准，某种分配符合这个标准，它就是公平的，否则便是不公平的。
　　公平的并不是平均的，尽管有时是平均的。一个公平的分配是，各方之所得是其“应该”所得的。但
什么是“应该”所得的？
　　作为理性人，每个人均想多分配一点。现实中的许多争吵，大到国家间的领土争端，小到人与人之间
的鸡毛蒜皮的小事，很大一部分是由于分配不公平造成的。这种争吵或者由于一方认为不公平造成的，或
者由于双方均认为不公平造成的。
8 个金币的故事
有这样一个故事。
　　约克和汤姆结对旅游。约克和汤姆准备吃午餐。约克带了 3 块饼，汤姆带了 5 块饼。这时，有一个路人
路过，路人饿了。约克和汤姆邀请他一起吃饭。路人接受了邀请。约克、汤姆和路人将 8 块饼全部吃完。吃完
饭后，路人感谢他们的午餐，给了他们 8 个金币。路人继续赶路。
　　约克和汤姆为这 8 个金币的分配展开了争执。汤姆说：“我带了 5 块饼，理应我得 5 个金币，你得 3
个金币。”约克不同意：“既然我们在一起吃这 8 块饼，理应平分这 8 个金币。” 约克坚持认为每人各 4
块金币。为此，约克找到公正的夏普里。
　　夏普里说：“孩子，汤姆给你 3 个金币，因为你们是朋友，你应该接受它；如果你要公正的话，那
么我告诉你，公正的分法是，你应当得到 1 个金币，而你的朋友汤姆应当得到 7 个金币。”
　　约克不理解。
　　夏普里说：“是这样的，孩子。你们 3 人吃了 8 块饼，其中，你带了 3 块饼，汤姆带了 5 块，一共是 8
块饼。你吃了其中的 1/3，即 8/3 块，路人吃了你带的饼中的 3-8/3=1/3；你的朋友汤姆也吃了 8/3，路人
吃了他带的饼中的 5-8/3=7/3。这样，路人所吃的 8/3 块饼中，有你的 1/3，汤姆的 7/3。路人所吃的饼中，
属于汤姆的是属于你的的 7 倍。因此，对于这 8 个金币，公平的分法是：你得 1 个金币，汤姆得 7 个金币。
你看有没有道理？”
　　约克听了夏普里的分析，认为有道理，愉快地接受了 1 个金币，而让汤姆得到 7 个金币。
　　在这个故事中，我们看到，夏普里所提出的对金币的“公平的”分法，遵循的原则是：所得与自己
的贡献相等。
　　这就是夏普里值的意思。
从分蛋糕到财产分割与边界争端的解决：
双赢的分配两人分一个蛋糕，用什么方法才能分配得公平？一个公平的分法是：由其中一人持刀来分，
分者后取。这样，分的人因担心后取而吃亏，他所能采用的最好办法是尽量将蛋糕分平均，即使他后拿，
也不会吃亏。
　　分蛋糕只是对同质的东西所进行的一个简单的分配，对不同质的东西能否建立一个像“你分我先取
”分蛋糕那样的一个程序，从而做到公平分配吗？美国纽约大学政治系的勃拉姆兹（S. Brams）教授
给出了肯定的回答。他提出了一个“双赢”的分配办法。
　　我们来看一下一个离婚的财产分割的例子。假定一对夫妇，安娜和汤姆，感情破裂，不想在一起过日
子了。他们到法院进行财产分割。
　　法官看了他们的财产：冰箱、电脑、缝纫机、烟斗、自行车、书桌。一共有 6 件。法官叫他们对这 6 件物品
进行轮流选择，所选择的归其所有。当然是女士先选。选择顺序是：安娜，汤姆，安娜，汤姆，安娜，汤
姆。
　　选择的结果是什么呢？我们假定安娜与汤姆对不同物品的偏好不同，比如，安娜作为家庭主妇最喜
欢冰箱，认为它也最值钱；而汤姆由于工作的关系更喜欢电脑，认为它更有用。他们对物品的“评价”见
表 4-1。
　　离婚分东西表 4-1
　　排序安娜汤姆 1 冰箱电脑 2 缝纫机烟斗 3 自行车书桌 4 书桌自行车 5 电脑冰箱 6 烟斗缝纫机
　　于是，选择的结果是：安娜选了冰箱、缝纫机和自行车，而汤姆选了电脑、烟斗和书桌。
　　安娜得到了 6 件物品中她认为价值最高的 3 件物品，汤姆同样得到了他希望得到的价值在前 3 位的物
品。两人对分配均满意。
　　这是一个双赢分配。
　　这里所实现的“双赢”分配，其基础是：我们假定了他们对不同的物品的估价“差别较大”，或者
说不同物品在不同的人那里其“效用”是不同的。为了分析这里的分配是双赢的结果，我们设定他们对每
件物品进行打分，假定满分为 100 分，安娜和汤姆分别将这 100 分分配给不同的物品。见表 4-2：
　　表 4-2
　　排序安娜汤姆 1 冰箱 28 电脑 302 缝纫机 22 烟斗 253 自行车 20 书桌 204 书桌 15 自行车 155 电脑 10 冰
箱 56 烟斗 5 缝纫机 5
　　这样，安娜总共得到了 70 分，而汤姆得到了 75 分。两人分配得到的结果大大超过了 50 分。勃拉姆兹
在《双赢解》一书中还提出了分配的“无嫉妒原则”。这里，安娜的所得为 70 分，汤姆的所得为 75 分。安娜
嫉妒汤姆，认为他的所得超过自己。勃拉姆兹提出，可以让汤姆补给安娜 2.5 分值的东西，这样，安娜的
心理就平衡了。此时双方都不会产生嫉妒心理。如此看来，这样的分配确实是双赢的。
　　在上述的分配中，我们假定了安娜和汤姆对不同物品的估价或者排序是不同的。如果他们的估价差不
多，情形又将如何？
　　假定安娜和汤姆对不同物品估价后进行的排序为表 4-3。与前面一样，同样是安娜先选择，然后是汤
姆，接着是安娜……
　　在这样的选择中，如果每个人进行的选择是诚实的，即每个人进行选择时，都是从剩下的物品中选
择自己认为价值最高的物品，那么结果是：安娜选择了冰箱、自行车和缝纫机；而汤姆选择了电脑、烟斗
和书桌。
　　表 4-3 诚实的选择
　　排序安娜汤姆 1 冰箱电脑 2 电脑烟斗 3 自行车书桌 4 书桌自行车 5 缝纫机冰箱 6 烟斗缝纫机
　　在这个分配中，安娜获得了她认为的价值“第一”，“第三”和“第四”的物品，而汤姆获得了他
认为价值“第一”、“第二”和“第六”的物品。
　　这样的分配对双方来说，虽然不是最好的结果，但是双方应该对这个分配结果感到满意的。
　　在这个例子中，聪明的读者会想到：安娜第一次不选择冰箱，而先选择电脑，情形会怎样呢？即：
安娜的选择是策略性的，而不是诚实的。因为，安娜知道在汤姆那里电脑排第一，而冰箱排倒数第二。安
娜第一次选择了电脑，轮到汤姆选择时，汤姆不会选择冰箱，而选择了烟斗。结果见表 4-4。
　　在表 4-4 中，安娜得到了她认为的最值钱的前三位东西。汤姆得到了他认为的第二、第三及第六位价
值的物品。
　　表 4-4 策略选择
　　排序安娜汤姆 1 冰箱电脑 2 电脑烟斗 3 自行车书桌 4 书桌自行车 5 缝纫机冰箱 6 烟斗缝纫机
　　在这个例子中，如果汤姆对自己的分配所得的结果不满意，他同样可以采取策略行为。当他看到安娜
采取策略性行为而选择了电脑时，论到他选择时，他先选择冰箱！尽管冰箱在他看来价值最低，但他知
道冰箱在安娜那里价值最高，当他选择了冰箱后，他可以用它与安娜交换电脑！这样一来，情形就较复
杂。读者不妨自己分析此时的结果。
　　如果双方对物品的估价一样，此时的分配便无法做到双赢了。这样的分配问题演变成一个“常和博弈
”：双方所得之和为一个常数，一方如果分配所得多了，另外一方的所得便少了。我们这里不对这个问题
进行探讨。
　　有意思的是，勃拉姆兹教授认为，他的这种方法可以用于解决南沙群岛争端问题。勃拉姆兹首先将南
沙争端各方分成两方：以中国（包括中国台湾）为一方，以声称拥有主权的东盟四国（越南、菲律宾、马
来西亚、文莱）为一方。然后将超过 230 个小岛和暗礁分成“南部”、“西南部”、“中南部”、“东部”和
“中北部”五部分，让双方就“政治利益”、“军事重要性”和“经济利益”给出分值，然后进行分配，
这样可以实现双赢。本人在纽约大学做访问学者时，他问：“你看这个方法能够解决南沙争端吗？”我说：
“不可能！” 他问： “为什么？”我说：“每个国家都希望得到更多！”他说：“只要各方理性地坐
下来谈，这便是一个双赢的分配方案。” 对勃拉姆兹的解决有兴趣的读者请参见勃拉姆兹 1999 年出版的
《双赢解》（The Win Win Solution）。
知识与博弈
对一博弈来说，肯定存在着某些公共知识，均衡的产生依赖于这些公共知识的条件，只不过不同博弈的
公共知识是不同的。如：“参与者是理性的”是公共知识，“博弈结构或支付函数”是公共知识。
　　新的公共知识的出现会使原来的均衡打破，而形成新的均衡，如“村庄里的大屠杀”中的“至少有
一个男人是不忠的”，“皇帝的新装”中的“皇帝没有穿衣服”，成为公共知识
后，原来的均衡便打破了。
　　然而在一博弈中，公共知识不是参与者知道的惟一知识，也就是说，对参与者来说，存在着非公共
知识。即：有些知识不是公共知识。
　　这里有两种情况，一是有些知识，博弈双方知道，但不知道对方知道不知道，当然也不知道对方是
否知道自己知道不知道，最明显的例子是小孩说出真相之前每个人都知道“皇帝没有穿衣服”。这时也形
成均衡。
　　第二种情况是，有些知识是博弈的一方知道的，而另外一方不知道，即一方拥有的知识多一些，而
另外一方拥有的知识少一些。现在的问题是，拥有知识多的一方更有利还是拥有知识少的一方有利？
　　惯常的想法是知识越多越好，事实是不是这样呢?让我们看一个例子。
　　假定同一种商品只有两个商家生产，它们构成寡头垄断。
　　商家博弈它们之间面对同一个市场，它们要决定生产多少。有很多经济学家在研究这个问题，而且有
很多模型，如库若模型、斯坦伯格模型，等等。这个问题是西方经济学家关心的问题。
　　我们这里不用模型来分析(有兴趣的读者可找有关文献)，只是定性地给予解释。
　　在双方互相不了解对方的情况下，每个商家力图调整自己的产量以使得自己的利润最大，在调整的
过程中我们会发现对方也在调整，当对方调整时自己还得调整……这是一个动态的过程。理性的厂商会这
样想：我何不预测对方在我调整时将得出的产量？双方都这样想，这就是博弈过程。或者碰巧猜测对了对
方的产量，或者真的了解了在自己产量给定的情况下对方的最优产量。这时，纳什均衡产量就达到了。这
时双方对对方的支付结构都不了解。这里，“无知”是对称的。
　　在这个调整过程中假定一方通过某种方法了解到对方的调整策略，这个方法或者是从调整中得来的，
或者通过商业间谍获悉的，或者两种并用。此时，我们可以说，知识是非对称的，一方比另外一方拥有更
多的知识。拥有更多的知识将处于有利的局面：它因为准确预测对方的产量而可以确定使自己利润最大的
产量。这也可以解释企业为什么尽量获取对方内部的信息，而尽量不让对方了解自己内部的信息。这也就
是商业间谍存在的原因。由此可见，商战的双方感兴趣的不仅仅是对方的技术机密，企业产量与利润、成
本之间的关系均是战略决策的决定因素。商业间谍侦查和反侦查是商场上竞争的手段，它决定着商战的成
功。
信息与战争博弈
国际上国与国之间外交上的较量何尝不是这样呢？国与国之间的外交行为是地地道道的博弈行为，而战
争是一种特殊的博弈。为了达到本国的利益，其策略选择要使自己的目的最大化，然而任何国家在决定自
己的策略时要充分考虑对方的行为，间谍的目的之一就是弄清对方变动的可能性。因此，信息在博弈中发
挥着重要的作用。
　　我们可以用一个例子来说明。
　　二战结束后，朝鲜沿三八线被划分为南北朝鲜。1951 年南北朝鲜发生战争，美国介入。对于美国来说，
它预计中国不会介入到朝鲜战争中去。因为，在美国看来，新生的共和国刚刚成立，内战消耗太大，经济
百废待兴，不可能卷入战争。并且美国认为，美国武器装备优良，军费充足，即使中国参战，也无力与之
抗衡。因此美国得出结论：朝鲜战争因美国的介入很快就会结束，而中国不会介入。当时美国有一家叫德
林的咨询公司，在美国未出兵之前，深入地研究了中国的情况、朝鲜与中国的关系，研究的结论是：如果
美国介入到朝鲜战争中去，中国将出兵。他们想将研究报告以 500 万美元卖给政府，而美国政府未予理睬。
最终，美国这个军事大国在朝鲜战场上丢了脸面，损失的财产以几百亿美元计，伤亡数十万人，
　　各国均有派往他国的间谍，间谍的信息可供本国的决策者作出利己的决策。而为了自己在决策中的胜
利，反间谍是一国安全的主要内容。因此间谍与反间谍是国与国之间永久的话题。
　　冷战时期，美国与苏联的间谍战已众所周知，驱逐间谍和交换间谍也是常有的事情。苏联解体后，俄
罗斯与美国之间的敌对关系不存在了，取而代之的是战略伙伴关系。然而间谍战并没有因此而消失。
　　那么，他国间谍的存在对自己本国的战略全是坏事情吗？
　　未必。为什么这样说？获取情报是间谍的任务，而足够的情报是战争胜利的保证，因此间谍的存在是
胜利的条件。但是一场战争只能有一方胜利，如果了解到对方足够的情况而知道自己肯定会输的话，该国
还能打吗？此时战争还能打得起来吗？
　　战争胜败大体上取决于实力、信息、战略与人心。如果其中一方各方面均优于另外一方，并且弱的一方
知道的话，理性的弱者是不会参与战争的，此时战争便打不起来。间谍就具有传递这个信息的作用。
　　应当说，双方之间若要进行战争，足够理性的双方应当知道谁会胜利，谁会失败。这是惟一确定的。
因此很多情况下，国与国之间的战争往往是由于不完全了解局势造成的。如果不考虑战争的所谓正义与非
正义——因为这个问题是伦理学的内容，而不是科学的考虑对象，应当看到，有足够理性的双方之间是
不可能发生战争的。
　　一般来说，战争是两败俱伤的，尤其是双方力量对比差不多的时候。战争往往是双方没有足够的信息
造成的。当然现实中很难做到信息充分，因而战争也不可能未打之前就能定胜负。弱者可以胜强者，以弱
胜强的例子太多了，中国共产党的军队在解放战争期间打败无论是军队的装备上还是军队的数量上均居
于优势的国民党军队。尽管毛泽东对自己的才能及自己的军队有足够的自信，然而在 1945 年重庆谈判时
未必能预知他的军队能这么快就胜利。而蒋介石更不知道他会失败，否则他在谈判桌上不会毫无谈判诚意，
不让共产党有生存空间，并且边谈判边开战。
　　从理论上讲，具有足够理性和具有足够知识与信息的人能预知战争的结果。但现实中的人或者因为没
有足够的知识和信息，或者不具有足够的理性（或算计）的能力，而往往不能做到这一点。战争的结果不
能预知，这也是战争的魅力所在。
　　一般来说，获取对方的信息而不让对方知道己方的情况是合理的。然而这不是绝对的。
　　如果一方要将虚假信息传递出去，对方间谍的存在是最好的。另一方面，如果弱小的一方因不了解对
方的情况而开战，则对双方都是不利的。强国也不愿意发生战争，它通过媒体表达自己的态度，然而弱小
的一方会以为对方是因弱而害怕，更加大了开战的决心。此时，强国最好的办法是将自己的情况让对方的
间谍知道。当弱势方知道对方的真实情况时，一场对谁都不利的战争便避免了。
　　其实，早在 2000 多年前我国著名的《孙子兵法》中就强调了间谍的作用。在第 13 篇《用间篇》中讨论了
间谍的种类、作用及用法。
　　“先知者不可取于鬼神，不可象于事，不可验于度，必取于人，知敌情者也。”了解敌情不能求神问
鬼，不能类推，不能臆测，只能从知道敌情的人那里获得。孙子提出五间：乡间——利用敌方的本地人做
间谍；内间——用地方的官吏做间谍；反间——迫使敌方的间谍为我所用；死间——散布假情报并通过
我方的间谍告诉敌方；生间——让我方的间谍回来报告情报。而五间中，孙子认为，关键是反间。
　　孙子说：“故三军之事，莫亲于间，赏莫厚于间，事莫密于间。”军队的各种事务中，最亲信的是间
谍，赏赐最多的是间谍，行动最机密的还是间谍。由此可见，信息在战争博弈中的作用。
声称的策略与实际的策略：言语博弈问题

　有些博弈是“无声的”，而有些博弈是“有声的”。这有声的博弈可称之为言语博弈。如各国的外交声
明，战争中或战争之前各方发布的真假策略（如在海湾战争中，伊拉克对美国说：如果你打我们的话，
我们将向以色列发射导弹），都是言语博弈。在博弈论中有学者称之为信号博弈。
　　言语博弈涉及实际的策略决定和声称的策略决定。
　　如：当有人说“人不犯我，我不犯人；人若犯我，我必犯人”时，这含有什么意思呢？
　　如果“别人犯我，我不犯别人”的话，别人会不断地犯我，我将不断地受到侵犯——这是我所不希
望的；如果“别人不犯我，我犯别人”的话，我不犯人的时候别人也会来犯我——这也不是我所期望的。
因此，“人不犯我，我不犯人；人若犯我，我必犯人”的策略是我的好的策略。其价值是由理性的我出于
利己的动机来规定的。这是策略决定。
　　同时，这个策略的说出本身有“传达”的功能：你不要犯我，否则我肯定犯你；你不犯我，我也不
会犯你。语言哲学中有人认为，语言本身就是行动（speech act）。这里行动者就是将行动的可能策略告
诉对方，目的是使双方避免出现不希望的结果，而首先是为了自己的目的。
　　如美国声称，如果中国武力攻打台湾的话，美国将介入。这是美国声称的策略。美国通过这言语上的
声明，目的是为了恐吓中国政府。而中国政府同样以言语回击：是否以武力收复台湾是中国的内政，美国
无权干预。言下之意，如果美国干预的话，美国和中国将发生战争。如果中国政府真的武力攻打台湾以实
现国土统一，美国真的会介入吗？这是中国政府所要考虑的问题，即要弄清美国届时实际的策略是什么。
而美国也要考虑，一旦战争打起来，美国如果干预的话，中国会向美国开战吗？
　　因此要分清行动者真正的策略决定与声称的策略决定。真正的策略决定，我们说是规定真的，因为它
是行动者从利己的角度确定的，行动者没有理由确定对自己不利的策略决定。而声称的策略决定本身也是
一种策略，或者说本身是一种决定了的行动。行动者通过这个行动来达到某种目的。
　　可以这么认为：“人不犯我，我不犯人；人若犯我，我必犯人”是一种声称的策略决定。而“如果天
下雨，我将带伞”则是真正的策略决定。
　　怎么区分这两种决定呢？
　　声称的策略决定首先是一种语言行动，而真正的策略决定不是一种语言行动。声称的策略决定是行动
者向其他行动者说出去的一种行为，它是行动者的一种行动。而真正的策略决定是不是需表达出来的，其
他行动者有可能知道也有可能不知道，并且有时这种真正的策略决定是保密的。
　　其次，声称的策略决定与真正的策略决定可以相同也可以不同。行动者的真正的策略决定是利益最大
化得来的，只要社会的逻辑结构或博弈结构给定，行动者就会有自己的策略决定。囚徒困境中，被警察抓
到的囚徒——行动者或博弈方，在警察给了他们的支付矩阵后，他们就会分析出自己的策略决定，即：
无论对方招认还是不招认，他的最优策略是招认。
言语博弈中的“ 威胁”与 “承诺”
在现实中，我们经常看到声称的策略决定，但是这些声称的策略可信吗？
　　声称的策略包括“威胁”与“承诺”。美国和中国在台湾问题上的言语博弈就是威胁的。而在国际核
武器问题上，我国及其他一些国家承诺“不首先使用核武器”就是一种言语承诺。
　　博弈论中，经常用“可置信”和“不可置信”的“威胁”或“承诺”来区分行动者说出来的策略，
我们在对动态博弈的分析中会分析什么样的策略是可置信的，什么样的策略是不可置信的。而分析“威胁
”或“承诺”是可置信的还是不可置信的方法是倒推法。
　　倒推法（backward induction）也叫逆向归纳法。那么什么是倒推法？
　　要理解什么是倒推法，先来看一下商界里经常见到的博弈。
　　在某个城市假定只有一家房地产开发商 A，我们知道任何没有竞争下的垄断利润是很高的，假定 A 此
时每年的垄断利润是 10 亿元。
　　现在假定有另外一个企业 B，准备从事房地产开发。面对着 B 要进入其垄断的行业，A 想：一旦 B 进入，
A 的利润将受损很多，B 最好不要进入。所以 A 向 B 表示，你进入的话，我将阻挠你进入。假定当 B 进入时 A
阻挠的话，A 的利润降低到 2，B 的利润是-1。而如果 A 不阻挠的话，A 的利润是 4，B 的利润也是 4。
　　现在让我们回到房地产开发商之间的博弈问题。A 的最好结局是“B 不进入”，而 B 的最好结局是“进
入”而 A“不阻挠”。这两个最好的结局不能构成均衡。那么结果是什么呢？
　　A 向 B 发出威胁：如果你进入，我将阻挠。而对 B 来说，如果进入，A 真的阻挠的话，它将受损失-1
（假定-1 是它的机会成本），当然此时 A 也有损失。对于 B 来说，问题是：A 的威胁可置信吗？
　　B 通过分析得出：A 的威胁是不可置信的。原因是：当 B 进入的时候，A 阻挠的收益是 2，而不阻挠的
收益是 4。4>2，理性人是不会选择做非理性的事情的。也就是说，一旦 B 进入，A 的最好策略是合作，而不
是阻挠。因此，通过分析，B 选择了进入，而 A 选择了合作。双方的收益各为 4。
　　在这个博弈中，B 采用的方法为倒推法，或者说逆向归纳法，即：当参与者作出决策时，他要通过对
最后阶段的分析，准确预测对方的行为，从而确定自己的行为。
　　在这里，双方必须都是理性的。如果不满足这个条件，就无法进行分析了。
　　这个例子只是简单的两阶段博弈，而三阶段或更多阶段的博弈，可用同样方法加以分析。
　　在动态博弈中，涉及“威胁”与“承诺”是不是可信的问题。静态地看，一博弈存在许多均衡。
　　因此，阻挠，不进入的纳什均衡点得以淘汰，在动态博弈中一个新的均衡——子博弈精练纳什均衡
——得以实现。子博弈精练纳什均衡的定义及分析，归功于另一位诺贝尔经济学奖获得者塞尔屯
（Selton）。
　　这里分析的是完全且完美信息下的动态博弈。所谓完全信息是指：博弈的支付函数是“公共知识”
（我们在第一部分叙述了公共知识的含义）。本书中未涉及不完全信息的博弈问题，如囚徒困境这样的静
态博弈也是完全信息博弈。完美信息是针对动态博弈而言的，指参与者知道博弈的所有历史。
　　倒推法是动态博弈中有用的工具，它可以说是理性的人自然的推理方式。然而倒推法面临着一个困难，
这就是蜈蚣博弈的悖论。（参见第六章）
　　上面我们分析了“威胁”是否可信，下面我们可分析“承诺”是否可信。“不首先使用核武器”的承
诺可信吗？这个承诺是针对常规战争而言的，即：只要大家都运用常规武器进行战争，那么承诺者将不
首先使用核武器。在常规战争下不涉及国家生死存亡的时候，这个承诺是可信的。因为如果承诺者首先使
用核武器，将使他国也对它使用核武器，这样一来，它会因首先使用核武器而带来更大的灾祸。但是，如
果在常规战争中某国面临着被消灭的危险时，它还不首先使用核武器吗？在这种情况下，使用核武器有
可能挽救这个国家，而不使用，则该国肯定灭亡，即使用的好处大于不使用的好处。因此，这个承诺在一
个国家面临灭亡的时候将是不可信的。
空口声明博弈
在博弈论中存在另外一种言语博弈，英文叫 cheep talk。cheep talk 可翻译成“空口声明”，它是一口
头表态，发话者说出某些话语无需某些成本，也无须承担某些责任，它不是“威胁”也不是“承诺”，
但发话者说出它是有目的的。听者要分析他话中的含义，即要分析 cheep talk 是真还是假。
　　如：某人应聘某职位时，他会说“我的能力很高”，这就是 cheep talk。他的目的是为了能应聘得
上或者说是为了获取高工资，他说出这样的话是无需成本的，每个应聘者都可以这么说。而雇主则要弄清
这些应聘者的 cheep talk 中哪个是真的哪个是假。
明天太阳必然能升起吗？
——归纳推理的合理性问题人有两种推理方式：一是演绎的，二是归纳的。
　　由前提真必然地推出结论真就是演绎推理。这是逻辑或传统逻辑研究的对象。古希腊哲学家亚里士多
德确定了三段论推理形式如：
　　大前提：所有人皆要死；
　　小前提：张三是人；
　　结论：张三要死。
　　再比如：
　　大前提：所有的爬行动物是用肺呼吸的。
　　小前提：蛇是爬行动物。
　　结论：所以蛇是用肺呼吸的。
　　只要前提真，推理过程无误，演绎推理的结论就是真的。演绎推理是由某个普遍性的原理推出某种特
殊的结论。这个结论其内容不会超过前提蕴含的内容。数学就是演绎性的。
　　不仅有演绎推理，同时还有归纳推理。如：
　　前提 1：张三要死；
　　前提 2：李四要死；
　　结论：所有人都要死。
　　又如：
　　前提 1：蛇是用肺呼吸的；博弈生存博弈生存博弈生存博弈生存归纳推理的合理性问题前提 2：鳄鱼
是用肺呼吸的；
　　结论：所有的爬行动物都是用肺呼吸的。
　　这种由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。
　　归纳出来的普遍性的结论不是必然真的，而是归纳真的，或者说是“或然真的”，即：结论可能是
真的，也可能是假的。
　　归纳推理是跳跃的，结论的内容超出前提的内容。当然，这种跳跃性的过程是可质疑的。大哲学家休
谟批判人们的归纳没有合理性，只是人的习惯联想而已。因为没有逻辑的理由来证明归纳法。
　　演绎与归纳在人的认识与行动中起着重要作用，哲学家在研究它们的作用。
　　人的行动很大一部分建立在归纳推理之上。那么什么是归纳推理呢？
　　我们每天看到太阳从东方升起而得出结论说“太阳每天从东方升起”，我们看到了几只天鹅是白色
的，我们说“所有的天鹅是白色的”。
　　归纳推理就是从少数的观测的事例中概括出普遍性的命题。如果用逻辑学的话语说，就是从特称命题
得出全称命题。所谓全称命题是指这样的命题形式：“所有的……具有某种性质”，而特称命题是指“某
某具有什么性质”。当然这是一种不严格的说法。今天非经典逻辑的归纳逻辑就是研究证据与全称命题之
间的支撑关系的。
　　从特称命题到全称命题的过程是归纳过程，这个过程中存在着跳跃。这样的跳跃合理吗？
　　归纳法是科学家的常用工具，而对归纳法的合理性哲学家一直在探讨。培根说过“知识就是力量”，
他竭力倡导归纳法，认为知识的来源是经验。
　　知识来源于经验，这不容怀疑。然而人们通过经验得出知识的方法令人怀疑。18 世纪英国哲学家休谟
认为，归纳法其实是人的习惯联想。
　　我们怎么从过去每天观测的太阳从东方升起得出“太阳将每天从东方升起”的结论？根据休谟的看
法，答案只能是习惯联想。我们以前观测到甲现象出现时，乙现象也出现，当我们以后看待甲现象时，我
们便期待着乙现象出现，并且我们把甲现象称之为原因，把乙现象称之为结果。然而我们的结论合理吗？
甲与乙之间的所谓因果联系是必然的吗？休谟的回答是否定的。
　　我们可设想一下：主人每天给猪喂食，当猪看到主人来时，意味着食物送来了，然而猪不能必然性
地得出，主人来必然给它喂食物。因为，很可能的是，一天主人拎着刀杀它来了。这就是归纳法的困难。
　　哲学家无法证明归纳法的绝对合理性，如果要证明，肯定要引入其他的假定，假定自然是有规律的，
但是这样的假设是无法证明的。
　　虽然归纳法的合理性存在疑问，但归纳法在科学中的作用则不可低估——当然这不是我们上面所举
的例子中的简单的枚举归纳法，以至于有人说，归纳法是科学家的荣耀，哲学家的耻辱。
　　尽管如此，人们在日常生活中也是用归纳法来生活、工作的，归纳法是很有用的工具。如当我们看到
有乌云时，我们会想到要下雨了，因为以前有这样的现象，然而是否肯定下雨，则难说，但下雨的概然
性大，对我们来说，这就足够了。因此，归纳法是我们思维工具箱中的一个非常有用的工具，尽管不能时
时有效。
　　归纳法在人的互动行动中作用如何呢？这是我们下面要讨论的问题。
归纳的暴力：偷东西的人应该叫小偷吗？
对事物规则性的归纳得出的结论叫规律，规律以所谓命题的形式出现——所谓命题即是有真假的句子。命
题与事实的关系是上世纪哲学研究的一个重要内容，上面对归纳法的怀疑是对得出真命题的方法的怀疑。
这里我们不讨论这个问题。我们来分析人们是如何用归纳法对人的行动进行归纳从而决定自己的行动的。
　　在现实中人们经常用归纳法来对人下结论。如果我们看到某人几次做出同样的错事，我们肯定会认为
他的能力有问题；如果我们看到某人做出几件不好的事情，我们很容易怀疑他的道德。对他人归纳性的看
法会得出对方在同样的情形下会做出同样的事情的结论，因而我们会制定出自己的策略。但是，我们这样
做往往陷入误区。
　　不能说偷过东西的人永远会偷东西，因而叫他们是小偷或贼是不正确的，犯了错误的人不一定永远
犯错误。但我们往往这么思维。我们把偷了东西的人叫小偷的话，那么这种称呼本身就将他们归类，他们
成为另类，这样称呼本身就等于我们用语言在他们与我们之间划了一条横沟，因而，此时语言成了一种
不道德的暴力。从这一点来讲，我们的语言是不宽容的，或者说我们的语言存在着问题。
　　我们这里的讨论带有思辨的特点，然而我们在社会中确实是这样使用语言和思维的。我们正是通过对
认识的人的几次接触而对他们得出一个结论的，这个结论构成我们对之采取“回应行动”的基础。这个回
应行动包括“友好相处”、“防范对方的侵犯”、“追求从而成为恋人”、“冷漠”，等等，并根据不同情
况将周边的人分类成：可以成为朋友的、有可能成为敌人的、可以成为恋人或情人的、没有任何交往的，等
等。这样的归纳会发生错误，随着交往的深入，归纳会发生改变。当然有些归纳因某种现实的或偶然的原
因而永远得不到改变。
　　一个群体在长时间的交往接触中，分化出各种固定的关系来，有些成为固定的朋友，有些成为一般
的朋友，有些成为永远的敌人，当然也会出现恋人或爱人，还有一些形同陌路。即一均衡态出现了：周边
的人基本上被定了位，形成了固定的关系。而这一切从归纳开始，并且在不断的交往中对所归纳的看法给
以改正。这是一个博弈，在这个博弈中存在着一个对周边的人不断认识的过程，在博弈中称之为学习过程。
行动中的两种推理：归纳与演绎
博弈论是研究人的行为的，在博弈论中参与者一方面猜测其他参与者的策略，同时计算各种策略可能性
下的支付（得益）。然而在实际中，一般情况下，人们是很难计算得益的。此时人们往往准备了各种备选
策略，当其他参与者采取一确定策略时，自己将决定采取某种策略。
　　“人不犯我，我不犯人；人若犯我，我必犯人”。这是毛泽东的外交方针。一旦别人采
取某种策略，如敌人采取侵犯的策略，根据这个方针，可以推理出“我”将采取“犯”的策略。这就是逻
辑推理与行动之间的关系。
　　我们经常用逻辑推理的方法来确定自己的行动。
　　“如果天下雨，我将带伞”，这是我们日常的行动决定；“如果上证指数跌破 1500 点，我将大量买
进股票”，这是股民的决定，当然具体的股民的方案是不同的；而外交方面更是靠逻辑推理来确定自己
的行为，如：我国在台湾问题上采取“如果其他国家和台湾建交，中国政府将强烈抗议并与之断交”的
策略。因此，逻辑推理在社会行动中是确定策略的工具。
　　其实参与者在计算支付时，也是一样确定自己的策略，即确定：一旦别人采取什么策略，我将采取
什么策略更好——支付更大。
　　“如果天下雨，我将带伞”，“人不犯我，我不犯人；人若犯我，我必犯人”，这些是行动者制定
的行动规则，它们构成行动推论的大前提。如：
　　前提 1：如果天下雨，我将带伞；
　　前提 2：今天下雨；
　　结论：我要带伞。
　　又比如：
　　前提 1：人不犯我，我不犯人；人若犯我，我必犯人。
　　前提 2：张三犯我。
　　结论：我犯张三。
　　这两个推理是演绎的。
　　通过分析，我们看到，在人的行动中演绎推理发挥着重要作用。因此我们可以认为，逻辑是社会行动
的基础。这也是我们为什么分析社会行动主题的原因。
　　然而，行动中逻辑推理与认识中的逻辑推理的关系如何？行动中的演绎推理的结论肯定是真的吗？
　　在上一部分中我们说了，演绎性推理只要前提是真的，推理形式正确，结论肯定是真的。我们并没有
说，演绎推理分行动的和认识的两种。所以这个看法在行动的推理中同样正确。
　　然而人们的行动中的推理前提其正确性如何呢？这是问题所在。我们认为，人的认识中普遍性的命题
是真的，逻辑就是揭示这些普遍性的命题与个别性结论之间的关系。而人的行动中的前提是“某种条件下
的策略决定”，它为真吗？如果为真的话，是什么意义上的真？
　　这就涉及社会行动的本质问题。
　　首先，决定行动者的行动的前提是真的吗？如：“如果天下雨，我将带伞”是真的吗？对于这个命
题，其真值取决于“天下雨”与“我带伞”两个命题的值的组合，当“天下雨，我没有带伞”，此时命
题就假了。然而天下雨与我带伞之间的联系是由行动者“我”来规定的。因此我们可以说，前提真是“规
定真的”。
　　当然，这里的“规定的真”不是没有理由的，它是由行动者的理性与行动结构所决定的，如果是博
弈的话，这个结构就是博弈的结构。一旦行动者的结构给定了，理性的行动者的策略决定就确定了。
　　对于日常非博弈的情况，理性的行动者总是最大化自己的利益而制定策略的。试想一下，下雨时在不
带雨伞与带雨伞之间，行动者会选择后者，如果没有其他方便的避雨的手段的话。因为，不带雨伞会使自
己淋湿——被淋湿是任何人所不希望的。
酒吧问题与“百花奖”的评选 (1)
酒吧问题（bar problem），是美国人阿瑟（W.B.Arthur）1994 年在《美国经济评论》发表的《归纳论证和
有界理性》一文中提出的，后来在 1999 年的著名的《科学》杂志上发表的《复杂性和经济学》一文中阐述了
这个博弈。
　　阿瑟是斯坦福大学经济学系教授，同时是美国著名的圣塔菲研究所（Santa Fe Institute）研究人
员。他不满意经济学中认为的，经济主体或行动者（agent）的行动是建立在演绎
推理的基础之上的，而认为其行动是基于归纳的基础之上的。酒吧问题就是他为了说明这个问题而提出的。
　　该博弈是说：有一群人，比如总共有 100 人，每个周末，均要决定是去一酒吧活动还是呆在家里。酒
吧的容量是有限的，比如空间是有限的或者座位是有限的，如果人去多了，去酒吧的人会感到不舒服，
此时，他们留在家里比去酒吧更舒服。我们假定酒吧容量是 60 人，或者说座位是 60 个，如果某人预测去
酒吧的人数超过 60 人，他的决定是不去，反之则去。这 100 人如何做出去还是不去的决策呢？
　　假定每个参与者或决策者面临的信息只是以前去酒吧的人数，每个参与者只能根据以前去的人数的
信息归纳出策略来。没有其他信息，他们之间更没有信息交流。
　　这是一个典型的动态博弈问题，这是一群人之间的博弈。如果许多人预测去酒吧的人数多于 60，而决
定不去，那么，酒吧的人数将很少，这时候作出这些预测则错了。如果有很大一部分人预测去酒吧的人数
少于 60，因而去了酒吧，则去的人很多，多过 60，此时他们的预测也错了。因此一个作出正确的预测的
人应该能知道其他人如何作出预测的。但是在这个问题中每个人的预测的信息来源是一样的，即都是过去
的历史，而每个人不知道别人如何作出预测，因此，所谓正确预测是没有的。每个人只能根据以往历史“
归纳地”作出预测，而无其他办法。阿瑟教授提出这个问题也是强调在实际中归纳推理与行动之间的重要
性。
　　因此，对于这样的博弈的参与者来说，问题是他如何才能归纳出合理的行动策略。
　　例如，如果前面几周去酒吧的人数如下：
　　44，76，23，77，45，66，78，22
　　不同的行动者可作出不同的预测，例如预测：下次的人数将是前 4 周的平均数（53），两点的周期
环（78），与前面隔一周的相同（78）。
　　这样的预测种类会很多。在 2000 年 9 月中国科技大学主办的一个“经济物理学”国际讨论会上，香港
中文大学物理系的许伯铭博士说，他讲了这个问题后，叫研究生回去写出能想到的策略，研究生写出了
400 多条策略！
　　行动者根据这些预测来行动，然而这些预测是归纳性的。
　　通过计算机的模型实验，阿瑟得出一个有意思的结果：不同的行动者是根据自己的归纳来行动的，
并且，去酒吧人数的数字没有一个固定的规律，然而，经过一段时间以后，去酒吧的平均人数很快达到
60。即经过一段时间，这个系统中去与不去的人数之比是 60∶40，尽管每个人不会固定地属于去酒吧或不
去酒吧的人群，但这个系统的这个比例是不变的。阿瑟说，预测者自组织地形成一个生态稳定系统。
　　这就是酒吧问题。对于下次去酒吧的确定的人数，我们是无法作出肯定的预测，这是一混沌现象。
　　首先，混沌系统的行为，是不可预测的。对于酒吧问题，由于人们根据以往的历史来预测以后去酒吧
的人数——我们假定这个过程是这么进行的，过去的人数历史就很重要，然而过去的历史可以说是“任
意的”，未来就不可能得到一个确定的值。
　　其次，这是一个非线性过程。所谓非线性的过程是说，系统未来对初始值有强烈的敏感性。这就是人
们常常说的“蝴蝶效应”：在北京的一只蝴蝶煽动了一下翅膀，美国的华盛顿下了一场大暴雨。
　　在酒吧问题中，同样有这样的情况。假如其中一个人对未来的人数作出了一个预测而决定第 n 天去还
是不去酒吧，他的行为反映在下次去酒吧的人数上，这个数目对其他人的预测及第 n+1 天去和不去的决
策造成影响，即第 n+1 天中去酒吧的人数中含有他第 n 天的决策的影响。而他对第 n+2 天人数的预测要根
据 n+1 的人数，这样，他第 n 天的预测及行为给其他人造成的影响反过来又对他第 n+2 天的行为造成影响。
随着时间的推移，他的第 n 天的决策的效应会越积越多，从而使得整个过程是不可预测的。
　　人们总是根据过去的经验来归纳从而得出策略，这没有错，因为人们没有其他办法，在实际生活中
人们确实是这样的。我们在第一节分析过，归纳法在认识中是没有绝对合理性的，即没有任何办法来证明
它。在人们的行动中归纳法又是怎么样的呢？
　　归纳法在对人的行动的预测中更是没有合理性可言。尽管有很多预测办法，但没有理由认定其预测是
在合理的基础之上的。现在问题还没有结束。如果说，预测的办法没有合理的基础，那么存在一个合理的
学习机制吗？也就是说，错误的预测不要紧，但有没有办法改进这个预测，以至于下次能作出更好的预
测？在酒吧问题上，可以说没有这样的一个改进机制。
　　酒吧问题所反映的是这样一个社会现象，正像阿瑟教授说的那样，我们在许多行动中，要猜测别人
的行动，然而我们没有更多关于他人的信息，我们只有通过分析过去的历史来预测未来。
酒吧问题与“百花奖”的评选 (2)
　生活中有很多例子与这个模型是相同的。比如社会上经常举行的所谓大众评选活动，如全社会进行的“
十佳运动员”评选活动，电影爱好者的“百花奖”的评选活动。在这些投票过程中，对于每个投票者的激
励是：他如果“正确地”选中某些人，比如“十佳运动员”的评选，不仅要选中 10 个人，而且顺序也要
正确，那么投票者将获得某种奖励。但是如何才能选中“正确的”人选呢？有“正确的”人选吗？得票多
的就是“正确的”吗?严格地说：得票最多的是第一名（比如“十佳运动员”中的第一），得票次之的是
第二名（如“十佳”运动
员中的第二名），等等。因此，投票者能够选中的话，或者说被他提名的能够当选的话，关键是猜测
到别人的想法。猜测对了，你就能获奖；猜测错了，你则不能获奖。在这里，我们可以看到没有正确与否，
或者谁应该选上、谁不应该选上的问题，而是投票的人相互猜测的结果（在这个过程中当然舆论的导向作
用是很大的，它似乎告诉人们某某人是其他许多人所要选的）。这个例子与酒吧问题的结构是大众评选活
动一样的，只不过在评选上是一次性的，没有过去的历史让我们来归纳而已。这明显是博弈问题。另外一
个例子是，每年高校招生或研究生报名都呈现出混沌现象，考生通过各种渠道弄清以往专业的报名情况，
因为一个简单的道理是：如果报名的人太多，竞争太强，被录取的可能性就低。考生一般根据以往几年的
情况来推测当年报名的情况，然而这会造成不准确预测。当考生看到以往几年报名的人很多时，他会想下
次人还很多，因而他不敢报名。一旦大多数考生这么想，下次报名的人反而少了；反之，则又多。这与酒
吧问题有一致的结构。
少数者博弈及其应用：
股票买卖与交通拥挤问题在本书的导言中我们给出了少数者博弈（Minority Game）的简单模型：失火时
面对两个门，你将如何选择。现在我们来介绍这个模型。
　　少数者博弈是改变了形式的酒吧问题，是由一位定居瑞士的名叫张翼成的中国人在 1997 年提出的。
张教授祖籍河南，科大毕业后 80 年代初去了瑞士，现在瑞士的弗莱堡大学（University of Fribourg）
任教。他提出的少数者博弈影响很大，现在很多物理学家、博弈论专
家研究这个问题。比如，2000 年 9 月在中国科技大学召开的“经济物理学高级研讨班及金融复杂性国际学
术讨论会”上许多学者作的报告就是围绕这个问题的。
　　少数者博弈可以运用于股票市场。每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果
多数股民处于“卖”股票的位置，而你处于“买”的位置，股票价格低，你就是赢家；而当你处于少数
的“卖”股票的位置，多数人想“买”股票，那么你持有的股票价格将上涨，你将获利。而股民采取什么
样的策略则多种多样，而策略的得出完全是根据他们以往的经验归纳出来的，因而类似于这里的少数者
博弈的情况。但是物理学家对少数者博弈研究的结论能否用来指导股民在股票市场上搏杀，本人不得而知。
　　不过本人认为，少数者博弈中一个特殊的结论不具有普遍意义，即：记忆长度长的人未必一定具有
优势，因为，如果确实有这样的方法的话，在股票市场上，人们利用计算机存储的大量的股票的历史数
据就肯定能够赚到钱了。但是，这样一来，人们将争抢着去购买存储量大即硬盘空间大以及计算速度快的
计算机了，在实际中人们还没有发现这是一个炒股票必定赢的方法。
　　交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越来越拥挤，选择行车路线也是不断的
博弈过程。在交通高峰期间，司机面临两条路的选择时，往往要选择没有太多车的路线行走，此时他宁愿
多开一段路程而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验来判断哪条路更好走，而所有
司机都不愿意在塞车的道路上行走。因此每一个司机的选择必须考虑其他司机的选择。这也是一个少数者
博弈问题。
　　当然在司机行车的少数者博弈问题中，司机经过多次的选择和学习，许多司机往往能找到规则性，
这是以往成功和失败的经验教训给他的指引，但这不是必然有效的规则性。在这个过程中，司机的经验和
司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段；有的司机经验不足，往往不能
有效避开高峰路段；有的司机喜欢冒险，宁愿选择短距离的路线；而有的司机因为保守而宁愿选择有较
少堵车的较远的路线，等等。最终的路线的拥挤程度就由不同特点和不同经验的司机的选择所构成。
对称的人群为什么会出现破缺性的行动？
——盲目的学习人们拥有的知识是其行动的基础。在上面的酒吧问题中，每个行动者面对的信息是一样的，
但每个人所用的预测方法是不同的，即他们所归纳出的预测公式是不同的（这也就是为什么我们说这种
归纳没有合理的基础的原因）。然而，尽管如此，对整体人群来说，平均去酒吧的人数占总人数的 60%。对
每个人来讲，他的预测与行动独立于其他人将要作出的选择——因为假定他们之间没有信息交流。可以这
么说，60%两边是对称的。
　　还有另外一种非对称的情况。我们假定，人们没有足够的知识以支撑自己的行动。如果对可选择的策
略或行动没有任何知识，此时行动者的行为就会出现盲目性。但是由于人本身具有学习的天性，快速的学
习过程就发生了。让我们看一个例子。
　　这是一个心理学上的例子：有一群人鱼贯进入一个房间，拿一瓶饮料喝。在他们面前有多种饮料，假
定是 3 种，房间很黑，每个人无法通过视觉判定饮料的质量，当然更无法看清品牌，也就是说，3 种饮料
给他们呈现的是同样的视觉图像。此时的选择会是怎样的结果呢？
　　通过实验发现，人们会将特别“偏爱”一种饮料，即几乎所有人都选择一种饮料，而不是 3 种饮料
平均被选取。这里他们所“偏爱”的并非是特定的，在不同的人群中做同样的实验，出现的情况是一样的，
只不过每一次被大多数人选取的饮料会不同。此时被选取的饮料具有非对称性。
　　按通常的情况，假定饮料给每个人呈现同样的视觉图像，人群会出现对称性选择，即每个人会在所
给定的几种饮料中随机选取。而由于群体的存在，即使不同的人对某种颜色有偏爱——我们假定人们可看
到颜色，每个人的偏爱也会被抵消掉。对群体来说，每种饮料被选取的可能性是一样的。
　　出现选择的非对称性完全是由于人们的选择行动之间的相互作用。其实这是微妙的，同时是不合理的
学习过程。第一个人选取饮料可以说是随机的，在备选的几种饮料中选取完全是任意的，但是接着的人对
饮料的选取则不是任意的。由于看到第一个人选择了某种饮料，他会认为第一个人的选取是有根据的，从
而也会选择第一个人所选取的饮料。后面的人也会这样想。于是第一个人对某种饮料的选取会传递下去，
并且这个过程中越到后面的人越有理由相信选择该种饮料是有根据的。这就是为什么所有的人都倾向于选
择一种饮料。
　　这就是为什么出现非对称的选择结果了。这种传递不是通过语言，而是通过对前面人的选择行动的观
察。这是一个学习目的学习过程，并且是一个没有理由的学习过程，也就是说这样的学习过程是没有根据
的。
　　这个心理学上的实验。反映了人们之间互动的情况。这个盲目的跟随现象或者说盲目的学习现象在现
实生活中处处可见。
蜈蚣博弈的悖论
倒推法是分析完全且完美信息下的动态博弈的有用工具，在第四章我们分析言语博弈中“威胁”或“承
诺”是否可信时，已给出了一个倒推法例子。我们看到，倒推法符合我们的直觉。然而，通过下面的蜈蚣
博弈的悖论，我们将看到倒推法存在致命的缺陷。
　　蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈：两个参与者 A、B 轮流进行策略选择，
可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定 A 先选，然后是 B，接着是 A，如此交
替进行。A、B 之间的博弈次数为有限次，比如 100 次。假定这个博弈各自的支付给定如下：
　　合作合作合作合作
　　A B A …… A B （100，100）
　　背叛背叛背叛背叛
　　（1，1）（0，3）（2，2）（99，99）（98，101）
　　现在的问题是：A、B 是如何进行策略选择的？
　　这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
　　这个博弈的奇特之处是：当 A 决策时，他考虑博弈的最后一步即第 100 步；B 在“合作”和“背叛”
之间作出选择时，因“合作”给 B 带来 100 的收益，而“不合作”带来 101 的收益，根据理性人的假定，
B 会选择“背叛”。但是，要经过第 99 步才到第 100 步，在 99 步，A 考虑到 B 在 100 步时会选择“背叛”
——此时 A 的收益是 98，小于 B 合作时的 100，那么在第 99 步时，他的最优策略是“背叛”——因为“
背叛”的收益 99 大于“合作”的收益 98……如此推论下去，最后的结论是：在第一步 A 将选择“不合作
”，此时各自的收益为 1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。
　　根据倒推法，结果是令人悲伤的。从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告
诉我们，一开始就采取不合作的策略获取的收益只能为 1，而采取合作性策略有可能获取的收益为 100。
当然，A 一开始采取合作性策略的收益有可能为 0，但 1 或者 0 与 100 相比实在是太小了。直觉告诉我们采
取合作策略是好的。而从逻辑的角度看，一开始 A 应取不合作的策略。我们不禁要问：是倒推法错了，还
是直觉错了？
　　这就是蜈蚣博弈的悖论。
　　什么是悖论？悖论(paradox)来源于希腊语，para 意即“超越”，doxos 的意思是“相信”。Paradox
的意思是：本来可以相信的东西不能相信，而有的东西看起来不可信但是反而是正确的。悖论指由肯定它
真，就推出它假，由肯定它假，就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟
”的芝诺悖论，“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论，“一个理发师说：‘我给
所有不给自己理发的人理发’”的理发师悖论或罗素悖论，等等。这些悖论在历史上对于逻辑和数学的发
展起了巨大的作用。
　　对于蜈蚣悖论，许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验［目前通过实
验验证集体的交互行为已成时尚，正如博弈论专家英国的宾莫（Ken Binmore）所言，诺贝尔奖也无疑在
考虑这方面的先驱者］，实验发现，不会出现一开始选择“不合作”策略而双方获得收益 1 的情况。双方
会自动选择合作性策略，从而走向合作。这种做法违反倒推法，但实际上双方这样做，要好于一开始 A 就
采取不合作的策略。
　　倒推法似乎是不正确的。然而，我们会发现，即使双方开始能走向合作，即双方均采取合作策略，这
种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。倒推法肯
定在某一步要起作用。只要倒推法在起作用，合作便不能进行下去。
　　这个悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定
在何处采取“不合作”策略。
最后通牒博弈中理性的困境
　有这样一个博弈：
　　两人分一笔总量固定的钱，比如 100 元。方法是：一人提出方案，另外一人表决。如果表决的人同意，
那么就按提出的方案来分；如果不同意的话，两人将一无所得。比如 A 提方案，B 表决。如果 A 提的方案是
70∶30，即 A 得 70 元，B 得 30 元。如果 B 接受，则 A 得 70 元，B 得 30 元；如果 B 不同意，则两人将什么
都得不到。
　　A 提方案时要猜测 B 的反应，A 会这样想：根据理性人的假定，A 无论提出什么方案给 B——除了将所
有 100 元留给自己而一点不给 B 留这样极端的情况，B 只有接受，因为 B 接受了还有所得，而不接受将一
无所获——当然此时 A 也将一无所获。此时理性的 A 的方案可以是：留给 B 一点点比如 1 分钱，而将 99.99
元归为己有，即方案是：99.99∶0.01。B 接受了还会有 0.01 元，而不接受，将什么也没有。
　　这是根据理性人的假定的结果，而实际则不是这个结果。英国博弈论专家宾莫做了实验，发现提方案
者倾向于提 50∶50，而接受者会倾向于：如果给他的少于 30%，他将拒绝；多于 30%，则不拒绝。
　　这个博弈反映的是“人是理性的”这样的假定在某些时候存在着与实际不符的情况。
　　理论的假定与实际不符的另外一个例子是“彩票问题”。
　　我们说理性的人是使自己的效益最大，如果在信息不完全的情况下则是使自己的期望效益最大。但是
这难以解释现实中人们购买彩票的现象。
　　人们愿意掏少量的钱去买彩票，如买福利彩票、体育彩票等，以博取高额的回报。在这样的过程中，
人们自己的选择理性发挥不出来，而惟有靠运气。在这个博弈中，人们要在决定购买彩票还是决定不买彩
票之间进行选择，根据理性人的假定，选择不买彩票是理性的，而选择买彩票是不理性的。
　　彩票的命中率肯定低，并且命中率与命中所得相乘肯定低于购买的付出，因为彩票的发行者早已计
算过了，他们通过发行彩票将获得高额回报，他们肯定赢。在这样的博弈中，彩票购买者是不理性的：他
未使自己的期望效益最大。但在社会上有各种各样的彩票存在，也有大量的人来购买。可见，理性人的假
定是不符合实际情况的。
　　当然我们可以给出这样一个解释：现实中人的理性的计算能力往往用在不符合实际情况的“高效用
”问题上，而在“低效用”问题上，理性往往失去作用，对于人来说，存在着“低效用的区决策陷阱”。
在购买彩票问题上，付出少量的金钱给购买者带来的损失不大，损失的效用几乎为零，而所能命中的期
望也几乎是零，这时候，影响人抉择的是非理性的因素。比如，考虑到如果自己运气好的话，可以获得高
回报，这样可以给自己带来更大的效用，等等。彩票发行者正是利用人存在着“低效用区的决策陷阱”而
寻求保证赚钱的获利途径。
陈水扁上台与民主选举的 (1)
不可根除的缺陷蜈蚣博弈的悖论反映了单个参与者博弈的困难，个体难以在“利己”和“利他”之
间找到一个合理的策略。蜈蚣博弈悖论是单个决策者的决策悖论，它反映了个体理性的局限。
　　在集体进行决策时同样也面临着理性的局限。2000 年台湾所谓“总统”选举可以说是中国发生的一件
大事。对于中国大陆来说，谁来做台湾新的领导人意味着台湾的未来走向，即：独立还是统一。而对于
台湾人民，新的领导人的未来政策意味着给他们带来灾难还是福祉。
　　选举的结果是民进党的陈水扁上台，陈水扁成了台湾第一任“民选总统”，国民党自 1949 年逃到台
湾 51 年后，终于交出了政权。现在大家不禁要问：作为台湾第一大党的国民党为什么输给了弱小的民进
党？陈水扁上台真的意味着台湾的“民意”吗？
　　大家知道，这次选举的结果是李登辉“弃连保扁”的阴谋得逞。李登辉是国民党主席，国民党跑到台
湾，其政治主张是一个中国，长期抱着反攻大陆的思想。随着共产党在大陆的渐渐强大，国民党认识到反
攻大陆是不可能的，然而有大陆情结的国民党虽然与共产党势不两立，一山不能容纳二虎，但因其坚持
“一个中国”的立场，所以国民党执政期间，不存在台独泛滥问题。
　　然而到了李登辉时代，情形发生了变化，在国民党内部分裂成主张统一的“统一派”和主张独立的
“独派”。骨子里主张台独的李登辉，由于是国民党主席，无法施展他内心的政治主张。他只能从所谓理
论上“论证”台湾与大陆的不同、台湾独立的合理性，这就是臭名昭著的“两国论”、“七国论”。在理论
上他要阐述他的“政治思想”，以成为台湾所谓的“国父”；在行动上他找到了与他内心政治主张一致
的人，这就是主张台湾独立的民进党主席陈水扁。因而作为国民党主席的李登辉，在实际行动上支持陈水
扁。
　　可以说，国民党被李登辉“玩残”，他真独立的主张使国民党发生分裂。主张统一的宋楚瑜被李登辉
开除出党。宋楚瑜原来是李登辉政治上坚强的合作伙伴，因为他的资历，他得到大批的国民党党员的拥护。
李登辉与宋楚瑜分道扬镳使得宋楚瑜另立山头，成立了新党。国民党被李登辉肢解。
　　此次台湾选举是所谓的“民主选举”，各党派“平等竞争”。从理论上讲，弱小的党派获得选举胜利
可能吗？我们将在下一节从理论上简单地阐述这是可能的，但是需要一定的条件。我们先来看一下陈水扁
是如何上台的。
　　李登辉推出连战作为国民党的“总统”候选人，但是身为国民党主席却在不同场合下支持陈水扁，
使得民进党得以快速发展。“总统”的竞争最后在宋楚瑜、陈水扁、连战以及独立候选人李敖四者之间角
逐。最后，陈水扁以微弱优势获胜，而宋楚瑜和连战均告失败。
　　大家想一想，如果李登辉不耍“弃连保扁”的政治伎俩，或者维护国民党的统一而不使其分裂，使
得国民党只有一人参加竞选，那么支持宋楚瑜加上连战的总票数肯定超过陈水扁。
　　另外一种情况是，假如台湾选举不是直选，选举规则是先角逐出两个而不是多个候选人，然后再在
这两个候选人之间进行竞选，会出现什么结果呢？我们可以看一下，假定陈水扁能顺利过第一关而成为
两个候选人之一，而宋楚瑜、连战有一个成为候选人，假定是连战，在连战与陈水扁之间的最后角逐中，
支持宋楚瑜的选民这次会支持连战——因他们的政治主张相近，那么连战获胜的机会肯定大于陈水扁。但
是事实上不是这样，选举中各候选人同时竞选，国民党因分裂而使陈水扁得以上台。
　　现在我们来看一下中国申办 2000 年奥运会失败的例子。北京 1992 年开始大张旗鼓地申请主办 2000 年
奥运会的工作。申办奥运会的投票规则是逐步淘汰制，具有投票权的委员在参加申请的城市里进行投票，
得票最少的城市便被淘汰。前两轮投票中北京一直领先。经过两轮投票，最后剩下 3 家：德国的柏林、澳大
利亚的悉尼以及中国的北京。在第三轮投票时，北京获得最多的票，悉尼第二，柏林第三。
　　这一轮投票结束后，柏林被淘汰掉。如果就这一次投票，北京就获胜。但问题是还得再投一次票。当在
北京与悉尼之间角逐时，北京肯定会再次获得胜利吗？
　　事实是，北京输了，悉尼获得了举办 2000 年奥运会的主办权。为什么会这样？原来支持柏林的投票
人大多数转而支持悉尼。这就是悉尼获胜的原因。
　　由此看来，民主投票不能得出惟一的结果，其选举结果取决于民主投票的程序安排以及每次确定的
候选人的多少，即投票规则。不同的投票规则将得出不同的选举结果。这就是说，民主投票有内在的缺陷。
我们将用著名经济学家阿罗提出的“不可能性定理”来说明，民主制度存在着缺陷。四、通过民主的方式
能使少数人支持的候选人赢吗？读者会问，能不能通过所谓民主选举而得出任意结果呢？
　　可以这样说：假定一次性选举时所有人都选某一个人，那么在任何的选举规则下，即通过任何的选
举（无论独裁的还是不同民主规则下的选举），这个人肯定当选。在这种极端情况下，无论什么制度对选
举人都一样，独裁制度也会得出这个结果。当然如果所有人都不选某一个人，什么制度的设计也都一样，
无论是民主的还是独裁的都会得出同样的结果，并且无论设计什么样的规则，结果都一样。这就是为什么
历史上的独裁者认为，他是人民的代表，他的决定代表着民意，因为代表着民意意味着你们对所有的决
定不要再表达自己的意见了，我的意见就是你们的意见，即使通过民主的方式，也是同样的结果。这就是
独裁者经常强奸民意的理论根据。
陈水扁上台与民主选举的 (2)
而当人们的偏好不同时，民主选举程序的规则设计就极大地影响着选举结果。
　　我们举一个例子。一由 n 人组成的社会，假定 n 取 300，对候选人 A、B 进行选举，并假定进行一次性
投票，此时有 2/3 的人反对 A 而选举 B，1/3 的人选 A 而不选 B。我们有没有办法设计一个结构，通过“民
主的”投票规则使 A 能够当选呢？我们说这是可能的。
　　假定大家都同意服从大多数原则，但程序可以商量。我们把这 300 人构成 3 组——这 3 组既可以天然
地形成，也可以设计。每组中候选人获得该组的大多数选票，他就赢得这组的选举，3 组中赢得 2 组即赢
得大多数，就算赢了。我想，在实际中这些是任何候选人都能同意的，并且也认为是公平的。我们假定每
组的人数不是一样的：第一组是 50 人，第二组是 100 人，第三组是 150 人——我们这里人数的确定完全
是随意的。假定第一组中有 30 人赞成 A 而反对 B，第二组中有 60 人赞成 A 而反对 B，第三组中 10 人赞成 A
而反对 B。即：第一组 A 与 B 的比例是：30∶20；第二组 A 与 B 的比例是：60∶40；第三组 A 与 B 的比例是：
10∶140。
　　在这样一种规则下进行投票，A 获得了 3 组中 2 组的赞成票。A 获胜。
　　在这个例子中，如果不分组就选一次，那么 B 肯定获胜。
　　这个例子中，使 B 获胜的是直选机制，使 A 获胜的是间接选举机制。台湾采取的是前者，美国采取的
是后者。
　　布坎南在《同意的计算》布坎南，塔洛克：《同意的计算》，中国社会科学出版社，2000 年版，第 242
页。中举了另外一个例子。一个 25 个人组成的社会，只需要 9 个人同意某个议案就可使得它通过。具体地说，
可以将这 25 个人分成 5 个区，每个区 5 个人，这样，只要有 3 个区（5 个区中的多数）中的多数同意，即
每个区有 3 个人同意就能使一项议案通过。
　　具体地，我们可将 25 个人分成 A、B、C、D、E 共 5 个区。同意者分在 A、B、C 三区，见下表。
　　ABCDE***************
　　这完全可以在“大多数”原则下使一项议案得到通过，尽管可以有 16 人不同意。如果是 36961 人
（199×199）的一个社会，只需 10000 人就可使一项议案获得通过，只比总数的 1/4 多一些，而无须多于
1/2 的人同意。即用此方法对两个候选人或候选议案进行选举或进行表决，可以使其中本来获得少数人同
意的当选。
　　这说明民主选举有其局限性，但并不是说民主选举是虚伪的和带欺骗性的，当然更不能构成不进行
民主选举的理由。正如有一篇讨论民主与丑闻的文章里说的那样，民主选举不是绝对好的，但反民主绝对
是坏的。在民主社会里，罪恶被最大限度地暴露出来，并受到谴责，因此抑制了更多的罪恶；而在反民主
的社会里，罪恶被最大限度地掩盖起来，于是往往导致更大的罪恶。斯塔尔法官对克林顿与莱温斯基的性
丑闻穷追不舍，克林顿为此不得不在电视上公开道歉。总统没有绝对的权力，他也有服软的时候。
　　选举是揭示群体偏好的一种方法，我们这里要说的是，一群体进行的所谓民主选举并不能客观地揭
示一群体成员的偏好。
革命：另外一种投票方式
投票是加总社会中各个人偏好的一种方式。我们已说明，无论哪种投票制度都是不完善的，之所以采用是
因为对所有的候选人来说是公平的。对于群体选择，或者表达群体偏好，还存在另外的方法——革命，或
者如毛泽东所说的“枪杆子里面出政权”。革命是极端的投票方式。
　　一个合理的社会将不断地调整社会财富的分配，如所得税率实行低收入低征乃至于不征，高收入按
高比率征收的方法。当财富集中在少数人手里时，两极分化严重，社会出现极度的不公正，对一社会来说
隐藏着巨大的社会危机。危机意味着革命的发生。
　　什么是革命？革命是政治学范畴，如果从经济学范畴来说，革命就是社会财富的再分配。在经济学里
有边际效用递减规律。所谓效用是指物品对人的需要或欲望的满足程度，而边际效用指的是消费者在消费
物品时所消费的每一单位物品给他的满足程度。比如：某人一顿吃了 3 碗饭，每一碗饭给他一个效用；一
富豪买了一辆奔驰车后又买了第二辆奔驰车，他买第一辆奔驰车和第二辆奔驰车时的满足程度是不同的。
这就是边际效用的概念。
　　边际效用递减规律说的是，消费者在消费物品时，每一单位物品对消费者的效用是不同的，它们呈
递减关系。无论是饿着肚子的人还是饱食终日的人，第一碗饭给他的效用最大，第二碗饭则没有那么大的
效用了，吃到一定程度后，再吃的话，饭给他的效用是负的，即不仅不能给他好处，反而是负担。对买车
的人也一样，当他买了第一辆奔驰车时，他感到方便很多，同时有巨大的心理满足感。当他买第二辆奔驰
车时，他不能同时用两辆车，这第二辆车给他的方便及满足感会没有第一辆车大。当然第二辆车会体现他
的成功，从而增加他的炫耀资本，此时总的效用是增加的，但增加的幅度没有他买第一辆车时增加的幅
度大。如果他继续购买车，他想，买了车后，既要雇司机，又要准备停车的车库，同时要防范窃贼的光顾，
等等，会感觉到得不偿失。这第三辆车给他带来的效用更低了。
　　可以这么认为，边际效用递减规律是关于人的规律，正如诺贝尔奖获得者 H.西蒙提出的关于人的理
性是有限的看法，它们均为关于人的假设。
　　人的边际效用是递减的，那么将财富从富人那里部分地转移到穷人那里似乎是合理的，此时富人的
效用减少了，但减少得不多，但穷人增加的效用则很大。如果一个社会贫富悬殊过大，政府又没有调节好
贫富之间的关系，那么革命就有可能发生。
　　劫富济贫从来就是不合法但被颂扬的行为，因为它增进了大多数人的效用，在政府无力的时候，这
是惟一的增进社会总的效用的方式。抢夺富人接济穷人，或者因生活潦倒、无法生存而去抢夺富人的东西
以活命，同样增进社会的效用。当然，抢劫穷人的物品来为自己享用是土匪行径，这种行为是可耻的。
　　从这个意义上说，革命就是多数人通过暴力对少数人的财富进行剥夺和再分配，因此它是一种偏好
的表达方式，是非和平的方式，而不像投票那样的和平方式。之所以要采取暴力的方式，是因为，一般情
况下，理性的财富拥有者是不会自动地将财富分给穷人的，慈善者除外。
　　革命：另外一种投票方式革命不同于民主的选举方式和民主化的决策方式，革命是非理性的。如果一
个社会有合理地表达人民意愿（或偏好）的程序或方法，那么革命就不会发生。但是正如我们上面说的那
样，由于不可能有一种绝对合理的民主决策方式，任何决策方式本身都只是一种在某种程度上揭示偏好
的方法而已。因此，任何社会都不能排除革命的可能。
　　在民主社会里人民的偏好得到一定程度的表达，发生革命的概率较低。一般情况下，革命不是发生在
专制社会里，就是发生在前民主的社会里，前者完全没有表达人民意愿的机会，后者表达人民意愿的机
制尚不完善。一个完善的社会制度存在一个渐进完善的机制，可以在某种程度上化解革命的发生，这样才
能避免社会震荡。
　　中国古代的朝代更替就是震荡式的。专制社会没有人民表达意愿的机会，再加上“家天下”的政治机
制不存在“退出”机制，人民只能以激烈的方式来表达自己的意愿。
　　因此，对于社会来说，关键不在于它现在的体制多么不完善、政治架构多么不合理，而在于它是否有
一个合理改进的机制，从而使得制度渐进合理。
哈定悲剧
在人类社会中存在群体行动的悲剧。这种悲剧是群体的而非个人的，不是个人命运遭受的不公平对待，而
是群体在行动过程中所遭受的不可避免的集体性灾难。
　　什么是悲剧？著名哲学家怀特海在《科学与近代世界》一书中描述希腊戏剧时说：“悲剧的本质并不
是不幸，而是事物无情活动的严肃性。但这种命运的必然性，只有通过人生中真实的不幸遭遇才能说明。
因为只有通过这些剧情才能说明逃避是无用的。”群体行动的悲剧也是这样：它不是群体偶然性的不幸，
而是具有必然性，每个人都意识到这种悲剧，但无法摆脱。说群体悲剧是群体遭受的难以抗拒的灾难，一
定程度上指群体受一个无情法则的支配。一定意义上，这种悲剧是社会的规律造成的——当然我们这里使
用规律一词是比较危险的，因为规律意味着与人的自由相对抗，人绝对不可避免，然而我们在第 9 章将
分析，人类的文化或文明正是对不可抗拒的悲剧的抵抗。
　　让我们看一下著名的公共资源悲剧问题，即哈定悲剧。该问题是经济学中的经典问题，也是博弈论教
科书中必定要讨论的问题。
　　公共资源悲剧最初由哈定提出。哈定（Garrit Hadin）1968 年在《科学》杂志上发表了一篇文章，题为
The Tragedy of the Commons。北京大学的张维迎教授将之译成《公共地悲剧》，但哈定那里的 the
commons 不仅仅指公共的土地，而且指公共的水域、空间等等；武汉大学的朱志方教授将 The Tragedy of
the Commons 译成《大锅饭悲剧》，有一定的道理，但也不完全切合哈定所表达的意思。将 the commons 译
成“公共资源”似乎更确切些。哈定描述的 The Tragedy of the Commons，我们可称为哈定悲剧。
　　哈定举了这样一个具体事例：一群牧民面对向他们开放的草地，每一个牧民都想多养一头牛，因为
多养一头牛增加的收益大于其购养成本，是合算的，尽管因平均草量下降，可能使整个牧区的牛的单位
收益下降。每个牧民都可能多增加一头牛，草地将可能被过度放牧，从而不能满足牛的食量，致使所有牧
民的牛均饿死。这就是公共资源的悲剧。
　　对公共资源的悲剧有许多解决办法，哈定说，我们可以将之卖掉，使之成为私有财产；可以作为公
共财产保留，但准许进入，这种准许可以以多种方式来进行。哈定说，这些意见均合理，也均有可反驳的
地方，“但是我们必须选择，否则我们就等于认同了公共地的毁灭，我们只能在国家公园里回忆它们。”
　　哈定说，像公共草地、人口过度增长、武器竞赛这样的困境“没有技术的解决途径”，所谓技术解决
途径，是指“仅在自然科学中的技术的变化，而很少要求或不要求人类价值或道德观念的转变”。
　　对公共资源悲剧的防止有两种办法：一是制度上的，即建立中心化的权力机构，无论这种权力机构
是公共的还是私人的——私人对公共地的拥有即处置便是在使用权力；第二种便是道德约束，道德约束
与非中心化的奖惩联系在一起。
　　在实际中也许可以避免这种悲剧。当悲剧未发生时，如果建立起来一套价值观或者一个中心化的权力
机构，这种权力机构可以通过牧牛成本控制数量或采取其他办法控制数量。
中国北方草原荒漠化的问题
据中央电视台的新闻报道，2001 年新年的第一天，北京市和银川市发生沙尘现象，沙尘像雾一样笼罩在
这两个城市的上空。生态警钟再次敲响。
　　河北境内的沙漠直逼北京，河北的怀来县离北京只有 60 公里！专家预测，如不想出有效办法对沙漠
进行治理，过不了多长时间，北京将消失，被沙漠掩盖，像消失的楼兰文明。
　　土地荒漠化是中国重大的生态问题。中国土地的荒漠化集中在中国的北部，即内蒙、新疆、黑龙江、宁
夏等省份。来自北面的风沙侵袭着北京，以至于北京的风沙一年比一年大，1999 年发生了两次沙尘暴！
　　荒漠化的速度呈上升趋势。20 世纪 50 年代至 70 年代中期，土地荒漠化年均扩大 1560 平方公里；而
在 70 年代中期到 80 年代中期，年均扩大面积为 2100 平方公里。目前的扩大速度为每年 2460 平方公里。这
个速度还在增加。
　　现在普遍的观点是，荒漠化的原因，是由于人类对土地资源的过度利用，对土地的利用超过了它的
承受能力。在北方，雨水量小，土地上的生态系统脆弱，为了维持人口的过度增长对粮食等的需求，人们
对土地的索取呈加速趋势。对土地的“滥垦”、“滥牧”、“滥樵”、“滥采”是土地沙漠化的主要原因。
　　据调查，在牧区，草原上的牲畜严重超载已成普遍现象，牧区一般超载 50%～120%，有的地区达到
300%！
　　发菜是宁夏“四宝”之一的“黑”宝，宁夏的农民为了多赚钱，大规模地采集发菜，以销往南方，
以至于当地政府不得不明令禁止这种行为，并将发菜从宁夏“四宝”中去除。而在甘肃挖甘草已成致富之
路，据估计每挖 10 公斤甘草要破坏 5.3 公顷～7.3 公顷的草地。
　　这与哈定的公共资源悲剧何其相同，其原因就在于环境资源是大家的。
发展经济与对自然的破坏
现在各国都在发展经济，GNP（国民生产总值）或人均 GNP 是一国富裕程度的指标，或者说是国力强弱的
指标，各个国家都在制订促使 GNP 增长的政策。然而，GNP 的增长完全建立在对自然的破坏之上，可以这
么说，GNP 是对自然破坏的指标。
　　当然，有很多人不同意我这里的观点。为什么美国那么富裕，而对自然破坏得较少？美国的环境是保
护得最好的。其实，这有三个原因：第一，美国的生产或消耗的原料有很大一部分来自于别国，如石油来
自中东，美国 GNP 的增长建立在他国对自然的破坏之上；第二，美国的产品许多是高科技产品，高科技
产品对自然的破坏较轻，但它会加大人类的破坏力量；第三，像美国生产的高科技产品往往难以被自然
消解，自然对加工粗糙的产品的消解是容易的，而对用高科技制造出来的精巧的物品消解起来是缓慢的，
但这种对自然的破坏不是那样直观，因此常被我们忽略。
　　可以这么认为，人类社会的发展对个人来说是没有选择的自由的。当周边国家进入工业社会，发展机
器工业，可以在较短的时间生产出比农业社会更多的物资，并且可以生产出以前没有的东西，试想一想，
有哪个国家看到这种情形还会无动于衷？并且重要的是，没有选择发展工业的国家面对周边国家的强盛，
它的安全受到威胁，它除了被动地选择进入工业社会，别无其他选择。18 世纪工业革命首先发生在英国，
西方国家相继进入工业社会。而远东的中国，在距离上离发生工业革命的西欧较远，直到 19 世纪中叶才
感受到工业革命的冲击——在列强枪炮的攻击下被动地接受工业化。20 世纪的中国其实是被动地接受现代
化的。在社会发展史上人们在很大程度上是没有多少选择余地的，这一点正如马克思所认为的，生产力是
最具革命性的力量，它促进生产关系的发展。
　　我们这里要说的不是历史的发展规律问题，而是要表明：当前世界各国竞相发展经济、对自然进行破
坏，是一个集体行动的悲剧。有读者可能无法理解：发展经济是好事，为什么能和哈定悲剧联系在一起？
　　发展经济对人类确实是好事，人类总不能生活得与动物世界一样。但问题是，当今经济的发展已经进
入过渡时期，经济的发展造成了环境的破坏。
　　市场经济是竞争经济，在这样一个优胜劣汰的格局下，拼命地向自然索取或者说掠夺是现时代的特
征。每个竞争者——可以小到个人，大到国家——都这样想：我不发展就有可能被淘汰出局。而经济的发
展就是对自然的利用——无论这种利用是对自然中原始物的加工还是对中间产品的再加工，其结果都是
自然被加速地破坏。这就是自然的生态状况愈来愈恶化的原因，其结果是人类的生存环境越来越恶劣。这
也是囚徒困境。
　　许多人清楚人类目前的这种状况，但谁也没有良药，因为“破坏—发展”是占优策略，每个参与者
采取“破坏—发展”成为集体行动的纳什均衡。这就是悲剧：大家都意识到问题所在，但大家都无能为力。
光天化日之下的违法
行为为什么总能成功？人类有许多关于猴子的故事，比如朝三暮四，杀鸡给猴看。其实猴子是没有思维的，
它们有一定的群体意识，但没有社会意识，人们关于它们的故事其实是说人自己的。我们这里也讲一个猴
子的故事。
　　在一个笼子里关了一群猴子，主人每过一天就打开笼子抓一只猴子去杀掉。每天主人来时，每个猴子
都紧张，它们不敢有任何举动，怕引起主人的注意而被主人选中。当主人把目
光落在其中一只猴子身上时，其余的猴子就希望主人赶快决定。当主人最终作出决定时，没有被选中的猴
子非常高兴。那个被选中的猴子拼命反抗，其余猴子在一旁幸灾乐祸地观看，这只猴子被杀掉了。这样的
过程日复一日地进行着，最终猴子全部被宰杀掉了。
　　如果这群猴子群起而攻之，有可能会逃掉。但每只猴子不知道其余的猴子是否会和它一起反抗，它怕
自己的反抗会引起主人的注意而被主人选中宰杀掉。
　　在现实社会中，窃贼在公共场所比如公共汽车上偷东西时，车上的乘客看到了，但不敢吭声。没有被
偷的人想，反正被偷的待宰猴群的结局人不是我，我反抗了，我得不到任何好处，反而遭到伤害；而不
反抗虽不得益，但也不受损，我何必要反抗呢？这就是光天化日之下的偷窃行为为什么总能成功的原因。
　　窃贼在偷东西时发出这样的信号：如果谁反抗，将殴打谁。乘客想，窃贼的威胁是可信的：因为如果
个别乘客反抗，而窃贼不殴打该乘客的话，就会有更多的乘客抓窃贼，窃贼将有可能被抓，因此窃贼必
然欧打反抗的乘客。乘客的策略及可能的支付为：反抗，有可能被殴打甚至受伤；不反抗，无所得也无
所失。这一博弈过程为：
　　对于乘客来说，窃贼的威胁是可信的，因而乘客的最优策略是“不反抗”；而对于窃贼来说，乘客
“不反抗”下的“不殴打”策略为最忧。
　　这一博弈的结果是，窃贼偷东西时“乘客不反抗，窃贼不敢打”，这是一“子精炼纳什均衡”。
　　这样一种群体不反抗的结果将使社会风气恶化，偷窃之风盛行。对个体来说，虽然这一次被偷的不是
你，但下次你被偷的几率增加了。这使得我们都如同待宰的猴子，我们不知道什么时候轮到我们自己。这
样，我们每个人的处境比以前更差。
　　如何从这种困境中摆脱出来？
　　我们看到，使乘客采取“反抗”策略，而非“不反抗”策略在于加大采取“反抗”策略的获益，而
减少不反抗的获益。当“反抗”策略下的获益大于“不反抗”策略下的获益时，乘客就会采取“反抗”的
策略。
　　加大道德宣传，培养人的道德感可以解决这个囚徒困境。增强人的道德观念就是加大“反抗”策略的
获益，即：当反抗时，尽管有受伤的可能，但是道德荣誉感或道德满足感将使得乘客的心理有所补偿；
而在窃贼行窃时，乘客如果不反抗，他的道德感将使得他为他的行为感到羞耻。上述博弈过程为这样，当
小偷偷东西时，尽管乘客认为窃贼的威胁是可信的，但是如果乘客是道德感强的人，那么博弈结果是“
乘客反抗，小偷殴打”，从而小偷有可能被抓住，这也是一“子精炼纳什均衡”。从全社会的角度来说，
如果每个公民都有这样高的道德感，小偷成为过街老鼠，社会将从偷窃之风盛行的困境中解脱出来。并且
小偷如果偷窃的话，他知道将会受到道德感强的公民的反抗，即支付函数成为公共知识，他偷窃的收益
将很低，他很难再从事偷窃活动了。这使我们看到，此处道德是消除集体行动悲剧的一个良方。
　　这里，道德的人并不是不理性的，理性的人是计算的人，是对得与失作出充分计算后行动的人。这也
是道德存在的科学解释，对此将在下一章作出分析。
　　博弈论对不合作的博弈结果的预测是令人悲哀的。但是，从这个例子我们看到，道德就是由群体实施
的对所谓“非道德”的行为进行非强制性的惩罚机制，而法律及实施法律的国家的形成与改进就是建立
一个对所谓“违法行为”实施的中心惩罚机制。这正是下一章要讨论的内容。
囚徒困境的消解与文明
文明和文化是什么，一直是思想家思考的问题。我们无法给文明和文化下一个明确的定义，但我们可以认
为，文明及文化均是人类独有的现象。当然我们也在寻找地球外的文明，但是否有天外文明仍然是个谜。
　　20 世纪 80 年代弗洛伊德的精神分析理论开始在中国流行，他对人类文明的独特见解曾迷倒许多莘莘
学子。
　　他认为，文明是对人的本能的压抑，人的历史就是人的本能被压抑的历史。在他看来，人有“生的本
能”和“死的本能”，前者称“性本能”或“爱的本能”，后者称“死亡本能”或“破坏本能”。本能的
目的是满足，但是如果本能得到完全的满足，则没有了文明。人所追求的目标是各种需要的满足，而文明
则是要人彻底抛弃这个目标的。因此在他看来，文明就是对本能的压抑与利用。
　　而在社会学大师韦伯看来，文明是对人的贪欲的压抑，社会的各种组织理性化就是为了压制和利用
人的贪欲。
　　由此可见，要解释文明就是要解释利己的个体是如何得到约束的。下面将从博弈论的角度提出一个新
的文明观：文明其实就是对集体行动悲剧的克服。
　　在囚徒困境中，每个参与者选择的占优策略是“招认”即“不合作”，如果对囚徒博弈在参与者之
间进行重复博弈呢？试考虑这样一个非合作博弈：甲、乙两人博弈，两人各有两个策略。各策略下的支付
矩阵为：
　　文明是对人的贪欲的压抑
　　甲乙不合作合作不合作(1，1)(5，0)合作(0，5)(4，4)
　　但是如果此时，两者的纳什均衡为（不合作，不合作）。
　　在第二阶段假设支付情况是这样的：当在第一阶段采取的是“合作”策略时，将有额外的收益 3；如
果采取“不合作”策略，则没有任何额外收益。即：在第二阶段额外的支付矩阵为：
　　甲乙不合作合作不合作(0，0)(0，3)合作(3，0)(3，3)
　　假设在第一阶段博弈双方知道这个两阶段博弈在各种策略下的结果，于是这个博弈可由上述两个矩
阵相加得出：
　　甲乙不合作合作不合作(1，1)(5，3)合作(3，5)(7，7)
　　这两个阶段博弈其实是一阶段博弈。在这个博弈中（合作，合作）是纳什均衡，而这个结果就解开了
囚徒困境。
　　这个例子的社会意义是什么？这里关键是对上面第二阶段的支付矩阵的解释。
　　一种解释是：如果第一阶段双方只要有人采取不合作的策略，那么以后双方便不能合作，以后的收
益为 0。这相当于在生意场上如果一方欺骗了一方，那么以后双方便不能合作。如果第一阶段采取了合作，
那么双方在第二阶段没有理由不采取合作，这就等于说，第二阶段是第一阶段的自然结果。
　　其实，第二阶段的支付矩阵是赏罚矩阵，是对参与者第一阶段采取某种行动的“赏罚”。即：如果第
一阶段双方采取了“合作”，那么将对双方奖励 3；如果第一阶段有一方采取不合作，则收益变为 0。
　　在这个例子中，奖惩矩阵是在参与者之间建立起来的。而一般来说，存在两种情况：一是参与者在博
弈过程中自动建立起来的，这就是演进博弈研究的内容；第二种情况是非博弈第三方强加于参与者之上
的赏罚矩阵，从而调节博弈结果。
　　摆脱囚徒困境的这个方法或者说模型对于社会有什么解释力呢？我们说，文明就是这个赏罚机制的
建立，而道德与国家的目的就是建立这样的机制。
一个关于猴子的故事
这里再讲一个关于猴子的故事：
　　有一群猴子被关在笼子里，在笼子里的上方有一条绳子，绳子拴着一个香蕉，绳子连着一个机关，
机关又与一个水源相连。猴子们发现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的绳
子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了香蕉，但其他猴子被淋湿了，这个过
程重复着，猴子们发现，尽管有猴子吃到香蕉，但吃到
香蕉的猴子是少数，而其余的大多数猴子都被淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴
子去抓香蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因愤怒而自动地去撕咬那个猴
子，久而久之，猴子们产生了合作，再也没有猴子敢去取香蕉了。
　　在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个社会，它们也繁衍下一代，它们会将
它们的经历告诉下一代，渐渐地猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉是
“不道德的”，它们也会自动地惩罚“不道德的”猴子。
　　当然这只是一个故事，这个故事反映了人类的道德的产生过程。
　　人天生是自私的，他努力使自己的利益最大。当然这不是对现实的人的看法，而是一个抽象的假定。
但现实中的人为什么有道德呢？从自私的假定中怎么推出道德的人？
　　上述猴子的“道德”产生的故事可以用来解释博弈论专家对道德的阐述。
人类原初的状态就是囚徒困境
人类的天性是驱利避害的，从动物状态走出来时人是自私的。自私的人在交往中每个人为了自己的利益而
产生的结果正是一种囚徒困境。
　　英国哲学家霍布斯假设了人类的原初状态，用他的话说，自然状态中人与人之间像狼与狼一样，是
“每个人对每个人的战争”。在这种状态中，每个人都力图保护自己的利益，并企图占有别人的东西，此
时，每个人是每个人的敌人。此时没有任何规则，没有财产，没有
正义或不正义，只有战争。武力与欺诈是战争中的两大基本德性。
　　在自然状态下，霍布斯说，是没有工业、知识、艺术、社会的一点余地的。
　　霍布斯对自然状态的假定，目的是要引申出他的政治主张。他认为，在这种状态下人的生活是悲惨的。
为了摆脱这种状态，人们便汇聚起来，建立契约，同意确立一个权力者或权力团体，这就是利维坦，这
个拥有巨大权力的利维坦对人们使用权力，以结束每个人对每个人之间的混战。这就是霍布斯的社会契约
论的思想。
　　在“霍布斯模型”中，国家以法律条文规定对某种行为如“战争”采取惩罚措施，但是如果惩罚措
施不力，即使扣除惩罚的成本，行动者从“战争”行动中获取的好处大于他采取“和平”策略所带来的
好处，那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行
动为原则。这就是法律制定的第一条原则：效率原则。
　　效率原则是从对社会的整体考虑分析得出的，从这个意义上讲，法律越严格越好，越严格越有效率。
但是，严格的法律对犯法者公平吗？这就涉及法律制定的第二条原则。
　　第二条原则是，法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则，这就是公
平原则。从这个意义上讲，法律惩罚太重，对犯法者不公平；而太轻，对社会或他人不公平。
　　效率原则与公平原则是很难统一的，法律的制定既要考虑效率原则，又要考虑公平原则，但往往两
者难以兼顾。在不同的国家以及在同一个国家的不同时期，对这两个原则的侧重点是不同的。
更为基本的道德调节
与国家一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现（当然还有国家）使得人类从囚徒
困境中走出来。
　　道德调节的第一个特点是，道德是先于国家产生的。根据历史记载，国家的出现在人类历史上是很晚
的事情，而在国家出现以前，人类已经经过很长一段历史。
　　在国家出现以前，以某种权力组织来调节群体是可能的，如部落的存在。然而更为基本的是道德的调
节作用。道德先于国家而存在，在上面的例子中，非洲的努埃尔人没有国家，但也调节得很好，这便是道
德的作用。
　　人的正义和非正义的概念与财产权的概念分不开，没有明确的财产权的地方是不可能有正义的，因
而在人类的早期，正义的观念与财产权的观念几乎是同时产生的。
　　人的正义与非正义的观念产生了道德感，无论是霍布斯还是休谟都这么认为。道德的产生先于国家，
而它们的作用都是区分或调节正义与非正义的行为的。
　　英国著名哲学家休谟在《人性论》中认为，人存在着先天的不足。狮子勇猛、敏捷，羊、牛虽不具备这些
条件，但它们食量也不大，而人身体软弱但需求很大，为了弥补这个不足，只有依赖于社会。在社会中人
有了力量、能力和安全。但是社会是如何合作的？休谟叙述了从两性的吸引到亲情关系，再到道德感的产
生。道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作，从而使得不道
德的人遭受损失。这样，社会上不道德的行为就会受到抑制。
　　因此只要社会形成了道德或不道德，或者正义或非正义的观念，就自动地产生了调节作用。我们说，
这种调节机制是非中心化的，即它不是通过某个建立起来的中心化的组织来实施的。
　　道德调节无须成本，这是道德调节的第二个特点。道德感是存在于每个人心中的，它无须成本维持。
对不道德行为的谴责也是不花成本的。
　　道德调节的第三个特点是，道德的调节存在着局限。它对不道德的行为的抑制是有限度的，当不道德
的行为带来的利益大于道德的满足时，道德的作用便失效。捡到别人掉的东西还给失主是道德行为，一方
面捡到者有道德满足感，另一方面会受到社会的表扬；如果不送回失主并被发现的话，则会受到谴责。但
是如果捡到的是一大笔钱，捡到者对是否还回给失主将有所疑虑，因为他道德的满足感或可能承受的谴
责小于他捡到这笔钱的获利。另外一个例子是，自古有杀人者死，伤人者刑，然而这与法律的实施相联系，
在没有国家、没有组织的原始社会，我们假定这时是单个人的社会，如果有力量的人杀了人，有谁对其惩
罚呢？人们可以谴责这种行为，认为它是不道德的，但没有力量对之惩罚。因此从社会发展的角度来看，
社会发展到一定程度，便需要强有力的政府产生，以弥补道德调节的不足。
道德作为“文化基因”的遗传与变异
道德产生之后，它成了“文化基因”，它与基因一样可以遗传。学者达维肯斯(R. Dawkins)发明了一个词
meme，它与 gene(基因)相对应，指某一群体的文化上的特质，或者说是文化基因。武汉大学的朱志方博士
在《社会决策论》中将之翻译成模因，以与基因相对。文化基因(meme)有记忆和模仿的特征。
　　说道德是文化基因，因为它与遗传物质的基因有许多相同之处，它可以复制、遗传及变异。
　　首先，道德可以遗传。道德的遗传通过“教—学”的关系来完成的。父母及周边的人通过其行为不自
觉地将道德传给了子女，各种教育机构通过不同的教育方式传递德道规范。一代又一代，在学习过程中继
承了前辈形成的道德。
　　其次，道德可以变异。变异意味着进化，惟有变异才能进化。道德是人类集体行动时面临集体行动的
悲剧而产生的，当人类产生新的集体行动的悲剧时便会产生新的道德意识。从这个意义上讲，人类和生物
的进化不是变异在先，而是环境的变化在先，能够产生适应环境的变异，才能得以生存。人类的道德也是
一样，当新的生存悲剧产生时，产生新的克服它们的道德，群体才能生存下去，否则便灭亡。真正的悲剧
不是不能克服，而是来不及克服。
　　第三，存在不同的道德，道德之间是相互竞争的。严格说来，道德是一个群体区别于其他群体的文化，
不同的群体因道德的不同而相互不同，在历史上道德根植于宗教。大的范围里，我们用“文明”称呼不同
的道德群体。美国著名学者、美国国际事务顾问亨廷顿认为当今世界存在着八大主要文明，它们是：中华
文明、西方文明、东正教文明、印度文明、日本文明、伊斯兰文明、拉丁美洲文明以及非洲文明。有时我们用“
民族”来称呼具有独特文化的群体。我们说道德与国家是两种调节社会的工具，道德存在于宗教之中，而
宗教比国家的起源更早。这也是为什么西方历史上世俗政权（国家）和神权（宗教）相互争夺权力的原因。
　　亨廷顿在《文明的冲突》、
《文明的冲突与世界秩序的重建》中表明他的观点，他认为，当前的冲突表现
出文明的冲突，目前最严重的冲突是在文明的交接点上，比如最近几年来在巴尔干半岛上的冲突和战争。
相同的文化及相同的道德意识，把人们团结在一起，“我们相同”、“我与你不同”将人们分成群体，相
同的道德群体内部尽管有冲突，但是遇到不同的外来文化的侵略
　　蚂蚁分工时，相同文化的人就团结在一起。中东六次战争是信奉伊斯兰教的阿拉伯国家和信奉犹太教
的以色列之间的战争。第四，基因载体努力复制自身，文化基因也力图发展自己。在生物学家看来，基因
有很强的复制自身的动力。在蜜蜂和蚂蚁王国，蜂后和蚁后专司生殖，而工蜂和工蚁专门寻找食物。这有
一个问题，对于工蜂和工蚁来说，怎么解释它们不繁殖自身呢？生物学家解释说：工蜂和工蚁自己繁殖
的话，下一代的基因与自己相似的程度是 50%，而由蜂后和蚁后来繁殖的工蜂和工蚁的“弟弟”、“妹妹
”与自己基因的相似程度是 75%。于是，工蜂和工蚁它们宁愿自己不繁殖。当然这只是一个解释。
　　对于文化基因似乎也是这样，一群体总是努力使自己的文化基因发展壮大。不同文化的扩张必然带来
冲突。基督教 2000 年来的发展，是与传教士的努力分不开的。基督教在自身的扩展过程中，是排斥异教的，
基督教的十字军东征就是为了消灭异教徒。今天西方世界与伊斯兰国家之间的冲突就是文化基因在拓展自
身过程中的冲突。儒家文明与西方基督教文明冲突剧烈的时候是在 19 世纪。西方基督教文明在向四周扩张
的时候，努力压制其他文明。儒家文明为了不至于消亡，在外部世界的压力下，发生了变异以适应新的环
境。
　　当今全球化过程中人们对自身文明的认同越来越强烈，亨廷顿认为，通讯的发展并不会使得人们价
值观发生趋同，而不同的文化对这些信息将产生不同的解释。
国家的作用及其局限
国家与道德均是一套赏罚机制，它们的建立是为了调整人们的行为，使人摆脱囚徒困境，走向合作。
　　笔者写了一篇论文，题为《赏罚机制的建立与博弈结构的调整》，中心意思是，人类的个体理性与集
体理性存在着冲突，这个冲突就是集体行动的悲剧，但是人类可以通过“自动”地建立一赏罚机制来克
服这样的悲剧。就数学形式而言，赏罚机制的建立就是在支付矩阵上加一个赏罚矩阵，或者在支付函数上
加一个赏罚函数；从实际意义上说，就是通过改变规则来对人的某些行动给以奖赏，而对某些行动给以
惩罚。
　　这种规则的改变有三种方式。
　　第一，如果参与者之间没有一个组织调节，那么参与者之间可以通过协议形成组织，以调节人类的
行动。国家是其中的典型，竞争的企业之间为了避免相互恶性竞争建立的某些行业协会也是其中的一种。
　　第二，如果原来存在着协调组织，但是，它的规则导致囚徒困境，这时，该组织可以通过改变规则，
来改变博弈结果。像中国北方草原问题，在一定程度上起因于草地财产权的界定。
　　第三，参与者之间形成道德调节过程。道德谴责与道德赞赏是非中心化的，而道德的作用一样可改变
博弈规则，使违反道德的行为得以降低，遵从道德的行为得以升高。
　　这三种方式是都是对“悲剧”的克服的方式，它们都可以说是人类自动形成的。并且可以这么认为，
它们就是文明！
　　对于这种对人类集体行动的悲剧的解决方式的解释，华南师范大学的陈友芳先生提出这样一个问题：
从原始社会开始，为什么有的地方形成了国家?为什么有的地方没有形成国家而只有道德的调节机制？
　　这个问题涉及一个深刻的问题，即实际的机制形成的问题。为什么有些地方形成一中心化的国家，而
有些地方没有形成国家，只有道德调节，这可能是成本问题，当然我这里只是一种猜测。中心化的组织的
形成及其运行是要花成本的，而道德存在于每个人的心中，它是非中心化的，其实施是通过每个人的行
为表现出来的。在人类社会形成之初，由于人口稀少、生产力低下及行动能力的局限，道德是主要的调节
因素，此时人类没有能力形成控制力强的组织即国家。只有到社会发展到一定程度，人口到一定的规模，
生产力达到一定水平，中心化的组织才能产生。正如马克思所认为，原始社会是没有国家的，到了奴隶社
会，才形成了一个阶级压迫另一个阶级的国家。
　　其实可以这样认为，国家是在其带来的利益大于其成本时才得以形成的，即国家是人们为了摆脱“
集体行动的悲剧”而形成的，此时好处大于坏处。当然国家形成之后往往是一个集团通过它得到更多的利
益，而许多人因国家的存在而遭遇不幸，成为国家的牺牲品，但在自然状态或原始社会中，是没有一群
人实施对另一群人“合法性”的屠杀的。
　　国家的运作成本太大，如果每个人不能从中得到更多的额外的好处，那么国家便不能形成，或者严
格地说不能自愿形成，此时人们不可能有去形成这样一个权力中心的动机。当然，形成的国家对统治者来
说是有好处的，往往有足够武力的少数人或集团有统一的动机，他们通过武力来征服其他人以形成一中
心化的国家。然而，当人民在这样一个国家下得到的好处没有他们在自然状态下获得的好处大时，从长期
来看，这个国家便不能存在下去。这也可以解释古希腊马其顿国王亚力山大统治的横跨欧亚的国家，成吉
思汗建立的世界上最大的横跨欧亚非的国家以及前苏联国家，它们为什么不能长久的原因。它们可以短时
间通过武力建立起来，但是不能长时间存在下去，因为它们存在的成本太高，而给人民的好处不大。
　　因此可以说，国家的存在是有条件的，而道德的存在是没有条件的。在非洲地区，或者古代，因生产
力低下，人们所在的地域广大，国家存在的管理成本太高，因此只可能有小而灵活性的部落性组织存在，
而不可能有庞大的制度化运作的国家。
　　国家和道德均有调节机制，是为了使人类摆脱“集体行动的悲剧”而自动产生出来的机制。这里所谓
的自动产生是指，它的产生是由行动者本身的内部力量产生出来的，而非由该集体之外的力量为它设计
的。因而，国家和道德是人类集体进化的产物，从这个意义上讲不是上帝强加于人类的。
　　这里只说明了什么时候产生国家，什么时候产生道德，但为什么在有国家的地方仍有道德呢？可以
这么认为，国家通过规则化的机制对人的行动进行规范，然而它对人的行动的监督是有成本的，它对社
会危害大同时道德无法进行监管的行为进行管制，而把对社会危害小同时难以监督的行为留给了道德。如
抢劫、杀人对社会的危害不言而喻，道德虽然可以在一定程度上制约这种行为，但对这些行为的真正有效
的惩罚只有通过合法的暴力来进行。至于吐痰、在公共场所吸烟这类行为，对于吐痰者或吸烟者是有利的，
因为有吐痰的需求时立即吐掉是愉快的，而对于吸烟者来说，在公共场所烟瘾上来时吸上几口烟也是很
愉悦的。但无论是随地吐痰还是在公共场所吸烟，对他人是有害的，因而这些是不道德的行为，对它们只
有通过人们内心的道德感以及他人的谴责来进行抑制。如果没有道德调节，而由国家实行的外部的强制力
量来管制，那么其成本太高，实际上效果不大。
文明新解
那么在博弈论中，文明是什么呢？在博弈论中，人是经济人或理性人，然而理性的人往往导致谁都不愿
意见到的结果，这就是集体行动的悲剧。当然，并不是所有的集体行动都造成悲剧。
　　这里得出与弗洛伊德及韦伯不同的看法：文明就是对集体行动悲剧的克服。正如休谟认为，人的天生
能力不如其他动物，而惟有形成社会并相互依赖才能克服自身的弱点。但是，群体的行动往往导致没有技
术解决办法的悲剧。国家及其相应的法律、道德都是为了克服集体行动的悲剧。
　　文明的发展是对集体行动的悲剧不断克服的历史。集体行动的悲剧具有相同的结构，都是囚徒困境的
形式，即：自私的人或理性的个体从自身利益出发，造成群体受到损害。这在现实中往往以不同的方式表
现出来，如我们在第 7 章中举出的例子。同时，在人类的发展中不断产生新的集体性的悲剧，而人类就是
在不断地调整自己的行动——通过建立法律、形成新的道德意识，从而不断克服这种悲剧的。
　　历史上存在着这样一个现象：对社会均衡的打破开始于殉道者。先知看到常人没有看到的东西，他们
预测到集体行动的灾难，然而社会没有意识到问题之所在，没有形成克服悲剧的集体的道德意识，当然
更没有建立某种克服悲剧的组织形式。社会不能理解先知的呼喊，因而先知因违背众人的意志而被社会所
不容，甚至被处以极刑。
　　鸦片战争后，中国面临被列强瓜分的危机，清政府软弱无能。固守传统还是学习西方，成了人们论战
的主题。康有为、谭嗣同等人力主维新变法，然而开明并支持维新的光绪皇帝其权力受到以慈禧为代表的
保守势力的多方挟制。当袁世凯出卖光绪，慈禧开始对维新派进行大规模搜捕屠杀时，力主变法的谭嗣同
没有逃走。他拒绝到日本躲避，而慷慨赴难。他说：“各国变法，无不从流血而成，今中国未闻有因变法
而流血者，此国所以不昌也。有之，请自嗣同始。”维新运动被保守的清政府镇压了。维新在某种程度上是
在清政府原来的体制上的改革，而非彻底的革命，维新运动的失败意味着清政府丧失掉了克服集体行动
悲剧的机会，因而导致清政府的腐朽和灭亡。经过辛亥革命以及毛泽东等人领导的中国共产党的革命，强
大的共和国终于在维新运动失败的半个世纪之后建立起来。
　　谭嗣同从容就义，鲁迅大声呐喊，都是为了唤醒民众。他们要告诉人们：不要再昏睡下去，要行动起
来！否则中国要亡了。他们力图打破由自私而形成的社会的均衡，克服集体行动的悲剧。
　　因此，人是自由的，他不受必然性的支配。当人没有认识到集体行动的悲剧的时候，人可能无法克服
这样的悲剧。而一旦人认识到集体面临的悲剧，人的道德感便可能使人超越人的经济理性而走向道德理性，
集体面临的悲剧就可能被克服。黑格尔说得好：“自由是对必然性的认识。”这就是人，也正是人才有文
明。
当前的悲剧与解决途经： (1)
　世界政府的可能性和可行性分析
　　当前的悲剧是竞争的悲剧。无论是前苏联和美国核竞赛(当然两个超级大国的核竞赛随着前苏联的解
体而结束)，还是全球性的对环境的破坏，都源于竞争。
　　马克思说，私有制是一切罪恶的根源，然而私有制并不必然产生竞争，中国古代是私有制的，但根
本没有产生竞争，当然更没有产生今天的这种破坏性的竞争。可以这么认为，竞争的机制是囚徒困境的机
制。
　　20 世纪的一些事件给知识分子以严重的创伤，福山（F.Fukuyama）在《历史的终结》导言中说：“我
们西方人在关于认识民主制度全部进步进程的可能性方面，是彻底的悲观主义者。这种普遍的悲观主义不
是偶然的，而是受 20 世纪上半叶极其可怕的政治事件影响的结果。这些政治事件包括：两场毁灭性的世
界大战；独裁主义意识形态崛起；科学以核武器及环境破坏的形式构成反人类的转向。”
　　第二次世界大战中，先后参战的国家达 61 个，全世界 80%以上的人口约 17 亿人直接或间接地卷入到
战争中去，参战军队达 1.1 亿人，直接用于军费的开支总额约为 13520 亿美元。各交战国用于军费的开支
占其国民生产总值的 60%～70%。战争持续了 6 年零 1 天。军队死亡人数为 2210 多万，居民死亡约 3430 多万
人，合计死亡 5600 多万人，约占交战国人口的 3%。
　　二战时，纳粹德国设立的奥斯维辛集中营中有 400 万人丧生；日本侵略军攻入南京时，南京大屠杀
中有 30 万人遇难。
　　二战中，参战国经济损失达 40000 亿美元。日军侵华战争给中国人民造成巨大的经济损失，直接经济
损失达 620 亿美元，间接经济损失达 5000 亿美元。
　　人类当前的困境有着深刻的历史、文化原因，也可以说这是社会发展的必然趋势。如果从文化角度来
分析可以这样认为，西方享乐主义文化在全世界的扩展是本质性的。西方文化最近 500 年才崛起，它是一
种强势文化，并且是竞争性文化，它将全球拖入竞争状态，各国发展经济一方面是要满足人民的需求，
更重要的是要在国际舞台上取得地位，防止被其他国家所消灭。可以这样认为，各国发展经济是政治要求，
是另外一种战争。
　　战争为人类的天性，而西方科学技术的发展使得战争成为毁灭性的。弗洛伊德说，人有生的本能和死
的本能，后者也叫破坏本能。所谓本能是发生于人的内部的永恒冲动力，本能意味着需要，不能通过逃避
得以解除，而要通过满足来消除。死亡本能的驯服、控制和对象转移是文明的一个条件，正如对生的本能
的必要压抑是文明的前提一样。而死亡本能的外投，用之于向自然开战就是生产，而向敌人开战就是战争。
因此战争是不可避免的。
　　走出当前的困境，需要限制人类的享乐性文化的扩张，消除国家之间的战争，这需要一个全球性的
人类共同政府来实施。对当前悲剧的惟一解决方式是世界政府的建立，世界政府的建立可以消除各国之间
的战争。
　　世界政府或者说全球政府，意指世界进入一种无国家的状态，原有的有平等权力的各个国家消亡了，
而只由一个政府来对全球的事务进行管理和调节。
　　这里涉及两个问题：一是世界政府可能吗？二是世界政府可行吗？
　　对于第一个问题，我们说这是可能的。从管理的可能性来分析，人类社会随着生产力的不断发展，政
府的管理能力不断地增大；从历史的角度来看，国家是对非正规的权力组织即部落的统一，国家的产生
条件是生产力水平发展到一定程度。由于地理环境和历史文化的多种因素，国家有大有小。而从今天的管
理能力来看，一个政府对全球事务进行管理是可能的，或者是渐渐可能的。
　　上面说的是管理能力的可能性。但是一个政府的出现还面临着文化的可能性问题。从能力上大国完全
有能力吞并小国，但这种吞并是非正义的，面临着吞并国文化上的抵触。不过，世界人民经过 500 来年的
频繁交流，文化已达到一定的融通或理解。比如，以儒家为代表的中华文明从来就是一个开放的和包容性
强的文明，由于中华文明的悠久历史和博大精深，它对其他文明的接纳有一个过程，目前正处于快速吸
纳阶段。因此，世界各国人民从文化上得以相互理解和认同，并形成一种全球性的共同文化是可能的。而
且即使不形成一种共同文化，只要能够相互理解和宽容，世界政府就是有可能建立的。
　　第二个问题是，世界政府是可行的吗?即它的建立可以解决人类面临的问题吗?目前人类的战争问题、
武器竞赛、污染问题是世界性的，这些问题的进一步发展将毁灭人类，这种悲剧是大范围内的并且是毁灭
性的。对这些问题的解决，我们已分析得出：一种办法是建立一个赏罚机制，另一种办法是道德的约束。
道德约束个人的行为在一定范围内是可行的，而约束国家或集团则有相当的难度。对于人类来说，最有效
的方法是从制度上建立消除悲剧的可能性。
　　要建立调节国家行动的赏罚机制，必须存在一个其权力高于国家的机构。法律的权威性与法律的实施
相联系，一国之内法律意味着国家权力的权威性。但是国与国之间的法律是什么呢?现行的所谓国际法不
是严格意义上的法律，而只是“国际惯例”。必须存在超国家的权力组织或政府，才会有约束国家的法律，
此时国家的权力不足以与这样的组织对抗。因此，惟有建立这样的政府，才能协调或奖惩各个国家的行为
——如果此时各个国家还存在的话。
当前的悲剧与解决途经： (2)
英国历史学家汤因比与日本著名学者池田大作都论述过世界政府问题，汤因比认为未来世界政府的领导
人最好由中国人担任，因为中国人爱好和平。
　　可以设想世界政府对于解决目前的悲剧是一种可行的方法，但是它仍有许多问题：它的建立是暴力
的还是和平的?它产生独裁怎么办?它的存在往往会压抑人的创造性——池田大作这么认为，这个问题怎
么解决?它会不会产生其他的人类悲剧?等等。这有待于进一步思考。
弑父娶母的传说
如果没有摩擦阻力的话，我们能准确计算出物体下落的时间，我们能准确预测哈雷慧星每 76 年光顾地球
一次，等等。在宏观物理世界，我们的预测是准确的或基本准确的。
　　但是，我们能预测我们的社会未来是什么样的吗？美国能成功部署 NMD 吗?100 年后中国的经济、政治、
文化能与美国齐肩吗?100 年后世界政府能够创立吗?
　据称，许多先知能预测未来。在传说中，明朝朱元璋的军师刘伯温就是一个能预测未来的奇人。据说，
他曾预测未来：“天上蝴蝶飞，地上海龟爬”。蝴蝶，飞机也；海龟，汽车也。
　　不仅中国的传说中有这样的先知，西方社会里同样流传着有这样的所谓预测大师。根据诺查丹马斯的
《大预言》，有人说他预测到了 20 世纪发生的两次世界大战，预测到了会出现恶魔希特勒（据说连名字都
预测出来），并且预测 1999 年人类大毁灭。但人类顺利度过了 1999 年。
　　人能够洞察人群组成的社会秘密吗?如果能的话，我们既然知道了社会发展的进程，我们不是能完全
可以按照我们的意愿来改变未来状态吗?但是，如果我们改变了未来状态，我们的预言不是错了吗？对于
社会的未来，似乎是，或者我们承认不可以预言，或者认为可以预言，但是对预言的事实或者说将要成
为事实的事实，我们不能改变，这样才能不发生矛盾。
　　古希腊有一个古老的传说：俄狄浦斯是国王拉伊俄斯之子，俄狄浦斯出生后，先知预言国王必被其
子俄狄浦斯杀死。国王拉伊俄斯叫奴隶将俄狄浦斯杀死在山中，奴隶不忍心杀死这个婴儿，将其置于山中。
俄狄浦斯大难不死，被另一个国王波吕玻斯收养。波吕波斯把俄狄浦斯当作自己的孩子来养。
　　俄狄浦斯长大后，先知告诉他，他将犯杀父娶母之罪。俄狄浦斯非常害怕，他离开了养父波吕玻斯，
出外流浪。当然，他不知道波吕玻斯是他的养父。
　　在流浪的途中，他与人抢路而发生争吵，一怒之下杀死了对方。而被其杀死的正是他的亲生父亲拉伊
俄斯，然而他并不知道。他来到他亲生父亲拉伊俄斯的国家，正好人首狮身的怪物司芬克斯作乱，城里人
说，谁杀死了司芬克斯怪物，他将为王，并娶寡居的王后为妻。司芬克斯问：什么动物早上四条腿，中午
两条腿，晚上三条腿？这就是著名的司芬克斯之谜。俄狄浦斯猜测说是“人”。因为人小时候不会走路，
用手和脚在地上爬，长大了用两条腿走路，老了的时候因体力不支而需撑着拐杖。俄狄浦斯猜中了怪物的
谜语，怪物跳崖而死。俄狄浦斯因对全城有功被推举为王，坐了他亲生父亲的位置，并且娶了他的母亲。
先知的预言实现了，俄狄浦斯努力避免而没能避免。古希腊著名悲剧作家索福克勒斯据此传说创作了《俄
狄浦斯王》，这是一个著名的悲剧剧作。
　　这就是悲剧，明知道但不可避免的不幸。
　　这个故事涉及社会发展的两个问题：一是我们能否知道事件或历史发展的进程?二是如果知道了，我
们能否改变这个进程?
　　在俄狄浦斯杀父娶母的例子中，先知知道俄狄浦斯会杀父娶母，俄狄浦斯的父亲及其本人也知道了
这个最终结果，他们都在努力避免预言成为现实，然而却并没有避免得了。先知预测到了俄狄浦斯将杀死
父亲并娶母亲这个结果，并将这个结果告诉俄狄浦斯的父亲及其本人，以及俄狄浦斯及其父亲为避免预
言成为现实所作的努力，等等，这是不是说所有这些都是事件发展的必然进程呢?
　　似乎可以从中得出这样的结论：预言及对预言结果改变的企图均构成预言结果的实现过程。这个传说
表达的正是这一点。也就是说，即使我们预先知道了事件的未来的结果，这个结果也是我们不可改变的。
我们不知道未来我们会知道什么
无论是科幻电影、小说，还是学者严肃的探讨，许多人都认为回到过去是可能的。但回到过去真的可能吗?
　　回到历史中去也面临着一个原则上是否可能的问题。本人认为——这也是许多学者指出的，回到过去
在原则上是不可能的。因为，回到过去就意味着可能改变过去，而改变了过去就使本来发生的事情不能发
生，这违反最基本的逻辑规律。因为在同样的时空状态下，一事
物不能既存在又不存在，即不能违反矛盾律。发生的已经发生了，回到历史中去，如果不违反矛盾律的话，
惟一的可能是，无法改变已经发生的事件，即只能“看”而不能“动”。当然，如果能够回到过去并改变
历史的话，那改变后的历史及其发展是全新的社会发展状态，这样一个全新的状态是另外一个事件的发
展进程，而不是原来的历史进程了。
　　回到过去原则上是不可行的，对未来的预言原则上是不是同样不可行呢?自然科学能够做到对物质系
统的发展作出预测，这在一定程度上已经形成共识。然而在混沌世界，以及在微观世界，预测面临着危机。
自然中的混沌现象是不可预测的。在社会行动中，我们能预测我们的行动对社会进程的影响吗?不能。因为
我们不能知道我们未来的行动会是什么样的，我们都有这样的经历，今天的一些行动是几天前或几年前
所无法预知的，尤其在社会大变动的年代，我们不知道几年后我们会在哪里，当然更不知道我们将来会
做些什么了。既然我们不知道我们未来将有什么行动，我们怎么能够知道我们的行动如何影响他人呢?
　　20 世纪最伟大的哲学家之一，卡尔·波普，论证了历史预测的不可能性，他的论证简单说来是这样
的：我们得承认，我们的未来受人类知识的强烈影响，我们今天不可能知道我们未来会知道什么，因此
我们今天不可能知道我们未来会是什么样子。
　　波普论证的关键在于“我们今天不可能知道未来我们会知道什么”，波普认为，“他的证明在于指
出了任何科学预测者——不管是一位科学家，还是一部计算机——都不能用科学方法预测它自己未来的
结果。”任何预测的人无法知道自己未来能知道什么，他当然就无法知道自己尚不知道的东西对未来会造
成多大影响。
　　在生活的舞台上，我们不知道我们未来会演什么角色，也不知道我们自己会怎么演，当然也就不知
道我们未来的演出会给其他角色造成什么影响。我们不会知道这一台节目未来会演成什么样子。
社会在什么意义上是可预测的？
对社会的预测，就是对集体行动结果的预知。
　　从原则上讲，在一般意义上人类的历史是不可预测的，也就是说，人类的集体行动是不可能预知的。
　　但是，在某些假定的条件下，某种集体行动是可预测的。博弈论中对行动者的假定是，
行动者是理性的。理性的人不可能作出非理性的事情，在这个假定下，许多结果就能预测出来。
　　博弈的均衡就是可预测的结果。在囚徒困境中，那两个被抓的囚犯除了选择“招认”外其他还有吗?
对于理性的或者说自私的囚徒来说，没有。这是理性人的假定下的必然结论。
　　在博弈论中有这样的结论：在静态的博弈中，如果有一个纳什均衡解，那么这个解就是该博弈的必
然结果，它是可预测的；而当有几个纳什均衡时，这几个纳什均衡都是可能的结果，此时，结果也是可
预测的。
　　像中国北方草原每况愈下的公共资源悲剧，武器竞赛，人口问题，等等，这样的集体行动的悲剧也
是可预测的。一旦群体处于这种状态下，结局将不可避免。当然这是从理性的假定之下得出的。然而人的个
体理性与集体理性发生冲突时，一种调节的力量产生了，即道德和国家的产生或进化。此时，从个体理性
出发的预测将失效，集体行动到底走向何方，没有必然性的答案。
　　因此，原则上集体行动是不可预测的，而所谓预测只是在一定前提下的结论，而非逻辑的必然性。
　　由此，我们可以看一下我们的社会。我们只能从现有的状况预测未来的发展，这只是一个趋势，离我
们较远的未来，我们无法作出准确的预测，而所谓先知，只不过比其他人看得更远一些而已。我深感到，
未来是茫茫的黑暗，它充满着恐惧，同时也意味着希望。但对于我们有限的认知个体来说，未来是一个黑
洞。
　　帕斯卡有一句名言可以很好地描述我现在的感受，他说：面对茫茫的宇宙，我充满着恐惧。当然他指
的不仅是空间的宇宙而且指未来。这是有限的个体对无限的宇宙——无限的时间和空间——的恐惧。面对
不可预知的未来，我们能够想像出会是什么样子吗？绝对不可能！在无限的时空面前，我们只是一粒微
不足道的尘埃。我们的知识也只是大海里的一滴水。
社会科学研究的作用
本书勾勒的世界政府同样会遇到历史预测的可能性问题。
　　对于社会科学，本人坚持社会预测的不可能性。波普从逻辑上论证了历史预测原则上的不可能。
　　学者的研究本身是一种行动，正如科学家的研究是一种行动一样。科学家的实验是对自
然物(被实验的对象)的干扰，不论肉眼的观测还是通过望远镜、显微镜的观测都是一种行动，这种行动所
造成的干扰在微观层次上影响着观测结果，测不准原理表明了这种干扰。社会科学家的研究体现在收集社
会事实材料时对社会的干预，这不是指那种坐图书馆查阅年鉴、统计数据等，而是指如社会学那样的社会
调查，当然前者也是一种对社会产生影响的行动，这里不作论证。更重要的是，社会科学家在收集资料时
的行动(如访问等)改变着社会状态，也改变着社会进程。社会科学家的研究成果作用于社会，变成一种独
特的改变世界的力量，使思想变成行动。
　　社会科学在揭示已发生以及正在发生的社会事实时，它的意义比较明显。历史科学告诉我们过去发生
了什么以及如何解释所发生的事情，社会学则告诉我们某一社区的人群的职业结构、风俗习惯、道德状况，
等等。但是，对于未来，社会科学只能告诉人们，未来发生某些事情的可能性。
　　指出未来发生某些事情的可能性只是社会科学的一个起码的目的，如果该门社会科学想这样的话。更
为重要的是，社会科学要促成一些事情的发生。思想也是一种力量，思想与现实的其他力量对比究竟如何，
取决于该思想与其他力量的关系。在一定社会场合下，如封闭的高压社会，与高压政策相背的自由思想无
所作为，而适合统治者的观念则变成一种强大的力量。
　　社会科学，如果涉及未来的世界状态的话，它本身就在提倡着某些观点，即使它以中立者的角色出
现。而未来究竟发展成何样，取决于各种力量以及该思想或观点对社会的影响程度。
　　马克思发现了社会的发展规律，指出社会发展的五大发展阶段理论，而当前的资本主义的巨大不平
等将由发达、平等、没有剥削、压迫的共产主义社会来代替，他的思想的缘起是他看到资本主义的丑恶，努
力提出与现实不同的一个美好蓝图。由于马克思主义影响的广泛性，马克思主义本身便成为一种强大的改
变社会的力量，于是多种力量共同推进，20 世纪出现了多种多样的社会主义，而中国共产党走出中国特
色的社会主义是马克思主义与中国文化、中国社会现实等力量共同促成的。
　　总之，从理论上或者从逻辑上讲，社会科学要精确地预测一个社会或群体的未来是不可能的，但它
可以指出未来某些事情的可能性，并促成某些可能的事情的发生。

博弈生存

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

博弈生存

Uploaded by

Copyright:

Available Formats

博弈生存

导言：失火了，你往哪个门跑 (1)

声称的策略与实际的策略：言语博弈问题

You might also like

博弈生存

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

博弈生存

Uploaded by

Copyright:

Available Formats

博弈生存

导言：失火 了，你往 哪个门跑 (1)

声称的 策略与实 际的策略 ：言语博 弈问题

You might also like

　博弈生存

导言：失火了，你往哪个门跑 (1)

声称的策略与实际的策略：言语博弈问题