正义的多维面向及其内在统一:关于休谟与斯密的笔记
详细信息The Multidimensional Facets of Justice and Their Internal Unification: On the Notes of Hume and Smith
-
摘要: 休谟和斯密关于正义源泉的论述中,存在着一条效用—美感—快乐—德性—正义的逻辑链条,并且情感扮演着比理性更重要的角色。休谟更关注作为互惠的正义,斯密则强调作为不偏不倚的正义,二者之间是互补和统一的。通过社会中的约定等途径实现正义,两位伟大的思想家尤其是休谟揭示出一些关键理念,可视为现代博弈论和制度设计中的纳什均衡与激励等思想的先导。Abstract: In Hume and Smith's treatise on the origin of justice, there exists a logical chain from utility to aesthetic feeling, happiness, virtue and finally the justice, and passion plays a more important role than rationality. Hume pays more attention on justice as mutual advantage, while Smith emphasizes justice as impartiality, in fact, these two kinds of justice are complementary and can be unified. To realize justice through ways such as conventions in society, these two great thinkers especially Hume bring to light some key ideas, which can be regarded as the precursors to Nash equilibrium and incentive in modern game theory and institution design.
-
Keywords:
- David Hume /
- Adam Smith /
- justice /
- internal unification
-
美国哲学家布莱恩·史盖姆斯在其《社会契约演化论》的前言中开篇即指出,关于社会契约有两种研究传统。广为人知的是基于理性决策的方法。它探讨的是,在预先给定的自然状态下,理性的决策者会达成何种类型的契约,其代表人物是霍布斯以及现代的博弈论大师豪尔绍尼和政治哲学家罗尔斯。另外一条由休谟和卢梭创立的研究路线探究的是,既存的、隐性的社会契约是如何演化而来的,又将如何继续演化。这样的研究视角也可以自然地从社会契约延伸到其重要的内涵——道德和正义。①本文作为一种思想史的研究,正是基于博弈论和理性选择理论②、社会生物学和进化心理学③两方面互补的理论,对大卫·休谟和亚当·斯密的正义理论做一些不求面面俱到的比较,探寻其各自的预设、结论与论证理路,以呈现正义观念多维面向背后内在的统一性。文本关注的主要是休谟的《人性论》《道德原则研究》和斯密的《道德情操论》。
① [美]布莱恩·史盖姆斯:《社会契约演化论》,“前言”,申海波、杨培雷译,上海财经大学出版社2012年版。
② 参见John C. Harsnayi. Rational Behaviour and Bargaining Equilibrium in Games and Social Situations.Cambridge University Press, 1977.
③ 参见[美]戴维·巴斯:《进化心理学》, 张勇、蒋柯译,商务印书馆2015年版;[美]爱德华·威尔逊:《社会生物学——新的综合》,毛盛贤、孙港波、刘晓君等译,北京理工大学出版社2008年版。
对于当代社会科学应用特别广泛的跨学科研究工具博弈论,Yanis Varoufakis总结了其五个主要命题:在任何有限博弈中至少存在一个纳什均衡,存在唯一合理的讨价还价协议,前面两个命题可推广到动态情形,前面三个命题可推广到有风险的情形,演化均衡是纳什均衡。④最后一个命题也意味着,前述的两种区分与纳什早已洞察到并为宾默尔所强调、在博弈论中合理的解概念的两种均衡化过程(即理性演绎的与学习演化的),本质上是一致的。在一定意义上,演绎和演化会呈现出某种互补性和统一性,较弱理性的行为主体经过长期试错、学习和调整后稳定下来的行为模式,就“好像是”那些建立在精致的理性假设基础上逻辑推演出的产物。宾默尔则总结了社会契约的三个优先层面,即稳定、效率与公平:“一个社会契约必须是内在稳定的,否则就无法维持。它必须是有效率,否则就不能成功地与其他社会的社会契约竞争。”⑤效率,即不能再做帕累托改进;此处所谓的“内在稳定”,即是要成为一种博弈论中的纳什均衡或其精炼等行为模式;而“(在存在多种可能的均衡的情况下,)公平是均衡选择问题所演化的解” ①,很大程度上意味着某种功利主义或罗尔斯的最大最小准则。我们也将会看到,这些现代的思想在休谟和斯密那里,都可发现其脉络。
④ Yanis Varoufakis. Game Theory: Can it Unify the Social Sciences?. Organization Studies, 2008(29):1255—1277.
⑤ [美]宾默尔:《自然正义》,第10页,李晋译,上海财经大学出版社2010年版。
① [美]宾默尔;《自然正义》,第25页。
本文分为三个部分。首先整理了休谟和斯密关于德性和正义的起源以及理性和情感在其中扮演角色的诸多论述;其次,根据巴里关于“作为互惠的正义”和“作为不偏不倚的正义的区分”,进一步梳理出休谟和斯密正义思想脉络中的细微区别和殊途同归;最后,讨论二人尤其是休谟的思想中那些先驱性的隐含博弈论和激励理论观念的远见和洞察。
一. 理性抑或情感:德性和正义的源泉
休谟和斯密的正义理论有一个地方稍不同于霍布斯。后者从其第三自然法——“所订信约必须履行”得到正义的起源。“正义的性质在于遵守有效的信约,而信约的有效性则要在足以强制人们守约的社会权力建立以后才会开始,所有权也就是在这个时候开始。”②而信约的合理性当然来自守约所产生的结果,所以休谟和斯密直接强调,正义是从社会角度对一个结果以及导致此结果的行为的评价,它建立在个人评价的基础上。“正义这一德性完全从其对人类的交往和社会状态的必需用途而派生出其实存,乃是一个真理。”③作为结果的组成元素的事物对个人的价值即效用是最基本的出发点;而从休谟和斯密的论述中我们可以发现,存在着一条效用—美感—快乐—德性—正义的逻辑链条。
② [美]霍布斯:《利维坦》,第109页,商务印书馆1986年版。
③⑤⑥⑨⑩ [英]休谟:《道德原则研究》,第37, 22, 24, 76, 95页,曾晓平译,商务印书馆2001年版。
首先需要说明一点,他们所讲的效用(utility)与今天博弈论和理性决策理论中效用函数所谓的效用,有一些微妙的区别。休谟和斯密笔下的效用,最基本的涵义是实现某种利益目的的功用;现代意义上的效用,是行为主体对一个结果的综合权衡后的评价。这个结果包含每个人所得到的对其利益实现的有利和不利的各个方面,所以效用函数中涵盖了利己、利他和妒忌等各种人格因素,甚至包括斯密都察觉到的行为经济学的“禀赋效应”:“和只是使我们期待拥有的东西落空相比,剥夺我们原本拥有的东西,是一种更大的恶行。” ④几乎可以说,现代意义上的效用更接近于休谟和斯密所讲的情感(passion)。
④⑪⑫ [英]亚当·斯密:《道德情操论》,第101, 220, 104页,谢宗林译,中央编译出版社2008年版。
由于指导个人行为的基本要素是理性和情感,由此自然产生的问题是“道德是导源于理性,还是导源于情感”⑤。这个问题又可分解为两部分:一是道德的发生学;二是理性和情感如何在人类的决策和道德判断中发挥作用。休谟“猜想……理性和情感在几乎所有道德规定和道德推论中都是共同发生作用的……很可能,最终的裁决依赖于大自然所普遍赋予整个人类的某种内在的感官或感受”⑥。
休谟的猜想在今天有着生理学和心理学方面科学的验证或支持。⑦现代的进化心理学使我们可以合理地推断,作为生物的人类的各个器官之结构和功能,是为我们在生命竞争和演化历程中的生存繁衍服务的。⑧相应的感官系统同样如此,譬如痛感和快感。如果没有痛感,人类就不能察觉那些对身体的伤害,就会很容易因此死亡;如果没有快感,那些好的行为模式就不容易持续下来。所谓美感,在物质基础也就来自于这种快感。休谟曾引用昆体良的隽语“美和效用是从不分离的”⑨,并指出:“在所有动物中,美的一个相当重要的源泉是它们由自身肢体和器官的特定结构而获得的好处,这种结构是与大自然给它们命定的特定生活方式相适应的。”⑩深受休谟影响的斯密同样认同“效用是美的一个主要根源”⑪,并感叹“为了增进个体生存与种族繁衍这两大自然目的,各种植物或动物身体构造的每一部分设计之巧妙,是多么的令人赞叹啊!”⑫
⑦ 参见[美]保罗·扎克:《道德博弈》,中信出版社2016年版。
⑧ 参见[美]爱德华·威尔逊:《社会生物学——新的综合》,第一章“基因的道德”。
生存与繁衍是生物的基本本能,所以休谟强调“自爱是人类本性中的一条具有如此广泛效能的原则”①。当然,这种自爱自然包括了父母对子女的慈爱。斯密也指出:“自然女神,为了最为贤明的目的,使父母对子女的温柔慈祥……成为一种比子女对父母的孝心更为强烈的情感。人类的延续与繁衍完全依赖前一种情感,而不依赖后一种情感。”②在有助于基因延续的意义上,道金斯强调,“利他行为实际上是伪装起来的自私行为”[英]R.道金斯:《自私的基因》,第5页,卢允中、张岱云译,科学出版社1981年版。。但我们依然要强调,从后面所引休谟与斯密的思想中也能够看出,在效用函数中包含对别人的利他主义关怀;虽非对所有人必然如此,对许多人却是可能的。
①④⑤⑥ [英]休谟:《道德原则研究》,第69, 65, 35, 70页。
②⑦⑧⑨⑩⑪⑫ [英]亚当·斯密:《道德情操论》,第169, 342, 2, 406, 3, 15, 191页。
从个人推广到他人和社会,休谟认为一种行为及其结果的公共效用和由此生发的美感构成德性的基础:“社会性的德性具有一种自然的美和亲切……由于这些社会性的德性的公共效用是它们由以派生出它们的价值的主要因素,因而,它们所趋向于促进的目的必定是某种令我们感到愉快的方式,必定抓住我们的某种自然的感情。这个目的必定或者出于对自我利益的考虑,或者出于更慷慨的动机和考虑而使人快乐。”④他甚至断定:“公共的效用是正义的唯一起源,对这一德性的有益后果的反思是其价值的唯一基础。”⑤
德性与同理心和同情感有关。在一个重要的脚注中,休谟写道:“我们……有人道或与他人的同胞感……这被经验到是人类性中的一条原则……没有人是与他人的幸福和苦难绝对地漠不相关的。他人的幸福有一种产生快乐的自然趋向;他人的苦难有一种产生痛苦的自然趋向……我们可以有把握地将这些原则当作原始的。”在人人具备基本的同理心和同情感的基础上,“如果有用性是道德情感的一个源泉,如果这种有用性并不总是被关联于自我来考虑,那么结论就是,凡是有助于社会的幸福的东西都使自己直接成为我们的赞许和善意的对象。这是一条在很大程度上说明道德性之起源的原则”。⑥
斯密与休谟一样,认为“我们的情感主要分为自爱的与慈善的两大类”⑦。他指出:“人,不管被认为是多么的自私,在他的人性中显然还有一些原理,促使他关心他人的命运,使他人的幸福成为他的幸福必备的条件,尽管除了看到他人幸福他自己也觉得快乐之外,他从他人的幸福中得不到任何其他好处。属于这一类的原理,是怜悯或同情,是当我们看到他人的不幸,或当我们深刻怀想他人的不幸时,我们所感觉到的那种情绪。”⑧斯密特别强调了“整个企图从自爱推演出一切道德情感……却从未被说明得很清楚完整的人性理论……似乎是源自于没搞清楚同情的概念”⑨。他的看法与前引道金斯所谓“利他是某种自私”在表面上虽冲突,在种群或族群意义上却可以协调起来,因为同一种群中的个体之间存在极大的共同基因。
通过其特别强调的“旁观者”这个观念,斯密细化了同理心和同情感。“只有透过想象,我们才能对他的感觉有所感知……我们的想象所复制的,是我们自身的感官所感受到的感觉,不是他的感官所感受到的感觉。借由想象,我们把自己摆在他的位置……在某一程度内与他合而为一,从而对他的感觉有所体会。”“这就是我们对他人的不幸有同情感的根源。正是借由想象和受难者易地而处,我们才会对他的感受有所感知,他的感受也才会影响我们。”⑩
斯密分几步阐释了从情感出发逐渐得到正义的观念。“情感或心里的感受,是各种行为产生的根源,也是品评整个行为善恶最终必须倚赖的基础。因此,我们可以从两个不同的方面来看待情感,或者说,可以在两种不同的关系中考量情感:第一是从引起它的原因,或者说,从引起它的动机来考量它;第二则是从它所意图的目的,或者说,从它倾向产生的后果来考量它。” ⑪ “我们对他人行为的持续观察,会慢慢地导致我们在自己内心里,就什么是合宜适当的,或什么是该避免的行为,形成某些概括性的规则。” ⑫ “对那些概括性行为规则的尊重,是可以恰当称为义务感的那种感觉,是人类生活中最重要的一项原则,是大部分人类唯一能够赖以指引其自身行为的原则。”①“有一种美德,他的概括性规则,以极高的精确度,标明它所要求的每一项外在的行为。这美德就是正义。”②
①②③⑥ [英]亚当·斯密:《道德情操论》,第195, 213, 408, 408页。
德性和正义发端于感觉和情感,却也离不开理性的指引。斯密在讨论霍布斯时,讲到“美德在于服从理性,就某些方面来说,是正确的……理性也可以很恰当地被看作是赞许与非难以及所有稳健的是非判断的源头与原理。我们正是透过理性,才得以发现我们的行为应该遵守的那些概括性的正义规则”。同时,“理性可以使我们看出,某一事物是获得其他某些自然可喜的或可恶的事物的手段,从而使该事物因那些事物的缘故而间接被我们喜欢或被我们憎恶”。③
但是,何者为第一位的因素,两人的回答还是情感。休谟反复强调:“第一,理性单独决不能成为任何意志活动的动机;第二,理性在指导意志活动方面并不能反对情感。”④“理性是、并且应该是情感的奴隶,除了服务和服从情感之外,再不能有任何其他的职务。”⑤因为,也如斯密所言,“快乐与痛苦分别是我们的喜好与憎恶的主要对象,但是,区分快乐与痛苦的,却不是理性,而是直接的感觉。因此,如果美德本身就是可喜的,而恶行本身也同样就是可恶的,那么,最初区分美德与恶行的,便不可能是理性,而是直接的感觉”⑥。休谟还通过一些极端的例子指出,不同的人所持有的情感的可能性和多样性不同。当然,我们相信,如果时间足够长的话,进化的力量会把那些持有不合理情感或偏好的个体及其种群淘汰出局。在“附录一关于道德情感”中,休谟写道:“尽管理性在得到充分的帮助和改进时足以给我们指明品质或行动的有害的或有用的趋向,然而它单独时却不足以产生任何道德的谴责或赞许。效用只是一种对于某个一定目的的趋向……为了给予有用的而非有害的趋向以一种优先选择,在此就必须展现出一种情感。这种情感……只能是一种对人类的幸福的同情和对人类的苦难的愤恨,因为这些正是德性和恶行各自趋向于促进不同的目的。”⑦
④⑤ [英]休谟:《人性论》,第451, 453页,关文运译,商务印书馆1996年版。
⑦⑧ [英]休谟:《道德原则研究》,第138, 146页。
同时,二者也相辅相成:“理性……通过给我们指明达到幸福或避免苦难的手段而引导我们出自欲望或爱好的冲动;趣味,由于它产生快乐或痛苦并由此构成幸福或苦难之本质,因而就变成行动的动机,是欲望和意欲的第一源泉和动力。前者的标准基于万物的本性之上,是永恒不变的……后者的标准来自动物的永久的构架和组织。”⑧哈丁对此评论道:“休谟提到快乐是基本的欲望并且不能做进一步的解释。快乐和痛苦是基础性的且无任何先验理由与解释。今天我们可能会想到给出一种进化解释,但这种努力的成功并不会改变或降低休谟的方案的地位,只不过是强化了休谟关于我们的道德信念的心理学研究。”⑨这个评论同样适用于同理心和同情感。
⑨ Russell Hardin.David Hume: Moral and Political Theorist.Oxford University Press, 2007:30.
二. 互惠与无偏观察者:殊途同归
对于一个结果(或导致此结果的行为)在何种意义上被视为正义,巴里给出了两种重要的区分:作为互惠互利的正义(justice as mutual advantage),“正义只不过是我们在他人的合作(至少是容忍)乃能够实现我们之所欲的必要条件的那些场合所奉行的理性的审慎” ⑩,其代表人物有霍布斯和休谟;作为不偏不倚的正义(justice as impartiality),“一个事物的正义状态就是人们能够接受的那种,不仅在他们不能理性地期望得到更多的意义上,而且在他们不能合理地诉求更多的意义上” ⑪,其代表人物有亚里士多德、洛克、卢梭和康德。微妙的是,不偏不倚的正义强调的是基于“中立观察者”(impartial observer),即前面提到的斯密的“旁观者”立场。我们可以发现,这是他的正义理论一个核心的助探原理。
⑩⑪ Brian Barry.Theories of Justice, a Treatise on Social Justice, Volume I.University of California Press, 1989:6, 9.
这种关于正义观念的划分,与通常所谓交换正义和分配正义的区分有些表面上的类似之处。我们可以说,合理的交换应该是互惠互利的,因为不能强买强卖;分配性的裁断中的仲裁者,应该是中立的、不偏不倚的,正如正义女神是蒙上双眼的。但交换中的价格确立,虽然是双方讨价还价的结果,却也有从旁观者角度看来的合理性;而分配裁断中的具体内容,也应该有助于实现双方事前看来的互惠互利,这样才合乎激励的道理。
作为互惠互利正义的代表,休谟认为:“正义对于维持社会的必需性是正义这一德性的惟一基础。”①“导向正义的那种便利或者毋宁说那种必需性,是如此普遍,处处都如此指向同一些规则,以致这种习惯出现在所有社会中……甚至在日常生活中我们时时刻刻都在诉诸公共的效用这条原则。”②由此,“正义和非义的这种区别有两个不同的基础,即利益和道德;利益所以成为这个基础,是因为人们看到,如果不以这些规则约束自己,人们就不能在社会中生活;道德所以成为这个基础,则是因为当人们一旦看出这种利益以后,他们一看到有助于社会安宁的那些行动,就感到快乐,一看到有害于社会安宁的那些行动,就感到不快”③。
①②④⑤⑧ [英]休谟:《道德原则研究》,第55, 54, 57, 60—61, 160页。
③⑥⑦ [英]休谟:《人性论》,第573—574,531,532页。
这种正义的必需性,源于人类本质上是一种分工和合作的动物。“(如果)没有单个人之间的联结,人类本性绝不可能存续;而不尊重公道和正义的法则,单个人之间的联结又绝不可能发生。混乱,骚动,一切人对一切人的战争,就是那样一种无视法则的行为的必然后果。”④休谟的洞察力细致入微,“甚至建立在最不道德、对一般社会的利益最具毁灭性的原则之上的那些社会,其中也需要一定的规则,它们既通过私人利益、也通过虚假荣誉而约束每一个成员去遵奉……匪寇和海盗如果不在其内部建立一种新的分配正义,不恢复他们对其余人类已经侵犯的那些公道法则,他们就不可能维持他们的有害的联盟”⑤。
这种互惠互利的正义也带来了包括法律在内的各种社会规范的观念和具体制度。“在人们缔结了戒取他人所有物的协议、并且每个人都获得了所有物的稳定以后,这时立刻就发生了正义和非义的观念,也发生了财产权、权利和义务的观念。”⑥“没有人能够怀疑,划定财产、稳定财物占有的协议,是确立人类社会的一切条件中最必要的条件。”⑦司法也是如此。“公共的效用是所有司法法院的一般目标,这种效用也要求有一条稳定的规则对一切纷争起作用;但是当几条近乎相等和不分轩轾的规则同时出现时,正是一种非常微弱的思想倾向规定着有利于哪方的判决。”⑧
与上述休谟互惠互利的正义不同,斯密从不偏不倚的观察者视角看待正义。“就人类心灵容许产生的每一种情感来说,旁观者的情感,总是和旁观者设身处地的想象中主要当事人应该会有的那种感受相像。”⑨反过来,“所有人类的情感,似乎是适当且被认可的,如果每一位公正的旁观者都完全同情那些情感,或者说如果每一位不偏不倚的旁观者都完全体谅且附和那些情感”⑩。
⑨⑩⑪ [英]亚当·斯密:《道德情操论》,第4, 81, 162页。
如果我们作为仲裁者,处理冲突的利益要求时,“我们在观测那些彼此相反的利益时,绝不可站在我们自己的立场或站在他的立场,也绝不可用我们自己的眼睛或用他的眼睛,而必须站在某个第三者的立场,并且使用这第三者的眼睛。这个第三者,不管是和我们或是和他,都没有特殊的关系,因此可以不偏不倚地在我们和他之间做出公正无私的评判” ⑪。
在讨论柏拉图的正义观念的时候,斯密总结道:“交换性正义……在于绝不侵犯别人的东西,并且自动地做那些反正我们也可以被正正当当地强制去做的事情……分配性正义……在于适当的慈善,在于适当地使用我们自己的东西,在于把它用在,就我们的处境来说,最适合使用它的那些慈善或慷慨的目的上。就这个意义来说,正义包含一切有助于社会和乐的美德。”除此两种意义,斯密强调了正义和公平更加广泛的涵义,即“公正的旁观者认为”的应该如何:“所有语言中表示公平或正义的字眼都有的意义……我们会被认为对某一特定对象不公平,如果我们看起来没有以公正的旁观者认为它似乎应该得到的那个程度的尊重去重视它,或者我们看起来没有以公正的旁观者认为它本质上似乎有能力唤起的那个程度的热情去追求它的话。”①
①②③④⑦ [英]亚当·斯密:《道德情操论》,第346, 381, 26, 391, 405页。
关于正义的这两种观念,除了看到它们之间的微妙区别,还应该看到二者之间的互补性。在转述伊壁鸠鲁时,斯密也指出了正义的互惠方面:“公平或正义的美德,这个在所有美德中最重要的美德,其全部的价值不过是,在对待我们的邻人时,要有审慎分辨与考虑周详的适当行为。”②当然,适当的行为和判断应该建立在合理权衡的基础上:“和我们自身有特殊关系的事物所引起的每一种感情,其合宜点,或者说,旁观者能够附和它的那个强度,显然位于某一中庸的程度。”③所以,“那种主张美德在于效用的学说,也和那种主张美德在于合宜的学说是一致的”④。
现代的社会选择理论中研究公平正义问题时,把它处理为一种扩展同情型(extended sympathy type)的社会选择问题,通常接受某种人际间效用比较的同一原理(axiom of identity)。它在直觉上的理由如阿马蒂亚·森所言:“把自己放在其他人的地位上不仅包括置于后者的客观环境,还包括在主观特征上把自我与他人认同。”⑤当代功利主义最杰出的辩护者之一豪尔绍尼也认为:“有意义的个人之间效用比较的可能性(在观察者间的完全有效性下)将保持下来,只要不同个体的选择行动和偏好至少由同样的基本心理规律左右。这是因为,每个个体的偏好将由同样的一般因变量所决定,以致我们所观察到的不同人群偏好的差异至少在原则上可以由他们的因变量的差异来预言,这些差异诸如他们的生物性习性,过去生活的经历,以及现时的环境条件。”⑥他们的理由与斯密简直如出一辙:“虽然同情可以很恰当地被认为是源自我和主要当事人的处境有一虚拟的转换,然而,这个虚拟的处境转换却不应被认为是发生在我还是我自己的那个身份与角色上,而应被认为发生在我换成是我所同情的那个人的身份与角色上。”⑦
⑤ Amartya Sen. Collective Choice and Social Welfare.Holden-Day, Inc.1970:150.
⑥ John C. Harsnayi. Rational Behaviour and Bargaining Equilibrium in Games and Social Situations.Cambridge University Press, 1977:58.
由上述可知有两点需要强调。
其一,不同的两种观念,可能都会得到功利主义的判断标准,即休谟所谓“(德性)所要求的惟一辛劳是合理地计算和坚定不移地优先选择最大的幸福”⑧。这种功利主义应该是规则功利主义(rule utilitarianism)而非行为功利主义(act utilitarianism),“公道或正义的规则完全依赖于人们所处的特定的状态和状况,它们的起源和实存归因于它们的严格的规范的遵守给公共所带来的那种效用”⑨。规则功利主义意味着,一个行为的合理性,应该以如下考察其对社会整体利益的实现方式来判断:如果这种行为被视为合理的,那么它作为一种激励规则的因素所带来的长期而非短期的结果如何,事前的通盘考虑以对事后的局部结果进行加总的评价如何。
⑧⑨ [英]休谟:《道德原则研究》,第132, 39页。
其二,无论是从旁观者立场看的“将心比心”还是互惠互利式正义导致的利他的行为⑩表现,与利他主义效用函数有所不同。如果每个人的效用函数都有很强的利他主义关怀,那么囚徒困境博弈中双方不合作的均衡就可能不再成立。
⑩ 参见[美]戴维·巴斯《进化心理学》, 第九章“互惠式的利他行为理论”一节。
三. 正义的实现:均衡与激励
现代的制度设计理论与广义的社会契约论一样,关心的一个核心主题是,如何通过恰当的规则和制度的激励(不管这种制度是人为建构的还是自然演化出来的)引导人们合理的行为选择,走出或者避免霍布斯笔下的“自然状态”。按照休谟的表述,“人类在很大程度上是被利益所支配的,并且甚至当他们把关切扩展到自身以外时,也不会扩展得很远……人类若非借着普遍而不变地遵守正义规则,便不能那样有效地达到这种利益,因为他们只有借这些规则才能保存社会,才能不至于堕入人们通常所谓的自然状态的那种可怜的野蛮状态中”①。
①②③⑩ [英]休谟:《人性论》,第574, 569, 577, 530页。
但是,“利己心才是正义法则的真正根源;而一个人的利己心和其他人的利己心既是自然地相反的,所以这些各自的计较利害的情感就不得不调整得符合于某种行为体系”②。由此,休谟在讨论政府和社会的起源时指出,“我们既然不能改变或改正我们天性中任何重要的性质,所以我们所能做到的最大限度只是改变我们的外在条件和状况,使遵守正义法则成为我们最切近的利益,而破坏正义法则成为我们的最辽远的利益”③。也就是说,合理的制度对不同善恶行为进行奖励和惩罚,激励的作用就使得追逐自我利益的人的行为被导向实现社会正义的方向。
制度设计的目的是要实现合乎功利主义标准的结果。“如果我们考察用以指导正义和所有权的特定的法律,我们仍将得出同一结论。增进人类的利益是所有这些法律和规章的惟一目的。”④“为了确立规范所有权的法律,我们必须了解人的本性和境况,必须摒弃各种貌似有理但却可能虚妄不实的假象,必须寻求那些总体看来最有用的和有益的规则。”⑤休谟所认为的“最有用的和有益的规则”是:“那些探讨自然法的作者们……不论他们从什么原则出发,他们最终都一定终止在这里,都一定将人类的便利和必需性作为他们所确立的每一条规则的终极理由。”⑥“对于任何一种义务,除了观察到倘若它不确立,人类社会或者人类本性就不能存续,而给与它的尊重愈不可侵犯,人类社会或者人类本性就将达到愈大程度的幸福和圆满,我们还能为之欲求或设想什么更稳固的基础呢?”⑦
④⑤⑥⑦⑨ [英]休谟:《道德原则研究》,第44, 46, 47, 52, 157页。
而制度目标的实现,至少在稳定的或统计意义上稳定的角度来看,只能通过人们在社会互动中形成合理的均衡行为模式。休谟笔下的“约定”⑧就属此列。“如果约定是指一种对共同利益的感觉,这种感觉是人人在自己内心里感受到、在自己同胞身上觉察到、在自己和他人协力时将自己带入一个旨在促进公共的效用的一般行动计划或体系中的,那么必须承认,在这个意义上,正义起源于人类的约定。”⑨这些制度或社会契约,从理性演绎的观点看,要有精巧细密的激励结构的设计;从演化观点看,是人们在长期或多次的社会互动中形成的、凝聚了众人共识的惯例或约定。
⑧ 原文为convention,也许还包含“惯例”的意思。中文本《人性论》中被译为“协议”。承接休谟,一个经典的研究是[美]刘易斯:《约定论:一份哲学上的考量》,吕捷译,三联书店2009年版。
在更早的《人性论》中,休谟讲道:“协议只是一般的共同利益感觉;这种感觉是社会全体成员互相表示出来的,并且诱导他们以某些规则来调整他们的行为。我观察到,让别人占有他的财物,对我是有利的,假如他也同样地对待我。他感觉到,调整他的行为对他也同样有利。当这种共同的利益感觉互相表示出来、并为双方所了解时,它就产生了一种适当的决心和行为。”后面的表述相对更明晰:“这可以恰当地称为我们之间的协议(convention)或合同(agreement),虽然中间并没有插入一个许诺(promise);我们双方各自的行为都参照对方的行为,而且在作那些行为时,也假定对方要作某种行为。”⑩这段话我们在今天除了可以读出互惠互利的正义,还可解读出非合作博弈论中最核心的解概念——纳什均衡思想的萌芽。
纳什均衡,作为可自我实施(self-enforcing)的解理论的必要条件,是这样一种互为最优反应的策略组合或行为模式,即,我的行为是对你的行为的最优应对,同时你的行为是对我的行为的最优应对。这与“我们双方各自的行为都参照对方的行为,而且在作那些行为时,也假定对方要作某种行为”可谓形神俱同。按照经典博弈论隐含的预设,博弈结构是博弈者之间的共识(common knowledge)⑪,从而均衡行为模式是他们可以合理预见到的,即“一个理性的博弈者可以协调地持有的关于其他理性参与人行为的预期”①。休谟所谓的“互相表示出来、并为双方所了解”也隐含此意。行为的许诺,如果是博弈的均衡行为模式的一部分,不需要外力就会自我实施。
⑪ 一件事是博弈者之间的共识,如果每个人都知道它,每个人都知道每个人都知道它,如此以至无穷。
① 参见John C. Harsnayi. Rational Behaviour and Bargaining Equilibrium in Games and Social Situations.Cambridge University Press, 1977.
上图是休谟提到博弈表示的一个例子:“两个人在船上划桨时,是根据一种合同或协议而行事的,虽然他们彼此从未互相作出任何许诺。”②后来休谟再次提起它:“通过为了共同利益的共同的约定,毋需任何许诺或契约(contract),一只舟上的两个人就摇起桨橹。”③
②⑤⑦⑧ [英]休谟:《人性论》,第530,578—579,530—531,561页。
③⑥ [英]休谟:《道德原则研究》,第158,158页。
这个博弈中,单独划桨不足以让船移动,只是白白消耗了自己的力气。如斯科姆斯指出,这与著名的“公鹿狩猎”(Stag Hunt)博弈是一回事。④这个博弈有两个纳什均衡,分别是(不划,不)和(划桨,划)。比较两个均衡,当然都划的均衡对双方皆为有利,但与都不划相比却更具风险。从甲方这边考量,设乙方划的概率为p,则甲划的期望效用为4p+1(1-p),不划的期望效用为3p+3(1-p);要使甲愿意划必须前者不小于后者,即p不小于2/3。所以合作依赖于很强的互信,不那么容易实现。当然,如果双方有充分的交流,则都划的共识就能够达成。
④ [美]布莱恩·斯科姆斯:《猎鹿与社会结构的进化》,第2页, 薛峰译,上海世纪出版集团2011年版。
休谟还引入了另一个类似的博弈来说明回报优超均衡之脆弱和风险占优均衡之顽固。“两个邻人可以同意排去他们所共有的一片草地中的积水,因为他们很容易互相了解对方的心思,而且每个人必然看到,他不执行自己任务的直接后果就是把整个计划抛弃了。但是要使一千个人同意那样一种行为,乃是很困难的,而且的确是不可能的;他们对于那样一个计划难以同心一致,至于执行那个计划就更困难了,因为各人都在找寻借口,要想使自己省却麻烦和开支,而把全部负担加在他人身上。”⑤一方面,人数越多越难以形成共识;另一方面,存在一些人搭便车的行为。二者都会降低人们对达成合作的预期概率,从而导致自己也要退出,这就更强化了其他人退出的动机。
休谟总结道:“凡是所有人尽其一份力量就对两个或更多的人有好处的事情,凡是单单一个人做起来就使所有好处丧失殆尽的事情,都绝不可能起源于别的原则。否则任何人都不会有进入那种行为方式的动机。”⑥所谓绝不可能起源于别的原则,即只能通过人类的约定和承诺才能实现。这同样包含着机制设计理论中最基本的激励相容思想:一个社会目标,如果不是均衡行为模式的结果,就不可能实现。
休谟下面这段话揭示了共识和均衡如何通过学习和进化的方式得到并巩固。“关于财务占有的稳定的规则虽然是逐渐发生的,并且是通过缓慢的进程,通过一再经验到破坏这个规则而产生的不便,才获得效力,可是这个规则并不因此就不是由人类协议得来的。正相反,这种经验还更使我们确信,利益的感觉已成为我们全体社会成员所共有的,并且使我们对他们行为的未来的规则性发生一种信心;我们的节制与戒禁只是建立在这种期待上的。”⑦
休谟还讲到了另一个社会博弈:“你的谷子今天熟,我的谷子明天将熟。如果今天我为你劳动;明天你再帮助我,这对我们双方都有利益。”但是,“我对你并没有什么好意,并且知道你对我也同样没有什么好意。因此,我不肯为你白费辛苦;如果我为了自己的利益帮你劳动;期待你的报答,我知道我将会失望,而我所依靠于你的感恩会落空的。因此,我就让你独自劳动,你也照样对待我。天气变了,我们两人都因为缺乏互相信托和信任,以致损失了收成。”⑧
Vanderschraaf (1998, 221)用所谓“农夫悖论”博弈⑨描述了乙的麦子先熟从而甲先做出行动的博弈过程。这个博弈与囚徒困境博弈有些相似,唯一个不同的是,后面行动的乙能够观察到甲前面的行动。而结论是雷同的,无论甲前面选择了帮或者不帮,乙的理性的选择都是不帮。由此,甲的理性选择也是不帮。
⑨ Peter Vanderschraaf. The Informal Game Theory in Hume's Account of Convention.Economics and Philosophy, 1998, 14(2):215—47.
如休谟所言,由于“这一切都是人性中自然的、固有的原则和情感的结果”,在“改正人类的自私和忘恩负义方面”除了上帝谁也无能为力,“(道德学家和政治学家)所能企图的,只是给予那些自然情感以新的方向,并且教导我们说,我们通过间接的、人为的方式,比起顺从我们的欲望的直接冲动来,更可以满足这些欲望。因此,我就学会了对别人进行服务,虽然我对他并没有任何真正的好意;因为我预料到,他会报答我的服务,以期得到同样的另一次的服务,并且也为了同我或同其他人维持同样的互助的往来关系。因此,在我为他服务了、而他由我的行为得到利益以后,他就被诱导了来履行他的义务,因为他预见到他的拒绝会有什么样的后果”①。
①② [英]休谟:《人性论》,第561—562, 563页。
互惠互利的正义,一定程度上可以通过重复博弈的途径来实现,只要让不合作行为在以后的博弈中受到惩罚,以使行为者失去更大的利益。“要形成这个协作或协议,不需要任何别的条件,只需要每个人感觉到忠实履行约定是有利益的,并向社会中其他成员表示出那种感觉来。这样就立刻使那种利益对他们起了作用;而利益是履行许诺的最初的约束力。”②
Vanderschraaf (1998)讨论了走出不合作的一种途径。假设博弈不确定何时中止从而有一定概率不停地持续进行,那么考察如下严酷的“触发策略”:首先是在别人麦子先熟的情况下帮助别人;如果别人先前帮过自己,则明天或明年别人麦子先熟时继续帮别人;如果别人有一次没有帮自己,则以后永远不帮他。假设贴现因子足够大,即人们对未来利益比较看重,那么双方都使用触发策略就构成一个均衡,使合作得以实现。
类似地,关于有限重复的囚徒困境博弈,“声誉效应”也会使合作长期维系:如果一方有一定的概率可能是“投桃报李”(tit for tat)类型,即上来合作,然后模仿对方上一次的行为;那么,理性的一方也会控制急功近利之心,装出“投桃报李”类型的样子,换来对方长期的合作。如果完全没有“投桃报李”类型存在的可能,那么有限重复的囚徒困境博弈只能是双方重复地进行不合作。所以,斯密说:“以其人之道,还治其人之身:这样的报复,似乎是自然女神命令我们恪守的伟大法则。”③
③④ [英]亚当·斯密:《道德情操论》,第98, 92页。
斯密还指出:“虽然人类自然被赋予一种想要保全社会与希望社会繁荣的愿望,不过,造物主并未信托人类的理智,要它发现实施一定的惩罚是达成此一愿望的适当手段;而是赋予他一种本能,要他在看到最适于达成该愿望的手段获得实施时直接给予本能的赞许……(自然女神)不仅赋予人类以一种嗜好,要他们对她所图谋的目的怀有与生俱来的欲求,而且也赋予他们以另一种嗜好,要他们对唯有运用它们才能够达成该目的的那些手段同样怀有与生俱来的欲求,完全只为了那些手段本身的缘故,而不涉及它们倾向产生她所图谋的目的。”④这就再次说明了“投桃报李”类型存在的自然基础。
另外,在这种从统计意义考察制度结果的规则功利主义的思考上,休谟与斯密异曲同工:“一切规范所有权的自然法以及一切民法都是一般性的,都仅仅尊重案件的某些基本的因素……公共的效用要求所有权应当受一般的不可变易的规则所规范;虽然这样的规则被采纳来尽可能促进公共的效用这同一目的,然而对它们来说要防止一切特定的困苦或使每一单个的事件都产生有益的后果是不可能的。如果整体的计划或体制是公民社会的维持所必需的,如果由此在大体上善多于恶,那就够了。”⑤
⑤⑥ [英]休谟:《道德原则研究》,第157, 131—132页。
从休谟和斯密关于人类社会正义的思考中,我们能够发现许多类似的现代社会科学观念的渊源。故此,休谟那段自我相关(self-reference)式的话,是对他们两人博大精深思想的最好评价:“任何命题在哲学上是否为真(理)决不依赖于其增进社会利益的趋向……但是,难道还有什么哲学真理能够比这里给出的哲学真理更有利于社会吗?这里所给出的哲学真理展现了德性的全部真正的最诱人的魅力”。⑥