前言:我们精心挑选了数篇优质进化博弈理论文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
一、进化博弈的基本理论
进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。
二、进化博弈理论的应用研究
1.社会行为领域
Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Sandholm对个体行为偏好的进化进行了动态分析。Juang从进化的视角研究了规则的进化与均衡的选择问题。Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。
2.制度的演化
青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。他们认为:任何一种经济体制的产生都具有一定的惯性,并随着经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化。吴炯、彭飞以进化博弈的复制动态方法为工具解释了公司治理结构演进过程中的“两极化”现象。邱中华等通过演化博弈模型考察委托人和人在委托过程中行为策略的自发演化过程,发现这一博弈过程的所有均衡都是鞍点,从而得出委托人和人之间的监察博弈没有进化稳定策略。Kandori和Rafael运用进化博弈理论研究了两种具有网络外部性的技术之间竞争的博弈过程,提出了解决“花车效应”问题的对策,论证了后发技术取代主导技术的可能性。
3.经济行为的演化
Routledge基于Grossman和Stiglitz提出的经济模型,探讨了金融市场上个体行为人是如何通过适应性和进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Cowen和Kroszner利用进化博弈理论研究了在自由竞争易货贸易经济中,在存在交易成本的情况下,交易媒介的选择问题。罗发友等对集群内企业技术创新行为构建了鹰鸽博弈、鹰鸽反击者博弈和鹰鸽应变者博弈三个模型,并得出集群内企业创新行为不存在纯策略进化稳定均衡,但存在混合策略进化稳定均衡和行为策略进化稳定均衡,反映了集群内企业创新行为的协同竞争性以及这种协同竞争创新行为的进化稳定特性。
三、借鉴意义
1.进化博弈论从有限理性人出发,强调系统达到均衡的过程而非均衡本身。进化博弈理论是完全摒弃传统理论中非现实的“理性人”假设,直接从有限理性参与人群体出发而提出的一种全新的动态分析方法,该方法认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程。
2.进化博弈论纳入了系统到达均衡的时间因素,有利于决策者控制系统向目标的进化。进化博弈理论的动态分析方法中一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程。这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。
3.进化博弈理论引入突变因素较好的解决了多重均衡的选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态。进化博弈理论的基本均衡概念――进化稳定均衡,描述了当经济系统一旦进入到某一均衡的吸引域内,系统就会对其他的突变策略具有一定程度的抵抗力。
参考文献:
[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)
[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998
[3] 青木昌彦 奥野正宽:经济体制的比较制度分析.中国发展出版社,1999
[4]邱中华 金翔:基于进化博弈论研究的一类监察博弈. 南京邮电大学学报(自然科学版),2006,26
本文以进化博弈理论的基本均衡概念----进化稳定策略的提出、发展及不断完善为主线,在指出原初概念缺陷的基础上,文章从非对称博弈、有限群体、随机因素及动态过程四个方面分别介绍了博弈论理论家们对该概念的拓展。
关键词:进化稳定策略;渐近稳定性;严格N群体ESS;随机稳定集;群体稳定集
引言
进化博弈理论来自于达尔文的生物进化论,至少自雷威丁(Lewontin 1960)用于解释生态现象 ②就已经产生了。但直到1973年梅纳德·史密斯和普莱斯(Maynard Smith and Price)、梅纳德·史密斯(1974)提出了该理论的基本均衡概念----进化稳定策略[3](evolutionary stable strategy, ESS)及泰勒和乔克(Taylor and Jonker)提出该理论的基本动态概念---模拟者动态以后,进化博弈理论得到了理论界的普遍关注。特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开,正式确定了进化博弈理论在经济学上的学术地位,此后,该理论在经济学便上获得了迅速的发展及广泛的应用。越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981);阿克赛尔罗德(1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向[康利斯克(Conlisk 1980);利奈尔和罗尔(Cornell and Roll 1981)]、消费者对品牌的选择[凯思和史培罗(Katz and Shapiro 1985)]、社会学习过程[弗登博格(Fudenberg 1995)]及社会习俗形成[彼特·杨,(H. Peyton Young 1993,1998)等领域的相关问题。进化稳定策略是进化博弈理论最基本的均衡概念,它具有广泛的应用并在发展中得到了不断完善。本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。
一、原初ESS定义及其缺陷
在梅纳德·史密斯和普莱斯(1973);梅纳德·史密斯(1974)提出进化稳定策略概念以前,进化博弈理论的发展还仅仅处于萌芽阶段。在这一时期生态学家们主要应用纯数学理论如极限环、分岔、奇异吸引子(罗森,Rosen 1970)等概念来描述生态演化系统并用于解释生态现象,同时把生物之间的互动行为纳入到进化模型之中(威尔·艾德瓦兹,Wynne-Edwards 1962),他们处理问题的方法已经蕴含了进化博弈理论的基本思想。
在七十年代,生态学理论和博弈理论在各自领域中都获得了迅速的发展,同时实验经济学作为一门学科也获得了经济学界的一致认同,这些条件为进化论与博弈论的结合提供了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973)在总结以前理论的基础上,提出进化博弈理论的基本均衡概念----进化稳定策略③ ,该均衡概念的提出使得进化博弈理论的研究有了明确的方向,为进化博弈理论的进一步发展奠定了坚实的基础。
所谓进化稳定策略就是指:如果占群体绝大多数的个体选择进化稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下,突变者要么改变策略而选择进化稳定策略,要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973)所定义的进化稳定策略(文献[3]对此有详细的介绍):
说是进化稳定策略,如果,存在一个④,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入界限(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。从定义可以看出,当系统处于进化稳定状态时(群体选择进化稳定策略时所处的状态就是进化稳定状态),除非有来自外部强大的冲击,否则系统就不会偏离进化稳定状态,即系统会“锁定”(Lock in)于该状态。定义的直观意思就是,当一个系统处于进化稳定均衡的吸引域范围之内时,它就能够抵抗来自外部的小冲击。显然,进化稳定策略是一个静态概念,但它却可以描述出系统的局部即吸引域内的动态性质。
原初进化稳定策略定义为以后的研究者提供了理论基础,但它是建立在许多理想化的假定之上,存在着许多不够完善的地方:第一,梅纳德·史密斯等是在研究生态现象时提出的进化稳定策略概念的,由于动植物的行为完全是由其基因决定的。因而,每个种群体都被程式化为一个纯策略,整个生态环境的所有种群也被看作一个大群体。然而,同一种群的个体由于其性别不同、需要不同、能力不同、基因突变或基因遗传⑤ 等因素都会影响到它们的行为,把每一个种群行为程式化一个纯策略是没有太强说服力的,把一个生态环境中所有种群看作一个大群体也存在不妥之处;第二,从梅纳德·史密斯等提出的进化稳定策略定义可以看出,它仅适应于互不重叠且相互独立的突变因素的影响,其吸引域半径只与单个突变因素y有关,也就是说只有等到一个突变因素对群体的影响消失之后,才能出现另一个突变因素,现实中出现这种现象是非常偶然的;第三,梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体规模无限大 ⑥,即隐含地假定博弈的支付⑦ 空间是一个连通、闭集,这个假定不符合现实;第四,从原初的进化稳定策略定义可以看出,它是一个静态概念,只能描述系统的局部动态性质,没有涉及到动态系统整体的调整过程,而现实中许多系统的均衡依赖于系统的整体动态性质。
从生态意义上说,进化稳定策略把种群之间的互动行为纳入到模型之中,推广了达尔文的优胜劣汰理论,然而与纳什均衡概念相比,进化稳定策略并不能解释群体如何达到稳定的。它只能回答一旦达到了这种稳定状态,原群体就对突变者群体者具有较强的抵抗力。也就是说,它只能回答当系统处于某一个均衡点的吸引域时,在一定条件下,随着时间的演化,该系统就会趋于这个均衡点,而当系统有多重均衡或者多个吸引域时,原初的定义就显得无能为力了。事实上梅纳德·史密斯和帕克(Maynard Smith and Parker 1976)、梅纳德·史密斯(1978;1979)已经识到原初定义的某些缺陷,梅纳德·史密斯(1982)给予了一定程度的修进并提出了修进的ESS(Modified ESS)概念。下面我们从四个方面来介绍理论家对进化稳定均衡所作的拓展。
二、非对称群体中的ESS概念
梅纳德·史密斯早在1979年就已经意识到,原初的进化稳定策略在处理多群体非对称博弈时遇到了困难。他发现,在现实中,如生态学、经济学和其他社会科学中的许多策略互动行为可能发生于两个或多个群体的个体之间,个体之间进行的是非对称博弈,单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化稳定标准拓展到多群体情形呢?在单群体中,所有的个体都被程式化了一个纯策略(梅纳德·史密斯假定只有纯策略是可以遗传的),个体之间进行的是两两重复匿名博弈;并且在单群体中,规模很少的突变因素对群体所产生的影响是可以忽略的,因此,非严格纳什均衡策略不可能侵入到最优反应的严格纳什均衡策略群体。在多群体中,突变因素可能来自于各个群体,突变策略者的互动行为会对群体行为产生不可忽略的影响。因此,原初的进化稳定标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。Selten(1980)认为,把均衡概念由单群体拓展到多群体不是一个简单的过渡,而是涉及到系统的动态调整过程及动态稳定性等一系列的变化。哈曼斯顿(Hammerstein 1981)认为,在非对称博弈中,个体更加倾向于应用稳定策略来选择行为并决定竞争结果,而这些稳定策略与进化稳定策略相比,可能会有更少的“吸引域”。因此,由进化稳定策略定义所得的结论就显得有点似是而非了,但他没有作出进一步解释。
泽尔腾(Selten (1980))首次深入地研究了非对称博弈动态稳定性并利用两群体博弈情形证明 “在非对称博弈原初进化稳定策略必定是严格纳什均衡”。后来,Van Damme(1987)在更一般的情形下证明了这个命题⑧ 。我们知道,严格纳什均衡本来就显示出很好的性质,如果一个理论把其主要的注意力集中于研究严格纳什均衡,那么它就没有任何理论价值;更重要的是许多非对称博弈根本就不存在严格纳什均衡,因而也就无法研究动态系统的稳定性;在非对称博弈中,渐近稳定性(Asymptotic Stability)实质上也蕴含了严格纳什均衡,因此,渐近稳定性在非对称博弈中也不是一个合适概念;进化稳定策略是一个静态概念,虽然能够描述系统的局部动态性质,但在非对称博弈中,原初的进化稳定均衡与动态演化过程极限结果之间的对应关系却不明显(即出现了局部与全局的矛盾)。因此,要研究非对称博弈的动态稳定性就必须通过考察系统的动态演化过程来寻求能够适应于对称博弈与非对称博弈的稳定性概念。为了能够更精确地描述非对称博弈,泽尔腾(1983,1988)通过对引入角色限制行为(Role Conditioned Behavior)而提出了适应于非对称博弈的ESS概念。
他的定义如下:在有角色限制的博弈G中,一个行为策略称为进化稳定策略,
如果 (ⅰ)对任意的,满足
(ⅱ)如果那么对任意的有。
然而,泽尔滕的ESS概念尽管适应于描述两群体非对称博弈的情形,但它只能描述系统的局部动态性质,而且该定义并不能够显示出均衡概念与动态演化过程极限结果之间的关系。因此,要更好地描述非对称博弈均衡,就必须正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是,弗里德曼(Friedman 1991)考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论:(1)每一个纳什均衡都是动态系统的静止点(rest point)⑨ ;(2)渐近稳定结果必定是纳什均衡;(3)在对称和非对称博弈中,对所有单调调整过程而言ESS不一定是渐近稳定的;(4)对某些单调调整过程而言,正规ESS是渐近稳定的。在此基础上,他得出了“渐近稳定结果必定是纳什均衡”结论。莱瑞·萨谬尔森和张建波(Larry Samuelson and Jianbo Zhang 1992)在弗里德曼(1991)的基础上进一步考察了非对称博弈的累积单调选择动态(Aggregate Monotonic Selection Dynamic)并得出:在非对称博弈中,单调调整过程能够剔除所有严格劣的纯策略,并且能够确保均衡结果必定是纳什均衡。同时,他们证明了“稳定点必定是纳什均衡”及“渐近稳定结果必定是严格纳什均衡”,进而强化了弗里德曼(1991)的“渐近稳定结果必定是纳什均衡”的结论。
Swinkels(1992)认为,进化稳定标准不对突变策略组合给予适当限制是说不过去的。特别地,在处理某些经济问题时,突变策略可能来自于参与人或者企业的创新、试验等活动,这些突变策略组合本身可能会影响系统的稳定性。因此,考察相对于后进入突变群体最优反应策略组合的稳定性可能会更合理,并且这些稳定性概念很容易由单群体情形推广到多群体N-人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。
定义:称之为相对于均衡进入者的稳健策略(Robust against Equilibrium Entrants REE),如果存在对所有的策略组合及满足:。其中表示突变策略;表示选择突变策略者在群体中所占的比例;表示混合群体;表示突变策略相对于策略x的最优反应策略,他并且证明了REE是ESS的一个子集。然后,他又把REE概念推广到了N-人非对称博弈的情形而提出了均衡进化稳定(Equilibrium Evolutionarily Stable EES)概念:
定义:称集合是均衡进化稳定的(EES),如果它是相对于下面性质的最小集: X是纳什均衡策略集合一个非空闭子集,存在,如果及,那么。
换句话说,EES集是纳什均衡策略集的最小闭集,它能够保证任何小规模的均衡进入突变者不可能使得群体离开进化稳定均衡的吸引域。
三、有限群体上的ESS概念
梅纳德·史密斯等提出的ESS概念另一个缺陷就是,他们为了在技术上处理的方便而认为群体规模无限大,这个假定与现实尤其应用于解决经济问题时并不相符。为了使理论与现实更接近,许多博弈论理论家对有限群体的均衡问题进行了深入的研究。沙弗尔(Schaffer 1988)首次放开群体规模无限大的假定,考察了有限规模群体的进化稳定性并提出了有限群体ESS(Finite Population Ess)概念。他证明“在一般情况下,有限群体ESS并不是纳什均衡策略”。汉森和萨谬尔森(Hansen and Samuelson 1988)分析了经济博弈的演化过程,并把有限群体ESS称之为“普遍生存策略”(universal survival strategy)。他们认为,在现实世界竞争中,未来的利润和可供选择的策略具有不确定性,这就会阻碍企业选择最优化策略,企业必须通过不断的试验、学习过程来寻求有利可图的满意策略 ⑩(不一定是最优策略)。沙弗尔(1989)应用“普遍生存策略”来研究寡头企业之间的竞争并得出结论:通过经济自然选择过程 ⑾而得以生存下来的策略是相对的而不是绝对的利润最大化策略。泰尼克(Tanaka 2000)利用模拟者动态,考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”(Globally Surviving Strategy GSS)。他得出结论的是:在价格与数量竞争的寡头模型中,GSS都是随机稳定的并且在两种情况下它们是等价的。
以上所得到的均衡概念基本上是适应于单群体有限个体情形,并不适应于有限个体多群体博弈。哈佛保尔和西格蒙德(Hofbauer and Sigmund 1988)证明了“两群体对称博弈中不存在混合策略ESS”。泽尔腾(1988)在考察了大量的两人对称博弈的基础上也得出了类似的结论。克瑞斯曼(Cressman 1992)定义了有限两群体非对称博弈的进化稳定策略,1996年对他所定义的概念作了进一步说明。他认为,在模拟者动态下,至少一个群体的突变者所得到的平均支付少于选择稳定策略者所获得的支付,才能保证静止点的渐近稳定性。Garay and Varga(2000)认为,定义有限数目多群体的均衡概念应该满足如下三点:其一是突变者不能侵入他自己的群体;其二是现有群体对来自外部的随机冲击具有较强的抵抗力;其三是多群体ESS定义应该与非对称博弈理论的基本结论一致。众所周知,纯策略模拟者动态的渐近稳定集并不一定是ESS。那么,哪一种动态稳定概念等价于ESS呢?克瑞斯曼(1990)指出,在单群体条件下强稳定性等价于ESS,那么多群体的ESS定义也应该满足多群体稳定性概念等价于多群体ESS。根据这个标准,Garay and Varga(2000)定义了严格N群体ESS概念。其定义如下:
定义:策略组合 称之为N-群体进化稳定策略,如果对每一个,存在,对所有的都有:
框架。
四、随机因素影响下ESS概念
梅纳德·史密斯等提出的ESS概念第三个缺陷是要求突变因素是不连续且不重叠的。原初ESS定义由于仅仅考虑单个因素对系统的影响,所以任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态。帕克和菲尔德曼(Peck and Feldman 1988)认为,由于群体规模和后代数目很大,因而随机因素对动态系统的影响是可以忽略不计的。现实并不是这样,经济演化系统常常会受到来自突变和其他偶然事件的冲击,这些因素可能会对系统产生不可忽略的影响。福斯特和杨(Foster and Young 1990)认为,首先,ESS概念把影响系统的因素都看成是一个个孤立的事件,而在现实中系统常常会受到连续的随机冲击。如果假定有一个因素的影响消失以后,再考虑另一个因素对系统的影响,那么,系统当然就不会远离原来的均衡状态;其次,现实中出现上述情况纯属偶然现象,一个只能处理偶然现象的理论是没有任何存在价值。现实中,尽管单个随机因素对动态系统的影响较少,但它们却可能对系统产生累积作用而定量地改变系统的稳定性,使得系统离开进化稳定状态,系统什么时候回复到当初的进化稳定状态,依赖于动态过程的全局结构,而ESS定义是一个局部概念,因此在考虑随机冲击时就不能作为判断系统稳定性的标准;再次,由于系统的极限行为依赖于初始条件,同时在吸引子集合中只有一部分状态是随机稳定的,且随机稳定状态的选择还依赖于随机过程特定的结构,因此,ESS和一般意义上的吸引子(Attractors)由于没有充分地考虑到随机因素对进化系统的影响,在描述随机系统的稳定性时也很不理想。于是,他们首次把影响系统的随机因素纳入到进化模型之中并提出了一个既不同于传统ESS也不同于吸引子(Attractor)概念的随机稳定性(Stochastic Stability)概念。他们的定义如下:
定义:群体向量是随机稳定的,如果随着随机影响,极限密度对的每一个小邻域都赋有正概率;更精确地说,其中。其中是当时,的极限分布,表示随机因素对系统所产生的影响。
粗略地说,一个状态P是一个随机稳定的,如果在长期中,随着随机冲击因素影响的不断变少,系统几乎一定(nearly certain)不会离开P的任意少的邻域。随机稳定的群体向量总是存在的,它有如下性质:随着及,它是一个最小闭集。接着,他们又提出了更一般的概念----随机稳定集(Stochastic Stable Set)。随机稳定集 是一个满足如下条件的状态集合,即从长期来看,随着随机冲击的不断变少,系统几乎一定处于包含于S的任何一个开邻域中。随机稳定集概念的提出把传统确定性动态模型中的ESS拓展到随机性动态系统中,并且它是一个比进化稳定策略集更精练的概念,是进化稳定集的子集。随机稳定集已经成为描述随机动态系统的基本均衡概念。
五、ESS与动态的结合
从ESS的定义可以看出,它只能描述系统的局部动态性质而与系统的全局动态过程无关,然而,要更准确地描述一个系统的动态性质就必须对仔细考察整个系统的动态调整过程。泰勒和乔克(Taylor and Jonker 1978)首次把传统的ESS定义用模拟者动态模型表示出来,他们证明在一个多群体的模型中,进化稳定策略是渐近稳定的充分但非必要条件。但他们没有作出进一步的研究。鉴于此,吉尔博和马特休(Gilboa and Matsui (1991))在考察群体行动态调整过程的基础上,提出了“循环稳定集”(Cyclically Stable Set)又一均衡概念。“循环稳定集”直接来源于群体行为的调整过程,其基本思想是“可接近性”(Accessibility)。一个策略分布f称为可以从另一个策略分布g接近是指,如果存在一条从f到g的道路,且在该道路方向上任何一点都是相对于该点的最优反应。“循环稳定集”是指在满足“可接近性”条件下是封闭的策略分布集合(在该集合中任何两个分布之间都是接近的)。与一般均衡理论不同,仅当参与人按照均衡策略而作出选择时才有效,CSS并不要求群体保持这种决策状态。CSS的直观意义是,在一个很短的时间间隔内,只有少部分人离开或者死亡并且由一些新来的人(新生的孩子)代替,这些新来者从他们的母体那里继承一些行为模式,并且在现行预期(也就是说他们并不关心行为模式未来的变化)条件下作出最优的反应,一旦新来者选择了某一行动,他就会一直坚持下去(转换成本的存在是他坚持这个行动的一个重要原因)。马特休(Matsui 1992)给出了一个“稳定”策略的静态表述,在存在对原群体中各策略的初始分布冲击的情况下该策略能够保持这种分布。斯温克斯(1992)在马特休的基础上提出了“群体稳定策略”(Socially Stable Strategy SSS)。相对于均衡的进入者而言,所谓“群体稳定策略”是指如果存在一个突变群体(或者进入者群体,譬如说群体A),其支付高于原群体的支付,那么必定存在另外一个群体(如群体B),在这个包含大部分原群体个体而有一少部分群体A的个体的群体中,群体B将获得高于群体A的支付。这个概念也称为“稳健策略组合”。当然在某些情况下,“群体稳定策略”可能并不存在,但不是这个概念本身的缺点,出现这种情况与我们所研究的动态过程本身是分不开的。然而,我们可能会问,实际的行为模式又是怎么样呢?如果这个过程并不是稳定状态,那么稳定状态又是什么呢?在对这个问题作出回答时,马特休利用了吉尔博和马特休(1991)所提出的集值解的概念(Set-valued Solution),同时他也证明了循环稳定集的存在性。Binmore and Samuelson(1993)把参与人的学习过程纳入到了进化模型中并提出了自我强化均衡[10](Self-confirming Equilibrium)。他们认为,每个参与人都会通过自己的经验来推断对手可能选择的策略而作出最优反应,这个学习过程可能使得系统在不同自我强化均衡的吸引域之间漂移而不会停留在某一个均衡,由于在非均衡路径上的推断不一定正确,所以自我强化均衡可能不一定是纳什均衡。
结束语
进化博弈理论从发展到现在虽然只有二十几年的历史,但它却受到社会学、经济学、生态学们的普遍关注。特别是该理论的基本均衡概念----进化稳定均衡提出以后,理论界已经从不同的方面对它进行了拓展,并取得了令人瞩目的成果,使进化博弈理论体系得到了在发展中不断完善。进化博弈理论具有较强的实用性和广阔的发展前景 ⑿,相信它会引起更多经济学家的兴趣,必将成为主流经济学的一部分。
注释: ①张良桥:中山大学岭南学院经济学系数量经济学硕士研究生,广东省顺德职业技术学院经济管理系教师(邮政编码:528300;联系电话:0765-2338029;13825507060,值此文发表之际谨向他们致以深深的谢意,同时要感谢经济管理系的仇颖老师对此文中英文名字进行了认真的翻译。 ②生物学家在研究生态现象时发现,利用纳什均衡可以很好地解释生物进化结果。然而,生物是没有思维的更谈不上理性要求了,它们的行为却可以趋于纳什均衡,因此,理性要求并不是纳什均衡的必要条件。这样,生物进化论与博弈论的结合便成为可能,为进化博弈理论的产生奠定了基础。进化博弈理论以群体(Population)为研究对象,主要处理群体中近视且幼稚的(Navie)个体进行重复、匿名博弈的动态调整过程。其基本思想为:给定群体所处的状态,随着时间的演化更合适的策略会被更多参与者采用,其目的是为预测群体最终行为提供一个理论依据。 ③此后本文称之为原初定义 ④实际上相当于吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。 ⑤如长颈鹿进化的过程。 ⑥对群体模型为无限大的要求有两个原因:其一是机械式的,为了假想的“侵入界限”(Invasion Barriers)也就是突变者群体在大群体中所占的份额(Population Share),当突变群体模型超过1/n时,n是大群体的个体数,突变群体就有可能侵入到大群体,进化稳定策略的条件就有不满足了。其二是技术上的,群体模型足够大,就可以忽略掉现行群体个体的行为对其他突变者群体未来行为的影响,即不考虑学习过程。 ⑦其中的支付是生态学上的适应度(Fitness)或繁殖成活率。 ⑧下面我给出Van Damme1987的证明:首先设是进化稳定的,并且令所有参与人都选择不变的策略。令,对所有的。令,其中,那么对所有,满足及,因此,由进化稳定性可知。所以,而是任意的,所以。其次,设是一个严格纳什均衡策略,并且,那么至少存在一个满足,由的连续性可知,至少存在一个,对所有及,至少存在一个 满足:,这就说明 是进化稳定的。 ⑨静止点(Rest Point)就是当动态系统处于静止点时就不会离开该点。 ⑩Alchian(1950)指出,企业必须通过对所观察到的市场参与者的行动与结果之间的比较来得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的选择过程,每一个企业所能够选择的策略不随环境的变化而变化。在每一个阶段结束时,如果企业1的利润大于企业2的利润,那么企业1在下一阶段生存下来的概率就大于企业2在下一阶段生存下来的概率。相应地可以把企业的生存规则看作为策略的幸存,成功策略在群体中所占的比例通过企业之间对策略的模仿而得以增长 ⑿杨小凯教授(1995)认为,博弈理论当前最有趣的研究成果及日后有可能获得诺贝尔奖的工作就是信息不对称的动态博弈模型,以及对策游戏规则演化模型(也就是进化博弈模型)。事实上1996年及2001年的诺奖都属于研究信息经济学的经济学家,这说明杨教授具有超前的预见性,进化博弈理论研究者虽然还没有获得诺贝尔经济学奖,但也可以说明杨教授非常看重对进化博弈理论的研究。
[参考文献]
[1] 王则柯(1999):《博弈论平话》,中国经济出版社。
[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。
[3] 张良桥(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。
[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。
[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .
[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.
[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.
[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.
[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.
[10] Fudenberg, D. (1998): Learning in Games, Cambridge MIT Press.
[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.
[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.
[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.
[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.
[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.
[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.
[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.
[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.
[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.
[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.
[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.
[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.
[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.
[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.
[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.
[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.
[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.
[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.
[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.
[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.
[31] Wynne-Edwards, V. C. (1962): “Animal Dispersion in Relation To Social Behavior,” Hofner, New York.
【关键词】 会计信息博弈;披露;监管
一、研究背景
云南绿大地生物科技股份有限公司(简称绿大地)创立于 1996 年 6 月, 2007 年 12 月,公司向社会公开发行股票在深圳证券交易所挂牌上市,成为国内绿化苗木行业首家上市公司。2011 年 3 月中旬,绿大地公司公告称,其董事长何学葵因涉嫌欺诈发行股票罪被公安机关逮捕。调查发现,公司涉嫌虚增资产、虚增收入、虚增利润等多项违法违规行为。其实,在此之前,绿大地造假事件早已露出端倪,上市三年多来,公司频繁更换高管人员和会计师事务所。可是问题如此之多的绿大地,为何能通过层层关口上市融资,并直至三年后才被揭穿呢?
从银广厦到绿大地,上市公司涉嫌财务造假背后总有会计师事务所如影随形。本来,中介机构的任务是将真正优秀的公司输送到市场中,可事实却是中介机构与上市公司串通起来蒙骗投资者。这是由于这种行为的成本与收益不对称:与上市公司串通可以获得很大的收益,而一旦东窗事发,处罚却十分有限。显然,造假成本小而收益大。针对这种会计信息失真现象,本文从动态博弈的角度出发,对这种现象进行了分析,并提出了减少会计信息失真现象的建议。
二、博弈模型的建立与假设的提出
在会计信息的披露过程中,有披露方和监管方这样两个参与者,其中会计信息的披露方主要指企业的管理层即经营者,会计信息的监管方指会计师事务所等外部监督管理机构(这里暂不讨论股东这个角色)。每个博弈方都有两个纯策略可供选择,对于披露方可以选择披露虚假的会计信息即不诚信,也可以选择披露真实的会计信息即诚信;对于监管方则可以选择实行监管,也可以选择不监管。这里用I和H分别表示监管方和披露方的策略集合,Ii和Hi分别表示第i个纯策略(i=1,2),即I={I1,I2}={监管,不监管},H={H1,H2}={不诚信,诚信}。同时可以作出如下假设:
假设1:披露真实的会计信息为企业带来的效用是Y,而披露虚假的会计信息为企业带来的效用是X(X>Y),其中伪造虚假会计信息的成本是a,这里a相对于X来说特别的小即X-a>Y,只有在这种条件之下,企业才有可能对会计信息进行造假。
假设2:若披露虚假的会计信息,则监管方遭受的损失是m,若披露真实的会计信息,则监管方既无收益也无损失。如果监管方发现企业有造假行为,则企业应向监管方交纳f的罚款,而监管方在监管过程中需要付出c的成本。
假设3:如果披露方披露虚假会计信息,监管方进行监管,就一定能查出该造假行为,且需满足f-c>0,否则根据理性人的假设,监管方不会实施监管。同时也假定监管方监管的惩罚力度是很大的,实施的是有效监管,使企业在被处以罚款之后的效用低于披露真实会计信息的效用,即X-a-f
从以上假设可以得到监管方和披露方的得益矩阵(见表1)
三、会计信息披露与监督的静态博弈分析
基于上述假设可以得出,在静态博弈分析中,如果监管方选择I1监管,则披露方就会选择H2披露真实会计信息即诚信;如果监管方选择I2不监管,则披露方就会选择H1披露虚假会计信息即不诚信;如果披露方选择H1不诚信,则监管方就会选择I1监管;如果披露方选择H2诚信,则监管方就会选择I2不监管。这样博弈双方就一直在博弈矩阵里循环往复下去,显然这个博弈不存在占优策略,但是纳什均衡存在性定理告诉我们:每一个有限博弈至少存在一个纳什均衡(纯策略的或混合战略的)。从以上分析可以看出这个博弈不存在纯策略纳什均衡,因此它必然存在一个混合策略纳什均衡。
假定监管方的混合策略为p={p,1-p},披露方的混合策略为 Q={q,1-q},这表示监管方以P的概率选择监管,披露方以q的概率选择不诚信即披露虚假的会计信息。这样就可以推出博弈双方的期望得益:
监管方选择监管的期望得益值为:
Up=q(f-m-c)+(1-q)(-c) (1)
监管方选择不监管的期望得益值为:
U1-p=q(-m) (2)
披露方选择不诚信的期望得益值为:
Uq=p(X-a-f)+(1-p)(X-a)(3)
披露方选择诚信的期望得益值为:
U1-q=PY+(1-p)Y(4)
在混合策略纳什均衡中,应该使得无论披露方选择哪一种策略,监管方选择监管和不监管的期望得益都是相同的,同时,也应该使无论监管方选择哪一种策略,披露方选择不诚信和诚信的期望得益是相同的。因此可以得到以下两个等式:
Up=U1-p,Uq=U1-q
计算可以得到P*=(X-a-Y)/1,q*=c/f,,这表示监管方分别以概率P*和1-P*选择“监管”与“不监管”,披露方分别以概率 q*和1-q*选择“不诚信”和“诚信”,即监管方和披露方博弈的唯一的混合策略纳什均衡为{((X-a-Y)/f,(f+a+Y-X)/f),(c/f,(f-c)/f)}。从中可以得出当p>P*时,诚信是披露方的最佳策略,即q=0;当pq*时,监管方会选择监管,即p=1;当q
四、会计信息披露与监督的进化博弈分析
在有限理性下人们不一定有能力找到纳什均衡,每个博弈方通过把不同策略的得益与平均得益进行比较,然后逐步调整策略。这与生物进化过程很类似,在物种进化过程中,生物调整自身行为很缓慢。在这里,假设由披露方和监管方组成的大群体学习速度很慢,这样就可以用复制动态来模拟博弈方的动态调整,在整个复制动态过程中,如果出现一种适应性较高的策略,就会被大多数人采用,否则就会被淘汰。
在演化博弈分析框架下,监管方博弈群体中采用监管策略的比例为p,披露方博弈群体中采用不诚信策略的比例为q,因此,由方程(1)和(2)得到监管方群体的平均得益UI为:
UI=pUp+(1-p)U1-p=pqf-pc-qm(5)
由方程(3)和(4)得到披露方群体的平均得益UH为:
UH=qUq+(1-q)U1-q=q(X-a-Y)-pqf+Y (6)
由方程(1)、(5)可以得到监管方采用监管策略比例的复制动态方程为:
从上述分析可以得出以下结论:
第一,适当提高罚款额有助于降低披露方不诚信的可能性。
上述不等式说明监管方监管的可能性和披露方不诚信的可能性是罚款额的减函数。对于披露方而言,罚款额越高,越会选择诚信即披露真实的会计信息,这与现实也是相符合的,一旦被发现会计信息造假,企业不仅要承担因虚假会计信息带来的损失,还要额外地支付罚款,这样企业将会承担更大的成本和风险,因此披露方会更倾向于选择诚信的策略。同时,对于监管方来说,他们考虑到由于罚款额上升会使披露方不诚信的可能性降低,因此他们监管的可能性也会降低;相反,较低的惩罚力度会使披露方产生不诚信的心理,使得监管方监管的可能性增强。
第二,降低监管成本可以减小披露方不诚信的可能性。
这个不等式表明披露方不诚信的可能性会随着监管成本的降低而降低,是因为较低的监管成本使得监管方实施监管的可能性增加,披露方考虑到监管方的这种心理,自然就减少会计信息造假的可能性。所以,为了尽可能地减少会计信息失真的现象发生,监管部门应该采取一切可能的方法来降低监管成本,有效遏制会计信息造假的发生。
第三,诚信遵从的改善是缓慢的,即监管方监管的概率p*较高时,披露方处于规避风险的考虑,他不诚信的概率q*较低,同时,一旦监管方觉察到会计信息造假的事件比较少时,也会放松监管,即选择监管策略的可能性就会降低,这样就会使得披露方偏向于选择不诚信,提高不诚信的概率q*。这就表明,提高披露方的诚信遵从度是一个非常缓慢的过程,并非在短时间内可以实现,为减少会计信息失真的现象,应该尽量使得p>p*,从而使披露方不诚信的概率q保持在一个较低的水平上。
五、总结
本文从理论的角度分析了会计信息的披露和监管过程中的静态博弈和动态进化博弈,克服了经典博弈模型中要求参与者具有完全理性的缺点,而进化博弈正是有限理性的研究框架,降低了参与者的理性程度,更贴近现实。除此之外,动态进化博弈提供了各种可能的均衡状态,并给出了均衡状态下的方程,同时将罚款金额、监管成本和造假成本纳入动态分析过程,更符合现实,还得出了降低监管成本和加大惩罚力度是减少会计信息失真的有效途径。
【参考文献】
[1] 李敏.上市公司会计信息失真博弈分析[J].合作经济与科技,2008(2):80-81.
[2] 徐焕章,管慧芳,刘丽华.基于博弈论的会计信息失真研究[J].西安工程大学学报,2009(2):126-130.
[3] 张维迎.博弈论与信息经济学(第二版)[M].上海:上海人民出版社,2005.