前言:我们精心挑选了数篇优质博弈论的方法文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。
博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。
博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。
1.完全信息静态博弈:纳什均衡
完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's Dilemma)和“性别战”(Battle of theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。
2.完全信息动态博弈:子博弈精炼纳什均衡
动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。
3.不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。
4.不完全信息动态博弈:精炼贝叶斯纳什均衡
在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。
国际机制理论的理性主义流派概述
当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International
Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)
新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International
Regimes(London:Cambridge University Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。
新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。
博弈论与国际机制理论
在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International
Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)
早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。
关键词:群体决策;信息集结;博弈论;信息获取;审议;透明性
一、引言
群体决策的研究涉及多个学科,不同学科对群体决策的研究所采取的方法和着重点不一样。在经济学、政治学、管理学领域对群体决策的研究侧重于偏好的集结,较少考虑影响偏好形成的潜在背景信息。其中社会选择理论与公共选择理论利用数学分析的方法和福利经济学的一些基本原理,研究如何“公平合理地”将群体成员的偏好集结为群体的偏好并据以作出群体的选择,这方面的研究源于Condorcet投票悖论的提出,从20世纪50年代开始经过Arrow、Sen、Gibbard和Satterthwaite等人的进一步发展,已形成完整的理论体系,通过对理性社会选择本质的剖析,促进了人们对选举、立法以及政治机构运作等问题的理解。
在管理科学领域,对群体决策的研究主要强调如何通过对群体成员以不同形式表达的偏好的集结,使得群体成员就最终决策达成某种程度上的一致,而一致性则意味着“正确性”,这方面最具代表性的是社会决策图式理论。
在社会心理学领域对群体决策的研究主要采用实验性方法,通过对群体成员之间交互过程的分析研究群体决策的信息集结有效性,一般假定群体成员具有共同的目标,很少考虑决策过程中的策略,心理学研究的主要成果是对群体思维和群体极化现象的分析。
近年来国外出现了不少用博弈论作为理论工具研究群体决策信息集结问题的文献,这些文献主要发表于经济学、政治学与政治经济学期刊,通过对群体决策过程中群体成员的动机和理的分析,给出了一些与人们的直觉完全相反的结论。笔者将对此领域的研究进展从决策信息的获取、审议过程中信息的披 露、透明性的影响与最优决策规则四个方面进行评述。需要说明的是,这四个方面紧密关联,特别是决策群体成员的信息披露动机直接受到决策过程对公众是否透明以及最终的投票表决规则的影响,而群体成员的信息获取动机则部分地取决于信息披露动机,但由于利用博弈论分析群体决策问题的复杂性,现有的文献主要还是相对集中于其中的一两个方面。
文[1]是注意到此领域较早的综述性文章,该文发表于1999年,讨论了当时出现不久的研究政治机构信息集结作用的文献,其中对最先考虑策略性投票表决行为的文[2-5]等进行了简要介绍。同年9月份,《美国国家科学院院刊》发文评述了研究选举的信息集结作用及因投票者私有信息的不准确而导致的策略性投票表决行为的成果[6],其中提及的部分研究工作尚处于未发表状态。文[7]对研究货币政策委员会决策过程中的动机问题的文献进行了系统讨论。文[8]总结了货币政策委员会决策机制设计应该考虑的各种因素,对与群体决策相关的经济学与社会心理学理论与实验分析文献进行了评述,其中讨论了信息集结问题。应该说文[9]是目前评述基于博弈论的群体决策信息集结研究文献较为全面和细致的文章,该文从策略性投票、信息获取、利益冲突和交流四个方面进行了详细评述,并讨论了此领域的研究成果对货币政策委员会决策机制设计的参考价值。
本研究与文[9]的差别在于:第一,文[9]的讨论基本上局限于基于博弈论的群体决策信息集结研究本身,而笔者从研究方法、研究对象与研究成果等方面将基于博弈论的群体决策信息集结研究与经济学、政治学、管理学以及社会心理学领域对群体决策的传统主流研究进行了对比,分析了博弈论作为理论工具研究群体决策信息集结问题的优缺点,并深入探讨了现有研究工作存在的不足之处,也即指出了此领域可能的研究方向,因此,笔者的深度与广度有所超越。第二,文[9]对此领域研究成果的评述思路稍显混乱,文献分类较不合理。第三,笔者特别关注了研究决策过程的透明性对群体成员信息获取与信息披露动机以及投票表决行为的影响的文献,而文[9]对此几乎没有涉及。第四,文[9]发表后此领域出现了不少具有重要参考价值的文献,笔者对这些最新的文献给予了较为详细的评述。
二、决策信息的获取
(一) Condorcet陪审团定理与搭便车问题
与决策问题相关的各类信息一般以分散的、局部的形式存在于社会系统,群体决策的意义之一,是可能更充分地利用这些信息,因而更有可能作出正确的决策。不考虑其他因素,仅从信息集结的角度看,让更多拥有信息的个体参与决策可以改善决策质量,这种观点符合人们的直觉,其形式化证明出自18世纪Condorcet给出的陪审团定理。该定理认为:群体决策可以有效集结信息,在多数决定规则下,增加群体成员数量可以增加作出正确决策的概率,并且随着成员数量趋于无穷,作出正确决策的概率趋于1。
Condorcet陪审团定理及其后来的很多拓展往往都有个潜在的假设:群体决策者所掌握的与决策问题相关的信息是事前外部给定的,或是以零成本获得的[9]。但对于许多现实决策情形,信息并不是不需要投入成本和努力就能轻易得到的,如审稿专家需要付出一定的时间和精力才能决定稿件是否符合录用标准,因此决策者必须决定是否付出以及付出多少代价以获取信息。而在群体决策中,与决策问题相关的信息是公共物品,因而存在典型的所谓社会惰化(social loafing)现象或搭便车问题(freerider problem)。
文[10]对陪审团决策中的信息获取问题进行了研究,认为陪审员的信息准确程度取决于陪审团的大小,更大的陪审团的陪审员具有更少的动机认真听取审判过程,所以更大的陪审团作出正确判决的概率可能更小,从而导致陪审团定理不再成立。文[11-17]进一步研究了群体决策中的理性无知(rational ignorance)问题,对仍能有效集结信息时信息获取成本或成本函数需要满足的条件进行了分析,这些文献针对多数决定规则,假定所有群体成员具有完全相同的决策偏好。其中文[11,13-15]证明,当全体或部分群体成员的信息获取成本函数在获取零信息处的二阶导数为零,则Condorcet陪审团定理仍然有效。
另外,文[18]通过一个仅有两个成员的群体决策模型,指出群体成员间的交流可能会恶化信息获取中的搭便车问题。在该文中,决策成员首先收集关于一项工程实施后果的信息,然后相互交流,再投票表决是否实施该项工程。文章指出,如果交流的作用仅限于信息集结,则交流可能会减少作出正确决策的概率,特别是当高质量的信息很容易获得时,交流会减少决策成员收集信息的动机,加剧信息收集中的搭便车问题,但当信息收集需要付出高昂的代价时,更多的交流通常会增加作出正确决策的概率。
(二)搭便车问题避免措施
因为信息获取活动一般是不可观测的,搭便车者可以通过提供一个虚假的信息假装已经给予了足够的投入,所以无法通过有效的惩罚措施以阻止搭便车问题,只能够从决策群体的成员组成和决策规则等方面考虑避免该问题的发生。
文[19-20]的研究结论从决策群体人员组成方面为避免信息获取中的搭便车问题提供了理论参考,指出具有极端偏好的成员相对来说更具有收集高成本信息的动机,但这两篇文献的研究内容不属于严格意义上的群体决策,因为其中的委员会成员仅负责收集与报告信息,自身并没有决策权。在文[19]中,委员会成员在信息收集之前相互间没有偏好差异,在投入不可观测的努力收集信息后形成各自不同的政策偏好,该文证明最优的委员会规模和总的社会剩余有时会随委员会成员偏好差异期望值的增大而增大,因为预期的偏好差异为成员提供了收集信息的动机。文[20]指出,如果信息收集的成本较低,委员会成员的偏好应该与决策者的偏好类似,这是因为一方面与决策者偏好类似的成员会收集决策者想要的信息,另一方面由于偏好类似所以在报告时不会产生信息的扭曲问题;如果信息收集的成本较高,则委员会应该由具有极端偏好的成员组成,只有这些成员才具有足够强烈的动机付出代价收集信息,但因为信任问题,他们往往只会收集硬信息,即客观上可验证的信息。对于在投票表决前需要对决策选项进行审议的群体决策来说,文[20]的研究结论尤其具有参考价值。
从群体决策机制设计的角度看,如果存在信息获取问题,则机制设计者必须既要考虑如何提供充分的激励促使群体成员获取信息,又要考虑如何有效集结成员所获得的信息,以最大化群体决策的期望效用。
文[21]证明,采用适当保守的决策规则可以促进群体成员收集证据,从而改善决策质量。文[22-23]对存在信息获取时的群体决策最优规则与最优群体成员数量进行了研究。文[22]指出,尽管一致性规则使每个群体成员的投票选择对最终结果都具有决定性影响力,但一致性规则并不能为获取信息提供适当的激励,而且一致性规则特别不适合于信息较不准确的情形,也即更需要群体决策的情形,在只考虑单调纯策略均衡的条件下,除非群体成员的信息足够准确,否则一致性规则或接近于一致性规则的规则不可能最优。文[23]认为,为了提供足够的信息获取激励,对于相当普遍的决策情形,事前最优的决策机制事后可能是非最优的,即不必然利用了所有群体成员获取的信息导致从统计学角度有最优的信息集结,该事前最优的决策机制是在激励成员获取信息与最大程度提取成员信息之间折中的产物。需要指出的是,文[21-23]均假定决策群体成员具有相同的偏好。
三、审议过程中信息的披露
决策群体,尤其是规模较小的群体,一般会在投票表决前对决策选项进行审议,交流各自的私有信息。信息的共享能引起成员信念的收敛。但群体成员通常代表着不同的利益集体,具有不同的利益追求或偏好,因而具有操纵或隐藏私有信息的动机,从而限制了信息共享的可能性,成员间策略性的信息操纵与反操纵甚至导致比纯粹偏好冲突更大程度上的意见不一致。
绝大多数群体决策文献对审议(deliberation)、交流(communication)、辩论(debate)、廉价磋商(cheap talk)等类似表述用语没有进行明确的区分,虽然这些用语在不同场合有一些微妙甚至较大的差异,如文[24]认为审议是辩论的子集。
研究审议对群体决策的影响的文献一般将决策过程建模为两阶段博弈:先审议后正式投票表决,通过对贝叶斯Nash均衡策略和均衡存在条件的分析,研究审议是否以及如何对群体决策发生作用。这类文献一般假定无论是以公共利益还是以私人利益作为评判标准,好的决策选择总是部分取决于世界的真实状态,而世界的真实状态对决策群体成员来说无法确切知道,他们仅不对称地掌握了有关世界真实状态的部分信息。在正式投票表决之前的审议过程可以使群体成员有机会告诉其他成员他们所掌握的私有信息,然后,根据各自已掌握的关于世界真实状态的部分信息,群体成员形成自己对世界真实状态的判断,进而根据自己的评判标准形成各自的决策选择偏好,如果他们的决策选择偏好不一致,就有可能在审议的过程中不披露自己的真实信息,或提供虚假的信息以诱导其他成员作出对自己有利的决策选择。因此,此类文献注重从信息集结角度对完全信息披露均衡和完全信息集结均衡的分析。
Coughlan在文[25]中认为,当所有群体成员的决策偏好完全相同或足够接近,在审议过程中每个成员都具有真实披露私有信息的动机。文[26]则进一步证明,只要群体成员主观上认为多数成员与他拥有共同偏好具有较大的可能性,客观上的偏好差异不会影响信息的真实共享。然而,该文同时指出,审议并不总是能有效集结信息,特别是当群体成员没有较强的先验信念认为自己的价值取向就是群体主流的价值取向时,可能出现有意的相互欺骗。需要说明的是,在文[26]给出的模型中,所有群体成员的偏好或者完全相同,或者完全相反,与此相符的现实群体决策情形很少,甚至几乎没有。文[24,27-28]证明一致性规则在很多情况下为群体成员在审议过程中策略性地隐藏信息提供了动机,多数决定规则比一致性规则能引导出更多的信息共享。文[28]还证明,在相当一般的条件下,审议使得除一致性规则以外的所有其他规则具有相同的序贯均衡集合,也即审议使得所有的无否决权规则在序贯均衡方面等价,从而说明如果群体成员在投票表决前有向所有成员公开宣布各自私有信息的机会,那么采用除一致性规则以外的其他任何决策规则,都会产生相同的决策结果。文[29]对陪审团在审议阶段信息的披露进行了实验研究,以无约束力的意向性投票形式实现信息的交流,实验结果与理论分析基本近似。
另外,文[30]给出了一个两成员的交流与决策模型,两个成员投票表决是否组成具有不确定回报的合伙关系,他们的偏好不一致且为私有信息。文章分析了均衡的特征,发现在均衡时仅有部分信息被传递,交流对于双方的福利是有益的。
对于很多现实决策问题,决策者可能拥有客观上可验证的信息,即所谓硬信息(hard information)。文[31]对硬信息在具有偏好冲突的委员会中的交流进行了研究,证明完全信息集结均衡在偏好为私有信息的情况下比在偏好为常识情况下更有可能存在,即允许更大程度上的偏好差异;另外该文证明,如果信息可验证,完全信息集结均衡的存在条件等同于完全信息披露均衡的存在条件。文[32]指出,在审议阶段群体成员共享私有信息的动机一定程度上取决于其私有信息的可验证性,如果决策成员能够为自己的信息提供验证材料,则一致性规则比其他规则提供了更强的信息共享激励,更有可能实现完全信息共享。文章给出了在一致性规则下审议阶段存在完全信息披露均衡的充分必要条件。
文[33]指出,尽管偏好与信息的差异可能使得部分成员在审议过程中具有错误表达私有信息的动机,但给予群体成员适当的外部激励能消除此类动机,促进信息与偏好的完全集结,而且随着群体规模的扩大,外部激励的强度可以很小,外部激励的具体措施包括对成员决策能力的肯定等。
四、透明性的影响
随着社会的进步,公众对涉及自身利益的重要决策过程的透明性提出了越来越高的要求。透明的决策过程意味着公众可以评价决策群体成员的偏好、能力与贡献,从而引起决策者对自身声誉的关注,而对声誉的关注既可能促进信息的获取和真实信息的披露,但也有可能导致信息传递与投票表决行为的扭曲。
在文[34]中,委员会成员在前一时期表现出的决策能力影响了他在后一时期能否获得连任,而作为委员会成员可为其带来一定的效用。该文证明公开个人投票记录可以促进委员会成员努力获取信息。文[35]认为,仅公布最终决策结果,不公开个人投票记录,会诱导委员会成员按照现有偏见作出投票选择,因此,委员会的决策倾向于保守化,向公众公开成员的投票记录则能够减少现有偏见对决策的影响。该文同时认为,群体决策机制的设计应该不仅考虑决策过程的透明性,也要考虑决策规则的适当性,如果决策规则选择合适,则不透明的决策过程可能比透明的决策过程得到更好的决策结果。在文[34-35]所给出的模型中,都没有考虑委员会成员在投票表决前可能会相互交流各自的私有信息。
在文[36]中,委员会代表公众对一项新工程的实施与否进行表决,委员会成员既关心工程的实际价值,又关心委员会在公众中的声誉,如果维持现状,不实施新工程,则暴露出委员会成员意见的不一致,从而给委员会的声誉带来负面影响,而公众仅能注意到委员会的决策结果,事后不能观测到工程的实际价值。该文证明,在审议阶段,部分成员对声誉的过分关注可能使他们不愿真实披露私有信息,而是夸大工程的价值,导致更容易采取实施新工程的决策。文[37]认为,公开委员会的具体审议记录可能会降低决策质量。由于委员会成员关心公众对其决策能力的判断,使得他们在正式会议交流过程中可能隐藏内部存在的意见分歧,公众对于决策过程透明性的要求,可能导致委员会在正式会议之前组织秘密的非正式预备会议,将真正实质性的讨论从公开的正式会议阶段转移到秘密的预备会议阶段,从而对公众消除委员会内部意见的不一致,而非正式的会议更具有不稳定性,因此,透明性要求并不一定能增加社会福利。
在文[38-40]中,外部利益关联者可以观察到公开委员会每个成员的具体投票记录和决策结果,但对于秘密委员会则只能看到最终决策结果,而委员会成员既关心决策结果又关心外部利益关联者所给予的回报。文[38]和[39]认为,不公布委员会成员的个人投票记录可以减少外部利益关联者对决策的影响,在某些情况下秘密委员会优于公开委员会。文[39]还特别指出,由于随着群体成员数量的增加,单个成员的投票对最终决策具有决定性影响的概率减小,对单个成员而言不诚实投票的代价随之减小,所以对于公开委员会来说,其成员更容易因外部利益关联者承诺给予的回报而不诚实投票,因此Condorcet陪审团定理可能不再成立。在文[40]中,对于秘密委员会,外部利益关联者可以根据投票表决规则的阈值和最终决策结果对委员会成员的投票作出推断。文章分析了秘密委员会的最优决策规则,指出决策规则中增加选择某一选项需要的投票比例可能会导致该选项更容易成为最终决策结果,传统看法认为降低决策规则的阈值可以防止委员会过于保守的看法未必正确,但对于公开委员会则不存在此问题。文[41]虽然不是直接研究透明性,但其研究结论与此处内容相关,该文通过一个博弈模型,说明在特定情况下,外部利益集团可以不用付出任何代价就能操纵委员会的决策。
另外,不少文献从理论与实证两方面研究了决策过程的透明性对货币政策委员会决策的影响。文[7,42]对这方面的文献进行了综述。文[42]区分了三种类型的透明性:决策目标透明性;知识透明性,这里的知识指决策所依据的经济数据或经济模型等;操作透明性,包括委员会会议记录与投票记录的透明性以及决策结果的透明性等。该文评述的文献有部分运用了博弈理论作为分析工具。文[7]专门讨论了货币政策委员会决策过程中的动机问题,指出货币政策委员会的最优规模与透明性等仍有待进一步研究。
类似于文[34],研究透明性对货币政策委员会决策信息集结有效性的影响的文献,一般认为委员会成员希望得到社会公众对其决策能力或决策偏好的正面评价,从而获得连任的机会,如文[43]假设委员会成员希望公众认为他是通货膨胀的强硬抵制者,而最近的文献如文[44-46]等,则假设委员会成员希望公众认为他是具有较强决策能力者。文[44]认为,公开审议过程的详细记录会使得货币政策委员会成员不愿意表达不同的意见,该文通过对美联储联邦公开市场委员会在被要求公开会议记录之前和之后的会议记录的分析说明了理论结果的有效性。文[45-46]分析了投票记录的公开对委员会成员投票表决行为的影响,认为投票记录对公众的透明带来的负面效应占主导地位,透明性不能增加社会福利。
五、最优决策规则
显而易见,不同的决策规则极大地影响了群体决策的信息集结效率,尤其是决策群体成员的偏好或能力不完全一致时,决策规则更是直接影响了群体成员的投票选择行为,进而影响了决策结果的正确性。前述文献大多不同程度地讨论了决策规则的比较和选择,除此以外,另有部分文献对各种情况下的最优决策规则进行了研究。
文[47-48]从最大化期望效用的角度对固定规模的委员会形式集体决策的最优决策规则进行了分析,文[49-50]研究了在特定约束条件下的最优决策规则。然而,这些早期的文献都有个潜在的假设:决策成员仅按照自身获得的信息作出投票选择。文[2,51]等指出,即使决策群体成员的偏好完全一致,也不能保证一定能够如Condorcet陪审团定理所预测的那样有效集结各成员的信息,因为群体成员仅根据自身信息作出非策略性的选择不符合理性要求,当且仅当所使用的决策规则为集结群体成员私有信息的最优规则时,所有群体成员仅按自身信息投票才是Nash均衡,而最优决策规则则取决于特定的决策情形。
文[52]证明,当采用文[48]所定义的最优决策规则时,所有成员仅按照自身获得的信息投票表决形成Nash均衡,但仅按自身信息投票可能不是有效的,因为部分成员联合决定策略性投票可以增加期望效用。文[53]讨论了投票者对不同决策选项具有可用基数表示的效用时的诚实投票问题,试图给出当决策机制允许多种消息类型时诚实投票的准确定义。为使投票者具有诚实投票的动机,文[54]提出了一种在随机选择的投票表决集合上运用多数决定规则得到最终决策的方法,在对所有投票者的表决结果运用多数决定规则和仅对投票表决结果的随机抽样子集运用多数决定规则之间进行随机选择,可以激励投票者诚实投票,从而得到Condorcet陪审团定理的有效性收敛结果。
文[55]基于陪审员的私有信息和策略性表决行为构建了一个陪审团决策模型,证明一致同意规则可能会导致无辜被告得到有罪判决和有罪被告得到无罪判决这两种错误的概率都增加。文[56]分析了决策群体所投票表决的决策选项不独立于投票表决规则的情形:给定决策群体的投票表决规则,提案者向决策群体提出一个要么完全接受要么完全拒绝的议案,群体投票表决是接受还是拒绝该议案。该文证明由于一致同意规则能促使提案者提出更有吸引力的议案,所以增加了决策群体的期望效用,在某些情况下,一致同意规则甚至是Pareto最优的表决规则,因为它也增加了提案者的期望效用,即使提案者与决策群体的利益追求可能完全相反。总结考虑一致性规则的文献[22,24,27,28,32,55,56],可见博弈分析得到的结论往往与人们直观上的认识截然相反,一致性规则是不是合适的决策规则完全取决于特定的决策情形。
既然投票表决规则直接影响了投票者的投票选择行为,那么,对于群体决策机制的设计者来说,他在选择投票表决规则时是否需要考虑投票者在各种表决规则下的投票行为,换言之,机制设计者关于投票者在各种规则下的博弈行为的信念是否会影响到最优决策规则的选择。文[57-58]对此问题进行了研究,其中假设群体成员的决策偏好完全一致。文[57]分析了决策成员的能力存在差异且这种差异是常识的情况下的投票表决规则,指出最优的匿名单调投票规则并不取决于成员是否按照自身信息投票或策略性投票。类似于文[57]的结论,文[58]认为,决策机制设计者对最优投票表决规则的选择与机制设计者关于投票者在不同表决规则下的投票行为的信念无关,在该文中,机制设计者为决策群体选择投票表决规则,其目的是为了最大化决策群体的期望福利,文章证明,仅从信息集结的角度看,关于投票者在各种表决规则下的投票行为的不同假设对于最优决策规则的选择来说,结论是一样的,不同的行为假设导致相同的结论。对于具有相同偏好的决策群体来说,文[57-58]的研究结论大大简化了决策规则的选择。
现实中的决策群体往往存在具有极端偏好的成员,这些成员的存在为信息的有效集结带来较大的困难。文[59]对存在极端偏好者和中立者的群体面对二分决策问题时的最优决策规则进行了研究,考虑了决策成员之间存在转移支付的情况,指出最优投票表决规则相对于转移支付可能性的大小来说是非单调的。文[60]对由两类具有完全相反的偏好的成员所组成的委员会决策进行了分析,对比了一致性规则与非一致性规则的信息集结效率。文[61]给出了一个现实中较难接受的非单调性决策规则――超多数惩罚(supermajority penalty)规则,当选择某一选项的投票过多时,将该选项作为群体决策最终结果的概率反而会下降,该文证明,当对于每个选项都存在极端偏好者时,超多数惩罚规则是最优匿名激励相容规则。
前述文献都假定群体成员的偏好相互独立,而文[62]对群体成员具有相互关联但不完全相同的偏好的情况进行了分析,其中的决策选择空间是连续的,该文分别讨论了采用平均规则与中值规则时所对应博弈的对称贝叶斯Nash均衡的存在性问题,并比较了这两种规则在不同偏好关联程度下的性能。
由于从众心理,群体成员经常会根据对其他成员行为的观察相应调整自己的行为。文[63-64]对从众心理对群体决策的影响进行了研究,其中假定群体成员一方面希望选出好的决策选项,另一方面又希望自己成为胜出的一方。文[63]分析了群体规模较大时同时投票机制与顺序投票机制的均衡特征和信息集结质量,文[64]指出这种从众心理导致同时存在多个均衡,而且对于这些均衡中的多数,信息不能被有效集结。文[64]从某种程度上说明了最优决策规则设计的困难。
六、现有研究工作的不足之处
其一,社会选择理论与公共选择理论以及管理学领域对群体决策的研究,主要考虑偏好集结的有效性,而其中的偏好则是指对决策选项的偏好,这种偏好取决于决策者对最终结果的更根本意义上的偏好和对世界真实状态的信念。在现实社会中,纯粹以偏好的有效集结为终极目标的重要群体决策问题几乎不存在,例如社会选择理论与公共选择理论最重要的应用领域――选举,既是偏好集结(这里指更根本意义上的偏好),更是信息集结。仅考虑偏好的集结问题,不考虑偏好的形成过程以及信息在偏好形成过程中的潜在作用,无法分析群体内外部交流与互动等对决策的影响,无法解释现实中的很多现象,因而对相关决策机制设计的指导作用较为有限。
其二,社会心理学从认知的角度研究群体决策,其结论出自于对实验和经验数据的统计学分析,易于为人们接受。但由于从实验或经验数据中利用统计学方法推导出群体的偏好分布参数极为困难,所以无法深入研究群体决策过程中因偏好不一致而导致的隐藏与扭曲私有信息等策略。
其三,与社会选择理论和公共选择理论一样,用博弈论研究群体决策信息集结问题的文献也是以理性选择假设作为判断与决策的微观基础。尽管所有群体成员严格按照贝叶斯规则更新自己的信念等完全理性假设对于心理学家和普通人来说都是难以接受的,但博弈论文献还是以其数学分析的简洁与严谨颠覆了很多直觉上的认识,通过对群体决策者动机的分析,有助于我们理解决策机制的哪些方面可能会引起不利于决策目标实现的策略,进而有助于决策机制的改进。随着群体成员偏好差异程度和决策问题重要程度的增加,审议方式和决策规则趋向于书面化和正规化,群体思维与群体极化现象将很少出现,决策结果也将更接近于博弈分析的预测。
目前对群体决策信息集结问题的研究尚处于起步阶段,还有很多不完善之处,在某些方面甚至存在根本性的缺陷。
第一,可能是受到信息经济学研究的误导,本领域的很多理论与实验分析文献,包括一些奠基性的文献,混淆了信息与在信息基础上形成的判断。真实信息的披露不会引起其他群体成员以及公众对自己决策能力的负面评价,更不会如判断的披露那样引起认知上的从众,如果决策者掌握了确凿可靠的信息,则其不会因为其他人基于其他信息产生的不同看法而轻易改变自己的信念。
除个别文献外,现有研究群体决策信息集结问题的文献几乎都是将审议完全等同于信息经济学领域的廉价磋商,将交流限制为每个群体成员同时向所有其他成员发送一轮公开的消息。在现实群体决策过程中,审议至少包括对各方面提供的信息的真实性的审议,以及对信息与世界真实状态之间的逻辑关联(即潜在的决策模型)的审议。因此,将审议建模为完全的廉价磋商的现实意义极为有限,对于偏好差异较大的群体更是如此。
第二,客观上难以验证的信息的可接受性,取决于接收者对于信息发送者的偏好的信念,例如,人们有充分的理由怀疑垄断企业单方面提供的企业运营成本数据的真实性。另一方面,在很多情况下,信息的软硬程度(可验证程度)与信息获取者和信息接收者的成本投入相关。因此,群体成员获取可验证信息与不可验证信息的动机,以及群体成员对信息软硬程度的投入,既取决于是否有审议阶段以及审议方式和决策规则,也取决于群体成员的偏好和群体成员关于群体偏好差异程度的先验信念。诸如此类问题现有文献几乎没有涉及。
群体决策在现代社会无处不在,如政府部门对重大战略性问题的决策、公司董事会对重要项目投资与实施问题的决策、审判委员会对犯罪嫌疑人的判决、专家对科学基金项目申请书的评审等。从组织或社会的目标出发,针对特定的决策问题,为了尽可能作出正确的决策,应该如何组成决策群体,选择何种决策规则?此类群体决策的科学化与民主化问题很久以来一直是管理、政治、法律和经济等领域讨论的中心,其研究结果对于各类政治、社会、经济组织的运行机制设计具有重要的意义。
中国学者对群体决策的理论与方法进行了大量的研究,提出了不少新的概念和方法,作出了很多重要贡献,国家自然科学基金委员会对群体决策理论与方法研究也较为重视,曾将其列为优先资助领域。但根据现有的各类文献和历年的基金项目研究摘要,总体感觉国内对决策群体成员的动机和理考虑较少,到目前为止还没有发现国内其他学者利用博弈论研究群体决策信息集结问题。
笔者试图利用不完全信息博弈论和机制设计理论,研究决策群体成员的策略性信息获取、信息传递和投票表决行为,揭示决策群体人员组成、审议方式、决策规则、透明性等决策机制的各个方面对群体决策的信息集结有效性的具体影响。并试图从信息集结角度,为一些典型公共决策情形优化决策机制。
参考文献:
[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.
[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.
[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.
[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.
[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.
[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.
[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.
[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.
[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.
[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.
[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.
[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.
[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.
[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.
[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.
[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.
[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.
[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.
[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.
[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.
[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.
[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.
[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.
[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.
[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.
[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.
[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.
[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.
[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.
[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.
[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.
[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.
[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.
[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.
[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.
[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.
[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.
[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.
[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.
[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.
[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.
[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.
[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.
[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.
[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.
[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.
[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.
[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.
[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.
[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.
[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.
[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.
[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.
[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.
[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.
[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.
[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.
[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.
[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.
[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.
[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.
[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.
【关键词】博弈论;社交网络;访问控制;SNS
1、引言
随着移动通信、光纤通信、云计算、多媒体等技术的快速发展,有效促进了社交网络平台的普及和应用,已经诞生了QQ、微信、微博、BBS、Twitter、Facebook等社交网络平台,这些社交服务采用了SNS模式,可以为人们提供交友、购物、学习等多种服务,扩大了人们生活交际的渠道和平台,进一步改善人们的生活质量和水平[1]。社交网络发展过程中,访问控制一直是人们研究的重点,论文基于笔者多年的研究,详细地分析了社交网络应用发展过程,探讨了基于博弈论的社交网络访问控制应用设计功能,构建完善的用户信任机制、损益机制和病毒防御机制,能够提高社交网络访问控制能力和成效。
2、社交网络应用分析
随着Web2.0的诞生,人们社交服务采用的SNS平台已经得到了广泛应用,其以人为本,具有真实化、个性化、互动性等多种特征,目前已经诞生了多种SNS网站,比如LinkedIn、微博、BBS等[2]。具体的社交网络应用发展包括以下几个方面:
(1)高校型SNS平台。高校SNS平台发展起步较早,一直走在社交网络的前言,目前常用的高校社交网络平台为人人网、BBS、Facebook等,扩展了高校学生交友、学习、就业渠道,丰富高校学生的精神文化生活,
(2)商务型SNS平台。商务交往是企业发展的重要途径,商务活动是企业推广产品、市场营销的重要任务,构建商务型SNS平台,可以为企业构建商务圈,为企业发展提供合作交流、洽谈渠道,目前最为常用的商务SNS平台为LinkedIn,该平台拥有将近7500万家企业入住,涉及电商、旅游、工业、农业等多个领域。
目前,随着SNS服务平台引入更加先进的推广技术,社交网络在各个领域如雨后春笋,诞生了饭否、美团、占座等多个平台,覆盖了人们工作、生活和学习的各个领域,促进了人们生活信息化、便捷化,具有重要的作用和意义。
3、博弈论在社交网络访问控制中的应用设计
3.1构建完善的用户信任机制
目前,许多网络构建信任机制常用的方法是根据网络节点操作记录,判定使用主体可信度[3]。社交网络用户信任可以利用博弈论的网络节点信任数值计算方法,确定用户的信任度,计算过程中利用的数据包括用户注册时间、发帖数量和朋友圈人数等,具体的计算方法如下:
(1)用户驱动方法。用户驱动方法可以根据自己的社会关系、朋友圈确定用户信任度,比如用户和朋友圈的许多人都拥有一个共同好友,则该好友的可信度就判定为较高,比较符合用户的实际情况,具有较高的灵活性。
(2)机器驱动方法。机器驱动方法可以通过SNS平台的发现机制、推荐机制进行执行,平台可以搜集用户的详细信息,利用用户的浏览记录、消费记录等行为,统计计算用户的信任值,可以迅速、客观、简单地分类用户,具有自动推荐等特点。
(3)混合驱动方法。混合驱动方法在集成用户驱动、机器驱动等方法的优点,自动计算和确定用户信任度,为用户推荐朋友圈,并且通过用户判定之后方可建立信任机制,提高了信任可识别性,具有重要的作用。
3.2构建用户损益机制
社交网络用户损益是通过朋友圈人数进行确定的,朋友圈人数越多,收益越大,朋友圈人数越少,损失就越大。但是,用户朋友越多,个人信息和隐私泄露的概率就变大,为用户信息带来了较大的风险。构建用户损益机制,可以防止网络欺骗,鼓励用户之间真诚交流。基于博弈论的用户损益机制包括欺骗与非欺骗服务、诚实与拒绝服务等博弈策略。如果用户认为来访人员带来的损失超过收益,存在欺骗访问行为,可以通过网络将举报信息发送至服务器或管理员处,通过监管对访问人员进行惩罚;当系统认为收益超过损失,判定为诚实访问,将其列入到用户的朋友圈,扩展用户的朋友圈人数,提升用户收益。基于博弈论的用户损益机制可以较为准确地识别欺骗访问、诚实访问,强化欺骗访问的处罚力度,促使用户不能使用社交网络实施欺骗行为,减少欺骗用户数量,提高诚实访问用户数量,促进社交网络能够健康运行和发展。
3.3构建网络病毒防御机制
随着社交网络服务平台的普及,其在为人们带来高质量、信息化生活的同时,也为人们带来了潜在的安全威胁,造成人们的信息丢失,进而钱财、生命安全受到侵害,严重的损害了社交网络正常运行和发展。基于博弈论的网络病毒防御机制可以将用户进行分类,分别是合法用户、攻击威胁用户,这两种用户属于非合作性质的博弈,一方的损失必然伴随一方的获利,是一种非零和的博弈,两者之间的损失和收益是不对等的,并且博弈策略偏向维护合法用户,也就是收益时对合法用户影响较大,损失时对攻击威胁用户影响较大,这种策略可以阻止网络攻击,降低病毒对社交网络合法用户的侵害,具有重要的作用和意义。
4、结束语
随着社交网络平台的快速诞生,社交网络保存了海量的用户信息,因此亟需提高访问控制管理水平,以便保证用户信息的安全性。论文基于博弈论设计了一种访问控制方法,可以构建用户信任机制、损益机制和病毒防御机制,更加符合人们参与社交网络的应用背景,提高人们社交服务的信息化水平,具有重要的作用。
参考文献
[1]孟宪佳,马建峰,王一川,等.面向社交网络中多背景的信任评估模型[J].西安交通大学学报,2015,49(4):73-77.
[2]陈庆丽,张志勇,向菲,等.面向多媒体社交网络的访问控制模型[J].西安电子科技大学学报:自然科学版,2014(6):181-187.
[3]刘娜,叶春晓.线上社交网络访问控制模型综述[J].计算机系统应用,2014(5):1-7.
作者简介
郝宗波,男,汉,19770528,籍贯四川,副高级,研究方向:社交网络、软件工程。
关键词: 混合无线网络; 网络选择; 博弈论
中图分类号: TP391.41
文献标志码: A
文章编号: 2095-2163(2016)06-0141-03
0引言
近年来,随着人们对无线网络连接需要的日益增加,适用于不同工作情况与使用环境的无线网络接入技术得到了飞速的发展。这些技术的提升进步满足了人们随时随地能够接入到无线网络中的理想诉求。人们使用的无线网络连接设备,如笔记本电脑、平板电脑、手机等,往往同时配备了多种满足不同通信需求的无线网络接入技术,如适用于近距离通信需要的Zigbee、Bluetooth,以及适用于中远距离通信需要的WiFi、WiMax、2G、LTE等。而且,同一地区被多种无线网络覆盖的情况也大大增加了,如办公室、商场或者是家中,这些区域往往普遍配设有无限局域网络与蜂窝网络,而蜂窝网络常常也是由多家移动网络服务商各自优化后、且分别提供的,如中国移动、中国联通等,如此这般的多种无线网络接入技术共存的情况被称为混合无线网络。综上可知,在此背景环境中,人们所能选择的无线网络的数量也必然增加。根据使用环境的各异以及用户需求的不同,人们在选择移动设备所要连接的无线网络时将会综合考虑多种因素,如网络的稳定性、网络能提供的带宽以及使用网络需要付出的代价等。网络选择中的基本问题就是研究在多种无线网络共存的情况下,人们(设备)如何根据自身的需要,选择出最合适的无线网络,以及在选择过程中设备更换无线网络的行为趋势。为了分析解决混合无线网络中不同无线接入技术的选择问题,目前已提出了多种方法,如文献[1-2]提出的最大化用户效用的选择方法,文献[3-5]提出的基于多种属性满足的决策制定方法等等。博弈论作为一种数学工具,常常用于研究分析在人们根据自己的情况选择出最有利的策略时,参与者的行为变化趋势以及不同参与者之间相互影响的情况。在无线网络的研究中,由于博弈论在分析无线网络设备选择不同通信策略时其所获得的收益情况与各个设备行为特点上的优势,越来越多的工作利用博弈理论来解决混合无线网络中的网络选择问题[6-7]。本文总结了目前一些利用博弈理论来解决混合无线网络中的网络选择问题的文章,给出了博弈理论在解决这类问题时的一般方法。
[JP3][BT4]1博弈论的基本概念以及网络选择问题的博弈模型[JP]
[BT5]1.1博弈论的基本元素
在博弈理论中,博弈是由博弈的参与者、参与者所能选择的策略的集合、每个参与者选择某种策略时所获得的收益而构成的优选进化过程,过程中包含着3个基本元素,现对其进行如下定义描述。
1)参与者。博弈中能够选择自身策略的单位,可以是某一个体、也可以是某一群体,其目标是通过选择某种策略以使自己收益最大化,当目标为削减成本时为最小化。
2)策略集。策略集中包含了参与者能够选择的所有策略,每轮博弈时参与者将在其中选择一个以指导自己的行为。
3)收益。参与者选择某个策略时所能获得的效用,该效用由参与者选择的策略与其他参与者选择的策略共同决定。
[BT5]1.2博弈结果描述方法
具体地,针对存在多个参与者的博弈描述中,每个参与者将根据收益的大小采取不同的策略,同时某个参与者采取的策略也将影响到其他参与者的收益。当博弈重复进行的时候,各参与者是否可以最终达到某一平衡状态,即参与者是否可以找到一种最合适的策略,使得博弈终止。博弈是否能够终止,以及何时达到终止是博弈论中的重要研究部分。下面将调引最常用的描述博弈终止的状态定义,即纳什均衡状态。
纳什均衡状态用于描述这样一种情况,即在一个博弈中,所有的参与者都选择好自己的策略后,如果任意一个参与者都不能在其他参与者保持所选策略也不变的前提下,通过改变自身采取的策略使得自己的收益增大。这时,就可说系统达到了纳什平衡状态。
如果博弈的参与者用集合N={1,2,…,n}来表示,参与者可以选择的策略用集合S来表示,参与者i所选择的策略用si来表示si∈S,那么s*={s1*,s2*,…,sn*}为纳什均衡,当且仅当对任意的i∈N,存在:
[HT5SS]ui(s*i,s*-i)≥ui(s'i,s*-i)[JY](1)
其中,s*-i表示除了参与者i以外其他参与者所选择的策略,ui()为参与者的收益计算函数。并不是所有的博弈均存在纳什均衡;同时,有的博弈可能存在多个纳什均衡。
[BT5]1.3网络选择问题的博弈模型
网络选择问题存在3种博弈情况。对于每种博弈情况,现做出分析概述如下。
1)用户与用户之间的博弈。这种情况下,博弈的参与者均为需要使用无线网络的用户,多个无线网络用户将分享若干个无线网络接入服务,每个用户所能选择的无线网络接入点就是用户所能采取的策略。用户通过选择不同的无线网络接入点来最大化自己的收益或者最小化自己使用无线网络服务所需支付的代价。
2)无线网络服务商之间的博弈。这种情况下,博弈的参与者为能够向用户提供无线网络服务的各个网络服务商。各个无线网络服务商通过采取不同的自费策略来吸引更多的用户选用自己的无线网络服务,从而达成最大化自己收益的目的。
3)无线网络服务商与用户之间的博弈。参与者分别为无线网络服务商与用户。服务商通过选择不同服务资费标准与服务对象来最大化自己的收益,而用户则通过选择不同的服务商来最大化自己可能获得的网络效用。
[BT4]2博弈论在网络选择问题上的主要研究情况
[BT5]2.1用户与用户之间的博弈
文献[8]将网络选择问题描述为各个自利用户之间的非合作博弈,并使用拥塞博弈模型来研究用户的行为情况。在该博弈中,用户可以在多个可用的无线网络的不同频段中选择其中之一进行连接,在选择某个网络后,该用户将会造成一定程度的网络拥塞,同时用户需要为其造成的拥塞支付费用,而费用的高低将由网络当前的拥塞程度决定。作者形式化地给出了网络拥塞程度的描述以及用户所需支付的费用。实现过程是将该用户的网络选择情况用一组布尔值来设定其表示,如表示用户u是否选择了a网络的布尔值bua。当用户u选择了网络a时,bua=1,如果没有选择网络a,bua=0。此后,研究利用整数规划的方法求解了该博弈的纳什均衡策略。
文献[9]利用演化博弈模型来研究用户的网络选择问题。演化博弈在传统的博弈理论中加入了种群的概念,种群用于表示一组相同类型的用户,种群中的用户可以改变自己的策略以使种群的总体收益增加,或者使种群中其他用户改变自己的行为,以达到收益均衡的目的。项研究利用了演化博弈中的复制动态来研究一群同类用户的行为变化情况。复制动态用来表示种群中选择不同策略的用户的比例的变化情况,数学上是利用常微分方程来构建表示, 其对应公式为:
[HT5SS]x・i(t)=xi[fi(t)-(t)][JY](2)
其中,xi表示种群中采用策略i的个体占种群全体的比例,xi=ni/N,ni为选择i策略的用户的数量,N表示种群中用户的总数量。fi(t)表示参与者选择策略i所获得的收益,(t)表示该种群中所有参与者获得的平均收益。
文献[10]描述了装备有多种无线网络通信技术的设备,在不同网络之间切换服务,以达到自身获得的网络吞吐量最大的目的。文章给出了2类不同的无线网络技术的带宽分配模型,全面分析在了每种无线网络技术下用户的行为变化情况,给出了用户最大化自身收益的算法,并证明了在同种无线通信技术内部切换无线网络基站的情况下,系统存在纳什均衡,即用户在经历有限的基站选择变化后,所有用户均将达到稳定状态,而无需继续改变自身的选择。
[BT5]2.2无线网络服务商之间的博弈
文献[11]提出了一个由4部分组成的用于分配管理无线传输资源系统框架,其中包括网络层分配、容量预留机制、用户接入控制以及连接层分配。作者将带宽分配问题描述为不同接入网络之间的博弈,同时在系统达到纳什均衡时,网络总效益最大。
文献[12]将2个独立的无线局域网之间的接入控制问题描述为多阶段的非合作博弈问题。该博弈中的参与者为2个无线局域网,而策略集则为用户发出的网络接入请求。博弈的结果给出了2个网络最大化自身收益时,网络接入请求在2个无线网络中的分布情况,
文献[13]描述了在多个无线网络共存的环境中,存在一个移动着的用户。为了保证负载平衡以及减少用户在各个网络的交接,作者提出了一合作博弈的方法。参与者为区域中各个可以被用户连接的无线网络,其策略集为用户使用每个网络的优先级。每个候选网络的收益为当前网络负载、预定负载界限与网络惩罚权重的函数。博弈的目标是使每个候选网络的收益值最大。
2.3无线网络服务商与用户之间的博弈
文献[14]利用将无线网络服务商与用户之间的竞争描述为双方博弈的方式,提出了一种防止拥塞的控制机制。作者提出框架包括2个博弈,其中一个为接入控制博弈,另一个为负载控制博弈。接入控制博弈利用了经典的囚徒困境模型,参与者为各种用户-服务商对。每一种服务请求代表了每个参与者具有2个策略选择的博弈。服务商可以接受或者拒绝服务请求,而用户可以选择继续接受服务或者停止接受当前服务商的服务。作者讨论了该博弈的纯策略纳什均衡的存在情况。在负载控制博弈中,用户在不停止传输的情况下选择是否离开当前服务商,而服务商也可以选择是否终止提供服务。文章表明当服务商同时运用2种策略时,得到的收益将会达至最大。
[BT4]3结束语
本文总结了当前利用博弈理论分析解决混合无线网络中网络选择问题的一些代表性工作。值得注意的是,在利用博弈论解决该问题时,不能仅停留在判断是否存在纳什均衡的层面上,还需对如何达到纳什均衡进行研究。博弈论分析了混合无线网络中的参与者在为了最大化收益时的行为情况,为提出更加有效的网络选择方案作出了有益、且实用的贡献。
参考文献:
[1]
BARI F, LEUNG V. Use of nonmonotonic utility in multi-attribute network selection[C]//Processings of Wireless Telecommunications Symposium 2007. Pomona:IEEE, 2001:1C8.
[2] NGUYEN-VUONG Q T, GHAMRIDOUDANE Y, AGOULMINE N. On utility models for access network selection in wireless heterogeneous networks[C]//Processings of Network Operations and Management Symposium 2008. Salvador: IEEE, 2001:144-151.
[3] WANG L, BINET D. TRUST: a triggerbased automatic subjective weighting method for network selection[C]//Processings of Fifth Advanced International Conference On Telecommunications 2009. Venice:IEEE, 2009: 362-368.
[4] BAKMAZ B, BOJKOVIC Z, BAKMAZ M. Network selection algorithm for heterogeneous wireless environment[C]//Processings of IEEE 18th International Symposium on Personal, Indoor and Mobile Radio Communications 2007. Athens:IEEE, 2007: 1-4.
[5] BARI F, LEUNG V. Automated network selection in a heterogeneous wireless network environment[J]. Network, IEEE, 2007, 21(1): 34-40.
[6] STEVENSNAVARRO E, WONG V W S. Comparison between vertical handoff decision algorithms for heterogeneous wireless networks[C]//Processings of Vehicular technology conference 2006. Melbourne:IEEE, 2006: 947-951.
[7] ZHANG W. Handover decision using fuzzy MADM in heterogeneous networks[C]//Processings of Wireless Communications and Networking Conference 2004. Atlanta:IEEE, 2004: 653-658.
[8] MALANCHINI I, CESANA M, GATTI N. Network selection and resource allocation games for wireless access networks[J]. IEEE Transactions on Mobile Computing, 2013, 12(12): 2427-2440.
[9] NIYATO D, HOSSAIN E. Dynamics of network selection in heterogeneous wireless networks: an evolutionary game approach[J]. IEEE Transactions on Vehicular Technology, 2009, 58(4):2008-2017.
[10]ARYAFAR E, KESHAVARZ-HADDAD A, WANG M, et al. RAT selection games in HetNets[C]//Proceedings of INFOCOM 2013. Turin:IEEE, 2013:998-1006.
[11]NIYATO D, HOSSAIN E. A noncooperative gametheoretic framework for radio resource management in 4G heterogeneous wireless access networks[J]. Mobile Computing, IEEE Transactions on, 2008, 7(3):332-345.
[12]CHARILAS D E, MARKAKI O I, VLACHEAS P T. Admission control as a noncooperative multistage game between wireless networks[C]//Processings of Systems, International Conference on Signals and Image 2009. Chalkida:IEEE, 2009: 1-5.
关键词:认知无线电;功率控制;非合作博弈;纳什均衡;效用函数
中图分类号:TN014文献标识码:A文章编号:1672-3198(2009)16-0265-02
0 前言
认知无线电(cognitive radio,CR)是以软件无线电(software radio)技术为基础的能够提高无线通信频谱利用率的新技术。在很多国家,传输效率较高的频段是以授权分配的方式分配给无线通信业务部门和运营企业的,但这些频段的授权用户并不是在任何时刻都使用分配给他的频段,因此不少传输效率很高的授权频段会经常处于空闲状态,这就浪费了宝贵的频谱资源。根据美国联邦通信委员会(FCC)所进行的大量研究表明,在大部分地区,授权频段的平均利用率在15%―85%之间,而一些传输效率较高的非授权频段则过于拥挤。于是Joseph Mitola博士在1999年首先提出了认知无线电概念,目的就是解决频谱资源的有效利用问题。
博弈论(Game Theory)又被称为对策论,是现代数学的一个分支,也是运筹学的一个重要组成部分,是研究互动决策的理论。John Nash博士在1950年提出了纳什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。该理论指出,在一策略组合中,所有的参与者都面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的,此时便达到了纳什均衡。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。这种参与者为了各自利益的最大化不断改变策略的做法,与CR中各认知用户为争得传输效率的最大化对频谱和功率不断进行调整的自适应算法策略相符。因此,可以引入非合作博弈论模型对CR的频谱分配和功率控制算法进行检测和优化。
本文以认知用户的满意度为设计目标,引入代价函数得到一种新的基于非合作认知无线电功率控制的博弈模型,并结合对该模型的分析介绍了非合作博弈论在CR中的一般分析方法。
1 认知无线电体系结构
认知无线电是对软件无线的扩展,因此具备软件无线可重新配置的特点,并且能够实现基于环境认知的自动配置。S•Haykin根据CR所必需的频谱扫描、信号分析、参数测量、频谱决策、协议分析等功能,给出了CR系统构成的基本功能结构,该结构将CR系统分为三个功能模块。
(1)无线频谱分析模块。
该模块通过接收环境中的射频激励,并利用自身算法对激励信号进行动态分析,实时提供对环境中频谱空穴的检测情况,搜集可使用的频谱空穴的信息。
(2)无线信道估计模块。
该模块根据无线频谱分析模块的分析结果,对无线信道状态和容量进行估计,为系统通信信道的选择提供依据。
(3)传输功率控制和动态频谱管理模块。
该模块根据频谱分析模块和信道估计模块的分析结果,选择最优的频谱空穴进行通信。在通信过程中对传输功率进行实时控制,使得首要用户和次要用户均能达到最优的通信水平。
S•Haykin给出的三个功能模块共同构成了CR系统的物理层,从各个模块所具备的功能可以看出认知无线电是应用了多种现代信号处理技术的综合性通信平台。
2 非合作博弈论在认知无线电中的分析方法
认知无线电中的策略选择问题及相关算法的设计是该技术的研究核心。利用非合作博弈论,可以按以下方法及步骤对自适应算法进行分析:
(1)该算法是否能达到纳什均衡。即验证算法是否能达到纳什均衡,具体步骤为:先将所研究的问题抽象为相应的非合作博弈算法模型,然后证明该模型中NE的存在性和唯一性。
(2)该算法达到纳什均衡(NE)后的稳定状态是否符合帕累托最优(Pareto Optimality)。即根据系统的目标函数衡量这一稳定状态是否是实际应用环境中的最优情况。
(3)该算法达到纳什均衡和帕累托最优的约束条件。
3 基于非合作博弈论的认知无线电功率控制模型
在认知无线电中,非授权用户接入处于空闲状态的授权用户频段,可以提高系统的频谱利用率,但是该接入过程必然会导致授权用户和非授权用户之间的干扰。这是由于在CR系统中通常采用动态功率控制以扩大通信系统的工作范围,而每个用户的发射功率都会对其他用户造成干扰。2003年,为了规范移动频段的非授权操作,美国联邦通信委员会(FCC)提出了新的量化和管理干扰的指标――干扰温度。在给定干扰温度和频谱空穴的限制下控制发射功率,可以看做为一组策略问题,而且在实际环境中很好的符合了非合作博弈的模型。在CR中,每个用户都从自身的利益出发,追求功率的最大化,而任何用户发射功率的增大都会对其他用户利益造成影响。因此需要提供一种有效的算法对各个用户的发射功率进行动态控制,以达到所有用户的总利益最大化。
在CR中可以用信道利用率、系统吞吐量、系统信干比等指标来衡量用户的利益。假设以系统信干比来衡量,设计算法时就应当以系统的总干扰水平最小化为设计目标。
通常把授权用户称为主要用户(Primary User),非授权用户称为次要用户(Secondary User)。假设通信环境中多个主要用户和次要用户同时工作,次要用户具有认知能力,即把次要用户看做认知用户。假设认知用户i的发射功率为pi,传输增益为gi,且认知用户与基站存在通信链路,基站接收到的该用户的功率为pigi,第j个主要用户对第i个次要用户的干扰为Qij并有M个主要用户,则相应的次要用户在基站处的信干比(SNIR)为:
ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)
其中σ2为基站处背景噪声,Ri为传输速率,W为第i个用户在的扩频带宽。
文献提出的非合作的认知无线电网络的功率控制纯策略的博弈模型(NPCG)定义了:参与者I={1,2,…,N}为认知网络中非授权用户的集合;策略空间pi,认知用户在一次博弈中选择的策略构成功率矢量P={p1,p2,…,pN};用 表示用户i的效用,即用户i对所选策略的满意程度,其中p-i是除i外其他N-1个用户的功率。
在该模型中,每个认知用户的策略都是尽量增大功率,以获得更高的效用。但当功率超过干扰温度后,整个系统的性能会迅速恶化,进而造成每个用户的效用都会降低。因此,必须选定合适的代价函数,使用户获得更高效用时付出相应的代价。考虑到在低于干扰温度时,用户只需付出较小的代价,而当超过干扰温度时,每增加一定的效用必须让用户付出更高昂的代价,笔者选择SINR的正切函数做为代价函数:
Ci=tg(kri)(2)
其中k为干扰系数,在认知用户发射功率接近干扰温度时,kri的取值接近π2 。
在非合作的认知无线电网络的功率控制纯策略的博弈模型的基础上,结合式(2)笔者提出基于非合作的功率控制算法的数学模型:
ui(pi,p-i)=Ripif(ri)-λpiritgri(3)
其中piri表示增加单位信干比所要增加的功率,λ为惩罚因子,代表代价函数有效性的量度。该模型通过引入代价函数增加了惩罚机制,以此来控制认知用户为追求信干比一味增大发射功率的行为。当功率超过干扰温度后的严厉惩罚,会使所有认知用户意识到,牺牲一定的信干比可以带来效用的最优,从而将发射功率控制在干扰温度以下,避免了超过干扰温度后系统性能迅速下降的恶性情况出现。
按照上节介绍的分析步骤对式(3)给出的模型进行分析,讨论该模型是否存在纳什均衡(NE)以及是否符合帕累托最优。对式(3)求一阶导数后可求得微分方程的驻点,进而再求出二阶导数,易证式(3)的二阶导数小于零。因此可得出该非合作博弈过程中NE的存在性和唯一性,所求得的驻点为唯一的纳什均衡点,同时该驻点即为所应满足的约束条件。
4 结论
认知无线电概念提出的20年以来,随着相关技术的研究不断深入、相关传输标准的确立以及计算机处理能力的提高,CR的应用越来越广泛。本文首先介绍了CR物理层的基本结构,然后结合一种新的基于NPCG的非合作非合作功率控制模型的构建,介绍了非合作博弈论在认知无线电中的分析方法。综上所述,我们有理由相信,随着相关理论和技术的不断进步,非合作博弈论必将在认知无线电的功率分配、频谱分配以及其他核心研究方向发挥更大的作用。
参考文献
[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.
[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.
关键词: 最优化方法 合作博弈 分配模型
在社会发展过程中,水资源已成为影响区域发展的重要资源,流域范围内水资源利用的冲突,归根就是各利益主体的水资源开发利用和水环境保护合作问题。解决流域环境问题冲突时,排污权分配是一个重要问题,一般以多目标优化模型为技术手段,以达到流域全局最优策略;但各个主体的既得利益也不能忽视,如何通过谈判达到多赢效果也是一个重要问题。因此,博弈论也被广泛应用于流域内的排放、分配问题的研究。污水处理厂作为我国常见的排污个体,由于种种原因仍处粗放式管理,同一流域的污水处理厂,可能存在地域性的不公平,未能达到整体的最优化。本研究从这个角度切入,通过建立最优化-合作博弈模型,研究了同一流域内不同污水处理厂的排污量分配及利益分配方案,实现区域整体最优化,并通过利润再分配减少了各参与主体的成本。
1 文献综述
目前我国在控制改善环境质量方面,污染物总量控制制度发挥着重要作用。基于总量控制下的河流排污权分配,我国学者利用优化模型进行研究,如陈阳[1]等研究了一种基于相互补偿的协商分配模型。刘首文[2]等、黄国如[3]等以基本遗传算法求解多个排放口的最优化处理问题。王艳[4]运用最优控制原理与博弈论,研究了流域水环境管理的区域间自愿合作协商促进机制。刘红刚[5]等采用合作博弈论方法,建立了在给定污染物总削减比例条件下各区域环境合作的博弈模型。在国外方面,Deininger[6]使用线性规划方法研究了在保证预设水质要求的条件下污染负荷的最优分布。Liebman和Lynn[7]、Shih[8]使用动态规划识别了污染负荷沿着一条河流的最优分布。Loucks等[9]建议对于同一类问题推广线性规划方法。Ecker[10]提出了一个几何规划模型,并用于在维持现状溶解氧水平的基础上优化河流污染负荷分配,以达到处理费用最小化。CardweIJ和Ellis[11]提出了一种最优化模型,用于在考虑参数不确定性和模型不确定性的清况下,进行多个点源的污染负荷分配。总体来说,国外对环境冲突问题的研究日渐深入,博弈论在国外环境科学领域的研究成果非常丰富,提出过包括流域污染微分博弈的旁支付方法、流域污染多阶段超级博弈模型等方法,几乎博弈论的每一个最新成果,在环境问题中都能找到应用实例。
2 区域污染物排放量最优化分配模型
2.1 问题提出
假设某一流域存在n个排污口,如n个污水处理厂。将每个排污口作为整个博弈系统的一个参与者,则所有的参与者形成一个集合I 。在给定集合I排放总量情况下,如何分配集合内部各参与者(排污口)之间污染物排放量,并尽可能使其节约成本。其中,不同的参与者用i(i =1, 2, ..., n)表示,其排放量用s表示,各排污口的处理率为η。
由于η为各排污口的处理率,因此可将ηi称为各个参与者(排污口)i的处理策略,将I=(n1,n2,...,nn)称为参与者的策略集。
通常,各污水处理厂的污水处理费用,也就是参与者i的成本可以用下式来表达:
区域内总排污成本为:
其中,M表示处理成本,η表示污水厂的处理率,q表示流量,a、b、c分别为参数,具体由于各地区不同工艺设备、成本控制、排污流量等因素而产生差异,需通过具体调查确定。对于同一污水处理厂,若当地管理者要求污染物削减量越大时,则要更大幅度地提高污染物的处理率,以达到更高的治理要求,则处理成本Mi越高。
一般来说,在形成合作联盟之前,各个参与者间无好的信息交流或合作协议,较为公正的排污分配方案是统一采用平均分摊法,例如,每个排污口都采取相同处理率。此时则有:
其中,上标N代表为非合作状态。式2-4即为采用平均分摊方案情况下的总成本。
平均分摊对于每个参加者来说或许是公平的,但这其实是因各参与者间缺乏信息共享、没有形成统一联盟,而形成一个整体高成本的Nash均衡的博弈结果,即所谓的“囚徒困境”。根据合作博弈理论,其结果必定符合Pareto最优,通过形成协议联盟进行合作,降低总体成本,获得额外利益,并进一步将收益公平合理分配,从而使各个参与者合作后的成本都低于合作前的成本,这种做法是完全可以实现的。
当采取合作时,则总体成本存在最优化模型:
其中,约束条件(2-6)表示进行区域合作后的排污量必须到达规定排污量削减指标。约束条件(2-7)表示处理率的范围在0-1之间。
此外,根据合作博弈的定义,该联盟合作后的成本必须小于合作前各成员单干的成本,否则该联盟的形成就没有意义。因此还有下式成立:
2.2 优化模型解析解
3 合作博弈分配模型
3.1 优化模型存在问题
经过优化模型分配后的排放量,虽然在整体经济效益上最优的,但对于参与的各个成员来说,则未必最优。最优化的结果通常为大部分参与成员成本下降,某些参与成员反而成本上涨。因此对这些成员来说,他们没有真正参与合作的动机,联盟也就不能成立。因此,要保证联盟成立,统一优化过程可行,还需进一步对联盟得到的利润进行科学合理的分配,使每个参与成员的成本在参与联盟后都比参与前有所降低,确保联盟合作的可行性。
在这个联盟中,Z(I)是所有参与者都参与的大联盟,同时,任意参与者都可能会形成一个子联盟,该子联盟是大联盟集合I的真子集。因此,若存在n个参与者,则共可以形成2n个子联盟。设某个参与者的子集合K形成的博弈联盟为Z(K)。
定义V为联盟所获得的收益,则V(I)为大联盟所获得的收益,V(K)为子联盟所获得的收益。用pi表示参与成员i从联盟最大收益值中V(I)应获得的利润,集合P=(p1,p2,…pi)称为该合作博弈的分配策略。根据合作博弈的定义,pi应同时满足以下两个条件:
(1)整体合理性:
即每个参与者所分配到的额外收益,等于整个合作联盟比合作前增加的额外收益的总和。
(2)个体合理性:
即每个参与者参与联盟后得到的收益,应当高于他未参加合作时(即单干时)所获得的收益,否则该成员没有参与联盟的动机。
3.2 博弈模型的求解
因此,要对合作联盟得到的利润进行合理分配,就是要求解满足上述条件的pi的过程。合作博弈模型的求解方法比较多,本文主要选择Shapley值法与核心法,分别进行求解。
对于一个联盟来说满足式(3-1)及式(3-2)的分配方案有很多种,在一般情况下,或在强有力的约束协议下,只要满足上述两式条件的分配方案都可以被参与成员接受。但是如果联盟协议的约束力并不强,并假设所有参与者都追逐最大利益的情况下,则还要考虑子联盟的情况。若有数个参与者发现当他们组成一个小联盟后,获得的收益比参与大联盟时要更高,这样他们就不会参与大联盟,而形成收益更高的小联盟了,而大联盟也就随之不能成立。因此,在这种情况下,大联盟的分配必须保证每个成员的的收益都高于他任何可能参与的小联盟的收益,才能保证大联盟的稳定性。
由于核心是满足以上所有条件的解集,因此理论上来说核心内的解才是最符合联盟收益最大化的。从满足整体合理性及个人合理性的角度来说,以核心作为分配策略才最为合理。但遗憾的是,由于要求过高,核心的解集往往是空集,从而大大限制了核心法的运用,因此只能寻求其他的妥协方法进行求解,从而求得到相对公平的分配策略。
Shapley值法是一个重要的求解方法之一,其可确保得到合作博弈的唯一解。其结果可能在核心集合内,也可能在核心集合外,但能保证存在唯一解。事实上,Shapley值法是对于该博弈联盟的每个参与者,考察其对所有可能存在的子联盟的贡献率及其概率大小,按照该贡献率给出参与者在联盟博弈中的一个分配方式。Shapley值由特征函数V确定,特征函数V即该联盟合作后获得的额外利润。由于当联盟中仅存在一人时,即相当于该参与者单干,因此他采取的策略仍为平均分摊法时的策略,即η。由此可知,当联盟K为单参与者i时,V(i)= 0。
综上所述,根据最优化结果得到的分配方案建立的博弈模型,是以求解分配方案P=(p1,p2,…pi)为目标。首先必须求得联盟的特征函数V,包括大联盟I的特征函数,以及所有子联盟K的特征函数。随后根据式(3-3)(3-4)(3-5),寻找该博弈模型的核心,看是否为空集。
一般情况下都采用Shapley值法进行求解博弈模型,因其是根据成员贡献来进行收益分配,且一定有解,解可能在核心集合内。Shapley值法可根据以下公式进行求解:
上式中,Pi即为Shapley值。|K|为博弈联盟K所含的元素个数,V(K)表示包含参与者i的联盟K的博弈特征函数,V(K\i)表示在联盟K中,若将参与者i除去后,剩余参与者组成的博弈联盟的特征函数。
4 研究案例
4.1 案例现状及参数选取
本研究选用粤西阳春市漠阳江流域。参考《粤西水质保护规划》,根据不同规划年限城镇生活污水处理率的要求,综合考虑水污染源预测结果、污水处理厂建设规划现状、削减量,提出的漠阳江流域城镇污水处理工程建设方案中的重点规划项目,漠阳江上游的春湾污水处理厂于2010年新建,处理规模1.0万t/d,2020年将扩建至2.5万t/d;合水污水处理厂于2010年新建,处理规模1.0万t/d,2020年将扩建至1.5万t/d;春城污水处理厂与2010年扩建至规模4万t/d,2020年将扩建至8.0万t/d。本研究将采用以上污水处理厂2020年数据。
根据上级单位分配给阳春市的“十一五”COD排放总量,规划提出近年内COD目标总量控制方案,见下表。
表4-1 漠阳江阳春市流域COD总量控制目标
本研究采用2020年COD允许排放量数据进行计算。
此外,由2.1节可知,污水处理厂的处理率参数a、b、c,具体由于各地区不同工艺设备、成本控制、排污流量等因素而产生差异。根据文献调查,式(2-5)中的污水处理参数a=200,b=1000,c=0.8,污水处理厂进水COD浓度为650mg/L。
4.2 最优化方法求解排污量分配
根据上节,至2020年时三个污水处理厂运行规模,可以算出每个污水处理厂的平均排污流量(春湾污水处理厂为1,合水污水处理厂为2,春城污水处理厂为3,下同)及COD产生量。又根据表3-2,由于2020年该流域内COD允许排放量为6686t,因此总的COD处理率应至少达到0.77。在形成合作之前,为公平起见,每个污水处理厂都采取相同的处理效率,即都采取77%的削减率,这能达到管理者的要求。在这种情况下,根据式(2-1),各厂的成本分别为:
即,1号参与者采用0.56的处理率,2号参与者采用0.52的处理率,3号参与者采用0.88的处理率时,可以使总成本达到最小。相比起采用平均分摊法的策略,总体成本共节省了45.45万元。
但是如果直接采用这种方法的话,会使1号、2号参与者的成本有较大的降低,而使3号参与者的成本有较大的提升,这样3号参与者必定不会同意这种联盟的实现。因此,为了使得合作顺利实现,必须对合作带来的收益(即经集体规划后节省下来的资金)用合作博弈模型重新进行分配,使各个参与者在参加联盟后都有所收益,才能保证联盟的顺利进行,保证最优化分配的可行性。
4.3 合作博弈模型求解分配方案
5 结语
本论文对在同一流域的不同排污口之间的排污量最优化分配模型及成本分配的合作博弈模型上进行了研究。以同一流域内的不同排污口为基础,为改变平均分摊法导致成本较高的弊端,在达到管理者要求的处理率的前提下,以总体成本最小为目标,建立了排污口处理率分配优化模型,并通过数学方法,求得了该二次规划问题的解析解。由于最优化的结果通常为大部分参与成员成本下降,而某些参与成员反而出现成本上涨,因此这些成员没有真正参与合作的动机,联盟也就不能成立。为保证联盟成立使得统一优化过程可行,通过建立合作博弈的模型,并使用核心解法及Shapley值法,进一步对联盟得到的额外收益进行科学合理的分配,使得每个参与联盟成员的成本都比参与前降低。根据粤西漠阳江流域阳春市范围内的春湾、合水、春城三家污水处理厂,以当地管理者提出的COD排放总量控制要求,用合作实例用模型进行了验证分析。在满足COD最大允许排放量的情况下,通过组成统一联盟,进行处理率最优化,以及采用合作博弈进行收益分配后,春湾、合水、春城三家污水处理厂分别采用56%、52%及88%的处理率,取代之前的平均分摊法,使得处理成本分别比合作前降低了11.79、10.69及22.97万,分别占总成本比例的4.01%、5.56%和3.86%。可见,通过合作降低成本的做法是有效的。
【参考文献】
[1] 陈阳,赵勇,肖江文.激励机制下污染物允许排放总量的分配模型[J].华中科技大学学报,2006,34(6)
[2] 刘首文,冯尚友.遗传算法及其在水污染控制系统规划中的应用,武汉水利电力大学学报,1996.29 (4):95-99.
[3] 黄国如,胡和平等基于遗传算法的水污染控制系统规划清华大学学报,2002,42(4)551―554
[4] 王艳.流域水环境管理合作促进机制博弈分析[J].系统工程,2007,25(8):54-57
[5] 刘红刚,陈新庚,彭晓春.基于合作博弈论的感潮河网区污染物排放总量削减分配模型研究[J].生态环境学报,2011,20(3):456-462
[6] Deininger,R.A.. Water quality management: the planning of economically optimal pollution control systems[D].Northwestern University, Evanston,Illinois. 1965
[7] Liebman,J.C.and Lynn,W.R. The optimal allocation of stream dissolved oxygen[J].Water Resources Research.1966.2521
[8] Shih,C.S.. System optimization for river basin management[Jl. Journal of the Water Pollution Control Federation.1970.42: 1792
[9] Loucks,D.P.,Revelle,C.S. and Lynn,W.R.. Linear programming models for waterpollution controI[J].Management Science,1967,14(B):166
【关键词】地下空间;规模论证;万博中心
Scale demonstration of the method of underground space
- A Case Study of Underground Space Guangzhou Huambo Center
Abstract:In this paper, the implementation of the project of underground space Guangzhou Huambo Center for example, through the development and construction of underground space in the actual space requirements for each function segmentation studies, comprehensive judgment overall development scale. For similar problems have important reference.
[Key Word:Underground space, Scale demonstration, Huambo Center
1、引言
国内外城市中心区地下空间需求量预测工作尚处于研究探索阶段, 还没有形成一整套系统的需求预测方法。
本文以实施工程广州万博中心地下空间为例,通过对地下空间实际开发建设的各功能进行空间需求细分研究,综合判断总体开发规模。由于,地下交通、市政设施属于公共设施范畴,且不需计容,规模论证集中分析商业规模的论证。期望通过本次研究对于同类问题具有重要借鉴意义。
2、规模论证是控规层面地下空间规划的主要内容
地下空间规划是城市规划的重要组成部分。城市地下空间规划分为总体规划和详细规划两个阶段进行编制。详细规划阶段地下空间由分为控规层面地下空间规划及修详层面地下空间规划。
控规层面地下空间规划内容为:根据地下空间总体规划的要求,确定规划范围内各专项地下空间设施的总体规模、平面布局和竖向分层等关系;针对各专项设施对规划范围内地下空间资源的开发利用要求,提出公共性地下空间以及开发地块内必须向公众开放的公共性地下空间设施的控制要求。对开发地块地下空间资源开发利用的控制以指导性为主,仅对开发地块地下空间与公共性地下空间之间的连接进行详细控制;结合各专项地下空间设施的开发建设特点,对地下空间的综合开发建设模式、运营管理提出建议。
因此,规模论证为控规层面地下空间规划的主要工作内容。
3、万博中心地下空间规模论证的方法
3.1方法一:地面与地下规模对比法
万博地下空间的开发建筑面积约为179.87万O(约为地面总量的48%)。综合国内外相关案例,如蒙特利尔、北京中关村西区、杭州钱江新城等地下空间开发多与地铁站相结合,功能上以商业和停车为主,开发量一般为地上建筑量的30%―50%。
表1:新建城市中心区地下空间开发量一览表:
3.2方法二:详细功能累计法
万博中心地下空间主要功能包括:道路交通设施、市政管线、地下商业设施三大部分内容。
图1:万博中心地下空间三大功能构成图
3.2.1地下交通设施包括:地下停车库、地下道路、地下通道及公共出入口/等设施,面积共137.58万平方米。
a、地下停车规模:根据《广州市建设项目配建停车位指标》,本区属于B区范围,机动车停车位约3.23万个,地下停车建筑面积(含设备用房)面积约117.36万O。
b、地下道路规模:根据地下道路系统设计(市政隧道双向共2车道、主环路单向3车道、次环单向2车道,6组出入口隧道)建筑面积共约13.88万O。
c、公共通道规模:万博二路、汉溪大道地下负一层、负二层人行道作为公共通道,负一层通道宽度不少于15M,局部扩大为18M;负二层公共通道不少于8M,建筑面积约3.78万O。
d、公共出入口/下沉广场/垂直交通/逃生口/风井等设施规模:主要沿汉溪大道东、万博二路布局,建筑面积约1.17万O。
e、地下轨道规模:根据地铁方案设计,分别在负一层、负二层设有地铁风井、地铁设备房及收费处,负四层设有轨道及地铁站台,建筑面积约1.87万O。
3.2.2地下市政设施包括:地下战场、地下综合管沟两部分内容共3.05万平方米。
市政设施的地下化发展为城市提供了更广阔的空间,将成为未来城市建设和发展的趋势和潮流。鼓励万博项目采用创新型可持续市政基础设施系统。
规划原则:遵循合理性、持续性、可行性原则,以地下市政管线综合化为重点,以高效低耗为目标,以实现城市可持续发展为宗旨,使城市向生态化迈进。
在区域内共有12种工程管线:分别为冷冻水管、冷冻回用水管、真空垃圾管、给水管、10KV电力电缆、电信电缆。在管沟局部段有DN1200压力补水管、11万伏电缆及DN200热水管、热水回用管、蒸汽管道、凝结管道。
a、地下市政站场规模:共设置雨水沉淀池、中水处理站、2处隧道雨水提升泵房、真空垃圾处理站共5个地下市政站场,建筑面积约0.33万O。
b、地下综合管沟规模:减少道路开挖的次数、有效缩短管线施工的工期、提高地下空间利用率和提高工程的综合质量和投资效率,解决整个万博片区的电力供应、通信支持、中央空调系统、真空垃圾收集系统、自来水供应等问题。沿万博核心区围绕主环路敷设综合管沟,核心区设有综合管沟,考虑管沟外在敷设条件,综合确定管沟尺寸为:B×H=8.9m×6.0m。管沟建筑面积约2.24万O 。
地下商业设施:通过研究国内外城市地下空间,采取地上地下平衡法、类比法综合确定万博地下3.2.3商业设施规模
a、地上地下平衡法
日本是世界上地下商业最发达的国家,最早的地下空间开发已商业开发为目的(1955年上野火车站项目),商业开发规模结合地上建设,以市场需求为导向。
根据研究日本中心区地下商业开发面积与地上面积存在1:10至2:10的关系(根据上海科学技术委员会课题研究,编号04dx12009),具体规模与地铁站点、地质及服务人口也有关。
由于万博地区地下商业主要集中在地铁站点附近,即核心区内,因此,若以核心区地上面积为计算基础,则地下商业面积宜为20.7万平方米至41.4万平方米。
b、类比法
根据“广州市总体发展战略规划2010”万博地区定位为城市副中心,目前我国城市副中心地下商业均在40万平方米至5万平方米左右,建议万博地下空间控制在45万平方米以内。
因此,综合以上三大地下设施规模,万博中心地下空间总规模为181.25万平方米,其中交通设施约占76.57%,市政设施约占1.42%,商业设施约占22.01%。
结语
由于地下空间的建设具有设计专业类别多、建设不可逆、工程难度大等特征,控规阶段的地下空间规模研究涉及内容较多,如对于商业设施规模这部分内容,由于其开发是否成功与详细的商业策划及后期运营密切相关,地下商业策划的内容未来也会成为决定其规模的重要依据之一。因此,随着地下空间未来开发建设的成熟,相信对于规模论证会提出更多科学手法。
图2:万博地下空间效果图:
参考文献
[1] 汪波宁. 城市高密集区地下空间规划与实施初探―以武汉王家墩商务区核心区地下空间规划为例.中华建设.2009(4)
关键词:冷弯薄壁不锈钢;广义梁理论;非线性材料;受压构件;屈曲荷载
中图分类号:TU973.13
文献标志码:A
文章编号:1674-4764(2013)04-0068-11
不锈钢材料具有华丽的外观、优异的抗腐蚀性能、良好的力学和工艺性能、较高的比强度与比刚度、较低的维护费用等诸多优点,在建筑结构领域已获得较广泛的应用,如广州国际会展中心不锈钢屋面板、天津港四号卡子门不锈钢空间网架结构等,结构新颖,造型美观,具有显著的经济效益与社会效益[1]。受材料造价或建筑造型需要等因素影响,不锈钢通常被加工成薄壁构件并冷弯至各种形状,此类冷弯薄壁构件的稳定问题较突出,在结构设计时必须谨慎考虑。
与普通碳素结构钢相比,不锈钢在化学成分上增加铬(Cr)和镍(Ni)等合金元素使其耐腐蚀性能得到极大改善[2],在材料受力性能方面亦表现出显著不同:不锈钢材料没有类似普通碳素钢的屈服平台,其应力应变曲线表现为典型的非线性特征,并具有低比例极限和良好的应变硬化性能[3]。这也就意味着即使不锈钢薄壁构件失稳时应力(应变)水平较低,材料也极可能处于非线性阶段,其屈曲性能将受瞬时弹性模量控制并表现出相应非线性特征。处理此类问题需构建三维本构关系,运用荷载增量法确定平衡路径,最终得到构件临界屈曲应力[4-5],与弹性稳定分析相比有较大区别且更加复杂。目前中国关于不锈钢薄壁构件稳定性能研究较少,缺乏科学的理论分析和设计指导,极大阻碍了不锈钢结构的应用与发展。
本文基于广义梁理论(Generalised Beam Theory,以下简称GBT)基本原理针对不锈钢材料进行修正,根据流动法则、变形法则定义其瞬时弹性模量,利用Quach模型定义其非线性应力应变关系,并以荷载增量形式给出修正GBT平衡方程、边界条件及特征值计算公式,最后将提出的修正GBT法计算结果与试验结果进行对比验证。需要说明的是,受瞬时弹性模量影响,计算包含迭代过程,需借助软件(Maple、C++或Matlab)完成,因此提出公式严格来讲属于准解析的计算公式。
1非线性材料GBT计算公式
1.1传统GBT的基本原理
传统GBT理论主要用于线弹性薄壁构件稳定性能分析,按以下步骤进行[6-9] :
1)截面分析。构件截面划分为连续折板,屈曲模态分解为一系列截面基本变形模态的线性组合,根据弗拉索夫假设和各基本模态单位翘曲、横向位移构造位移函数,计算截面刚度系数矩阵。
2)构件弹性稳定分析。考虑构件的长度和边界约束情况,建立GBT平衡微分方程和边界条件,利用有限差分法、有限元法或伽辽金法求解此特征值问题,最终通过线性组合求得此构件屈曲应力及相应屈曲模态[10-11]。
目前已有依据GBT理论编写的稳定分析程序GBTUL[12],计算精确迅速,成为继有限条法、有限元法后研究人员处理薄壁构件弹性稳定问题的主要计算方法,被科学研究和工程设计领域广泛采用。然而,传统GBT理论只能用于构件弹性稳定分析,对于非线性材料的稳定问题尚不能予以有效解决。Goncalves和Camotim利用GBT法对不锈钢薄壁构件屈曲性能展开研究[13],得到矩形薄板、C形卷边截面和矩形闭口截面构件在均匀受压时的屈曲模态和稳定曲线,但其本构方程采用Rasmussen模型,此模型经证实不能准确反映不锈钢材料应力应变关系[3],且文献[13]中的GBT公式缺少必要推导过程,不同模态下构件屈曲应力计算过程不明确,结果缺乏试验数据验证。本文基于传统GBT理论及Goncalves和Camotim初步研究成果对GBT方法进行修正,使其适用于非线性材料构件的屈曲性能分析。
1.2应力应变关系模型
不锈钢是典型的非线性材料,应力应变关系模型精确与否对确定本构关系有着至关重要的影响。这方面的研究成果较为丰富,其中Quach等人提出的三段式模型[14]能够准确反映不锈钢材料的应力应变关系,是目前可供选用的最佳应力应变关系模型[3]。本文选用该模型描述不锈钢材料的应力应变关系,即:
1.3瞬时弹性模量
传统GBT理论采用弹性模量矩阵描述材料各方向本构关系,弹性模量矩阵在计算过程中保持不变。然而,非线性材料的应力应变呈非线性关系,随着应变的发展,弹性模量不断折减,构件刚度不断退化,固定的弹性模量矩阵不能反映材料真实本构关系。因此,需将弹性模量表达为应力(应变)的函数,以反映非线性材料在特定应力(应变)状态下的本构关系,即“瞬时弹性模量”。通过定义瞬时弹性模量矩阵对GBT法截面分析、构件稳定分析进行修正,使其能够正确描述构件屈曲状态,并最终根据平衡方程求得屈曲应力。本文基于小应变弹塑性理论确定材料瞬时弹性模量ij,假设材料屈服面服从Mises屈服条件,采用J2流动法则[15]和J2变形法则[16]2种理论的瞬时弹性模量ij中各分量表达式为:
3结论
提出适用于非线性材料的广义梁理论屈曲荷载计算方法,并对不锈钢薄壁受压构件局部屈曲、畸变屈曲和整体屈曲3种失稳模态的屈曲荷载进行计算。经验证,本文提出的修正GBT法具有较高精度,可用于确定非线性材料屈曲荷载,同时应注意以下2点:
1)传统弹性计算方法不适用于不锈钢等非线性材料。由于未考虑瞬时弹性模量变化,忽略了非线性材料的刚度折减,传统弹性计算方法的计算结果明显高于试验值,不能用于实际工程设计。
2)与流动法则相比,按变形法则理论确定材料瞬时模量,所得计算结果精确又偏于安全,且公式形式简洁、程序编写容易,可为研究人员、设计人员参考采用。
参考文献:
[1]王元清,袁焕鑫. 不锈钢结构的应用和研究现状[J]. 钢结构, 2010, 25(2): 1-12,18.
[2]Gedge G. Structural uses of stainless steel-buildings and civil engineering [J]. Journal of Constructional Steel Research, 2008, 64(11): 1194-1198.
[3]朱浩川, 姚谏. 不锈钢材料的应力-应变模型[J]. 空间结构, 2011, 17(1): 62-69.
[4]Tvergaard V, Needleman A. On the foundations of plastic buckling [J]. Developments in Thin-Walled Structures, 1982, 1:205-233.
[5]Hutchinson J W. Plastic buckling [J]. Advances in Applied Mechanics, 1974, 14: 67-144.
[6]Schard R. Generalized beam theory-an adequate method for coupled stability problems [J]. Thin-Walled Structures, 1994, 19: 161-180.
[7]Davies J M, Leach P. First-order generalised beam theory [J]. Journal of Constructional Steel Research, 1994, 31(2/3):187-220.
[8]Davies J M, Leach P, Heinz D. Second-order generalised beam theory [J]. Journal of Constructional Steel Research, 1994, 31(2/3): 221-241.
[9]Davies J M. Generalised beam theory (GBT) for coupled instability problems [C]//Courses and Lectures International Centre for Mechanical Sciences, 1998:151-224.
[10]Schardt R. Generalized beam theory-an adequate method for coupled stability problems [J]. Thin-Walled Structures, 1994, 19:161-80.
[11]Schardt R. Lateral torsional and distortional buckling of channel-and hat-sections [J]. Journal of Constructional Steel Research, 1994, 31(2/3): 243-265.
[12]Camotim D, Silverstre N, Goncalves R, et al. GBT-based structural analysis of thin-walled members: overview, recent progress and future developments [C]//Advances in Engineering Structures, Mechanics & Construction, 2006: 187-204.
[13]Goncalves R, Camotim D. GBT local and global buckling analysis of aluminium and stainless steel columns [J]. Computers & Structures, 2004, 82: 1473-1484.
[14]Quach W M, Teng J G, Chung K F. Three-stage full-range stress-strain model for stainless steels [J]. Journal of Structural Engineering, 2008, 134(9):1518-1527.
[15]Handelman G H, Prageb W. Plastic buckling of a rectangular plate under edge thrusts[C]//National Advisory Committee for Aeronautics Report 946, 1948: 479-506.
[16]Bijlaard P. Theory and tests on the plastic stability of plates and shells [J]. Journal of the Aeronautical Sciences, 1949(16): 529-541.
[17]童根树. 钢结构的平面外稳定[M]. 北京: 中国建筑工业出版社,2007.
[18]Silvestre N, Camotim D. Second-order generalised beam theory for arbitrary orthotropic materials [J]. Thin-Walled Structures, 2002, 40(9): 791-820.
[19]Bradford M A, Azhari M. Buckling of plates with different end conditions using the finite strip method [J]. Computers & Structures, 1995, 56(1): 75-83.
[20]姚谏, 夏志斌. 钢结构——原理与设计[M]. 北京: 中国建筑工业出版社,2011.
[21]Rasmussen K J R. Numerical modelling of stainless steel plates in compression [J]. Journal of Constructional Steel Research, 2003, 59(11): 1345-1362.
[22]Lecce M, Rasmussen K J R. Distortional buckling of cold-formed stainless steel sections: Experimental investigation [J]. Journal of Structural Engineering, 2006, 136(4): 497-504.
[23]Silvestre N, Camotim D. Distortional buckling formulae for cold-formed steel C and Z-section members: Part I: Derivation [J]. Thin-Walled Structures, 2004, 42(11): 1567-1597.
[24]陈绍蕃. 钢结构设计原理[M]. 北京: 科学出版社,2005.
[25]Rasmussen K, Hancock G J. Design of cold-formed stainless steel tubular members. I: Columns [J]. Journal of Structural Engineering, 1993, 119: 2349-2367.
[摘要]:“价值无涉”是韦伯社会科学方法论的核心概念,但是对此学术界却存在严重误读。本文从韦伯构建学术公共领域的角度,认为韦伯“价值无涉”的“客观性”原则具有双重含义,既是为了破除普世性的理论神话,也论证了价值判断需要“科学”的论证,而经验事实需要在与文化价值的关联中获得意义,这是学术伦理存在的基础。通过对国民经济学的批判,韦伯阐明了他的“理想类型”是对经验事实的逻辑整理,而不是“客观”反映,这是“价值无涉”的第三个含义。本文还讨论了韦伯的新闻思想及其实践与学术公共领域的关系,并提出今天重读韦伯的意义在于构建中国的学术共同体和学术公共领域。
讨论社会科学研究的方法论问题,韦伯是个绕不过的名字。“价值无涉”已经被我们念得耳熟能详,但是韦伯意义上的“价值无涉”究竟应该如何理解?在学术界却依然晦暗不明。当今中国社会发展与危机并重,思想界因此存在严重分歧,学术与政治的关系也变得云谲波诡,有学者提出应该用“去道德”和价值“无立场”的方法来应对这样的局面[1]。但是,“去道德”与“无立场”究竟在什么意义下才是可能的和有效的?政治与学术在韦伯的语境下究竟意味着什么?今年,正值韦伯逝世九十周年,韦伯的着作再次在汉语世界中被大量出版。重新阅读韦伯,并借此整理中国知识界关于学术与政治、立场与价值等问题的纠葛,已经又一次成为具有重大理论与现实意义的议题。
(一)“价值无涉”的双重含义
《社会科学认识和社会政策认识的“客观性”》是1904年韦伯接手主办《社会科学和社会政策文库》杂志时,阐释其办刊宗旨的纲领性文献。从中我们可以看到韦伯是如何把社会科学方法论与学术伦理以及学术共同体的思考结合在一起的,这也是韦伯集中讨论和总结其社会科学方法论的重要文献。但是,自八十年代中文学术界“发现”韦伯以来,这也是被误读最严重的部分。所以,回到文本自身,应该是重读韦伯最重要的方法。
韦伯开宗明义地指出,《文库》的宗旨一是扩展对社会生活的事实的认识,另一是训练人们对社会生活的实际问题作出判断。那么,判断的有效性是什么?或者,在什么意义上可以说,社会科学研究存在着“客观有效的真理”呢?韦伯整篇文稿正是建立在这个问题意识上的。
韦伯反对两种历史观,一是道德进化论,一是历史相对主义,正是这两者的结合在社会科学领域取得了支配性地位。韦伯以国民经济学为主要批评对象,指出:通过把文化价值总体引入道德领域而在内容上规定道德领域,并由此把国民经济学提高到“伦理”科学的地位,这其实是把所有可能的文化理想在总体上贴了“道德”的标签,既抹杀了道德律令的特有地位,也没有对理想的“客观性”有什么贡献。《文库》需要从根本上予以拒斥的流行观点,正是:国民经济学是从一种特殊的“经济世界观”得出的,并且应当由此得出价值判断。因为经验科学的任务决不是提出约束性的规范和理想,以便从中得出实践的处方。《文库》需要拒斥的另一种观点是:价值判断因为立足于某种理想,从而具有主观起源,就可以摆脱“科学”的讨论。这正是“价值无涉”的两重含义,不可偏废任何一方,而目前国内学界就韦伯观点围绕着经济学是否应该有道德的讨论,其实都没有抓住韦伯的关键。
韦伯说,《文库》关心的问题其实是:对理想和价值判断所作的“科学”批判的意义和目的是什么?科学的“技术性批判”最根本的功能就是使在追求目的过程中的代价,能够被充分评估和权衡,也唯有在这样的时候,最需要贯彻“价值无涉”的逻辑方法。在这之后,权衡上升为决策,就不再是“科学”的任务,决策者根据自己的良知和世界观在各种有关的价值之间进行权衡选择,但正是“科学能够使他意识到,一切行动,当然根据具体情况还有不行动,在其结果中都意味着吸收了某些价值,从而常常意味着——这一点目前特别容易被人忽视——放弃另一些价值。做出选择是他自己的事情。”科学的任务正是揭示并且在逻辑上阐明“目的”建立之上的“观念”基础,“对价值判断的科学探讨如今不仅要使人进一步理解和体验所希求的目的和作为其基础的理想,而且首先还要教人批判地‘判断’它们。”也就是说,作为“科学”本身不担任价值评判的任务,但是它却是价值评判的基础。这是因为,在一个世界观存在严重冲突的时代,“以普遍有效的终极理想的方式创造解决我们的问题的实际公分母,这都毫无疑问既不能是我们这份杂志的任务,也绝不能是任何一门经验科学的任务:这样一种任务不仅在实际上是无法解决的,而且自身也是不合情理的。” 这决定了在方法论上的“价值无涉”作为逻辑意义的地位。
一个饱餐了知识之树的文化时代,其命运是必须知道,无论对世界事件研究的结果多么完善,都不可能从中获知世界事件的意义,而是必须能够自己去创造这种意义本身,世界观决不可能是经验知识进步的产物,因此,最强有力地推动着我们的那些最高的理想,在任何时代都只能是在与其他理想的斗争中实现的,这些其他理想对于其他人来说,正如我们的理想对于我们来说一样,都是神圣的。
因此,可以看出,韦伯所说的“价值无涉”的第一个含义,正是要彻底破除所谓“普世价值”的神话,一个诸神争斗的时代,决定了社会科学领域不可能,也不应当存在普遍有效的终极价值。在这个意义上,廉价的相对主义和乐观的折中主义,要么在理论上无视其严峻,要末是在实践上回避其结果。这些都与科学的“客观性”没有丝毫关系,“中间道路”丝毫不具有
任何文化科学的先验前提都不是我们认为某一种或者任何一种文化有价值,而是我们就是文化人,赋有自觉地对世界表示态度并赋予它一种意义的能力和意志。无论这种意义是什么东西,它都将导致我们在生活中从它出发来判断人类共同存在的某些现象,把它们视为重要的(积极的或者消极的)而表明态度。
对世界表明态度并赋予其意义的能力与意志,这其实正是学术伦理存在的基础。韦伯对以色列先知的描述中,着重的正是他们为文化和宗教共同体建构意义的“天职”。[16]在这里,我们再次看到的是韦伯世界中知识分子的学术伦理与先知的宗教伦理的叠印。正是在这个基础上,韦伯强调学者的“个人”因素对于学术研究的重要性。因为没有什么观点是从材料里自然得出的,所谓让事实自己说话,不是自欺,就是欺人。真正具有意义的是作为“个人”的学者“灵魂之镜”,只有这样的镜子才能折射出现实与文化的价值和涵义
在随时随地自觉或不自觉地对事物的个别特殊方面所做的这种选择中,起支配作用的是科学工作那种作为时有所闻的主张——一项科学工作的“个人因素”才是其真正有价值的因素;此外,任何工作如果存在是有价值的,就必须表现出“个性”——之基础的因素。毋庸置疑,如果没有研究者的价值理念,就不会有选择材料的原则,就不会有对个体性现实的有意义认识,就像如果没有研究者对某些文化内容之意义的信念,认识个体性的现实方面的任何工作都是绝对没有意义的一样,他的个人观念的倾向,他的灵魂之镜中的价值反射,规定着他的工作的方向。而科学的天才把自己研究的对象与之联系起来的那些价值,却能够规定整个时代的“观点”,即是决定性的:不仅对于现象中被视为“有价值”的东西而言,而且对于现象中被视为有意义的或者无意义的、“重要的”或者“不重要的”东西而言都是如此。[17]
韦伯这里清理的正是知识分子在当代确立学术伦理价值的基础,知识分子的内在志向即对学术为世界建构意义的确认和信念,这是推动文明本身和文化本身发展的动力。至此,我们可以明白韦伯的社会科学方法论的核心所在,那就是在一个诸神的时代里,社会科学不是寻求普遍而终极的规律或目的,而是认识、确立和创建文化的价值意义,这才是学术和知识分子确立安身立命的伦理基石。因为对人类文明寻求价值意义的确信,内在于文明自身,也内在于任何时代的知识共同体和民族共同体之中,它们正是知识分子应该予以承接的“天命”。正是在这个意义上,知识分子的“天命”是一种伦理的诫命,是外在使命和内在志向的结合。
(三)“理想类型”与社会科学的“客观性”
——对“国民经济学”的批判
这里,韦伯是以对“国民经济学”的“自然主义一元论”为批评对象,展开其对社会科学方法论的具体讨论。
国民经济学开始的时候是一种讨论国民“财富”增长的“技术”性现象,但是它从一开始就不仅仅是技术的,因为它被纳入到18世纪自然法的、理性主义的世界观的巨大统一体中。自然科学的方法:用根据规律性联系对经验事实做出一般的抽象和分析,以一种形而上学的有效性和具有数学形式的概念体系,达到对现实的一种纯“客观”的,摆脱一切价值的,同时也是绝对理性的,也就是摆脱一切个体性的“偶然性”的一元论认识。在这样的科学思维的模式中,除了发现事物的“规律”外,科学工作的其他意义都是不可想象的。只有“合规律”性才是科学本质性的东西,“个体性”的事件只有作为“典型”,即作为规律的解说才有意义,而这些事件本身则并不是“科学的”兴趣。因此,在历史领域,抽象的理论方法和经验的历史方法处于对立之中。抽象的经济理论为我们提供了一幅关于经济组织、自由竞争和严格的理性行为在商品市场上发生的各种事件的理想画卷。“这一理想画卷把历史生活的某些联系和事件统一成为设想出来的联系得天衣无缝的体系。在内容上,构思具有一个通过思想上提高现实的某些要素而获得自在乌托邦的性质。它与生活的经验给定事实的关系仅仅在于,在那种构思中被抽象地描述的那类联系,从而也就依赖于‘市场’的事件,在现实中被发现或者被猜测为在某种程度上起作用的地方,我们都能够利用一个理想典型(Idealtypus)实际地说明和解释这种联系的特性。”[18]
转贴于
但是“理想典型”(国内更多翻译为“理想类型”,下文采用这种译法)的概念是为了归属判断,它不是假设,也不是对现实的描述,它是历史给定的现代交换经济社会组织的“理念”。韦伯指出西方经济学中的“市场”与作为发生学概念上西方中世纪的“城市经济”理念,这两者是根据“完全相同的逻辑原则展开的”。而“城市经济”概念也并不是所有被考察的城市中实际存在的经济原则的“平均值”,而是单方面提高一个或者一些观点,把散乱的个别的现象综合成一个自身统一的理想画卷而获得的。就此而言,即“理想类型”是从经验事实中选取不同的元素加以逻辑整理而言,它的确具有“客观性”,这正是“价值无涉”的第三个含义,即“理想类型”作为一种逻辑的分析工具本身是“价值无涉”的。但另一方面,“就其概念上的纯粹性而言,这一理想画卷不能经验地在现实中的任何地方发现,它是一个乌托邦。而对于历史工作来说就产生了一个任务,即在任何具体场合都要确认现实离那个理想画卷有多近或者多远,某个城市的关系的经济特性在多大程度上可以在概念的意义是哪个被说成是‘城市经济的’”。[19]因此,理想类型并不是对“客观”现实的无条件的“反映”,而是“整理”。因此,韦伯强烈地反对把理想类型的概念图像当成是历史现实的“真正”内容,当成“本质”。理想类型绝不是古希腊神话中的强盗普罗克拉斯特之床,历史不应该在此被削足适履,也不应该被当成是历史中起作用的“实在”力量,——韦伯强调特别需要警惕后一种危险。对于中国的经济学来说,西方的以中世纪“城市经济”为模式发展出来的经济学“原理”,究竟能够在多大程度上解释中国和解决中国的城乡问题呢?这值得今天更深刻地追问和反思。
韦伯告诉我们的恰恰是:没有建立概念与具体的历史语境的联系,就简单套用西方的诸如“市场”这样的经济学概念来横扫一切是极其危险的,因为正是这样的做法违背了“价值无涉”的社会科学方法,违背了现实的“客观性”原则。这对于我们今天形形的市场原教旨主义来说,应该是当头棒喝。韦伯明确地指出,经济学理论是一种“教理学”,它特别假定纯粹经济利益的支配作用,而排除行为的政治取向和其他非经济取向的影响,因此它只能是一种“理想类型”,而绝不是历史的“自然”发展,更不能成为“应当”如此的普世道路
那种在此意义上“无国家”、“无道德”、“个人主义的”纯粹理论,作为方法上的辅助手段是并且总是必不可少的,而极端的自由贸易学派则把它理解为“自然的”,即未被人愚蠢的歪曲的现实的一种详尽无遗的写照,并进一步据此把它理解为一种“应当”,理解为一个在价值领域有效的理想,而不是理解为一个可以用来经验地研究存在的理想典型。[20]
所以,“理想类型”的功能,不是作为目的,而是作为社会科学的“手段”来发挥作用的,因为社会科学必须借助通常只有在“理想类型”中才能清楚明白的规定概念来工作。其工作原理在于归纳、衡量与对比,是以确立概念的“界限”为前提的,这正是一种专业主义的训练
它是一种理想画卷,但并不是历史现实,也根本不是“真正的”现实,它也根本不适宜于把现实作为样本归入其中的图式,而是指具有纯理想的界限概念的意义。为了廓清现实的经验内容的某些重要的成分,人们借助这一概念对现实作出衡量。把它与现实作出对比。这样的概念是思想的产物,我们借助它们,通过运用客观可能性的范畴,来构思各种联系,我们依据现实定向的、受过训练的想象力对它们作出判断,认为它们是适合的。[21]
但是混淆总是很容易产生,历史相对主义者总是让理想类型意义上的“理念”生成为理想意义上的“理念”需求,让其变成价值判断。因此,科学自我监控的基本义务和避免受骗的唯一手段,就是严格区分这两种方式。以比较的方式把现实与逻辑意义上的理想类型联系起来,与从理想出发对现实做出评价性判断,这是两种完全不同的方法。这正是韦伯强调作为方法论的理想类型是“价值无涉”的,即不能用它作为价值判断的标准。因为理想类型“是某种对评价性的判断完全不感兴趣的东西,除了纯逻辑的完善之外,它与其他任何一种完善都毫不相干。”[22]也就是说,在韦伯的理论中,理想类型其实是一种逻辑工具,并不具有价值判断的意义,这才是“价值无涉”最核心的意义,否则,就会有沦为自然主义或道德主义“目的论”的极大危险。
韦伯更进一步指出:虽然“理想类型”在形成过程中要排除“偶然性”的东西,但是其本身仍然是“个体性”的,不是平均值的典型。因为理想类型的概念形成的目的,“就是在任何地方都使人清晰地意识到的,它不是合乎类的东西,而恰恰相反,是文化现象的特性”[23],是文化个体性的表达,因此“理想类型”绝不是普遍“规律”的体现,而是有着明确的使用界限的。至此,我们已经可以理解,韦伯对“价值无涉”的强调,其批判的对象正是用“理想类型”来代替价值评判,这样一种会在现实中带来极大危险的思想混乱,其主要代表正是西方经济学。
针对自然主义的历史观,即社会科学的目的必须是将现实还原为“规律”,韦伯的批评正是针对其把“理想类型”与现实相互混淆的危险。韦伯告诫道,必须清醒地意识到“理想类型的发展状况和历史是两件必须有效区分开来的事情,构思在这里仅仅是有计划地将一个历史事件有效地归属于根据我们认识的现状而可能的原因范围中的现实原因的手段。”[24]正是在这里,韦伯对马克思,——这位他所尊敬的也是最主要的理论对手作了这样的评价:所有的“规律”和历史发展的构思,在理论上都具有“理想类型”的特征,“凡是使用过的概念的人都知道,如果把现实与这些理想典型进行比较,它们就具有巨大的,甚至是独一无二的启迪意义;同样,一旦把它们设想为经验有效的,或者甚至设想为实在的(事实上也就是形而上学的)的‘作用力’、‘趋势’等等,它们就具有危险性。”[25]这一评价值得重视,也值得今天作为一个重要视角来重新理解在中国的命运。
韦伯充分肯定“理想类型”的逻辑作用,但是他强调所有“理想类型”的构思都具有暂时性,“文化科学工作的结果就是不断改造我们力图把握现实所用的那些概念的过程。因此,关于社会生活的各门科学的历史就是并且依然是借助概念的过程。因此,关于社会生活的各门科学的历史就是并且依然是借助概念的形成而尝试在思想上整理现实,由于科学视野的扩展和更移而废除已经获得的思想图像,以及在如此改变了的基础上形成新概念之间的不断变换。”[26]这是因为,概念的形成取决于问题的提出,而问题的提出是随着文化自身的内容发生变化的,概念与被概念化的东西之间包含着一种综合的暂时性。因此,概念的价值正在于它们揭示了作为其基础的观念意义的有效性界限,而不是目标。“理想类型”之意义正在于它的暂时性,和无可避免的被超越性,是手段和工具,服务于建立价值联系的目的,因此决不能混同于具体的实在,后者才是第一性的目的。概念的目的被假定为对“客观”现实的观念的“反映”,这可以追溯到康德的现代认识论,这里的概念与历史工作之间的关系被头足倒置了。而社会科学的伟大进步正是与实际的文化问题的变更密切相关的,并采取了对概念的形成进行批判的反思形式。韦伯宣布,《文库》最重要的任务就是为这种批判与进一步的综合服务
转贴于
一切经验知识的客观有效性,都是并且仅仅是按照范畴整理给定的现实,而这些范畴在特殊的意义上是主观的,即表现我们认识的先决条件的,受到唯有经验知识才能给予我们的那些真理的价值的前提条件的制约。[27]
社会科学的“客观性”正在于此,即它来自于对经验现实的逻辑综合和整理,也因此具有明确的使用边界,因此不能据此作为“本质”或者“规律”证明特定的经验事实,也不能因此取得判断现实的价值特权,因为价值尺度只能来自于特定的文化自身。社会科学的任务并不是不断去追逐新的观点和概念,而是相反,对于具体历史联系的文化意义的认识,才是所有的概念和概念批判为之服务的终极目的。“材料专业户”和“意义专业户”都不能把已知的事实与已知的观点结合起来,从而创造出新的东西。
在韦伯看来,价值意义是“理想类型”获得逻辑意义的前提,否认作为特定的文化产物的价值真理性,就没有社会科学,就只剩下用普遍的概念与判断去取代科学。一旦社会科学把它的方法论原则建立在把加工材料看成目的本身,而不是自觉地根据最终的价值观念来检查和反思个别材料的认识价值,不能意识到认识价值是植根于具体的实际的文化作为最终价值,道路就会迷失,这时,就需要从文化的价值意义上进行范式突破。这时,
未加反思地使用的观点的意义变得不可靠,道路迷失在黄昏中。重大的文化问题的光芒依然存在。于是,科学就武装起来,改变自己的立足点和概念体系,从思想的高度俯视事情之流。[28]
推动社会科学发展的动力,不是科学的内在逻辑,而是一个特定社会的文化价值的重大问题。我们需要在这个意义上理解韦伯这句似乎骇世惊俗的话:政治经济学是政治的仆人!因为,作为现实的、具体的德国的文化价值才是真正的政治性问题,学术的目的正在于是否能够落实于具体的文化语境中,——它既是社会科学问题意识的来源,也是作为学术研究的社会科学最后的旨归。只有在这里,在责任伦理高于信念伦理的情况下,两种伦理才可以寻求互相支持的契合点,我们也需要从今天中国的历史语境中重新确立和理解韦伯的意义。
最后,让我们再来读一点读韦伯自己的论述
我们最终必须竭尽全力反对的是一种并不少见的观念,它认为通过权衡各种彼此对立的价值判断和他们之间的“政治家式的”折衷,就可以踏上通往科学“客观性”的大道。“中间路线”不仅恰好与“最极端”的价值判断一样,不能以经验学科的方法得到科学的证明,而且,在价值判断的范围内,它正是在“规范的”意义上最晦暧不清。它不属于讲坛,——而是属于政治纲领,官僚机构和议会。科学,无论是规范的还是经验的,都能为政治活动家和对立的党派提供无可估量的帮助。它告诉他们,(1),对于这个世纪问题,某些不同的“最终”立场是可以考虑的;——(2)在你就这些立场作出抉择时,存在着这样那样你必须考虑的事实。[29]
韦伯指明的是,真正的有责任的“政治”行为应该建立在学术的“科学性”的基础上,即有价值的政治行为必然充分估计三个方面:1,不可避免的手段;2,不可避免的附带后果;3,由此制约的在其实践结果中众多可能的评价相互之间的竞争,这正是经验科学以自己的手段能够揭示的东西。[30]只有在此基础之上的“政治”行为才可以与现实中党派利益纷争的政治活动划清界限。社会科学的“客观性”绝非折中的中间路线,因为妥协和折中并不是以价值的澄明为前提的,因此需要反对各种“伪”客观性(以及在此基础上的各种伪“政治”性,即建立在党派利益纷争基础上的“政治”)
认为从要求经验地讨论“价值无涉”的立场出发,价值判断的讨论就是无结果和毫无意义的观点,是与我们完全不相干的,因为关于价值判断意义的认识恰是所有这类讨论的前提。这种讨论的先决条件是理解各种原则上不可逾越的和大相径庭的最终价值判断的可能性。然而,“理解一切”并不意味着“原谅一切”,单是对他人观点本身的理解也不导致同意它们。另一方面,这至少可以使人同样容易并且通常极其可能认识到妨碍人们达成一致的原因和问题。但是,这种认识恰恰是真理性的认识,而“价值判断讨论”正好有助于这中认识。[31]
至此,韦伯对于社会科学的“客观性”和“价值无涉”的思想已经清楚了。这里试从以上三个互相关联的层面上做一个分梳和归纳
首先,韦伯所说的“价值无涉”是社会科学的历史观,它反对把历史纳入任何道德主义或自然主义的目的论体系中,因此,它本身不属于也反对任何“宏大叙事”。其方法论上的体现是划清“理想类型”的有效性边界,不能把“理想类型”或者任何概念性的逻辑思维的产物上升为价值判断。任何意义上的“理想类型”作为对经验事实的逻辑整理,都不是对现实的“反映”,而是归纳和总结,归根结底是“个体性”的,因此不能把“个别”上升为“普遍”的规律,并成为“应当”如此的历史力量。因此,韦伯反对从历史的“发展趋势”中引申出对实践的评价,因为这意味着把“变迁”视为目的论的,并成为对现实政策毫无反思的美化
无论如何,我们都无法看出,为什么经验科学的代言人应当感到有必要支持这种做法,使自己成为某个时候的“发展趋势”的喝彩者,使对这些“发展趋势”的“适应”从一个终极的、只能由具体的人在具体场合解决的、因而也只能取决于具体的人的良知的评价问题变成一个据说由一门“科学”的权威庇护的原则。[32]
第二,韦伯所说的“价值无涉”指的是建构学术公共领域的原则,即不同的立场和观点都具有平等准入的地位与权利,而且在这个意义上接受最严格的反思与批判。知识共同体不能以某种预设的绝对价值作为规范,或者以“普世价值”来压抑和取消歧见,这是作为经验科学的社会科学能够生产“有效”知识的前提。但是,作为个体的学者,却正是以自己的立场,以及以此立场出发的知识建构进入学术公共领域,“正是‘个人’的最内在的因素,规定我们的行动、赋予我们的生活以意义的最高的和最终的价值判断,才是某种我们感到有‘客观’价值的东西。”[33]这个意义上,韦伯的“价值无涉”决不是取消价值立场,而是相反,不同的价值判断必须接受自己以及对手的反思和挑战,方有可能有真正意义上的社会科学的发展。
第三,韦伯所说的“价值无涉”指的是在学术共同体内部建立理解的方法。在各种不同的、甚至歧见严重的观点之间,“价值无涉”要求的是对他者观点的理解,它建立在以经验的方式,从概念的逻辑意义上,去考察他人的行为和动机,以发现真正的不同的立场,这是一切有意义的学术辩论的前提。这样的以建立理解为前提的“价值无涉”的工具性,是学术对话和论辩的基础。它可以使人从逻辑和事实的角度认识到妨碍达成一致的原因和问题
人们可以是不一致的,以及为什么不一致,在什么地方不一致。恰恰这种认识是一种真理认识,而且“价值讨论”也就是为它服务的。与此相反,人们以这种方法肯定不能获得——因为它在一个截然相反的方向上——的东西,是某种规范的伦理学,或者就是某种“律令”的约束力。[34]
这才是为什么“价值无涉”需要发挥作用的地方,也正是社会科学“客观性”的体现。
但是,遗憾的是,在过去的韦伯研究中,我们恰恰是在很大程度上是把韦伯极力批评和反对的方法强加给韦伯自己了,对“理想类型”盲目而混乱的运用就是最鲜明的例证。
转贴于 [注释]
[1]关于此一问题的争论,可参见罗卫东:《社会科学从业人员的理性回归:重返韦伯》,载《浙江社会科学》2006年第5期;冯钢:《“客观性”、“理想类型”与“伪道德中立”——评罗卫东的“重返韦伯”》,载《浙江社会科学》2006年第6期,其讨论的核心问题是如何看待经济学与道德的关系。本文在此的讨论,与上述两位作者的观点都有重大不同。另,赵汀阳提出的“无立场”分析方法以及相关讨论也包含了这样的意愿。
限于篇幅,此处发表的文稿属于笔者《学术与政治:重读韦伯》长文的第三部分,前两部分是: 一 ,“先知”与知识分子——学术的伦理与天职;二,何为政治?——政治的伦理及其悖论;待发。
韦伯:《社会科学认识和社会政策认识的“客观性”》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第3-4页。韦伯的《社会科学方法论》的另一中译本是中央编译出版社2002年出版,译者韩水法、莫茜。本文中的引用参照这两个译本,具体见注释。
同上。
同上,第6页。
同上,第6页。
韦伯:《社会科学认识和社会政策认识中的“客观性”》,见韦伯:《社会科学方法论》,韩水法、莫茜译,北京:中央编译出版社,2002年,第10-11页。
韦伯:《社会科学认识和社会政策认识的“客观性”》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第9页。
同上,第10页。
[10]同上,第14-15页。
[11]同上,第16页。
[12]同上,第18页。
[13]同上,第21-22页。
[14]同上,第22页。
[15]同上,第24页。
[16]此部分的详述见本人《学术与政治:重读韦伯》长文的第一部分,即 一 ,“先知”与知识分子——学术的伦理与天职,待发表。
[17]韦伯:《社会科学认识和社会政策认识的“客观性”》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第25-26页。
[18]同上,第31-32页。
[19]同上,第32页。
[20]韦伯:《社会学与经济学的“价值阙如”的意义》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第146页。
[21]同上,第34页。
[22]同上,第28-29页。
[23]同上,第40页。
[24]同上,第41页。
[25]同上,第42页。
[26]同上,第43页。
[27]同上,第47页。
[28]同上,第49页。
[29]韦伯:《社会科学和经济科学“价值无涉”的意义》,见韦伯:《社会科学方法论》,韩水法、莫茜译,北京:中央编译出版社,2002年,第145页。
[30]韦伯:《社会学与经济学的“价值阙如”的意义》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第124页。
[31]韦伯:《社会科学和经济科学“价值无涉”的意义》,见韦伯:《社会科学方法论》,韩水法、莫茜译,北京:中央编译出版社,2002年,第149页。
[32]韦伯:《社会学与经济学的“价值阙如”的意义》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第129页。
[33]韦伯:《社会科学认识和社会政策认识中的“客观性”》,见韦伯:《社会科学方法论》,韩水法、莫茜译,北京:中央编译出版社,2002年,第6页。
[34]韦伯:《社会学与经济学的“价值阙如”的意义》,见韦伯:《社会科学方法论》,李秋零、田薇译,北京:中国人民大学出版社,2009年,第120页。
[35]见Hanno Hardt:Social Theories of the Press: Early German & American Perspectives,pp174-182, London:SAGE Publications, 1979. 感谢南洋理工大学郭振羽教授和耶鲁大学博士生王颖曜同学提供线索和材料。该书在2002年再版,补充了卡尔马克思论新闻自由的章节。
[36]玛丽安妮韦伯:《马克斯韦伯传》,阎克文、王利平、姚中秋译,江苏人民出版社,2002年,第481页。
[37]同上,第182页。但是在玛丽安妮的《马克思韦伯传》中,并没有直接提到这个原因,而是更多地提及同行和董事会对该项目和社会学学会的影响和干扰。见玛丽安妮韦伯:《马克斯韦伯传》,阎克文、王利平、姚中秋译,江苏人民出版社,2002年,第478-481页。
[38]同上,第488页。
[39]同上,第494页。
[40]同上,第496页。
[41]同上,第507-508页。
[42]玛丽安妮韦伯:《马克斯韦伯传》,阎克文、王利平、姚中秋译,江苏人民出版社,2002年,第486页。
[43]马克斯韦伯:《以政治为业》,见《学术与政治》,冯克利译,北京:三联书店,1998年,第77-81页。
【关键词】博弈论;发展脉络;理论体系
博弈论是研究在利益相互影响的局势中,参与人如何选择自己的策略才能使自身的收益最大化的均衡问题,是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。无论是人类社会的发展变化、社会经济制度的变革,还是人们的日常生活,我们都会经常碰到利益相互影响的博弈问题,也会经常使用博弈去选择策略,不管是自觉的还是无意识的。博弈论的思想极为深刻,内容十分丰富,引起了众多经济学家的极大兴趣,赢得了经济理论界的广泛关注。
一、博弈论发展脉络
博弈思想在人们日常生活中早就存在,但这只是停留在经验上,没有形成理论。在我国,有文献记载的最早博弈思想,可以追溯到2000多年前著名的田忌赛马的事例。在国外,1500年前巴比伦犹太教法典中的婚姻合同问题,也包含着明显的博弈思想。博弈论应用到经济分析中,是在19世纪中期,博弈论体系的产生、发展、繁荣,则是近几十年的事。
现代博弈论思想在经济上的应用可以分为以下几个阶段:
1、萌芽阶段
最早的包含博弈思想的经济学文献,是1838年法国经济学家古诺(Cournot)提出的寡头市场产量竞争模型。而1883年法国经济学家伯特兰德(Bertrand)提出的寡头市场价格竞争模型,把古诺模型里寡头厂商的产量竞争变成了价格竞争。1913年策梅罗(Zermelo)提出的关于象棋博弈的定理是博弈论的第一个定理,提出的逆向归纳法是博弈论的第一种有一般意义的分析方法。这一阶段,还有很多学者涉及了博弈论的研究,但都是零散的研究,没有形成体系。
2、产生阶段
一般认为,博弈论作为一种系统的理论产生的标志,是1944年冯・诺伊曼(von Neumann)和摩根斯坦(Morgenstern)合著的《博弈论和经济行为》一书的出版。该书在总结以往博弈研究成果的基础上,给出了博弈论研究的一般框架、概念术语和表述方法,提出了较系统的博弈理论。在此阶段,还涌现出许多著名的博弈理论家,提出了一系列重要概念和理论。例如,1950年纳什(Nash)提出了均衡点的概念,1950年塔克(Tucker)介绍了“囚徒困境”博弈,1953年夏普里(Shapley)提出了合作博弈里著名的“夏普里值”,这些概念和理论共同构成了现代博弈论体系的核心。
3、发展阶段
从20世纪60年代开始,博弈论进入一个发展和完善的阶段。1965年泽尔腾(Selten)提出了子博弈完美纳什均衡的概念,1967-1968年海萨尼(Harsanyi)建立了不完全信息博弈理论,1974年奥曼(Aumann)提出了相关均衡的概念,1975年泽尔腾又提出了颤抖的手均衡的概念,1982年克里普斯(Kreps)和威尔逊(Wilson)提出了序贯均衡的概念,1991年弗登博格(Fudenberg)和梯若尔(Tirole)提出了完美贝叶斯均衡的概念,这些都进一步发展和完善了博弈的理论。
4、繁荣阶段
20世纪90年代以来,博弈论开始受到经济学家真正广泛的重视,并被看作重要的经济理论和经济学的核心分析方法,开始贯穿几乎整个微观经济学、产业组织理论,在宏观、金融、环境、劳动、福利、国际经济学等学科中也开始占有越来越重要的地位,大有以博弈论为基础重构经济学大厦的趋势。尤其是1994年纳什、海萨尼、泽尔腾这三位博弈论学者共同获得诺贝尔经济学奖,使博弈论作为重要经济学分支学科的地位和作用得到了权威性的肯定,也表明了博弈论已在主流经济学中占据重要地位。
二、博弈论理论体系
博弈论涵盖的内容很多,从总体上可以分为合作博弈和非合作博弈两大类。如果博弈中存在有约束力的协议,就是合作博弈;相反,如果博弈中不存在有约束力的协议,就是非合作博弈。合作博弈主要研究的是在有约束力的协议作用下,参与人采取符合集体理性的行动达到博弈均衡后,各参与人的收益分配问题。而经济问题中遇到的多是在个体理性基础上的决策,这使得基于个体理性的非合作博弈在经济研究中广泛应用。对非合作博弈的分类,主要涉及博弈的过程和博弈的信息结构两个方面:
1、博弈的过程
从博弈的过程来分,博弈论可以分为静态博弈和动态博弈两类。如果所有参与人同时选择策略,或者决策虽有先有后,但后行动者并不知道先行动者的选择,这样的博弈称为静态博弈;如果参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此做出相应的选择,这样的博弈称为动态博弈。
2、博弈的信息结构
博弈的信息结构又分为关于收益的信息和关于博弈过程的信息两方面。在关于收益的信息方面,如果各参与人完全了解所有参与人各种情况下的收益,称为完全信息;而至少部分参与人不完全了解其他参与人的收益,称为不完全信息。在关于博弈过程的信息方面,如果轮到行动的参与人全部能够看到在他行动之前行动的所有参与人的行动,就是完美信息;而至少部分轮到行动的参与人不能全部看到在他行动之前行动的某些参与人的行动,就是不完美信息。这里,我们可以看到,完美信息和不完美信息实际上是只针对动态博弈的,而静态博弈中所有参与人可看作同时选择策略,所以不存在完美信息和不完美信息的问题。
这样,根据上述博弈的过程和博弈的信息结构两个方面,我们可以将非合作博弈分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全不完美信息动态博弈、不完全信息动态博弈等类型。掌握了博弈的分类情况,针对每一个具体的博弈问题,我们就可以将其归于某一特定类型,根据这一类型的分析思路来解决这个博弈问题。
参考文献:
[1]奥斯本,鲁宾斯坦.博弈论教程[M].北京:中国社会科学出版社,2000
[2]弗登博格,梯若尔.博弈论[M].北京:中国人民大学出版社,2010
[3]王文举.经济博弈论基础[M].北京:高等教育出版社,2010
[4]谢识予.经济博弈论[M].上海:复旦大学出版社,2012
[5]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,2004
关键词 博弈论 体育领域 应用
一、博弈论概述
(一)博弈论的发展
博弈思想源远流长,虽然起始人们没有博弈的相关知识,但是博弈意识时刻伴随着人们的生活,因为根据现在博弈理论,我们就可以知道只要有选择,只要有竞争,就有博弈的存在。就有关文献记载的最早博弈思想的规范理论,可追溯2000多年前我国古代的“齐威王田忌赛马”等。
博弈理论的形成不是一蹴而就的,他有自己的发展历程,就目前而至已经自成体系,博弈论的理论体系大体上可以分为自然发展、专门研究、运用、4个阶段,其特征、代表作和人物见表1 。
表1博弈理论历程
阶段 时间 特征 代表人物
自然发展 二十世纪20-40年代 数学家―最佳策略―具体决策问题―研究方法用于军事领域 1944年诺依曼《博弈论与经济行为》
专门研究 二十世纪中期 经典理论被验证:囚徒困境和纳什均衡等 纳什均衡、塔克 囚徒困境
运用 二十世纪80年代 引起了经济学结的革命 威尔逊等
二十世纪90年代 在经济、政治、军事、外交、公共选择、犯罪学等领域应用广泛 1994年Nash、Selten、Harsanyi
(二)博弈论要素
要想构成一个博弈,一般情况下需要存在五个要素,并且其中前三个是必须具备的:博弈主体(又称博弈方,指博弈中的决策者)、博弈策略集合、博弈者的收益(博弈的结果,这是博弈的焦点,一切就围绕着这个努力)、博弈的过程(也就是博弈方选择的时间先后,同时进行抉择,或者抉择有先后或者重复等)、博弈的信息(对自己和对方的处境、条件的掌握情况),其中前三个是基本要素。
(三)博弈论分类
由于博弈分类的要依据不同,可以有多种分类方法,本文主要从以下三个角度进行博弈的分类。
1.按照参与人行动的先后顺序
当这个作为依据时,博弈有静态博弈、动态博弈之分。静态的博弈是指博弈参与者在同一个时间做出策略选择,不能知道对方的选择结果,或者即便时间不是同时但不知道对方的选择是什么,对自己的没有参考,也叫做静态博弈;动态博弈指参与人不是在同时做出选择,后者能知道前者的选择信息,并对自己的选择有很关键的影响,这样对自己有参考价值。
2.依据博弈主体之间掌握的对方的相关信息如何
此时的博弈种类就存在有完全信息博弈、不完全信息博弈两种情况。完全信息指的是对对方的和博弈相关的信息有了完全掌握,同时呢,对方对自己的信息也是了如指掌,否则,就是不完全信息。
3.按照根据博弈结果的支付水平以此为切入点的话,博弈的种类就存在三种:零和博弈、常和博弈、变和博弈。零和博弈也就是两方的得益之和为零,一方赢的等于一方输的值,两者所得的和总为零;常和博弈指博弈方共分一块蛋糕,你多我就少,你少我就多,总和是一定的;变和博弈则是除上述外的所有博弈。
二、博弈论理论贡献与现实意义
博弈论理论从形成至今,已经获得了很多领域的成功,但最主要的成果集中于经济学领域,至2005年诺贝尔经济学奖已经5次授予博弈论领域的经济学家,特别是在全球经济快速发展的进30年来共4次授予博弈论领域的经济学家。诺贝尔经济学奖在这么短的时间内多次频繁光顾博弈论领域,彰显博弈论在经济学中的重要地位。同时也说明博弈论具有一定的实用价值。
(一)国外博弈论在体育领域中的应用
通过文献资料的调查与整理分析发现,国外已经有博弈论在竞技体育领域中应用的具体实例,在网球领域有人对1983年美国网球公开赛中克丽丝•艾弗特和马丁娜•纳芙拉蒂洛娃的比赛进行了博弈分析研究,用两位选手的底线击球线路和防守策略构建了博弈矩阵,演示了“零和博弈”中的纳什均衡的求解方法,提出了“混合出招”的概念。并进一步构建了网球博弈的序贯行动模型,分析了“后动优势”的形成过程。
在博弈类型分类演示中,阿维纳什•迪克西特与苏珊•斯克丝用(美式)橄榄球总的单次对局构建了进攻与防守的博弈模型,系统的描述了离散型策略同时行动博弈的“博弈矩阵表(game table)”、“支付表(payoff table)”及“策略式(strategic form)”的相关概念。
但是博弈理论在国外运用最成功的体育项目是在足球的点球射门的博弈中,构建了射手与守门员的博弈模型和网球发球与接发球的博弈模型,并在此基础上进行了多次的博弈行为实验,实验的结果表明足球点球博弈模型与具体实践较为一致。
(二)国内博弈论在体育领域中的应用
以博弈论为检索关键词进行检索,得出仅人民大学图书馆共有博弈论著作354条记录,其中有关体育领域的著作一部,名为《体育博弈论》作者是李益群和谢亚龙二人,奠定了博弈论在体育科学领域研究的基石。系统的阐述了一般博弈论和体育博弈论现象的情况,提出了竞技体育博弈论是研究现代竞技体育竞争中如何去战胜对手、提高胜算、获取优胜的科学理论,并对体育博弈论的产生背景和科学基础进行了论证。提出体育博弈论现象、博弈系统、博弈制胜规律、博弈决策、博弈战略、博弈策略、博弈创新、博弈方法、博弈实践、博弈实战等等构成基本概念体系。并且进一步分析了竞技体育博弈系统的构成、特点和层次,规划了竞技体育博弈论研究的具体内容,为展开这项理论在体育领域的进一步研究奠定了必要的理论基础。
体育领域的题名为博弈研究文献总数为213篇,集中在宏观领域内的研究有李益群与谢亚龙的《竞技体育博弈论初探》是博弈论在体育领域的应用开始的标志,其后的王成夫的《试论体育博弈论的理论基础》与罗智波等人的《论博弈论在体育比赛中的运用》两篇,前者主要从体育博弈论的基础入手,分别就博弈论,体育博弈研究主体、对象与内容及竞争的特征等方面进行了阐述和研究,文章的主要意图还是试图逐步构架和完善体育博弈理论体系。后者主要阐述博弈论在体育比赛中的重要意义以及博弈论对体育研究的作用。文章指出:体育博弈,是人类最具理想意义的竞争,是在一定规则的限定下进行的,它贯穿于体育运动的始终。体育发展与进步的历史进程,与社会、政治、经济文化更紧密的结合,促进了体育理论的产生与发展。根据现代体育的发展, 体育博弈论的发展历程从时间和特征上进行了划分,大致经历了5个发展阶段。就为微观领域的体育博弈研究有:棋类博弈研究、竞赛表演、竞技体育人才培养、兴奋剂监管、大型体育活动内部知识共享行为、篮球运动、象棋竞技与改革、高校运动队训练与管理、体育教学、足球运动、网球运动等领域。
三、结论
总结研究得出,通过把博弈论与体育博弈论的哲学思维模式应用在现代体育运动运动中,借助于体育运动运动实践中的真实、具体的博弈现象进行博弈分析,能够找出博弈的关键因素,根据现实需要制定相应的措施,以期达到用博弈的理论和方法指导现代体育运动向着良性方向的发展。博弈论虽然可以作为体育运动的有力补充,也有相应成果,但还需要进一步深化,以期待理论与实践的高度结合。
注释:
李益群,谢亚龙.体育博弈论[M].北京:北京体育大学出版社.2002.60.
参考文献:
[1]姚国庆.博弈论[M].天津:南开大学出版社.2003:5-7.
[2]李益群,谢亚龙.体育博弈论[M].北京:北京体育大学出版社.2002.51.
[3]李益群,谢亚龙.竞技体育博弈论初探[J].体育科学.1999.19(5):9-13.
【关键词】博弈论;经济学;信息经济学
自80年代中期开始,博弈论的广泛应用促使经济学经历了一次巨大变革,而且,目前这场变革还在加速进行。博弈论是数学的一个分支,1951年纳什的文章和1953年夏普里的文章都是发表在数学杂志上。但博弈论作为一种研究方法,在经济学上的应用却最为广泛成功。经济学是研究资源如何有效配置以达到或实现既定目标的一门学科。但从现代经济学的发展来看,这种观点将被另一观点所取代:经济学是研究人的行为,即研究理性人的行为。博弈论在短短10余年对经济学产生的如此深刻的影响是史无前例的。近年来,博弈论的思想和建模方法已渗透到了几乎所有的经济分析领域。而影响最大的便是微观经济学,甚至可以说成为微观经济学的基础
80年代以后博弈论迅速地成为微观经济学的基础。其原因在于它建立起了一个内容丰富、体系健全、逻辑合理和更加贴近现实的经济学分析体系。博弈论不但强化了经济分析的深度,而且拓宽了经济分析的广度,从而不但使经济分析以更加符合现实的方式揭示经济活动的内在规律,而且也使信息经济学得以迅速发展。
博弈论在经济学中的应用深深地影响了经济学家的思维方式,成为经济学家的必备分析工具之一,多位博弈论专家也因对博弈论的贡献获得了诺贝尔经济学奖,博弈论获得了经济学的中心地位,成为微观经济学的基础。博弈论在经济学中熠熠生辉,引人注目。
博弈论在经济学中的应用十分广泛,如寡占理论、产业组织理论,并形成了经济学新的分支――信息经济学。1994年诺贝尔经济学奖授予了对博弈论做出开拓性的三位博弈论专家纳什、泽尔腾和海萨尼。相隔十年,2005年诺贝尔经济学奖再度授予在博弈论领域做出杰出贡献的两位专家――托马斯・谢林(Thomas C.Schelling)和罗伯特・奥曼(Robert J.Aumann)。博弈论广泛而深刻地改变了经济学家的思维方式,为研究各种经济现象开拓了新视野,博弈论成为微观经济学的基础,取得了主流经济学的中心地位。
博弈论之所以被经济学家普遍使用,是与传统经济学的缺陷和经济学自身发展的要求分不开的。传统经济学在谈到人(或其他经济主体)的决策时,往往是假定在其它条件不变的条件下最大化自己的效用,个人的效用也只决定于自己的选择,其他所有人的行为都归结在价格这个参数中;市场是充分竞争的,垄断和寡头是特殊情况;信息是充分和对称的。然而现实中这些条件都是很难成立的。第一,充分竞争的市场是很少有的(例如,国内具有一定规模的钢铁生产厂家屈指可数,占据一定市场份额的彩电生产厂家也为数不多),由于存在产品差异、地域差异和信息差异,任何一个厂商总是处于某种垄断地位(正是这样他们才有利可图),所以与充分竞争相比,垄断和寡头倒很常见;第二,每一主体在做出自己的选择时不仅要受到其他主体的影响,而且自己的选择也往往影响到其他主体的选择(考虑一下1998年长虹大规模吸纳彩管的情形);第三,在市场竞争中信息几乎总是不充分、非对称的,获取信息经常是有成本的,有时成本还是相当大的。如果不考虑以上这几方面因素,经济学所讨论的决策其实仅仅是规划问题,是在没有竞争对手时的决策,所解决的也只是资源分配问题。现实世界中决策者要在面对有智能和充分理性的对手与之激烈竞争时做出选择。在竞争对手日益明显、竞争越来越直接的情况下,博弈论为经济学研究提供了一种不可替代的工具。另外,经济学现在已经越来越重视对经济个体的研究,而在各个经济个体之间,博弈是无时无处不在的。
博弈能够融入主流经济学,为主流经济学家所接受,主要有两方面原因:一是博弈论分析范式与新古典经济学不谋而合;二是博弈论符合了新古典经济学的科学化趋势。
1.分析范式的趋同。即强调个人理性,也就是在给定的约束条件下经济利益主体各自追求效用最大化,最终达到一种稳定状态,实现均衡。可以说博弈论与新古典经济学的关键链接就是理性人的假设。任何一门学科都有一套有别于其他学科的独特体系,而经济学不同于物理、化学等学科就在有它的理性人假设。对此,经济学家张五常曾举过一个很有趣的例子:如果我把一张百元钞票放到游行人的街道上,没有风吹,也没有警察,我敢打赌,这张钞票会不翼而飞,在人类发明的所有科学中,只有经济学可以推断,可以解释。整个新古典经济学理论的大厦便基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。这个假设意味着,每个人的所有行为,都是在局限条件约束下争取最大化报酬。消费者根据自己的偏好和市场既定价格,在收入约束下最大化自己的效用;厂商根据外生的价格水平选择利润最大化产量。各经济行为主体的趋利行为通过竞争,最终达到稳定状态,实现均衡,这包括从单个市场的局部均衡到所有市场的一般均衡。而博弈论研究范式是给出个人的支付函数及战略空间,然后看当事人都选择其最优战略以最大化个人支付函数时将发生什么,这与经济学效用最大化的方式完全吻合。博弈论从行为分析入手,坚持并突出了个人理性在经济分析中的重要作用。不论冯・诺依曼和摩根斯坦因的“最小最大解”,还是后来的“纳什均衡”及其精炼,都是以个人理性为基础的,并对理性人的行为进行了深刻的剖析,揭示了理性人行为背后心理作用的过程,加深了对个人理性的信念。博弈论通过研究拥有不同利益的主体在发生冲突时是如何进行理性决策的,并研究利益冲突的主体如何通过理性决策最终达到均衡,从纳什均衡到精炼纳什均衡再到贝叶斯纳什均衡和精炼贝叶斯均衡,博弈均衡概念的创立、精炼和完善及模型界的存在、性质与应用的研究是现代博弈论的主要内容。正是由于分析范式的趋同,经济学家很容易用博弈论工具对经济问题进行研究,使博弈论在经济学有着广泛的应用领域。
2.符合了新古典经济学的科学化趋势。对于经济学是否是一门科学这一话题,历来争论不休,本文作者也不想就此展开论述,但有一点是可以肯定的,即西方学者一直致力于将数学、物理学等精密科学的分析方法应用于经济学,试图使经济学变成一门科学,他们把现有制度视为外在,只研究可以纯粹用目的和手段来刻画和判断的人类理,强调将复杂社会现象简约成某种可以向物理学那样可以准确把握的东西进行研究,试图将经济学变成一门科学。因此,经济学的分析和论证尽量仿效精密科学尤其是数学和物理学的做法,在研究方法上,除了无法回避的规范分析之外,主要是实证分析,大量采用了数学方法。作为一种数学方法的博弈论,其创立之初就是为了是对经济行为的分析更加精密、科学,《博弈论与经济行为》本身就是用深奥的数学理论写成的,对博弈论发展起过奠基作用的论文最初都是发表在数学杂志上。运用博弈论分析工具对存在利益冲突的理性人的选择行为进行定量分析,可以使经济学向科学化目标迈出一大步。
自从将博弈论引入经济学以后,经济学改变了传统经济分析地那种以个人孤立决策,其他经济活动者的行为影响则被典型地简化为价格信号为基础的分析方法,而侧重于经济活动中多个利益主体的行为所产生的相互作用和影响的分析,从而使经济分析更能反应经济系统的本质。
参考文献
[1]张维迎.博弈论与信息经济学[M].上海:上海三联书店,上海人民出版社,1996.
[2]谢识予.经济博弈论[M].复旦大学出版社.
[3]彭建刚.博弈论与西方经济学的发展[J].经济动态,1998(5).
【关键词】博弈论;水利工程;工程项目管理;应用探讨
近年来,随着我国科经济实力的不断发展壮大,国家用于水利工程建设的投资和力度不断加大,而水利工程项目一般都具有工程复杂、施工难度比较大、技术要求高、工期长等特点,这些决定了项目管理工作具有较大的难度。面对项目管理中的难度,近年来,水利建设单位引入博弈论原理进行项目管理,在水利工程项目管理中具有很好的现实效果。
一、博弈论分析
所谓博弈论是指研究决策主体的行为之间发生相互作用时候的决策以及这种决策的均衡问题,通俗来说就是当一个主体的行为决策受到另一个行为主体的制约时,最终综合双方的意见得出最终决策方案,这种就是我们所指的博弈论。在水利工程项目中运用博弈论就是将监理单位与承包单位之间的行为决策相互作用,确保最终的管理方案具有可行性和科学性。
博弈论可以分为很多种,一般有合作博弈和非合作博弈,两者之间最大的区别就是双方在相互作用时,其最终结果是否一致。一般我们使用的都是合作博弈论,这种方式强调合作效率、公平、公正,体现了合作双方的理性、个人最优决策,通过双方的努力合作,最终得出的结果也是有效的。根据博弈论不同的角度还可以将其分为静态和动态博弈。这种划分方法主要是依据参与人对有关其他参与人的特征和战略空间等掌握的知识程度来划分,可以分为完全信息和不完全信息博弈。在水利工程项目管理要根据实际情况使用不同的博弈方法,建立有效的博弈管理模型。
二、水利工程项目管理内容
工程质量管理是指为了确保合同所规定的质量标准,项目各方采取的一系列的质量监管和控制的管理方法、手段和措施。水利工程项目质量管理包括很多方面,如施工、材料购买、工程变更、工程设计、施工图纸等各方面的管理,只有对工程项目各个环节进行管理才能确保有效控制工程质量,使工程质量达到相关合同标准,确保工程质量和人们生命安全。
在水利工程项目中需要很多劳动人员的参与,如工程设计人员、工程现场施工人员、质量监督人员、项目委托单位等各方面的工作人员的管理。在进行人员管理时,单位要提高工作人员整体素质,让工作人员掌握博弈论理论知识,方便工作人员更好地开展工作。
三、博弈论在水利工程项目管理中的应用探讨
下面以监理工程师和承包商之间的关系建立博弈模型。
首先分析两者之间的单阶段博弈论模型,主要参与者是监理工程师和承包商。监理工程师的战略选择是认真监督和不认真监督,承包商的战略选择就是保证工程质量符合相关标准,或者不确保工程质量,在施工中出现偷工减料现象。在博弈论模型中,监理是否认真直接影响着承包商施工质量,如果监理单位认真监督,那么承包商就不敢偷工减料,反之,如果监督不认真,承包商在施工中就可能出现偷工减料现象。当监理工程师不认真监督时,承包商偷工减料给业主带来的损失就会增加,假定A和B是监理工程师不认真和认真监督时所消耗的工程成本,C是监理工程师在监督过程中发现承包商偷工减料现象,并且按照劳动合同进行的索赔。假设B
假设α表示监理工程师认真监督的概率,β代表承包商偷工减料的概率。我们假定β是已知不变的,监理工程师选择认真监督(α=1)和不认真监督(α=0)的理想收益分别为:πG(1,β)=(-A+C)β+(-A)(1-β)=Cβ-A;πG(0,β)=-Aβ+0(1-β)=-Aβ。解πG(1,β)=πG(0,β),可以得出β=A/(β+A),由此表明,如果承包商偷工减料的概率小于A/(β+A),此时监理工程师可以选择不认真监督;如果承包商头功减料大于A/(β+A)这个概率,监理工程师则需要认真监督,确保工程质量。根据这种推理方法,我们可以对承包商偷工减料进行不同程度的假定,然后计算出承包商偷工减料的概率,从而判断监理工程师的最终选择。
由上述博弈论在水利工程项目管理中的应用研究,我们可以得出,各项目单位在进行项目管理时该采用什么样的工作态度和工作方法,这些都是根据其他相关博弈行动参与者情况所决定。本文主要是例举监理工程师和承包商之间的博弈模型,在水利工程项目管理中,监理人还需要在水利工程中基于博弈论对工程质量进行有效监管,监理工程师、业主和承包商三者都是水利工程项目的博弈参与者,需要建立三者之间相互决策的博弈模型。其中监理工程师与承包商之间的博弈关系是最为重要的,在进行项目工程管理时,要根据承包商偷工减料概率判断监理工程师的选择。这种博弈模型对于加强水利工程项目管理具有重要的作用和意义,能透过表面现象深入到各个环节的管理工作中,不仅能树立单位的良好形象,还能为单位争取更多的经济效益。
结束语
综上所述,在水利工程项目管理中应用博弈论分析方法具有重要的作用和意义。运用博弈论进行工程项目管理,可以通过表面现象对工程项目进行深入的管理,这种管理模式能帮助单位实现最大化的经济效益,建立监理人与承包单位之间的博弈模型,从而规范工程项目施工单位和建立单位的工作,避免出现工程项目质量问题,实现质量与效益共赢的局面。
参考文献:
[1]王国强 周书杰.基于博弈论的监理人水利工程施工阶段质量控制[J].水利经济,2010(02)
[2]王贺瑶.博弈论在水利工程项目管理中的应用分析[D].沈阳农业大学:水利水电工程,2009
[3]姜国辉.基于博弈论的跨流域调水工程水价及项目管理研究[J].西安理工大学:水文学及水资源,2010
作者简介:
博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。
博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。
2.博弈论的基本原理和方法
文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述
G={P,A,S,I,U}
P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。
A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。
S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。
I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。
U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。
还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。
不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。
3、博弈论与电力市场
博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。
正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。
博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。
博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。
4、博弈论在电力市场中的应用
4.1自备电厂与公用电网之间的交易
开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。
文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。
文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。
4.2区域间输电交易分析
互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。
4.3转运市场中电网的固定成本分摊问题
运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。
4.4基于Pool或PX模式的多边贸易市场
电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。
在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。
文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。
该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。
对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。
4.5用博弈论解释和实现算法
文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。
作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。
鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。
用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。
他们还说,写作《妙趣横生博弈论》的目的就是为了要把读者“培养成策略艺术的更佳实践者。不过,对策略艺术的良好实践,首先要求对博弈论的基础概念和基本方法有初步的掌握”。
人生本来就是一场博弈,小到下象棋、养小孩,大到创事业、搞经营,再大到选总统、试军备,几乎无所不包博弈,决策的思想。与此同时,它不像一个伐木工人去砍树,面对的是没有想法和行动的树木,在多数对垒局势里,我们身边围绕着的是积极思考和同样工于心计的人,他们的选择与我们的选择彼此影响、相互作用,甚至互相牵制。正如作弊的考生要时刻面对来回走动、严肃监考的老师,做题跟猜谜一样的学生总要换位思考、寻思出题者的习惯,这些都是博弈。
对此,此书作者提到“当将军试图消灭敌军时,他必须料及并克服阻止其意图的反抗力量。如同将军一样,你必须意识到你的生意对手、潜在配偶,乃至你的子女都是富有谋略的。他们的目标与你的目标既可以相互冲突,也可以完全一致。你的决策必须并充分利用合作。”
所以,在这个意义上,我们多少需要懂点博弈论。要知道,它可不是什么小把戏,也不是厚黑学,
看完《妙趣横生博弈论》之后,应该对博弈论持有这样的看法:它应该是展开有效竞争与合作的理论,应该是大智慧,应该是个人理性融入社会的艺术。对于那些试图探求真实世界现象之因缘的人们来说,博弈论也是理解高度互动的人类社会的一种思想方法和分析工具。
此前,很多有关博弈论的文献都采取数学形式讨论,这使得博弈论在很长时间里都只是象牙塔里面的学科。迪克西特首先认识到,“让博弈论离开学术期刊真是太有趣太重要了”,因为博弈论的洞见在商业、政治、体育以及日常社会交往中有广泛的应用。于是他和合作者身体力行,将博弈论的重要洞见从原来数学形式的理论,转换成日常语言用直观的例子和案例分析取论化的命题。他们“想要改变大家观察世界的方式,通过引入博弈论的概念和逻辑以帮助大家策略性地思考”。