博弈论发展简述(合集5篇)

栏目:精品范文发布:2025-01-10浏览:1收藏

第一篇:博弈论发展简述

博弈论发展简述

博弈论,又称为对策论,英文名称为Game Theory,是研究主体行为发生直接相互作用时的决策以及这种决策的均衡问题的理论。Game一词在英文中的基本意思时游戏、比赛,故而在博弈论刚被介绍到中国时,有的学者根据其英文名称,直译其为游戏理论。博弈的“博”字是竞争的意思,“弈”是对弈,是一种关于在竞争中选择策略,争取最好结果的技艺。

其实,博弈论是用严谨的数学模型来研究现实世界中冲突对抗条件下最优决策问题的理论,最初发源于数学。自20世纪40年代,博弈论从数学家之手产生之后,就很快被借用到经济学领域,并在几代经济学大师的研究和推动之下,广泛应用于经济学、社会科学、管理科学、国际政治、生态学工商业活动以及人们的日常的生活之中。

博弈论的创始者是匈牙利的天才数学家冯·诺依曼(1903~1957),他不仅是经济博弈论的创立者,同时也是计算机的发明者。20世纪初,冯·诺依曼、塞梅鲁(Zemelo)、鲍罗(Borel)就开始研究博弈的准确的数学表达。1939年,冯·诺依曼和经济学家奥斯卡·摩根斯坦(Oskar Morgenstem)合作,从而使博弈论进入经济学的广阔领域。1944年,二人共同出版了著作《博弈论与经济行为》,书中介绍了博弈的理论和方法,提出了标准型、扩展性和合作型博弈模型解的概念和分析方法,从而奠定了博弈学科的利率基础,标志着现代系统的博弈理论初步形成,也象征着博弈学科的正式建立。20世纪50年代,合作型博弈的研究和应用达到顶峰。但是,诺依曼的博弈论的局限性在于,由于过于抽象,大大限制了它的应用范围,在相当一段时间里,人们对博弈论的研究很少,只是少数数学家的专利,影响力有限。

正在此时,另一位博弈论大师纳什(Nash)博士于1950年11月在美国全国科学院的每月公报上刊登了两篇论文,将冯·诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,其理论比冯·诺依曼的合作博弈论更能反映现实的情况。非合作博弈思想,即“纳什均衡”理论的提出,标志这博弈理论新时代的开始。作为一位天才人物,纳什从上大学开始就从事纯数学的博弈论研究。后来,他在经济博弈论领域做出了划时代的贡献。他提出的纳什均衡的概念在非合作博弈理论中起着核心的作用,其后续的研究者对博弈论的贡献,几乎都是建立在这一概念之上的。由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

自20世纪50年代以来,由于纳什、泽尔腾(Selten)、海萨尼(Harsanyi)等人的努力,使博弈理论逐渐成熟并进入实用。尤其在经济学领域,博弈论引发了经济学的“博弈论革命”。博弈论的概念和方法改造了经济学的思维,也从而推进了经济学的研究。1994年诺贝尔经济学奖授予纳什、泽尔腾和海萨尼3位博弈论专家,有力地证明了博弈论在现代经济学研究中的地位,也进一步激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已经成为占据主流地位的基本分析工具。

博弈论在20世纪40年代产生时,最初是运筹学的一个分支,是较纯粹的数学方法,但是由于其理论的普遍性,被逐步推广应用到许多研究领域,尤其是在经济学领域,博弈论改变了经济学家的思维方式,至今引领着该领域的前沿。同时,对博弈论的研究也就方兴未艾,各种博弈理论分支更是层出不穷,演化博弈论就是一个时期以来在原有的理论基础上发展起来的博弈论家族中的热门和新兴分支。

博弈论的组成要素

博弈论由3个基本要素组成:一是决策主体(player),又可译为参与人、局中人或博弈方。指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可以成为一个博弈方,形成决策主体;二是给定的策略空间(strategy space),就是信息结构,又叫策略集,指参与人可选择的策略和行动空间,是可选择策略的集合。每一个策略都对应一个相应的结果,因此每个博弈方可选择的策略数量越多,博弈就越复杂;三是效用(Utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。上述参与人、策略空间和效用3个要素就构成了一个基本的博弈。

博弈理论认为,一个完整的博弈应当包括一下五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后顺序;第五,博弈方的收益,即博弈方做出决策选择后的所得所失。

常见的博弈类型

通过博弈论学者们的研究归纳,通俗地讲,常见的博弈类型有以下几种:第一种是合作博弈和非合作博弈。二者的主要区别在于参与者之间的博弈行为相互作用时,他们能否达成一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。合作博弈强调的是团体理性、效率、公正和诚信,非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的;第二种是重复博弈和非重复博弈。非重复博弈就是博弈的双方博弈之后各自走人,从此不会再来博弈。重复博弈则具有连续性的特点,同一博弈可以重复下去。非重复博弈由于是一次性的,所以容易出现欺诈等道德问题,而重复博弈由于是连续性的,所以道德和规则的约束力较强,参与者不仅要追求一次博弈的目标最大化,而且要追求多次博弈平均目标的最大化,这就会迫使参与者高度重视信誉,并由对抗走向合作;第三种是零和博弈和非零和博弈。零和博弈的特点是博弈双方的成本和所得会相互换位,也即:你的所失正是我的所得,反之一样。不具有这样特征的博弈就是非零和博弈。第四种是静态博弈和动态博弈。参与双方同时决策或同时行动的,叫静态博弈,决策或行动有先后顺序的叫动态博弈。显然,有没有先后顺序,博弈结果和采取的策略是不同的;第五种是完全信息博弈和不完全信息博弈。信息就是知识,但不是一般的知识,是指与决策目标和决策对象有关的特定信息,是参与人有关博弈的知识。按博弈双方拥有的程度分为:①完全信息:博弈双发对产生博弈的事情的知识都是共同知识;②对称信息:博弈双方有关信息的掌握程度是相等的;③不对称信息:博弈双方对实现某一个目标所掌握的信息及采取的策略掌握程度不同,信息在双方之间的分布是不均匀、不对称的。

博弈论的经典模型:囚徒困境

囚徒困境(Prisoner’s Dilemma)。“囚徒困境”至今仍然是博弈研究的重要课题。这个故事是说,两个罪犯犯罪后被抓,分别关押,不能见面,警察审问时分别对他们说,坦白吧,坦白你会被放走,你不坦白另一个人坦白了,你将被判10年。实际上两个囚徒面临的情况是:一个坦白,另一个不坦白,坦白的将被释放,不坦白的会判10年;如果两个人都坦白,各判5年;两个人都不坦白,都放。根据理性人的假设,甲乙两个罪犯都会寻找自己最优目标,那就是自己被释放。如果两个人都不坦白,都会被释放,但甲会想:如果我不坦白,乙坦白了,他会被释放,我要判10年。我坦白了,不管乙是否坦白,我最多判5年,也有可能乙不坦白,我被释放。罪犯乙其实也是这么想。结果他们都坦白了,分别判了5年。在坦白这一点上形成策略均衡,实现了目标最大化。实际上囚徒困境这个模型揭示了合作与竞争(或叫对抗)的关系道理。囚徒困境的情况在生活中最常见的就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤。其中的纳什均衡就是大家都挤,结果上车更慢了,每个人采取的都是最优战略,但是结果却是最劣,原因在于个人理性和集体理性之间存在着冲突。

博弈论的经典模型:智猪博弈

智猪博弈(Boxed Pigs)。有两头猪生活在同一猪舍里,一头大猪,一头小猪,共用一个长食槽。食槽的一头有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下10个包子,而跑去按开关的猪会耗费两个包子的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪会吃掉9各包子,小猪只能吃到1个;如果大猪先按开关,按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个。如果不去按开关,就会被一起饿死。这个模型的最优策略组合只有一个答案:在任何情况下,都要大猪按开关,小猪等待。因为这样,大猪会吃到6个包子,减掉耗费掉的2个,剩4个,与小猪一样。但让小猪按开关,它只能吃到1个包子,减掉耗费的2个,亏1个。智慧型的猪不会干赔本的买卖。但如果大猪也不动,只能双双饿死。这个模型也解释了在博弈过程中,多劳者不一定多得。

博弈论的经典模型:情侣博弈

情侣博弈。假定一对热恋中的情侣,每周末见一次,必须见,否则活不下去。男的喜欢看足球,女的喜欢看电影。见面后,面临选择,看足球还是看电影?热恋中的情侣因为爱,会牺牲自己的爱好去满足对方。如果去看足球,男的满足程度为四个单位,女的满足程度是两个单位;去看电影,女的满足程度是四个单位,男的满足程度是两个单位。在这个博弈中,有三个变量非常重要。一个变量是顺序,就是谁先提出来,比如男的先提出来,女方尽管更愿意看电影,但是男方已经提出来了,她不愿意违背他,只好同意,结果他们就去看足球。相反的情况也是一样。第二个是一次博弈还是多次博弈。如果是多次博弈,双方就会大体上形成一种默契,这一周看电影,下一周看足球。第三个取决于感情的深度。处于依赖程度比较高的一方,对对方更加顺从照顾一些。一般而言,情侣之间的博弈是一个动态过程,因为恋爱就是双方之间较长时期的磨合、了解过程。如果我们假定情侣博弈是一个动态博弈,而且总是男的先决策,女的后决策,那么就会出现一种非常有趣的决策情景。就女方来说,无论男的是选择足球,还是选择电影,她的决策均为四个:一个是追随决策,就是男的选择什么,她就选择什么;二是对抗策略,就是男的选择什么,她偏不选什么;三是偏好策略,就是无论男的选什么,她都选电影,因为这是她的偏好;四是成全策略,就是无论男的选什么,她都选足球,因为足球是男的偏好,她宁可牺牲自己的偏好,而成全男方。情侣博弈在现实生活中到处存在,它让人们思考如何人去关心别人、理解别人,处理好人际关系。

博弈论的经典模型:斗鸡模型

斗鸡博弈(Chicken Game).在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失败。现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰上了。这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。第二种是,双方都退下来,双方也都是丢面子,但是都掉不到水里去。第三种结果,甲方退下来,丢面子,乙过去。第四种结果,乙退下来,丢面子,甲顺利通过。在这四种结果中,第一种是两败俱伤;

三、四两种是一胜一败,第二种是两败不伤,这就是斗鸡博弈。在这个模型中,最优策略有两个,就是第三、第四两种选择,即甲退下来乙先过去,或者乙退下来甲先过去。因为两种选择对整个社会来说效益最大,损失最小。两虎相争勇者胜,如何处理竞争中的两虎关系呢?一般有四种办法:第一种是谈判,双方约定一个条件,其中一个先退下来;第二种是制度,建立一种制度,规定从南到北的先退,或者从北到南的先退,或者后上桥者先退;第三种是时间,双方僵持一段时间,谁先吃不住劲谁先退;第四种是妥协,妥协不一定是最优策略,但是至少可以保证取得次优结果。在工作生活中乃至处理国际关系时,得饶人处且饶人,退一步还扩天空,都是从斗鸡博弈可以总结出的道理。

博弈论的经典模型:威慑模型

威慑博弈的完整名称是进入威慑博弈,是研究参与者想进入某领域,而与该领域已有竞争者的博弈模型。假定有两个参与人,一个想进入某行业,称之为进入者,另一个已在同一行业占有一席之地,称之为先入者。对进入者来说,不管先入者是否设置壁垒,其最优目标都是进入。而对先入者来说,要设置壁垒,必须付出巨大成本,否则不如默许。进入威慑博弈模型的启示是:要做一件事情,必须确定一个可行的目标,不怕困难,全力以赴向目标努力,目标就会实现。另外,不是所有的威慑都没有用处,付出巨大成本的威慑是起作用的,而要想使威慑起作用的,必须付出巨大成本。同时,进入威慑博弈也提出了一个问题,就是威胁和承诺的可信度问题,威胁实际上也是一种承诺。威胁和承诺是否可行,取决于其成本的大小,取决于其成本和收益的比较。一般而言,成本巨大的,或者成本高于收益的威胁和承诺,可信度就比较高,反之则低。实际生活中有些制度见效甚微,就是因为惩罚力度太小,使得违规者的违规收益高于违规成本。

第二篇:博弈论的发展历程

博弈论的发展历程(下)(ZZ)

信息问题上的突破。古典经济模型几乎无一例外地假设,个人(或厂商)的资源与偏好情况不仅为自己,也为他们的竞争对手所知,即完全信息假设。这显然不符合实际。不过,这并非模型建立者本身所希望的,而只是因为缺乏解决不完全信息问题的工具而不得不做出的简化。博弈论的发展也遇到同样问题。由于对不完全信息问题一度苦无良策,博弈论曾受到严厉批评。因为局中人事实上不可能清楚关于对手决策的所有信息。由此导致博弈理论建模的应用范围也受到了限制。豪尔绍尼对这一问题的解决方法是将不完全信息建模为自然完成的一种抽彩。这种抽彩决定局中人的特征。而这些特征是局中人偏好与经验的总和,其中,每个局中人清楚自己的特征,但不知道别人的真实特征。即他对整个博弈局势只有不完全信息。据其特征,局中人可分为一些类型。每个局中人知道自己的类型,不知道别人的类型,但知道类型上的联合分布,从而能对其它局人的类型作出先验分布判断。不完全信息的这种博弈局势把实际中千变万化的不完全信息都№归结为局中人对他人的主观判断。这种方法成功地将不易建模的不完全信息转化为数学上可处理的不完善信息:即局中人根据经验与知识对对手的类型得出关于可能性大小的主观判断,即数学上的一种先验分布。不完全信息博弈的解是由纳什均衡概念推广而来的。其均衡点(贝叶斯均衡点)是一个n重策略,每个局中人每种类型的个人策略均是对其它局中人的(n-1)重策略的那种类型的最佳应对。以类型为基础的不完全信息博弈是豪尔绍尼(1967~1968年)提出的。他运用这种方法来克服将局中人的信息与偏好以及他对其它局中人信息与偏好的了解进行建模时所遇到的复杂性。这一思路极富创造性,使不完全信息博弈成为解决经济问题的一个有力工具。其次是关于混合战略的解释。混合战略概念的传统解释是,局中人应用一种随机方法来决定所选择的纯战略。这种解释在理论与实际上均不能令人满意。豪尔绍尼对此提出杰出的解释方法。他说明在每一真实的博弈形势中,总受一些微小的随机波动因素影响。在一标准型博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一策略均对应一个。这些随机变量的具体取值仅为相关局中人所知,这种知识即成为私有信息;而联合分布则是博弈者的共有信息。这称为变动收益博弈。变动收益博弈适用豪尔绍尼的不完全信息博弈理论,各随机变量的一种取值类型影响着一个博弈者的收益。在适当的技术条件下,变动收益博弈所形成的纯策略组合与对应无随机影响的标准型博弈的混合战略组合恰好一致。豪尔绍尼证明,当随机变量趋于零时,变动收益博弈的纯战略均衡点转化为对应无随机影响的标准型博弈的混合战略均衡点。豪尔绍尼的变动收益博弈理论提供了对混合战略均衡点具有说服力的解释。局中人只是表面上以混合战略博弈,实际上,他们是在各种略为不同的博弈情形中以纯战略博弈。这种重新解释是一个具有重大意义的概念创新,是豪尔绍尼对博弈论所采用的贝叶斯研究方法的一块基石。再次就是关于合作博弈的通解。豪尔绍尼关于博弈论的第一篇论文(1956)把纳什的合作理论与Zeuthen的议价模型结合,这是他建立n人合作博弈的通用议价模型(1959,1965)的第一步。绝大多数合作解概念基于具有或不具有旁支付(side payment)的特征方程型博弈。而他的通用议价模型是第一个适用于标准型博弈问题的几人合作理论。通过对均衡时效用权重与联盟对局中人分红具有独创性的构造,他成功地定义了一种议价解法,与非合作博弈的一种均衡点非常相似。直至现在,他的几人议价模型仍是合作博弈理论中最为重要的理论之一。最后是关于对合作的非合作形式建模。现在一种观点已被广泛接受,即有关一种博弈形势的充分详细的模型必为一个非合作博弈理论。而在1960年代以前,一般观点认为,合作理论比非合作理论更为重要。豪尔绍尼是促使产生这种观念变迁的博弈论研究者之一。他首先认识到合作机会以非合作博弈形式建模的必要性。由此观点,合作理论可视为一个简化形式,需要建立具有更多细节的非合作模型。以这种思路,豪尔绍尼(1974)为特征方程型博弈中一个重要的合作理论——冯•诺伊曼——摩根斯顿稳定集——进行了创造性的非合作形式重建。豪尔绍尼的议价模型中为一个具有可转移效用的零和特征方程型博弈设计了一个收益向量序列,以其序列递推过程描述联盟的选择过程。其理论利用非直接优势概念形成了修正的稳定集概念。豪尔绍尼对稳定集概念的非合作重建为考察联盟形成的非合作模型构造提供了方法上的突破。对不可置信威胁的研究引出了博弈论中一个很重要的概念,即承诺行动。承诺行动是博弈中的主体使自己的威胁战略变得可置信的行动。一种威胁是否可以置信,取决于当事人在不施行这种威胁时是否会遭受更大的损失。承诺行动意味着当事人要为自己的失信付出成本,尽管这种成本并不一定真的发生,但承诺行动给当事人带来很大的好

处,因为它会改变均衡结果。

随着现代经济的迅猛发展,博弈论日益为人们所认识,并应用于经济现象的分析与研究中。博弈论已成为博大精深的体系,广泛应用于经济学、政治学、军事决策、计算机科学、生物演化等研究。同时与数学、心理学、统计学以及认识论、伦理学等学科有重要联系。它与各学科之间相互影响、相互促进,一方面借鉴其它学科的思想成果,另一方面也促进了其它学科的发展。博弈论与经济学的关系尤为密切,其最直接的应用领域是在契约、合作及各种公共产品等领域,博弈论的影响广及市场理论、契约与合同、政府行为等诸多方面,为研究各

种经济现象开辟了全新视野。

博弈论思想也对经济学家的思维方式产生了深刻影响。人们越来越认识到,大多数经济问题可以作为博弈过程来分析。克雷普斯指出,仅就在经济学上的应用而言,博弈论的主旨是帮助经济学家理解和预测在经济环境中已经发生与将要发生的事情。博弈论工具的应用的确加深了对经济现象的理解。近年来,许多学者尝试运用博弈论研究微观和宏观经济理论问题,甚至想通过这条途径重新建构理论框架。这一趋势已逐渐深入到每一个经济学及相关的领域。博弈论的传统应用领域是产业组织或市场结构的研究以及对投票和公共物品供给的分析等。诸如重复囚犯困境、交错出价的议价模型、时间选择博弈和先买权博弈,都在产业组织理论分析中得到应用。而豪尔绍尼的贝叶斯纳什均衡解,作为许多博弈推理分析的基石,则应用于机制设计问题。其中包括非线性价格歧视、最佳拍卖、对公共物品偏好的显示以及信息不完备情况下的契约失效等。在对掠夺行为和就业市场信号的分析中所应用的一系列解的概念——完全贝叶斯均衡解、克雷普斯和威尔森序列均衡解、泽尔滕颤抖手完美点均衡解,体现着经扩展的不完全信息博弈中子博弈完美点的思想。近年来,博弈论被应用到对不同拍卖行为的分析、委托人——代理人的关系及激励机制问题,以及公共财政学领域等。我国学者近年来对博弈论在经济研究中的应用进行了有益尝试。如对经济调整中的社会博弈问题的研究、对中央政府与地方政府的博弈关系和规则的探讨等。博弈论作为一种有力的分析手段,在经济学中有着广泛的应用前景。博弈、合作与经济制度紧密相联,诺斯则认为对经济制度的研究实质上就是对合作的机制的研究。我们认为,近年来经济学的一系列突出成就和最新进展越来越集中地表现出人们对经济行为主体认识的深化。作为洞察主体行为规律和分析经济现象背后机制形成的认识工具,博弈论在研究变革社会的秩序演进与制度创新方面应用潜力巨大。

博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理

论指导,具有重要意义。

经济学在为现实经济提供理论指导的同时其自身也要不断发展,凯恩斯以后的西方经济学,在战后已发展起了一个新的体系,即以研究资本主义经济运行为对象的宏观经济学和微观经济学。在改革前,我国的经济研究原是以生产关系为研究对象的政治经济学,主要探讨社会主义经济制度不断完善的途径,并不研究经济运行的过程,在当时计划经济体制下人们对经济活动的关心也主要局限在对政府行为的理解和落实上,而忽视对企业和个人行为的分析、更不考虑各经济主体之间的相互影响和相互对立,忽视经济主体在资源配置问题上的矛盾和博弈。我国在确立社会主义市场经济目标以后,重塑经济主体、转变经济主体的职能、增强各经济主体的活力,是重要的任务。博弈论分析我国转型时期宏微观经济运行的重要工具,因为在我国社会主义市场经济中,经济主体存在着信息的不完全、信息不对称等现实情况,人(政府、企业中的决策者及社会个人)都有自己的效用函数,对信息的加工能力也是有限的,各经济主体之间的选择存在着许多相互依

赖关系。

博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理

论指导,具有重要意义。

我国市场经济经济运行中,政府制定什么政策会收到什么效果,可以通过构建博弈模型进行研究,考虑博弈中各主体的效用函数等,研究不同博弈规则下的均衡。在转型时期政府的许多政策并不能采取指令性规定强制实施,只能依靠宏观调控的手段进行,因此,政府在制定政策时必须考虑政策实施的效果,要研究博弈主体决策行为的相互依赖和相互影响,考虑经济主体的预期以及所获信息对博弈均衡的制约和影响。个人的各项经济决策,要考虑到社会经济活动中其他相关主体的影响。企业作为生产者,目标是利润极大。从这个目标出发,它对投入、产出的种类和数量进行选择,对自己的收入转化为积累与个人的收入分配比例进行选择,这个过程是一个重大的博弈决策过程。经济体制改革改变了政府控制整个经济活动的局面,企业和个人在经济活动中的独立性与能动性日益增强,研究各经济主体在经济活动中的博弈和均衡是研究经济运行机制和规律的重要内容,而专门研究相互依赖、相互影响的理性决策行为的博弈论方法,为政府利用经济理论分析政策问题提供了一种有效的手段。信息经济学是不对称信息博弈论在经济学上的应用,即研究在给定信息结构的条件下,进行最优的契约安排。我国经济转型时期的许多工作需要信息经济学的理论。信息经济学中信息的不对称包括不对称发生的时间和不对称信息的内容。从不对称发生的时间看,债转股的不对称可能发生在相关利益者签约之前,也可能发生在签约之后,分别称事前不对称和事后不对称。研究事前不对称信息博弈的模型称为逆向选择模型,研究事后不对称的模型称为道德风险模型。在信息经济学中,将博弈中拥有私人信息的参与人称为代理人,不拥有私人信息的参与人称为委托人。信息经济学的所有模型都可以在委托人一代理人的框架下分析。债转股政府、资产管理公司和债转股国有企业之间的关系就存在特殊的值得深入探讨的委托代理关系。博弈论理论的成熟,极大地促进了委托代理理论的发展,委托代理理论可以模型化如下一类的问题:委托人(如政府)想使代理人(如债转股国有企业的经营者)按照前者的利益选择行动(如使股权回购和国有资产保值增值),但委托人不能直接观测到代理人选择了什么行动,能观测到的只是另一些变量(如企业效益、产品的市场占有率等),这些变量由代理人的行动和其他的外生的随机因素共同决定,因而充其量只是代理人行动的不完全信息。委托人的问题是如何根据这些观测到的信息来奖惩代理人,以激励其选择对委托人最有利的行动。委托人在签约时要使自己期望效用极大化,而此时会面临来自代理人的两个约束:一个是参与约束,即代理人从接受合同中得到的期望效用不能小于不接受合同时能得到的最大期望效用;另一个是代理人的激励相容约束,即代理人总是选择使自己的期望效用最大化的行动,如果委托人希望的行动正好能使代理人的期望效用最大,那么代理人就会选择它。

第三篇:博弈论的发展历程.

博弈论的发展历程

虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈。这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。

1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。

接下来的一段时期对合作博弈的研究有了长足进步。按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。如意愿表示不可强制执行,则为非合作博弈。非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。事实上,合作博弈可视为非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。为了解决合作博弈中所遇到的问题,这一期间提出了联盟博弈、稳定集、解概念、可转移效用、核心等重要概念与思想。1950年代是博弈论的成长期,纳什为非合作博弈的一般理论奠定了基础,提出了博弈论中最为重要的概念——纳什均衡,开辟了一个全新的研究领域。非合作理论发展起来,如阿尔·塔克的囚徒困境、重复博弈概念等。合作博弈理论在这个阶段得到进一步发展,如沙普利值概念、核概念等。博弈论的研究队伍开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为博弈论的研究中心。此经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论的成熟期。不完全信息与非转移效用联盟博弈那样的扩充使理论变得更具广泛应用性。常识性的基本概念得到了系统阐述与澄清。博弈论成了完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重

要解概念之间的对应关系。豪尔绍尼与泽尔滕正是在这一时期开始他们的工作,豪尔绍尼提出了不完全信息理论,泽尔滕开始其均衡选择问题的研究。1970年代至今是博弈论的丰富壮大期。博弈论在所有研究领域都得到重大突破。博弈论开始对其它学科的研究产生强有力的影响,计算机技术的飞速发展使得研究复杂与涉及大规模计算的博弈模型发展起来。在理论上,博弈论从基本概念到理论推演均形成了一个完整与内容丰富的体系。在应用上,政治与经济模型有了深入研究,非合作博弈理论应用到大批特殊的经济模型。同时博弈论应用到生物学、计算机科学、道德哲学等领域,如随机策略这样的概念得到了重新解释。渐渐地,博弈论变得大众化起来。不再是仅为少数研究者所知。要对每年所发表的有关博弈论数以千计的文献进行了解已不是件容易的事。至今,博弈论仍在不断发展与深化,预测其可能出现的创新与成就是很困难的。

在博弈论的发展过程中,纳什奠定了非合作博弈的理论框架与概念基础,他的名字与博弈论的中心概念——纳什均衡联在一起;豪尔绍尼与泽尔滕则致力于博弈论的进一步发展与应用。

在非合作博弈论和经济分析里所应用的博弈论思想中,纳什均衡都处于核心地位。克雷普斯(D.Kreps)教授认为,如今在每一个经济学领域及与其相关的金融、会计、市场学甚至政治学等领域,在消化其近期研究成果过程中,对纳什均衡概念的理解均起着重要作用。虽然作为先驱者的古诺(Cournot)已在其研究中开创这一思想的先河,但其目前的形式则是纳什独立完成得出的卓越成就。美国普林斯顿大学的数学家和统计学家纳什。从1950年至1954年,他发表了多篇论述博弈论的文章,为非合作的一般理论和合作博弈的谈判理论奠定了基础。他规定了非合作博弈的形式,并定义了著名的“纳什均衡点”。纳什最先对合作与非合作进行了区别。纳什认为以前的理论包含着某种被称为合作类型的n人博弈思想,它以一种对能由局中人形成的不同合作之间相互关系的分析为基础;与此相反,纳什认为他自己的理论则“以缺乏合作为基础,在其中假定每个参与者都各行其是,与其他人之间没有合作与沟通”。该思想拓展了博弈论的研究范围,并增强了其应用性。在阐明了合作与非合作之间区别的基础上,纳什定义了著名的“纳什均衡点”,并对它的存在进行了证明。纳什均衡的定义一般是通过简单确定一个正常形式的有限局中人和行动的博弈来给出的。在纯策略中,它是指这样一种策略分布:假使其他局中人不变换其策略,则任何一个局中人都不能以单方面变换自己的策略来增加其效用。纳什还证明,在一个有限局中人和行动的博弈中,至少总存在一个纳什均衡,虽然当我们考察混合策略时才能完全保证其存在,因为有例子表明,存在着没有纯策略均衡的对策。这一定义实际上包含着一个前提假定,即局中人对游戏结构有充分的了解,也就是说拥有完全信息,以便能够导出他们自己的预测。纳什均衡的意义直到现在仍是探讨与争论的题目。一般认为,它是随不同情况而变化的一种过程。例如,假设在某种博弈中,局中人通过某些非强制手段就局中人的策略选择达成协议,这项协议具体确定了每个局中人选择的策略。由于协议无强制力量,局中人如果能通过违背协议而获得利益,则该协议无效。所以,为了保证协议有效,必须有一种局中人不可能因单方面违背协议而获益的机制,即形成一种纳什均衡。即,纳什均衡使得协议能够自我约束,无外力作用下也能保证协议的生效。这里纳

什均衡的意义在于保证协议的自我强制执行。但这并不是说每个纳什均衡都具有自我强制性,就多个局中人背信问题而言可能得出不同的结论。此外,这里并未讨论协议如何实施及无协议时的情况。纳什均衡在上述情况中的含义是有差别的。纳什均衡刻画了人们理性选择的结果:利益冲突达到一种稳态以至无人会单方面加以改变。纳什均衡并未对这一结果做出福利上即总体上优与劣的判断。这就允许存在一种情形:由于人们的不合作使得每个人都达不到可能的最大收益。在囚徒困境中表现得十分明显,其中唯一的纳什均衡是双方均交待,因为在其它策略组合下均有一方能因改变策略而获益。但是这一局势中的帕累托最优是双方均不交待。这表明,帕累托最优并不一定能在纳什均衡点上实现。也即,在存在利益冲突的情况下,利己主义个人理性选择的结果在总体上可能并不是最有效的。进而,西方经济学中在经济人假设下,市场经济会达到或者趋向帕累托最优这一结论在引入利益冲突后有可能无法成立。在囚徒困境中,双方虽可在均不交待的情况下达到帕累托最优,却难以实现这一结果。这是由于缺乏对对方的信任。因对方可

解锁后支持完整在线阅读或下载编辑海量优质内容资源

博弈论发展简述(合集5篇)

第一篇:博弈论发展简述博弈论发展简述博弈论,又称为对策论,英文名称为Game Theory,是研究主体行为发生直接相互作用时的决策以及这种决…
点击下载
分享:
热门文章
    热门标签
    确认删除?