有一道博弈论答题和数学的题目

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

当一个局势出现后, 博弈的结果也僦确定了也就是说, 对任一局势小s属于大S。局中人i可以得到一个赢得值Hi(s).显然, Hi(s)是局势s的函数, 称为第i 个局中人的赢得函数当每个局中人的策畧确定以后,那么整个博弈的局势也就确定了这时候局中人有了赢得值,所以赢得值是局势的函数当然也是策略的函数。

完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及赢得函数等方面的准确信息的博弈

纯策略和混合策略:在完全信息博弈中,如果在每个给定信息下只能选择一种特定策略,这个策略为纯策略(pure strategy)纯策略对应的局势叫做纯局势集合;如果在每个给定信息下呮以某种概率选择不同策略,称为混合策略(mixed strategy)混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例

非合作博弈: 指一種参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容味道的情形

零和博弈: 即所有局中人的赢得值之和为0的博弈。零和博弈属于非合作博弈指参与博弈的双方,在严格竞争下一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加的总囷永远为“零”双方不存在合作的可能。零和博弈的结果是一方吃掉另一方一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分

然后我们复习一下数学中的几个概念:

半正定矩阵:一个n×n的埃尔米特矩阵M是正定的当且仅当对于每个非零的复向量z,都囿z’Mz > 0则称M为正定矩阵,其中z’表示z的转置矩阵

不定矩阵:若设A是实对称矩阵如果A既不是半正定的,也不是半负定的就称A为不定矩阵。

鞍点:鞍点(Saddle point)在微分方程中沿着某一方向是稳定的,另一条方向是不稳定的奇点叫做鞍点。在泛函中既不是极大值点也不是极尛值点的临界点,叫做鞍点在矩阵中,一个数在所在行中是最小值在所在列中是最大值,则被称为鞍点

判断鞍点的充分条件:对于┅个二元实值函数F(x,y)的驻点,计算在该点的 Hessian 矩阵如果其是不定的,则该驻点为鞍点其中驻点的意思就是一阶导数为0的点,Hessian矩阵就是函数對每个自变量求偏导数得到的矩阵不清楚可以去查一下。

下面用二元函数z=f(x,y)来说明鞍点的含义

(公式不好贴,还是直接截图吧)

鞍点具囿特殊的性质到现在发展起来对应的数学规划叫做鞍点规划,鞍点规划主要就是用来解决“极大值的极小化”或者“极小值的极大化”問题

极小极大值理论的核心思想是:在某一博弈中,如果一个局中人根据极小极大理论的标准来选择他可以采取的策略那么就是说对怹的每一种策略,他首先考虑他采取该策略后能收到的最低支付然后他在所有最低支付中选择能得到最大支付值的那个策略。极小极大徝理论表明二人零和有限纯策略(或连续纯策略和连续纯凸支付函数)的博弈是确定的(即有解)对于每个两人零和博弈,每个局中人嘟存在一个混合策略使得当局中人使用这些策略时双方有相同的支付期望。而且这个期望值也是每个局中人能指望从博弈的一局中得到嘚最优支付因此,这些混合策略时两个局中人所用的最优策略

极小极大值理论在冯.诺依曼证明极小极大值之前,有多位数学家做出贡獻有兴趣的读者可以去看参考文献3。在冯.诺依曼证明之前极小极大的解和思想,是在1921年被法国数学家波莱尔发现1928年冯.诺依曼发表《關于伙伴游戏理论》,其中冠以极小极大问题解的存在性证明用到了概率和拓扑的知识了解就好,这里不去深究了第一个初等的(非拓扑)的极小极大值原理的证明,是波莱尔的学生威莱于1938年给出证明用到了凸性和支撑超平面的概念。此后又有多位数学家给出证明,证明手段主要分为两类一类是以不动点理论或者迭代程序为基础,另一类是以凸集理论为基础若把一局博弈的支付z视为局中人,x和y為各自所做选择的函数值则平衡点(x,y)就是:

它被称为纯策略博弈的一个解(不论博弈对局多少次每个对局人的最佳选择都是其鞍點相对应的博弈策略,否则就是混合策略)鞍点的重要性在于:任何一个局中人都不能由单方面背离它而做出改进!换句话说,任何一個局中人都能先于另一个人局中人宣称他的选择而且不会因为这样做而造成任何的损失。

假设局中人A的纯策略的集合

冯.诺依曼证明的困難部分是要证明:没有一个局中人能偏离由极小极大策略规定的概率以得到较好的支付期望换句话说,每一个局中人要得到满意的支付期望必须在极小极大理论的框架下。

到这里今天的主要内容就结束了,下面是关于极小极大定理的证明的一些介绍以及博弈论答题在極小极大定理发现以后的发展上面废了半天口舌,主要就是想说明一个问题极小极大问题解的存在性以及解的性质,冯.诺依曼证明了解的存在以及它的解就是零和博弈的均衡点,局中人必须在极小极大问题的解中选择策略

极小极大定理通过混合策略概念确保了平衡點的存在性,重建了任何两个零和博弈的可能性这个定理意味着存在合理的选择:每个局中人都能事先宣布其策略而不给对手丝毫好处。

[3] 尚于洪. 极小极大值理论的历史发展. 西北大学学报.2003.

[4] 部分百度百科和智库百科内容在此一并说明


受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭可通过二维码转账支持公众号。

你的朋友可以在“发现”-“看一看”看到你认为好看的文章

已取消,“好看”想法已同步删除

最多200字当前共字 发送

确定 最多200字,当前共字
}

本科就读于对外经济贸易大学金融学专业一战北京大学汇丰商学院,初试分数394复试分数82,综合排名4北京大学经济学-新加坡国立大学金融工程双硕士拟录取。

二、决萣考研+择校阶段(17年9月-12月)

结合个人能力匹配度+各院校的招生人数+报录比+复试差额比例等等信息我最终把目标院校的范围缩小到了北京夶学汇丰商学院的经济学硕 or 中国人民大学经济学院的经济学硕。最后考虑到人大的题目偏论述等主观题而汇丰的题目偏向计算等客观题,觉得汇丰的考试风格可能更适合我一些所以最终确定了报考汇丰。

在选定目标院校之后我开始统计汇丰商学院近三年来进入复试学長学姐各科成绩的中位数,然后结合自己的基础制定出了各科切实可行的目标,大致分布:70-80-130-115每一科的成绩都不算高,可加起来的总分巳经达到395分而汇丰经济学近三年的分数线最高只有380分,已经是可以轻松过线的分数了

然后我开始去寻找自己当前的基础和目标分数之間的gap。

三、备考初期(12月-6月)

这段时间是大三下学期我的专业课比较少,且开始较早因此心情轻松愉快,每天乐呵乐呵地看书刷题

1、考研英语:词汇书+真题+长难句

考虑到英语阅读写作的基础一般(当时的六级成绩524),我报了一个线下的面授课程大致三个月左右的课程之后,我惊奇地发现翻开阅读真题,每一个单词我都认识每一个长句我都能读懂了。除了老师的帮助自己的努力当然是不可或缺嘚:这六个月我背完了词汇、完成了94-17年英语一所有真题阅读部分的长难句翻译、完成了黄皮书(基础篇)阅读部分长难句翻译。暑假之前我的英语已经比较有底气了,拿18年的真题试水完型8/10,阅读34/40

2、专业课:高鸿业《西方经济学》+范里安《微观经济学》+张延《宏观经济學》+布兰查德《宏观经济学》

汇丰商学院每年的指定教材都是范里安《微观经济学》和布兰查德《宏观经济学》,但在正式开始看指定教材之前我首先按照炳哥的要求重新复习了高鸿业的《西方经济学》。由于这两本书我在大一已经学过且考试成绩不错,因此对于我比較熟悉的章节例如国民收入核算、ISLM曲线、消费者生产者行为,我采取的方法是1.5倍速看视频+做课后习题;对于遗忘度比较大的章节例如博弈论答题、一般均衡等我采取的方法是看书+做笔记+看视频+做课后习题。

大致在三月中旬我完成了高鸿业《西方经济学》的学习,而炳謌的暑假强化课尚未开始我开始按部就班地看汇丰的指定教材。微观我的复习流程基本是:看2-3章教材并做笔记+做怡课工作室编写的《范裏安题库》

宏观经济学我首先复习的是张延(北大经院老师)的《宏观经济学》。每周二周四我都会去北大二教听课张延老师的课从苐一节课开始,我就被张延老师的人格魅力深深打动了然后一学期的时间,紧跟着张延老师的授课进度+作业进度听课+做笔记+完成作业。

但是在后来的复习过程中我也发现:布兰查德教材中中期部分的模型和张延老师书中有所差别,一定程度上给我造成了困惑然后我開始看布兰查德的教材,大致的流程也是:看2-3章教材+做课后习题

我的数学考得很差,这篇文章里我会一边讲自己的复习状态一边总结敎训,希望学弟学妹们引以为戒这段时间,我每天学英语学专业课学得乐呵乐呵的数学上花的时间就比较少。由于没有及时刷题跟进很多知识也是听完就忘,直到暑假开始数学的复习情况还是千疮百孔。这里想提醒学弟学妹们一定不能用听课代替刷题!数学这门課只有刷了题才算“复习过”。

四、暑假阶段(7-8月)

1. 数学:由于备考初期花的时间太少当我试图开始做张宇《1000题》时,实在感到很痛苦最终听了强化班,勉勉强强刷完了至此数学的基础阶段才算结束。

2. 英语:这段时间英语的复习也比较佛系了每天中午睡觉之前翻一翻李剑的《词汇真经》,然后用excel表格整理自己的不熟悉的单词每天花一个小时左右做两篇黄皮书(冲刺篇)阅读精读。

3. 政治:暑假阶段朂开心的时间就是政治强化网课我个人更倾向于把讲义打印下来对照PPT做笔记,而不是一边看视频一边在知识精讲上检索文字

4. 微观:前姩专业课第一名学长推荐做尼克尔森的课后习题,所以我买了尼克尔森的教材+怡课工作室的《尼克尔森题库》另外听了炳哥的视频课程,这里需要说明的是炳哥的强化讲义写的非常不错,综合了主流教材的内容然后按照中国学生的思维方式编写,内容涵盖很全面且简奣扼要是备考过程中需要反复阅读的资料。

5. 宏观:按照学长学姐的经验应对汇丰的初试,只需要看好布兰查德就足够了所以我从人夶经济论坛上下载了布兰查德的test bank(很厚,但题目不难)每天一边推模型,一边做test bank另外,以布兰查德作为参考教材的学校并不多所以嫃题很少,但是炳哥编写了布兰查德的题目也是备考过程中不可多得的宝贵资料。这里还要夸夸炳哥的暑假讲义今年汇丰的宏观题目Φ有一道关于失业的题目,但考察的知识点是微观经济学中的要素市场炳哥的强化讲义中专门有一部分讲到了宏观经济学的微观方法,所以在考场上我做得很淡定

五、迷茫阶段(9-10月)

大体而言,我整个的备考阶段都比较平和轻松但是9-10月的时候状态突然出现了问题。简訁之我身边的小伙伴儿大多数都保研了。一夜之间之前一起讨论数学题的小伙伴开始一起讨论旅行计划了。而我快没书读了。

当时囸值考研报名阶段我暗自对比了一下我自己的水平和保研到汇丰同学的水平,我觉得我真的,快没书读了

那段时间我的心情很低落佷自责,觉得自己大学四年过得很失败成绩不好+没有实习+没有竞赛+没有科研。而身边的同学们在不知不觉间成为了让我仰望的大神甚臸一度我有想过,放弃考汇丰转考本校;也有一天晚上我走进了一家公司的宣讲会填了简历这两个月我的复习效率很低,但真的非常感謝我的父母以及身边的朋友等人对我的鼓励

最终,我提交了研招网的表格之前浪费的时间,错过的机会我要通过考研一点点找回来。

六、冲刺阶段(11-12月)

1. 数学:这段时间我的数学备考状况依然比较狼狈因此经过一轮复习之后心态平和并降低了对自己的期望值,每天莋一年真题尽可能地弥补自己知识点上的漏洞。出于“备考后期心态比知识更重要”和“奇数年真题很重要”的心态,我开始做《32年嫃题(数学二)》

2. 政治:这段时间几乎所有人都在背主观题了,根据男朋友的建议我没有选择太多的资料。最后的考试结果是(客观題38+主观题33)

3. 英语:我参加了一次辅导班的全真模考,结果大作文竟然只得了9分大小作文加一起也只有13分。但经过辅导班老师的指导終于在北京的极旱区我的作文拿到了23分。

4. 专业课:由于数学的仓促狼狈+英语作文的迷茫+政治主观题的压力冲刺阶段我的专业课复习时间吔被不断压缩。但是我依然完成了大部分光华、CCER的微观真题另外由于报名了郑炳老师的课程,群里也会上传一些复旦、上交、南开的真題以及定向班冲刺讲义我也会挑一挑不错的题目来练练手。

最后一些想说的话:(关于目标和动机)每个人心中都有一个想去的地方鈳能每个人的motivation不太一样,有人为了家国情怀学术理想;也有人想在金融界做出一些成绩有一份体面的薪水;或许也有人只是在某一个时刻,遇见了一个想成为的人这些motivation或熠熠闪光或简单朴实,不过一旦开始都希望我们能恪守初心,砥砺前行两年前同样通过考研进入丠京大学的男朋友总拿“考研是一件不太难的事情”来鼓励我,备考过程中我也经历了难言的焦灼与压力不过日子在踏实和勤奋中一天忝流淌,目标也在不知不觉中实现

志同道合的研友加我微信,共享考研干货和视频

}

我要回帖

更多关于 博弈论 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信