博弈论精要(童话版)-第2章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
方程式,每个人都有自己的方程式。把这些方程式联解的解,就是静态博弈之均衡。”
文书急忙去翻下页,嘴里叽里咕哝的,想是十分的不满意。
它头也不抬:“子博弈精炼纳什均衡?”不过狐狸也不含糊:
“μa,μb。。。。。。βa,βb。。。。。。都是0或者1时得出的均衡就是子博弈精炼纳什均衡!
”
“不完全信息博弈?”
“μa,μb。。。。。。都是小数!”
“贝叶斯纳什均衡?”
“只要我那代数式成立便是贝叶斯纳什均衡!”
“海萨尼转换?”
“这是废话,不需要!你把μ换成β便是,符号变一变,计算上没有什么大不了的改进
,画蛇添足!”
“不完全信息静态。。。。。。”
“什么静态都跟我刚才说的方法一样!”
“精炼贝叶斯均衡。。。。。。”
“停停!怎么个精炼法?”
“哼哼,”文书感觉大是欣喜。它骄傲地说:“听好了!精炼贝叶斯均衡就是。。。。。。修
改后验概率。”
它念了十分钟。蚂蚁和绛仙都糊涂了。
“Robbish!”狐狸不耐烦地道,“莫不是知道某β已经发生,来确定某μ是否合理?”
“你按我那式子计算出来的均衡策略解集中,倘若没有某β,岂不就μ出了矛盾?当然
是要修改μ,此时便需要进一步精炼;倘若解集中就有某β,则此均衡就没有问题,就
是那精炼贝叶斯均衡吧?说起来不过就是以前μ已知,求β;变为β已知,求μ而已!
何必再安些名词出来?”
“那,不完美信息博弈的精炼贝叶斯均衡。。。。。。”
“同上!”
文书的脸色有些难看:“序贯均衡?”
“呵呵,你那序贯均衡无非是不想让人们在非均衡路径上乱来,所以想着任何零概率事
件都赋予正的小概率,好利用条件概率的性质到所有决策上是么?我那代数表达式在所
有策略上都有概率符号,不管它是零概率也好还是其它什么也好,保证在哪儿都不会乱
来!岂非不就是序贯均衡?”
“颤抖手均衡呢?”
“只要第一步用代数式来表达,就也是颤抖手均衡!绝对没有那些乱七八糟的怪现象出
现!”
文书语气开始有些软了。
“你能说说显示原理么?”
“不就是所谓的纳什均衡么?给定每个人的性质,可以设计出一个纳什均衡。要是其中
有一个人谎报自己的情况,便是单独偏离了此均衡,故结果定然对他不利。所以他的唯
一选择就是说实话。”
“我便不信!”绛仙叫道,“你根本不了解别人的情况,居然就能让别人说实话!”
“是啊,这个显示原理也有个前提,就是其它所有人都说的是实话的前提下,单个人不
会偏离均衡而说谎。倘若其它多数人都是说谎,便不是单个人偏离均衡,而是多数人偏
离均衡了,此时谁能保证偏离不会得到更大的利益呢?所以社会环境的确是重要啊!”
“无名氏定理又是怎么回事?”
“这个是无限次重复博弈中的东东。一般说来,博弈中双方合作时得益最大,但若一方
不遵守合作约定,必定是另一方老好人吃亏。所以便引入惩罚机制:谁TMD违约,以后就
要处罚他,使他不敢违约。这便是无名氏定理的要义。”
“处罚的方式有很多,譬如既然已经违约,这个人是不值得相信的了,别人也决计不会
再想和他合作,所以便可能选择一个对这个人最不利的纳什均衡策略,使得此人受损—
—你知道,在无限重复博弈中,倘若损失不考虑时间贴现,则违约人因此受到的损失当
是无穷大;如果时间贴现为0,则违约人不会因惩罚而受到任何损失,所以必有一个贴现
值居于中间,使得凡大于此贴现时的损失,超过违约人一次违约的利益。”
“当然了,其它人倒未必一定要永远处罚下去,只要一段时期损失累计大于违约利益后
,大家又可以合作,倘若再违约,再开始一段时期的处罚。所以违约必亏,大家便永远
合作了。”
文书黯然把书合上了。狐狸笑道:“还有么?”
文书耸了耸肩。