Game Theory

在刷李永乐老师的视频的时候,看到了一个很有意思的视频,里面讲了两个例子:囚徒困境和三姬分金的问题。

看完了我很气愤,因为两个东西就是最经典的博弈轮的例子,怎么能成为博弈论总结,我之前学过一些博弈论的知识,所以我毫无收获(当然其他视频对我增加这个世界的感知还是很有帮助的)。

我开始思考如果我来做这样的一期节目,我会怎样进行编排和讲述,我一下子就想到了之前在收藏夹吃灰很久的 Yale University ECON 159 Game Theory。说来惭愧,我之前只上了五六节就弃坑了。

于是花了很长的时间看网课,记笔记,回顾,代入现实生活中应用。

有了系统的学习,加上我大学人生中不断积累的例子,我感觉我在博弈论方面还是有很多很有意思的例子的,并且居然在这门课中都能找到原型!这是多么的amazing啊,要知道能够找到能够解释所有相关问题的理论是非常让人振奋的。

下面我来说说我看到的一些有意思的例子。

例子

囚徒困境

这个例子太过经典了,两个犯人进行博弈,选择告密或者是保密,收益矩阵如下:

告密 保密
告密 0, 0 3, -1
保密 -1, 3 2, 2

规则:两人同时保密,两人同时减刑;一人告密。一人保密,告密者释放,保密者加刑;两人同时告密,刑期不变。那么两个囚徒应该怎么进行抉择呢?

答案:同时选择告密。

选择严格最优的策略。

来源:lecture 1

游戏——信任的进化

信任的进化是一个小的博弈游戏,在囚徒困境的基础之上,增加了多轮的博弈,而这个背后的本质是合作的讨论,是囚徒困境的多轮和无穷轮的讨论。

答案:

  1. 有明确若干轮的,通过backward induction进行推导,最后一次合作必定叛变。
  2. 若合作无穷轮,一直合作。

如何维护合作的关系,不仅要考虑收益的问题,还好有合作的预期。

因此对我们的显示生活中有很大的指导意义,因为我们的生活中的合作就是一个无限的游戏:一直合作,一旦对方叛变了,那么以后都选择不合作。

来源:lecture 21

高能玩家——31点

规则:4组1-6,轮流取数,最后手上所有的数字和为31胜利。

本质上就是必胜必败态的讨论。

具体可以看我之前写的一个帖子的讨论

答案:先手出1, 2, 5必胜

来源:lecture 15

三姬分金

规则:天行九歌里有一说的就是三姬分金的故事。首先准备了一百份金子,游戏规则是,第一个人提出自己的分配方案,如果没有超过半数以上的人同意,那个这个人就会失败,同时也意味着会被处死,以此类推提出方案,然后表决。

答案:玩家1,2,3依次提出决策。通过backward induction进行推导,如果最后只剩下两个人,那么倒数第二个人必死,那么倒数第二个人为了不进入这种局面,必须不能使倒数第三个玩家死。那么玩家1+玩家2一开始一定会合作,那么玩家1会获得所有的钱。

来源:lecture 13及期中后面的若干例子。

如何面对内卷

老师讲这个例子代入的使数据陷阱的故事中,实际上这个问题实质上是一个拍卖问题,也就是如何最理性的进行拍卖。

并且老师还将这个博弈代入到了现在最热门的内卷问题中进行解释,方法我很赞同。那么这个问题该怎么解决呢?

实际上这个问题并不好解决,我们增加一些条件的限制:

  • 两个玩家进行拍卖。
  • 最高出100美分。
  • 赢钱和输钱的概率都是50%。

假设现在出价x,那么赢钱的期望是,推导出。也就是每一个博弈参与人都应该将拍卖的价格设置小于等于50美分。

实际上,常规使用的有四种拍卖方式,有两种策略进行竞拍。

lesson: 我们在竞价的时候,我们应该假设我们已经赢了,并且做出相应的竞价。

来源:lecture 24

大作业组队

这个组队方式看起来很友好,实际上如何正确的处理还是大有门道的。

答案:找到整个博弈的纳什均衡状态,并且假设博弈的同学都是很优秀的,不容许挂科的存在。我给出的两种:一个就是全部参加;另外一个就是掷色子,让一个人上去讲。

来源:全部参加:纳什均衡lecture 4;随机lecture 8。

红眼蓝眼

一个岛上有100个人,其中有5个红眼睛,95个蓝眼睛。这个岛有三个奇怪的宗教规则。

1.他们不能照镜子,不能用任何方式看自己眼睛的颜色。

2.他们不能直接或间接告诉别人对方的眼睛是什么颜色。

3.一旦有人知道了自己是红眼睛,他就必须在当天夜里自杀。

某天,有个旅行者到了这个岛上。由于不知道这里的规矩,所以他在和全岛人一起狂欢的时候,不留神就说了一句话:你们这里有红眼睛的人。

问:假设这个岛上的人足够聪明,每个人都可以做出缜密的逻辑推理,请问岛上会发生什么?

答案:第五天夜里红眼睛全部自杀。

有时候缺乏信息也是一种信息。

来源:lecture 23

广告营销策略

搬出罗永浩的一个例子:

一个书籍经销商有下面的经营策略:

仅电子书 纸质书+电子书
售价 3 10

发现大部分人买的是电子书。

后来他们稍微修改了销售的规则

仅电子书 仅纸质书 纸质书+电子书
售价 3 10 10

结果出人意料,大部分人选择了最后的销售组合。

这就是淘宝套餐策略啊/(ㄒoㄒ)/~~(捂紧我瘪瘪的钱包

很明显增加了选择干扰项,就会影响我们的抉择,甚至有点欺骗的感觉。。。

减少自己的抉择有时候也是一种很好的策略。

来源:lecture 13

欢迎添加

推荐理由

互联网上纷杂的信息是会让我们有一些模糊的世界观,很难转换成自己的方法论,而这门课介绍了无数个实用有意思的方法论。

看似与我们生活常识相同的教训,实际上蕴含的深刻的博弈论道理。

可以看到,每一个博弈论的思路都能从这门课中找到。有的博弈因为是纯游戏,只有策略,有的博弈还能够悟出一些人生的道理。

这门课讨论了很多的话题:选举、经济生产模型、足球运动、企业投资、种族隔离、合作、垄断等等诸多的问题,有些模型解释是非常让人信服的。

Anyway,哪怕是2007年的课程,每一个话题都是非常的经典和耐人寻味的。

这是我对这门课的脑图总结,看不清可见github仓库原图:

各种链接

课程链接

视频链接

课程笔记

results matching ""

    No results matching ""