Game Theory
在刷李永乐老师的视频的时候,看到了一个很有意思的视频,里面讲了两个例子:囚徒困境和三姬分金的问题。
看完了我很气愤,因为两个东西就是最经典的博弈轮的例子,怎么能成为博弈论总结,我之前学过一些博弈论的知识,所以我毫无收获(当然其他视频对我增加这个世界的感知还是很有帮助的)。
我开始思考如果我来做这样的一期节目,我会怎样进行编排和讲述,我一下子就想到了之前在收藏夹吃灰很久的 Yale University ECON 159 Game Theory。说来惭愧,我之前只上了五六节就弃坑了。
于是花了很长的时间看网课,记笔记,回顾,代入现实生活中应用。
有了系统的学习,加上我大学人生中不断积累的例子,我感觉我在博弈论方面还是有很多很有意思的例子的,并且居然在这门课中都能找到原型!这是多么的amazing啊,要知道能够找到能够解释所有相关问题的理论是非常让人振奋的。
下面我来说说我看到的一些有意思的例子。
例子
囚徒困境
这个例子太过经典了,两个犯人进行博弈,选择告密或者是保密,收益矩阵如下:
告密 | 保密 | |
---|---|---|
告密 | 0, 0 | 3, -1 |
保密 | -1, 3 | 2, 2 |
规则:两人同时保密,两人同时减刑;一人告密。一人保密,告密者释放,保密者加刑;两人同时告密,刑期不变。那么两个囚徒应该怎么进行抉择呢?
答案:同时选择告密。
选择严格最优的策略。
来源:lecture 1
游戏——信任的进化
信任的进化是一个小的博弈游戏,在囚徒困境的基础之上,增加了多轮的博弈,而这个背后的本质是合作的讨论,是囚徒困境的多轮和无穷轮的讨论。
答案:
- 有明确若干轮的,通过backward induction进行推导,最后一次合作必定叛变。
- 若合作无穷轮,一直合作。
如何维护合作的关系,不仅要考虑收益的问题,还好有合作的预期。
因此对我们的显示生活中有很大的指导意义,因为我们的生活中的合作就是一个无限的游戏:一直合作,一旦对方叛变了,那么以后都选择不合作。
来源:lecture 21
高能玩家——31点
规则:4组1-6,轮流取数,最后手上所有的数字和为31胜利。
本质上就是必胜必败态的讨论。
具体可以看我之前写的一个帖子的讨论。
答案:先手出1, 2, 5必胜
来源:lecture 15
三姬分金
规则:天行九歌里有一说的就是三姬分金的故事。首先准备了一百份金子,游戏规则是,第一个人提出自己的分配方案,如果没有超过半数以上的人同意,那个这个人就会失败,同时也意味着会被处死,以此类推提出方案,然后表决。
答案:玩家1,2,3依次提出决策。通过backward induction进行推导,如果最后只剩下两个人,那么倒数第二个人必死,那么倒数第二个人为了不进入这种局面,必须不能使倒数第三个玩家死。那么玩家1+玩家2一开始一定会合作,那么玩家1会获得所有的钱。
来源:lecture 13及期中后面的若干例子。
如何面对内卷
老师讲这个例子代入的使数据陷阱的故事中,实际上这个问题实质上是一个拍卖问题,也就是如何最理性的进行拍卖。
并且老师还将这个博弈代入到了现在最热门的内卷问题中进行解释,方法我很赞同。那么这个问题该怎么解决呢?
实际上这个问题并不好解决,我们增加一些条件的限制:
- 两个玩家进行拍卖。
- 最高出100美分。
- 赢钱和输钱的概率都是50%。
假设现在出价x,那么赢钱的期望是,推导出。也就是每一个博弈参与人都应该将拍卖的价格设置小于等于50美分。
实际上,常规使用的有四种拍卖方式,有两种策略进行竞拍。
lesson: 我们在竞价的时候,我们应该假设我们已经赢了,并且做出相应的竞价。
来源:lecture 24
大作业组队
这个组队方式看起来很友好,实际上如何正确的处理还是大有门道的。
答案:找到整个博弈的纳什均衡状态,并且假设博弈的同学都是很优秀的,不容许挂科的存在。我给出的两种:一个就是全部参加;另外一个就是掷色子,让一个人上去讲。
来源:全部参加:纳什均衡lecture 4;随机lecture 8。
红眼蓝眼
一个岛上有100个人,其中有5个红眼睛,95个蓝眼睛。这个岛有三个奇怪的宗教规则。
1.他们不能照镜子,不能用任何方式看自己眼睛的颜色。
2.他们不能直接或间接告诉别人对方的眼睛是什么颜色。
3.一旦有人知道了自己是红眼睛,他就必须在当天夜里自杀。
某天,有个旅行者到了这个岛上。由于不知道这里的规矩,所以他在和全岛人一起狂欢的时候,不留神就说了一句话:你们这里有红眼睛的人。
问:假设这个岛上的人足够聪明,每个人都可以做出缜密的逻辑推理,请问岛上会发生什么?
答案:第五天夜里红眼睛全部自杀。
有时候缺乏信息也是一种信息。
来源:lecture 23
广告营销策略
搬出罗永浩的一个例子:
一个书籍经销商有下面的经营策略:
仅电子书 | 纸质书+电子书 | |
---|---|---|
售价 | 3 | 10 |
发现大部分人买的是电子书。
后来他们稍微修改了销售的规则
仅电子书 | 仅纸质书 | 纸质书+电子书 | |
---|---|---|---|
售价 | 3 | 10 | 10 |
结果出人意料,大部分人选择了最后的销售组合。
这就是淘宝套餐策略啊/(ㄒoㄒ)/~~(捂紧我瘪瘪的钱包
很明显增加了选择干扰项,就会影响我们的抉择,甚至有点欺骗的感觉。。。
减少自己的抉择有时候也是一种很好的策略。
来源:lecture 13
欢迎添加
推荐理由
互联网上纷杂的信息是会让我们有一些模糊的世界观,很难转换成自己的方法论,而这门课介绍了无数个实用有意思的方法论。
看似与我们生活常识相同的教训,实际上蕴含的深刻的博弈论道理。
可以看到,每一个博弈论的思路都能从这门课中找到。有的博弈因为是纯游戏,只有策略,有的博弈还能够悟出一些人生的道理。
这门课讨论了很多的话题:选举、经济生产模型、足球运动、企业投资、种族隔离、合作、垄断等等诸多的问题,有些模型解释是非常让人信服的。
Anyway,哪怕是2007年的课程,每一个话题都是非常的经典和耐人寻味的。
这是我对这门课的脑图总结,看不清可见github仓库原图: