第二讲.博弈论(博弈论)
推荐阅读:微观经济学 — 微观经济学目录
1. 概述
2. 同时进行的比赛
3. 顺序游戏
4. 混合策略游戏
5. 贝叶斯游戏
6. 承诺的经济学
📃【信任游戏的演变】(https://jb243.github.io/pages/1111)
1.概述
⑴ 玩家:参与博弈的经济主体(例如企业、消费者)。
⑵ 策略:描述每个玩家将采取什么行动的计划。
⑶ 收益:每个玩家因策略选择而获得的效用(即游戏结果)。
① uᵢ:玩家i的效用(收益)
② sᵢ:玩家i的策略
③ s₋ᵢ:玩家 1, 2, ···, i−1, i+1, ···, n 的策略
④ 通常以表格形式表示,即收益矩阵。
⑷ 策略概要:元组(s₁,…,sₙ)。
⑸ 游戏:由玩家、所有可行策略和收益组成的集合。
⑹ 博弈论:寻找策略概况的理论。
⑺ BR(最佳回应)
① 定义:对于一个玩家来说,固定其他玩家的策略,使该玩家的效用最大化的策略。
② 一个玩家可能有多个最佳反应(平局),因此 BR 不必是唯一的。
⑻ 纳什均衡(NE)
① 定义:策略概况,其中每个玩家的策略都是最佳响应。
② 也就是说,任何玩家都无法通过单方面改变自己的选择而获益。
③(注)约翰·纳什:1994年诺贝尔经济学奖获得者;电影《美丽心灵》的主角。
⑼ 占优策略均衡(DSE)
① 定义:所有玩家选择他们的主导策略的策略配置文件。
② 缺点是现实中并不常见。
③ 主导策略:无论其他玩家的策略如何,都能最大化玩家效用的策略。
④ 定理1. DSE ⊂ NE
⑤ 定理2. 即使不存在占优策略均衡,纳什均衡仍然可能存在。○ 原因:纳什均衡的条件较弱(限制较少)。
⑽ 优化理论与博弈论
表 1. 优化理论与博弈论
2.同步游戏(同时游戏)
⑴ 假设:合作是不可能的,游戏只玩一次。
⑵ 表示 1. 范式表示
① 示例1. 匹配/不匹配游戏
表 2. 匹配/不匹配游戏
○ 每个单元格“#,#”中,第一个数字是玩家 1 的效用,第二个数字是玩家 2 的效用。
○ πᵢ(sᵢ, s₋ᵢ) 表示当玩家 i 选择 sᵢ 而其他玩家选择 s₋ᵢ 时,玩家 i 获得的效用。
○ 检查所有最佳答案 (BR) 并在表中标记如下。表 3. 标记 BR 的匹配/不匹配游戏
○ BR₁(A ∈ S2) = B ∈ S₁
○ BR₁(B ∈ S2) = A ∈ S₁
○ BR2(A ε S₁) = A ε S2
○ BR2(B ε S₁) = B ε S2○ 由于没有两个收益都带有下划线的单元格,因此不存在纳什均衡。> ② 示例2. 双寡头定价博弈
表 4. 双寡头定价博弈
○ 每个单元格“#,#”中,第一个数字是玩家 1 的效用,第二个数字是玩家 2 的效用。
○ πᵢ(sᵢ, s₋ᵢ) 表示当玩家 i 选择 sᵢ 而其他玩家选择 s₋ᵢ 时,玩家 i 获得的效用。
○ 下划线方法:勾选所有BR,并相应划线。表 5. 标记 BR 的双头垄断定价博弈
○ BR₁(L ∈ S2) = L ∈ S₁
○ BR₁(H ∈ S2) = L ∈ S₁
○ BR2(L ε S₁) = L ε S2
○ BR2(H ε S₁) = L ε S2○ 纳什均衡:(s₁, s2) = (L, L)
○ DSE: (s₁, s2) = (L, L)○ 玩家 1 的占优策略是 L (因为 BR₁(L ∈ S2) = L ∈ S₁ 且 BR₁(H ∈ S2) = L ∈ S₁)
○ 玩家 2 的占优策略是 L (因为 BR2(L ∈ S₁) = L ∈ S2 且 BR2(H ∈ S₁) = L ∈ S2)
⑶ 表示2.博弈树(扩展形式):每个节点称为决策节点。
图 1. 同步游戏的扩展形式
(设定与双寡头游戏相同。)
3。顺序游戏(顺序游戏)
⑴ 概述
① 特征1.单代理决策问题
○ 定义:一种情况是,一个玩家可以完全独立另一位玩家的行为来决定自己的策略。
○ 在典型的同时游戏中,一个玩家会受到另一个玩家策略的影响,因此不符合定义。
○ 在序列博弈中,先动者拥有主动权,因此对应于单智能体决策问题。
○(注)如果一方的策略不起作用,同时博弈也可以是单智能体决策问题。② 特征2. 与同时博弈不同,顺序博弈将行动与行动计划区分开来。
⑵ 示例
① 连续博弈的正常形式表示:可能包括不切实际的纳什均衡。
表 6. 顺序博弈的标准形式表示
○ 设置:硬件厂商先动;软件公司随后搬迁。
○ (HH, HS)的含义:一种软件策略——如果硬件选择H则选择H,如果硬件选择S则选择H。
○ (S, (SH, SS)) 是一个不切实际的解决方案(因为硬件公司自然会选择 H)。② 顺序博弈的扩展形式表示:不包括不切实际的纳什均衡。
图 2. 序列博弈的扩展形式
③(评论)一个重要的特征是,与同时游戏不同,这两种表示方法对于顺序游戏可能不同。
⑶ 适当的子游戏
① 信息集:玩家可能所在的节点集合。
○ 在图1中,玩家2的信息集由单个节点组成。
○ 在图2中,玩家2的信息集由两个节点组成。② 真子博弈:在扩展博弈中,根为单例信息集的子树。
○ 即,包含在较大游戏中的独立游戏。
○ 图2共有三个正确的子游戏。③ 特征1. 任何游戏都包含其自身作为子游戏。
④ 特征2. 一场同时进行的游戏只有一个子游戏。
⑤ 特征3. 由于根决策者是单个参与者,因此它是单代理决策问题的特例。
⑷ SPE(子博弈完美均衡)> ① 定义:策略概况,是每个适当子博弈中的纳什均衡。
②(注)对于同时进行的游戏,NE概念相关;对于顺序博弈,完美均衡概念是相关的。
③ 特性1. SPE必须是NE。
④ 特性 2. NE 不必是 SPE。○ 原因:适当的子博弈消除了不切实际的纳什均衡。
○(评论)适当的子博弈可以被视为一种通过扩展形式求解的方法,从而避免不切实际的结果。
⑸ 前向归纳法:一种自上而下的求SPE的方法。
① 1st. 查找所有 NE。
○ 在上例中,您可以找到(H, (HH, HS))、(H, (HH, SS))、(S, (SH, SS))。
② 第二. 检查每个子博弈中是否每个都是 NE。
○ (H, (HH, HS)):不合适,因为在下面的子博弈中硬件选择S,软件选择H。
○ (H, (HH, SS)):这是一个 SPE。
○ (S, (SH, SS)):不合适,因为在下面的子博弈中硬件选择 H,软件选择 S。
⑹ 逆向归纳法:自下而上寻找SPE的方法。
① 1st. 在扩展形式的顺序博弈中,从叶子开始向上寻找第一个单例信息集。
② 第二. 在每个正确的子游戏中找到 NE。
③ 3rd. 上移至第二个单例信息集。
④ 4th. 在每个正确的子游戏中找到 NE 并对其进行适当标记。
⑤ 第5. 重复步骤③–④,直到到达游戏的根部。⑥ 示例
图 3. 逆向归纳示例
(H, (HH, SS)) 是 SPE。
4。混合策略游戏
⑴ 定义:策略是按概率选择的。
⑵ 特征:最佳响应根据概率参数而变化。
⑶ 示例
表 7. 混合策略游戏示例
① 条件 1. 玩家 1 以概率 ω 选择 H,以概率 1−ω 选择 S。
② 条件 2. 玩家 2 以 h 的概率选择 H,以 1−h 的概率选择 S。
③ BR(最佳响应):理解为是对对手参数h或ω的响应。
④ 纳什均衡解一共有三个。
5。贝叶斯游戏
⑴ 概述
① 不完整信息:至少有一个玩家不知道其他玩家所有可能情况的收益。
② 贝叶斯博弈:基于不完全信息的博弈。○ 混合策略游戏将概率分配给动作,而贝叶斯游戏使用概率来推断信息。
③ BNE(贝叶斯纳什均衡):对于两个玩家,策略配置文件 (s₁(t), s2) 满足:
○ 条件 1. 知道 t 的玩家 1 必须选择最佳响应。
○ 条件 2. 玩家 2 不知道 t,必须根据期望值进行选择。
⑵ 示例> ① 问题设置:概率为1/3,t = −1;概率为 2/3,t = 3。只有玩家 1 知道 t(单例)的值。
② 范式表示
表 8. 贝叶斯博弈的范式表示
③ 扩展形式:根节点称为机会节点。请注意,它仅适用于玩家 1。
图 4. 贝叶斯博弈的扩展形式
④ 策略概况表示法:如果 t = −1 意味着选择 H,则将其写为 H₋₁(或原表示法中的 H1),依此类推。
⑤ 确定玩家 1 的最佳反应
○ 如果 t = −1,玩家 1 应该始终选择 S:放弃涉及 H₋₁ 的策略。
○ BNE 候选人:((S₋₁, H₃), H), ((S₋₁, H₃), S), ((S₋₁, S₃), H), ((S₋₁, S₃), S)
○ ((S₋₁, H₃), H):最佳响应(OK)
○ ((S₋₁, H₃), S):最好切换到((S₋₁, S₃), S)
○ ((S₋₁, S₃), H):最好切换到((S₋₁, H₃), H)
○ ((S₋₁, S₃), S):最佳响应(OK)⑥ 确定玩家 2 的最佳反应
○ 评估 ((S₋₁, H₃), H)
○ 评估 ((S₋₁, S₃), S)⑦ 结论:BNE 为 ((S₋₁, H₃), H) 和 ((S₋₁, S₃), S)。
6。承诺的经济学(承诺)
⑴ 定义:为证明实施威胁的可信意图而采取的行动。
⑵ 目的是让对手相信你必须坚持所威胁的行动,即使这显然也会伤害你。
⑶【政策博弈论】(https://jb243.github.io/pages/2043)
发布时间: 2020-04-22 13:27