第二讲.博弈论（博弈论）

推荐阅读：微观经济学 — 微观经济学目录

1. 概述
2. 同时进行的比赛
3. 顺序游戏
4. 混合策略游戏
5. 贝叶斯游戏
6. 承诺的经济学

► 两盘平衡问题与博弈论

📃【信任游戏的演变】(https://jb243.github.io/pages/1111)

1.概述

⑴ 玩家：参与博弈的经济主体（例如企业、消费者）。

⑵ 策略：描述每个玩家将采取什么行动的计划。

⑶ 收益：每个玩家因策略选择而获得的效用（即游戏结果）。

① uᵢ：玩家i的效用（收益）
② sᵢ：玩家i的策略
③ s₋ᵢ：玩家 1, 2, ···, i−1, i+1, ···, n 的策略
④ 通常以表格形式表示，即收益矩阵。

⑷ 策略概要：元组(s₁,…,sₙ)。

⑸ 游戏：由玩家、所有可行策略和收益组成的集合。

⑹ 博弈论：寻找策略概况的理论。

⑺ BR（最佳回应）

① 定义：对于一个玩家来说，固定其他玩家的策略，使该玩家的效用最大化的策略。
② 一个玩家可能有多个最佳反应（平局），因此 BR 不必是唯一的。

⑻ 纳什均衡（NE）

① 定义：策略概况，其中每个玩家的策略都是最佳响应。
② 也就是说，任何玩家都无法通过单方面改变自己的选择而获益。
③（注）约翰·纳什：1994年诺贝尔经济学奖获得者；电影《美丽心灵》的主角。

⑼ 占优策略均衡（DSE）

① 定义：所有玩家选择他们的主导策略的策略配置文件。
② 缺点是现实中并不常见。
③ 主导策略：无论其他玩家的策略如何，都能最大化玩家效用的策略。
④ 定理1. DSE ⊂ NE
⑤ 定理2. 即使不存在占优策略均衡，纳什均衡仍然可能存在。

○ 原因：纳什均衡的条件较弱（限制较少）。

⑽ 优化理论与博弈论

表 1. 优化理论与博弈论

2.同步游戏（同时游戏）

⑴ 假设：合作是不可能的，游戏只玩一次。

⑵ 表示 1. 范式表示

① 示例1. 匹配/不匹配游戏

表 2. 匹配/不匹配游戏

○ 每个单元格“#，#”中，第一个数字是玩家 1 的效用，第二个数字是玩家 2 的效用。
○ πᵢ(sᵢ, s₋ᵢ) 表示当玩家 i 选择 sᵢ 而其他玩家选择 s₋ᵢ 时，玩家 i 获得的效用。
○ 检查所有最佳答案 (BR) 并在表中标记如下。

表 3. 标记 BR 的匹配/不匹配游戏

○ BR₁(A ∈ S2) = B ∈ S₁
○ BR₁(B ∈ S2) = A ∈ S₁
○ BR2(A ε S₁) = A ε S2
○ BR2(B ε S₁) = B ε S2

○ 由于没有两个收益都带有下划线的单元格，因此不存在纳什均衡。> ② 示例2. 双寡头定价博弈

表 4. 双寡头定价博弈

○ 每个单元格“#，#”中，第一个数字是玩家 1 的效用，第二个数字是玩家 2 的效用。
○ πᵢ(sᵢ, s₋ᵢ) 表示当玩家 i 选择 sᵢ 而其他玩家选择 s₋ᵢ 时，玩家 i 获得的效用。
○ 下划线方法：勾选所有BR，并相应划线。

表 5. 标记 BR 的双头垄断定价博弈

○ BR₁(L ∈ S2) = L ∈ S₁
○ BR₁(H ∈ S2) = L ∈ S₁
○ BR2(L ε S₁) = L ε S2
○ BR2(H ε S₁) = L ε S2

○ 纳什均衡：(s₁, s2) = (L, L)
○ DSE: (s₁, s2) = (L, L)

○ 玩家 1 的占优策略是 L （因为 BR₁(L ∈ S2) = L ∈ S₁ 且 BR₁(H ∈ S2) = L ∈ S₁)
○ 玩家 2 的占优策略是 L （因为 BR2(L ∈ S₁) = L ∈ S2 且 BR2(H ∈ S₁) = L ∈ S2)

⑶ 表示2.博弈树（扩展形式）：每个节点称为决策节点。

图 1. 同步游戏的扩展形式
（设定与双寡头游戏相同。）

3。顺序游戏（顺序游戏）

⑴ 概述

① 特征1.单代理决策问题

○ 定义：一种情况是，一个玩家可以完全独立另一位玩家的行为来决定自己的策略。
○ 在典型的同时游戏中，一个玩家会受到另一个玩家策略的影响，因此不符合定义。
○ 在序列博弈中，先动者拥有主动权，因此对应于单智能体决策问题。
○（注）如果一方的策略不起作用，同时博弈也可以是单智能体决策问题。

② 特征2. 与同时博弈不同，顺序博弈将行动与行动计划区分开来。

⑵ 示例

① 连续博弈的正常形式表示：可能包括不切实际的纳什均衡。

表 6. 顺序博弈的标准形式表示

○ 设置：硬件厂商先动；软件公司随后搬迁。
○ (HH, HS)的含义：一种软件策略——如果硬件选择H则选择H，如果硬件选择S则选择H。
○ (S, (SH, SS)) 是一个不切实际的解决方案（因为硬件公司自然会选择 H）。

② 顺序博弈的扩展形式表示：不包括不切实际的纳什均衡。

图 2. 序列博弈的扩展形式

③（评论）一个重要的特征是，与同时游戏不同，这两种表示方法对于顺序游戏可能不同。

⑶ 适当的子游戏

① 信息集：玩家可能所在的节点集合。

○ 在图1中，玩家2的信息集由单个节点组成。
○ 在图2中，玩家2的信息集由两个节点组成。

② 真子博弈：在扩展博弈中，根为单例信息集的子树。

○ 即，包含在较大游戏中的独立游戏。
○ 图2共有三个正确的子游戏。

③ 特征1. 任何游戏都包含其自身作为子游戏。
④ 特征2. 一场同时进行的游戏只有一个子游戏。
⑤ 特征3. 由于根决策者是单个参与者，因此它是单代理决策问题的特例。

⑷ SPE（子博弈完美均衡）> ① 定义：策略概况，是每个适当子博弈中的纳什均衡。

②（注）对于同时进行的游戏，NE概念相关；对于顺序博弈，完美均衡概念是相关的。
③ 特性1. SPE必须是NE。
④ 特性 2. NE 不必是 SPE。

○ 原因：适当的子博弈消除了不切实际的纳什均衡。
○（评论）适当的子博弈可以被视为一种通过扩展形式求解的方法，从而避免不切实际的结果。

⑸ 前向归纳法：一种自上而下的求SPE的方法。

① 1st. 查找所有 NE。

○ 在上例中，您可以找到(H, (HH, HS))、(H, (HH, SS))、(S, (SH, SS))。

② 第二. 检查每个子博弈中是否每个都是 NE。

○ (H, (HH, HS))：不合适，因为在下面的子博弈中硬件选择S，软件选择H。
○ (H, (HH, SS))：这是一个 SPE。
○ (S, (SH, SS))：不合适，因为在下面的子博弈中硬件选择 H，软件选择 S。

⑹ 逆向归纳法：自下而上寻找SPE的方法。

① 1st. 在扩展形式的顺序博弈中，从叶子开始向上寻找第一个单例信息集。
② 第二. 在每个正确的子游戏中找到 NE。
③ 3rd. 上移至第二个单例信息集。
④ 4th. 在每个正确的子游戏中找到 NE 并对其进行适当标记。
⑤ 第5. 重复步骤③–④，直到到达游戏的根部。

⑥ 示例

图 3. 逆向归纳示例
(H, (HH, SS)) 是 SPE。

4。混合策略游戏

⑴ 定义：策略是按概率选择的。

⑵ 特征：最佳响应根据概率参数而变化。

⑶ 示例

表 7. 混合策略游戏示例

① 条件 1. 玩家 1 以概率 ω 选择 H，以概率 1−ω 选择 S。
② 条件 2. 玩家 2 以 h 的概率选择 H，以 1−h 的概率选择 S。
③ BR（最佳响应）：理解为是对对手参数h或ω的响应。
④ 纳什均衡解一共有三个。

5。贝叶斯游戏

⑴ 概述

① 不完整信息：至少有一个玩家不知道其他玩家所有可能情况的收益。
② 贝叶斯博弈：基于不完全信息的博弈。

○ 混合策略游戏将概率分配给动作，而贝叶斯游戏使用概率来推断信息。

③ BNE（贝叶斯纳什均衡）：对于两个玩家，策略配置文件 (s₁(t), s2) 满足：

○ 条件 1. 知道 t 的玩家 1 必须选择最佳响应。
○ 条件 2. 玩家 2 不知道 t，必须根据期望值进行选择。

⑵ 示例> ① 问题设置：概率为1/3，t = −1；概率为 2/3，t = 3。只有玩家 1 知道 t（单例）的值。

② 范式表示

表 8. 贝叶斯博弈的范式表示

③ 扩展形式：根节点称为机会节点。请注意，它仅适用于玩家 1。

图 4. 贝叶斯博弈的扩展形式

④ 策略概况表示法：如果 t = −1 意味着选择 H，则将其写为 H₋₁（或原表示法中的 H1），依此类推。

⑤ 确定玩家 1 的最佳反应

○ 如果 t = −1，玩家 1 应该始终选择 S：放弃涉及 H₋₁ 的策略。
○ BNE 候选人：((S₋₁, H₃), H), ((S₋₁, H₃), S), ((S₋₁, S₃), H), ((S₋₁, S₃), S)
○ ((S₋₁, H₃), H)：最佳响应（OK）
○ ((S₋₁, H₃), S)：最好切换到((S₋₁, S₃), S)
○ ((S₋₁, S₃), H)：最好切换到((S₋₁, H₃), H)
○ ((S₋₁, S₃), S)：最佳响应（OK）

⑥ 确定玩家 2 的最佳反应

○ 评估 ((S₋₁, H₃), H)
○ 评估 ((S₋₁, S₃), S)

⑦ 结论：BNE 为 ((S₋₁, H₃), H) 和 ((S₋₁, S₃), S)。

6。承诺的经济学（承诺）

⑴ 定义：为证明实施威胁的可信意图而采取的行动。

⑵ 目的是让对手相信你必须坚持所威胁的行动，即使这显然也会伤害你。

⑶【政策博弈论】(https://jb243.github.io/pages/2043)

发布时间: 2020-04-22 13:27

6914