Korean, Edit

第二讲.博弈论(博弈论)

推荐阅读:微观经济学微观经济学目录

1. 概述
2. 同时进行的比赛
3. 顺序游戏
4. 混合策略游戏
5. 贝叶斯游戏
6. 承诺的经济学

两盘平衡问题与博弈论

📃【信任游戏的演变】(https://jb243.github.io/pages/1111)


1.概述

玩家:参与博弈的经济主体(例如企业、消费者)。

策略:描述每个玩家将采取什么行动的计划。

收益:每个玩家因策略选择而获得的效用(即游戏结果)。

uᵢ:玩家i的效用(收益)
sᵢ:玩家i的策略
s₋ᵢ:玩家 1, 2, ···, i−1, i+1, ···, n 的策略
④ 通常以表格形式表示,即收益矩阵

策略概要:元组(s₁,…,sₙ)。

游戏:由玩家、所有可行策略和收益组成的集合。

博弈论:寻找策略概况的理论。

BR(最佳回应)

定义:对于一个玩家来说,固定其他玩家的策略,使该玩家的效用最大化的策略。
② 一个玩家可能有多个最佳反应(平局),因此 BR 不必是唯一的。

纳什均衡(NE)

定义:策略概况,其中每个玩家的策略都是最佳响应。
② 也就是说,任何玩家都无法通过单方面改变自己的选择而获益。
③(注)约翰·纳什:1994年诺贝尔经济学奖获得者;电影《美丽心灵》的主角。

占优策略均衡(DSE)

定义:所有玩家选择他们的主导策略的策略配置文件。
② 缺点是现实中并不常见。
主导策略:无论其他玩家的策略如何,都能最大化玩家效用的策略。
定理1. DSE ⊂ NE
定理2. 即使不存在占优策略均衡,纳什均衡仍然可能存在。

原因:纳什均衡的条件较弱(限制较少)。

优化理论与博弈论

表 1. 优化理论与博弈论


2.同步游戏(同时游戏)

假设:合作是不可能的,游戏只玩一次。

表示 1. 范式表示

示例1. 匹配/不匹配游戏

表 2. 匹配/不匹配游戏

○ 每个单元格“#,#”中,第一个数字是玩家 1 的效用,第二个数字是玩家 2 的效用。
○ πᵢ(sᵢ, s₋ᵢ) 表示当玩家 i 选择 sᵢ 而其他玩家选择 s₋ᵢ 时,玩家 i 获得的效用。
○ 检查所有最佳答案 (BR) 并在表中标记如下。

表 3. 标记 BR 的匹配/不匹配游戏

○ BR₁(A ∈ S2) = B ∈ S₁
○ BR₁(B ∈ S2) = A ∈ S₁
○ BR2(A ε S₁) = A ε S2
○ BR2(B ε S₁) = B ε S2

○ 由于没有两个收益都带有下划线的单元格,因此不存在纳什均衡。> ② 示例2. 双寡头定价博弈

表 4. 双寡头定价博弈

○ 每个单元格“#,#”中,第一个数字是玩家 1 的效用,第二个数字是玩家 2 的效用。
○ πᵢ(sᵢ, s₋ᵢ) 表示当玩家 i 选择 sᵢ 而其他玩家选择 s₋ᵢ 时,玩家 i 获得的效用。
下划线方法:勾选所有BR,并相应划线。

表 5. 标记 BR 的双头垄断定价博弈

○ BR₁(L ∈ S2) = L ∈ S₁
○ BR₁(H ∈ S2) = L ∈ S₁
○ BR2(L ε S₁) = L ε S2
○ BR2(H ε S₁) = L ε S2

纳什均衡:(s₁, s2) = (L, L)
DSE: (s₁, s2) = (L, L)

○ 玩家 1 的占优策略是 L (因为 BR₁(L ∈ S2) = L ∈ S₁ 且 BR₁(H ∈ S2) = L ∈ S₁)
○ 玩家 2 的占优策略是 L (因为 BR2(L ∈ S₁) = L ∈ S2 且 BR2(H ∈ S₁) = L ∈ S2)

表示2.博弈树(扩展形式):每个节点称为决策节点

图 1. 同步游戏的扩展形式
(设定与双寡头游戏相同。)


3。顺序游戏(顺序游戏)

概述

特征1.单代理决策问题

定义:一种情况是,一个玩家可以完全独立另一位玩家的行为来决定自己的策略。
○ 在典型的同时游戏中,一个玩家会受到另一个玩家策略的影响,因此不符合定义。
○ 在序列博弈中,先动者拥有主动权,因此对应于单智能体决策问题。
○(注)如果一方的策略不起作用,同时博弈也可以是单智能体决策问题。

特征2. 与同时博弈不同,顺序博弈将行动行动计划区分开来。

示例

连续博弈的正常形式表示:可能包括不切实际的纳什均衡。

表 6. 顺序博弈的标准形式表示

设置:硬件厂商先动;软件公司随后搬迁。
○ (HH, HS)的含义:一种软件策略——如果硬件选择H则选择H,如果硬件选择S则选择H。
○ (S, (SH, SS)) 是一个不切实际的解决方案(因为硬件公司自然会选择 H)。

顺序博弈的扩展形式表示:不包括不切实际的纳什均衡。

图 2. 序列博弈的扩展形式

③(评论)一个重要的特征是,与同时游戏不同,这两种表示方法对于顺序游戏可能不同。

适当的子游戏

信息集:玩家可能所在的节点集合。

○ 在图1中,玩家2的信息集由单个节点组成。
○ 在图2中,玩家2的信息集由两个节点组成。

真子博弈:在扩展博弈中,根为单例信息集的子树。

○ 即,包含在较大游戏中的独立游戏。
图2共有三个正确的子游戏。

特征1. 任何游戏都包含其自身作为子游戏。
特征2. 一场同时进行的游戏只有一个子游戏。
特征3. 由于根决策者是单个参与者,因此它是单代理决策问题的特例。

SPE(子博弈完美均衡)> ① 定义:策略概况,是每个适当子博弈中的纳什均衡。

②(注)对于同时进行的游戏,NE概念相关;对于顺序博弈,完美均衡概念是相关的。
特性1. SPE必须是NE。
特性 2. NE 不必是 SPE。

原因:适当的子博弈消除了不切实际的纳什均衡。
○(评论)适当的子博弈可以被视为一种通过扩展形式求解的方法,从而避免不切实际的结果。

前向归纳法:一种自上而下的求SPE的方法。

1st. 查找所有 NE。

○ 在上例中,您可以找到(H, (HH, HS))、(H, (HH, SS))、(S, (SH, SS))。

第二. 检查每个子博弈中是否每个都是 NE。

○ (H, (HH, HS)):不合适,因为在下面的子博弈中硬件选择S,软件选择H。
○ (H, (HH, SS)):这是一个 SPE。
○ (S, (SH, SS)):不合适,因为在下面的子博弈中硬件选择 H,软件选择 S。

逆向归纳法:自下而上寻找SPE的方法。

1st. 在扩展形式的顺序博弈中,从叶子开始向上寻找第一个单例信息集。
第二. 在每个正确的子游戏中找到 NE。
3rd. 上移至第二个单例信息集。
4th. 在每个正确的子游戏中找到 NE 并对其进行适当标记。
第5. 重复步骤③–④,直到到达游戏的根部。

⑥ 示例

图 3. 逆向归纳示例
(H, (HH, SS)) 是 SPE。


4。混合策略游戏

定义:策略是按概率选择的。

特征:最佳响应根据概率参数而变化。

示例

表 7. 混合策略游戏示例

条件 1. 玩家 1 以概率 ω 选择 H,以概率 1−ω 选择 S。
条件 2. 玩家 2 以 h 的概率选择 H,以 1−h 的概率选择 S。
BR(最佳响应):理解为是对对手参数h或ω的响应。
④ 纳什均衡解一共有三个。


5。贝叶斯游戏

概述

不完整信息:至少有一个玩家不知道其他玩家所有可能情况的收益。
贝叶斯博弈:基于不完全信息的博弈。

○ 混合策略游戏将概率分配给动作,而贝叶斯游戏使用概率来推断信息

BNE(贝叶斯纳什均衡):对于两个玩家,策略配置文件 (s₁(t), s2) 满足:

条件 1. 知道 t 的玩家 1 必须选择最佳响应。
条件 2. 玩家 2 不知道 t,必须根据期望值进行选择。

示例> ① 问题设置:概率为1/3,t = −1;概率为 2/3,t = 3。只有玩家 1 知道 t(单例)的值。

② 范式表示

表 8. 贝叶斯博弈的范式表示

③ 扩展形式:根节点称为机会节点。请注意,它仅适用于玩家 1。

图 4. 贝叶斯博弈的扩展形式

④ 策略概况表示法:如果 t = −1 意味着选择 H,则将其写为 H₋₁(或原表示法中的 H1),依此类推。

⑤ 确定玩家 1 的最佳反应

○ 如果 t = −1,玩家 1 应该始终选择 S:放弃涉及 H₋₁ 的策略。
BNE 候选人:((S₋₁, H₃), H), ((S₋₁, H₃), S), ((S₋₁, S₃), H), ((S₋₁, S₃), S)
○ ((S₋₁, H₃), H):最佳响应(OK)
○ ((S₋₁, H₃), S):最好切换到((S₋₁, S₃), S)
○ ((S₋₁, S₃), H):最好切换到((S₋₁, H₃), H)
○ ((S₋₁, S₃), S):最佳响应(OK)

⑥ 确定玩家 2 的最佳反应

○ 评估 ((S₋₁, H₃), H)
○ 评估 ((S₋₁, S₃), S)

结论:BNE 为 ((S₋₁, H₃), H) 和 ((S₋₁, S₃), S)。


6。承诺的经济学(承诺)

定义:为证明实施威胁的可信意图而采取的行动。

⑵ 目的是让对手相信你必须坚持所威胁的行动,即使这显然也会伤害你。

⑶【政策博弈论】(https://jb243.github.io/pages/2043)

发布时间: 2020-04-22 13:27

results matching ""

    No results matching ""