第 3 章. 递增序列和柯西序列
推荐帖子:【分析】【分析目录】(https://jb243.github.io/pages/1829)
1. 收敛性和基本性质
2. 柯西序列
1.序列的收敛性和基本性质
⑴ 实数序列(an)n∈ℕ收敛到实数a意味着什么
① 对于 N ∈ ℕ,对于所有 n > N
② 对于每个正 ε,存在一个 N,最终ㅣ an - a ㅣ < ε
⑵ 给定一个序列(an)和一个递增的自然数序列n1<n2<···,新序列(ank)k∈ℕ称为(an)的子序列。
⑶ 练习: 证明以下结论。
① 如果最终an = a,则(an)收敛于a。
② 如果 (an) 收敛于 a,则集合 {an} 有界。
③ 假设(an) → a 和(bn) → b。如果最终 an ≤ bn,则表明 a ≤ b。
④ 如果 (an) → a 并且最终 an ≤ b,则 a ≤ b。
⑤ 如果 (an) → a 并且 (an) → b,则 a = b。也就是说,收敛序列的极限是唯一的。
⑷ 练习: 证明以下内容。
① 如果(an) → a,则每个子序列(ank)也收敛于a。
② 序列(1/n)收敛于0。
⑸ 练习: 证明以下内容。
① 当 0 < p < 1 时,序列 (pn) 收敛于 0。
② an, a ∈ ℝ −{0} 且若 a 是 (an) 的极限,则证明以下成立。
⑹ 练习: 证明以下内容。
① 序列 (an) = (1, 0, 1, 0, …) 不收敛。
② 如果a是(an)的极限,b是(bn)的极限,则证明以下成立。
⑺ 练习: 证明以下内容。
① 递增序列的收敛性:若a1 ≤ a2 ≤ ···且(an)有界,则证明(an)收敛。对于递减序列你能得出同样的结论吗?
② 设两个序列 (an) 和 (bn) 满足 a1 = 1, b1 = 2 且
并让
成立。表明两个序列收敛。
⑻ 练习: 令序列 (an) 有 a1 = 3 并且对于每个 n ∈ ℕ,定义
证明 (an) 收敛。它收敛于什么?
2.柯西序列
⑴ 柯西序列的定义
① 对于 N ∈ ℕ,对于所有 n,m > N> ② 实序列 (an) 是柯西序列,如果对于每个 ε > 0,存在一个 N,使得最终ㅣ an - am ㅣ < ε
⑵ 对于ℝ2中的向量序列((an, bn))n∈ℕ收敛到向量(a, b)是一样的
和
分别。
⑶ 定义无穷级数I如下:
对于实序列(an),说无穷级数I收敛到A,意味着部分和序列(An)收敛到A。这里An = a1 + ··· + an。
⑷ Bolzano-Weierstrass 定理:如果一个实数序列(an)有界,则它有一个收敛子序列。我们可以对 ((an, bn))n∈ℕ 说同样的话吗?
⑸ 练习: 证明如果 (an) 是柯西序列,则它收敛。
⑹ 练习: 如果
然后
成立。证明这一点。
⑺ 练习: 找一个(an)的极限为0但无穷级数I不存在的例子。
⑻ 练习: 对于实数 r,几何级数恰好在什么时候
收敛?
⑼ 练习: 令实数序列a1, a2, a3,…对于每个n满足an ≥ 0。证明无穷级数
当且仅当部分和序列 (An) 有界时收敛。
⑽ 练习: 如果无穷级数
收敛,证明无穷级数
也收敛。
⑾ 练习: 令序列 (an) 由 a1 = 1 定义,并且对于每个 n ∈ ℕ,定义
证明 (an) 收敛。它收敛于什么?这个极限可以用连分数表示吗?
○ 解决方案
通过数学归纳法,a2n 和 a2n-1 可以证明是递增序列。
此外,由于 an < 2,因此序列 (an) 是有界的。
递增有界序列收敛;因此 (a2n), (a2n-1) 收敛。» 从接下来的步骤中可以看出,(a2n) 和 (a2n-1) 的极限是相同的,因此 (an) 收敛。
设 a 为 (an) 的极限;然后我们有以下内容。
连分数表示如下。
3。示例:最佳停止序列和柯西序列
⑴ 定理1. ㅣmaxx f(x) - maxx g(x)ㅣ ≤ maxxㅣf(x) - g(x)ㅣ
⑵ 定理2. 若 Vt(i) = max{r(i), a + bΣj∈S ℙ(j ㅣ i) Vt+1(j)} = max{r(i), a + b𝔼[Vt+1(j) ㅣ i]},则Vt(i) ≥ Vt+1(i) 成立
① 证明1. 代数证明:使用【数学归纳法】(https://www.youtube.com/watch?v=t9RBuyBmFdQ)(逆向归纳法)
② 证明2. 组合证明:同样使用数学归纳法。在后向归纳设置中,如果 Vτ(i) ≥ Vτ+1(i) 对于 τ = t+1, …, T-1 成立,而重复模式在每个 τ 处重复出现,那么如果我们在 Vt(·) → VT(·) 的轨迹上的任何一步强制选择“现状”,则可以使演化与轨迹完全相同从 Vt+1(·) → VT(·)。因此,Vτ(i) ≥ Vτ+1(i) 在 τ = t 时也成立。
③ 注意。 它是最大值这一事实并不是必需的。即使在下一个示例中使用 inf 进行定义,添加额外的阶段也有机会添加非负成本,因此最小化不会使值下降。即Vn(i) ≤ Vn+1(i)(正向归纳)
⑶ 定理3. 如果 Vt(x) = max{-c + p(x)(1 + Vt+1(x-1)) + (1 - p(x))Vt+1(x), Vt+1(x)}, VN+1(x) = 0,则以下成立
① 时间单调性:Vt(x) ≥ Vt+1(x)
○ 证明. Vt(x) = max{·, Vt+1(x)} ≥ Vt+1(x)
② x 中的单调性:Vt(x) ≥ Vt(x-1)
○ 证明。 考虑由(t, x) 形成的网格。检查在 x = 0 时,对于所有 t,我们有 Vt(x) = Vt+1(x)。按照(t, x) = (N+1, 0), ⋯, (N+1, S), (N, 0), ⋯, (N, S), (N-1, 0), ⋯的顺序可以验证上述归纳假设成立。 (如果 S = ∞,则沿对角线遍历。)也就是说,在每个归纳步骤中,我们可以找到 A、B、C、D,使得 A ≤ B、C ≤ D,且 Vt(x-1) = max(A, C) ≤ max(B, D) = Vt(x)。例如,B = -c + p(x)(1 + Vt+1(x-1)) + (1 - p(x))Vt+1(x)。
③ 边际值上限: 1 ≥ Vt(x) - Vt(x-1)» ○ 证明。 考虑在相同的操作序列(每天相同的“查看/跳过”)下运行具有初始粒子计数 x (A) 的世界和具有 x-1 (B) 的世界。如果确实存在 Vt(x) - Vt(x-1) > 1 的点,那么简单地在两个世界中“复制并执行”该策略(无需其他设备)就会为 A 创造超过 B 的超过 1 的稳定超额利润。无限重复这种复制将意味着创造无限利润的可能性,这与这个世界的许多规则(例如对称性)相矛盾。因此,利润差距永远不会超过1。因此,这样的点不存在。
○ 直觉。 直觉上,预期增益不能超过确定增益,因此 Vt(x) - Vt(x-1) 必须 ≤ 确定增益 1。
○ 直觉。 实际上,当您模拟 Vt(x) 时,它不会显示出剧烈振荡的形状。 (∵ ⑥ 存在阈值) 事实上,由 ⑤ 边际值的时间关系可知,Vt(x) - Vt(x-1) 在时间上是单调的。有界单调序列由完备性公理收敛。根据对称性,极限必须恰好为 1,既不大于也不小于 1。
④ x 凹面失效: Vt(x) - Vt(x-1) ≤ Vt(x-1) - Vt(x-2)
○ 反例。 在以下所有三种情况中,x 的凹性均失败。
⑤ 边际值时间关系: Vt(x) - Vt(x-1) ≥ Vt+1(x) - Vt+1(x-1)
○ 证明。 模仿策略:我们说,一个额外粒子的边际值 ΔVτ(x) = Vτ(x) - Vτ(x-1) 随着剩余视野的缩小而减小。由② x 的单调性,我们知道 ΔVτ ≥ 0。假设有两个世界,一个在时间 t (A),一个在时间 t+1 (B)。如果我们强迫 A 等待一步,然后运行与 B 相同的操作序列(每天相同的“查看/跳过”),我们可以获得相同的边际值。但 A 比 B 多一天的自由,因此它可以选择使 Vt(x) - Vt(x-1) 足够大的动作。因此 Vt(x) - Vt(x-1) ≥ Vt+1(x) - Vt+1(x-1)。
○ 显着性。 由①、②、③、⑤,我们可以很容易证明 Sk = {x ㅣ c ≥ p(x)(1 + Vk+1(x-1) - Vk+1(x))},并且 Sk ⊃ Sk+1。作为参考,Sk 是 x 值的集合,其中值函数在第 k 天不变,即选择“停留”。
⑥ 存在阈值:Gt(x) = p(x)(1 - Δt+1(x)) 是 x 的单调递增函数» ○ 证明。 Vt(x) 在 t 中减小,在 x 中增大。因此,在任何给定时间 t,搜索的动机随着 x 的增长而变得更强,并且可以证明在 t 天,仅当 x ≥ xt* 时进行搜索才是最佳的。如果我们定义“stay”当且仅当 Qk(x,stay) < Qk(x,search),那么我们得到 x1* = ··· = xn*。也就是说,对于所有 x ≤ xN*,可以证明 xN-1* = xN* 和 VN-1(x) = VN(x),并且通过对称性,直观地可以看出这一归纳假设得到保留。相反,如果我们定义“stay”当且仅当 Qk(x,stay) ≤ Qk(x,search),那么我们就得到 x1* ≥ ··· ≥ xn* 因为“stay”是弱首选。
○ 证明。 令 Sk = {x ㅣ c ≥ p(x)(1 - Δk+1(x))} = {x ㅣ c ≥ Gt(x)}。当 t = N 时,我们知道 Gt(x) = p(x),它是 x 的单调递增函数。考虑由 (t, x) 形成的网格。按照(t, x) = (N+1, 0), ⋯, (N+1, S), (N, 0), ⋯, (N, S), (N-1, 0), ⋯的顺序,验证上述归纳假设是否成立。 (如果S = ∞,则沿对角线遍历。)假设对于t+1,···,N,我们已经验证了Sk可以写成{0, 1, ···, xk}。如果在(t+1,x)处选择“stay”,那么“look”就没有进一步的增益,因此在(t,x)处我们也选择“stay”。请注意,如果您还有足够的时间,您可以更多地利用“停留”策略。如果在 (t+1, x) 和 (t+1, x-1) 处选择“look”,那么在 (t, x) 处我们可以安全地选择“look”。如果在(t+1,x)处选择“看”但在(t+1,x-1)处选择“停留”,那么在(t,x)处我们可以短暂等待或选择“看”。因此,即使在时间 t,我们仍然有 Sk = {0, 1, ···, xk},并且我们还检查了 xt* ≥ xt+1* 的可能性。将 Sk 写为 {0, 1, ···, xk*} 归纳证明 Gt(x) 是单调递增的。这解释了为什么 Vt(x) 没有表现出剧烈振荡的形状。
○ 证明。 使用不动点的方法:假设我们知道 Sk = {0, 1, ···, xk*}。即 xk* 是 x = p-1(c / p(x)(1 - Δk+1(x))) 的唯一不动点。由于右侧随着 k 的增加而减小,因此固定点变小。因此,xt* ≥ xt+1* 成立。
○ 直觉。 剩下的时间越多,留下来的好处就越大,而观看的好处随着时间的推移大致保持不变。由于停留和观看之间的这种不对称性,停留最佳的状态集随着剩余时间的增加而扩大,而观看最佳的状态集则缩小。
发布时间:2019.12.25 00:53
修改时间:2025.10.25 18:10