第 14-7 章。柯尔莫哥洛夫-斯米尔诺夫检验

推荐帖子：【统计】第14章【统计测试】(https://jb243.github.io/pages/1631)

1. 一般柯尔莫哥洛夫-斯米尔诺夫检验

2. 参数柯尔莫哥洛夫-斯米尔诺夫检验

3. Cramér–von Mises 测试

4. 柯尔莫哥洛夫-斯米尔诺夫二样本检验

5. 柯尔莫哥洛夫-斯米尔诺夫独立性测试

1.一般柯尔莫哥洛夫-斯米尔诺夫检验

⑴ 定义样本（即经验）分布函数如下：阶跃函数形式

⑵ 双边 Kolmogorov-Smirnov 检验当跟随值较大时拒绝原假设

图 1. Kolmogorov-Smirnov 检验统计量

⑶原假设

① D 的零分布不依赖于 F₀（假设是连续的），这针对各种样本大小 n 总结在表格中

② 换句话说，零假设是两个概率分布 F̂ 和 F₀ 相同。

⑷ 理论：在原假设下，√n D 渐近（n→∞）服从布朗桥最大绝对值分布

⑸ 模拟：可以通过蒙特卡罗模拟计算p值

① 实际中，由于零分布下D的分布不依赖于F₀，因此每个样本量只需要执行一次

② 例如F₀可以设置为Unif(0, 1)

2.参数柯尔莫哥洛夫-斯米尔诺夫检验

⑴ 检验统计量定义如下

⑵ p值通常通过参数引导程序来估计：这里，F̂和θ̂是针对每个引导程序样本重新计算的

⑶ 当𝒢是正态分布族时：即测试给定的分布是否服从正态分布时（正态性检验）

① 此检验通常称为 Lilliefors 正态性检验

② 上述检验统计量可以针对族内的所有分布进行调整，这是通过蒙特卡洛模拟进行的

③ 因此，这个检验统计量的零分布总结在一个表格中

④ R 代码：ks.test(dat, "pnorm", mean=mu, sd=sigma)

⑷ 同样的逻辑适用于其他位置规模族的分布

① 这里，G₀ 是在实数集 ℝ 上定义的给定分布

② 位置：平均值、中位数、分位数/百分位数等

③ 量表：标准差、中位绝对差等

3. 克拉梅尔-冯·米塞斯测试

⑴ 柯尔莫哥洛夫-斯米尔诺夫检验的一种变体

⑵ 当以下值较大时，Cramér-von Mises 检验拒绝原假设：

① f₀(x) = dF₀(x)/dx 是原假设下的概率密度函数（PDF）。

② 与MSE（均方误差）类似地制定方程。

⑶ 这有一个简单的封闭式表达式，不需要积分：

① 这里，X₍₁₎ ≤ ⋯ ≤ X_(n) 是有序样本，称为有序统计量。

② D 的零分布不依赖于 F₀，已制成表格。

③ 渐近零分布也是已知的，但比较复杂。

④ 因此，可以使用蒙特卡罗模拟来计算 p 值。

4. Kolmogorov-Smirnov 二样本检验

⑴ (单方面的) Kolmogorov-Smirnov 检验拒绝较大的值

⑵ 理论

① 利用一些递推公式可以准确有效地计算出 D_m,n⁺ 的分布。

② 在大样本限制下

③ 这恰好是与样本量 ⎣ mn / (m+n) ⎦ 的单样本情况相同的极限分布。

5。柯尔莫哥洛夫-斯米尔诺夫独立性测试

⑴ 概述

① 本着柯尔莫哥洛夫-斯米尔诺夫检验的精神，Hoeffding (1948) 以及后来的其他人提出了基于经验 CDF 的独立性检验。

② 特征 1. 如果 X 和 Y 连续，则检验是无分布的。渐近分布也以封闭形式已知。

③ 特征 2. 该测试与独立性的任何替代方案普遍一致。

⑵ 统计

①原假设H₀：两个随机变量是独立的。

② 对于较大的 H 值，测试会被拒绝。

③ F_n^X 是 X₁、…、X_n 的经验 CDF。

④ F_n^Y 是 Y₁、…、Y_n 的经验 CDF。

⑤ F_n^XY 是 (X₁, Y₁), ···, (X_n, Y_n) 的联合经验 CDF。

输入：2025.03.23 18:32

7310