第 14-7 章。柯尔莫哥洛夫-斯米尔诺夫检验
推荐帖子:【统计】第14章【统计测试】(https://jb243.github.io/pages/1631)
1.一般柯尔莫哥洛夫-斯米尔诺夫检验
⑴ 定义样本(即经验)分布函数如下: 阶跃函数形式
⑵ 双边 Kolmogorov-Smirnov 检验当跟随值较大时拒绝原假设
图 1. Kolmogorov-Smirnov 检验统计量
⑶原假设
① D 的零分布不依赖于 F0(假设是连续的),这针对各种样本大小 n 总结在表格中
② 换句话说,零假设是两个概率分布 F̂ 和 F0 相同。
⑷ 理论:在原假设下,√n D 渐近(n→∞)服从布朗桥最大绝对值分布
⑸ 模拟:可以通过蒙特卡罗模拟计算p值
① 实际中,由于零分布下D的分布不依赖于F0,因此每个样本量只需要执行一次
② 例如F0可以设置为Unif(0, 1)
2.参数柯尔莫哥洛夫-斯米尔诺夫检验
⑴ 检验统计量定义如下
⑵ p值通常通过参数引导程序来估计:这里,F̂和θ̂是针对每个引导程序样本重新计算的
⑶ 当𝒢是正态分布族时:即测试给定的分布是否服从正态分布时(正态性检验)
① 此检验通常称为 Lilliefors 正态性检验
② 上述检验统计量可以针对族内的所有分布进行调整,这是通过蒙特卡洛模拟进行的
③ 因此,这个检验统计量的零分布总结在一个表格中
④ R 代码:
ks.test(dat, "pnorm", mean=mu, sd=sigma)
⑷ 同样的逻辑适用于其他位置规模族的分布
① 这里,G0 是在实数集 ℝ 上定义的给定分布
② 位置:平均值、中位数、分位数/百分位数等
③ 量表:标准差、中位绝对差等
3. 克拉梅尔-冯·米塞斯测试
⑴ 柯尔莫哥洛夫-斯米尔诺夫检验的一种变体
⑵ 当以下值较大时,Cramér-von Mises 检验拒绝原假设:
① f0(x) = dF0(x)/dx 是原假设下的概率密度函数(PDF)。
② 与MSE(均方误差)类似地制定方程。
⑶ 这有一个简单的封闭式表达式,不需要积分:
① 这里,X(1) ≤ ⋯ ≤ X(n) 是有序样本,称为有序统计量。
② D 的零分布不依赖于 F0,已制成表格。
③ 渐近零分布也是已知的,但比较复杂。
④ 因此,可以使用蒙特卡罗模拟来计算 p 值。
4. Kolmogorov-Smirnov 二样本检验
⑴ (单方面的) Kolmogorov-Smirnov 检验拒绝较大的值
⑵ 理论
① 利用一些递推公式可以准确有效地计算出 Dm,n+ 的分布。
② 在大样本限制下
③ 这恰好是与样本量 ⎣ mn / (m+n) ⎦ 的单样本情况相同的极限分布。
5。柯尔莫哥洛夫-斯米尔诺夫独立性测试
⑴ 概述
① 本着柯尔莫哥洛夫-斯米尔诺夫检验的精神,Hoeffding (1948) 以及后来的其他人提出了基于经验 CDF 的独立性检验。
② 特征 1. 如果 X 和 Y 连续,则检验是无分布的。渐近分布也以封闭形式已知。
③ 特征 2. 该测试与独立性的任何替代方案普遍一致。
⑵ 统计
①原假设H0:两个随机变量是独立的。
② 对于较大的 H 值,测试会被拒绝。
③ FnX 是 X1、…、Xn 的经验 CDF。
④ FnY 是 Y1、…、Yn 的经验 CDF。
⑤ FnXY 是 (X1, Y1), ···, (Xn, Yn) 的联合经验 CDF。
输入:2025.03.23 18:32