第 14-10 章。 Cochran-Mantel-Haenszel (CMH) 测试
推荐阅读:【统计】第14章【统计测试】(https://jb243.github.io/pages/1631)
1. 概述
2. 推导
3. 解释
1.概述
⑴定义:一种统计检验方法,用于确定两个变量X和Y之间的关系是否可以通过基于第三个变量的分层得到更好的解释
⑵ 零假设 H0 : 给定层的 X 和 Y 之间的相关性与没有层的相关性没有区别(条件独立)
⑶ 例如,可以测试按年龄对治疗和反应之间的相关性进行分层是否可以提供更重要的解释
⑷ 分层通常是分类数据,但可以通过分箱到区间来应用连续数据
2.推导
⑴ 假设(X,Y)作为N对观测数据存在
⑵ 假设观测数据通过第三个变量(如:年龄)分层为K层 : 定义每层观测数据的个数为Nk
⑶ 定义第k层的概率变量为(Xk,Yk),将该层中的数据表示为(x1k,y1k),…,(xNk,yNk)
⑷ 定义Tk如下
⑸ 定义CMH统计量如下
⑹ ρs的方差 : 可用于统计区间估计
3.口译
⑴CMH统计量或M2
① 如果 M2 足够大且 p 值较低,则表明两个变量之间的相关性在各层中不同
② M2统计量本身不仅取决于变量之间的加权相关性,还取决于样本量
③ 例如,如果没有分层,M2=ρ2(N-1)(其中ρ为整体皮尔逊相关系数)
⑵ SCC(层调整相关系数)或ρs
① 使用ρs代替M2作为两个变量之间的加权相关系数,考虑分层
⑶ -1≤ρs≤1
① ρs = 1 : 完美正相关
② ρs = -1 : 完美负相关
③ ρs = 0 : 无相关性
⑷ 应用. HiCRep : 在评估一对Hi-C生物信息学数据之间的相似性时,检查接触矩阵的相关系数的距离依赖性
图 1. HicRep
输入:2024.10.13 23:27