Korean, Edit

第 20 章回归分析的方差分析

高级类别:【统计】【统计概述】(https://jb243.github.io/pages/1641)


1. 简单线性回归分析的方差分析

2. ANCOVA



1.简单线性回归分析的方差分析 

⑴ 问题情况


年龄(岁) 螨虫数量  
3 5  
6 13  
9 16 16
12 12 14 14
15 15 18 18
18 18 23 23
21 21 20  
24 32 32
27 27 29 29
30 28 28

表1.简单线性回归分析的方差分析


⑵【t统计量】表(https://jb243.github.io/pages/1629#4-students-t-distribution) 


因素 系数 标准错误 t 意义  
拦截 5.733 5.733 2.265 2.265 2.531 2.531 0.035 0.035
年龄 0.853 0.853 0.122 0.122 7.006 7.006 0.001 0.001

表2.t统计量表


绘图


⑶ F统计量表


因素 平方和 df 均方 F 意义
回归 539.648 1 539.648 49.086 49.086 < 0.001
剩余 87.952 87.952 8 10.994 10.994    
总计 627.600 627.600 9      

表3.F统计量表


①原假设H0 回归线的斜率等于0 

②思路如果回归的MS>残差的MS,则回归线的斜率不为零 

③计算


绘图


④回归线的自由度之所以为1因为回归变量只有一个

⑷ F统计量比t统计量显示功效更大的原因 F统计量的p值较小 

① F统计量比t统计量使用更多的信息

② 由于样本量较大的影响,F 统计量显示出更大的功效



2.协方差分析

⑴概述

① 简单线性回归分析与单向方差分析融合的概念

②必要性在实际问题情况下,由于一个因素的混杂效应,第二个因素发生变化,会影响因变量

③ 与双向方差分析的区别 ANCOVA 技术不与某些 ANOVA 技术竞争。 ANOVA 和 ANCOVA 可以同时进行

⑵ 问题情况

①自变量是否为污染矿区

② 因变量 大鼠器官中的铅浓度

③混杂效应年龄

⑶ 不考虑年龄的结果表


因素 平方和 自由度 均方 F 比
治疗 SS治疗 k-1 MS 处理 = SS 处理 / (k-1) F = MS 治疗/MS 错误
错误 SS 错误 N-k MS 误差 = SS 误差 / (N-k)  
总和 SS 总计 N-1    

表 4. 简单单向方差分析结果表 


①如果不控制年龄效应,残差变大

② 随着残差增大,MS Error增大,F比减小

③随着F比的降低,功效也降低换句话说,很难证明治疗的意义

⑷ 假设

①同方差性

② 独立性

③常态

④ 协变量和因变量之间的关系应该是线性的

⑤ 并行度» ○ 例如,计算每个污染矿区和非污染区的回归线时,斜率相同

○ 满足并行性与没有交互是一样的 

○ 如果不满足并行性,则比较一个选定值(例如年龄的总体平均值)的差异不能代表整个协变量范围


绘图

图 1. ANCOVA 中缺乏并行性的示例


○ 在ANCOVA之前,应评估年龄和地区的相互作用以确认平行性

⑸ 程序

① 第一第一。确认年龄和铅浓度之间的相关性


绘图

图 2. 年龄与铅浓度之间的相关性


② 第二第二。证实年龄和地区的交互作用不具有统计显着性 


因素 平方和 自由度 均方 F 比 p值
年龄          
网站          
年龄 × 地点         NS
错误          
总计          

表 5. 结果表,包括交互项


③ 第三。根据年龄计算铅浓度回归线 


绘图

图3.铅浓度随年龄的回归线


④ 第 4。根据第 3rd 步获得的回归线计算满足以下条件的两条回归线 


绘图

图 4. 两条回归线的计算


○ 对于从第 3rd 步骤获得的回归线,仅更改 y 截距,同时保持回归线的斜率 

○ 最小化每个自变量水平的平方和  

⑤ 第 5。计算第 4 步获得的每条回归线的残差


绘图

图5.残差计算


⑥ 第六th。计算出整个组的平均年龄后,将该值的每条回归线的函数值指定为标准值

○ 整个群体的平均年龄只是一个例子,它的值是多少并不重要。


绘图

图6.标准值的计算


⑦7th。将第 5 步向上和向下获得的残差标记为每个治疗组的标准值


绘图

图 7. 最终结果


⑧ 第 8。最后,可以看到SS Error更小了 p值更小了


绘图

图。 8.结果对比


⑹ 结果

①修正结果


绘图

图9.污染矿区的铅浓度


绘图

图10.非污染矿区铅浓度


② 修正前结果表


因素 平方和 自由度 均方 F 比 p值  
网站 320 320 1 320 320 2.74 2.74 0.115 0.115
错误 2100.8 2100.8 18 18 116.71      
总计 2420.800 19 19        

表6.校正前结果表


③校正后结果表可以从回归线计算年龄的平方和


因素 平方和 自由度 均方 F 比 p值
年龄 1776.290 1776.290 1 1776.290 1776.290 93.054 93.054 < 0.001
网站 1094.335 1 1094.335 57.329 57.329 < 0.001
错误 324.510 17 17 19.089 19.089    
总计 2420.800 19 19      

表7.校正后结果表


④ 报告示例 : “平行性的初步分析表明,铅浓度线的斜率与年龄的关系没有显着差异(年龄 × 地点: F1,16 = 0.00, NS)。随后的 ANCOVA 显示地点的显着影响(F1,17 = 57.329,P < 0.001)以及协变量(年龄)的显着影响(F1,17 = 93.054, P < 0.001) 矿区大鼠的铅含量高于对照组。

⑺ 未将污染矿区回归线y轴截距与其他区域回归线y轴截距进行比较的原因

①情况如果满足并行性,比较y截距就容易多了 

② 比较 y 截距类似于比较样本组只有一个样本

③ 因为 ANCOVA 采用总误差项,ANCOVA 类似于比较具有给定样本组大小两倍的元素的样本组 

④ 因此,执行 ANCOVA 比简单比较 y 截距具有更高的功效

应用1. 2因素ANCOVA 

① 在分析2-way ANOVA时应用ANCOVA技术

② 示例当自变量为性别和药物治疗,因变量为血压,混杂因素为年龄时  

应用2. 如果存在多个混杂因素  

①采用多元线性回归分析 

② 也可以使用【高级回归分析】(https://jb243.github.io/pages/1792)



输入:2019.12.07 23:04

results matching ""

    No results matching ""