作为一名长期使用R、Amos和SPSS进行数据分析的研究者,我经常需要处理重复测量设计的实验数据。混合模型方差分析(Mixed Model ANOVA)是这类数据的标准分析方法之一,而球形假设(Sphericity)的检验是其中关键但容易被忽视的环节。
球形假设是指在一个重复测量设计中,所有处理水平之间差异的方差应该相等。换句话说,如果我们有k个处理水平,那么这k个水平两两之间差异的方差应该相同。这个假设特别适用于被试内因素(within-subjects effects)的分析。
举个例子,假设我们研究三种教学方法对学生成绩的影响,每个学生都接受了这三种方法的教学。那么方法A与方法B的差异方差、方法A与方法C的差异方差、方法B与方法C的差异方差,这三个方差值应该大致相同。
提示:球形假设类似于独立样本t检验中的方差齐性假设,但应用于重复测量设计的差异方差。
当球形假设不满足时,F检验会变得过于宽松,增加犯第一类错误(假阳性)的风险。具体来说:
在我的实践中,特别是在心理学和教育学研究中,球形假设被违反的情况相当常见。因此,检验这一假设并采取适当校正措施是数据分析的必要步骤。
莫奇利球形检验(Mauchly's Test of Sphericity)是检验球形假设是否成立的常用方法。它的基本逻辑是:
检验统计量W近似服从卡方分布,通过p值来判断是否拒绝原假设。
在实际分析中,我们会遇到两种情况:
r复制# R中示例输出
Mauchly's Test for Sphericity
W p-value
factor1 0.876 0.124
r复制# R中示例输出
Mauchly's Test for Sphericity
W p-value
factor1 0.632 0.018
注意:莫奇利检验对正态性假设比较敏感。当样本量较小时,检验功效可能不足;而样本量很大时,即使轻微的球形偏离也可能导致显著结果。
当莫奇利检验显著时,我们需要对自由度进行校正。常用的校正方法有三种:
其中,ε(epsilon)是衡量球形偏离程度的指标,范围在1/(k-1)到1之间。
在我的实践中,选择校正方法的经验法则是:
r复制# R中anova_test()函数的典型输出
Effect DFn DFd F p p<.05 ges eps
factor1 1.34 26.82 15.6 0.000 * 0.32 0.67
上例中,eps=0.67表示Greenhouse-Geisser的ε估计值,由于小于0.75,因此采用G-G校正后的自由度(DFn=1.34, DFd=26.82)。
在R、SPSS和Amos中,球形检验的实现略有不同:
R语言:
car包中的Anova()函数afex包中的aov_car()或aov_ez()ez包中的ezANOVA()r复制# 使用afex包的示例
library(afex)
result <- aov_ez(
id = "Subject",
dv = "Score",
data = mydata,
within = "Condition"
)
anova(result, correction = "GG")
SPSS:
Amos:
样本量问题:
多重比较校正:
数据转换:
缺失数据处理:
当数据严重违反球形假设且校正后结果仍不理想时,可考虑以下替代方法:
MANOVA不依赖球形假设,但:
线性混合模型(LMM)或广义混合模型:
r复制# 使用lme4包的混合模型示例
library(lme4)
model <- lmer(Score ~ Condition + (1|Subject), data = mydata)
summary(model)
当数据严重偏离正态性时:
在论文或研究报告中,应清晰透明地报告球形检验结果:
示例报告格式:
"Mauchly球形检验表明数据违反球形假设(W=0.68, p=0.02),因此采用Greenhouse-Geisser校正(ε=0.72)。校正后的分析显示条件主效应显著,F(1.44, 28.8)=9.32, p=0.002。"
在实际分析中,我发现许多研究者忽视了球形检验的重要性,直接报告未校正的结果。这种做法可能增加假阳性风险。根据我的经验,在教育学和心理学研究中,约60-70%的重复测量数据会不同程度地违反球形假设,因此必须进行检验和适当校正。
最后分享一个实用技巧:在R中,使用afex包可以一次性获得球形检验、校正结果和效应量,大大简化分析流程。同时,建议在预分析阶段就检查球形假设,以便有足够时间考虑替代分析方法。