每次点击Amos的"Calculate estimates"按钮后,面对Output窗口里密密麻麻的拟合指标,你是否感到无从下手?卡方值、GFI、CFI、RMSEA...这些数字究竟在告诉我们什么?更让人困惑的是,不同指标有时会给出相互矛盾的结论——就像一群专家各执己见,让你不知该听谁的。本文将带你穿透这些统计迷雾,建立一套清晰的拟合度评估体系,让你不再被Amos的输出选项牵着鼻子走。
Amos提供的拟合度指标实际上是从三个不同维度评估模型:绝对拟合、相对拟合和简约拟合。就像医生用多种检查手段综合判断健康状况一样,我们需要综合这些指标才能全面评价模型质量。
绝对拟合指标直接比较样本数据与理论模型的匹配程度,是最直观的"体检报告":
卡方检验(χ²):最传统的拟合检验,但存在样本量敏感性问题。计算公式为:
math复制χ² = (n-1)F_{ML}
其中n为样本量,FML是最大似然拟合函数。实践中我们更关注:
GFI(拟合优度指数):类比线性回归中的R²,反映模型解释的方差比例。理想值>0.9,计算公式:
math复制GFI = 1 - \frac{\text{tr}[(Σ^{-1}S - I)^2]}{\text{tr}[(Σ^{-1}S)^2]}
RMSEA(近似误差均方根):考虑模型复杂度的惩罚指标,对错误设定敏感。优秀模型应<0.05,计算公式:
math复制RMSEA = \sqrt{\frac{F_0}{df}} \quad \text{其中} F_0 = \max\left(\hat{F} - \frac{df}{n-1}, 0\right)
注意:绝对指标容易受样本量影响,大样本时χ²几乎总会显著,而小样本时GFI可能虚高。
相对拟合指标将你的模型与一个最差的"独立模型"(假设所有变量无关)进行比较:
| 指标 | 计算公式 | 理想标准 | 特点 |
|---|---|---|---|
| CFI | 1-(χ²ₘ-dfₘ)/(χ²ₙ-dfₙ) | >0.9 | 对样本波动稳健 |
| NFI | (χ²ₙ-χ²ₘ)/χ²ₙ | >0.9 | 受样本量影响明显 |
| TLI | (χ²ₙ/dfₙ - χ²ₘ/dfₘ)/(χ²ₙ/dfₙ -1) | >0.9 | 惩罚复杂模型 |
(注:下标m表示目标模型,n表示独立模型)
好模型不仅要拟合好,还要简洁。Amos中常用的简约指标包括:
PGFI(简约拟合优度):GFI的简约版本,调整公式为:
math复制PGFI = GFI \times \frac{df}{p(p+1)/2}
其中p为观测变量数
AIC/BIC:基于信息准则的指标,适用于模型比较而非绝对评估。计算公式:
math复制AIC = χ² + 2k \quad BIC = χ² + k\ln(n)
其中k为估计参数个数
点击Analysis Properties→Output时,面对23个可选指标,资深研究者通常会采用分阶段策略:
text复制☑ Minimization history # 检查迭代收敛
☑ Standardized estimates # 解释标准化系数
☑ Squared multiple correlations # 查看R²
☑ Indirect, direct & total effects # 分析效应分解
☑ Model fit # 核心拟合指标
text复制☑ Modification indices # 模型修正参考
☑ Expected change # 配合MI使用
☑ Critical ratio for differences # 参数差异检验
text复制□ Bootstrap standard errors # 仅需稳健标准误时启用
□ Factor score weights # 特殊分析需求才需要
提示:不要盲目勾选"Modification indices",它可能引导你过度拟合数据。建议只在理论支持下考虑模型修正。
实践中经常遇到这种情况:CFI=0.92(良好)但RMSEA=0.08(一般),该如何判断?这时需要分情况处理:
大样本情境(n>500):
小样本情境(n<200):
当绝对指标 vs 相对指标冲突时:
当简约指标 vs 拟合指标冲突时:
mermaid复制graph TD
A[所有指标达标?] -->|是| B[模型可接受]
A -->|否| C{RMSEA与CFI冲突?}
C -->|是| D[检查模型误设]
C -->|否| E{样本量>500?}
E -->|是| F[侧重RMSEA]
E -->|否| G[侧重CFI]
当数据严重偏离多元正态时(通过Amos中的"Test for normality"检查),需要调整策略:
text复制☑ Bootstrap
☑ Robust statistics
当模型包含分类变量时(如李克特量表):
text复制☑ Thresholds
☑ Weighted estimates
进行跨组恒等性检验时:
text复制☑ Multiple group comparisons
☑ Invariance testing
即使所有指标都"漂亮",模型也可能存在问题。我曾分析过一个客户满意度模型,CFI=0.96、RMSEA=0.04,但细查发现:
这时需要坚持:
最终,好的模型评估应该像法庭审判:统计指标是证据,但需要理论逻辑作为法律框架来做出最终判决。Amos的输出选项只是工具,真正的智慧在于研究者如何解读和运用这些信息。