Spearman相关系数：原理、计算与应用实例-代码聚汇网

Spearman相关系数：原理、计算与应用实例

吴前锐

1. Spearman相关系数基础解析

Spearman相关系数（Spearman's rank correlation coefficient）是一种非参数统计方法，用于衡量两个变量之间的单调关系强度。与Pearson相关系数不同，它不要求数据呈正态分布，也不假设变量间呈线性关系，而是基于变量的排序位置进行计算。

在实际应用中，我们经常会遇到这样的场景：比如研究员工工作年限与薪资水平的关系，或者分析城市空气质量指数与呼吸道疾病发病率的相关性。这些情况下，数据可能不满足Pearson相关系数的前提条件，而Spearman相关系数就成为了更合适的选择。

1.1 排序与等级转换原理

Spearman相关系数的核心思想是将原始数据转换为等级数据。具体操作步骤如下：

对变量X的所有观测值进行排序，并赋予等级（从1到n）
对变量Y重复同样的排序和等级赋予过程
当出现相同数值（即存在"结"）时，取这些数值对应位置的平均等级

例如，假设我们有以下身高数据（单位：cm）：
[170, 175, 168, 180, 175]

排序后为：[168, 170, 175, 175, 180]
对应的等级为：[1, 2, 3.5, 3.5, 5]（注意两个175取3和4的平均）

1.2 相关系数计算公式

Spearman相关系数ρ的计算公式为：

ρ = 1 - [6Σd² / (n³ - n)]

其中：

d表示两个变量对应等级的差值
n表示样本量

这个公式实际上是Pearson相关系数应用于等级数据的特例。当数据中不存在相同等级时，这个简化公式非常高效；当存在相同等级时，建议使用标准的Pearson公式计算等级数据的相关性。

注意：当样本量n较小时（通常n<10），Spearman相关系数的抽样分布与正态分布差异较大，此时需要特别谨慎解释结果。

2. 显著性检验的统计原理

计算出Spearman相关系数后，我们需要判断这个相关性是否具有统计学意义。这就是显著性检验要解决的问题。

2.1 假设检验框架

显著性检验的基本框架是：

零假设(H₀)：两个变量间不存在单调相关（ρ=0）
备择假设(H₁)：两个变量间存在单调相关（ρ≠0）

检验的统计量通常基于Spearman相关系数ρ构建。对于大样本（n>30），可以使用近似正态分布的方法；对于小样本，则需要参考专门的临界值表。

2.2 检验统计量的计算

对于大样本情况，检验统计量z的计算公式为：

z = ρ × √[(n-2)/(1-ρ²)]

这个统计量近似服从自由度为n-2的t分布。因此，我们可以计算对应的p值来判断相关性是否显著。

2.3 小样本的精确检验

当样本量较小时（n≤30），上述近似方法可能不够准确。此时可以考虑：

使用专门的Spearman临界值表
采用排列检验（permutation test）方法
使用bootstrap方法估计置信区间

在实际研究中，我们通常会同时报告相关系数及其p值，以及置信区间，以提供更全面的信息。

3. 完整计算流程与实例演示

让我们通过一个实际案例来演示完整的计算和检验过程。

3.1 数据准备

假设我们研究10名学生的数学成绩与物理成绩的关系：

学生	数学成绩	物理成绩
A	85	78
B	76	70
C	92	88
D	81	75
E	89	82
F	73	76
G	95	90
H	68	65
I	79	77
J	83	80

3.2 等级转换

首先对两科成绩分别进行等级转换：

数学成绩排序：[68,73,76,79,81,83,85,89,92,95]
对应等级：[1,2,3,4,5,6,7,8,9,10]

物理成绩排序：[65,70,75,76,77,78,80,82,88,90]
对应等级：[1,2,3,4,5,6,7,8,9,10]

3.3 计算等级差及平方差

构建下表：

学生	数学等级(Rx)	物理等级(Ry)	d=Rx-Ry	d²
A	7	6	1	1
B	3	2	1	1
C	9	9	0	0
D	5	3	2	4
E	8	8	0	0
F	2	4	-2	4
G	10	10	0	0
H	1	1	0	0
I	4	5	-1	1
J	6	7	-1	1

Σd² = 1+1+0+4+0+4+0+0+1+1 = 12

3.4 计算Spearman相关系数

ρ = 1 - [6×12 / (10³ - 10)] = 1 - (72/990) ≈ 0.927

3.5 显著性检验

计算检验统计量：
z = 0.927 × √[(10-2)/(1-0.927²)] ≈ 6.53

查t分布表（df=8）：
p值远小于0.001，拒绝零假设

结论：数学成绩与物理成绩存在显著的正相关关系（ρ=0.927，p<0.001）

4. 实际应用中的注意事项

4.1 数据要求与前提条件

虽然Spearman相关系数对数据分布没有严格要求，但仍需注意：

变量至少是有序尺度（可以排序）
单调关系的假设（不一定是线性）
异常值对结果的影响相对较小，但仍需检查

4.2 常见误用情况

在实践中，我经常看到以下误用：

将Spearman系数解释为线性关系强度
忽略样本量对p值的影响
对存在大量相同等级的数据未做适当调整
未检查散点图就盲目计算相关系数

4.3 结果解释技巧

好的结果报告应包含：

相关系数值及其方向（正/负）
p值或置信区间
效应大小的描述（如Cohen的标准：0.1小，0.3中，0.5大）
可视化展示（如散点图加平滑曲线）

经验提示：当Spearman系数与Pearson系数差异很大时，可能表明数据存在非线性关系，值得进一步探索。

5. 现代统计软件的实现方法

5.1 R语言实现

r复制# 基本计算
cor.test(math_grades, physics_grades, method = "spearman")

# 更详细的输出
library(psych)
corr.test(data.frame(math=math_grades, physics=physics_grades), 
          method="spearman", adjust="none")

5.2 Python实现

python复制from scipy import stats

stats.spearmanr(math_grades, physics_grades)

# 更详细的选项
stats.spearmanr(math_grades, physics_grades, nan_policy='omit', alternative='two-sided')

5.3 SPSS操作步骤

菜单选择：Analyze > Correlate > Bivariate
将变量移至Variables框
取消勾选Pearson，勾选Spearman
点击OK运行

5.4 在线计算工具

对于快速计算，可以使用：

GraphPad QuickCalcs
VassarStats
SocSciStatistics

但要注意在线工具通常功能有限，且可能存在数据隐私问题。

6. 进阶话题与扩展应用

6.1 偏Spearman相关

当需要控制其他变量影响时，可以使用偏Spearman相关。这在多元分析中特别有用，比如研究学习时间与成绩关系时控制智力因素的影响。

R中可通过ppcor包实现：

r复制library(ppcor)
pcor.test(math_grades, physics_grades, control=iq_scores, method="spearman")

6.2 重复测量数据的处理

对于纵向数据或配对样本，需要考虑数据的非独立性。这时可以使用混合效应模型或广义估计方程(GEE)来考虑相关结构。

6.3 与Kendall tau的比较

Kendall's tau是另一种非参数相关度量，对异常值更稳健，但解释性稍差。选择依据包括：

样本量（小样本时Kendall tau更准确）
是否存在大量相同等级
计算效率考虑（Spearman计算更快）

6.4 大数据场景下的优化

当数据量非常大时（n>10⁶），传统算法可能效率低下。可以考虑：

使用近似算法
随机抽样方法
分布式计算框架实现

7. 常见问题排查与解决方案

7.1 结果不显著的可能原因

样本量太小（增加样本量或使用精确检验）
变量间确实没有关系（检查理论依据）
存在调节变量（考虑分层分析）
测量误差过大（改进测量工具）

7.2 相关系数异常高/低

检查数据输入错误
查看极端值影响
确认等级转换正确
考虑变量本身的分布特性

7.3 如何处理相同等级

使用平均等级法
考虑使用Kendall tau-b或tau-c
报告时注明相同等级的数量
在样本量允许时考虑随机分配等级

7.4 样本量规划建议

为了确保检验有足够的功效，可以事先进行样本量计算。例如，在R中：

r复制library(pwr)
pwr.r.test(r=0.5, sig.level=0.05, power=0.8)

这将告诉我们，要检测中等效应大小(ρ=0.5)的相关性，在α=0.05和功效=0.8的条件下，大约需要28个样本。

8. 在研究报告中的呈现方式

8.1 表格呈现示例

变量对	Spearman's ρ	p值	95% CI
数学-物理	0.927	<0.001	[0.76, 0.98]
数学-语文	0.685	0.029	[0.12, 0.91]

8.2 文本描述规范

"数学成绩与物理成绩呈显著正相关，Spearman's ρ=0.927，p<0.001，95%CI[0.76,0.98]，表明两者之间存在极强的单调关系。"

8.3 可视化建议

散点图加平滑曲线
添加相关系数和p值标注
考虑分面图展示多组比较
使用热图呈现多个变量间的相关矩阵

在ggplot2中的示例代码：

r复制ggplot(data, aes(x=math, y=physics)) +
  geom_point() +
  geom_smooth(method="loess") +
  annotate("text", x=80, y=95, 
           label=paste("ρ =", round(cor,2), ", p =", format.pval(pval)))

9. 与其他方法的比较与选择

9.1 Spearman vs Pearson

选择依据：

数据尺度：Pearson要求连续变量，Spearman可用于有序变量
分布假设：Pearson要求近似正态，Spearman无此要求
关系类型：Pearson检测线性，Spearman检测单调
异常值敏感性：Spearman更稳健

9.2 Spearman vs Kendall

解释性：Spearman更直观
效率：Kendall计算更耗时
相同等级处理：Kendall有专门调整
假设检验：Kendall对小样本更准确

9.3 何时选择其他方法

考虑使用其他相关分析方法的情况：

存在非线性关系：距离相关或最大信息系数
分类变量：卡方检验或Cramer's V
高维数据：典型相关或稀疏相关

10. 在特定领域的应用案例

10.1 心理学研究

在人格心理学中，Spearman相关常用于评估不同人格特质之间的关系。例如研究外向性与社交媒体使用频率的相关性，这类数据通常不满足正态分布假设。

10.2 医学研究

评估临床量表评分与生化指标的关系。比如疼痛评分与炎症标志物的相关性分析，由于评分数据是有序的，Spearman比Pearson更合适。

10.3 教育评估

分析不同科目成绩间的相关性。由于考试成绩往往呈偏态分布，且可能存在天花板/地板效应，Spearman相关能提供更可靠的结果。

10.4 市场研究

消费者满意度评分（1-5李克特量表）与回购意愿的关系分析。有序量表数据最适合使用Spearman相关。

在实际分析中，我发现同时计算Pearson和Spearman相关系数并比较两者的差异，往往能揭示数据中隐藏的模式。当两者差异较大时，可能暗示数据存在非线性关系或异常值影响，值得进一步探究。