TOPSIS、熵权法、AHP傻傻分不清？一张图帮你搞定数学建模评价类选题

赵阿Q

TOPSIS、熵权法、AHP：数学建模评价方法选型实战指南

面对数学建模比赛或实际业务决策时，评价类问题总是让人头疼——TOPSIS、熵权法、层次分析法(AHP)这些方法到底该怎么选？它们各自的适用场景和优缺点是什么？本文将用一张清晰的决策流程图，结合"选择最佳实习offer"的完整案例，带你彻底理清这三种主流评价方法的选型逻辑。

1. 评价方法的三维定位框架

评价类问题的核心在于指标权重分配和方案排序计算。要理解三种方法的差异，可以从三个维度建立认知坐标系：

数据完备性维度
- TOPSIS：要求所有指标均有完整量化数据（如销售额、误差率等可测量值）
- 熵权法：需要部分量化数据作为计算基础
- AHP：可在完全缺乏数据时，通过主观判断建立评价体系

权重生成方式维度

mermaid复制graph LR
A[权重类型] --> B[主观权重]
A --> C[客观权重]
B --> D(AHP专家打分)
C --> E(熵权法数据驱动)
C --> F(TOPSIS默认权重)

计算复杂度维度

方法	计算步骤	所需工具	适合场景
AHP	最复杂	判断矩阵一致性	战略决策、长期规划
熵权法	中等	数据标准化处理	数据中等的运营分析
TOPSIS	最简单	矩阵运算	快速决策、竞赛限时场景

关键洞察：没有绝对最优的方法，只有最适合当前问题特征的选择。接下来我们用实际案例验证这个框架。

2. 实战案例：如何选择最佳实习offer

假设你收到4家公司的实习offer，需要从薪资水平、通勤时间、成长空间、公司声望4个维度进行评价。我们将演示三种方法的应用差异。

2.1 数据准备阶段

首先建立决策矩阵（原始数据）：

公司	薪资(元/月)	通勤(分钟)	成长评分(1-5)	声望评分(1-5)
A	8000	90	4.2	3.8
B	7500	45	3.5	4.5
C	9000	120	4.8	4.2
D	8500	60	3.8	3.5

指标类型识别：

效益型指标（越大越好）：薪资、成长评分、声望评分
成本型指标（越小越好）：通勤时间

2.2 方法应用对比

2.2.1 TOPSIS实现步骤

正向化处理（仅需处理通勤时间）：

python复制# 成本型转效益型公式：max(x) - x
commute = [90, 45, 120, 60]
normalized_commute = [max(commute)-x for x in commute]  # 结果：[30, 75, 0, 60]

标准化矩阵计算（消除量纲）：

python复制import numpy as np
matrix = np.array([
    [8000, 30, 4.2, 3.8],
    [7500, 75, 3.5, 4.5],
    [9000, 0, 4.8, 4.2],
    [8500, 60, 3.8, 3.5]
])
norm_matrix = matrix / np.sqrt((matrix**2).sum(axis=0))

确定正负理想解：
- 正理想解：[9000, 75, 4.8, 4.5]
- 负理想解：[7500, 0, 3.5, 3.5]

计算相对接近度：

python复制# 欧式距离计算
D_pos = np.sqrt(((norm_matrix - norm_matrix.max(axis=0))**2).sum(axis=1))
D_neg = np.sqrt(((norm_matrix - norm_matrix.min(axis=0))**2).sum(axis=1))
score = D_neg / (D_pos + D_neg)

最终得分排序：C(0.67) > A(0.53) > D(0.47) > B(0.45)

2.2.2 熵权法实现差异

熵权法的核心是通过数据波动程度自动确定权重：

计算信息熵：

python复制p = matrix / matrix.sum(axis=0)
entropy = -np.sum(p * np.log(p), axis=0) / np.log(len(matrix))

确定权重：

python复制diversity = 1 - entropy
weights = diversity / diversity.sum()  # 结果：[0.32, 0.18, 0.28, 0.22]

加权TOPSIS：
使用熵权法生成的权重替代TOPSIS中的默认权重，其余步骤相同。最终排序可能发生变化。

2.2.3 AHP实施要点

当缺乏具体数据时（如无法量化"成长空间"），AHP通过构建判断矩阵：

建立层级结构：

code复制目标层：选择最佳offer
└─准则层：薪资、通勤、成长、声望
   └─方案层：公司A/B/C/D

构造判断矩阵（以准则层为例）：

薪资通勤成长声望

薪资 1 3 2 4

通勤 1/3 1 1/2 2

成长 1/2 2 1 3

声望 1/4 1/2 1/3 1

	薪资	通勤	成长	声望
薪资	1	3	2	4
通勤	1/3	1	1/2	2
成长	1/2	2	1	3
声望	1/4	1/2	1/3	1

一致性检验：

python复制from numpy.linalg import eig
eigenvalues, _ = eig(judgment_matrix)
CI = (max(eigenvalues) - len(judgment_matrix)) / (len(judgment_matrix)-1)
CR = CI / 0.9  # 若CR<0.1则通过检验

3. 方法选型决策树

基于上述分析，我们总结出评价方法选择的黄金法则：

数据完备性优先
- 有完整数据 → TOPSIS或熵权法
- 只有部分数据 → 熵权法
- 完全无数据 → AHP
时效性要求
- 紧急决策 → TOPSIS（计算最快）
- 长期规划 → AHP（考虑更全面）
结果可解释性
- 需要明确权重来源 → AHP（主观权重可追溯）
- 追求客观性 → 熵权法

常见误区警示：

误用AHP处理大量量化数据（效率低下）

在数据分布不均匀时使用熵权法（权重失真）

TOPSIS未进行适当的正向化处理（结果逆转）

4. 进阶技巧与避坑指南

4.1 混合方法的应用

在实际项目中，可以组合使用这些方法：

mermaid复制graph TB
    A[建立评价体系] --> B{是否有数据?}
    B -->|是| C[熵权法确定客观权重]
    B -->|否| D[AHP确定主观权重]
    C & D --> E[TOPSIS进行最终排序]

4.2 敏感性分析

无论采用哪种方法，都需要检验结果的稳定性：

python复制# 以TOPSIS权重敏感性分析为例
def sensitivity_analysis(base_weights, variation=0.1, steps=100):
    results = []
    for _ in range(steps):
        noise = np.random.uniform(-variation, variation, size=len(base_weights))
        new_weights = base_weights * (1 + noise)
        new_weights /= new_weights.sum()
        # 重新计算TOPSIS...
        results.append(ranking)
    return pd.DataFrame(results).apply(pd.Series.value_counts, axis=1)