别再手动算效率了！用Python的DEApy库5分钟搞定CCR模型（附学校评价实战代码）

Yasuraoka Mugi

别再手动算效率了！用Python的DEApy库5分钟搞定CCR模型（附学校评价实战代码）

当我们需要评估多个决策单元（如学校、医院或企业部门）的效率时，传统方法往往需要复杂的数学计算和大量时间。数据包络分析（DEA）中的CCR模型正是为解决这类多投入多产出的效率评价问题而生。本文将带你快速掌握如何用Python的DEApy库实现CCR模型，无需深入数学原理也能轻松应用。

1. 环境准备与数据导入

在开始之前，我们需要准备好Python环境和示例数据。假设我们要评估6所中学的效率，投入指标包括生均投入和非低收入家庭百分比，产出指标则是生均写作得分和生均科技得分。

首先安装必要的库：

bash复制pip install deapy pandas numpy

接着创建示例数据文件schools.csv：

csv复制school,student_cost,low_income_percent,writing_score,science_score
A,89300,64.3,250,223
B,86200,99,316,328
C,108100,99.6,273,291
D,106600,96,291,295
E,102000,96.2,306,320
F,115700,79.9,290,310

用pandas读取数据：

python复制import pandas as pd

data = pd.read_csv('schools.csv')
inputs = data[['student_cost', 'low_income_percent']].values
outputs = data[['writing_score', 'science_score']].values

2. CCR模型快速实现

DEApy库已经封装了CCR模型的复杂计算过程，我们只需几行代码即可完成效率评价：

python复制from deapy import CCR

# 创建CCR模型实例
model = CCR(inputs, outputs)

# 计算效率得分
efficiency_scores = model.efficiency()

# 将结果添加到原始数据中
data['efficiency'] = efficiency_scores
print(data.sort_values('efficiency', ascending=False))

运行后会输出类似下面的结果：

code复制  school  student_cost  low_income_percent  writing_score  science_score  efficiency
B      B         86200                99.0            316            328    1.000000
E      E        102000                96.2            306            320    0.963107
F      F        115700                79.9            290            310    0.843478
D      D        106600                96.0            291            295    0.783784
C      C        108100                99.6            273            291    0.722222
A      A         89300                64.3            250            223    0.700000

3. 结果解读与可视化

效率得分在0到1之间，1表示完全有效，得分越低效率相对越低。从结果可以看出：

学校B效率最高（1.0），说明其投入产出比达到了最优
学校A虽然生均投入最低，但效率得分也最低，说明资源利用不够充分
其他学校处于中间水平，可根据具体得分分析改进空间

我们可以用matplotlib绘制效率分布图：

python复制import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
plt.bar(data['school'], data['efficiency'], color='skyblue')
plt.axhline(y=1, color='r', linestyle='--')
plt.title('School Efficiency Scores (CCR Model)')
plt.ylabel('Efficiency Score')
plt.xlabel('School')
plt.show()

4. 进阶应用与注意事项

实际应用中，我们可能需要对模型进行更多定制化设置：

4.1 权重约束

如果需要限制某些指标的权重范围，可以添加约束条件：

python复制from deapy import WeightRestriction

# 限制生均投入的权重不超过0.7
restrictions = [WeightRestriction(input_index=0, upper=0.7)]
model = CCR(inputs, outputs, weight_restrictions=restrictions)

4.2 规模收益分析

CCR模型假设规模收益不变，如果需要分析规模收益变化，可以使用BCC模型：

python复制from deapy import BCC

bcc_model = BCC(inputs, outputs)
scale_efficiency = bcc_model.scale_efficiency()

4.3 数据预处理建议

量纲统一：不同指标的单位差异较大时，建议进行标准化处理
异常值处理：极端值可能影响结果，需提前识别和处理
指标选择：投入产出指标应具有逻辑关联性，通常需要领域专家确认

提示：实际项目中，建议先用描述性统计和相关性分析检查数据质量，再运行DEA模型。

5. 完整实战案例

下面是一个完整的学校评价案例，包含数据预处理、模型运行和结果分析：

python复制import pandas as pd
from deapy import CCR
import matplotlib.pyplot as plt

# 数据准备
data = pd.DataFrame({
    'school': ['A', 'B', 'C', 'D', 'E', 'F'],
    'student_cost': [89300, 86200, 108100, 106600, 102000, 115700],
    'low_income_percent': [64.3, 99, 99.6, 96, 96.2, 79.9],
    'writing_score': [250, 316, 273, 291, 306, 290],
    'science_score': [223, 328, 291, 295, 320, 310]
})

# 标准化处理（可选）
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
data[['student_cost', 'low_income_percent']] = scaler.fit_transform(data[['student_cost', 'low_income_percent']])
data[['writing_score', 'science_score']] = scaler.fit_transform(data[['writing_score', 'science_score']])

# 运行CCR模型
inputs = data[['student_cost', 'low_income_percent']].values
outputs = data[['writing_score', 'science_score']].values

model = CCR(inputs, outputs)
data['efficiency'] = model.efficiency()

# 结果分析
print("效率排名：")
print(data.sort_values('efficiency', ascending=False))

# 可视化
plt.style.use('ggplot')
fig, ax = plt.subplots(figsize=(12, 6))
bars = ax.bar(data['school'], data['efficiency'], color=['#4C72B0' if x < 1 else '#55A868' for x in data['efficiency']])
ax.axhline(1, color='#CC6677', linestyle='--')
ax.set_title('学校效率评价结果(CCR模型)', pad=20, fontsize=15)
ax.set_xlabel('学校', labelpad=10)
ax.set_ylabel('效率得分', labelpad=10)

# 添加数值标签
for bar in bars:
    height = bar.get_height()
    ax.text(bar.get_x() + bar.get_width()/2., height,
            f'{height:.3f}',
            ha='center', va='bottom')

plt.tight_layout()
plt.savefig('school_efficiency.png', dpi=300)
plt.show()

这个案例展示了从数据准备到结果可视化的完整流程。实际应用中，可以根据需要调整输入输出指标，或者尝试不同的DEA模型变体。

已经到底了哦

精选内容

1 AD7124-4 精度实战：从寄存器配置到系统校准的避坑指南 2 从LR(0)到LALR：构建高效语法分析器的核心算法演进与实践 3 期末求生指南：手把手教你用浏览器开发者工具绕过百一测评的切屏检测 4 SLAM基石探秘-Boost几何库在点云配准与地图构建中的实战解析 5 芯片设计新手必看：5分钟搞懂什么是工艺角（Process Corner），别再被TT/FF/SS搞晕了 6 Jackson实战：巧用@JsonSerialize与@JsonDeserialize定制复杂数据转换 7 保姆级教程：手把手教你用WinRM远程管理Windows 10（附防火墙、网络类型报错解决方案）8 从CTFshow靶场实战出发：手把手教你用Flask/Jinja2的SSTI漏洞拿Flag（附完整Payload分析）9 Unity C#编程避坑指南：别再乱用public和private了，聊聊封装与访问修饰符的正确姿势 10 Aspose-Words与POI-TL实战：集成License.xml实现Word/PDF无水印导出

别再手动算效率了！用Python的DEApy库5分钟搞定CCR模型（附学校评价实战代码）

别再手动算效率了！用Python的DEApy库5分钟搞定CCR模型（附学校评价实战代码）

1. 环境准备与数据导入

2. CCR模型快速实现

3. 结果解读与可视化

4. 进阶应用与注意事项

4.1 权重约束

4.2 规模收益分析

4.3 数据预处理建议

5. 完整实战案例

内容推荐