别再傻傻分不清了！Python项目里的requirements.txt和environment.yml到底该用哪个？（附实战选择指南）

Will.liu

Python依赖管理终极指南：requirements.txt vs environment.yml实战解析

刚接触Python项目时，看到requirements.txt和environment.yml这两个文件总让人一头雾水——它们看起来都在记录项目依赖，但到底有什么区别？为什么有些项目只用其中一个，有些却两者都提供？作为开发者，在自己的项目中又该如何选择？这些问题困扰着许多Python初学者，甚至一些有经验的开发者也会在这两个文件之间犹豫不决。

理解这两种依赖管理文件的本质区别，不仅能帮助你更高效地搭建开发环境，还能避免在团队协作中因环境不一致导致的"在我机器上能运行"的经典问题。更重要的是，正确的选择能让你在部署应用时少走弯路，特别是在处理科学计算、机器学习等复杂依赖场景时。

1. 依赖管理的核心概念：从基础到进阶

1.1 Python包管理简史

Python生态中，包管理工具的发展经历了几个关键阶段：

早期阶段：easy_install作为setuptools的一部分出现，解决了最基本的包安装问题
pip时代：2008年pip诞生，逐渐成为Python官方推荐的包管理工具
conda崛起：随着数据科学和机器学习的发展，Anaconda提供的conda因能更好地处理非Python依赖而流行

bash复制# Python包管理工具演变时间线
2004 - easy_install
2008 - pip首次发布
2012 - Anaconda首次发布
2015 - pip 7.0引入wheel格式
2018 - pip 10.0引入新的依赖解析器

1.2 虚拟环境的重要性

无论使用哪种依赖管理文件，虚拟环境都是Python开发中不可或缺的一环。虚拟环境的主要优势包括：

隔离性：每个项目拥有独立的Python环境和包空间
可重现性：确保开发、测试和生产环境的一致性
灵活性：允许在同一机器上运行需要不同Python版本或依赖版本的项目

bash复制# 创建虚拟环境的两种方式
# 使用venv（Python内置）
python -m venv myenv

# 使用conda
conda create --name myenv python=3.8

2. requirements.txt深度解析

2.1 文件结构与语法规则

requirements.txt是pip使用的依赖声明文件，其核心语法包括：

基本格式：包名==版本号（精确版本）
版本限定符：
- >=：最低版本
- <=：最高版本
- ~=：兼容版本
- !=：排除特定版本
其他特性：
- -e：可编辑安装（通常用于开发模式）
- -r：包含其他requirements文件
- --index-url：指定自定义包索引

text复制# 示例requirements.txt
Django==3.2.8
requests>=2.25.1,<3.0.0
numpy~=1.21.0
-e ../mylocalpackage
-r base_requirements.txt

2.2 生成与使用的最佳实践

生成requirements.txt的推荐方法是：

bash复制# 精确记录当前环境的所有包及版本
pip freeze > requirements.txt

# 仅记录项目直接依赖（推荐）
pip install pip-tools
pip-compile requirements.in > requirements.txt

安装依赖的标准方式是：

bash复制# 基本安装
pip install -r requirements.txt

# 开发环境安装（包含开发依赖）
pip install -r dev-requirements.txt

提示：避免直接使用pip freeze生成生产环境的requirements.txt，因为它会包含所有间接依赖，可能导致依赖冲突。推荐使用pip-tools等工具管理依赖关系。

2.3 优缺点分析

优势：

简单直观，学习成本低
与pip无缝集成，适用于纯Python项目
广泛支持，几乎所有Python项目都使用
文件体积通常较小

局限：

仅管理Python包，无法处理系统级依赖
依赖解析能力有限，容易遇到版本冲突
不包含Python版本信息
跨平台兼容性有时存在问题

3. environment.yml全面剖析

3.1 Conda环境文件详解

environment.yml是conda使用的环境配置文件，采用YAML格式，包含以下关键部分：

yaml复制# 典型environment.yml结构
name: myenv       # 环境名称
channels:         # 包来源通道
  - defaults
  - conda-forge
dependencies:     # 依赖列表
  - python=3.8
  - numpy=1.20
  - pip:          # 通过pip安装的包
    - django==3.2

主要字段说明：

字段	描述	是否必需
name	环境名称	可选
channels	包下载渠道	可选
dependencies	包依赖列表	必需
prefix	环境路径	通常不手动指定

3.2 环境创建与管理

创建环境：

bash复制# 从yml文件创建环境
conda env create -f environment.yml

# 指定环境名称（覆盖文件中的name）
conda env create -f environment.yml -n custom_name

更新环境：

bash复制# 更新环境并保存更改
conda env update --file environment.yml --prune

导出环境：

bash复制# 导出当前环境（包含精确版本）
conda env export > environment.yml

# 仅导出显式安装的包（推荐）
conda env export --from-history > environment.yml

3.3 混合使用conda和pip

当需要在conda环境中使用pip安装某些包时，最佳实践是：

在environment.yml中明确列出pip作为依赖
将所有pip安装的包也列在dependencies下的pip部分
避免在激活环境后直接使用pip install（可能导致依赖冲突）

yaml复制dependencies:
  - python=3.8
  - pip
  - pip:
    - some-package==1.0

注意：conda和pip混用时容易出现依赖冲突。建议优先使用conda安装包，仅在conda仓库中没有所需包时才使用pip。

4. 决策指南：如何选择适合你的方案

4.1 关键对比维度

下表总结了两种方案的主要区别：

维度	requirements.txt	environment.yml
管理工具	pip	conda
文件格式	文本	YAML
Python版本	不包含	可指定
非Python依赖	不支持	支持
虚拟环境	不管理	可管理
跨平台	有限	更好
典型用途	纯Python应用	数据科学/机器学习

4.2 选择决策树

根据项目需求选择依赖管理方案的决策流程：

项目类型：
- 纯Python应用 → 优先考虑requirements.txt
- 数据科学/机器学习 → 优先考虑environment.yml
依赖复杂度：
- 只有Python包 → requirements.txt足够
- 需要C库或其他语言扩展 → conda更合适
团队协作：
- 团队全用conda → environment.yml
- 团队混合使用 → 提供两个文件
部署环境：
- 云原生/Docker部署 → requirements.txt更轻量
- 本地/复杂环境 → conda环境更可靠

4.3 典型场景推荐

使用requirements.txt的场景：

开发Web应用（Django/Flask等）
开发可安装的Python库
目标环境限制严格（如AWS Lambda）
团队中所有开发者使用相同操作系统

使用environment.yml的场景：

数据分析和科学计算项目
机器学习/深度学习应用
需要特定版本Python或系统库
跨平台开发（Windows/macOS/Linux混合团队）
涉及复杂C/C++扩展的项目

两者同时提供的场景：

开源项目希望支持更广泛的用户
项目既有conda也有pip可用的依赖
开发和生产环境需求差异大

5. 高级技巧与常见问题解决

5.1 依赖锁定与可重现性

确保环境完全可重现的关键技术：

pip方案：

bash复制# 生成精确版本锁文件
pip freeze > requirements.lock

# 安装时使用哈希校验
pip install --require-hashes -r requirements.lock

conda方案：

bash复制# 导出精确环境规格
conda list --explicit > spec-file.txt

# 根据精确规格创建环境
conda create --name myenv --file spec-file.txt

5.2 依赖冲突解决策略

当遇到依赖冲突时，可以尝试：

创建干净环境：从全新虚拟环境开始
版本放松：适当放宽版本限制
依赖隔离：将冲突包隔离到不同环境
使用替代包：寻找功能相似但无冲突的包

bash复制# 检查依赖冲突（pip）
pip check

# 查看依赖关系树（conda）
conda deps

5.3 多阶段依赖管理

对于复杂项目，建议采用分层依赖管理：

核心依赖：运行必需的最小依赖集
可选依赖：额外功能需要的依赖
开发依赖：测试、文档等开发工具

code复制# 项目结构示例
requirements/
├── base.in       # 核心依赖
├── dev.in        # 开发依赖
├── docs.in       # 文档依赖
└── test.in       # 测试依赖

5.4 跨平台兼容性处理

确保依赖在不同操作系统工作的技巧：

避免使用平台特定的包版本
使用环境标记指定平台相关依赖
在CI/CD中测试多平台兼容性
考虑使用Docker统一开发环境

text复制# 平台特定依赖示例
pywin32==300 ; sys_platform == 'win32'
pyobjc==8.0 ; sys_platform == 'darwin'

在Python项目开发中，没有放之四海而皆准的依赖管理方案。经过多个项目的实践，我发现对于大多数数据科学项目，conda的environment.yml提供了更好的整体体验，特别是当项目涉及TensorFlow或PyTorch等复杂库时。而对于纯粹的Python应用或库开发，pip配合requirements.txt则更加轻量和直接。最关键的是一旦选择了某种方案，就在整个项目中保持一致，并确保团队所有成员都清楚如何使用。

已经到底了哦