在数据科学和机器学习领域,Python已经成为事实上的标准语言。但Python本身只是一个基础环境,要完成实际工作还需要安装各种第三方库(如NumPy、Pandas、Matplotlib等)。传统pip安装方式经常会遇到版本冲突、依赖关系复杂等问题。
Anaconda的出现完美解决了这些痛点。它不仅集成了1500+个常用的数据科学包,还提供了强大的环境管理工具conda。根据2023年Python开发者调查,超过78%的数据分析师选择Anaconda作为他们的开发环境。
虽然Anaconda支持Windows、macOS和Linux三大平台,但不同系统下的安装细节略有差异。建议电脑至少满足:
注意:如果你的电脑已经安装了Python,不必担心冲突。Anaconda会将自己的Python环境与系统环境隔离。
访问Anaconda官网时,你会看到两个版本选择:
对于大多数初学者,建议下载完整版。截至2023年7月,最新稳定版本是Anaconda3-2023.03,对应Python 3.10。
安装完成后,验证方法:
bash复制conda --version
python --version
bash复制echo 'export PATH="/Users/你的用户名/anaconda3/bin:$PATH"' >> ~/.zshrc
source ~/.zshrc
推荐使用命令行安装:
bash复制cd /tmp
wget https://repo.anaconda.com/archive/Anaconda3-2023.03-Linux-x86_64.sh
bash Anaconda3-2023.03-Linux-x86_64.sh
按提示完成安装后,需要激活环境:
bash复制source ~/.bashrc
默认conda源在国外,速度较慢。建议立即更换为国内镜像:
bash复制conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
避免不同项目间的包冲突,建议为每个项目创建独立环境:
bash复制conda create -n myenv python=3.9
conda activate myenv
| 功能 | 命令 |
|---|---|
| 安装包 | conda install numpy |
| 更新包 | conda update numpy |
| 列出环境 | conda env list |
| 导出环境 | conda env export > environment.yml |
| 删除环境 | conda env remove -n myenv |
这是PATH环境变量未配置导致的。解决方法:
除了更换镜像源,还可以尝试:
bash复制conda config --set remote_read_timeout_secs 600
conda clean -i
如果出现Python版本混乱,可以:
which pythonconda activate baseAnaconda自带的Jupyter Notebook是数据分析的利器。启动方式:
bash复制jupyter notebook
为了提高效率,建议安装这些扩展:
bash复制conda install -c conda-forge jupyter_contrib_nbextensions
要将环境复制到其他机器:
bash复制conda env export > environment.yml
conda env create -f environment.yml
在PyCharm中:
在VSCode中:
bash复制conda clean --all
bash复制conda install -n base -c conda-forge mamba
mamba install numpy
bash复制conda install -c conda-forge conda-pack
conda pack -n myenv -o myenv.tar.gz