ComfyUI Windows部署实战：从零搭建本地AI绘画工作站

希葛格的韩少君

1. 为什么选择ComfyUI搭建本地AI绘画工作站

最近两年AI绘画工具爆发式增长，但大多数都需要联网使用或者收费。ComfyUI作为一款完全免费的本地化工具，凭借其独特的节点式工作流和低硬件门槛，正在成为技术爱好者们的新宠。我花了三天时间在自己的游戏本（RTX 3060显卡）上完整部署了这套系统，实测生成一张512x512的图片仅需4-7秒，效果完全不输主流在线平台。

ComfyUI最大的优势在于它的灵活性。你可以像搭积木一样，通过连接不同的功能节点来构建专属工作流。比如把"文生图"节点和"图片放大"节点串联，就能实现一键生成高清大图。更棒的是，所有操作都在本地完成，既不用担心隐私泄露，也不用被网络速度限制创作灵感。

2. 硬件准备与环境检查

2.1 显卡配置要求

虽然ComfyUI支持CPU模式，但实测用集显生成一张图可能需要5分钟以上。建议至少配备NVIDIA GTX 1060及以上显卡，显存6GB起步。我的RTX 3060笔记本在生成768x768图片时，显存占用会达到5.8GB左右。可以通过以下命令检查显卡信息：

bash复制nvidia-smi

如果看到类似这样的输出，说明驱动安装正常：

code复制+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 516.94       CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ... WDDM  | 00000000:01:00.0  On |                  N/A |
| N/A   45C    P8    10W /  N/A |    689MiB /  6144MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

2.2 Python环境配置

推荐使用Python 3.10版本，这是目前最稳定的选择。我尝试过3.11版本会遇到一些依赖冲突。安装时务必勾选"Add Python to PATH"选项。安装完成后，在CMD中运行：

bash复制python --version
pip --version

如果显示版本号而非"不是内部命令"，说明环境变量配置正确。建议顺手升级下pip：

bash复制python -m pip install --upgrade pip

3. 详细安装步骤

3.1 下载与解压

官方压缩包约1.4GB，解压后约3.2GB。我专门测试了不同存储设备的速度：

机械硬盘解压耗时：约5分钟
SATA SSD解压耗时：约1分20秒
NVMe SSD解压耗时：约40秒

解压后目录结构如下：

code复制ComfyUI_windows_portable/
├── ComfyUI/
│   ├── models/
│   ├── custom_nodes/  
│   └── ...其他系统文件
├── run_cpu.bat
└── run_nvidia_gpu.bat

3.2 双模式启动详解

GPU模式启动：
直接双击run_nvidia_gpu.bat，会看到CMD窗口输出类似信息：

code复制...
Using seed: 123456
Loading model: v1-5-pruned-emaonly.safetensors
Model loaded in 2.4s
Running on local URL:  http://127.0.0.1:8188

CPU模式启动注意事项：
如果必须使用CPU模式，建议修改run_cpu.bat文件，在最后添加--cpu参数：

bat复制@echo off
python main.py --cpu
pause

4. 模型管理与工作流搭建

4.1 模型存放规范

官方推荐的模型目录结构：

code复制models/
├── checkpoints/        # 主模型(.ckpt/.safetensors)
├── vae/                # 变分自编码器
├── loras/              # LoRA微调模型
├── embeddings/         # 文本嵌入
└── upscale_models/     # 超分辨率模型

我整理了常见模型的下载来源：

基础模型：推荐下载v1-5-pruned-emaonly.safetensors（约4GB）
LoRA模型：可在CivitAI网站筛选"LoRA"类型
VAE模型：搭配使用可以改善色彩表现

4.2 第一个工作流实例

让我们搭建一个最简单的文生图流程：

右键画布 → 添加"CLIP Text Encode"节点
连接"正面提示词"输入框
添加"KSampler"节点并设置参数：
- Steps: 20
- CFG scale: 7
- Sampler: Euler a
最后连接"VAE解码"和"保存图像"节点

点击"Queue Prompt"后，可以在ComfyUI/output目录找到生成结果。我测试时发现，同样的参数下，不同模型产出风格差异很大，建议多尝试几个基础模型。

5. 实用插件推荐

5.1 中文汉化方案

推荐使用"AIGODLIKE-COMFYUI-TRANSLATION"项目：

下载ZIP包后解压到custom_nodes目录
重启ComfyUI后在设置中选择"中文"
部分专业术语翻译不够准确，但基本不影响使用

5.2 必备插件清单

插件名称	功能描述	安装方式
ComfyUI-Manager	插件管理系统	GitHub直接下载
Impact-Pack	人脸修复/背景移除等	通过管理器安装
WAS Node Suite	200+新节点增强	手动安装
Efficiency Nodes	优化采样效率	通过管理器安装

安装插件后遇到节点不显示的问题时，可以尝试：

检查控制台是否有报错
确认插件目录结构正确
清除浏览器缓存后刷新页面

6. 性能优化技巧

6.1 显卡参数调优

在extra_model_paths.yaml中添加以下配置可提升显存利用率：

yaml复制cuda:
  deterministic: false
  benchmark: true
  allow_tf32: true

实测在RTX 3060上能使生成速度提升约15%。但注意如果出现显存不足，需要把allow_tf32改为false。

6.2 常见报错解决

问题1：Torch not compiled with CUDA enabled
解决方法：重新安装对应版本的PyTorch：

bash复制pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

问题2：生成图片全黑
可能原因：

VAE模型未正确加载
采样步数设置过低
提示词冲突导致

7. 进阶应用场景

7.1 视频生成方案

通过"AnimateDiff"插件可以实现：

安装插件和运动模块
在工作流中添加"AnimateDiff Loader"节点
设置帧数(建议16-24)和循环参数
输出为GIF或MP4格式

实测生成3秒动画(24fps)约需8分钟，显存占用接近满载。

7.2 模型训练准备

虽然ComfyUI主要面向推理，但可以通过以下方式准备训练：

安装"SD-Train"节点套件
准备数据集(建议20-50张同风格图片)
配置LoRA训练参数：
- Batch size: 根据显存设置(通常1-2)
- Learning rate: 0.0001
- Steps: 800-1500

训练过程中可以通过任务管理器监控GPU利用率，正常应该在90%以上波动。

已经到底了哦

精选内容

1 SpringBoot项目实战：整合POI-TL模板与Aspose-Words，实现Word模板填充并一键导出PDF 2 保姆级教程：用iperf3精准测试你的云服务器真实带宽（附Windows/Ubuntu安装避坑指南）3 告别复制粘贴：深入理解 osgQt 的 GraphicsWindowQt 与官方示例演进 4 Echarts矩形树图label里加背景图？我踩过的坑你别再踩了（附完整代码）5 Jetson Nano到手后，除了SSH连接，这5个远程管理技巧让你效率翻倍 6 攻克GaN-HEMT仿真壁垒：从极化效应到陷阱建模的TCAD实践指南 7 从零到一：UG NX 2023 高效安装与核心模块实战指南 8 FPGA串口通信避坑指南：如何用Artix-7开发板实现带Modbus CRC的8字节报文回环测试 9 从‘发送一条微信’到‘收到一条微信’：手把手拆解计算机网络五层协议栈的完整工作流程 10 ConvNeXt网络结构详解：从ResNet到Transformer的‘现代化改造’（附PyTorch代码逐行解析）