第一次接触Stable Diffusion WebUI时,我花了整整两天时间才搞定环境配置。后来帮朋友部署时发现,90%的问题都出在环境准备阶段。下面这些细节,都是我用无数个深夜调试换来的经验。
Python版本是第一个大坑。官方要求3.10.6,但很多人不知道这个版本号必须精确匹配。我试过用3.10.5和3.10.7都会报错,特别是torch库的兼容性问题会让你怀疑人生。建议直接到Python官网下载Windows installer (64-bit)版本,安装时务必勾选"Add Python to PATH"。
显卡驱动是第二个隐形杀手。NVIDIA用户需要:
注意:AMD显卡用户需要安装ROCm,但Windows支持有限,建议用Linux系统
我推荐使用Miniconda而不是Anaconda,因为后者会自带大量无用库。具体操作:
bash复制conda create -n sdwebui python=3.10.6
conda activate sdwebui
这个环境专门给WebUI使用,不要和其他项目混用,否则容易出现库冲突。
git clone经常卡住是新手最头疼的问题。除了官方仓库,我整理了三个实测有效的加速方案:
set GIT_SSL_NO_VERIFY=true临时关闭SSL验证git config --global http.postBuffer 524288000增大缓存git clone git://github.com/AUTOMATIC1111/stable-diffusion-webui.git安装依赖时常见两个坑:
python复制index_url = "https://pypi.tuna.tsinghua.edu.cn/simple"
我建议首次运行时添加--skip-torch-cuda-test参数避免CUDA检测卡住:
bash复制webui-user.bat --skip-torch-cuda-test
官方v1.5模型(约4GB)是最稳妥的起点,但下载时有三个技巧:
E:\sd_models\Stable-diffusion模型管理的高级玩法:
models/Lora目录实测发现模型加载慢可能是显存不足导致的。GTX 1660Ti这类6GB显卡建议添加:
bash复制set COMMANDLINE_ARGS=--medvram --opt-split-attention
看到Running on local URL: http://127.0.0.1:7860不代表万事大吉。我遇到过这些典型问题:
黑屏问题:
NansException错误--precision full --no-half参数出图模糊:
Send images when loadedCLIP skip值为2Tiling选项最让人崩溃的是CUDA out of memory错误。我的解决方案是:
bash复制set COMMANDLINE_ARGS=--lowvram --always-batch-cond-uncond --disable-nan-check
在GTX 1060上实测有效的提速方案:
bash复制git clone https://github.com/NVIDIA/TensorRT.git
cd TensorRT && python setup.py install
bash复制set COMMANDLINE_ARGS=--xformers
--opt-channelslast内存优化模式对于4GB显存显卡,必须做这些调整:
Tiled diffusion和Highres fix经过三个月测试,这些插件最值得安装:
ControlNet:姿势控制神器
ADetailer:自动修复面部细节
bash复制git clone https://github.com/Bing-su/adetailer.git extensions/adetailer
Dynamic Thresholding:解决画面过曝
安装插件后出现兼容性问题时,可以:
extensions目录下对应文件夹--disable-extension=problem_extension准备数据集时要注意:
我常用的训练参数组合:
json复制{
"pretrained_model_name_or_path": "runwayml/stable-diffusion-v1-5",
"train_batch_size": 3,
"gradient_accumulation_steps": 1,
"learning_rate": 1e-6,
"lr_scheduler": "constant",
"train_text_encoder": true,
"mixed_precision": "fp16"
}
训练中断后的恢复技巧:
--resume_from_checkpoint参数后加lasttraining_state.json可以重置优化器max_train_steps为原值的1.2倍卡在Installing requirements:
--reinstall-torch参数生成图片全黑/全绿:
--no-half-vae参数WebUI突然崩溃:
debug.log最后20行--disable-safe-unpickle--max-embedding-count值遇到Couldn't launch python错误时,可能是环境变量问题。我常用的修复命令:
powershell复制[System.Environment]::SetEnvironmentVariable("PATH", "$env:PATH;C:\Python310", "User")