这套配置的核心思路在于用最低成本打造高性能多用途服务器。E3-1230v2作为经典的服务器CPU,虽然发布于2012年,但4核8线程设计加上3.3GHz基础频率,在虚拟化场景下依然能打。配合16GB DDR3内存和P106矿卡,整套平台二手市场价不超过800元,却可以同时满足:
实测这套配置在PVE虚拟化环境下,可同时运行:1个Ubuntu建站实例(2核4G)+ 1个Win10 AI专用机(2核4G+独显直通)+ 1个OpenWRT软路由(1核1G),系统负载长期保持在70%以下。
CPU:Intel Xeon E3-1230v2
显卡:NVIDIA P106-090
内存:DDR3-1600 ECC
P106矿卡需要特殊驱动才能发挥完整性能:
实测在Win10下跑分:Time Spy显卡分3500左右,Stable Diffusion出图速度约2.5it/s(512x512)
bash复制# 制作安装U盘(Linux环境示例)
dd if=pve-iso-file of=/dev/sdX bs=4M status=progress conv=fsync
# BIOS设置要点
- 开启VT-d/AES-NI指令集
- 显存分配设为64M(核显)
- 电源管理设为高性能模式
网络建议采用双网卡方案:
shell复制# /etc/sysctl.conf 优化
vm.swappiness=10
vm.vfs_cache_pressure=50
net.core.rmem_max=4194304
net.ipv4.tcp_rmem=4096 87380 4194304
# CPU调度策略
echo "performance" > /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
bash复制for d in /sys/kernel/iommu_groups/*/devices/*; do
n=${d#*/iommu_groups/*}; n=${n%%/*}
printf 'IOMMU Group %s ' "$n"
lspci -nns "${d##*/}"
done
conf复制GRUB_CMDLINE_LINUX_DEFAULT="quiet intel_iommu=on iommu=pt pcie_acs_override=downstream,multifunction nofb nomodeset video=vesafb:off"
shell复制echo "vfio" > /etc/modules-load.d/vfio.conf
echo "options vfio-pci ids=10de:1b82,10de:10f0" > /etc/modprobe.d/vfio.conf
推荐使用LXC容器而非完整虚拟机:
bash复制pct create 100 local:vztmpl/ubuntu-22.04-standard_22.04-1_amd64.tar.gz \
--cores 2 --memory 4096 --swap 1024 \
--storage local-lvm --rootfs 20G \
--net0 name=eth0,bridge=vmbr0,ip=dhcp
Nginx优化参数示例:
nginx复制worker_processes auto;
worker_rlimit_nofile 100000;
events {
worker_connections 4000;
use epoll;
multi_accept on;
}
shell复制sensors | grep "fan1" | awk '{print $2}'
ipmitool raw 0x30 0x30 0x02 0xff 0x14
| 工作状态 | 整机功耗 | 温度表现 |
|---|---|---|
| 待机 | 45W | CPU:38℃ GPU:42℃ |
| 建站负载 | 68W | CPU:52℃ GPU:45℃ |
| AI绘图满载 | 135W | CPU:62℃ GPU:78℃ |
| 压力测试双烤 | 158W | CPU:71℃ GPU:83℃ |
症状:直通后虚拟机无法启动
video=efifb:off症状:AI绘图时显存不足
当出现虚拟机间传输速度慢时:
bash复制# 检查是否启用了vhost_net
lsmod | grep vhost
# 启用virtio多队列
qm set <vmid> --args '-netdev type=tap,id=net0,ifname=tap0,vhost=on,queues=4'
Jellyfin硬解配置要点:
xml复制<Encoding>
<HardwareAccelerationType>qsv</HardwareAccelerationType>
<Qsv>
<EnableLowPower>true</EnableLowPower>
<DecodeBitrateCap>0</DecodeBitrateCap>
</Qsv>
</Encoding>
使用Ansible批量管理容器:
yaml复制- name: Update LXC containers
hosts: all
tasks:
- name: apt update
ansible.builtin.apt:
update_cache: yes
when: "'ubuntu' in inventory_hostname"
- name: yum update
ansible.builtin.yum:
update_cache: yes
when: "'centos' in inventory_hostname"
这套配置最让我惊喜的是P106矿卡在Ubuntu下的表现——通过CUDA 11.4和cuDNN 8.2的组合,居然能流畅运行LLAMA2-7B模型(量化版)。虽然生成速度较慢(约3token/s),但作为学习实验环境完全够用。建议给Win10虚拟机分配显存时保留至少512MB给宿主机的显示输出,否则容易遇到控制台卡死的情况。