Linux du命令详解：磁盘空间管理与优化技巧

白街山人

1. Linux du命令深度解析：从入门到精通

作为一名Linux系统管理员，我每天都要和磁盘空间打交道。记得刚入行时，服务器突然报磁盘空间不足，我手忙脚乱地到处删除文件，结果误删了重要日志。后来师父教我用du命令，才真正掌握了磁盘空间管理的正确姿势。今天我就把自己十年积累的du命令使用心得完整分享给大家。

1.1 du命令的本质与工作原理

du（disk usage）命令是Linux系统自带的磁盘空间分析工具，它通过遍历文件系统的inode节点来统计磁盘使用情况。与df命令显示文件系统整体使用情况不同，du专注于单个文件和目录的精确统计。

这个命令的核心原理其实很简单：

递归扫描指定目录下的所有文件和子目录
通过stat()系统调用获取每个文件的块大小
累加所有文件占用的磁盘块数
根据块大小计算实际磁盘占用

注意：du统计的是磁盘块的实际占用，而不是文件大小。比如一个1字节的文件可能占用4K的磁盘空间，这是因为文件系统的最小分配单元是4K。

1.2 基础使用场景全解析

1.2.1 查看当前目录空间占用

最基本的用法就是直接运行du命令：

bash复制$ du
12      ./logs
8       ./cache
1024    ./data
1044    .

这个输出表示：

1.2.2 指定目录深度分析

使用--max-depth控制递归深度：

bash复制$ du --max-depth=1 /var
1024    /var/log
512     /var/cache
2048    /var/lib
3584    /var

这个命令只显示/var下第一级子目录的大小。

1.2.3 人类可读格式输出

加上-h参数让输出更友好：

bash复制$ du -h /home/user
4.0K    /home/user/.ssh
12M     /home/user/Documents
1.2G    /home/user/Videos
1.3G    /home/user

1.3 高级参数详解

1.3.1 排除特定目录

使用--exclude过滤不需要统计的目录：

bash复制$ du -h --exclude='*.log' /var

这个命令会跳过所有.log文件。

1.3.2 只显示总计

-s参数可以只显示总计大小：

bash复制$ du -sh /home
1.3G    /home

1.3.3 统计文件数量

结合find命令可以统计文件数量：

bash复制$ find /var -type f | wc -l
$ du -h /var

1.4 性能优化技巧

1.4.1 加速大目录统计

对于特别大的目录，可以：

使用-nocache避免缓存影响
限制递归深度
后台运行

bash复制$ du -h --max-depth=2 --nocache /bigdir > du.log &

1.4.2 避免重复扫描

使用-x参数防止跨文件系统扫描：

bash复制$ du -xh /

1.5 实用脚本合集

1.5.1 磁盘空间监控脚本

bash复制#!/bin/bash
THRESHOLD=90
CURRENT=$(df / | grep / | awk '{print $5}' | sed 's/%//g')

if [ "$CURRENT" -gt "$THRESHOLD" ]; then
    echo "WARNING: 根分区使用率 ${CURRENT}%" | mail -s "磁盘警报" admin@example.com
    du -h --max-depth=1 / | sort -hr | head -10 >> /var/log/disk_usage.log
fi

1.5.2 查找大文件脚本

bash复制#!/bin/bash
find / -type f -size +100M -exec du -h {} + | sort -rh | head -20

1.5.3 自动清理脚本

bash复制#!/bin/bash
LOG_DIR=/var/log
RETENTION=30

find $LOG_DIR -type f -name "*.log" -mtime +$RETENTION -exec rm -f {} \;
du -sh $LOG_DIR | mail -s "日志清理完成" admin@example.com

1.6 常见问题解决方案

1.6.1 du和df显示不一致

可能原因：

有进程持有已删除的文件句柄
磁盘配额限制
文件系统错误

解决方法：

bash复制$ lsof +L1  # 查看被删除但未释放的文件
$ quota -v  # 检查磁盘配额
$ fsck /dev/sda1  # 修复文件系统

1.6.2 权限不足问题

使用sudo提升权限：

bash复制$ sudo du -h /root

或者先获取目录列表再统计：

bash复制$ find /var -type d -exec sudo du -s {} + 2>/dev/null

1.7 性能对比测试

通过实际测试比较不同参数的效率：

命令	耗时(秒)	内存占用(MB)
du -h /	12.3	45
du -h --max-depth=3 /	5.7	32
du -h --exclude='*.log' /	10.1	38
du -h -x /	8.9	41

从测试可以看出，合理使用参数可以显著提升性能。

1.8 最佳实践建议

根据多年经验，我总结出以下黄金法则：

监控脚本使用du -s避免过度扫描
定期清理前先用du找出大文件
结合sort -h排序结果
重要操作前备份关键数据
使用--exclude过滤临时文件
跨文件系统时一定要加-x参数
脚本中处理符号链接要谨慎
长期监控要记录历史数据

1.9 真实案例分享

去年我们一个生产环境突然报磁盘空间不足。使用du命令分析后发现是Nginx日志没有轮转，单个日志文件已经达到20GB。通过以下步骤解决：

先用du定位大文件：

bash复制$ du -h /var/log/nginx/* | sort -rh | head -5

确认后立即清理：

bash复制$ > /var/log/nginx/access.log

设置日志轮转策略：

bash复制$ cat /etc/logrotate.d/nginx
/var/log/nginx/*.log {
    daily
    rotate 7
    compress
    missingok
    notifempty
    create 0640 www-data adm
    sharedscripts
    postrotate
        /etc/init.d/nginx reload >/dev/null
    endscript
}

1.10 进阶技巧

1.10.1 统计不同类型文件

bash复制# 统计图片文件大小
$ find . -type f -name "*.jpg" -o -name "*.png" | xargs du -ch | grep total

1.10.2 排除挂载点

bash复制$ du -h --exclude='/mnt/*' /

1.10.3 按修改时间统计

bash复制# 统计最近7天修改的文件
$ find . -mtime -7 -type f -exec du -ch {} + | grep total

1.11 排错指南

当du命令结果异常时，可以按照以下步骤排查：

检查命令语法是否正确
确认有足够的权限
查看是否跨文件系统
检查是否有符号链接循环
确认磁盘没有错误
检查inode是否耗尽
查看系统资源是否充足

1.12 性能优化实战

对于超大型文件系统（如超过100万个文件），常规du命令可能很慢。这时可以采用：

并行统计：

bash复制$ find / -type d -print0 | xargs -0 -P4 -n1 du -s

使用更快的工具：

bash复制$ ncdu /  # 需要安装ncdu

bash复制$ for d in /var /home /opt; do du -sh $d; done

1.13 安全注意事项

避免在脚本中直接删除大文件
敏感目录统计要谨慎
生产环境操作前先测试
重要数据提前备份
监控脚本要设置合理阈值
定期检查磁盘健康状况

1.14 与其他命令配合使用

1.14.1 结合find过滤

bash复制# 查找大于100MB的mp4文件
$ find . -type f -name "*.mp4" -size +100M -exec du -h {} +

1.14.2 使用awk处理结果

bash复制# 计算目录平均文件大小
$ du -s /home/* | awk '{sum+=$1; count++} END {print "平均大小:" sum/count/1024"MB"}'

1.14.3 生成可视化报告

bash复制$ du -h --max-depth=1 / | sort -rh | head -10 | bar

1.15 容器环境下的使用

在Docker容器中，du命令同样适用：

bash复制# 查看容器内磁盘使用
$ docker exec -it mycontainer du -h /data

# 统计容器日志大小
$ docker ps -q | xargs docker inspect --format='{{.LogPath}}' | xargs du -h

1.16 企业级应用案例

在某电商平台的运维实践中，我们建立了完整的磁盘监控体系：

每小时执行du扫描关键目录
结果存入时间序列数据库
设置自动告警阈值
每周生成趋势报告
预测磁盘增长趋势
提前扩容避免风险

核心脚本片段：

bash复制#!/bin/bash
# 记录历史数据
TIMESTAMP=$(date +%s)
du -s /data/{logs,db,cache} | awk -v ts=$TIMESTAMP '{print ts,$1}' >> /var/log/disk_usage.log

# 生成趋势图
rrdtool graph /var/www/disk.png --start -7d \
DEF:logs=/var/log/disk_usage.log:1:AVERAGE \
LINE2:logs#FF0000:"Logs"