Shell脚本循环语句详解：for/while/until实战指南

狭间

1. Shell循环语句基础认知

作为Linux系统管理员和运维工程师的必备技能，shell脚本中的循环结构就像厨房里的多功能料理机 - 看似简单却蕴含强大生产力。我在十多年的运维工作中，处理过无数需要批量操作的任务场景，从日志分析到文件处理，从服务监控到数据迁移，循环语句始终是最得力的助手。

shell脚本主要支持三种循环结构：for循环、while循环和until循环，每种都有其独特的应用场景。就像木匠工具箱里的不同刨刀，选择合适工具能让工作事半功倍。我们先通过一个简单例子感受循环的威力：假设需要给100台服务器批量部署配置文件，手动操作可能需要数小时，而一个20行的循环脚本可能只需几分钟就能完成。

提示：在开始编写循环脚本前，建议先使用set -x开启调试模式，可以实时看到循环的执行过程，这对排查逻辑错误非常有帮助。

2. for循环实战详解

2.1 基础for循环语法

for循环是shell脚本中最常用的循环结构，特别适合处理已知迭代次数的场景。其基本语法格式如下：

bash复制for 变量 in 值列表
do
    命令序列
done

值列表可以有多种生成方式：

直接列举：for i in 1 2 3 4 5
使用序列表达式：for i in {1..5}
命令输出结果：for file in $(ls /var/log)
通配符扩展：for conf in /etc/*.conf

我在处理日志轮转时经常使用这样的结构：

bash复制# 压缩一周前的日志文件
for logfile in /var/log/app/*.log
do
    if [ $(date -r $logfile +%s) -lt $(date -d '7 days ago' +%s) ]; then
        gzip $logfile
    fi
done

2.2 C风格for循环

bash还支持类似C语言的for循环语法，这在需要精确控制循环变量时特别有用：

bash复制for ((初始值; 条件判断; 变量变化))
do
    命令序列
done

典型应用场景是生成测试数据：

bash复制# 生成10个测试用户
for ((i=1; i<=10; i++))
do
    username="testuser$i"
    useradd $username
    echo "User $username created"
done

注意：这种语法只在bash中可用，如果脚本需要跨shell环境运行，建议使用传统for循环。

2.3 循环控制技巧

在实际运维中，我们经常需要控制循环的执行流程：

break：立即终止整个循环

bash复制# 查找第一个可用的备份文件
for backup in /backup/*
do
    if [ -s "$backup" ]; then
        echo "Found valid backup: $backup"
        break
    fi
done

continue：跳过当前迭代，进入下一次循环

bash复制# 处理非空目录
for dir in /*
do
    [ "$(ls -A $dir)" ] || continue
    echo "Processing $dir"
    # 其他操作...
done

循环嵌套：处理多维数据

bash复制# 检查多台服务器的多个服务端口
for server in ${servers[@]}
do
    for port in 80 443 22
    do
        nc -z $server $port && echo "$server:$port is open"
    done
done

3. while循环深度应用

3.1 基础while循环

while循环在条件为真时持续执行，特别适合处理不确定迭代次数的场景：

bash复制while [ 条件测试 ]
do
    命令序列
done

我在监控服务状态时经常使用这种模式：

bash复制# 等待MySQL服务启动
while ! systemctl is-active --quiet mysql
do
    echo "Waiting for MySQL to start..."
    sleep 5
done
echo "MySQL is now running"

3.2 无限循环与退出控制

有时我们需要创建持续运行的后台进程：

bash复制# 简易的日志监控脚本
while true
do
    new_errors=$(grep "ERROR" /var/log/app.log | wc -l)
    [ $new_errors -gt 10 ] && send_alert "High error count detected"
    sleep 60
done

更安全的写法是使用:代替true，并添加退出条件：

bash复制# 带退出条件的守护进程
while :
do
    check_status || break
    perform_task
    sleep 300
done

3.3 读取文件内容

while循环与read命令配合是处理文本文件的黄金组合：

bash复制# 处理CSV文件
while IFS=',' read -r name age email
do
    echo "Adding $name ($age) to mailing list"
    # 其他处理逻辑...
done < users.csv

经验：设置IFS(Internal Field Separator)可以精确控制字段分隔，处理特殊格式文件时非常有用。

4. until循环特殊场景应用

until循环与while循环相反，它在条件为假时执行，适合需要"等待直到..."的场景：

bash复制until [ 条件测试 ]
do
    命令序列
done

典型应用是等待某个条件达成：

bash复制# 等待数据库备份完成
until [ -f /backup/db.done ]
do
    echo "Waiting for backup completion..."
    sleep 30
done
echo "Backup verified, starting import"

5. 性能优化与陷阱规避

5.1 循环性能优化

避免在循环中调用外部命令：

bash复制# 不推荐 - 每次循环都调用date命令
for file in *
do
    touch -d "$(date)" "$file"
done

# 推荐 - 提前获取时间戳
current_date=$(date)
for file in *
do
    touch -d "$current_date" "$file"
done

使用更快的替代方案：

bash复制# 传统for循环
for i in {1..10000}
do
    echo $i
done

# 更快的seq命令
seq 1 10000 | while read i
do
    echo $i
done

5.2 常见陷阱与解决方案

文件名中的空格问题：

bash复制# 错误示范 - 遇到带空格文件名会出错
for file in $(ls)
do
    echo "Processing $file"
done

# 正确做法 - 使用通配符
for file in *
do
    echo "Processing $file"
done

循环变量污染：

bash复制# 错误示范 - 修改循环变量可能导致意外行为
for i in {1..10}
do
    ((i++))  # 这会干扰循环计数器
    echo $i
done

# 正确做法 - 使用不同变量名
for i in {1..10}
do
    j=$((i+1))
    echo $j
done

管道中的变量作用域：

bash复制# 变量在管道子shell中修改不会影响父shell
total=0
find . -type f | while read file
do
    ((total++))
done
echo "Total files: $total"  # 输出0

# 解决方案1 - 使用进程替换
while read file
do
    ((total++))
done < <(find . -type f)

# 解决方案2 - 使用临时文件
find . -type f > tmpfile
while read file
do
    ((total++))
done < tmpfile

6. 实战案例集锦

6.1 系统管理案例

批量创建用户并设置随机密码：

bash复制# 读取用户列表文件
while IFS=: read -r username realname
do
    # 生成随机密码
    password=$(openssl rand -base64 12)
    
    # 创建用户
    useradd -c "$realname" -m "$username"
    
    # 设置密码
    echo "$username:$password" | chpasswd
    
    # 记录日志
    echo "Created user $username ($realname) with password $password" >> user_create.log
done < user_list.txt

6.2 数据处理案例

统计日志文件中各状态码出现次数：

bash复制declare -A status_codes
while read -r line
do
    # 提取HTTP状态码
    status=$(echo "$line" | awk '{print $9}')
    
    # 统计出现次数
    ((status_codes[$status]++))
done < access.log

# 输出统计结果
for code in "${!status_codes[@]}"
do
    echo "Status $code: ${status_codes[$code]} times"
done

6.3 网络管理案例

批量测试服务器连通性：

bash复制servers=("web1" "web2" "db1" "db2" "cache1")
timeout=2
failed_servers=()

for server in "${servers[@]}"
do
    if ! ping -c 1 -W $timeout "$server" &> /dev/null
    then
        echo "ALERT: $server is down!"
        failed_servers+=("$server")
    else
        echo "$server is responding"
    fi
done

[ ${#failed_servers[@]} -gt 0 ] && \
    send_email "Server outage alert" "Down servers: ${failed_servers[*]}"

7. 高级技巧与最佳实践

7.1 并行循环处理

使用GNU parallel工具或后台进程实现并行处理：

bash复制# 使用xargs并行处理
find . -name "*.log" | xargs -P 4 -I {} gzip {}

# 使用后台进程
for file in large_*.csv
do
    process_file "$file" &
done
wait # 等待所有后台进程完成

7.2 循环与函数结合

将复杂循环逻辑封装成函数提高可读性：

bash复制process_image() {
    local file=$1
    convert "$file" -resize 800x600 "resized/$file"
    echo "Processed $file"
}

export -f process_image  # 让子shell也能使用这个函数

find . -name "*.jpg" | parallel process_image

7.3 性能监控与调优

在循环中添加性能监控点：

bash复制start_time=$(date +%s)
processed=0

for item in ${items[@]}
do
    process_item "$item"
    ((processed++))
    
    # 每处理100个项目打印进度
    if [ $((processed % 100)) -eq 0 ]; then
        current_time=$(date +%s)
        elapsed=$((current_time - start_time))
        rate=$(echo "scale=2; $processed/$elapsed" | bc)
        echo "Processed $processed items in $elapsed seconds ($rate items/sec)"
    fi
done