在这关于流程控制的最后一章中,我们将看看另一种 shell 循环构造。for 循环不同于 while 和 until 循环,因为在循环中,它提供了一种处理序列的方式。这证明在编程时非常有用。因此在 bash 脚本中,for 循环是非常流行的构造。 实现一个 for 循环,很自然的,要用 for 命令。在现代版的 bash 中,有两种可用的 for 循环格式。
for: 传统 shell 格式 原来的 for 命令语法是: for variable [in words]; do commands done 这里的 variable 是一个变量的名字,这个变量在循环执行期间会增加,words 是一个可选的条目列表, 其值会按顺序赋值给 variable,commands 是在每次循环迭代中要执行的命令。 在命令行中 for 命令是很有用的。我们可以很容易的说明它是如何工作的: [me@linuxbox ~]$ for i in A B C D; do echo $i; done A B C D 在这个例子中,for 循环有一个四个单词的列表:“A”,“B”,“C”,和 “D”。由于这四个单词的列表,for 循环会执行四次。每次循环执行的时候,就会有一个单词赋值给变量 i。在循环体内,我们有一个 echo 命令会显示 i 变量的值,来演示赋值结果。正如 while 和 until 循环,done 关键字会关闭循环。 for 命令真正强大的功能是我们可以通过许多有趣的方式创建 words 列表。例如,通过花括号展开: [me@linuxbox ~]$ for i in {A..D}; do echo $i; done A B C D 或者路径名展开: [me@linuxbox ~]$ for i in distros*.txt; do echo $i; done distros-by-date.txt distros-dates.txt distros-key-names.txt distros-key-vernums.txt distros-names.txt distros.txt distros-vernums.txt distros-versions.txt 或者命令替换: #!/bin/bash # longest-word : find longest string in a file while [[ -n $1 ]]; do if [[ -r $1 ]]; then max_word= max_len=0 for i in $(strings $1); do len=$(echo $i | wc -c) if (( len > max_len )); then max_len=$len max_word=$i fi done echo "$1: '$max_word' ($max_len characters)" fi shift done 在这个示例中,我们要在一个文件中查找最长的字符串。当在命令行中给出一个或多个文件名的时候,该程序会使用 strings 程序(其包含在 GNU binutils 包中),为每一个文件产生一个可读的文本格式的 “words” 列表。然后这个 for 循环依次处理每个单词,判断当前这个单词是否为目前为止找到的最长的一个。当循环结束的时候,显示出最长的单词。 如果省略掉 for 命令的可选项 words 部分,for 命令会默认处理位置参数。我们将修改 longest-word 脚本,来使用这种方式: #!/bin/bash # longest-word2 : find longest string in a file for i; do if [[ -r $i ]]; then max_word= max_len=0 for j in $(strings $i); do len=$(echo $j | wc -c) if (( len > max_len )); then max_len=$len max_word=$j fi done echo "$i: '$max_word' ($max_len characters)" fi done 正如我们所看到的,我们已经更改了最外围的循环,用 for 循环来代替 while 循环。通过省略 for 命令的 words 列表,用位置参数替而代之。在循环体内,之前的变量 i 已经改为变量 j。同时 shift 命令也被淘汰掉了。
为什么是 i? 你可能已经注意到上面所列举的 for 循环的实例都选择 i 作为变量。为什么呢?实际上没有具体原因,除了传统习惯。for 循环使用的变量可以是任意有效的变量,但是 i 是最常用的一个,其次是 j 和 k。 这一传统的基础源于 Fortran 编程语言。在 Fortran 语言中,以字母 I,J,K,L 和 M 开头的未声明变量的类型自动设为整形,而以其它字母开头的变量则为实数类型(带有小数的数字)。这种行为导致程序员使用变量 I,J,和 K 作为循环变量,因为当需要一个临时变量(正如循环变量)的时候,使用它们工作量比较少。这也引出了如下基于 fortran 的俏皮话: “神是真实的,除非是声明的整数。”
for: C 语言格式 最新版本的 bash 已经添加了第二种格式的 for 命令语法,该语法相似于 C 语言中的 for 语法格式。其它许多编程语言也支持这种格式: for (( expression1; expression2; expression3 )); do commands done 这里的 expression1,expression2,和 expression3 都是算术表达式,commands 是每次循环迭代时要执行的命令。在行为方面,这相当于以下构造形式: (( expression1 )) while (( expression2 )); do commands (( expression3 )) done expression1 用来初始化循环条件,expression2 用来决定循环结束的时间,还有在每次循环迭代的末尾会执行 expression3。 这里是一个典型应用: #!/bin/bash # simple_counter : demo of C style for command for (( i=0; i<5; i=i+1 )); do echo $i done 脚本执行之后,产生如下输出: [me@linuxbox ~]$ simple_counter 0 1 2 3 4 在这个示例中,expression1 初始化变量 i 的值为0,expression2 允许循环继续执行只要变量 i 的值小于5,还有每次循环迭代时,expression3 会把变量 i 的值加1。 C 语言格式的 for 循环对于需要一个数字序列的情况是很有用处的。我们将在接下来的两章中看到几个这样的应用实例。
总结 学习了 for 命令的知识,现在我们将对我们的 sys_info_page 脚本做最后的改进。目前,这个 report_home_space 函数看起来像这样: report_home_space () { if [[ $(id -u) -eq 0 ]]; then cat <<- _EOF_ <H2>Home Space Utilization (All Users)</H2> <PRE>$(du -sh /home/*)</PRE> _EOF_ else cat <<- _EOF_ <H2>Home Space Utilization ($USER)</H2> <PRE>$(du -sh $HOME)</PRE> _EOF_ fi return } 下一步,我们将重写它,以便提供每个用户家目录的更详尽信息,并且包含用户家目录中文件和目录的总个数: report_home_space () { local format="%8s%10s%10s\n" local i dir_list total_files total_dirs total_size user_name if [[ $(id -u) -eq 0 ]]; then dir_list=/home/* user_name="All Users" else dir_list=$HOME user_name=$USER fi echo "<H2>Home Space Utilization ($user_name)</H2>" for i in $dir_list; do total_files=$(find $i -type f | wc -l) total_dirs=$(find $i -type d | wc -l) total_size=$(du -sh $i | cut -f 1) echo "<H3>$i</H3>" echo "<PRE>" printf "$format" "Dirs" "Files" "Size" printf "$format" "----" "-----" "----" printf "$format" $total_dirs $total_files $total_size echo "</PRE>" done return } 这次重写应用了目前为止我们学过的许多知识。我们仍然测试超级用户(superuser),但是我们在 if 语句块内设置了一些随后会在 for 循环中用到的变量,来取代在 if 语句块内执行完备的动作集合。我们添加了给函数添加了几个本地变量,并且使用 printf 来格式化输出。
相关主题 |