Linux——shell腳本編程2
shell腳本的調試方法
- -n:讀一遍腳本中的命令但不執行,用於檢查腳本中的語法錯誤
- -v:一邊執行腳本,一邊將執行過的腳本命令打印到標準錯誤輸出
- -x:提供跟蹤執行信息,將執行的每一條命令和結果依次打印出來
使用這些選項有三種方法,一是在命令行提供參數:
$ sh -x ./script.sh
二是在腳本開頭提供參數:
#! /bin/sh -x
第三種方法是在腳本中用set命令啟用或禁用參數:
#! /bin/sh if [ -z "$1" ]; then set -x # 啟用x參數 echo "ERROR: Insufficient Args." exit 1 set +x # 禁用x參數 fi
註:這樣可以只對腳本中的某一段進行跟蹤調試。
正則表達式
字符類:
字符 含義 舉例 . 匹配任意一個字符 abc.可以匹配abcd、abc9等 [] 匹配括號中的任意一個字符 [abc]d可以匹配ad、bd或cd - 在[]括號內表示字符範圍 [0-9a-fA-F]可以匹配一位十六進制數字 ^ 位於[]括號內的開頭,匹配除括號中的字符之外的任意一個字符 [^xy]匹配除xy之外的任一字符,因此[^xy]1可以匹配a1、b1但不匹配x1、y1 grep工具預定義的一些命名字符類:[[:alpha:]]匹配一個字母,[[:digit:]]匹配一個數字
數量限定符:
字符 含義 舉例 ? 緊跟在它前面的單元應匹配零次或一次 [0-9]?\.[0-9]匹配0.0、2.3、.5等,由於.在正則表達式中是一個特殊字符,所以需要用\轉義一下,取字面值 + 緊跟在它前面的單元應匹配一次或多次 [a-zA-Z0-9_.-]+@[a-zA-Z0-9_.-]+\.[a-zA-Z0-9_.-]+匹配email地址 * 緊跟在它前面的單元應匹配零次或多次 [0-9][0-9]*匹配至少一位數字,等價於[0-9]+,[a-zA-Z_]+[a-zA-Z_0-9]*匹配C語言的標識符 {N} 緊跟在它前面的單元應精確匹配N次 [1-9][0-9]{2}匹配從100到999的整數 {N,} 緊跟在它前面的單元應匹配至少N次 [1-9][0-9]{2,}匹配三位以上(含三位)的整數 {,M} 緊跟在它前面的單元應匹配最多M次 [0-9]{,1}相當於[0-9]? {N,M} 緊跟在它前面的單元應匹配至少N次,最多M次 [0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}匹配IP地址
位置限定符
字符 含義 舉例 ^ 匹配行首的位置 ^Content匹配位於一行開頭的Content $ 匹配行末的位置 $匹配位於一行結尾的;號,^$匹配空行 \< 匹配單詞開頭的位置 \<th匹配... this,但不匹配ethernet、tenth \> 匹配單詞結尾的位置 p\>匹配leap ...,但不匹配parent、sleepy \b 匹配單詞開頭或結尾的位置 \bat\b匹配... at ...,但不匹配cat、atexit、batch \B 匹配非單詞開頭和結尾的位置 \Bat\B匹配battery,但不匹配... attend、hat ...
其它特殊字符
字符 含義 舉例 \ 轉義字符,普通字符轉義為特殊字符,特殊字符轉義為普通字符 普通字符<寫成\<表示單詞開頭的位置,特殊字符.寫成\.以及\寫成\\就當作普通字符來匹配 () 將正則表達式的一部分括起來組成一個單元,可以對整個單元使用數量限定符 ([0-9]{1,3}\.){3}[0-9]{1,3}匹配IP地址 | 連接兩個子表達式,表示或的關系 n(o|either)匹配no或neither
以上的是grep正則表達式的Extended規範,Basic規範也有這些語法,只是字符?+{}|()應解釋為普通字符,要表示上述特殊含義則需要加\轉義。如果用grep而不是egrep,並且不加-E參數,則應該遵照Basic規範來寫正則表達式。
grep
grep找的是包含某一模式的行,而不是完全匹配某一模式的行。
1.作用
Linux系統中grep命令是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹 配的行打印出來。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用權限是所有用戶。
grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的擴展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它們把所有的字母都看作單詞,也就是說,正則表達式中的元字符表示回其自身的字面意義,不再特殊。linux使用GNU版本的grep。它功能更強,可以通過-G、-E、-F命令行選項來使用egrep和fgrep的功能。
2.格式
grep [options]
3.主要參數
- -c:只輸出匹配行的計數。
- -i:不區分大小寫。
- -h:查詢多文件時不顯示文件名。
- -l:查詢多文件時只輸出包含匹配字符的文件名。
- -n:顯示匹配行及 行號。
- -s:不顯示不存在或無匹配文本的錯誤信息。
- -v:顯示不包含匹配文本的所有行。
- --color=auto :可以將找到的關鍵詞部分加上顏色的顯示。
4、示例
$ grep ‘test’ d* 顯示所有以d開頭的文件中包含 test的行。 $ grep ‘test’ aa bb cc 顯示在aa,bb,cc文件中匹配test的行。 $ grep ‘[a-z]\{5\}’ aa 顯示所有包含每個字符串至少有5個連續小寫字符的字符串的行。 $ grep ‘w\(es\)t.*\1′ aa \1代表著()中匹配到的字符 如果west被匹配,則es就被存儲到內存中,並標記為1,然後搜索任意個字符(.*),這些字符後面緊跟著 另外一個es(\1),找到就顯示該行。如果用egrep或grep -E,就不用”\”號進行轉義,直接寫成’w(es)t.*\1′就可以了。
find
在運行一個非常消耗資源的find命令時,很多人都傾向於把它放在後臺執行,因為遍歷一個大的文件系統可能會花費很長的時間(這裏是指30G字節以上的文件系統)。
1、find命令格式:
find pathname -options [-print -exec -ok ...]
2、參數:
- pathname: find命令所查找的目錄路徑。例如用.來表示當前目錄,用/來表示系統根目錄,遞歸查找。
- -print: find命令將匹配的文件輸出到標準輸出。
- -exec: find命令對匹配的文件執行該參數所給出的shell命令。相應命令的形式為‘command‘ { } \;,註意{ }和\;之間的空格。
- -ok: 和-exec的作用相同,只不過以一種更為安全的模式來執行該參數所給出的shell命令,在執行每一個命令之前,都會給出提示,讓用戶來確定是否執行。
3、選項:
- -name 按照文件名查找文件。
- -perm 按照文件權限來查找文件。
- -prune 使用這一選項可以使find命令不在當前指定的目錄中查找,如果同時使用-depth選項,那麽-prune將被find命令忽略。
- -user 按照文件屬主來查找文件。
- -group 按照文件所屬的組來查找文件。
- -nogroup 查找無有效所屬組的文件,即該文件所屬的組在/etc/groups中不存在。
- -nouser 查找無有效屬主的文件,即該文件的屬主在/etc/passwd中不存在。
- -newer file1 ! file2 查找更改時間比文件file1新但比文件file2舊的文件。
- -type 查找某一類型的文件,諸如:
- b - 塊設備文件。
- d - 目錄。
- c - 字符設備文件。
- p - 管道文件。
- l - 符號鏈接文件。
- f - 普通文件。
- -size n:[c] 查找文件長度為n塊的文件,帶有c時表示文件長度以字節計。
- -depth 在查找文件時,首先查找當前目錄中的文件,然後再在其子目錄中查找。
- -fstype 查找位於某一類型文件系統中的文件,這些文件系統類型通常可以在配置文件/etc/fstab中找到,該配置文件中包含了本系統中有關文件系統的信息。
- -mount 在查找文件時不跨越文件系統mount點。
- -follow 如果find命令遇到符號鏈接文件,就跟蹤至鏈接所指向的文件。
- -amin n 查找系統中最後N分鐘訪問的文件
- -atime n 查找系統中最後n*24小時訪問的文件
- -cmin n 查找系統中最後N分鐘被改變文件狀態的文件
- -ctime n 查找系統中最後n*24小時被改變文件狀態的文件
- -mmin n 查找系統中最後N分鐘被改變文件數據的文件
- -mtime n 查找系統中最後n*24小時被改變文件數據的文件
4、使用exec或ok來執行shell命令
使用find時,只要把想要的操作寫在一個文件裏,就可以用exec來配合find查找,很方便 在有些操作系統中只允許-exec選項執行諸如ls或ls -l這樣的命令。大多數用戶使用這一選項是為了查找舊文件並刪除它們。建議在真正執行rm命令刪除文件之前,最好先用ls命令看一下,確認它們是所要刪除的文件。
exec選項後面跟隨著所要執行的命令或腳本,然後是一對兒{},一個空格和一個\,最後是一個分號。為了使用exec選項,必須要同時使用print選項。如果驗證一下find命令,會發現該命令只輸出從當前路徑起的相對路徑及文件名。
示例:
find . -type f -exec ls -l {} \; # 找到當前目錄下所有的普通文件,開一個子進程執行ls -l命令(將找到的所有文件放到緩沖區中,然後再一起執行命令) find logs -type f -mtime +5 -exec rm {} \; # 找到/logs目錄中查找更改時間在5日以前的文件並刪除它們 find . -name "*.conf" -mtime +5 -ok rm {} \; # 找到當前目錄中查找所有文件名以.conf結尾、更改時間在5日以上的文件,交互式提醒。 # < rm ... ./conf/httpd.conf > ? 按y鍵刪除文件,按n鍵不刪除。 find /etc -name "passwd*" -exec grep "root" {} \; # find命令首先匹配所有文件名為“ passwd*”的文件,然後執行grep命令看看在這些文件中是否存在一個root用戶。
5、選項詳解:
a.name選項
文件名選項是find命令最常用的選項,要麽單獨使用該選項,要麽和其他選項一起使用。
可以使用某種文件名模式來匹配文件,記住要用引號將文件名模式引起來。
不管當前路徑是什麽,如果想要在自己的根目錄$HOME中查找文件名符合*.txt的文件,使用~作為 ‘pathname‘參數,波浪號~代表了你的$HOME目錄。
想要在當前目錄及子目錄中查找所有的‘ *.txt’文件,可以用:
$ find . -name "*.txt" -print
想要的當前目錄及子目錄中查找文件名以一個大寫字母開頭的文件,可以用:
$ find . -name "[A-Z]*" -print
想要在/etc目錄中查找文件名以host開頭的文件,可以用:
$ find /etc -name "host*" -print
想要查找$HOME目錄中的文件,可以用:
$ find ~ -name "*" -print 或find . -print
要想讓系統高負荷運行,就從根目錄開始查找所有的文件:
$ find / -name "*" -print
如果想在當前目錄查找文件名以兩個小寫字母開頭,跟著是兩個數字,最後是.txt的文件,下面的命令就能夠返回例如名為ax37.txt的文件:
$find . -name "[a-z][a-z][0-9][0-9].txt" -print
b.用perm選項
按照文件權限模式用-perm選項,按文件權限模式來查找文件的話。最好使用八進制的權限表示法。
如在當前目錄下查找文件權限位為755的文件,即文件屬主可以讀、寫、執行,其他用戶可以讀、執行的文件,可以用:
$ find . -perm 755 -print
還有一種表達方法:在八進制數字前面要加一個橫杠-,表示都匹配,如-007就相當於777,-006相當於666
# ls -l # find . -perm 006 # find . -perm -006 -perm mode:文件許可正好符合mode -perm /mode:文件許可部分符合mode,6代表讀和寫,只要有2個中的一個就行 -perm -mode: 文件許可完全符合mode,必須要有指定的所有權限,多了也行,例如查找權限006:007,777...也行
c.忽略某個目錄
如果在查找文件時希望忽略某個目錄,因為你知道那個目錄中沒有你所要查找的文件,那麽可以使用-prune選項來指出需要忽略的目錄。在使用-prune選項時要當心,因為如果你同時使用了-depth選項,那麽-prune選項就會被find命令忽略。
如果希望在/apps目錄下查找文件,但不希望在/apps/bin目錄下查找,可以用:
$ find /apps -path "/apps/bin" -prune -o -print
避開多個文件夾
find /home \( -path /home/itcast/f1 -o -path /home/itcast/f2 \) -prune -o -print
註意(前的\,註意(後的空格。
d.使用user和nouser選項
按文件屬主查找文件,如在$HOME目錄中查找文件屬主為itcast的文件,可以用:
$ find ~ -user itcast -print
在/etc目錄下查找文件屬主為uucp的文件:
$ find /etc -user uucp -print
為了查找屬主帳戶已經被刪除的文件,可以使用-nouser選項。這樣就能夠找到那些屬主在/etc/passwd文件中沒有有效帳戶的文件。在使用-nouser選項時,不必給出用戶名; find命令能夠為你完成相應的工作。
例如,希望在/home目錄下查找所有的這類文件,可以用:
$ find /home -nouser -print
e.使用group和nogroup選項
就像user和nouser選項一樣,針對文件所屬於的用戶組, find命令也具有同樣的選項,為了在/apps目錄下查找屬於itcast用戶組的文件,可以用:
$ find /apps -group itcast -print
要查找沒有有效所屬用戶組的所有文件,可以使用nogroup選項。下面的find命令從文件系統的根目錄處查找這樣的文件
$ find / -nogroup -print
f.按照更改時間或訪問時間等查找文件
如果希望按照更改時間來查找文件,可以使用mtime,atime或ctime選項。如果系統突然沒有可用空間了,很有可能某一個文件的長度在此期間增長迅速,這時就可以用mtime選項來查找這樣的文件。
用減號-來限定更改時間在距今n日以內的文件,而用加號+來限定更改時間在距今n日以前的文件。
希望在系統根目錄下查找更改時間在5日以內的文件,可以用:
$ find / -mtime -5 -print
為了在/var/adm目錄下查找更改時間在3日以前的文件,可以用:
$ find /var/adm -mtime +3 -print
g.查找比某個文件新或舊的文件
如果希望查找更改時間比某個文件新但比另一個文件舊的所有文件,可以使用-newer選項。它的一般形式為:
newest_file_name ! oldest_file_name 其中,!是邏輯非符號。
h.使用type選項
在/etc目錄下查找所有的目錄,可以用:
$ find /etc -type d -print
在當前目錄下查找除目錄以外的所有類型的文件,可以用:
$ find . ! -type d -print
在/etc目錄下查找所有的符號鏈接文件,可以用
$ find /etc -type l -print
h.使用size選項
可以按照文件長度來查找文件,這裏所指的文件長度既可以用塊(block)來計量,也可以用字節來計量。以字節計量文件長度的表達形式為N c;以塊計量文件長度只用數字表示即可。
在按照文件長度查找文件時,一般使用這種以字節表示的文件長度,在查看文件系統的大小,因為這時使用塊來計量更容易轉換。 在當前目錄下查找文件長度大於1 M字節的文件:
$ find . -size +1000000c -print
在/home/apache目錄下查找文件長度恰好為100字節的文件:
$ find /home/apache -size 100c -print
在當前目錄下查找長度超過10塊的文件(一塊等於512字節):
$ find . -size +10 -print
i.使用depth選項
在使用find命令時,可能希望先匹配所有的文件,再在子目錄中查找。使用depth選項就可以使find命令這樣做。這樣做的一個原因就是,當在使用find命令向磁帶上備份文件系統時,希望首先備份所有的文件,其次再備份子目錄中的文件。
在下面的例子中, find命令從文件系統的根目錄開始,查找一個名為CON.FILE的文件。
它將首先匹配所有的文件然後再進入子目錄中查找。
$ find / -name "CON.FILE" -depth -print
j.使用mount選項
在當前的文件系統中查找文件(不進入其他文件系統),可以使用find命令的mount選項。
從當前目錄開始查找位於本文件系統中文件名以XC結尾的文件:
$ find . -name "*.XC" -mount -print
6、xargs
在使用find命令的-exec選項處理匹配到的文件時, find命令將所有匹配到的文件一起傳遞給exec執行。但有些系統對能夠傳遞給exec的命令長度有限制,這樣在find命令運行幾分鐘之後,就會出現 溢出錯誤。錯誤信息通常是“參數列太長”或“參數列溢出”。這就是xargs命令的用處所在,特別是與find命令一起使用。
find命令把匹配到的文件傳遞給xargs命令,而xargs命令每次只獲取一部分文件而不是全部,不像-exec選項那樣。這樣它可以先處理最先獲取的一部分文件,然後是下一批,並如此繼續下去。
在有些系統中,使用-exec選項會為處理每一個匹配到的文件而發起一個相應的進程,並非將匹配到的文件全部作為參數一次執行;這樣在有些情況下就會出現進程過多,系統性能下降的問題,因而效率不高;
而使用xargs命令則只有一個進程。另外,在使用xargs命令時,究竟是一次獲取所有的參數,還是分批取得參數,以及每一次獲取參數的數目都會根據該命令的選項及系統內核中相應的可調參數來確定。
來看看xargs命令是如何同find命令一起使用的,並給出一些例子。
下面的例子查找系統中的每一個普通文件,然後使用xargs命令來測試它們分別屬於哪類文 件
#find . -type f -print | xargs file
在當前目錄下查找所有用戶具有讀、寫和執行權限的文件,並收回相應的寫權限:
# ls -l # find . -perm -7 -print | xargs chmod o-w # ls -l
用grep命令在所有的普通文件中搜索hello這個詞:
# find . -type f -print | xargs grep "hello"
用grep命令在當前目錄下的所有普通文件中搜索hello這個詞:
# find . -name \* -type f -print | xargs grep "hello"
註意,在上面的例子中, \用來取消find命令中的*在shell中的特殊含義。
find命令配合使用exec和xargs可以使用戶對所匹配到的文件執行幾乎所有的命令。
sed
sed意為流編輯器(Stream Editor),在Shell腳本和Makefile中作為過濾器使用非常普遍,也就是把前一個程序的輸出引入sed的輸入,經過一系列編輯命令轉換為另一種格式輸出。sed和vi都源於早期UNIX的ed工具,所以很多sed命令和vi的末行命令是相同的。
sed命令行的基本格式為
sed option ‘script‘ file1 file2 ... sed option -f scriptfile file1 file2 ...
選項含義:
--version 顯示sed版本。 --help 顯示幫助文檔。 -n,--quiet,--silent 靜默輸出,默認情況下,sed程序在所有的腳本指令執行完畢後,將自動打印模式空間中的內容,這些選項可以屏蔽自動打印。 -e script 允許多個腳本指令被執行。 -f script-file, --file=script-file 從文件中讀取腳本指令,對編寫自動腳本程序來說很棒! -i,--in-place 直接修改源文件,經過腳本指令處理後的內容將被輸出至源文件(源文件被修改)慎用! -l N, --line-length=N 該選項指定l指令可以輸出的行長度,l指令用於輸出非打印字符。 --posix 禁用GNU sed擴展功能。 -r, --regexp-extended 在腳本指令中使用擴展正則表達式 -s, --separate 默認情況下,sed將把命令行指定的多個文件名作為一個長的連續的輸入流。而GNU sed則允許把他們當作單獨的文件,這樣如正則表達式則不進行跨文件匹配。 -u, --unbuffered 最低限度的緩存輸入與輸出。
以上僅是sed程序本身的選項功能說明,至於具體的腳本指令(即對文件內容做的操作)後面我們會詳細描述,這裏就簡單介紹幾個腳本指令操作作為sed程序的例子。
a,append 追加 i,insert 插入 d,delete 刪除 s,substitution 替換
如:$ sed "2a itcast" ./testfile 在輸出testfile內容的第二行後添加"itcast"。
$ sed "2,5d" testfile
sed處理的文件既可以由標準輸入重定向得到,也可以當命令行參數傳入,命令行參數可以一次傳入多個文件,sed會依次處理。sed的編輯命令可以直接當命令行參數傳入,也可以寫成一個腳本文件然後用-f參數指定,編輯命令的格式為
/pattern/action
其中pattern是正則表達式,action是編輯操作。sed程序一行一行讀出待處理文件,如果某一行與pattern匹配,則執行相應的action,如果一條命令沒有pattern而只有action,這個action將作用於待處理文件的每一行。
常用的sed命令
/pattern/p 打印匹配pattern的行 /pattern/d 刪除匹配pattern的行 /pattern/s/pattern1/pattern2/ 查找符合pattern的行,將該行第一個匹配pattern1的字符串替換為pattern2 /pattern/s/pattern1/pattern2/g 查找符合pattern的行,將該行所有匹配pattern1的字符串替換為pattern2
使用p命令需要註意,sed是把待處理文件的內容連同處理結果一起輸出到標準輸出的,因此p命令表示除了把文件內容打印出來之外還額外打印一遍匹配pattern的行。比如一個文件testfile的內容是
123 abc 456
打印其中包含abc的行
$ sed ‘/abc/p‘ testfile 123 abc abc 456
要想只輸出處理結果,應加上-n選項,這種用法相當於grep命令
$ sed -n ‘/abc/p‘ testfile abc
使用d命令就不需要-n參數了,比如刪除含有abc的行
$ sed ‘/abc/d‘ testfile 123 456
註意,sed命令不會修改原文件,刪除命令只表示某些行不打印輸出,而不是從原文件中刪去。
使用查找替換命令時,可以把匹配pattern1的字符串復制到pattern2中,比如:
$ sed ‘s/bc/-&-/‘ testfile 123 a-bc- 456 pattern2中的&表示原文件的當前行中與pattern1相匹配的字符串
再比如:
$ sed ‘s/\([0-9]\)\([0-9]\)/-\1-~\2~/‘ testfile -1-~2~3 abc -4-~5~6
pattern2中的\1表示與pattern1的第一個()括號相匹配的內容,\2表示與pattern1的第二個()括號相匹配的內容。sed默認使用Basic正則表達式規範,如果指定了-r選項則使用Extended規範,那麽()括號就不必轉義了。
$ sed ‘s/yes/no/;s/static/dhcp/‘ ./testfile 註:使用分號隔開指令。 $ sed -e ‘s/yes/no/‘ -e ‘s/static/dhcp/‘ testfile 註:使用-e選項。
如果testfile的內容是
<html><head><title>Hello World</title></head> <body>Welcome to the world of regexp!</body></html>
現在要去掉所有的HTML標簽,使輸出結果為
Hello World Welcome to the world of regexp!
怎麽做呢?如果用下面的命令
$ sed ‘s/<.*>//g‘ testfile
結果是兩個空行,把所有字符都過濾掉了。這是因為,正則表達式中的數量限定符會匹配盡可能長的字符串,這稱為貪心的(Greedy)。比如sed在處理第一行時,<.*>匹配的並不是或這樣的標簽,而是
<html><head><title>Hello World</title>
這樣一整行,因為這一行開頭是<,中間是若幹個任意字符,末尾是>。那麽這條命令怎麽改才對呢?留給同學們思考練習。
awk
sed以行為單位處理文件,awk比sed強的地方在於不僅能以行為單位還能以列為單位處理文件。awk缺省的行分隔符是換行,缺省的列分隔符是連續的空格和Tab,但是行分隔符和列分隔符都可以自定義,比如/etc/passwd文件的每一行有若幹個字段,字段之間以:分隔,就可以重新定義awk的列分隔符為:並以列為單位處理這個文件。awk實際上是一門很復雜的腳本語言,還有像C語言一樣的分支和循環結構,但是基本用法和sed類似,awk命令行的基本形式為:
awk option ‘script‘ file1 file2 ... awk option -f scriptfile file1 file2 ...
和sed一樣,awk處理的文件既可以由標準輸入重定向得到,也可以當命令行參數傳入,編輯命令可以直接當命令行參數傳入,也可以用-f參數指定一個腳本文件,編輯命令的格式為:
/pattern/{actions} condition{actions}
和sed類似,pattern是正則表達式,actions是一系列操作。awk程序一行一行讀出待處理文件,如果某一行與pattern匹配,或者滿足condition條件,則執行相應的actions,如果一條awk命令只有actions部分,則actions作用於待處理文件的每一行。比如文件testfile的內容表示某商店的庫存量:
ProductA 30 ProductB 76 ProductC 55
打印每一行的第二列:
$ awk ‘{print $2;}‘ testfile 30 76 55
自動變量$1、$2分別表示第一列、第二列等,類似於Shell腳本的位置參數,而$0表示整個當前行。再比如,如果某種產品的庫存量低於75則在行末標註需要訂貨:
$ awk ‘$2<75 {printf "%s\t%s\n", $0, "REORDER";} $2>=75 {print $0;}‘ testfile ProductA 30 REORDER ProductB 76 ProductC 55 REORDER
可見awk也有和C語言非常相似的printf函數。awk命令的condition部分還可以是兩個特殊的condition-BEGIN和END,對於每個待處理文件,BEGIN後面的actions在處理整個文件之前執行一次,END後面的actions在整個文件處理完之後執行一次。
awk命令可以像C語言一樣使用變量(但不需要定義變量),比如統計一個文件中的空行數
$ awk ‘/^ *$/ {x=x+1;} END {print x;}‘ testfile
就像Shell的環境變量一樣,有些awk變量是預定義的有特殊含義的:
awk常用的內建變量
FILENAME 當前輸入文件的文件名,該變量是只讀的 NR 當前行的行號,該變量是只讀的,R代表record NF 當前行所擁有的列數,該變量是只讀的,F代表field OFS 輸出格式的列分隔符,缺省是空格 FS 輸入文件的列分融符,缺省是連續的空格和Tab ORS 輸出格式的行分隔符,缺省是換行符 RS 輸入文件的行分隔符,缺省是換行符
例如打印系統中的用戶帳號列表
$ awk ‘BEGIN {FS=":"} {print $1;}‘ /etc/passwd
Linux——shell腳本編程2