1. 程式人生 > >UNIX運維的十個好習慣

UNIX運維的十個好習慣

採用 10 個能夠提高您的 UNIX 命令列效率的好習慣——並在此過程中擺脫不良的使用模式。本文循序漸進地指導您學習幾項用於命令列操作的技術,這些技術非常好,但是通常被忽略。瞭解常見錯誤和克服它們的方法,以便您能夠確切瞭解為何值得采用這些 UNIX 習慣。

引言

當您經常使用某個系統時,往往會陷入某種固定的使用模式。有時,您沒有養成以儘可能最好的方式做事的習慣。有時,您的不良習慣甚至會導致出現混亂。糾正此類缺點的最佳方法之一,就是有意識地採用抵制這些壞習慣的好習慣。本文提出了 10 個值得采用的 UNIX 命令列習慣——幫助您克服許多常見使用怪癖,並在該過程中提高命令列工作效率的好習慣。下面列出了這 10 個好習慣,之後對進行了更詳細的描述。

採用 10 個好習慣

要採用的十個好習慣為:

1. 在單個命令中建立目錄樹。
2. 更改路徑;不要移動存檔。
3. 將命令與控制操作符組合使用。
4. 謹慎引用變數。
5. 使用轉義序列來管理較長的輸入。
6. 在列表中對命令分組。
7. 在find之外使用xargs。
8. 瞭解何時grep應該執行計數——何時應該繞過。
9. 匹配輸出中的某些欄位,而不只是對行進行匹配。
10. 停止對cat使用管道。

在單個命令中建立目錄樹

清單 1 演示了最常見的 UNIX 壞習慣之一:一次定義一個目錄樹。

清單 1. 壞習慣 1 的示例:單獨定義每個目錄樹

~ $ mkdir tmp
~ $ cd tmp
~/tmp $ mkdir a
~/tmp $ cd a
~/tmp/a $ mkdir b
~/tmp/a $ cd b
~/tmp/a/b/ $ mkdir c
~/tmp/a/b/ $ cd c
~/tmp/a/b/c $

使用 mkdir 的 -p 選項並在單個命令中建立所有父目錄及其子目錄要容易得多。但是即使對於知道此選項的管理員,他們在命令列上建立子目錄時也仍然束縛於逐步建立每級子目錄。花時間有意識地養成這個好習慣是值得的:

清單 2. 好習慣 1 的示例:使用一個命令來定義目錄樹

~ $ mkdir -p tmp/a/b/c

您可以使用此選項來建立整個複雜的目錄樹(在指令碼中使用是非常理想的),而不只是建立簡單的層次結構。例如:

清單 3. 好習慣 1 的另一個示例:使用一個命令來定義複雜的目錄樹

~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}

過去,單獨定義目錄的唯一藉口是您的 mkdir 實現不支援此選項,但是在大多數系統上不再是這樣了。IBM、AIX 、mkdir、GNU mkdir 和其他遵守單一 UNIX 規範 (Single UNIX Specification) 的系統現在都具有此選項。

對於仍然缺乏該功能的少數系統,您可以使用 mkdirhier 指令碼,此指令碼是執行相同功能的 mkdir 的包裝:

~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}

更改路徑;不要移動存檔

另一個不良的使用模式是將 .tar 存檔檔案移動到某個目錄,因為該目錄恰好是您希望在其中提取 .tar 檔案的目錄。其實您根本不需要這樣做。您可以隨心所欲地將任何 .tar 存檔檔案解壓縮到任何目錄——這就是 -C 選項的用途。在解壓縮某個存檔檔案時,使用 -C 選項來指定要在其中解壓縮該檔案的目錄:

清單 4. 好習慣 2 的示例:使用選項 -C 來解壓縮 .tar 存檔檔案

~ $ tar xvf -C tmp/a/b/c newarc.tar.gz

相對於將存檔檔案移動到您希望在其中解壓縮它的位置,切換到該目錄,然後才解壓縮它,養成使用-C的習慣則更加可取——當存檔檔案位於其他某個位置時尤其如此。

將命令與控制操作符組合使用

您可能已經知道,在大多數 Shell 中,您可以在單個命令列上通過在命令之間放置一個分號 (;) 來組合命令。該分號是 Shell 控制操作符,雖然它對於在單個命令列上將離散的命令串聯起來很有用,但它並不適用於所有情況。例如,假設您使用分號來組合兩個命令,其中第二個命令的正確執行完全依賴於第一個命令的成功完成。如果第一個命令未按您預期的那樣退出,第二個命令仍然會執行——結果會導致失敗。相反,應該使用更適當的控制操作符(本文將描述其中的部分操作符)。只要您的 Shell 支援它們,就值得養成使用它們的習慣。

僅當另一個命令返回零退出狀態時才執行某個命令

使用 && 控制操作符來組合兩個命令,以便僅當 第一個命令返回零退出狀態時才執行第二個命令。換句話說,如果第一個命令執行成功,則第二個命令將執行。如果第一個命令失敗,則第二個命令根本就不執行。例如:

清單 5. 好習慣 3 的示例:將命令與控制操作符組合使用

~ $ cd tmp/a/b/c && tar xvf ~/archive.tar

在此例中,存檔的內容將提取到 ~/tmp/a/b/c 目錄中,除非該目錄不存在。如果該目錄不存在,則tar 命令不會執行,因此不會提取任何內容。

僅當另一個命令返回非零退出狀態時才執行某個命令

類似地,|| 控制操作符分隔兩個命令,並且僅當第一個命令返回非零退出狀態時才執行第二個命令。換句話說,如果第一個命令成功,則第二個命令不會執行。如果第一個命令失敗,則第二個命令才會 執行。在測試某個給定目錄是否存在時,通常使用此操作符,如果該目錄不存在,則建立它:

清單 6. 好習慣 3 的另一個示例:將命令與控制操作符組合使用

~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c

您還可以組合使用本部分中描述的控制操作符。每個操作符都影響最後的命令執行:

清單 7. 好習慣 3 的組合示例:將命令與控制操作符組合使用

~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar

謹慎引用變數

始終要謹慎使用 Shell 擴充套件和變數名稱。一般最好將變數呼叫包括在雙引號中,除非您有不這樣做的足夠理由。類似地,如果您直接在字母數字文字後面使用變數名稱,則還要確保將該變數名稱包括在方括號 ([]) 中,以使其與周圍的文字區分開來。否則,Shell 將把尾隨文字解釋為變數名稱的一部分——並且很可能返回一個空值。清單 8 提供了變數的各種引用和非引用及其影響的示例。

清單 8. 好習慣 4 的示例:引用(和非引用)變數

[code lang=”shell”]~ $ ls tmp/
a b
~ $ VAR="tmp/*"
~ $ echo $VAR
tmp/a tmp/b
~ $ echo "$VAR"
tmp/*
~ $ echo $VARa

~ $ echo "$VARa"

~ $ echo "${VAR}a"
tmp/*a
~ $ echo ${VAR}a
tmp/a
~ $[/code]

使用轉義序列來管理較長的輸入

您或許看到過使用反斜槓 (\) 來將較長的行延續到下一行的程式碼示例,並且您知道大多數 Shell 都將您通過反斜槓聯接的後續行上鍵入的內容視為單個長行。然而,您可能沒有在命令列中像通常那樣利用此功能。如果您的終端無法正確處理多行迴繞,或者您的命令列比通常小(例如在提示符下有長路經的時候),反斜槓就特別有用。反斜槓對於瞭解鍵入的長輸入行的含義也非常有用,如以下示例所示:

清單 9. 好習慣 5 的示例:將反斜槓用於長輸入

~ $ cd tmp/a/b/c || \
> mkdir -p tmp/a/b/c && \
> tar xvf -C tmp/a/b/c ~/archive.tar

或者,也可以使用以下配置:

清單 10. 好習慣 5 的替代示例:將反斜槓用於長輸入

~ $ cd tmp/a/b/c \
> || \
> mkdir -p tmp/a/b/c \
> && \
> tar xvf -C tmp/a/b/c ~/archive.tar

然而,當您將輸入行劃分到多行上時,Shell 始終將其視為單個連續的行,因為它總是刪除所有反斜槓和額外的空格。

注意:在大多數 Shell 中,當您按向上箭頭鍵時,整個多行輸入將重繪到單個長輸入行上。

在列表中對命令分組

大多數 Shell 都具有在列表中對命令分組的方法,以便您能將它們的合計輸出向下傳遞到某個管道,或者將其任何部分或全部流重定向到相同的地方。您一般可以通過在某個 Subshell 中執行一個命令列表或通過在當前 Shell 中執行一個命令列表來實現此目的。

在 Subshell 中執行命令列表

使用括號將命令列表包括在單個組中。這樣做將在一個新的 Subshell 中執行命令,並允許您重定向或收集整組命令的輸出,如以下示例所示:

清單 11. 好習慣 6 的示例:在 Subshell 中執行命令列表

~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \
> VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \
> | mailx admin -S "Archive contents"

在此示例中,該存檔的內容將提取到 tmp/a/b/c/ 目錄中,同時將分組命令的輸出(包括所提取檔案的列表)通過郵件傳送到地址 admin。

當您在命令列表中重新定義環境變數,並且您不希望將那些定義應用於當前 Shell 時,使用 Subshell 更可取。

在當前 Shell 中執行命令列表

將命令列表用大括號 ({}) 括起來,以在當前 Shell 中執行。確保在括號與實際命令之間包括空格,否則 Shell 可能無法正確解釋括號。此外,還要確保列表中的最後一個命令以分號結尾,如以下示例所示:

清單 12. 好習慣 6 的另一個示例:在當前 Shell 中執行命令列表

~ $ { cp ${VAR}a . && chown -R guest.guest a && \
> tar cvf newarchive.tar a; } | mailx admin -S "New archive"

在 find 之外使用 xargs

使用 xargs 工具作為篩選器,以充分利用從 find 命令挑選的輸出。find 執行通常提供與某些條件匹配的檔案列表。此列表被傳遞到 xargs上,後者然後使用該檔案列表作為引數來執行其他某些有用的命令,如以下示例所示:

清單 13. xargs 工具的經典用法示例

~ $ find some-file-criteria some-file-path | \
> xargs some-great-command-that-needs-filename-arguments

然而,不要將 xargs 僅看作是 find 的輔助工具;它是一個未得到充分利用的工具之一,當您養成使用它的習慣時,將會希望進行所有試驗,包括以下用法。

傳遞空格分隔的列表

在最簡單的呼叫形式中,xargs 就像一個篩選器,它接受一個列表(每個成員分別在單獨的行上)作為輸入。該工具將那些成員放置在單個空格分隔的行上:

清單 14. xargs 工具產生的輸出示例

~ $ xargsabcControl-D
a b c
~ $

您可以傳送通過 xargs 來輸出檔名的任何工具的輸出,以便為其他某些接受檔名作為引數的工具獲得引數列表,如以下示例所示:

清單 15. xargs 工具的使用示例

~/tmp $ ls -1 | xargs
December_Report.pdf README a archive.tar mkdirhier.sh
~/tmp $ ls -1 | xargs file
December_Report.pdf: PDF document, version 1.3
README: ASCII text
a: directory
archive.tar: POSIX tar archive
mkdirhier.sh: Bourne shell script text executable
~/tmp $

xargs 命令不只用於傳遞檔名。您還可以在需要將文字篩選到單個行中的任何時候使用它:

清單 16. 好習慣 7 的示例:使用 xargs 工具來將文字篩選到單個行中

~/tmp $ ls -l | xargs
-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \
root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \
16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \
joe joe 3239 Sep 30 12:40 mkdirhier.sh
~/tmp $

謹慎使用 xargs

從技術上講,使用 xargs 很少遇到麻煩。預設情況下,檔案結束字串是下劃線 (_);如果將該字元作為單個輸入引數來發送,則它之後的所有內容將被忽略。為了防止這種情況發生,可以使用 -e 標誌,它在不帶引數的情況下完全禁用結束字串。

瞭解何時 grep 應該執行計數——何時應該繞過

避免通過管道將 grep 傳送到 wc -l 來對輸出行數計數。grep 的 -c 選項提供了對與特定模式匹配的行的計數,並且一般要比通過管道傳送到 wc 更快,如以下示例所示:

清單 17. 好習慣 8 的示例:使用和不使用 grep 的行計數

[code lang=”shell”]~ $ time grep and tmp/a/longfile.txt | wc -l
2811

real 0m0.097s
user 0m0.006s
sys 0m0.032s
~ $ time grep -c and tmp/a/longfile.txt
2811

real 0m0.013s
user 0m0.006s
sys 0m0.005s
~ $[/code]

除了速度因素外,-c 選項還是執行計數的好方法。對於多個檔案,帶 -c 選項的 grep 返回每個檔案的單獨計數,每行一個計數,而針對 wc 的管道則提供所有檔案的組合總計數。

然而,不管是否考慮速度,此示例都表明了另一個要避免地常見錯誤。這些計數方法僅提供包含匹配模式的行數——如果那就是您要查詢的結果,這沒什麼問題。但是在行中具有某個特定模式的多個例項的情況下,這些方法無法為您提供實際匹配例項數量 的真實計數。歸根結底,若要對例項計數,您還是要使用 wc 來計數。首先,使用 -o 選項(如果您的版本支援它的話)來執行 grep 命令。此選項 輸出匹配的模式,每行一個模式,而不輸出行本身。但是您不能將它與 -c 選項結合使用,因此要使用 wc -l 來對行計數,如以下示例所示:

清單 18. 好習慣 8 的示例:使用 grep 對模式例項計數

~ $ grep -o and tmp/a/longfile.txt | wc -l
3402
~ $

在此例中,呼叫 wc 要比第二次呼叫 grep 並插入一個虛擬模式(例如 grep -c)來對行進行匹配和計數稍快一點。

匹配輸出中的某些欄位,而不只是對行進行匹配

當您只希望匹配輸出行中特定欄位 中的模式時,諸如 awk 等工具要優於 grep。

下面經過簡化的示例演示瞭如何僅列出 12 月修改過的檔案。

清單 19. 壞習慣 9 的示例:使用 grep 來查詢特定欄位中的模式

~/tmp $ ls -l /tmp/a/b/c | grep Dec
-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf
-rw-r--r-- 1 root root 238 Dec 03 08:19 README
-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar
~/tmp $

在此示例中,grep 對行進行篩選,並輸出其修改日期和名稱中帶 Dec 的所有檔案。因此,諸如 December_Report.pdf 等檔案是匹配的,即使它自從一月份以來還未修改過。這可能不是您希望的結果。為了匹配特定欄位中的模式,最好使用 awk,其中的一個關係運算符對確切的欄位進行匹配,如以下示例所示:

清單 20. 好習慣 9 的示例:使用 awk 來查詢特定欄位中的模式

~/tmp $ ls -l | awk '$6 == "Dec"'
-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar
-rw-r--r-- 1 root root 238 Dec 03 08:19 README
~/tmp $

停止對 cat 使用管道

grep 的一個常見的基本用法錯誤是通過管道將 cat 的輸出傳送到 grep 以搜尋單個檔案的內容。這絕對是不必要的,純粹是浪費時間,因為諸如 grep 這樣的工具接受檔名作為引數。您根本不需要在這種情況下使用 cat,如以下示例所示:

清單 21. 好習慣和壞習慣 10 的示例:使用帶和不帶 cat 的 grep

[code lang=”shell”]~ $ time cat tmp/a/longfile.txt | grep and
2811

real 0m0.015s
user 0m0.003s
sys 0m0.013s
~ $ time grep and tmp/a/longfile.txt
2811

real 0m0.010s
user 0m0.006s
sys 0m0.004s
~ $[/code]

此錯誤存在於許多工具中。由於大多數工具都接受使用連字元 (-) 的標準輸入作為一個引數,因此即使使用 cat 來分散 stdin 中的多個檔案,引數也通常是無效的。僅當您使用帶多個篩選選項之一的cat時,才真正有必要在管道前首先執行連線。

結束語:養成好習慣

最好檢查一下您的命令列習慣中的任何不良的使用模式。不良的使用模式會降低您的速度,並且通常會導致意外錯誤。本文介紹了 10 個新習慣,它們可以幫助您擺脫許多最常見的使用錯誤。養成這些好習慣是加強您的 UNIX 命令列技能的積極步驟。