UNIX運維的十個好習慣

阿新 • • 發佈：2018-12-27

採用 10 個能夠提高您的 UNIX 命令列效率的好習慣——並在此過程中擺脫不良的使用模式。本文循序漸進地指導您學習幾項用於命令列操作的技術，這些技術非常好，但是通常被忽略。瞭解常見錯誤和克服它們的方法，以便您能夠確切瞭解為何值得采用這些 UNIX 習慣。

引言

當您經常使用某個系統時，往往會陷入某種固定的使用模式。有時，您沒有養成以儘可能最好的方式做事的習慣。有時，您的不良習慣甚至會導致出現混亂。糾正此類缺點的最佳方法之一，就是有意識地採用抵制這些壞習慣的好習慣。本文提出了 10 個值得采用的 UNIX 命令列習慣——幫助您克服許多常見使用怪癖，並在該過程中提高命令列工作效率的好習慣。下面列出了這 10 個好習慣，之後對進行了更詳細的描述。

採用 10 個好習慣

要採用的十個好習慣為：

1. 在單個命令中建立目錄樹。
2. 更改路徑；不要移動存檔。
3. 將命令與控制操作符組合使用。
4. 謹慎引用變數。
5. 使用轉義序列來管理較長的輸入。
6. 在列表中對命令分組。
7. 在find之外使用xargs。
8. 瞭解何時grep應該執行計數——何時應該繞過。
9. 匹配輸出中的某些欄位，而不只是對行進行匹配。
10. 停止對cat使用管道。

在單個命令中建立目錄樹

清單 1 演示了最常見的 UNIX 壞習慣之一：一次定義一個目錄樹。

清單 1. 壞習慣 1 的示例：單獨定義每個目錄樹

~ $ mkdir tmp ~ $ cd tmp ~/tmp $ mkdir a ~/tmp $ cd a ~/tmp/a $ mkdir b ~/tmp/a $ cd b ~/tmp/a/b/ $ mkdir c ~/tmp/a/b/ $ cd c ~/tmp/a/b/c $

使用 mkdir 的 -p 選項並在單個命令中建立所有父目錄及其子目錄要容易得多。但是即使對於知道此選項的管理員，他們在命令列上建立子目錄時也仍然束縛於逐步建立每級子目錄。花時間有意識地養成這個好習慣是值得的：

清單 2. 好習慣 1 的示例：使用一個命令來定義目錄樹

~ $ mkdir -p tmp/a/b/c

您可以使用此選項來建立整個複雜的目錄樹（在指令碼中使用是非常理想的），而不只是建立簡單的層次結構。例如：

清單 3. 好習慣 1 的另一個示例：使用一個命令來定義複雜的目錄樹

~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}

過去，單獨定義目錄的唯一藉口是您的 mkdir 實現不支援此選項，但是在大多數系統上不再是這樣了。IBM、AIX 、mkdir、GNU mkdir 和其他遵守單一 UNIX 規範 (Single UNIX Specification) 的系統現在都具有此選項。

對於仍然缺乏該功能的少數系統，您可以使用 mkdirhier 指令碼，此指令碼是執行相同功能的 mkdir 的包裝：

~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}

更改路徑；不要移動存檔

另一個不良的使用模式是將 .tar 存檔檔案移動到某個目錄，因為該目錄恰好是您希望在其中提取 .tar 檔案的目錄。其實您根本不需要這樣做。您可以隨心所欲地將任何 .tar 存檔檔案解壓縮到任何目錄——這就是 -C 選項的用途。在解壓縮某個存檔檔案時，使用 -C 選項來指定要在其中解壓縮該檔案的目錄：

清單 4. 好習慣 2 的示例：使用選項 -C 來解壓縮 .tar 存檔檔案

~ $ tar xvf -C tmp/a/b/c newarc.tar.gz

相對於將存檔檔案移動到您希望在其中解壓縮它的位置，切換到該目錄，然後才解壓縮它，養成使用-C的習慣則更加可取——當存檔檔案位於其他某個位置時尤其如此。

將命令與控制操作符組合使用

您可能已經知道，在大多數 Shell 中，您可以在單個命令列上通過在命令之間放置一個分號 (;) 來組合命令。該分號是 Shell 控制操作符，雖然它對於在單個命令列上將離散的命令串聯起來很有用，但它並不適用於所有情況。例如，假設您使用分號來組合兩個命令，其中第二個命令的正確執行完全依賴於第一個命令的成功完成。如果第一個命令未按您預期的那樣退出，第二個命令仍然會執行——結果會導致失敗。相反，應該使用更適當的控制操作符（本文將描述其中的部分操作符）。只要您的 Shell 支援它們，就值得養成使用它們的習慣。

僅當另一個命令返回零退出狀態時才執行某個命令

使用 && 控制操作符來組合兩個命令，以便僅當第一個命令返回零退出狀態時才執行第二個命令。換句話說，如果第一個命令執行成功，則第二個命令將執行。如果第一個命令失敗，則第二個命令根本就不執行。例如：

清單 5. 好習慣 3 的示例：將命令與控制操作符組合使用

~ $ cd tmp/a/b/c && tar xvf ~/archive.tar

在此例中，存檔的內容將提取到 ~/tmp/a/b/c 目錄中，除非該目錄不存在。如果該目錄不存在，則tar 命令不會執行，因此不會提取任何內容。

僅當另一個命令返回非零退出狀態時才執行某個命令

類似地，|| 控制操作符分隔兩個命令，並且僅當第一個命令返回非零退出狀態時才執行第二個命令。換句話說，如果第一個命令成功，則第二個命令不會執行。如果第一個命令失敗，則第二個命令才會執行。在測試某個給定目錄是否存在時，通常使用此操作符，如果該目錄不存在，則建立它：

清單 6. 好習慣 3 的另一個示例：將命令與控制操作符組合使用

~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c

您還可以組合使用本部分中描述的控制操作符。每個操作符都影響最後的命令執行：

清單 7. 好習慣 3 的組合示例：將命令與控制操作符組合使用

~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar

謹慎引用變數

始終要謹慎使用 Shell 擴充套件和變數名稱。一般最好將變數呼叫包括在雙引號中，除非您有不這樣做的足夠理由。類似地，如果您直接在字母數字文字後面使用變數名稱，則還要確保將該變數名稱包括在方括號 ([]) 中，以使其與周圍的文字區分開來。否則，Shell 將把尾隨文字解釋為變數名稱的一部分——並且很可能返回一個空值。清單 8 提供了變數的各種引用和非引用及其影響的示例。

清單 8. 好習慣 4 的示例：引用（和非引用）變數

[code lang=”shell”]~ $ ls tmp/
a b
~ $ VAR="tmp/*"
~ $ echo $VAR
tmp/a tmp/b
~ $ echo "$VAR"
tmp/*
~ $ echo $VARa

~ $ echo "$VARa"

~ $ echo "${VAR}a"
tmp/*a
~ $ echo ${VAR}a
tmp/a
~ $[/code]

使用轉義序列來管理較長的輸入

您或許看到過使用反斜槓 (\) 來將較長的行延續到下一行的程式碼示例，並且您知道大多數 Shell 都將您通過反斜槓聯接的後續行上鍵入的內容視為單個長行。然而，您可能沒有在命令列中像通常那樣利用此功能。如果您的終端無法正確處理多行迴繞，或者您的命令列比通常小（例如在提示符下有長路經的時候），反斜槓就特別有用。反斜槓對於瞭解鍵入的長輸入行的含義也非常有用，如以下示例所示：

清單 9. 好習慣 5 的示例：將反斜槓用於長輸入

~ $ cd tmp/a/b/c || \ > mkdir -p tmp/a/b/c && \ > tar xvf -C tmp/a/b/c ~/archive.tar

或者，也可以使用以下配置：

清單 10. 好習慣 5 的替代示例：將反斜槓用於長輸入

~ $ cd tmp/a/b/c \ > || \ > mkdir -p tmp/a/b/c \ > && \ > tar xvf -C tmp/a/b/c ~/archive.tar

然而，當您將輸入行劃分到多行上時，Shell 始終將其視為單個連續的行，因為它總是刪除所有反斜槓和額外的空格。

注意：在大多數 Shell 中，當您按向上箭頭鍵時，整個多行輸入將重繪到單個長輸入行上。

在列表中對命令分組

大多數 Shell 都具有在列表中對命令分組的方法，以便您能將它們的合計輸出向下傳遞到某個管道，或者將其任何部分或全部流重定向到相同的地方。您一般可以通過在某個 Subshell 中執行一個命令列表或通過在當前 Shell 中執行一個命令列表來實現此目的。

在 Subshell 中執行命令列表

使用括號將命令列表包括在單個組中。這樣做將在一個新的 Subshell 中執行命令，並允許您重定向或收集整組命令的輸出，如以下示例所示：

清單 11. 好習慣 6 的示例：在 Subshell 中執行命令列表

~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \ > VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \ > | mailx admin -S "Archive contents"

在此示例中，該存檔的內容將提取到 tmp/a/b/c/ 目錄中，同時將分組命令的輸出（包括所提取檔案的列表）通過郵件傳送到地址 admin。

當您在命令列表中重新定義環境變數，並且您不希望將那些定義應用於當前 Shell 時，使用 Subshell 更可取。

在當前 Shell 中執行命令列表

將命令列表用大括號 ({}) 括起來，以在當前 Shell 中執行。確保在括號與實際命令之間包括空格，否則 Shell 可能無法正確解釋括號。此外，還要確保列表中的最後一個命令以分號結尾，如以下示例所示：

清單 12. 好習慣 6 的另一個示例：在當前 Shell 中執行命令列表

~ $ { cp ${VAR}a . && chown -R guest.guest a && \ > tar cvf newarchive.tar a; } | mailx admin -S "New archive"

在 find 之外使用 xargs

使用 xargs 工具作為篩選器，以充分利用從 find 命令挑選的輸出。find 執行通常提供與某些條件匹配的檔案列表。此列表被傳遞到 xargs上，後者然後使用該檔案列表作為引數來執行其他某些有用的命令，如以下示例所示：

清單 13. xargs 工具的經典用法示例

~ $ find some-file-criteria some-file-path | \ > xargs some-great-command-that-needs-filename-arguments

然而，不要將 xargs 僅看作是 find 的輔助工具；它是一個未得到充分利用的工具之一，當您養成使用它的習慣時，將會希望進行所有試驗，包括以下用法。

傳遞空格分隔的列表

在最簡單的呼叫形式中，xargs 就像一個篩選器，它接受一個列表（每個成員分別在單獨的行上）作為輸入。該工具將那些成員放置在單個空格分隔的行上：

清單 14. xargs 工具產生的輸出示例

~ $ xargsabcControl-D a b c ~ $

您可以傳送通過 xargs 來輸出檔名的任何工具的輸出，以便為其他某些接受檔名作為引數的工具獲得引數列表，如以下示例所示：

清單 15. xargs 工具的使用示例

~/tmp $ ls -1 | xargs December_Report.pdf README a archive.tar mkdirhier.sh ~/tmp $ ls -1 | xargs file December_Report.pdf: PDF document, version 1.3 README: ASCII text a: directory archive.tar: POSIX tar archive mkdirhier.sh: Bourne shell script text executable ~/tmp $

xargs 命令不只用於傳遞檔名。您還可以在需要將文字篩選到單個行中的任何時候使用它：

清單 16. 好習慣 7 的示例：使用 xargs 工具來將文字篩選到單個行中

~/tmp $ ls -l | xargs -rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \ root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \ 16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \ joe joe 3239 Sep 30 12:40 mkdirhier.sh ~/tmp $

謹慎使用 xargs

從技術上講，使用 xargs 很少遇到麻煩。預設情況下，檔案結束字串是下劃線 (_)；如果將該字元作為單個輸入引數來發送，則它之後的所有內容將被忽略。為了防止這種情況發生，可以使用 -e 標誌，它在不帶引數的情況下完全禁用結束字串。

瞭解何時 grep 應該執行計數——何時應該繞過

避免通過管道將 grep 傳送到 wc -l 來對輸出行數計數。grep 的 -c 選項提供了對與特定模式匹配的行的計數，並且一般要比通過管道傳送到 wc 更快，如以下示例所示：

清單 17. 好習慣 8 的示例：使用和不使用 grep 的行計數

[code lang=”shell”]~ $ time grep and tmp/a/longfile.txt | wc -l
2811

real 0m0.097s
user 0m0.006s
sys 0m0.032s
~ $ time grep -c and tmp/a/longfile.txt
2811

real 0m0.013s
user 0m0.006s
sys 0m0.005s
~ $[/code]

除了速度因素外，-c 選項還是執行計數的好方法。對於多個檔案，帶 -c 選項的 grep 返回每個檔案的單獨計數，每行一個計數，而針對 wc 的管道則提供所有檔案的組合總計數。

然而，不管是否考慮速度，此示例都表明了另一個要避免地常見錯誤。這些計數方法僅提供包含匹配模式的行數——如果那就是您要查詢的結果，這沒什麼問題。但是在行中具有某個特定模式的多個例項的情況下，這些方法無法為您提供實際匹配例項數量 的真實計數。歸根結底，若要對例項計數，您還是要使用 wc 來計數。首先，使用 -o 選項（如果您的版本支援它的話）來執行 grep 命令。此選項僅輸出匹配的模式，每行一個模式，而不輸出行本身。但是您不能將它與 -c 選項結合使用，因此要使用 wc -l 來對行計數，如以下示例所示：

清單 18. 好習慣 8 的示例：使用 grep 對模式例項計數

~ $ grep -o and tmp/a/longfile.txt | wc -l 3402 ~ $

在此例中，呼叫 wc 要比第二次呼叫 grep 並插入一個虛擬模式（例如 grep -c）來對行進行匹配和計數稍快一點。

匹配輸出中的某些欄位，而不只是對行進行匹配

當您只希望匹配輸出行中特定欄位 中的模式時，諸如 awk 等工具要優於 grep。

下面經過簡化的示例演示瞭如何僅列出 12 月修改過的檔案。

清單 19. 壞習慣 9 的示例：使用 grep 來查詢特定欄位中的模式

~/tmp $ ls -l /tmp/a/b/c | grep Dec -rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 root root 238 Dec 03 08:19 README -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar ~/tmp $

在此示例中，grep 對行進行篩選，並輸出其修改日期和名稱中帶 Dec 的所有檔案。因此，諸如 December_Report.pdf 等檔案是匹配的，即使它自從一月份以來還未修改過。這可能不是您希望的結果。為了匹配特定欄位中的模式，最好使用 awk，其中的一個關係運算符對確切的欄位進行匹配，如以下示例所示：

清單 20. 好習慣 9 的示例：使用 awk 來查詢特定欄位中的模式

~/tmp $ ls -l | awk '$6 == "Dec"' -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rw-r--r-- 1 root root 238 Dec 03 08:19 README ~/tmp $

停止對 cat 使用管道

grep 的一個常見的基本用法錯誤是通過管道將 cat 的輸出傳送到 grep 以搜尋單個檔案的內容。這絕對是不必要的，純粹是浪費時間，因為諸如 grep 這樣的工具接受檔名作為引數。您根本不需要在這種情況下使用 cat，如以下示例所示：

清單 21. 好習慣和壞習慣 10 的示例：使用帶和不帶 cat 的 grep

[code lang=”shell”]~ $ time cat tmp/a/longfile.txt | grep and
2811

real 0m0.015s
user 0m0.003s
sys 0m0.013s
~ $ time grep and tmp/a/longfile.txt
2811

real 0m0.010s
user 0m0.006s
sys 0m0.004s
~ $[/code]

此錯誤存在於許多工具中。由於大多數工具都接受使用連字元 (-) 的標準輸入作為一個引數，因此即使使用 cat 來分散 stdin 中的多個檔案，引數也通常是無效的。僅當您使用帶多個篩選選項之一的cat時，才真正有必要在管道前首先執行連線。

結束語：養成好習慣

最好檢查一下您的命令列習慣中的任何不良的使用模式。不良的使用模式會降低您的速度，並且通常會導致意外錯誤。本文介紹了 10 個新習慣，它們可以幫助您擺脫許多最常見的使用錯誤。養成這些好習慣是加強您的 UNIX 命令列技能的積極步驟。