1. 程式人生 > >運用sed命令高效地刪除檔案的特定行

運用sed命令高效地刪除檔案的特定行

#### 運用 sed 命令高效地刪除檔案的特定行 正常來說,我們想要刪除檔案中的某些行內容,一般都是先開啟這個檔案,然後找到要刪除的內容,再然後選中這些行並按刪除鍵進行刪除,這在資料量很少時是沒有問題的。但是,一旦檔案中的行資料非常多,而且資料冗雜的情況下,你還要用上面的方法去做的話就很恐怖了。為此,今天這篇文章將帶大家一起學習運用 sed 命令列工具,即使在資料多而雜的情況下也能高效而優雅地刪除檔案中的特定行內容。 `sed` 是 **Stream Editor** 的簡寫,它用於在 Linux 中進行基本的文字轉換,是檔案操作的一個重要命令,所以,我們也可以用它來實現文字的刪除操作。 下面是一些 `sed` 命令的使用示例,覆蓋了大多數的使用場景,由淺入深地幫助你學習 `sed` 命令,讓你輕鬆地實現高效刪除檔案的特定行內容。 首先我們準備一個演示檔案 `sed-demo.txt` 。 ```linux # cat sed-demo.txt 1 Linux Operating System 2 Unix Operating System 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` 然後我們就可以運用 `sed` 命令進行實驗了。 > 注意:**-i** 表示**直接進行檔案操作,而不在終端上顯示結果**。因為是演示所以這裡不帶 **-i** 選項,我們在**實際中請帶上 -i 選項**。 ##### 1. 刪除某一行 首先,我們先從刪除某一行開始,比如刪除第一行、最後一行,實際也就是第 **N** 行嘛。 刪除第 N 行的命令格式: ```linux sed 'Nd' file ``` 我們來刪除**第一行**試試: ```linux # sed '1d' sed-demo.txt After deletion: 2 Unix Operating System 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` 很簡單是吧?這裡就不多作解釋了,你想要刪除第幾行的內容只需要把命令中的 **1** 替換一下就 ok 了。 那問題來了,**最後一行**用什麼數字表示呢?這裡給大家一個小提示,可以用美元符號 **$** 表示最後,所以刪除最後一行的命令可以這麼寫: ```linux # sed '$d' sed-demo.txt After deletion: 1 Linux Operating System 2 Unix Operating System 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu ``` ##### 2. 刪除某些行 `sed` 命令可以刪除連續又或者不連續的行內容。 刪除連續的行,例如刪除**從 5 到 7** 行 的內容: ```linux # sed '5,7d' sed-demo.txt After deletion: 1 Linux Operating System 2 Unix Operating System 3 RHEL 4 Red Hat 8 Debian 9 Ubuntu 10 openSUSE ``` 刪除不連續的行,例如刪除**第 1 、第 5 、第 9 和最後一行**: ```linux # sed '1d;5d;9d;$d' sed-demo.txt After deletion: 2 Unix Operating System 3 RHEL 4 Red Hat 6 Arch Linux 7 CentOS 8 Debian ``` 另外,它還可以配合邏輯非 **!** 使用,比如刪除**第 3到 6 行以外**的其他行: ```linux # sed '3,6!d' sed-demo.txt After deletion: 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux ``` ##### 3. 刪除空白行 `sed` 還支援刪除檔案的空白行,命令如下: ```linux # sed '/^$/d' sed-demo.txt After deletion: 1 Linux Operating System 2 Unix Operating System 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` > 提示:這裡兩個斜槓 **/ /** 內的表示式起到了文字匹配的作用,大家可以參考**正則表示式**的使用方法。下面將列舉一些常用的方法來加深大家的學習。 ##### 4. 刪除包含特定字元的行 假設我們想要刪除示例檔案中的包含 **System** 這個單詞的行內容,我們可以用 `/System/`,它表示有出現 **System** 這個字串就進行匹配,具體的命令如下: ```linux # sed '/System/d' sed-demo.txt After deletion: 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` 不僅如此,我們還可以加上一下邏輯條件,比方說下面的命令: ```linux # sed '/System\|Linux/d' sed-demo.txt After deletion: 3 RHEL 4 Red Hat 5 Fedora 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` 反斜槓 `\` 代表**邏輯或**,上述命令的意思是文字中有 **System** 或 **Linux** 的行都要進行刪除。 ##### 5. 刪除特定字元開頭的行 首先,我們建立另一個示例檔案 `sed-demo-1.txt` 進行更好地演示,其內容如下: ```linux # cat sed-demo-1.txt After deletion: Linux Operating System Unix Operating System RHEL Red Hat Fedora debian ubuntu Arch Linux - 1 2 - Manjaro 3 4 5 6 ``` 上面也已經提到過,`$` 號可以理解為結尾,那麼有沒有字元可以代表開頭呢?答案是有的,這裡我們可以用 `^` 號代表開頭。 那麼,我們想要刪除以某一個字元開頭的行時,比如說**刪除以 R 開頭的行**,可以使用如下命令: ```linux # sed '/^R/d' sed-demo-1.txt After deletion: Linux Operating System Unix Operating System Fedora debian ubuntu Arch Linux - 1 2 - Manjaro 3 4 5 6 ``` 那麼問題來了,比如我想刪除以 R 或者 F 開頭的行,那我是不是要執行兩次命令呢?如果是有更多豈不是要執行多次命令?這裡它有一個簡單的寫法,你只要把這些字元寫在一對中括號 `[]` 裡就可以了: ```linux # sed '/^[RF]/d' sed-demo-1.txt After deletion: Linux Operating System Unix Operating System debian ubuntu Arch Linux - 1 2 - Manjaro 3 4 5 6 ``` 上面命令的作用是 **刪除以 R 或者 F 開頭的行**。 ##### 6. 刪除特定字元結尾的行 同上面一個道理,刪除以某一個字元結尾的行,比方說**刪除以 m 結尾的行**,我們可以這樣做: ```linux # sed '/m$/d' sed-demo.txt After deletion: 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` **刪除以 x 或 m 結尾的行**可以這樣寫: ```linux # sed '/[xm]$/d' sed-demo.txt After deletion: 3 RHEL 4 Red Hat 5 Fedora 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` ##### 7. 刪除以大寫字母開頭的行 這裡問題又來了,我想要**刪除所有以大寫字母開頭的行**呢?按照上面的做法是不是要將 A 到 Z 這 26 個字母都寫進 `[ ]` 裡呢? 其實我們大可不必這樣做,在 A 和 Z 中間加個 `-` 就可以了: ```linux # sed '/^[A-Z]/d' sed-demo-1.txt After deletion: debian ubuntu 2 - Manjaro 3 4 5 6 ``` 機智的你看到這裡肯定會想到其他類似的用法的了,不妨看看下面是否有你想到的命令吧。 ##### 8. 刪除包含字母字元的行 ```linux # sed '/[A-Za-z]/d' sed-demo-1.txt After deletion: 3 4 5 6 ``` ##### 9. 刪除包含數字的行 ``` # sed '/[0-9]/d' sed-demo-1.txt After deletion: Linux Operating System Unix Operating System RHEL Red Hat Fedora debian ubuntu ``` 另外,通過這個例子,我們可以加上 `^` 和 `$` 更好地看到他們三個之間的區別: ```linux # sed '/^[0-9]/d' sed-demo-1.txt After deletion: Linux Operating System Unix Operating System RHEL Red Hat Fedora debian ubuntu Arch Linux - 1 ``` ```linux # sed '/[0-9]$/d' sed-demo-1.txt After deletion: Linux Operating System Unix Operating System RHEL Red Hat Fedora debian ubuntu 2 - Manjaro ``` ##### 10. 其他更多 實際上,我們要刪除的檔案內容是更為具體的,簡單的條件是滿足不了我們的需求的,所以,`sed` 也支援更復雜的條件組合。比方說我要指定**刪除在 1 到 6 行內有 Linux 這個詞的內容**,那麼: ```linux # sed '1,6{/Linux/d;}' sed-demo.txt After deletion: 2 Unix Operating System 3 RHEL 4 Red Hat 5 Fedora 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` **刪除包含 System 以及其下一行的內容**: ```linux # sed '/System/{N;d;}' sed-demo.txt After deletion: 3 RHEL 4 Red Hat 5 Fedora 6 Arch Linux 7 CentOS 8 Debian 9 Ubuntu 10 openSUSE ``` --- 公眾號:良許Linux ### 有收穫?希望老鐵們來個三連擊,給更多的人看到這篇文章