1. 程式人生 > >實驗樓 簡單的文本處理

實驗樓 簡單的文本處理

大小寫 去除 重復 sudo 指定 兩個文件 strong 符號 信息

文本處理命令

tr 命令

tr 命令可以用來刪除一段文本信息中的某些文字。或者將其進行轉換

選項說明
-d 刪除和set1匹配的字符,註意不是全詞匹配也不是按字符順序匹配
-s 去除set1指定的在輸入文本中連續並重復的字符
# 刪除 "hello shiyanlou" 中所有的‘o‘,‘l‘,‘h‘
$ echo ‘hello shiyanlou‘ | tr -d ‘olh‘
# 將"hello" 中的ll,去重為一個l
$ echo ‘hello‘ | tr -s ‘l‘
# 將輸入文本,全部轉換為大寫或小寫輸出
$ cat /etc/passwd | tr ‘[:lower:]‘ ‘[:upper:]‘
# 上面的‘[:lower:]‘ ‘[:upper:]‘你也可以簡單的寫作‘[a-z]‘ ‘[A-Z]‘,當然反過來將大寫變小寫也是可以的

col 命令

col 命令可以將Tab換成對等數量的空格鍵,或反轉這個操作。

選項說明
-x Tab轉換為空格
-h 將空格轉換為Tab(默認選項)
# 查看 /etc/protocols 中的不可見字符,可以看到很多 ^I ,這其實就是 Tab 轉義成可見字符的符號
$ cat -A /etc/protocols
# 使用 col -x 將 /etc/protocols 中的 Tab 轉換為空格,然後再使用 cat 查看,你發現 ^I 不見了
$ cat /etc/protocols | col -x | cat -A

join命令

用於將兩個文件中包含相同內容的那一行合並在一起。

選項說明
-t 指定分隔符,默認為空格
-i 忽略大小寫的差異
-1 指明第一個文件要用哪個字段來對比,,默認對比第一個字段
-2 指明第二個文件要用哪個字段來對比,,默認對比第一個字段
# 創建兩個文件
$ echo ‘1 hello‘ > file1
$ echo ‘1 shiyanlou‘ > file2
$ join file1 file2
# 將/etc/passwd與/etc/shadow兩個文件合並,指定以‘:‘作為分隔符
$ sudo join -t‘:‘ /etc/passwd /etc/shadow
# 將/etc/passwd與/etc/group兩個文件合並,指定以‘:‘作為分隔符, 分別比對第4和第3個字段
$ sudo join -t‘:‘ -1 4 /etc/passwd -2 3 /etc/group

paste命令

paste這個命令與join 命令類似,它是在不對比數據的情況下,簡單地將多個文件合並一起,以Tab隔開。

選項說明
-d 指定合並的分隔符,默認為Tab
-s 不合並到一行,每個文件為一行
$ echo hello > file1
$ echo shiyanlou > file2
$ echo www.shiyanlou.com > file3
$ paste -d ‘:‘ file1 file2 file3
$ paste -s file1 file2 file3

輕松一下

ninvaders

作業

手動完成 dos 文本格式到 UNIX 文本格式的轉換

cat file1 | tr ‘\r\n:^M$‘ ‘\n:$‘ | > file2








實驗樓 簡單的文本處理