1. 程式人生 > >文本處理工具 wc cut sort uniq

文本處理工具 wc cut sort uniq

ces 小知識點 知識 例如 文件 處理 mark 常用 字母

<1> wc 統計字符 行 單詞 wc -l wc -w wc -c

技術分享圖片

         wc可以可以放在文件前面 也可以放在文件後面,如上圖。

<2> cut 切 顧名思義就是切割文件用的

作用:是切割一任意行文件的列....
但是默認按照空格來分割的個格列的
當然可以使用 cut -d 來指定分隔符  如 cut -d: cat -d"22",但是其默認參數必須要跟上-f 指定輸出第幾列,不指定就會報錯
常用的也就-d -f  但是還有一個是以前沒用用到過的,就是指定輸出分隔符 --output-delimiter
![](http://i2.51cto.com/images/blog/201809/19/40c57ae5a4d2d3129a8abc7fd9011794.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=)

這個的意思是 以 : 為分隔符切割 打印出第1,2列 然後以&為分隔符輸出且只顯示前十行。。
技術分享圖片
按照文本文件的行進行排序 例如:
技術分享圖片
這是默認排序
技術分享圖片
這個是使用sort排序後的輸出,默認按照.....啥來著 忘了 試一下
創建了個文本 有特殊符號 大小寫字母 數字
技術分享圖片
{穿插一個小知識點
技術分享圖片
這個是新創建的文本文檔 可以看到裏面有空字符開頭的行 首先把空字符的去掉吧 讓後另存為到其他文本文檔
技術分享圖片
查找以空格開頭的行 讓後取反
技術分享圖片
接著重定向到/tmp/sort.txt
}
然後使用sort排序 下圖 可以看到排序依次是特殊符號,數字,小寫字母,大寫字母。。。
技術分享圖片

技術分享圖片

        此命令是  列出歷史命令中出現次數最多的前20個命令
        這裏需要記錄的是兩個命令
            一個是sort 排序命令  其中兩個選項 -n是按照數值大小排序  -r 取反
            還有一個uniq命令 去重的意思,一個選項 -c 顯示重復的次數
            整個命令組合在面試的時候常被問到,一般都是統計某個時間段內,訪問某網站次數最多的前10個ip地址
            額 睡覺了....

文本處理工具 wc cut sort uniq