1. 程式人生 > >linux——高階文字處理命令之wc、cut、sort

linux——高階文字處理命令之wc、cut、sort

1.  wc :Word Count

  命令的功能為統計指定檔案中的位元組數、字數、行數,並將統計結果顯示輸出

  1.1 命令格式:

    wc [選項]檔案...

  1.2 命令引數: 

    -c 統計位元組數。

    -l 統計行數。

    -m 統計字元數。這個標誌不能與 -c 標誌一起使用。

    -w 統計字數。一個字被定義為由空白、跳格或換行字元分隔的字串。

    -L 列印最長行的長度。

    

 

 

2、cut:以某種方式按照檔案的行進行分割

  -b :以位元組為單位進行分割。這些位元組位置將忽略多位元組字元邊界,除非也指定了 -n 標誌。
  -c :以字元為單位進行分割。
  -d :自定義分隔符,預設為製表符。
  -f  :與-d一起使用,指定顯示哪個區域。
  -n :取消分割多位元組字元。僅和 -b 標誌一起使用。如果字元的最後一個位元組落在由 -b 標誌的 List 引數指示的<br />範圍之內,
該字元將被寫出;否則,該字元將被排除。
1 [[email protected] shell]$ echo $PATH
2 /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/root/apps/jdk1.8.0_191/bin:/home/zyk/.local/bin:/home/zyk/bin
分割符為:,取第一個字串
3 [[email protected] shell]$ echo $PATH | cut -d ":" -f 1 4 /usr/local/bin
分隔符為:,取1到5這5個字串
5 [[email protected] shell]$ echo $PATH | cut -d ":" -f 1-5 6 /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/root/apps/jdk1.8.0_191/bin
分隔符為:,取1到5和6這6個字串
7 [[email protected] shell]$ echo $PATH | cut -d ":" -f 1-2,5
8 /usr/local/bin:/usr/bin:/root/apps/jdk1.8.0_191/bin

 

3. sort:將文字檔案內容加以排序

  sort可針對文字檔案的內容,以行為單位來排序

 1   -b   忽略每行前面開始出的空格字元。
 2   -c   檢查檔案是否已經按照順序排序。
 3   -d   排序時,處理英文字母、數字及空格字元外,忽略其他的字元。
 4   -f   排序時,將小寫字母視為大寫字母。
 5   -i   排序時,除了040至176之間的ASCII字元外,忽略其他的字元。
 6   -m   將幾個排序好的檔案進行合併。
 7   -M   將前面3個字母依照月份的縮寫進行排序。
 8   -n   依照數值的大小排序。
 9   -o<輸出檔案>   將排序後的結果存入指定的檔案。
10   -r   以相反的順序來排序。
11   -t<分隔字元>   指定排序時所用的欄位分隔字元。
12   +<起始欄位>-<結束欄位>   以指定的欄位來排序,範圍由起始欄位到結束欄位的前一欄位。

 

t 以":"先分割,k 按每行的第三個比較,n 是數字比較,r 倒序

 

https://blog.csdn.net/z1164072826/article/details/81056872