1. 程式人生 > >Shell+Linux命令實現日誌分析

Shell+Linux命令實現日誌分析

一、列出當天訪問次數最多的IP
命令:

複製程式碼程式碼如下: cut -d- -f 1 /usr/local/apache2/logs/access_log |uniq -c | sort -rn | head -20
原理:
複製程式碼程式碼如下:
       cut
       -d, --delimiter=DELIM
              use DELIM instead of TAB for field delimiter
              表示用-分割,然後-f 1 
       -f, --fields=LIST
              select only these fields;  also print any line that contains  no
              delimiter character, unless the -s option is specified
           表示列印第一部分,就是ip
 uniq 是將重複行去掉, -c表示前面前面加上數目,
       sort -rn 就是按照數字從大到小排序,
       head -20取前面20行

最後列印的結果大概是這樣:

複製程式碼程式碼如下:    217 192.114.71.13
   116 124.90.132.65
   108 192.114.71.13
   102 194.19.140.96
   101 217.70.34.173
   100 219.235.240.36

以下是其他一些分析日誌的shell用法:

1、檢視當天有多少個IP訪問:

複製程式碼程式碼如下: awk '{print $1}' log_file|sort|uniq|wc -l

2、檢視某一個頁面被訪問的次數;

複製程式碼程式碼如下: grep "/index.php" log_file | wc -l

3、檢視每一個IP訪問了多少個頁面:

複製程式碼程式碼如下: awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file

4、將每個IP訪問的頁面數進行從小到大排序:

複製程式碼程式碼如下: awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n

5、檢視某一個IP訪問了哪些頁面:

複製程式碼程式碼如下: grep ^111.111.111.111 log_file| awk '{print $1,$7}'

6、去掉搜尋引擎統計當天的頁面:

複製程式碼程式碼如下: awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l

7、檢視2009年6月21日14時這一個小時內有多少IP訪問:

複製程式碼程式碼如下: awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq | wc -l