1. 程式人生 > >除錯排錯 - Java問題排查:Linux命令

除錯排錯 - Java問題排查:Linux命令

本文原創,更多內容可以參考: Java 全棧知識體系。如需轉載請說明原處。

Java 線上問題排查主要分兩篇:本文是第一篇,通過linux常用命令排查。@pdai

文字操作

文字查詢 - grep

grep常用命令:

# 基本使用
grep yoursearchkeyword f.txt     #檔案查詢
grep 'KeyWord otherKeyWord' f.txt cpf.txt #多檔案查詢, 含空格加引號
grep 'KeyWord' /home/admin -r -n #目錄下查詢所有符合關鍵字的檔案
grep 'keyword' /home/admin -r -n -i # -i 忽略大小寫
grep 'KeyWord' /home/admin -r -n --include *.{vm,java} #指定檔案字尾
grep 'KeyWord' /home/admin -r -n --exclude *.{vm,java} #反匹配

# cat + grep
cat f.txt | grep -i keyword # 查詢所有keyword且不分大小寫  
cat f.txt | grep -c 'KeyWord' # 統計Keyword次數

# seq + grep
seq 10 | grep 5 -A 3    #上匹配
seq 10 | grep 5 -B 3    #下匹配
seq 10 | grep 5 -C 3    #上下匹配,平時用這個就妥了

Grep的引數:

--color=auto:顯示顏色;
-i, --ignore-case:忽略字元大小寫;
-o, --only-matching:只顯示匹配到的部分;
-n, --line-number:顯示行號;
-v, --invert-match:反向顯示,顯示未匹配到的行;
-E, --extended-regexp:支援使用擴充套件的正則表示式;
-q, --quiet, --silent:靜默模式,即不輸出任何資訊;
-w, --word-regexp:整行匹配整個單詞;
-c, --count:統計匹配到的行數; print a count of matching lines;

-B, --before-context=NUM:print NUM lines of leading context   後#行 
-A, --after-context=NUM:print NUM lines of trailing context   前#行 
-C, --context=NUM:print NUM lines of output context           前後各#行 

文字分析 - awk

awk基本命令:

# 基本使用
awk '{print $4,$6}' f.txt
awk '{print NR,$0}' f.txt cpf.txt    
awk '{print FNR,$0}' f.txt cpf.txt
awk '{print FNR,FILENAME,$0}' f.txt cpf.txt
awk '{print FILENAME,"NR="NR,"FNR="FNR,"$"NF"="$NF}' f.txt cpf.txt
echo 1:2:3:4 | awk -F: '{print $1,$2,$3,$4}'

# 匹配
awk '/ldb/ {print}' f.txt   #匹配ldb
awk '!/ldb/ {print}' f.txt  #不匹配ldb
awk '/ldb/ && /LISTEN/ {print}' f.txt   #匹配ldb和LISTEN
awk '$5 ~ /ldb/ {print}' f.txt #第五列匹配ldb

內建變數

`NR`: NR表示從awk開始執行後,按照記錄分隔符讀取的資料次數,預設的記錄分隔符為換行符,因此預設的就是讀取的資料行數,NR可以理解為Number of Record的縮寫。

`FNR`: 在awk處理多個輸入檔案的時候,在處理完第一個檔案後,NR並不會從1開始,而是繼續累加,因此就出現了FNR,每當處理一個新檔案的時候,FNR就從1開始計數,FNR可以理解為File Number of Record。

`NF`: NF表示目前的記錄被分割的欄位的數目,NF可以理解為Number of Field。

更多請參考:Linux awk 命令

文字處理 - sed

sed常用:

# 文字列印
sed -n '3p' xxx.log #只打印第三行
sed -n '$p' xxx.log #只打印最後一行
sed -n '3,9p' xxx.log #只檢視檔案的第3行到第9行
sed -n -e '3,9p' -e '=' xxx.log #列印3-9行,並顯示行號
sed -n '/root/p' xxx.log #顯示包含root的行
sed -n '/hhh/,/omc/p' xxx.log # 顯示包含"hhh"的行到包含"omc"的行之間的行

# 文字替換
sed -i 's/root/world/g' xxx.log # 用world 替換xxx.log檔案中的root; s==search  查詢並替換, g==global  全部替換, -i: implace

# 文字插入
sed '1,4i hahaha' xxx.log # 在檔案第一行和第四行的每行下面新增hahaha
sed -e '1i happy' -e '$a new year' xxx.log  #【介面顯示】在檔案第一行新增happy,檔案結尾新增new year
sed -i -e '1i happy' -e '$a new year' xxx.log #【真實寫入檔案】在檔案第一行新增happy,檔案結尾新增new year

# 文字刪除
sed  '3,9d' xxx.log # 刪除第3到第9行,只是不顯示而已
sed '/hhh/,/omc/d' xxx.log # 刪除包含"hhh"的行到包含"omc"的行之間的行
sed '/omc/,10d' xxx.log # 刪除包含"omc"的行到第十行的內容

# 與find結合
find . -name  "*.txt" |xargs   sed -i 's/hhhh/\hHHh/g'
find . -name  "*.txt" |xargs   sed -i 's#hhhh#hHHh#g'
find . -name  "*.txt" -exec sed -i 's/hhhh/\hHHh/g' {} \;
find . -name  "*.txt" |xargs cat

更多請參考:Linux sed 命令 或者 Linux sed命令詳解

檔案操作

檔案監聽 - tail

最常用的tail -f filename

# 基本使用
tail -f xxx.log # 迴圈監聽檔案
tail -300f xxx.log #倒數300行並追蹤檔案
tail +20 xxx.log #從第 20 行至檔案末尾顯示檔案內容

# tailf使用
tailf xxx.log #等同於tail -f -n 10 列印最後10行,然後追蹤檔案

tail -f 與tail F 與tailf三者區別

`tail  -f `  等於--follow=descriptor,根據檔案描述進行追蹤,當檔案改名或刪除後,停止追蹤。

`tail -F` 等於 --follow=name ==retry,根據檔名字進行追蹤,當檔案改名或刪除後,保持重試,當有新的檔案和他同名時,繼續追蹤

`tailf` 等於tail -f -n 10(tail -f或-F預設也是列印最後10行,然後追蹤檔案),與tail -f不同的是,如果檔案不增長,它不會去訪問磁碟檔案,所以tailf特別適合那些便攜機上跟蹤日誌檔案,因為它減少了磁碟訪問,可以省電。

tail的引數

-f 迴圈讀取
-q 不顯示處理資訊
-v 顯示詳細的處理資訊
-c<數目> 顯示的位元組數
-n<行數> 顯示檔案的尾部 n 行內容
--pid=PID 與-f合用,表示在程序ID,PID死掉之後結束
-q, --quiet, --silent 從不輸出給出檔名的首部
-s, --sleep-interval=S 與-f合用,表示在每次反覆的間隔休眠S秒

檔案查詢 - find

sudo -u admin find /home/admin /tmp /usr -name \*.log(多個目錄去找)
find . -iname \*.txt(大小寫都匹配)
find . -type d(當前目錄下的所有子目錄)
find /usr -type l(當前目錄下所有的符號連結)
find /usr -type l -name "z*" -ls(符號連結的詳細資訊 eg:inode,目錄)
find /home/admin -size +250000k(超過250000k的檔案,當然+改成-就是小於了)
find /home/admin f -perm 777 -exec ls -l {} \; (按照許可權查詢檔案)
find /home/admin -atime -1  1天內訪問過的檔案
find /home/admin -ctime -1  1天內狀態改變過的檔案    
find /home/admin -mtime -1  1天內修改過的檔案
find /home/admin -amin -1  1分鐘內訪問過的檔案
find /home/admin -cmin -1  1分鐘內狀態改變過的檔案    
find /home/admin -mmin -1  1分鐘內修改過的檔案

pgm

批量查詢vm-shopbase滿足條件的日誌

pgm -A -f vm-shopbase 'cat /home/admin/shopbase/logs/shopbase.log.2017-01-17|grep 2069861630'

檢視網路和程序

檢視所有網路介面的屬性

[[email protected] ~]# ifconfig
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 172.31.165.194  netmask 255.255.240.0  broadcast 172.31.175.255
        ether 00:16:3e:08:c1:ea  txqueuelen 1000  (Ethernet)
        RX packets 21213152  bytes 2812084823 (2.6 GiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 25264438  bytes 46566724676 (43.3 GiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 127.0.0.1  netmask 255.0.0.0
        loop  txqueuelen 1000  (Local Loopback)
        RX packets 502  bytes 86350 (84.3 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 502  bytes 86350 (84.3 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

檢視防火牆設定

[[email protected] ~]# iptables -L
Chain INPUT (policy ACCEPT)
target     prot opt source               destination

Chain FORWARD (policy ACCEPT)
target     prot opt source               destination

Chain OUTPUT (policy ACCEPT)
target     prot opt source               destination

檢視路由表

[[email protected] ~]# route -n
Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
0.0.0.0         172.31.175.253  0.0.0.0         UG    0      0        0 eth0
169.254.0.0     0.0.0.0         255.255.0.0     U     1002   0        0 eth0
172.31.160.0    0.0.0.0         255.255.240.0   U     0      0        0 eth0

netstat

檢視所有監聽埠

[[email protected] ~]# netstat -lntp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name  
tcp        0      0 0.0.0.0:443             0.0.0.0:*               LISTEN      970/nginx: master p
tcp        0      0 0.0.0.0:9999            0.0.0.0:*               LISTEN      1249/java         
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN      970/nginx: master p
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      1547/sshd         
tcp6       0      0 :::3306                 :::*                    LISTEN      1894/mysqld       

檢視所有已經建立的連線

[[email protected] ~]# netstat -antp
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name
tcp        0      0 0.0.0.0:443             0.0.0.0:*               LISTEN      970/nginx: master p
tcp        0      0 0.0.0.0:9999            0.0.0.0:*               LISTEN      1249/java
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN      970/nginx: master p
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      1547/sshd
tcp        0      0 172.31.165.194:53874    100.100.30.25:80        ESTABLISHED 18041/AliYunDun
tcp        0     64 172.31.165.194:22       xxx.194.1.200:2649      ESTABLISHED 32516/sshd: root@pt
tcp6       0      0 :::3306                 :::*                    LISTEN      1894/m

檢視當前連線

[[email protected] ~]# netstat -nat|awk  '{print $6}'|sort|uniq -c|sort -rn
      5 LISTEN
      2 ESTABLISHED
      1 Foreign
      1 established)

檢視網路統計資訊程序

[[email protected] ~]# netstat -s
Ip:
    21017132 total packets received
    0 forwarded
    0 incoming packets discarded
    21017131 incoming packets delivered
    25114367 requests sent out
    324 dropped because of missing route
Icmp:
    18088 ICMP messages received
    692 input ICMP message failed.
    ICMP input histogram:
        destination unreachable: 4241
        timeout in transit: 19
        echo requests: 13791
        echo replies: 4
        timestamp request: 33
    13825 ICMP messages sent
    0 ICMP messages failed
    ICMP output histogram:
        destination unreachable: 1
        echo replies: 13791
        timestamp replies: 33
IcmpMsg:
        InType0: 4
        InType3: 4241
        InType8: 13791
        InType11: 19
        InType13: 33
        OutType0: 13791
        OutType3: 1
        OutType14: 33
Tcp:
    12210 active connections openings
    208820 passive connection openings
    54198 failed connection attempts
    9805 connection resets received
...

netstat 請參考這篇文章: Linux netstat命令詳解

檢視所有程序

[[email protected] ~]# ps -ef | grep java
root      1249     1  0 Nov04 ?        00:58:05 java -jar /opt/tech_doc/bin/tech_arch-0.0.1-RELEASE.jar --server.port=9999
root     32718 32518  0 08:36 pts/0    00:00:00 grep --color=auto java

top

top除了看一些基本資訊之外,剩下的就是配合來查詢vm的各種問題了

# top -H -p pid
top - 08:37:51 up 45 days, 18:45,  1 user,  load average: 0.01, 0.03, 0.05
Threads:  28 total,   0 running,  28 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.7 us,  0.7 sy,  0.0 ni, 98.6 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  1882088 total,    74608 free,   202228 used,  1605252 buff/cache
KiB Swap:  2097148 total,  1835392 free,   261756 used.  1502036 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
 1347 root      20   0 2553808 113752   1024 S  0.3  6.0  48:46.74 VM Periodic Tas
 1249 root      20   0 2553808 113752   1024 S  0.0  6.0   0:00.00 java
 1289 root      20   0 2553808 113752   1024 S  0.0  6.0   0:03.74 java
...

檢視磁碟和記憶體相關

檢視記憶體使用 - free -m

[[email protected] ~]# free -m
              total        used        free      shared  buff/cache   available
Mem:           1837         196         824           0         816        1469
Swap:          2047         255        1792

檢視各分割槽使用情況

[[email protected] ~]# df -h
Filesystem      Size  Used Avail Use% Mounted on
devtmpfs        909M     0  909M   0% /dev
tmpfs           919M     0  919M   0% /dev/shm
tmpfs           919M  452K  919M   1% /run
tmpfs           919M     0  919M   0% /sys/fs/cgroup
/dev/vda1        40G   15G   23G  40% /
tmpfs           184M     0  184M   0% /run/user/0

檢視指定目錄的大小

[[email protected] ~]# du -sh
803M

檢視記憶體總量

[[email protected] ~]# grep MemTotal /proc/meminfo
MemTotal:        1882088 kB

檢視空閒記憶體量

[[email protected] ~]# grep MemFree /proc/meminfo
MemFree:           74120 kB

檢視系統負載磁碟和分割槽

[[email protected] ~]# grep MemFree /proc/meminfo
MemFree:           74120 kB

檢視系統負載磁碟和分割槽

[[email protected] ~]# cat /proc/loadavg
0.01 0.04 0.05 2/174 32751

檢視掛接的分割槽狀態

[[email protected] ~]# mount | column -t
sysfs       on  /sys                             type  sysfs       (rw,nosuid,nodev,noexec,relatime)
proc        on  /proc                            type  proc        (rw,nosuid,nodev,noexec,relatime)
devtmpfs    on  /dev                             type  devtmpfs    (rw,nosuid,size=930732k,nr_inodes=232683,mode=755)
securityfs  on  /sys/kernel/security             type  securityfs  (rw,nosuid,nodev,noexec,relatime)
...

檢視所有分割槽

[[email protected] ~]# fdisk -l

Disk /dev/vda: 42.9 GB, 42949672960 bytes, 83886080 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk label type: dos
Disk identifier: 0x0008d73a

   Device Boot      Start         End      Blocks   Id  System
/dev/vda1   *        2048    83884031    41940992   83  Linux

檢視所有交換分割槽

[[email protected] ~]# swapon -s
Filename                                Type            Size    Used    Priority
/etc/swap                               file    2097148 261756  -2

檢視硬碟大小

[[email protected] ~]# fdisk -l |grep Disk
Disk /dev/vda: 42.9 GB, 42949672960 bytes, 83886080 sectors
Disk label type: dos
Disk identifier: 0x0008d73a

檢視使用者和組相關

檢視活動使用者

[[email protected] ~]# w
 08:47:20 up 45 days, 18:54,  1 user,  load average: 0.01, 0.03, 0.05
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root     pts/0    xxx.194.1.200    08:32    0.00s  0.32s  0.32s -bash

檢視指定使用者資訊

[[email protected] ~]# id
uid=0(root) gid=0(root) groups=0(root)

檢視使用者登入日誌

[[email protected] ~]# last
root     pts/0        xxx.194.1.200    Fri Dec 20 08:32   still logged in
root     pts/0        xxx.73.164.60     Thu Dec 19 21:47 - 00:28  (02:41)
root     pts/0        xxx.106.236.255  Thu Dec 19 16:00 - 18:24  (02:23)
root     pts/1        xxx.194.3.173    Tue Dec 17 13:35 - 17:37  (04:01)
root     pts/0        xxx.194.3.173    Tue Dec 17 13:35 - 17:37  (04:02)
...

檢視系統所有使用者

[[email protected] ~]# cut -d: -f1 /etc/passwd
root
bin
daemon
adm
...

檢視系統所有組

cut -d: -f1 /etc/group

檢視服務,模組和包相關

# 檢視當前使用者的計劃任務服務
crontab -l 

# 列出所有系統服務
chkconfig –list 

# 列出所有啟動的系統服務程式
chkconfig –list | grep on 

# 檢視所有安裝的軟體包
rpm -qa 

# 列出載入的核心模組
lsmod 

檢視系統,裝置,環境資訊

# 常用
env # 檢視環境變數資源
uptime # 檢視系統執行時間、使用者數、負載
lsusb -tv # 列出所有USB裝置的linux系統資訊命令
lspci -tv # 列出所有PCI裝置
head -n 1 /etc/issue # 檢視作業系統版本,是數字1不是字母L
uname -a # 檢視核心/作業系統/CPU資訊的linux系統資訊命令

# /proc/
cat /proc/cpuinfo :檢視CPU相關引數的linux系統命令
cat /proc/partitions :檢視linux硬碟和分割槽資訊的系統資訊命令
cat /proc/meminfo :檢視linux系統記憶體資訊的linux系統命令
cat /proc/version :檢視版本,類似uname -r
cat /proc/ioports :檢視裝置io埠
cat /proc/interrupts :檢視中斷
cat /proc/pci :檢視pci裝置的資訊
cat /proc/swaps :檢視所有swap分割槽的資訊
cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id"

tsar

tsar是淘寶開源的的採集工具。很好用, 將歷史收集到的資料持久化在磁碟上,所以我們快速來查詢歷史的系統資料。當然實時的應用情況也是可以查詢的啦。大部分機器上都有安裝。

tsar  ##可以檢視最近一天的各項指標
tsar --live ##可以檢視實時指標,預設五秒一刷
tsar -d 20161218 ##指定檢視某天的資料,貌似最多隻能看四個月的資料
tsar --mem
tsar --load
tsar --cpu ##當然這個也可以和-d引數配合來查詢某天的單個指標的情況 

具體可以看這篇文章:linux 淘寶開源監控工具tsar

更多內容

最全的Java後端知識體系 https://www.pdai.tech, 每天更新中...。