1. 程式人生 > >零零散散整理的一些linux核心引數和說明

零零散散整理的一些linux核心引數和說明

其實也不能算是原創,日常工作的時候經常和這些引數打交道,遇到不明白的就去網上找到並記錄下來,零零散散的記錄了這麼多,呵呵,如果你遇到沒見過的引數,不妨來我這裡找找,如果有不準確的地方,還請大家回覆指出,謝謝

$ /proc/sys/net/core/wmem_max
最大socket寫buffer,可參考的優化值:873200
$ /proc/sys/net/core/rmem_max
最大socket讀buffer,可參考的優化值:873200
$ /proc/sys/net/ipv4/tcp_wmem
TCP寫buffer,可參考的優化值: 8192 436600 873200
$ /proc/sys/net/ipv4/tcp_rmem
TCP讀buffer,可參考的優化值: 32768 436600 873200
$ /proc/sys/net/ipv4/tcp_mem
同樣有3個值,意思是:
net.ipv4.tcp_mem[0]:低於此值,TCP沒有記憶體壓力.
net.ipv4.tcp_mem[1]:在此值下,進入記憶體壓力階段.
net.ipv4.tcp_mem[2]:高於此值,TCP拒絕分配socket.
上述記憶體單位是頁,而不是位元組.可參考的優化值是:786432 1048576 1572864
$ /proc/sys/net/core/netdev_max_backlog
進入包的最大裝置佇列.預設是300,對重負載伺服器而言,該值太低,可調整到1000.
$ /proc/sys/net/core/somaxconn
listen()的預設引數,掛起請求的最大數量.預設是128.對繁忙的伺服器,增加該值有助於網路效能.可調整到256.
$ /proc/sys/net/core/optmem_max
socket buffer的最大初始化值,預設10K.
$ /proc/sys/net/ipv4/tcp_max_syn_backlog
進入SYN包的最大請求佇列.預設1024.對重負載伺服器,增加該值顯然有好處.可調整到2048.
$ /proc/sys/net/ipv4/tcp_retries2
TCP失敗重傳次數,預設值15,意味著重傳15次才徹底放棄.可減少到5,以儘早釋放核心資源.
$ /proc/sys/net/ipv4/tcp_keepalive_time
$ /proc/sys/net/ipv4/tcp_keepalive_intvl
$ /proc/sys/net/ipv4/tcp_keepalive_probes
這3個引數與TCP KeepAlive有關.預設值是:
tcp_keepalive_time = 7200 seconds (2 hours)
tcp_keepalive_probes = 9
tcp_keepalive_intvl = 75 seconds
意思是如果某個TCP連線在idle 2個小時後,核心才發起probe.如果probe 9次(每次75秒)不成功,核心才徹底放棄,認為該連線已失效.對伺服器而言,顯然上述值太大. 可調整到:
/proc/sys/net/ipv4/tcp_keepalive_time 1800
/proc/sys/net/ipv4/tcp_keepalive_intvl 30
/proc/sys/net/ipv4/tcp_keepalive_probes 3
$ proc/sys/net/ipv4/ip_local_port_range
指定埠範圍的一個配置,預設是32768 61000,已夠大.
 
net.ipv4.tcp_syncookies = 1
表示開啟SYN Cookies。當出現SYN等待佇列溢位時,啟用cookies來處理,可防範少量SYN攻擊,預設為0,表示關閉;
net.ipv4.tcp_tw_reuse = 1
表示開啟重用。允許將TIME-WAIT sockets重新用於新的TCP連線,預設為0,表示關閉;
net.ipv4.tcp_tw_recycle = 1
表示開啟TCP連線中TIME-WAIT sockets的快速回收,預設為0,表示關閉。
net.ipv4.tcp_fin_timeout = 30
表示如果套接字由本端要求關閉,這個引數決定了它保持在FIN-WAIT-2狀態的時間。
net.ipv4.tcp_keepalive_time = 1200
表示當keepalive起用的時候,TCP傳送keepalive訊息的頻度。預設是2小時,改為20分鐘。
net.ipv4.ip_local_port_range = 1024 65000
表示用於向外連線的埠範圍。預設情況下很小:32768到61000,改為1024到65000。
net.ipv4.tcp_max_syn_backlog = 8192
表示SYN佇列的長度,預設為1024,加大佇列長度為8192,可以容納更多等待連線的網路連線數。
net.ipv4.tcp_max_tw_buckets = 5000
表示系統同時保持TIME_WAIT套接字的最大數量,如果超過這個數字,TIME_WAIT套接字將立刻被清除並列印警告資訊。預設為180000,改為 5000。對於Apache、Nginx等伺服器,上幾行的引數可以很好地減少TIME_WAIT套接字數量,但是對於Squid,效果卻不大。此項引數可以控制TIME_WAIT套接字的最大數量,避免Squid伺服器被大量的TIME_WAIT套接字拖死。

本文出自 “虛擬的現實” 部落格,請務必保留此出處http://waringid.blog.51cto.com/65148/183496
kernel.hung_task_check_count
The number of tasks checked:
 */
unsigned long __read_mostly sysctl_hung_task_check_count = PID_MAX_LIMIT;
最大pid上限?
###############################################

net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
kernel.msgmnb = 65536
每個訊息佇列的最大位元組限制
kernel.msgmax = 65536
每個訊息的最大size.
kernel.shmmax = 68719476736
核心引數定義單個共享記憶體段的最大值
kernel.shmall = 4294967296
引數是控制共享記憶體頁數

net.ipv4.tcp_max_syn_backlog = 65536 表示SYN佇列的長度,預設為1024,加大佇列長度為8192,可以容納更多等待連線的網路連線數
net.core.netdev_max_backlog = 8192 每個網路介面接收資料包的速率比核心處理這些包的速率快時,允許送到佇列的資料包的最大數目
net.ipv4.tcp_max_tw_buckets = 20000 表示系統同時保持TIME_WAIT套接字的最大數量,如果超過這個數字,TIME_WAIT套接字將立刻被清除並列印警告資訊。預設為180000,改為5000。對於Apache、Nginx等伺服器,上幾行的引數可以很好地減少TIME_WAIT套接字數量,但是對於Squid,效果卻不大。此項引數可以控制TIME_WAIT套接字的最大數量,避免Squid伺服器被大量的TIME_WAIT套接字拖死
net.core.somaxconn = 32768 定義了系統中每一個埠最大的監聽佇列的長度,這是個全域性的引數,預設值為1024
net.core.wmem_default = 8388608 該檔案指定了傳送套接字緩衝區大小的預設值(以位元組為單位)。 
net.core.rmem_default = 8388608 該檔案指定了接收套接字緩衝區大小的預設值(以位元組為單位)。
net.core.rmem_max = 16777216    指定了接收套接字緩衝區(接收視窗)大小的最大值(以位元組為單位)          最大的TCP資料接收緩衝
net.core.wmem_max = 16777216      指定了傳送套接字緩衝區(接收視窗)大小的最大值(以位元組為單位)                    最大的TCP資料傳送緩衝
net.ipv4.tcp_timestamps = 0                                                        以一種比重發超時更精確的方法(請參閱 RFC 1323)來啟用對 RTT 的計算;為了實現更好的效能應該啟用這個選項,時間戳在(請參考RFC 1323)TCP的包頭增加12個位元組
net.ipv4.tcp_synack_retries = 2                     # syn-ack握手狀態重試次數,預設5,遭受syn-flood攻擊時改為1或2 
net.ipv4.tcp_syn_retries = 2                          外向syn握手重試次數,預設4
net.ipv4.tcp_tw_recycle = 1                           # 預設0,tw快速回收
net.ipv4.tcp_tw_reuse = 1                                                       表示開啟重用。允許將TIME-WAIT sockets重新用於新的TCP連線,預設為0,表示關閉;
net.ipv4.tcp_mem = 94500000 915000000 927000000  確定 TCP 棧應該如何反映記憶體使用;每個值的單位都是記憶體頁(通常是 4KB)。第一個值是記憶體使用的下限。第二個值是記憶體壓力模式開始對緩衝區使用應用壓力的上限。第三個值是記憶體上限。在這個層次上可以將報文丟棄,從而減少對記憶體的使用。對於較大的 BDP 可以增大這些值(但是要記住,其單位是記憶體頁,而不是位元組)
net.ipv4.tcp_max_orphans = 3276800  系統中最多有多少個TCP套接字不被關聯到任何一個使用者檔案控制代碼上。如果超過這個數字,孤兒連線將即刻被複位並打印出警告資訊。這個限制僅僅是為了防止簡單的DoS攻擊,你絕對不能過分依靠它或者人為地減小這個值,更應該增加這個值(如果增加了記憶體之後)

net.ipv4.tcp_fin_timeout = 30                    表示如果套接字由本端要求關閉,這個引數決定了它保持在FIN-WAIT-2狀態的時間。
net.ipv4.tcp_keepalive_time = 600                                 表示當keepalive起用的時候,TCP傳送keepalive訊息的頻度。預設是2小時,改為20分鐘。
net.ipv4.tcp_keepalive_intvl = 30                當探測沒有確認時,重新發送探測的頻度。預設是75秒
net.ipv4.tcp_keepalive_probes = 3                在認定連線失效之前,傳送多少個TCP的keepalive探測包。預設值是9。這個值乘以tcp_keepalive_intvl之後決定了,一個連線傳送了keepalive之後可以有多少時間沒有迴應

net.ipv4.tcp_no_metrics_save = 1                 一個tcp連線關閉後,把這個連線曾經有的引數比如慢啟動門限snd_sthresh,擁塞視窗snd_cwnd 還有srtt等資訊儲存到dst_entry中, 只要dst_entry 沒有失效,下次新建立相同連線的時候就可以使用儲存的引數來初始化這個連線.
                                                 tcp_no_metrics_save 設定為1就是不保持這些引數(經驗值),每次建立連線後都重新摸索一次. 我覺得沒什麼好處. 所以系統預設把它設為0.

net.ipv4.ip_local_port_range = 1024  65535    指定埠範圍的一個配置,預設是32768 61000
kernel.msgmni = 1024 這個引數決定了系統中同時執行的最大的message queue的個數
kernel.sem = 250 256000 32 2048
cat /proc/sys/kernel/sem
250 32000 100 128

4個數據分別對應
SEMMSL     250       表示每個訊號集中的最大訊號量數目
SEMMNS     32000  表示系統範圍內的最大訊號量總數目
SEMOPM     100      表示每個訊號發生時的最大系統運算元目
SEMMNI       128      表示系統範圍內的最大訊號集總數目