Linux 核心執行引數修改——sysctl命令
sysctl命令被用於在核心執行時動態地修改核心的執行引數,可用的核心引數在目錄/proc/sys中。它包含一些TCP/ip堆疊和虛擬記憶體系統的高階選項,用sysctl可以讀取設定超過五百個系統變數。
sysctl命令
用法:
sysctl [options] [variable[=value] …]
常用選項:
-n:列印時只打印值,不列印引數名稱;
-e:忽略未知關鍵字錯誤;
-N:列印時只打印引數名稱,不列印值;
-w:設定引數的值(不過好像不加這個選項也可以直接設定);
-p:從配置檔案“/etc/sysctl.conf”載入核心引數設定;
-a:列印所有核心引數變數;
-A:以表格方式列印所有核心引數變數。
示例
1、 設定socket接收緩衝最大值(rmem_max)為212992位元組
sudo sysctl -w net.core.rmem_max=212992
2、檢視socket接收緩衝最大值(rmem_max)
sysctl net.core.rmem_max
sysctl可以設定檢視的核心引數都在目錄/proc/sys中,每個檔案都記錄了一個引數,sysctl命令中其實也記錄了引數的相對路徑,只要將 . 換成 / 就是檔案路徑,比如記錄net.core.rmem_max的檔案就是/proc/sys/net/core/rmem_max,所以也可以直接檢視檔案內容來讀取引數的值
cat /proc/sys/net/core/rmem_max
如果不知道引數路徑也可以這麼做:
sysctl -a | grep rmem_max
配置sysctl
編輯此檔案vi /etc/sysctl.conf
如果該檔案為空,則輸入以下內容,否則請根據情況自己做調整(複製自http://man.linuxde.net/sysctl):
# Controls source route verification
# Default should work for all interfaces
net.ipv4.conf.default.rp_filter = 1
# net.ipv4.conf.all.rp_filter = 1
# net.ipv4.conf.lo.rp_filter = 1
# net.ipv4.conf.eth0.rp_filter = 1
# Disables IP source routing
# Default should work for all interfaces
net.ipv4.conf.default.accept_source_route = 0
# net.ipv4.conf.all.accept_source_route = 0
# net.ipv4.conf.lo.accept_source_route = 0
# net.ipv4.conf.eth0.accept_source_route = 0
# Controls the System Request debugging functionality of the kernel
kernel.sysrq = 0
# Controls whether core dumps will append the PID to the core filename.
# Useful for debugging multi-threaded applications.
kernel.core_uses_pid = 1
# Increase maximum amount of memory allocated to shm
# Only uncomment if needed!
# kernel.shmmax = 67108864
# Disable ICMP Redirect Acceptance
# Default should work for all interfaces
net.ipv4.conf.default.accept_redirects = 0
# net.ipv4.conf.all.accept_redirects = 0
# net.ipv4.conf.lo.accept_redirects = 0
# net.ipv4.conf.eth0.accept_redirects = 0
# Enable Log Spoofed Packets, Source Routed Packets, Redirect Packets
# Default should work for all interfaces
net.ipv4.conf.default.log_martians = 1
# net.ipv4.conf.all.log_martians = 1
# net.ipv4.conf.lo.log_martians = 1
# net.ipv4.conf.eth0.log_martians = 1
# Decrease the time default value for tcp_fin_timeout connection
net.ipv4.tcp_fin_timeout = 25
# Decrease the time default value for tcp_keepalive_time connection
net.ipv4.tcp_keepalive_time = 1200
# Turn on the tcp_window_scaling
net.ipv4.tcp_window_scaling = 1
# Turn on the tcp_sack
net.ipv4.tcp_sack = 1
# tcp_fack should be on because of sack
net.ipv4.tcp_fack = 1
# Turn on the tcp_timestamps
net.ipv4.tcp_timestamps = 1
# Enable TCP SYN Cookie Protection
net.ipv4.tcp_syncookies = 1
# Enable ignoring broadcasts request
net.ipv4.icmp_echo_ignore_broadcasts = 1
# Enable bad error message Protection
net.ipv4.icmp_ignore_bogus_error_responses = 1
# Make more local ports available
# net.ipv4.ip_local_port_range = 1024 65000
# Set TCP Re-Ordering value in kernel to ‘5′
net.ipv4.tcp_reordering = 5
# Lower syn retry rates
net.ipv4.tcp_synack_retries = 2
net.ipv4.tcp_syn_retries = 3
# Set Max SYN Backlog to ‘2048′
net.ipv4.tcp_max_syn_backlog = 2048
# Various Settings
net.core.netdev_max_backlog = 1024
# Increase the maximum number of skb-heads to be cached
net.core.hot_list_length = 256
# Increase the tcp-time-wait buckets pool size
net.ipv4.tcp_max_tw_buckets = 360000
# This will increase the amount of memory available for socket input/output queues
net.core.rmem_default = 65535
net.core.rmem_max = 8388608
net.ipv4.tcp_rmem = 4096 87380 8388608
net.core.wmem_default = 65535
net.core.wmem_max = 8388608
net.ipv4.tcp_wmem = 4096 65535 8388608
net.ipv4.tcp_mem = 8388608 8388608 8388608
net.core.optmem_max = 40960
如果希望遮蔽別人 ping 你的主機,則加入以下程式碼:
# Disable ping requests
net.ipv4.icmp_echo_ignore_all = 1
編輯完成後,請執行以下命令使變動立即生效:
/sbin/sysctl -p
/sbin/sysctl -w net.ipv4.route.flush=1
TCP/IP引數
所有的TCP/IP引數都位於/proc/sys/net目錄下(請注意,對/proc/sys/net目錄下內容的修改都是臨時的,任何修改在系統重啟後都會丟失),例如下面這些重要的引數:
引數(路徑+檔案) | 描述 |
---|---|
/proc/sys/net/core/rmem_default | 預設的TCP資料接收視窗大小(位元組)。 |
/proc/sys/net/core/rmem_max | 最大的TCP資料接收視窗(位元組)。 |
/proc/sys/net/core/wmem_default | 預設的TCP資料傳送視窗大小(位元組)。 |
/proc/sys/net/core/wmem_max | 最大的TCP資料傳送視窗(位元組)。 |
/proc/sys/net/core/netdev_max_backlog | 在每個網路介面接收資料包的速率比核心處理這些包的速率快時,允許送到佇列的資料包的最大數目。 |
/proc/sys/net/core/somaxconn | 定義了系統中每一個埠最大的監聽佇列的長度,這是個全域性的引數。 |
/proc/sys/net/core/optmem_max | 表示每個套接字所允許的最大緩衝區的大小。 |
/proc/sys/net/ipv4/tcp_mem | 確定TCP棧應該如何反映記憶體使用,每個值的單位都是記憶體頁(通常是4KB)。第一個值是記憶體使用的下限;第二個值是記憶體壓力模式開始對緩衝區使用應用壓力的上限;第三個值是記憶體使用的上限。在這個層次上可以將報文丟棄,從而減少對記憶體的使用。對於較大的BDP可以增大這些值(注意,其單位是記憶體頁而不是位元組)。 |
/proc/sys/net/ipv4/tcp_rmem | 為自動調優定義socket使用的記憶體。第一個值是為socket接收緩衝區分配的最少位元組數;第二個值是預設值(該值會被rmem_default覆蓋),緩衝區在系統負載不重的情況下可以增長到這個值;第三個值是接收緩衝區空間的最大位元組數(該值會被rmem_max覆蓋)。 |
/proc/sys/net/ipv4/tcp_wmem | 為自動調優定義socket使用的記憶體。第一個值是為socket傳送緩衝區分配的最少位元組數;第二個值是預設值(該值會被wmem_default覆蓋),緩衝區在系統負載不重的情況下可以增長到這個值;第三個值是傳送緩衝區空間的最大位元組數(該值會被wmem_max覆蓋)。 |
/proc/sys/net/ipv4/tcp_keepalive_time | TCP傳送keepalive探測訊息的間隔時間(秒),用於確認TCP連線是否有效。 |
/proc/sys/net/ipv4/tcp_keepalive_intvl | 探測訊息未獲得響應時,重發該訊息的間隔時間(秒)。 |
/proc/sys/net/ipv4/tcp_keepalive_probes | 在認定TCP連線失效之前,最多傳送多少個keepalive探測訊息。 |
/proc/sys/net/ipv4/tcp_sack | 啟用有選擇的應答(1表示啟用),通過有選擇地應答亂序接收到的報文來提高效能,讓傳送者只發送丟失的報文段,(對於廣域網通訊來說)這個選項應該啟用,但是會增加對CPU的佔用。 |
/proc/sys/net/ipv4/tcp_fack | 啟用轉發應答,可以進行有選擇應答(SACK)從而減少擁塞情況的發生,這個選項也應該啟用。 |
/proc/sys/net/ipv4/tcp_timestamps | TCP時間戳(會在TCP包頭增加12個位元組),以一種比重發超時更精確的方法(參考RFC 1323)來啟用對RTT 的計算,為實現更好的效能應該啟用這個選項。 |
/proc/sys/net/ipv4/tcp_window_scaling | 啟用RFC 1323定義的window scaling,要支援超過64KB的TCP視窗,必須啟用該值(1表示啟用),TCP視窗最大至1GB,TCP連線雙方都啟用時才生效。 |
/proc/sys/net/ipv4/tcp_syncookies | 表示是否開啟TCP同步標籤 |
/proc/sys/net/ipv4/tcp_tw_reuse | 表示是否允許將處於TIME-WAIT狀態的socket(TIME-WAIT的埠)用於新的TCP連線 。 |
/proc/sys/net/ipv4/tcp_tw_recycle | 能夠更快地回收TIME-WAIT套接字。 |
/proc/sys/net/ipv4/tcp_fin_timeout | 對於本端斷開的socket連線,TCP保持在FIN-WAIT-2狀態的時間(秒)。對方可能會斷開連線或一直不結束連線或不可預料的程序死亡。 |
/proc/sys/net/ipv4/ip_local_port_range | 表示TCP/UDP協議允許使用的本地埠號 |
/proc/sys/net/ipv4/tcp_max_syn_backlog | 對於還未獲得對方確認的連線請求,可儲存在佇列中的最大數目。如果伺服器經常出現過載,可以嘗試增加這個數字。 |
/proc/sys/net/ipv4/tcp_low_latency | 允許TCP/IP棧適應在高吞吐量情況下低延時的情況,這個選項應該禁用。 |
/proc/sys/net/ipv4/tcp_westwood | 啟用傳送者端的擁塞控制演算法,它可以維護對吞吐量的評估,並試圖對頻寬的整體利用情況進行優化,對於WAN 通訊來說應該啟用這個選項。 |
/proc/sys/net/ipv4/tcp_bic | 為快速長距離網路啟用Binary Increase Congestion,這樣可以更好地利用以GB速度進行操作的連結,對於WAN通訊應該啟用這個選項。 |