1. 程式人生 > >真正的inotify+rsync實時同步 徹底告別同步慢

真正的inotify+rsync實時同步 徹底告別同步慢

我們公司在用inotify+rsync做實時同步,來解決分散式叢集檔案一致性的問題。但當web檔案越來越多(百萬級數量html,jpg等小 檔案),同步就越來越慢,根本做不到實時,按照網上的調優方法都嘗試過,問題根本沒有解決。經過我一翻細緻研究,終於把慢的核心問題研究明白,先總結一句 inotifywait響應不會有延遲,rsync也很快。大家同樣有慢的煩惱,那是因為網上的inotify+rsync的教程都是坑。下面我們來分 析。

inotifywait 單獨分析

1/usr/local/bin/inotifywait-mrq--format'%Xe %w%f'-emodify,create
,delete,attrib/data/

執行上面命令,是讓inotifywait監聽/data/目錄,當監聽到有發生modify,create,delete,attrib等事件發生時,按%Xe %w%f的格式輸出。

在/data/目錄touch幾個檔案

1 touch/data/{1..5}

觀看inotify輸出

12345ATTRIB/data/1      --表示發生了ATTRIB事件路徑為/data/1ATTRIB/data/2ATTRIB/data/3ATTRIB/data/4ATTRIB/data/5

知道上面的輸出效果之後 我們應該想得到,可以用rsync獲取inotifywait監控到的檔案列表來做指定的檔案同步,而不是每次都由rsync做全目錄掃描來判斷檔案是否存在差異。

網上的inotify+rsync分析

我們來看網上的教程,我加了註釋。(網上所有的教程基本都一模一樣,儘管寫法不一樣,致命點都是一樣的)

1 2 3 4 5 6 #!/bin/bash /usr/bin/inotifywait-mrq--format'%w%f'-ecreate,close_write,delete/backup|whileread file #把發生更改的檔案列表都接收到file 然後迴圈,但有什麼鬼用呢?下面的命令都沒有引用這個$file 下面做的是全量rsync do cd
/backup&&rsync-az--delete/backup/rsync_backup@192.168.24.101::backup/--password-file=/etc/rsync.password done

#注意看 這裡的rsync 每次都是全量的同步(這就坑爹了),而且 file列表是迴圈形式觸發rsync ,等於有10個檔案發生更改,就觸發10次rsync全量同步(簡直就是噩夢),那還不如直接寫個死迴圈的rsync全量同步得了。

#有很多人會說 日誌輸出那裡明明只有差異檔案的同步記錄。其實這是rsync的功能,他本來就只會輸出有差異需要同步的檔案資訊。不信你直接拿這句rsync來跑試試。

#這種在需要同步的源目錄檔案量很大的情況下,簡直是不堪重負。不僅耗CPU還耗時,根本不可以做到實時同步。

備註:backup為rsync server配置module,除了編寫指令碼以外,還需要配置一個rsync server,rsync server配置參考《http://www.ttlsa.com/linux/rsync-install-on-linux/

改良方法

要做到實時,就必須要減少rsync對目錄的遞迴掃描判斷,儘可能的做到只同步inotify監控到已發生更改的檔案。結合rsync的特性,所以這裡要分開判斷來實現一個目錄的增刪改查對應的操作。

指令碼如下