1. 程式人生 > >關於使用CDN之後APACHE日誌記錄中IP地址不正確的解決辦法

關於使用CDN之後APACHE日誌記錄中IP地址不正確的解決辦法

最近在搞APACHE日誌分析,裝好了awstats之後,這兩天進行了觀察,

 
報表日期 月 1 月 2010
首次參觀日期 2010年01月12日 11:04
最近參觀日期 2010年01月13日 23:59
    參觀者 參觀人次 網頁數 檔案數 位元組
瀏覽器流量 * 77  226  (2.93 參觀人次/參觀者) 508979 (2252.11 網頁數/參觀) 509492 (2254.38 檔案數/參觀) 13.67 G位元組 (63430.28 K位元組/參觀)
非瀏覽器流量 *  117312 122716 736.24 M位元組

這邊的結果很讓人費解,通過google統計網站的獨立IP訪問量有2W做,這裡顯示的數字相差甚遠。  後面的網頁數和檔案數又都與實際相吻合。  經過查詢原因發現 apache日誌裡記錄的IP地址不正確,大部分都是cdn的節點地址。 產生的原因很顯然是因為CDN造成的,之前在網站後臺程式裡讀取使用者IP地址也出現了類似問題。 可以使用print_r($_SERVER)  (PHP語言),查詢到真實的使用者IP地址,本站為 $_SERVER[‘HTTP_CDN-SRC-IP’].  這個是CDN攜帶的真實的客戶IP地址(這裡不計較使用者是否使用代理)。 但在APACHE的日誌記錄裡如何使用這個值呢?  本人在GOOGLE和百度裡查找了許久都沒有找到相應的資料或者說解決方案,只好自己思考尋求了。

仔細看了下APACHE裡日誌記錄的相關配置,針對LogFormat:

LogFormat "%h %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combined

我思索裡面的%{Referer}和%{User-Agent} 是如何取得的, 這兩個是在程式裡也是經常會用到的東西,客戶端傳送請求的時候 這兩個資訊都是作為頭詳細傳送到伺服器的。後來查看了下訪問時的所有頭資訊,如下:
Array
(
    [Cdn-Src-Ip] => 222.44.46.58
    [Accept] => image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
    [Accept-Language] => zh-cn
    [User-Agent] => Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727)
    [Host] =>

www.875.cn
    [Cookie] => __utma=217127135.1188793388.1263188369.1263364666.1263368206.5; __utmz=217127135.1263368206.5.2.utmcsr=211.167.92.250|utmccn=(referral)|utmcmd=referral|utmcct=/cgi-bin/awstats/awstats.pl; viewedShopsID=621; viewedShopsPP=%u6B27%u5C1A%u574A
    [Accept-Encoding] => gzip
    [Via] => 1.1 hnay40:80 (Cdn Cache Server V2.0)
    [Connection] => keep-alive
)
當然rerfer的時候也會有rerfer資訊出現在頭部資訊裡,上面也有Cookie、Host、User-Agent等資訊,這些資訊都是可以在apache配置檔案裡可以使用的變數,當然這裡Cdn-Src-Ip正是我想要的客戶的真實IP地址。 於是推測${Cdn-Src-Ip}在日誌記錄格式裡應該也是可以使用的。 後面的i應該是指忽略大小寫的意思。於是得出一個解決方案:
新增一個新的logformat資訊
LogFormat "%{Cdn-Src-Ip}i %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combinedcdn

在需要記錄的網站配置裡增加:
CustomLog "|/usr/local/sbin/cronolog /usr/local/apache/logs/www.875.cn-access_log.%Y%m%d" combinedcdn env=!IMAGES

重啟apache服務,然後訪問網站,檢視日誌記錄發現現在可以正常記錄客戶IP地址了。