1. 程式人生 > >網站流量歐卡國際源碼出售數據采集環境部署及實現

網站流量歐卡國際源碼出售數據采集環境部署及實現

parent script now() welcom cat stop Opens 創建 conn

一、原理歐卡國際源碼出售論壇:haozbbs.com Q1446595067分析與設計實現
  

   

二、系統環境部署

    !!!執行復制下列命令是註意查看是否為英文類型的 “-” ,當命令錯誤時首先排查該處

-------------------------------服務器  A  中部署開始-----------------------------------

  需要的安裝包

uaJIT-2.0.4.tar.gz
set-misc-nginx-module-0.29.tar.gz
lua-nginx-module-0.10.0.tar.gz
ngx_devel_kit-0.2.19.tar.gz
echo-nginx-module-0.58.tar.gz

openresty-1.9.7.3.tar.gz
nginx-1.8.1.tar.gz

服務器中安裝依賴
yum -y install gcc perl pcre-devel openssl openssl-devel

上傳 LuaJIT-2.0.4.tar.gz 並安裝 LuaJIT
tar -zxvf LuaJIT-2.0.4.tar.gz -C /usr/local/src/
cd /usr/local/src/LuaJIT-2.0.4/
make && make install PREFIX=/usr/local/luajit

設置 LuaJIT 環境變量
vi /etc/profile
export LUAJIT_LIB=/usr/local/luajit/lib

export LUAJIT_INC=/usr/local/luajit/include/luajit-2.0
source /etc/profile

創建 modules 文件夾,保存 nginx 依賴的模塊
mkdir -p /usr/local/nginx/modules

上傳 nginx 依賴的模塊
set-misc-nginx-module-0.29.tar.gz
lua-nginx-module-0.10.0.tar.gz
ngx_devel_kit-0.2.19.tar.gz
echo-nginx-module-0.58.tar.gz

將依賴的模塊直接解壓到 modules 目錄
tar -zxvf lua-nginx-module-0.10.0.tar.gz -C /usr/local/nginx/modules/

tar -zxvf set-misc-nginx-module-0.29.tar.gz -C /usr/local/nginx/modules/
tar -zxvf ngx_devel_kit-0.2.19.tar.gz -C /usr/local/nginx/modules/
tar -zxvf echo-nginx-module-0.58.tar.gz -C /usr/local/nginx/modules/

安裝 openresty
tar -zxvf openresty-1.9.7.3.tar.gz -C /usr/local/src/
cd /usr/local/src/openresty-1.9.7.3/
./configure --prefix=/usr/local/openresty --with-luajit && make && make install

安裝 nginx
tar -zxvf nginx-1.8.1.tar.gz -C /usr/local/src/

編譯 nginx 並支持其他模塊
1
cd /usr/local/src/nginx-1.8.1/
./configure --prefix=/usr/local/nginx \
--with-ld-opt="-Wl,-rpath,/usr/local/luajit/lib" \
--add-module=/usr/local/nginx/modules/ngx_devel_kit-0.2.19 \
--add-module=/usr/local/nginx/modules/lua-nginx-module-0.10.0 \
--add-module=/usr/local/nginx/modules/set-misc-nginx-module-0.29 \
--add-module=/usr/local/nginx/modules/echo-nginx-module-0.58
make -j2
make install

備註:如果對 linux 相關操作不熟,請嚴格按照上述步驟搭建環境,切記心細,心細,再心細。

-------------------------------服務器  A  中部署結束-----------------------------------

三、自定義采集數據實現

-------------------------------服務器  B  中執行開始-----------------------------------

安裝httpd
yum install httpd
啟動httpd
service httpd start
進入/var/www/html/內上傳 index.html頁面文件
cd /var/www/html/

創建頁面 index.html
  頁面 index.html代碼如下:

復制代碼
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>welcome</title>

    <script type="text/javascript">
    var _maq = _maq || [];
    _maq.push([‘_setAccount‘, ‘jiFeng‘]);

    (function() {
        var ma = document.createElement(‘script‘); 
        ma.type = ‘text/javascript‘;
        ma.async = true;
        ma.src = ‘http://192.168.175.153/ma.js‘;
        var s = document.getElementsByTagName(‘script‘)[0]; 
        s.parentNode.insertBefore(ma, s);
    })();
    </script>

</head>
<body>
    <h1 align="center">雲計算大數據</h1>    
</body>

</html>
復制代碼
-------------------------------服務器  B  中執行結束-----------------------------------

-------------------------------服務器   A  中執行開始-----------------------------------

在安裝目錄 nginx/html 下添加一個數據采集腳本 ma.js。
cd /usr/local/nginx/html/

      腳本 ma.js代碼如下:

復制代碼
(function () {
var params = {};
//Document對象數據
if(document) {
params.domain = document.domain || ‘‘;
params.url = document.URL || ‘‘;
params.title = document.title || ‘‘;
params.referrer = document.referrer || ‘‘;
}
//Window對象數據
if(window && window.screen) {
params.sh = window.screen.height || 0;
params.sw = window.screen.width || 0;
params.cd = window.screen.colorDepth || 0;
}
//navigator對象數據
if(navigator) {
params.lang = navigator.language || ‘‘;
}
//解析_maq配置
if(_maq) {
for(var i in _maq) {
switch(_maq[i][0]) {
case ‘_setAccount‘:
params.account = _maq[i][1];
break;
default:
break;
}
}
}
//拼接參數串
var args = ‘‘;
for(var i in params) {
if(args != ‘‘) {
args += ‘&‘;
}
args += i + ‘=‘ + encodeURIComponent(params[i]);
}

//通過Image對象請求後端腳本
var img = new Image(1, 1); 
img.src = ‘http://192.168.175.153/log.gif?‘ + args;

})();
復制代碼

修改 nginx 的配置文件,添加自定義相關業務邏輯。
cd /usr/local/nginx/conf
vi nginx.conf
復制代碼
worker_processes 2;

events {
worker_connections 1024;
}

http {
include mime.types;
default_type application/octet-stream;

log_format  main  ‘$remote_addr - $remote_user [$time_local] "$request" ‘
                  ‘$status $body_bytes_sent "$http_referer" ‘
                  ‘"$http_user_agent" "$http_x_forwarded_for"‘;

log_format user_log_format "$msec||$remote_addr||$status||$body_bytes_sent||$u_domain||$u_url||$u_title||$u_referrer||$u_sh||$u_sw||$u_cd||$u_lang||$http_user_agent||$u_account";

sendfile        on;  #允許sendfile方式傳輸文件,默認為off

keepalive_timeout  65; #連接超時時間,默認為75s

server {
    listen       80;
    server_name  localhost;
    location /log.gif {
        #偽裝成gif文件
        default_type image/gif;    
        #nginx本身記錄的access_log,日誌格式為main
        access_log  logs/access.log  main;

        access_by_lua "
            -- 用戶跟蹤cookie名為__utrace
            local uid = ngx.var.cookie___utrace        
            if not uid then
                -- 如果沒有則生成一個跟蹤cookie,算法為md5(時間戳+IP+客戶端信息)
                uid = ngx.md5(ngx.now() .. ngx.var.remote_addr .. ngx.var.http_user_agent)
            end 
            ngx.header[‘Set-Cookie‘] = {‘__utrace=‘ .. uid .. ‘; path=/‘}
            if ngx.var.arg_domain then
            -- 通過subrequest到/i-log記錄日誌,將參數和用戶跟蹤cookie帶過去
                ngx.location.capture(‘/i-log?‘ .. ngx.var.args .. ‘&utrace=‘ .. uid)
            end 
        ";  

        #此請求資源本地不緩存
        add_header Expires "Fri, 01 Jan 1980 00:00:00 GMT";
        add_header Pragma "no-cache";
        add_header Cache-Control "no-cache, max-age=0, must-revalidate";

        #返回一個1×1的空gif圖片
        empty_gif;
    }   

    location /i-log {
        #內部location,不允許外部直接訪問
        internal;

        #設置變量,註意需要unescape
        set_unescape_uri $u_domain $arg_domain;
        set_unescape_uri $u_url $arg_url;
        set_unescape_uri $u_title $arg_title;
        set_unescape_uri $u_referrer $arg_referrer;
        set_unescape_uri $u_sh $arg_sh;
        set_unescape_uri $u_sw $arg_sw;
        set_unescape_uri $u_cd $arg_cd;
        set_unescape_uri $u_lang $arg_lang;
        set_unescape_uri $u_account $arg_account;

        #打開subrequest(子請求)日誌
        log_subrequest on;
        #自定義采集的日誌,記錄數據到user_defined.log
        access_log logs/user_defined.log user_log_format;

        #輸出空字符串
        echo ‘‘;
    }        
}

}
復制代碼

啟動 nginx
cd /usr/local/nginx
sbin/nginx -c conf/nginx.conf
查看是否啟動
ps -ef | grep nginx

  

-------------------------------服務器   A  中執行結束-----------------------------------

通過遊覽器訪問 nginx
訪問:192.168.175.151/index.html
-------------------------------服務器   A  中執行開始-----------------------------------

觀察自定義日誌采集文件是否有對應的內容輸出:
cd /usr/local/nginx/logs
tail -f user_defined.log

此時還可以觀察 nginx 默認的輸出日誌文件:

tail -f access.log

停止 nginx:

cd /usr/local/nginx
sbin/nginx –s stop

網站流量歐卡國際源碼出售數據采集環境部署及實現