1. 程式人生 > >從零開始學寫HTTP伺服器(七)muduo+tinyhttpd

從零開始學寫HTTP伺服器(七)muduo+tinyhttpd

(一)前言

對muduo內嵌的HttpServer進行了稍微的改進,融入了TinyHttpd中對CGI部分內容。

(二)程式碼

(三)CGI

簡單的理解:如果客戶請求的是靜態資料,則web server直接將資料響應給客戶端,如果是動態資料,那麼將這個動態頁面的請求交個CGI程式處理,不過web server需要配置一些環境變數來告訴CGI程式Method、URL等內容。具體一點的解釋:

首先,CGI是幹嘛的?CGI是為了保證web server傳遞過來的資料是標準格式的,方便CGI程式的編寫者。

web server(比如說nginx)只是內容的分發者。比如,如果請求/index.html,那麼web server會去檔案系統中找到這個檔案,傳送給瀏覽器,這裡分發的是靜態資料。好了,如果現在請求的是/index.php,根據配置檔案,nginx知道這個不是靜態檔案,需要去找PHP解析器來處理,那麼他會把這個請求簡單處理後交給PHP解析器。Nginx會傳哪些資料給PHP解析器呢?url要有吧,查詢字串也得有吧,POST資料也要有,HTTP header不能少吧,好的,CGI就是規定要傳哪些資料、以什麼樣的格式傳遞給後方處理這個請求的協議。仔細想想,你在PHP程式碼中使用的使用者從哪裡來的。

當web server收到/index.php這個請求後,會啟動對應的CGI程式,這裡就是PHP的解析器。接下來PHP解析器會解析php.ini檔案,初始化執行環境,然後處理請求,再以規定CGI規定的格式返回處理後的結果,退出程序。web server再把結果返回給瀏覽器。

好了,CGI是個協議,跟程序什麼的沒關係。那fastcgi又是什麼呢?Fastcgi是用來提高CGI程式效能的。

提高效能,那麼CGI程式的效能問題在哪呢?”PHP解析器會解析php.ini檔案,初始化執行環境”,就是這裡了。標準的CGI對每個請求都會執行這些步驟(不閒累啊!啟動程序很累的說!),所以處理每個時間的時間會比較長。這明顯不合理嘛!那麼Fastcgi是怎麼做的呢?首先,Fastcgi會先啟一個master,解析配置檔案,初始化執行環境,然後再啟動多個worker。當請求過來時,master會傳遞給一個worker,然後立即可以接受下一個請求。這樣就避免了重複的勞動,效率自然是高。而且當worker不夠用時,master可以根據配置預先啟動幾個worker等著;當然空閒worker太多時,也會停掉一些,這樣就提高了效能,也節約了資源。這就是fastcgi的對程序的管理。

那PHP-FPM又是什麼呢?是一個實現了Fastcgi的程式,被PHP官方收了。

大家都知道,PHP的直譯器是php-cgi。php-cgi只是個CGI程式,他自己本身只能解析請求,返回結果,不會程序管理(皇上,臣妾真的做不到啊!)所以就出現了一些能夠排程php-cgi程序的程式,比如說由lighthttpd分離出來的spawn-fcgi。好了PHP-FPM也是這麼個東東,在長時間的發展後,逐漸得到了大家的認可(要知道,前幾年大家可是抱怨PHP-FPM穩定性太差的),也越來越流行。

好了,最後來回來你的問題。 網上有的說,fastcgi是一個協議,php-fpm實現了這個協議

對。

有的說,php-fpm是fastcgi程序的管理器,用來管理fastcgi程序的

對。php-fpm的管理物件是php-cgi。但不能說php-fpm是fastcgi程序的管理器,因為前面說了fastcgi是個協議,似乎沒有這麼個程序存在,就算存在php-fpm也管理不了他(至少目前是)。 有的說,php-fpm是php核心的一個補丁

以前是對的。因為最開始的時候php-fpm沒有包含在PHP核心裡面,要使用這個功能,需要找到與原始碼版本相同的php-fpm對核心打補丁,然後再編譯。後來PHP核心集成了PHP-FPM之後就方便多了,使用–enalbe-fpm這個編譯引數即可。

有的說,修改了php.ini配置檔案後,沒辦法平滑重啟,所以就誕生了php-fpm

是的,修改php.ini之後,php-cgi程序的確是沒辦法平滑重啟的。php-fpm對此的處理機制是新的worker用新的配置,已經存在的worker處理完手上的活就可以歇著了,通過這種機制來平滑過度。

還有的說PHP-CGI是PHP自帶的FastCGI管理器,那這樣的話幹嗎又弄個php-fpm出

不對。php-cgi只是解釋PHP指令碼的程式而已。

(四)TinyHttpd實現CGI

主要看TinyHttpd中實現CGI。

void execute_cgi(int client, const char *path,
                 const char *method, const char *query_string)
{
//...
//...

//傳送響應頭
 sprintf(buf, "HTTP/1.0 200 OK\r\n");
 send(client, buf, strlen(buf), 0);

//建立用於父子程序通訊的管道
//需要兩個管道,因為管道不是全雙工的
 if (pipe(cgi_output) < 0) {
  cannot_execute(client);
  return;
 }
 if (pipe(cgi_input) < 0) {
  cannot_execute(client);
  return;
 }

//建立子程序執行CGI指令碼
 if ( (pid = fork()) < 0 ) {
  cannot_execute(client);
  return;
 }
 if (pid == 0)  /* child: CGI script */
 {
  char meth_env[255];
  char query_env[255];
  char length_env[255];

//dup用法見下
  dup2(cgi_output[1], 1);
  dup2(cgi_input[0], 0);
  close(cgi_output[0]);
  close(cgi_input[1]);
  sprintf(meth_env, "REQUEST_METHOD=%s", method);
  putenv(meth_env);//設定環境變數
  if (strcasecmp(method, "GET") == 0) {
   sprintf(query_env, "QUERY_STRING=%s", query_string);
   putenv(query_env);
  }
  else {   /* POST */
   sprintf(length_env, "CONTENT_LENGTH=%d", content_length);
   putenv(length_env);
  }
  execl(path, path, NULL);
  exit(0);
 } else {    /* parent */
// 父程序從管道讀取子程序的結果併發送給客戶
  close(cgi_output[1]);
  close(cgi_input[0]);
  if (strcasecmp(method, "POST") == 0)
   for (i = 0; i < content_length; i++) {
    recv(client, &c, 1, 0);
    write(cgi_input[1], &c, 1);
   }
  while (read(cgi_output[0], &c, 1) > 0)
   send(client, &c, 1, 0);

  close(cgi_output[0]);
  close(cgi_input[1]);
  waitpid(pid, &status, 0);
 }
}

(五)dup使用

dup,dup2,dup3是linux下非常重要的函式,用來實現流的重定向,可以很方便實現一些很有趣的效果
原理:每個程序在核心中有相應的fd記錄表,每個fd佔用一項。呼叫dup()後,新產生的newfd與原oldfd
向同一核心檔案表項,操作newfd與操作oldfd效果一樣,比較常用的應用就是CGI程式設計。

int main(int argc,char **argv)
{
    // 開啟檔案
    int fd = open("data.dat",O_CREAT|O_RDWR|O_TRUNC,S_IRUSR|S_IWUSR);
    assert(fd>0);

    // 通過新fd寫檔案
    read_write(fd);

    // dup實現標準輸入重定向到檔案 
    print2file(fd);

    // dup2實現標準輸入重定向到檔案
    print2file1(fd);

    return 0;
}

void read_write(int fd)
{
    // 拷貝fd,返回當前系統最小且沒有被使用的fd
    int nfd = dup(fd);
    printf("old:%d new:%d\n",fd,nfd); // 3 4

    char buf[1024];
    memset(buf,'\0',1024);

    int n;

    // 讀取控制檯輸入流,並通過nfd寫入檔案
    while((n = read(STDIN_FILENO,buf,1024))>0)
    {
        write(nfd,buf,n);
    }
}

void print2file(int fd)
{
    close(STDOUT_FILENO);

    /**
     * 關閉標準輸出流,呼叫dup()後返回的系統最小可用fd,此時nfd=1。此時任何目標為STDOUT_FILENO的I/O操作,如printf()等資料都會流入fd對應的檔案,太神奇了。
     * 如果fd為tcp套接字描述符,則會被髮送到與客戶端連線的socket上,這就是CGI的實現原理。這就能解釋CGI程式中大量的printf()語句
     */
    int nfd = dup(fd);

    // 這兩條列印語句會被寫入data.dat檔案中
    printf("old:%d new:%d\n",fd,nfd);
    printf("hello world\n");
}

void print2file1(int fd)
{
    /**
     * dup2可以指定拷貝後的newfd,原先的newfd會被關閉
     * dup2(fd,STDOUT_FILENO); 相當於 cose(STDOUT_FILENO); dup(fd); 
     */
    int nfd = dup2(fd,STDOUT_FILENO);
    printf("old:%d new:%d\n",fd,nfd);
    printf("dup2 test\n");
}