1. 程式人生 > >php 代碼的編譯

php 代碼的編譯

znode clas opc static 生成 二進制 所有 臨時 body

PHP是解析型高級語言,事實上從Zend內核的角度來看PHP就是一個普通的C程序,它有main函數,我們寫的PHP代碼是這個程序的輸入,然後經過內核的處理輸出結果,內核將PHP代碼"翻譯"為C程序可識別的過程就是PHP的編譯。

C程序在編譯時將一行行代碼編譯為機器碼,每一個操作都認為是一條機器指令,這些指令寫入到編譯後的二進制程序中,執行的時候將二進制程序load進相應的內存區域(常量區、數據區、代碼區)、分配運行棧,然後從代碼區起始位置開始執行,這是C程序編譯、執行的簡單過程。

同樣,PHP的編譯與普通的C程序類似,只是PHP代碼沒有編譯成機器碼,而是解析成了若幹條opcode數組,每條opcode就是C裏面普通的struct,含義對應C程序的機器指令,執行的過程就是引擎依次執行opcode,比如我們在PHP裏定義一個變量:$a = 123;

,最終到內核裏執行就是malloc一塊內存,然後把值寫進去。

在zend_compile.h文件中,opcode結構:

 1 struct _zend_op {
 2     const void *handler; //對應執行的C語言function,即每條opcode都有一個C function處理
 3     znode_op op1; //操作數1
 4     znode_op op2; //操作數2
 5     znode_op result; //返回值
 6     uint32_t extended_value; 
 7     uint32_t lineno;
 8     zend_uchar opcode;  //
opcode指令 9 zend_uchar op1_type; //操作數1類型 10 zend_uchar op2_type; //操作數2類型 11 zend_uchar result_type; //返回值類型 12 };


所以PHP的解析過程任務就是將PHP代碼(通過詞法分析re2c,語法分析bison)轉化為opcode數組,代碼裏的所有信息都保存在opcode中,然後將opcode數組交給zend引擎執行,opcode就是內核具體執行的命令,比如賦值、加減操作、函數調用等,每一條opcode都對應一個處理handle,這些handler是提前定義好的C函數。

 1 struct
_zend_op_array { 2 //common是普通函數或類成員方法對應的opcodes快速訪問時使用的字段 3 /* Common elements */ 4 zend_uchar type; 5 zend_uchar arg_flags[3]; /* bitset of arg_info.pass_by_reference */ 6 uint32_t fn_flags; 7 zend_string *function_name; 8 zend_class_entry *scope; 9 zend_function *prototype; 10 uint32_t num_args; 11 uint32_t required_num_args; 12 zend_arg_info *arg_info; 13 /* END of common elements */ 14 15 uint32_t *refcount; 16 17 uint32_t last; 18 //opcode指令數組 19 zend_op *opcodes; 20 21 //PHP代碼裏定義的變量數:op_type為IS_CV的變量,不含IS_TMP_VAR、IS_VAR的 22 //編譯前此值為0,然後發現一個新變量這個值就加1 23 int last_var; 24 //臨時變量數:op_type為IS_TMP_VAR、IS_VAR的變量 25 uint32_t T; 26 //PHP變量名數組 27 zend_string **vars;//這個數組在ast編譯期間配合last_var用來確定各個變量的編號,非常重要的一步操作 28 29 int last_live_range; 30 int last_try_catch; 31 zend_live_range *live_range; 32 zend_try_catch_element *try_catch_array; 33 34 //靜態變量符號表:通過static聲明的 35 /* static variables support */ 36 HashTable *static_variables; 37 38 zend_string *filename; 39 uint32_t line_start; 40 uint32_t line_end; 41 zend_string *doc_comment; 42 uint32_t early_binding; /* the linked list of delayed declarations */ 43 44 //字面量數量 45 int last_literal; 46 //字面量(常量)數組,這些都是在PHP代碼定義的一些值 47 zval *literals; 48 49 //運行時緩存數組大小 50 int cache_size; 51 //運行時緩存,主要用於緩存一些znode_op以便於快速獲取數據,後面單獨介紹這個機制 52 void **run_time_cache; 53 54 void *reserved[ZEND_MAX_RESERVED_RESOURCES]; 55 };

opcode指令:即PHP代碼具體對應的處理動作,與二進制程序中的代碼段對應
字面量存儲:PHP代碼中定義的一些變量初始值、調用的函數名稱、類名稱、常量名稱等等稱之為字面量,這些值用於執行時初始化變量、函數調用等等
變量分配情況:與字面量類似,這裏指的是當前opcodes定義了多少變量、臨時變量,每個變量都有一個對應的編號,執行初始化按照總的數目一次性分配zval,使用時也完全按照編號索引,而不是根據變量名索引

從PHP代碼到opcode是怎麽實現的?最容易想到的方式就是正則匹配,當然過程沒有這麽簡單。PHP編譯過程包括詞法分析、語法分析,使用re2c、bison完成,舊的PHP版本直接生成了opcode,PHP7新增了抽象語法樹(AST),在語法分析階段生成AST,然後再生成opcode數組

php 代碼的編譯