1. 程式人生 > >PHP四種序列化方案

PHP四種序列化方案

原文地址:https://t.ti-node.com/thread/...

資料的序列化是一個非常有用的功能,然而目測很多人跟我一樣,在剛接觸這玩意的時候壓根就不理解這貨色到底是幹啥用的,反正老師說了,實在理解不了就先背過再說。

“啥犢子玩意啊,又是序列化、又是反序列化。。。”(圖片來自於《我的團長我的團》之國軍二道販子兼二人轉演員迷龍同學)。

其實將資料序列化的作用無外乎有兩個:

  • 方便傳輸
  • 方便儲存

方便儲存如何理解呢?比如我們有個PHP物件或者一個PHP陣列需要儲存到資料庫甚至檔案中,這顯然是不可能的,這個時候必須要將PHP物件或者PHP陣列序列化後再執行儲存操作。不過這將PHP陣列序列化後存起來還能理解,這物件也能儲存啊?這操作是否過於風騷?少年,這一點兒都不風騷。有些時候將物件直接儲存起來,用的時候只需要簡單的反序列化後就可以投產使用了,避免了new一次帶來的效能耗費。

方便傳輸如何理解呢?其實序列化在傳輸中應用的相對更多更常見些許。最簡單的一個例子,一個碼前端的碼了一個ajax找你給TA提供一個API,那麼這個時候你倆得商量返回什麼資料,比如json或者xml,甚至你倆自己作死約定私有資料格式。比如在一個比較典型的服務架構中,閘道器伺服器和內部RPC伺服器之間通過msgpack傳遞資料。這都是典型的序列化為了傳輸的典型應用案例。

這裡序列化的概念可能更為廣泛和籠統一些,包括傳統的serialize、json、msgpack、protobuf等。( 如果你覺得序列化這個稱呼不太嚴謹的話,可以用encode來代替;反序列化則用decode來代替。反正我就用統統用序列化和反序列化來稱呼了,如果你覺得實在不舒服,可以順著網線來砍我!)。

實際上,從更高的層面看,資料的序列化可以分為兩種:

  • 文字序列化,常見如json、serialize、xml等
  • 二進位制序列化,常見如msgpack、protobuf、thrift等

一般說來,考驗序列化技術的效能指標一共有兩個,一個是序列化的速度,一個是序列化後資料的大小,自然是序列化速度越快、序列化後的資料越小為佳。就目前來看,protobuf、msgpack等二進位制序列化無論是速度上還是資料大小上,都要比文字序列化更好。不過話說回來,文字序列化有更好的可讀性,一眼就能瞪出來資料內容大概是啥玩意。

今天帶到這裡的這裡的有四個具體的方案,這四種方案都是簡單粗暴、開箱即用型別的,我們分別測試感受下,看哪個更適合我們。

參會的四個哥們:PHP內建的serialize、PHP內建的JSON解析器、PHP擴充套件JSOND、PHP擴充套件msgpack。其中前三個都是文字型別的,msgpack則是二進位制型別的。

JSOND作為PHP內建的JSON解析器的高階版本,坊間一直傳聞速度上要比內建的更牛X一些,作為擴充套件,這貨需要額外安裝,附送地址:https://pecl.php.net/get/json...

msgpack是一個鳥哥等人搞的一套二進位制序列化工具,slogan就是“It's like JSON.but fast and small.”,附送地址:https://pecl.php.net/get/msgp...

  1. serialize用法
    serialize(),序列化方法。
    unserialize(),反序列化方法。
  2. json用法
    json_encode(),沒啥好說的吧?
    json_decode(),沒啥好說的吧?
  3. jsond用法
    jsond_encode(),和json_encode()一樣,後面多個字母d而已。
    jsond_decode(),和json_decode()一樣,後面多個字母d而已。
  4. msgpack用法
    msgpack_pack(),序列化方法。
    msgpack_unpack(),反序列化方法。

測試程式碼如下:

<?php
// 故意搞了一個還算大的php陣列,更容易看出差距來
$arr = array(
  array(
    'uid' => 22193123,
    'gender' => 'famale',
    'username' => 'elarity',
    'password' => md5('www123'),
    'relation' => array(
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
      array(
        'uid' => 22193123,
        'gender' => 'famale',
        'username' => 'elarity',
        'password' => md5('www123'),
      ),
    ),
  )
);

// 每種序列化方案都執行100000次
$counter = 100000;

// json序列化方案,執行100000次
echo PHP_EOL.PHP_EOL;
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $json = json_encode( $arr ); 
}
$size = strlen( $json );
$end = microtime( true );
$cost_time = $end - $start;
echo "json_encode : 耗費時間為{$cost_time} , 資料體積為{$size}".PHP_EOL;

// jsond序列化方案,執行100000次
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $jsond = jsond_encode( $arr ); 
}
$size = strlen( $jsond );
$end = microtime( true );
$cost_time = $end - $start;
echo "jsond_encode : 耗費時間為{$cost_time} , 資料體積為{$size}".PHP_EOL;

// serialize序列化方案,執行100000次
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $serialize = serialize( $arr ); 
}
$size = strlen( $serialize );
$end = microtime( true );
$cost_time = $end - $start;
echo "serialize : 耗費時間為{$cost_time} , 資料體積為{$size}".PHP_EOL;

// msgpack序列化方案,執行100000次
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $msgpack = msgpack_pack( $arr );
}
$size = strlen( $msgpack );
$end = microtime( true );
$cost_time = $end - $start;
echo "msgpack耗費時間為 : {$cost_time} , 資料體積為{$size}".PHP_EOL;
echo PHP_EOL.PHP_EOL;

將檔案儲存為test.php,然後php test.php執行,結果如下圖所示:

![在這裡插入圖片描述](https://img-blog.csdnimg.cn/2018121221032979.jpg)

總結一下:

  1. jsond確實是要比json快一些的
  2. 總有刁民張嘴就來json要比serialize()快
  3. serialize()資料體積確實大(因為還保留了資料型別說明)
  4. msgpack最佳???不知道昂,你們自己感受