1. 程式人生 > >淺談PHP中pack、unpack的詳細用法

淺談PHP中pack、unpack的詳細用法

特殊 ++ 位置 per 小端 bsp 分享 .com 十六進制

轉自:https://segmentfault.com/a/1190000008305573

PHP中有兩個函數pack和unpack,很多PHPer在實際項目中從來沒有使用過,甚至也不知道這兩個方法是用來幹嘛的。這篇文章來為大家介紹一下它倆到底是用來幹啥的。

pack

string pack ( string $format [, mixed $args [, mixed $... ]] )

該函數用來將對應的參數($args)打包成二進制字符串。

其中第一個參數$format,有如下選項(可選參數很多,後面會選幾個常用的講解):

CodeDescription
a 以NUL字節填充字符串空白
A 以SPACE(空格)填充字符串
h 十六進制字符串,低位在前
H 十六進制字符串,高位在前
c 有符號字符
C 無符號字符
s 有符號短整型(16位,主機字節序)
S 無符號短整型(16位,主機字節序)
n 無符號短整型(16位,大端字節序)
v 無符號短整型(16位,小端字節序)
i 有符號整型(機器相關大小字節序)
I 無符號整型(機器相關大小字節序)
l 有符號長整型(32位,主機字節序)
L 無符號長整型(32位,主機字節序)
N 無符號長整型(32位,大端字節序)
V 無符號長整型(32位,小端字節序)
q 有符號長長整型(64位,主機字節序)
Q 無符號長長整型(64位,主機字節序)
J 無符號長長整型(64位,大端字節序)
P 無符號長長整型(64位,小端字節序)
f 單精度浮點型(機器相關大小)
d 雙精度浮點型(機器相關大小)
x NUL字節
X 回退一字節
Z 以NUL字節填充字符串空白(new in PHP 5.5)
@ NUL填充到絕對位置

這麽多參數看下來,我第一次是真心懵逼了,大部分說明都很好理解,但是其中的主機、大端、小端等字節序是什麽鬼呢?接下裏的內容比較枯燥,但必須理解才行,堅持吧。

字節序是什麽?

就是字節的順序,說白了就是多字節數據的存放順序(一個字節顯然不需要順序)。
比如AB分別對應的二進制表示為0100 00010100 0010。對於儲存字符串AB,我們可以0100 0001 0100 0010也可以0100 0010 0100 0001,這個順序就是所謂的字節序。

高/低位字節

比如字符串AB,左高右低(我們正常的閱讀順序),A為高字節,B為低字節

高/低地址

假設0x123456是按從高位到底位的順序儲存,內存中是這樣存放的:

高地址 -> 低地址
12 -> 34 -> 56

大端字節序(網絡字節序)

大端就是將高位字節放到內存的低地址端,低位字節放到高地址端。網絡傳輸中(比如TCP/IP)低地址端(高位字節)放在流的開始,對於2個字節的字符串(AB),傳輸順序為:A(0-7bit)、B(8-15bit)。
那麽小端字節序自然和大端相反。

主機字節序

表示當年機器的字節序(也就是網絡字節序是確定的,而主機字節序是依機器確定的),一般為小端字節序。

a和A(打包字符串,用NUL或者空格填充)

$string = pack(‘a6‘, ‘china‘);
var_dump($string); //輸出結果: string(6) "china",最後一個字節是不可見的NUL
echo ord($string[5]); //輸出結果: 0(ASCII碼中0對應的就是nul)

//A同理
$string = pack(‘A6‘, ‘china‘);
var_dump($string); //輸出結果: string(6) "china ",最後一個字節是空格
echo ord($string[5]); //輸出結果: 32(ASCII碼中32對應的就是空格)

技術分享圖片

附贈ASCII表一張(linux/unix下可以使用man ascii查看)

h和H

$string = pack(‘H3‘, 281);
var_dump($string); //輸出結果: string(2) "("

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出結果: 40 16

h和H需要特殊說明一下,它們是將對應的參數看做十六進制字符然後打包。什麽意思呢?比如上面的281,打包前會將281轉換為0x281,因為十六進制的一位對應二進制的四位,上面的0x281只有1.5個字節,後面會默認補0變成0x2810,0x28對應的十進制為40((),0x10對應的十進制為16(dle不可見字符),懂了吧?不懂可以給我留言。。

c和C

$string = pack(‘c3‘, 67, 68, -1);
var_dump($string); //輸出:string(3) "CD?"

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 67 68 225

最後輸出本能應該覺得是67 68 -1
ord獲取的是字符的ASCII碼(範圍0-255),這時-1(0000 0001)對應的字符將以補碼的形式輸出也就是255(1111 1110 + 0000 0001 = 1111 1111)

整型相關

所有的整型類型使用方法完全一樣,主要註意它們的位和字節序就可以了,下面以L作為例子展示

$string = pack(‘L‘, 123456789);
var_dump($string); //輸出:string(4) "?["

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 21 205 91 7

f和d

$string = pack(‘f‘, 12345.123);
var_dump($string);
//輸出:string(4) "~?@F"
var_dump(unpack(‘f‘, $string)); //這裏提前用到了unpack,後面會講解
//輸出:float(12345.123046875)

f和d是針對浮點數打包,至於為什麽打包前是12345.123解包後是12345.123046875,這個和浮點數的儲存有關系,後面可以單開一個文章講解一下IEEE標準

x、X、Z、@

$string = pack(‘x‘); //打包一個nul字符串
echo ord($string); //輸出: 0

關於X(大寫X),試了N次,沒搞明白怎麽用,有清楚的童鞋可以給我留言,多謝。

$string = pack(‘Z2‘, ‘abc5‘); //其實就是將從Z後面的數字位置開始,全部設置為nul
var_dump($string); //輸出:string(2) "a"

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 97 0
$string = pack(‘@4‘); //我理解為填充N個nul
var_dump($string); //輸出: string(4) ""

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 0 0 0 0

unpack

array unpack ( string $format , string $data )

unpack的使用相當簡單,就是講pack打包的數據解包,打包的時候用的什麽參數,就用什麽參數解包,具體使用懶得說了,列幾個小例子

$string = pack(‘L4‘, 1, 2, 3, 4);
var_dump(unpack(‘L4‘, $string));
//輸出:
array(4) {
[1]=>
int(1)
[2]=>
int(2)
[3]=>
int(3)
[4]=>
int(4)
}

$string = pack(‘L4‘, 1, 2, 3, 4);
var_dump(unpack(‘Ll1/Ll2/Ll3/Ll4‘, $string)); //可以指定key,用/分割
//輸出:
array(4) {
["l1"]=>
int(1)
["l2"]=>
int(2)
["l3"]=>
int(3)
["l4"]=>
int(4)
}

這兩個函數到底有啥用途

  • 數據通信(通過二進制格式與其它語言通信)

  • 數據加密(如果不告訴第三方你的打包方式,對方解包的難度就相對很大)

  • 節省空間(比如比較大的數字按字符串儲存會浪費很多空間,打包成二進制格式才需要4位<32位數字>)

  • 自己去想吧

淺談PHP中pack、unpack的詳細用法