浮點數是如何表示的

阿新 • • 發佈：2018-11-02

如何編碼浮點數？我們知道計算機表示的任何資訊都是一串bit，具體內容決定於如何解釋。IEEE浮點標準用

V = (-1)^s * M * 2^E

的形式來表示一個數。s表示符號（1表示負，0表示正）; M表示尾數，二進位制小數，取值範圍為1~2或者0~1，不包括上限值；E表示階碼，對浮點數加權，這個權重是2的E次冪（可能是負數）。在單精度浮點格式中，s佔用最高位1位，exp佔用接下來的8位，frac佔用剩下的23位。雙精度中分別是（1，11，52）。
請注意前面為何不直接說E佔用了多少位和M佔用了多少位？因為最終E和M的值需要由exp和frac的位模式計算出來。接下來討論單精度浮點數，exp的8個bit位取值有三種情況，下面根據每種情況分別計算E和M。

首先約定exp的值為8個bit組成的無符號數，取值為0~255。E為有符號數，取值為-126~127。
frac應該解釋為二進位制小數，計算方式是從高位到低位的每個bit乘以2的負數冪（-1到-23），然後相加。

當exp大於0小於255時，浮點數為規格化。

E = exp - (2^7 - 1)

M = 1 + frac

當exp等於0時，浮點數為非規格化。

E = 1 - (2^7 - 1)

M = frac

非規則化可以表示0，即frac取值為0時。根據符號位分別是+0.0或者-0.0

當exp等於255時，浮點數解釋為特殊值。

當frac取值0時，根據符號位分別表示+∞和-∞，無窮能表示溢位；當frac不為0時，表示NaN，當一些運算的結果不能是實數或者無窮時就會返回這個，例如計算-1開根號。

浮點數是如何表示的

當exp大於0小於255時，浮點數為規格化。

當exp等於0時，浮點數為非規格化。

當exp等於255時，浮點數解釋為特殊值。

float與 double型數據存儲---IEEE浮點數表示法

機器中的浮點數表示

計組—浮點數表示和運算

-1.1的浮點數表示（IEEE754標準）

IEEE浮點數表示

java 浮點數表示詳解及解決方法（例項函式）

IEEE754標準浮點數表示與舍入

IEEE 754 浮點數的表示精度探討

浮點數的二進制表示

cout<<fixed表示按一般方式輸出浮點數

JVM之浮點數（float）表示

浮點數是如何表示的

為什麼能精確表示的浮點數有效位數是7位

計算機中浮點數的表示，IEEE 754標準

浮點數在記憶體中的表示

單精度浮點數的二進位制表示中，為什麼指數的表示要與127相加作為結果？

c/c++中的浮點數的表示方法

sprintf與浮點數的表示

0.1在計算機中不能被精確表示（浮點數的陷阱其實也是二進位制下的陷阱？）

浮點數在計算機中的二進位制表示（IEEE 754 標準）

浮點數是如何表示的

當exp大於0小於255時，浮點數為規格化。

當exp等於0時，浮點數為非規格化。

當exp等於255時，浮點數解釋為特殊值。

相關推薦