IEEE浮點數表示

阿新 • • 發佈：2019-01-16

IEEE浮點標準：V=(-1)^s*M*2^E

1.符號(sign)s決定這個數是負數(s=1)還是正數,0(s=0)。
2.尾數(significand) M是一個二進位制小數.
3.階碼(exponent)E對浮點數加權。
單精度，雙精度的表示如下：
exp為階碼，frac為尾數

給定了位表示，根據exp的值，被編碼的值可以分為三種情況：

規格化的表示一般的數，非規格化的表示靠近0的數或0，階碼都為1的，當尾數為0時表示無窮大(即溢位)，階碼都為1的，當尾數不為0時表示不存在的數，例如-1開根號之類的。
規格化的數階碼欄位被解釋為以偏置(biased)形式表示的有符號整數。其實就是一個無符號數e，在進行運算時將E=e-Bias,Bias為偏移量(2^(k-1)-1)。小數字段frac表示為0<frac<1

,小數點前的1預設存在不寫,尾數M=1+frac。
非規格化的數，階碼全為0，階碼值為E=1-Bias，這是為了讓數從非規格化的數到規格化的數(開始也為1-Bias)時能平滑轉換。
無窮大，階碼全1，小數全0。s=0時，表示正無窮，s=1時，表示負無窮。也可表示溢位，兩個數很大相乘時，或除以0時。
NaN,階碼全1，小數非0時。一些運算結果不是實數或無窮就返回NaN，也可表示未初始化的資料。

例子

很有趣的現象，將正浮點數的位級表達解釋為無符號整數，它們是按升序排列的，負浮點數則為降序。

舍入
舍入包括四種：向上舍入，向下舍入，向0舍入，向偶數舍入。
1.向上舍入是指每次舍入都進位，如1.4->2，1.5->2,-1.4 -> -1;
2.向下舍入是指每次舍入都向下舍入，如1.4->1,1.5->1,-1.5->-2;
3.向0舍入是指正負數都向0方向舍入，如1.4->1,1.5->1,-1.5->-1;
4.向偶數舍入指向上或者向下舍入，儘量使結果的最低有效數字為偶數，也就是向最靠近的數舍入，如1.5->2,1.4->1,2.5->2,-1.5->-2。

向偶數舍入有一點比較難理解：
**數字最低位有效位為偶數時就不用考慮低位進位了嗎？
其實不然，如1.2453000精確到百分位，用向偶數舍入得到1.25。也就是說當某個數不是可能精確值的中間值時，優先考慮低位進位情況，在這個例子中1.24、1.25為可能的精確值，1.2453000顯然不是這兩個數的中間值，所以優先考慮後面的進位情況。當這個數為中間值時，優先考慮最低位有效位是否為偶數，是則捨去後面的，如1.245000->1.24，不是則考慮低位進位，如1.235000->1.24。

向偶數舍入也被用於浮點數中，二進位制的0為偶數，1為奇數。道理和上面一致。非中間值，考慮低位進位，如10.00110->10.01(保留2位小數)，中間值，考慮最低位有效位，如10.10100->10.10(保留2位小數)

浮點運算

浮點加法
IEEE規定，1/-0將產生負無窮大，1/+0將產生正無窮大。
實數的加法也形成了阿貝爾群，但我們必須考慮舍入對這些屬性的影響。x + y= y+x,這個運算是可交換的，但不可結合的。如，(3.14+1e10)求值為0.0——因為舍入，值3.14丟失了。而3.14+(1e10-1e10)為3.14。
作為阿貝爾群，大多數浮點數都是有逆元的，但無窮和NaN是除外的，正無窮+負無窮=NaN，NaN+x=NaN。
此外，浮點加法滿足單調性屬性：如果a>=b,那麼對於任意a，b以及x，除了NaN(個人感覺無窮也應該除外)，都有x+a>=x+b。無符號或補碼加法不具有該屬性。

浮點乘法
浮點乘法遵循通常乘法的所具有的許多特性。浮點乘法是封閉的（即使可能產生無窮大和NaN），它也是可交換的，並且它的乘法單位元為1.0。不具備可結合性，如在單精度浮點下，(1e20*1e20)le-20為正無窮大，而1e20(1e20*1e-20)為1e20。此外，浮點乘法在加法上不具備分配性，如在單精度浮點數下，1e20*(1e20-1e20)為0.0，而1e20*1e20-1e20*1e20為NaN。
此外，對於任何a,b和c,並且a，b，c都不等於NaN，浮點乘法滿足下列單調性：
只要a不等於NaN，就有a*a>=0。
無符號或補碼的乘法沒有這些單調性。

IEEE浮點數表示

浮點運算

float與 double型數據存儲---IEEE浮點數表示法

IEEE浮點數表示

深入理解計算機系統 2.4.2 IEEE浮點表示詳細講解

IEEE浮點表示

機器中的浮點數表示

計組—浮點數表示和運算

-1.1的浮點數表示（IEEE754標準）

java 浮點數表示詳解及解決方法（例項函式）

IEEE754標準浮點數表示與舍入

IEEE 754 浮點數的表示精度探討

計算機中浮點數的表示，IEEE 754標準

浮點數在計算機中的二進位制表示（IEEE 754 標準）

浮點數的二進位制表示(IEEE 754標準)

IEEE 754——計算機中浮點數的表示方法

浮點數的二進制表示

cout<<fixed表示按一般方式輸出浮點數

JVM之浮點數（float）表示

浮點數是如何表示的

為什麼能精確表示的浮點數有效位數是7位

浮點數在記憶體中的表示

IEEE浮點數表示

浮點運算

相關推薦