1. 程式人生 > >(轉)從Python的0.1輸出0.1000000000000001說浮點數的二進制

(轉)從Python的0.1輸出0.1000000000000001說浮點數的二進制

python2 comment 科學 交換 tps alt 三種 一段 fill

原文地址:http://blog.csdn.net/u012843100/article/details/60885763

今天在學習Python核心編程的時候,十進制浮點數那段看到一個有趣的事情。

>>>0.1
0.1000000000000001

為什麽會這樣?文中是這樣解釋的:

這是因為語言絕大多數C語言的雙精度實現都遵守IEEE754規範,其中52位用於底。因此浮點值只能有52位精度,類似這樣的值用二進制表示只能像上面那樣被截斷。0.1的二進制表示是0.11001100110011…*2^-3,因為它最接近的二進制近似值是0.0001100110011…,或1/16+1/32+1/256+…

意思就是四舍五入之後就變成0.1000000000000001了,上面這段話可能很多人似懂非懂。

可能是我在Python 3跟Python2.7中都試過,並沒有上述所說的這種問題,但這個問題還是值得大家來了解下。

下面先來段C#代碼證明我本質上還是個.Net程序猿吧:

            float f = 2.15f;
            double d = f;
            Console.WriteLine(d.ToString("0.00000000000"));

            d = 2.15d;              
            Console.WriteLine(d.ToString("0.00000000000"));  

            Console.ReadKey();

聰明的你猜猜這裏輸出的兩次結果一樣嗎?答案是不一樣的,不信你可以試試是不是下面這樣。
技術分享

要解答上面這個0.1的輸出,咱們就需要一步步來了。

第一步,先把0.1轉成二進制

整數轉二進制大家肯定都知道的,這個就不說了,但是小數部分怎麽轉可能還是有些同學不知道。沒關系,附上鏈接:二進制十進制間小數怎麽轉換

所以十進制0.1的二進制就是0.00011001100110011…到這裏,

0.1的二進制表示是0.11001100110011…*2^-3

這句話就懂了吧。

第二步,大概了解下IEEE 754

IEEE 754 標準是IEEE二進位浮點數算術標準(IEEE Standard for Floating-Point Arithmetic)的標準編號,IEEE 754 標準規定了計算機程序設計環境中的二進制和十進制的浮點數自述的交換、算術格式以及方法。

參考:
百度百科 IEEE 754
維基百科 IEEE 754

這裏引用一段阮一峰的網絡日誌

根據國際標準IEEE 754,任意一個二進制浮點數V可以表示成下面的形式:

技術分享

  (1)(-1)^s表示符號位,當s=0,V為正數;當s=1,V為負數。

  (2)M表示有效數字,大於等於1,小於2。

  (3)2^E表示指數位。

舉例來說,十進制的5.0,寫成二進制是101.0,相當於1.01×2^2。那麽,按照上面V的格式,可以得出s=0,M=1.01,E=2。

十進制的-5.0,寫成二進制是-101.0,相當於-1.01×2^2。那麽,s=1,M=1.01,E=2。

IEEE 754規定,對於32位的浮點數,最高的1位是符號位s,接著的8位是指數E,剩下的23位為有效數字M。
技術分享
對於64位的浮點數,最高的1位是符號位S,接著的11位是指數E,剩下的52位為有效數字M。
技術分享

IEEE 754對有效數字M和指數E,還有一些特別規定。

前面說過,1≤M<2,也就是說,M可以寫成1.xxxxxx的形式,其中xxxxxx表示小數部分。IEEE
754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,只保存後面的xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M只有23位,將第一位的1舍去以後,等於可以保存24位有效數字。

至於指數E,情況就比較復雜。

首先,E為一個無符號整數(unsigned
int)。這意味著,如果E為8位,它的取值範圍為0~255;如果E為11位,它的取值範圍為0~2047。但是,我們知道,科學計數法中的E是可以出現負數的,所以IEEE
754規定,E的真實值必須再減去一個中間數,對於8位的E,這個中間數是127;對於11位的E,這個中間數是1023。

比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即10001001。

然後,指數E還可以再分成三種情況:

(1)E不全為0或不全為1。這時,浮點數就采用上面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再將有效數字M前加上第一位的1。

(2)E全為0。這時,浮點數的指數E等於1-127(或者1-1023),有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。這樣做是為了表示±0,以及接近於0的很小的數字。

(3)E全為1。這時,如果有效數字M全為0,表示±無窮大(正負取決於符號位s);如果有效數字M不全為0,表示這個數不是一個數(NaN)。

第三步,把十進制0.1用32位bit位表示

0.1的二進制是1.100110011001100110011001…*2^-4
根據公式 技術分享

正數符號位為0;省略第一位的1,M為100110011001100110011001;E=-4+127=123,二進制表示為

可以得出 s=0,M=100 1100 1100 1100 1100 1100,E=0111 1011

所以寫成二進制形式是
0 10011001100110011001100 01111011

第四步,把前兩步都忘了然後把二進制轉回十進制

這個怎麽轉回10進制呢?剛剛十進制轉二進制是乘2得出每一位,那現在就是反過來,每一位除以2加起來就是了。
剛剛說的0.1的二進制

0.0001100110011…

轉回十進制大概是這樣

1*(2^-4)+1*(2^-5)+1*(2^-8)+1*(2^-9)+1*(2^-11)+…

算出來的結果應該就是0.1000000000000001,也就是結論了。
有耐心的你去驗證下,反正我沒耐心算。

細想一下好像不對呀…截斷後這個值怎麽都比原來的值要小吧?好吧,看來不是這個原因。

然後C#那段代碼是為啥呢?至於為啥呢?單精度浮點數(float)有效位是23位,雙精度浮點數(double)有效位是52位。我也只能幫到這裏了。

(轉)從Python的0.1輸出0.1000000000000001說浮點數的二進制