Python 浮點數的冷知識

阿新 • • 發佈：2019-09-22

本週的PyCoder's Weekly 上分享了一篇小文章，它裡面提到的冷知識很有意思，我稍作補充，分享給大家。

它提到的部分問題，讀者們可以先思考下：

若兩個元組相等，即 a==b 且 a is b，那麼相同索引的元素（如 a[0] 、b[0]）是否必然相等呢？
若兩個物件的 hash 結果相等，即 hash(a) == hash(b)，那麼它們是否必然相等呢？

答案當然都為否（不然就不叫冷知識了），大家可以先嚐試回答一下，然後再往下看。

-----思考分割線-----

好了，先來看看第一個問題。兩個相同的元組 a、b，它們有如下的關係：

>>> a = (float('nan'),)
>>> b = a
>>> a   # (nan,)
>>> b   # (nan,)

>>> type(a), type(b)
(<type 'tuple'>, <type 'tuple'>)

>>> a == b
True

>>> a is b  # 即 id(a) == id(b)
True

>>> a[0] == b[0]
False

以上程式碼表明：a 等於 b（型別、值與 id 都相等），但是它們的對位元素卻不相等。

兩個元組都只有一個元素（逗號後面沒有別的元素，這是單元素的元組的表示方法，即 len(a)==1 ）。float() 是個內建函式，可以將入參構造成一個浮點數。

為什麼會這樣呢？先查閱一下文件，這個內建函式的解析規則是：

sign           ::=  "+" | "-"
infinity       ::=  "Infinity" | "inf"
nan            ::=  "nan"
numeric_value  ::=  floatnumber | infinity | nan
numeric_string ::=  [sign] numeric_value

它在解析時，可以解析前後的空格、字首的加減號（+/-）、浮點數，除此之外，還可以解析兩類字串（不區分大小寫）："Infinity"或"inf"，表示無窮大數；“nan”，表示不是數（not-a-number），確切地說，指的是除了數以外的所有東西。

前面分享的第一個冷知識就跟“nan”有關，作為整體，兩個元組相等，但是它們唯一的元素卻不相等。之所以會這樣，因為“nan”表示除了數以外的東西，它是一個範圍，所以不可比較。

作為對比，我們來看看兩個“無窮大的浮點數”是什麼結果：

>>> a = (float('inf'),)
>>> b = a
>>> a   # (inf,)
>>> b   # (inf,)

>>> a == b  # True
>>> a is b  # True
>>> a[0] == b[0]  # True

注意最後一次比較，它跟前面的兩個元組恰好相反，由此，我們可以得出結論：兩個無窮大的浮點數，數值相等，而兩個“不是數的東西”，數值不相等。

化簡一下，可以這樣看：

>>> a = float('inf')
>>> b = float('inf')
>>> c = float('nan')
>>> d = float('nan')

>>> a == b  # True
>>> c == d  # False

以上就是第一個冷知識的揭祕。接著看第二個：

>>> hash(float('nan')) == hash(float('nan'))
True

前面剛說了兩個“不是數的東西”不相等，這裡卻顯示它們的雜湊結果相等，這挺違背常理的。

我們可以推理出一條簡單的結論：不相等的兩個物件，其雜湊結果可能相等。

原因在於，hash(float('nan')) 的結果等於 0，它是個固定值，作比較時當然就相等了。

其實，關於 hash() 函式，還埋了一個彩蛋：

>>> hash(float('inf'))  # 314159
>>> hash(float('-inf')) # -314159

有沒有覺得這個數值很熟悉啊？它正是圓周率的前五位 3.14159，去除小數點後的結果。在早期的 Python 版本中，負無窮大數的雜湊結果其實是 -271828，正是取自於自然對數 e。這兩個數都是硬編碼在 Python 直譯器中的，算是某種致敬吧。

由於 float('nan') 的雜湊值相等，這通常意味著它們不可以作為字典的不同鍵值，但是事實卻出人意料：

>>> a = {float('nan'): 1, float('nan'): 2}
>>> a
{nan: 1, nan: 2}

# 作為對比：
>>> b = {float('inf'): 1, float('inf'): 2}
>>> b
{inf: 2}

如上所示，兩個 nan 鍵值在表示上一模一樣（注意，它們沒有用引號括起來），它們可以共存，而 inf 卻只能歸併成一個，再次展示出了 nan 的神奇。

好了，兩個很冷的小知識分享完畢，背後的原因都在於 float() 取浮點數時，Python 允許了 nan（不是數）的存在，它表示不確切的存在，所以導致了這些奇怪的結果。

最後，我們作下小結：

包含 float('nan') 的兩個元組，當做整體作比較時，結果相等；兩個相等的元組，其對位的元素可能不相等
float('nan') 表示一個“不是數”的東西，它本身不是確定值，兩個物件作比較時不相等，但是其雜湊結果是固定值，作比較時相等；可用作字典的鍵值，而且是不衝突的鍵值
float('inf') 表示一個無窮大的浮點數，可看作確定的值，兩個物件做比較時相等，其雜湊結果也相等；可用作字典的鍵值，但是會產生衝突
float('nan') 的雜湊結果為 0，float('inf') 的雜湊結果為 314159

參考資料：

https://docs.python.org/3/library/functions.html#float

https://www.pythondoeswhat.com/2019/09/welcome-to-float-zone.html

公眾號【Python貓】，本號連載優質的系列文章，有喵星哲學貓系列、Python進階系列、好書推薦系列、技術寫作、優質英文推薦與翻譯等等，歡迎關注哦

Python 浮點數的冷知識

Python 浮點數的冷知識

python 浮點數保留小數

python 浮點數轉分數

Python浮點數range

你應該知道的浮點數基礎知識 • cenalulu's Tech Blog

Python浮點數格式化-Decimal

python 浮點數和整數的比較

Python浮點數（小數）運算誤差的原因和解決辦法

python學習03：Python浮點數精度問題（包含解決方案）

（轉）從Python的0.1輸出0.1000000000000001說浮點數的二進制

[python基礎] 浮點數乘法的誤差問題

知識小結（浮點數問題）

Python 把字符串變成浮點數

Python 判斷是否可以轉化為浮點數及其他數字類型

二進制轉換、字符編碼的演化、Python裏使用的編碼、浮點數、浮點數的精確度問題

用decimal模組增加python的浮點數精度

用decimal模塊增加python的浮點數精度

盤點 Python 中的那些冷知識

Python 整數長整數浮點數字串列表元組字典的各種方法

python學習筆記：浮點數計算問題（20180920）

Python 浮點數的冷知識

相關推薦