1. 程式人生 > >程式語言中負數取餘的問題

程式語言中負數取餘的問題

背景

最近在一道 Java 習題中,看到這樣的一道題:

// What is the output when this statement executed
System.out.printf(-7 % 3);

正整數的取餘運算大家都很熟悉,但是對於負數、實數的取餘運算,確實給人很新鮮的感覺。於是我對此進行了一些探索。我發現,這裡面還是頗有一點可以探索的東西的。

探究

首先,看看自然數的取模運算(定義1):

如果a和d是兩個自然數,d非零,可以證明存在兩個唯一的整數 q 和 r,滿足 a = qd + r 且0 ≤ r < d。其中,q 被稱為商,r 被稱為餘數。

那麼對於負數,是否可以沿用這樣的定義呢?我們發現,假如我們按照正數求餘的規則求 (-7) mod 3 的結果,就可以表示 -7 為 (-3)* 3 +2。其中,2是餘數,-3是商。

那麼,各種程式語言和計算器是否是按照這樣理解的呢?下面是幾種軟體中對此的理解。

p1

可以看到,結果特別有意思。這個問題是百家爭鳴的。看來我們不能直接把正數的法則加在負數上。實際上,在整數範圍內,自然數的求餘法則並不被很多人所接受,大家大多認可的是下面的這個定義2。

如果a與d是整數,d非零,那麼餘數r滿足這樣的關係:

a = qd + r , q 為整數,且0 ≤ |r| < |d|。

可以看到,這個定義導致了有負數的求餘並不是我們想象的那麼簡單,比如,-1 和 2 都是 (-7) mod 3正確的結果,因為這兩個數都符合定義。這種情況下,對於取模運算,可能有兩個數都可以符合要求。我們把-1和2分別叫做正餘數和負餘數。通常,當除以d 時,如果正餘數為r1,負餘數為r2,那麼有

r1 = r2 + d

對負數餘數不明確的定義可能導致嚴重的計算問題,對於處理關鍵任務的系統,錯誤的選擇會導致嚴重的後果。

看完了 (-7) mod 3,下面我們來看一看 7 mod (-3) 的情況(看清楚,前面是 7 帶負號,現在是 3 帶負號)。根據定義2,7 = (-3) * (-2) + 1 或7 = (-3) * (-3) -2,所以餘數為 1 或 -2。

這裡寫圖片描述

從中我們看到幾個很有意思的現象:

  • Java 緊隨 C++ 的步伐,而 Python、Google、百度步調一致。難道真是物以類聚?聯想一下,Google 一直支援 Python,Python 也頗有 Web 特色的感覺,而且 Google Application Engine 也用的 Python,國內的搜尋引擎也不約而同地按照 Google 的定義進行運算。
  • 可以推斷,C++ 和 Java 通常會盡量讓商更大一些。比如在 (-7) mod 3中,他們以 -2 為商,餘數為 -1。在 Python 和 Google 計算器中,儘量讓商更小,所以以 -3 為商。在 7 mod (-3) 中效果相同:C++ 選擇了 3 作為商,Python 選擇了 2 作為商。但是在正整數運算中,所有語言和計算器都遵循了儘量讓商小的原則,因此 7 mod 3 結果為 1 不存在爭議,不會有人說它的餘數是-2。
  • 如果按照第二點的推斷,我們測試一下 (-7) mod (-3),結果應該是前一組語言(C++,Java)返回 2,後一組返回 -1。(請注意這只是假設)

這裡寫圖片描述

總結

我們由此可以總結出下面兩個結論:

  1. 對於任何同號的兩個整數,其取餘結果沒有爭議,所有語言的運算原則都是使商儘可能小。
  2. 對於異號的兩個整數,C++/Java語言的原則是使商儘可能大,很多新型語言和網頁計算器的原則是使商儘可能小。