1. 程式人生 > >數學之美 系列十四 談談數學模型的重要性

數學之美 系列十四 談談數學模型的重要性

糾正地心說錯誤不是靠在托勒密四十個圓的模型上再多套上幾個圓,而是進一步探索真理。哥白尼發現,如果以太陽為中心來描述星體的執行,只需要 8-10 個圓,就能計算出一個行星的運動軌跡,他提出了日心說。很遺憾的事,哥白尼正確的假設並沒有得到比托勒密更好的結果,哥白尼的模型的誤差比托勒密地要大不少。這是教會和當時人們認為哥白尼的學說是邪說的一個原因,所以日心說要想讓人心服口服地接受,就得更準確地描述行星運動。

完成這一使命的是開普勒。開普勒在所有一流的天文學家中,資質較差,一生中犯了無數低階的錯誤。但是他有兩條別人沒有的東西,從他的老師第谷手中繼承的大量的、在當時最精確的觀測資料,以及運氣。開普勒很幸運地發現了行星圍繞太陽運轉的軌道實際是橢圓形的,這樣不需要用多個小圓套大圓,而只要用一個橢圓就能將星體運動規律描述清楚了。只是開普勒的知識和水平不足以解釋為什麼行星的軌道是橢圓形的。最後是偉大的科學家牛頓用萬有引力解釋了這個問題。

故事到這裡似乎可以結束了。但是,許多年後,又有了個小的波瀾。天文學家們發現,天王星的實際軌跡和用橢圓模型算出來的不太符合。當然,偷懶的辦法是接著用小圓套大圓的方法修正,但是一些嚴肅的科學家在努力尋找真正的原因。英國的亞當斯和法國的維內爾(Verrier)獨立地發現了吸引天王星偏離軌道的海王星。

講座結束前,我和 Google 中國的工程師們一同總結了這麼幾個結論:
1. 一個正確的數學模型應當在形式上是簡單的。(托勒密的模型顯然太複雜。)
2. 一個正確的模型在它開始的時候可能還不如一個精雕細琢過的錯誤的模型來的準確,但是,如果我們認定大方向是對的,就應該堅持下去。(日心說開始並沒有地心說準確。)
3. 大量準確的資料對研發很重要。
4. 正確的模型也可能受噪音干擾,而顯得不準確;這時我們不應該用一種湊合的修正方法來彌補它,而是要找到噪音的根源,這也許能通往重大發現。

在網路搜尋的研發中,我們在前面提到的單文字詞頻/逆文字頻率指數(TF/IDF) 和網頁排名(page rank)都相當於是網路搜尋中的“橢圓模型”,它們都很簡單易懂。