1. 程式人生 > >聊一聊統計學與數據挖掘的區別(一)

聊一聊統計學與數據挖掘的區別(一)

數據分析 和數 說過 而且 tex ali 關註 細致 簡單

技術分享圖片

當大家看到這個題目的時候,想必大家都有些疑惑——統計學和數據挖掘看起來並不容易混淆的東西,有必要去區分統計學和數據挖掘嗎?答案是肯定的,這是因為統計學和數據挖掘有共同的目標,就是發現數據中的結構,下面我們就給大家講述一下統計學與數據挖掘的區別。

我們說過了,統計學和數據挖掘有著共同的目標就是發現數據中的結構。事實上,由於它們的目標相似,一些人認為數據挖掘是統計學的分支。這是一個不切合實際的看法。因為數據挖掘還應用了其它領域的思想、工具和方法,尤其是計算機學科,而且它所關註的某些領域和統計學家所關註的有很大不同。

而統計學和數據挖掘研究目標的重叠自然導致了迷惑。事實上,有時候還導致了反感。統計學有著正統的理論基礎,而現在又出現了一個新的學科,有新的主人,而且聲稱要解決統計學家們以前認為是他們領域的問題。這必然會引起關註。更多的是因為這門新學科有著一個吸引人的名字,勢必會引發大家的興趣和好奇。把數據挖掘這個術語所潛在的承諾和統計學作比較的話,統計的最初含義是陳述事實,以及找出枯燥的大量數據背後的有意義的信息。當然,統計學的現代的含義已經有很大不同的事實。而且,這門新學科同商業有特殊的關聯。這種關聯使得數據挖掘在數據分析中占據十分重要的地位。

我們可以通過逐個考察這兩門學科的性質,區分它們的異同,並關註與數據挖掘相關聯的一些難題。首先,我們註意到“數據挖掘”對統計學家來說並不陌生。有人認為,僅僅是考察大量的數據驅動的模型,從中發現最適合的。統計學家因而會忽略對數據進行特別的分析,因為他們知道太細致的研究卻難以發現明顯的結構。盡管如此,事實上大量的數據可能包含不可預測的但很有價值的結構。而這恰恰引起了註意,也是當前數據挖掘的任務。

我們在這篇文章中給大家簡單介紹了統計學與數據挖掘的兩個學科的區別,其實統計學與數據挖掘的區別還體現在其他的方方面面,我們只有正確區分這兩門學科才能夠更好地認清和定位自己的學習目標和職業規劃。

聊一聊統計學與數據挖掘的區別(一)