1. 程式人生 > >數據挖掘需要什麽數學基礎(一)

數據挖掘需要什麽數學基礎(一)

幾何變換 泛函 text 內容 同時 圖片 學習 想要 就是

技術分享圖片

在學習數據挖掘的時候,我們一定要掌握一些數學基礎,畢竟數據挖掘中涉及到了很多的算法。說到這裏我們要給大家說一說數據挖掘的概念,數據挖掘就是從大量數據中獲取隱含的、潛在的是有價值信息的過程,數據挖掘也是這些年計算機領域主要的研究內容。那麽數據挖掘需要什麽數學基礎呢?下面我們就為大家講解一下這些知識。

首先給大家說一下數據挖掘的基本流程吧,數據挖掘的基本流程就是對原始數據進行填補遺漏、消除異常、噪聲等處理,提高數據挖掘的有效性和準確性。然後使用特定的算法對原始數據進行歸納抽象,去掉骯臟數據,最終得到一個關系模型。當新的數據加入數據集中時,可以根據該關系模型決定新數據的分類和處理模式。同時,新數據也將帶來對整體模型的變化,數據和模型處於動態對應的狀態。看到這裏,我們不難發現,數據挖掘就是一個典型的數據建模的過程,這就需要我們使用一些工具、方法、理論知識來進行解決這些問題。

一般來說,數據挖掘需要的數據基礎有很多,比如統計機器學習所需要的主要理論和技術:泛函分析、覆蓋數、描述長度理論與算法復雜度研究、與測度論、統計理論、VC維理論、非線性規劃技術、幾何變換等等,下面我們就給大家說一下數據挖掘涉及到的數學基礎。

我們先要給大家說的就是線性代數和統計學,在數據挖掘過程中,我們少不了建模,而在這個建模過程中,我們需要掌握兩個基礎的數據學科,這兩大數學學科就是線性代數和統計學。這兩門學科代表了機器學習中最主流的兩大類方法的基礎。第一種是以研究函數和變換為重點的代數方法,而另一種是以研究統計模型和樣本分布為重點的統計方法。這兩個學科側重雖有不同,但是常常是共同使用的,對於代數方法,往往需要統計上的解釋,對於統計模型,其具體計算則需要代數的幫助。以代數和統計為出發點,繼續學習的話,就很容易會發現需要更多的數學。而這些數學基礎都是我們需要掌握的知識。

在這篇文章中我們給大家講述了數據挖掘的知識以及數據挖掘需要的數學基礎。如果想要走進數據分析行業的話,還是需要了解這些知識的,由於篇幅原因我們就給大家講到這裏了,在下一篇文章中我們繼續給大家講述更多有用的知識。

數據挖掘需要什麽數學基礎(一)