(一)Python的開發環境搭建主要是按先後順序安裝Numpy、Scipy、matplotlib和scikit-learn。numpy、scipy、matplotlib、scikit-learn,分別是科學計算包,科學工具集,畫圖工具包,機器學習工具集。

1、numpy :科學運算,主要是矩陣的運算。提供陣列。

2、scipy:主要是一些科學工具集,訊號處理工具集  數值計算。

3、scikit-learn:大量機器學習演算法。

4、matplotlib:畫圖工具

而且為了方便進行機器學習在大資料環境下的進行,還搭建了GraphLab Create,主要是為了應用裡面的SFrame。

我主要是用的64位的Python,否則應用GraphLab Create時會產生,

ImportError:Nomodule named cy_unity 

的問題。

:python使用pip最好在環境變數里加入pip的目錄,具體的做法就百度一下吧,這裡預設大家都設定好了。)

(二)要在cmd中更新pip:pip install --upgrade pip ,這樣才能進行後續安裝。接下來按順序安裝Numpy、Scipy、matplotlib和scikit-learn,實際測試發現有時候用pip install XXX來安裝這些包大部分時間好用,但是有的包官方是沒有64位支援的,而且總出錯。如下圖。

所以可以在下面這個非官方的Python庫中尋找所需的包,找到對應版本下載。

http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn

這裡專門針對的64位系統和64位的Python,所以選擇下面這個。

這時,只要開啟cmd 找到對應的下載目錄,比如我的是在裡面pip install下載的whl檔案的檔名,回車確認就好了


(三)對於GraphLab Create需要到http://www.dato.com/去申請,可以免費使用一年(這個可以忽略),這個和panda差不多,但是可以處理資料量大的情況。它會在申請結束後給你一個地址,利用pip下載就好了,或者直接利用這個地址下載那個檔案,然後pip安裝就可以了。如果想用Ipython notebook作為編譯環境也可以,見我的另一個文章。