1. 程式人生 > >比較好的Python機器學習庫有哪些?

比較好的Python機器學習庫有哪些?

Python是一種面向物件的解釋型計算機程式設計語言,具有豐富和強大的庫,再加上其簡單、易學、速度快、開源免費、可移植性、可擴充套件性以及面向物件的特點,Python成為2017年最受歡迎的最受歡迎的程式語言!

人工智慧是當前最熱門話題之一,機器學習技術是人工智慧實現必備技能,Python程式語言含有最有用的機器學習工具和庫,以下是Python開發工程師必知的十大機器學習庫!

一、Scikit-Learn

在機器學習和資料探勘的應用中,Scikit-Learn是一個功能強大的Python包,我們可以用它進行分類、特徵選擇、特徵提取和聚集。

二、Statsmodels

Statsmodels是另一個聚焦在統計模型上的強大的庫,主要用於預測性和探索性分析,擬合線性模型、進行統計分析或者預測性建模,使用 Statsmodels是非常合適的。

三、PyMC

PyMC是做“貝葉斯曲線”的工具,其包含貝葉斯模型、統計分佈和模型收斂的診斷工具,也包含一些層次模型。

四、Gensim

Gensim被稱為“人們的主題建模工具”,其焦點是狄利克雷劃分及變體,其支援自然語言處理,能將NLP和其他機器學習演算法更容易組合在一起,還引用了Google的基於遞迴神經網路的文字表示法word2vec。

五、Orange

Orange是一種帶有圖形使用者介面的庫,在分類、聚集和特徵選擇方法方面,相當齊全,還有交叉驗證的方法。

六、PyMVPA

PyMVPA是一種統計學習庫,包含交叉驗證和診斷工具,但沒有Scikit-learn全面。

七、Theano

Theano是最成熟的深度學習庫,它提供了不錯的資料結構表示神經網路的層,對線性代數來說很高效,與Numpy的陣列類似,很多基於Theano的庫都在利用其資料結構,它還支援開箱可用的GPU程式設計。

八、PyLearn

PyLearn是一個基於Theano的庫,它給Theano引入了模組化和可配置性,可以通過不同的配置檔案來建立神經網路。

九、Hebel

Hebel是一個帶有GPU支援的神經網路庫,可以通過YAML檔案決定神經網路的屬性,提供了將神級網路和程式碼友好分離的方式,並快速地執行模型,它是用純Python編寫,是很友好的庫,但由於開發不久,就深度和廣大而言,還有些匱乏!

十、Neurolab

Neurolab是一個API友好的神經網路庫,其包含遞迴神經網路實現的不同變體,如果使用RNN,這個庫是同類API中最好的選擇之一。

以上是Python開發工程師必知十大機器學習庫,除此之外,還有OverFeat、Nolearn以及Decaf等機器學習庫,在此就不一一介紹了,感興趣的可以深入學習一下!