1. 程式人生 > >2018年最受歡迎Python機器學習庫介紹

2018年最受歡迎Python機器學習庫介紹

Python Python開發 Python全棧 機器學習庫

Python是一種面向對象的解釋型計算機程序設計語言,具有豐富和強大的庫,再加上其簡單、易學、速度快、開源免費、可移植性、可擴展性以及面向對象的特點,Python成為2017年最受歡迎的最受歡迎的編程語言!

人工智能是當前最熱門話題之一,機器學習技術是人工智能實現必備技能,Python編程語言含有最有用的機器學習工具和庫,以下是Python開發工程師必知的十大機器學習庫!

一、Scikit-Learn

在機器學習和數據挖掘的應用中,Scikit-Learn是一個功能強大的Python包,我們可以用它進行分類、特征選擇、特征提取和聚集。

二、Statsmodels

Statsmodels是另一個聚焦在統計模型上的強大的庫,主要用於預測性和探索性分析,擬合線性模型、進行統計分析或者預測性建模,使用 Statsmodels是非常合適的。

三、PyMC

PyMC是做“貝葉斯曲線”的工具,其包含貝葉斯模型、統計分布和模型收斂的診斷工具,也包含一些層次模型。

四、Gensim

Gensim被稱為“人們的主題建模工具”,其焦點是狄利克雷劃分及變體,其支持自然語言處理,能將NLP和其他機器學習算法更容易組合在一起,還引用了Google的基於遞歸神經網絡的文本表示法word2vec。

五、Orange

Orange是一種帶有圖形用戶界面的庫,在分類、聚集和特征選擇方法方面,相當齊全,還有交叉驗證的方法。

六、PyMVPA

PyMVPA是一種統計學習庫,包含交叉驗證和診斷工具,但沒有Scikit-learn全面。

七、Theano

Theano是最成熟的深度學習庫,它提供了不錯的數據結構表示神經網絡的層,對線性代數來說很高效,與Numpy的數組類似,很多基於Theano的庫都在利用其數據結構,它還支持開箱可用的GPU編程。

八、PyLearn

PyLearn是一個基於Theano的庫,它給Theano引入了模塊化和可配置性,可以通過不同的配置文件來創建神經網絡。

九、Hebel

Hebel是一個帶有GPU支持的神經網絡庫,可以通過YAML文件決定神經網絡的屬性,提供了將神級網絡和代碼友好分離的方式,並快速地運行模型,它是用純Python編寫,是很友好的庫,但由於開發不久,就深度和廣大而言,還有些匱乏!

十、Neurolab

Neurolab是一個API友好的神經網絡庫,其包含遞歸神經網絡實現的不同變體,如果使用RNN,這個庫是同類API中最好的選擇之一。

以上是Python開發工程師必知十大機器學習庫,除此之外,還有OverFeat、Nolearn以及Decaf等機器學習庫,在此就不一一介紹了,感興趣的可以深入學習一下!


2018年最受歡迎Python機器學習庫介紹