1. 程式人生 > >23個深度學習庫大排名:TensorFlow最活躍、Keras最受歡迎,Theano 屌絲逆襲

23個深度學習庫大排名:TensorFlow最活躍、Keras最受歡迎,Theano 屌絲逆襲

開源最前線(ID:OpenSourceTop) 猿妹 編譯

來源:https://github.com/thedataincubator/data-science-blogs/blob/master/deep-learning-libraries.md

The Data Incubator 最近製作了一個 23 個熱門深度學習庫的排名。此排名基於三個指標:Github上的活躍度、Stack Overflow上的活躍度以及谷歌搜尋結果數量。下面一起來看看排名情況

總體排名結果

640?wx_fmt=png&wxfrom=5&wx_lazy=1

上表排名給出了每個開源庫的總分值以及各自在 GitHub、Stack Overflow 以及谷歌搜尋上的得分(其中 0 為平均值)。

結果與討論

0?wx_fmt=png

排名是基於同樣基於三個組成部分:Github(星星數和分支),Stack Overflow(標籤和問題)和 Google Results(總體增長率和季度增長率)。這些是使用可用的 API 獲得的。

製作一個深入學習工具包的綜合排名列表是有很大難度的 - 我們羅列出了最具代表性的五個列表,計算每個指標的標準化分數,得出最終排名比如,Caffe 在 Github 上的標準評分為 1,deeplearning4j 則為 0.06。

TensorFlow 在最大活躍社群中佔主導

0?wx_fmt=png

TensorFlow 所有指標的得分至少比平均值高出兩倍多。在 Github 上的分支數幾乎是第二名的三倍,Stack Overflow 上的問題總數是第二名的六倍多。Google Brain 團隊於 2015 年首次開源 TensorFlow

,之後一路攀升,超越排名第四的 Theano 和排名第八的 Torch,成為排行榜榜首。

TensorFlow 雖然與在 C++ 引擎上執行的 Python API 一起分發,但列表中的一些庫可以 TensorFlow 作為後端使用,並提供自己的介面。比如排行第二的Keras,將很快成為TensorFlow和Sonnet核心的一部分。TensorFlow 的流行可能是由於其通用深度學習框架,靈活的介面,漂亮的計算圖形視覺化以及Google大量的開發人員與社群資源的結合。瞭解更多 TensorFlow 點選:《【開源推薦 5】快速入門 Google 機器學習系統 TensorFlow》

Caffe 尚未被 Caffe2 所取代

Caffe 排行第三,除 TensorFlow,Caffe 在 GitHub 上的活躍度要比其他競爭對手高很多。Caffe 通常被認為比 Tensorflow 更加專業化,其開發了專注於影象處理,目標識別和預訓練卷積神經網路。Facebook 於 2017 年 4 月釋出 Caffe 2,如今已經排在了深度學習庫的上半部分。Caffe2 是一個更輕量,模組化和可擴充套件的 Caffe 版本,包括迴圈神經網路。Caffe 和 Caffe2 是相互獨立的,所以資料科學家可以繼續使用最初的 Caffe。但是,有一些遷移工具,如 Caffe Translator,提供了一種 Caffe2 用來驅動現有的 Caffe 模型。

Keras 最受歡迎的深度學習前端

Keras 排名最高的非框架深度學習庫。Keras 可以被用作 TensorFlow、Theano、MXNet、CNTK 或 deeplearning4j 的前端。Keras 在所有的三個指標上表現都高於於平均值。

Keras 由於其簡單性和易用性而備受歡迎。Keras 資料科學家們對資料集上進行相關實驗時,往往都喜歡採用 Keras。隨著 R Studio 最近釋出了 Keras 的介面,Keras 的流行度往後還會不斷提高。

Theano 沒有行業巨頭支援,仍實力強大

0?wx_fmt=png

在眾多新的深度學習框架當中,Theano 是列表中出現最早的深度學習庫。Theano 率先使用了計算圖,如今在深度學習和機器學習的研究界仍然很受歡迎。Theano 本質上是一個 Python 的數值計算庫,但是可以像 Lasagne 這樣的高階深度學習庫一起使用。

TensorFlow 和 Keras 背後有谷歌強有力的支援,PyTorch 和 Caffe2 背後有 Facebook,MXNet 是亞馬遜網路服務(AWS)的官方深度學習框架,以及微軟設計維護的 CNTK ,Theano 背後沒有行業巨頭支援,但是仍然十分受歡迎。

Sonnet 發展最快的深度學習庫

0?wx_fmt=jpeg

早在 2017 年年初,Google 的 DeepMind 就公開發布了 Sonnet 的程式碼,這是一個基於 TensorFlow 的神經網路庫。在 Google 搜尋 Sonnet,返回的結果頁面數比上一季度增加了 272%,這是我們列表中所有庫中增長最多的一個。雖然 Google 在 2014 年收購了英國人造智慧公司 DeepMind,但 DeepMind 和 Google Brain 大體上仍然是兩個獨立的團隊。DeepMind 專注於人工智慧,Sonnet 幫助使用者在他們特定的 AI 理念和研究之上構建頂層架構

Python 是深度學習介面的主要語言

PyTorch 是列表中增長速度第二快的庫,底部唯一的介面是Python。與上一季度相比,Google 搜尋 PyTorch,結果頁面多了 236%。排名前 23 的開源深度學習框架和包裝器中,只有三個沒有 Python 介面,分別是:Dlib ,MatConvNet 和OpenNN。C ++ 和 R 介面分別有 7 個和 6 個。儘管看起來資料科學界在使用 Python 方面已經達成共識,但深度學習仍有許多選擇。

侷限性

所有的原始碼和資料都在我們的 Github 頁面上。深度學習庫的完整列表來自不同來源。當然,一些釋出歷史比較久的庫會有更高的指標,因此排名更前面。這裡使用的唯一指標是谷歌搜尋季度增長率。

資料中一些難題的處理方式:

● neural designer 並且 wolfram mathematica 是特有的,因此就剔除了

● CNTK 也被稱為 microsoft cognitive toolkit,但我們只用了原始的 CNTK 名字

● neon 改為 nervana neon

● paddle 改為 paddlepaddle

● 一些庫顯然是其他庫的衍生物,如 Caffe 和 Caffe2。對於此類情況,如果他們有獨立的 github 程式碼庫,我們就會把它們分開計算排名

方法

所有原始碼和資料都在我們的Github頁面上(https://github.com/thedataincubator/data-science-blogs)。

我們首先從五個不同的來源,產生 23 個開源深度學習庫,然後收集所有這些庫的標準,從而得出排名。Github 資料基於星星數和分支數,Stack Overflow 資料基於包含軟體包名稱的標籤及問題數量,Google Results 基於過去五年中 Google 搜尋結果的總數,以及季度增長率的比較。

其他一些說明:

● 用於確定谷歌搜尋的搜尋詞包括庫名和術語“deep learning”。

● 任何缺少 Stack Overflow 計數的數值一律轉換為 0

● 計數標準化,均值為 0 和偏差 1,然後平均得到 Github 和 Stack Overflow 得分,再加上 Serch Results 得到的總得分。

● 最後手動檢查以確認 Github 程式碼庫的位置。

所有資料於 2017 年 9 月 14 日下載。

●本文編號2789,以後想閱讀這篇文章直接輸入2789即可

●輸入m獲取文章目錄

相關推薦↓↓↓ 

0?wx_fmt=gif

大資料與人工智慧

涵蓋:程式人生、演算法與資料結構、黑客技術與網路安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。