1. 程式人生 > >四大機器學習程式語言對比:R、Python、MATLAB、Octave

四大機器學習程式語言對比:R、Python、MATLAB、Octave

圖源:Pixabay.com

GitHub 地址:https://github.com/mjbahmani/10-steps-to-become-a-data-scientist

 R 語言

R 是一種用於統計計算和圖的語言及環境。它是一個 GNU 專案,與貝爾實驗室的 John Chambers 及其同事開發的 S 語言及環境類似。R 可以視為 S 的一種不同實現。二者存在一些重要差異,但使用 S 寫的很多程式碼在 R 下執行時無需修改。

優點:

  • 端到端開發到執行(一些 brokers package 允許執行,IB)

  • 開發速度快(比 Python 的程式碼少 60%)

  • 開源包多

  • 成熟的量化交易包(quantstrat、quantmod、performanceanalyitics、xts)

  • 社群最大

  • 使用 rcpp 可以整合 R 和 C++/C 

缺點:

  • 比 Python 慢,尤其是在迭代迴圈和非向量化函式中

  • 比 Matlab 繪圖差,難以實現互動式圖表

  • 建立獨立應用程式的能力有限

 Python

Python 是一種用於通用程式設計的解釋型高階程式語言,由 Guido van Rossum 建立並於 1991 年首次釋出。Python 的設計強調程式碼可讀性,使用了大量空格。它的結構使其在大規模和小規模程式設計中都能清晰明瞭。

優點:

  • 端到端開發到執行(一些 brokers package 允許執行,IB)

  • 開源包(Pandas、Numpy、scipy)

  • 交易包(zipline、pybacktest、pyalgotrade)

  • 最適合一般程式設計和應用程式開發

  • 可連線 R、C++ 和其他語言的「膠水」語言

  • 總體速度最快,尤其是在迭代迴圈中

缺點:

  • 有一些不成熟的包,尤其是交易包

  • 有些包與其他包不相容或包含重疊

  • 在金融領域的社群比 R 小

  • 與 R 或 Matlab 相比,相同操作需要更多程式碼

  • 追蹤靜默錯誤(silent error)可能需要很長時間(即使使用視覺化偵錯程式/IDE)

 MATLAB

MATLAB(matrix laboratory)是一種多範型數值計算環境。作為 MathWorks 開發的一種專用程式語言,MATLAB 允許矩陣運算、函式和資料繪圖、演算法實現、使用者介面建立,以及與用其他語言(包括 C、C++、C#、Java、Fortran、Python)寫成的程式進行互動。

儘管 MATLAB 的設計初衷是數值計算,但其中的可選工具箱使用 MuPAD symbolic engine,具備符號計算能力。額外的包 Simulink 添加了圖多領域模擬和針對動態和嵌入系統的基於模型的設計。

優點:

  • 最快的數學和計算平臺,尤其是向量化運算/線性矩陣代數。

  • 適合所有數學和交易領域的商業級軟體。

  • 指令碼簡短,但高度集成了所有包。

  • 擁有圖和互動式圖表的最佳視覺化

  • 具備良好測試和支援。

  • 易於管理多執行緒支援和垃圾收集

  • 最好的偵錯程式

缺點:

  • 無法執行,必須轉換成另一種語言。

  • 昂貴:每個 license 大約 1000 美元,每新增一個包需要額外支付 50+ 美元。

  • 無法與其他語言很好地整合。

  • 很難檢測出交易系統中的偏差(它是為數學和工程模擬而構建的),因此可能需要廣泛的測試。

  • 糟糕的迭代迴圈效能。

  • 無法開發單獨的應用。

 Octave

Octave 可以看作是商業語言 MATLAB 的 GNU 版本,它是一種指令碼矩陣語言(scripting matrix language),其語法有大約 95% 可與 MATLAB 相容。Octave 由工程師設計,因此預裝了工程師常用的程式,其中很多時間序列分析程式、統計程式、檔案命令和繪圖命令與 MATLAB 語言相同。

優點:

  • 首先,目前沒有可用的魯棒性 Octave 編譯器,且沒有必要有,因為該軟體可以免費安裝。

  • Octave 和 Matlab 的語言元素相同,除了一些個例,如巢狀函式。Octave 仍然處於積極開發的狀態,每一個偏離 Matlab 語法之處都被視為 bug 或者至少是待解決問題。

  • Octave 有很多可用工具箱,只要程式不要求圖輸出,那麼在不進行大量更改的前提下,使用 Octave 執行和使用 Matlab 執行差不多。

  • 圖方面的能力是 Matlab 的優勢。Matlab 最新版本包括 GUI 設計器,包含大量很棒的視覺化特徵。

  • Octave 使用 GNU Plot 或 JHandles 作為圖程式包,JHandles 與 Matlab 中的圖程式包更接近一些。但是,Octave 不具備類似 GUI 設計器的元件,其視覺化機制很受限且不與 Matlab 相容。

  • 整合開發環境也是類似的情況:Octave 有一個 QTOctave 專案,但仍處於早期階段。

  • Octave 社群的合作很可能幫助該軟體很快提供更好、更相容的圖以及 GUI 能力。

缺點:

  • 它只是 MATLAB 的免費開源版本,無法帶給使用者新的東西。

下表列舉了資料科學家和機器學習工程師的常用工具,讀者可以檢視這些工具的流行度。

原文連結:https://towardsdatascience.com/r-vs-python-vs-matlab-vs-octave-c28cd059aa69