R與Python:有什麼區別?
R
學術界和統計學家已經發展了二十多年的R。R現在是執行資料分析的最豐富的生態系統之一。CRAN(開源儲存庫)中有大約12000個軟體包。無論您要執行哪種分析,都可以找到一個庫。豐富的圖書館使R成為統計分析的首選,特別是對於專業分析工作。
R和其他統計產品之間的前沿差異是輸出。R有很棒的工具來傳達結果。Rstudio附帶圖書館編織器。謝毅輝寫了這個包。他的報道瑣碎而優雅。通過簡報或文件傳達調查結果很容易。
Python幾乎可以執行與R相同的任務:資料爭用,工程,功能選擇Web報廢,應用程式等。Python是一種大規模部署和實現機器學習的工具。Python程式碼比R程式碼更容易維護和更強大。多年前; Python沒有很多資料分析和機器學習庫。最近,Python正在迎頭趕上併為機器學習或人工智慧提供最先進的API。大多數資料科學工作都可以通過五個Python庫完成:Numpy,Pandas,Scipy,Scikit-learn和Seaborn。
另一方面,Python比R更容易實現可複製性和可訪問性。事實上,如果您需要在應用程式或網站中使用分析結果,Python是最佳選擇。
人氣指數
IEEE Spectrum排名是量化程式語言流行度的指標。左欄顯示2017年的排名和2016年的右欄。2017年,Python排在第一位,而一年前排名第三。R排在第 6 位。

image.png
工作機會
下圖顯示了程式語言與資料科學相關的工作數量。SQL遙遙領先,其次是Python和Java。R排名第 5 。

image.png
如果我們關注Python(黃色)和R(藍色)之間的長期趨勢,我們可以看到Python在作業描述中比R更經常被引用。
R或Python用法
Python由大約1991年的計算機家Guido van Rossum開發.Python有數學,統計和人工智慧的有影響力的庫。您可以將Python視為機器學習中的純粹玩家。但是,對於計量經濟學和通訊而言,Python尚未完全成熟。Python是機器學習整合和部署的最佳工具,但不適用於業務分析。
好訊息是R由學者和科學家開發。它旨在回答統計問題,機器學習和資料科學。由於其強大的通訊庫,R是資料科學的正確工具。此外,R還配備了許多軟體包來執行時間序列分析,面板資料和資料探勘。最重要的是,與R相比,沒有更好的工具。
我們認為,如果您是具有必要統計基礎的資料科學初學者,您需要問自己以下兩個問題:
-
我想學習演算法的工作原理嗎?
-
我想部署模型嗎?
如果你對這兩個問題的答案都是肯定的,你可能會先開始學習Python。一方面,Python包含很好的庫來操作矩陣或編碼演算法。作為初學者,可以更容易地學習如何從頭開始構建模型,然後從機器學習庫切換到函式。另一方面,您已經知道演算法或想立即進入資料分析,然後R和Python都可以開始。如果你要專注於統計方法,R的一個優點。
其次,如果你想做的不僅僅是統計資料,讓我們說部署和可重複性,Python是一個更好的選擇。如果您需要編寫報告並建立儀表板,則R更適合您的工作。
簡而言之,R和Python之間的統計差距越來越小。大部分工作都可以通過兩種語言完成。您最好選擇適合您需求的產品,也可以選擇同事使用的工具。當你們所有人說同一種語言時,這樣會更好。在瞭解了第一種程式語言之後,學習第二種程式語言就更簡單了。
結論
最後,R或Python之間的選擇取決於:
-
您的目標:統計分析或部署
-
您可以投入的時間
-
您公司/行業最常用的工具