1. 程式人生 > >R語言書籍的學習路線圖(轉自格物堂)

R語言書籍的學習路線圖(轉自格物堂)

【轉】http://bbs.pinggu.org/thread-1522238-1-1.html

現在對R感興趣的人越來越多,很多人都想快速的掌握R語言,然而,由於目前大部分高校都沒有開設R語言課程,這就導致很多人不知道如何著手學習R語言。

對於初學R語言的人,最常見的方式是:遇到不會的地方,就跑到論壇上吼一嗓子,然後欣然or悲傷的離去,一直到遇到下一個問題再回來。當然,這不是最好的學習方式,最好的方式是——看書。目前,市面上介紹R語言的書籍很多,中文英文都有。那麼,眾多書籍中,一個生手應該從哪一本著手呢?入門之後如何才能把自己練就成某個方面的高手呢?相信這是很多人心中的疑問。有這種疑問的人有福了,因為筆者將根據自己的經歷總結一下R語言書籍的學習路線圖以使Ruser少走些彎路。

本文分為6個部分,分別介紹初級入門高階入門,,計量經濟學,,金融等。

1.初級入門

,這是官方的入門小冊子。其有中文版,由丁國徽翻譯,譯名為《R導論》。,這本小冊子有中文版應該叫《R入門》。除此之外,還可以去讀劉思喆的。這本書收集了R初學者提問頻率最高的153個問題。為什麼叫153分鐘呢?因為最初作者寫了153個問題,閱讀一個問題花費1分鐘時間,全域性下來也就是153分鐘了。有了這些基礎之後,要去讀一些經典書籍比較全面的入門書籍,比如《統計建模與R軟體》,國外還有《R Cookbook》和《R in action》,本人沒有看過,因此不便評論。

最後推薦,《R in a Nutshell》。對,“果殼裡面的R”!當然,是開玩笑的,in a Nutshell是俚語,意思大致是“簡單的說”。目前,我們正在翻譯這本書的中文版,大概明年三月份交稿!這本書很不錯,大家可以從現在開始期待,並廣而告知一下!

2.高階入門

讀了上述書籍之後,你就可以去高階入門階段了。這時候要讀的書有兩本很經典的。《Statistics with R》和《The R book》。之所以說這兩本書高階,是因為這兩本書已經不再限於R基礎了,而是結合了資料分析的各種常見方法來寫就的,比較系統的介紹了R線上性迴歸、方差分析、多元統計、R繪圖、時間序列分析、資料探勘等各方面的內容,看完之後你會發現,哇,原來R能做的事情這麼多,而且做起來是那麼簡潔。讀到這裡已經差不多了,剩下的估計就是你要專門攻讀的某個方面內容了。下面大致說一說。

3.繪圖與視覺化

亞里斯多德說,“較其他感覺而言,人類更喜歡觀看”。因此,繪圖和視覺化得到很多人的關注和重視。那麼,如何學習R畫圖和資料視覺化呢?再簡單些,如何畫直方圖?如何往直方圖上新增密度曲線呢?我想讀完下面這幾本書你就大致會明白了。

首先,畫圖入門可以讀《R Graphics》,個人認為這本是比較經典的,全面介紹了R中繪圖系統。該書對應的有一個網站,google之就可以了。更深入的可以讀《Lattice:Multivariate Data Visualization with R》。上面這些都是比較普通的。當然,有比較文藝和優雅的——ggplot2系統,看《ggplot2:Elegant Graphics for Data Analysis》。還有資料探勘方面的書:《Data Mining with Rattle and R》,主要是用Rattle軟體,個人比較喜歡Rattle!當然,Rattle不是最好的,Rweka也很棒!再有就是互動圖形的書了,著名的互動系統是ggobi,這個我已經喜歡兩年多了,關於ggobi的書有《Interactive and Dynamic Graphics for Data Analysis With R and GGobi》,不過,也只是適宜入門,更多更全面的還是去ggobi的主頁吧,上面有各種資料以及包的更新資訊!

特別推薦一下,中文版繪圖書籍有謝益輝的《現代統計圖形》。

4.計量經濟學

關於計量經濟學,首先推薦一本很薄的小冊子:《Econometrics In R》,做入門用。然後,是《Applied Econometrics with R》,該書對應的R包是AER,可以安裝之後配合使用,效果甚佳。計量經濟學中很大一部分是關於時間序列分析的,這一塊內容在下面的地方說。

5.時間序列分析

時間序列書籍的書籍分兩類,一種是比較普適的書籍,典型的代表是:《Time Series Analysis and Its Applications :with R examples》。該書介紹了各種時間序列分析的經典方法及實現各種經典方法的R程式碼,該書有中文版。如果不想買的話,建議去作者主頁直接下載,英文版其實讀起來很簡單。時間序列分析中有一大塊兒是關於金融時間序列分析的。這方面比較流行的書有兩本《Analysis of financial time series》,這本書的最初是用的S-plus程式碼,不過新版已經以R程式碼為主了。這本書適合有時間序列分析基礎和金融基礎的人來看,因為書中關於時間序列分析的理論以及各種金融知識講解的不是特別清楚,將極值理論計算VaR的部分就比較難看懂。另外一個比較有意思的是Rmetrics推出的《TimeSeriesFAQ》,這本書是金融時間序列入門的東西,講的很基礎,但是很難懂。對應的中文版有《金融時間序列分析常見問題集》,當然,目前還沒有發出來。經濟領域的時間序列有一種特殊的情況叫協整,很多人很關注這方面的理論,關心這個的可以看《Analysis of Integrated and Cointegrated Time Series with R》。最後,比較高階的一本書是關於小波分析的,看《Wavelet Methods in Statistics with R》。附加一點,關於時間序列聚類的書籍目前比較少見,是一個處女地,有志之士可以開墾之!

6.金融

金融的領域很廣泛,如果是大金融的話,保險也要被納入此間。用R做金融更多地需要掌握的是金融知識,只會資料分析技術意義寥寥。我覺得這些書對於懂金融、不同資料分析技術的人比較有用,只懂資料分析技術而不動金融知識的人看起來肯定如霧裡看花,甚至有人會覺得金融分析比較低階。這方面比較經典的書籍有:《Advanced Topics in Analysis of Economic and Financial Data Using R》以及《Modelling Financial Time Series With S-plus》。金融產品定價之類的常常要用到隨機微分方程,有一本叫《Simulation Inference Stochastic Differential Equations:with R examples》的書是關於這方面的內容的,有例項,內容還算詳實!此外,是風險度量與管理類。比較經典的有《Simulation Techniques in Financial Risk Management》、《Modern Actuarial Risk Theory Using R》和《Quantitative Risk Management:Concepts, Techniques and Tools》。投資組合分析類和期權定價類可以分別看《Portfolio Optimization with R》和《Option Pricing and Estimation of Financial Models with R》。

7.資料探勘

這方面的書不多,只有《Data Mining with R:learing with case studies》。不過,R中資料探勘方面的包已經足夠多了,參考包中的幫助文件就足夠了。

8.附註

出於版權等事宜的考慮,我無法告知你說在“新浪愛問”等地方可以直接免費下載到上面提到的這些書,但是,我想你可以發揮自己的聰明才智去體悟!