1. 程式人生 > >想學統計學需要掌握哪些知識?

想學統計學需要掌握哪些知識?

想學統計學需要掌握哪些知識?

發表於 2013-12-19 00:11 來源: 知乎網

這是一個很好的問題,對於新手、特別是非統計科班出身的人來說,心裡總是有這樣的顧慮,掌握的統計學基礎只是不夠,然而又應該從哪裡入手呢?以下是中國統計網整理自知乎的一些答案,希望對大家會有所幫助。

@肖玄

我認為首先要明確的是學統計幹什麼,如果有明確的作用,比如時間序列,市場調研這些,那麼推薦書籍各不一樣,統計終究只是一個工具,在實際運用中的偏重和變化還是蠻大的,如果不是有特別的目的,只是想要了解統計的話建議從理論基礎看起,再看一些實際操作的書會比較好。

基礎書籍

,我看前面各位大師都推薦的差不多了,就不詳細寫了,就簡單寫一下我理解的基礎書籍涉及的方面
第一個是《統計學基礎》,建議這個先看,至少能大致瞭解統計是什麼東西。只看過人大版的,私底下覺得邏輯還是有點問題,大神勿噴,也許是我腦子笨。不過作為入門還是不錯的。
接下來就是《概率論與數理統計》,這是所有數學學科中最霸氣的一門,沒有之一。
然後是《多元統計》《時間序列》,基本上到這裡統計大致的框架已經有了。
其他的《非引數統計》、《貝葉斯統計》等等看自己需要。
另外這裡推薦一本非主流的書,高階調查分析師考試中的《預測與決策》教材,這是我最喜歡的一本統計相關的教材,沒有之一。但是貌似現在要買到比較難,如果有哪位知友知道哪裡有買,那麼求共享,我也只有一個列印的版本。

操作書籍,好吧,我知道這4個字比較糙,大家將就看。
如果要涉及開源軟體,建議R,知乎上面關於學習R的資料推薦太多,不重複了,自己搜一下就行了。
就說一下SPSS,這裡推薦第一個是中文版的SPSS操作手冊,這個絕對是寶典,另外可以參考一本實際案例的書,哪本都行,關鍵是要跟著案例自己去操作分析。

通俗書籍,最後推薦一點統計的通俗書籍,理論畢竟看起來太煩,通俗的讀物可以幫助更多的理解,像《統計陷阱》,《深入淺出XXX》,這些都適合入門的看一下。另外如果有明確的目的,最好看一下統計學之前分析的方法,比如如果你做市場分析方面的話,可以去了解下消費者行為學,市場營銷理論,這樣才能瞭解統計在學科上的意義。

@鄒日佳

還是強烈推薦先把理論搞清楚,見過直接上軟體搞統計的,解釋資料一塌糊塗,連回歸做的是因變數的期望都不知道。
前期需要:微積分
統計學知識較深,用的地方非常廣,還是希望說一下您想做什麼用。
是在工程上用?還是在臨床試驗上用?還是基因組排序上用?處理金融資產實現無風險套利時用?亦或是在法律統計上用?
無論怎樣,數理方面一定要過關,不論是t統計量、卡方統計量、F統計量,一定要知道它的式子是個什麼形式,這樣才好說明意義,也才好進行篩選與對比,可以找《概率論與數理統計》這本書看一看
能做統計的軟體太多了,SAS、R、S-PLUS、SPSS、Eviews、Matlab,都可以以後學的統計知識得看你想拿它做什麼用,軟體也要根據你不同的用處來選擇,等你修改好問題後,我會再來具體說明的。

@王洪城:

忽視物件和目標而談方法,的確是耍流氓。統計學太寬、太雜,而且正處在蓬勃發展之中,任何一個細小的領域都能耗盡人的一生。況且統計學這東西,用的很廣,越來越多的文科生都想用用統計來支援自己的結論。文科生、工科生、經管類學生、數學系學生有不同的目標,自然方法不一樣。

不過,如果只是想要粗略地瞭解統計學的大概的話,還是有一些很好讀的書的。比如《女士品茶》、Rao的《統計與真理》,這些可以瞭解(只是瞭解)統計的思想、哲學和歷史。國內吳喜之《從資料到結論》、Freedman的《統計學》都寫的很不錯,有一些很好的案例,對統計的一些概念也會有一些理解。

感覺統計就跟醫學差不多,對付小感冒這種病,只要自己買藥,按照說明書服用,就ok了;如果只是像做個迴歸,看看相關係數這種,現在已經有很成熟的方法和軟體,像exel和spss。遇到複雜一點的問題還是請教專業人士吧,即使你能夠用一些方法得出結果,對結果的解釋也是很大的一個問題,大病還是得到醫院治。當然我並不是說統計很難,無法自學成功。統計並不難,只是無法速成,只是統計自身的特殊情況(對於特定情況下的模型選擇、結果解釋,即使在專業人士之間也會有爭議)使得統計有很大的靈活性,只有對統計瞭解地夠多,才能夠應付多變的情況,得到最符合預期且合理的結果。

一句話,想得多,讀得少。想了解直接就去看,缺啥補啥唄。

@鄭來軼:

給你推薦幾本統計學的經典圖書,《深入淺出統計學》、《漫畫統計學》、《女士品茶》、《愛上統計學》、《統計陷阱》,都很不錯的。然後就是上中國統計網

@李超群,電商界的小資料分析猿

專注潛水二十年,頭一次被邀請,照這趨勢看,不用多久,我就會升職加薪,當上總經理,出任CEO,迎娶白富美,走上人生巔峰。想想還有點小激動呢~ ……………………………… 呃,萬萬沒想到,醒來後還是那個王大錘。 OK,回到正題,題主的這個問題啊,就像是在一個專案中一樣,真正的使用者(通常情況下我們可以稱為“優秀”的使用者,原因在下面解釋)對自身的需求從來是不明確的,而優秀的產品經理呢,就是儘可能地明確使用者的需要,然後與專案經理溝通,再交給專案成員(幹活的苦力)實施完成。 說到這兒,有過喜當爹或者喜當媽經驗的同學們就會有經驗了。沒錯,想想吧,突然你家小寶貝兒哭了,哭得聲嘶力竭,驚天動地。。。   怎麼了? 不舒服了?餓了?渴了?痛了?冷了?熱了?害怕了? 對了,這裡我們要補充一個背景設定,小寶貝兒不到1歲,還不能通過語言溝通。   這個時候怎麼辦呢? 年輕的爸爸媽媽們開始討論了,這是怎麼回事兒,怎麼突然哭了呢?   爸爸:是不是不舒服?(提出原假設H0) 媽媽:廢話!你要是舒服了會哭嗎?(根據長期的觀測值與經驗判斷,舒服並哭的出現概率極低,近似為0,接受原假設,==>孩子不舒服)   爸爸:那怎麼就哭了呢?上午剛哭了一次,好不容易才哄好。(判斷事件發生頻率是否符合常態,判斷是否是異常值,檢查基礎資料的準確性,是否存在觀察誤差) 媽媽:你不耐煩了是不是?天天給你做飯,昨天吃了今天就別吃!(在絕對值上下波動,符合正態分佈,基礎資料的準確性沒有問題)   爸爸:說到吃飯,寶寶是不是餓了啊?(由經驗判別,寶寶餓了==>哭泣,提出假設:寶寶餓了) 媽媽:不可能,才餵了奶不到半個小時 (在這裡我們假設正常情況下寶寶每3個小時喝一次奶,左右波動0.5小時,那麼可以知道: 設X為寶寶喝奶的時間,假設服從正態分佈,有X~N(μ,0.5^2),樣本容量n=1,樣本均值X1=0.5,提出的假設為:HO:μ=3;H1:μ≠3 設顯著性水平α為0.05,所以臨界值 1.96,原假設H0的否定域為V1={|Z|≥1.96} 檢驗統計量Z=(0.5-3)/(0.5/根號下1)=-5 因為|-5|=5》1.96,落在否定域內,所以要否定原假設,表明寶寶這次的表現不符合標準的3個小時會餓的情況,所以寶寶不是因為餓了才哭的……)   爸爸:那,是被蚊子咬了嗎? 媽媽:大冬天的,哪來的蚊子?(p(冬天|蚊子)=0,不可能事件) ………………………………………… 經過無數輪討論,呃~這時我們的寶寶聲音已經哭啞了…… 媽媽得到了最終結論:寶寶尿床了! 於是爸爸吩咐保姆,快給孩子換尿布,洗床單 保姆:順利完成任務 爸爸檢查保姆的任務完成情況,並製作工作週報上交給媽媽 媽媽觀察寶寶的狀態,覺得還可以,給了爸爸一筆錢 爸爸給保姆發工資 ——————整個事件得到了完美的解決————————   幸好跑題還不是太遠,還是可以扯回來的 其實在以上事件中,套用了一個比較簡單的專案流程模型:寶寶扮演了使用者的角色,提出了需求;媽媽則是產品經理,把控了整個專案的方面,並負責了使用者與專案經理及專案成員的溝通協調;爸爸是專案經理,提出解決方案,交由組員實施;保姆就是實施的組員。   所以為什麼說不明確自身需求的使用者是“優秀”的使用者呢?通常意義下,更有利於產品經理的發揮,也就是方便忽悠錢。。。去年在電力集團做SAP實施,最直觀的感覺就是,只要能忽悠住了使用者,實施顧問們肆無忌憚圈錢的感覺真棒!   那麼在整個專案的決策與實施中,我們套用了一些統計學上的概念來解釋日常的概念,是因為統計學最初是基於生活中的基本現象而產生的,比如山頂洞人一天可以採集多少漿果?賭場裡連續出老千不被打斷兩條腿可能嗎?晴川打敗所有競爭者晉升為老佛爺而不被幹掉的概率是多少?……   所以平常在和別人交流時,偶爾會有這種的感覺,就是通過有過系統學習統計學的背景的人,他們的思維方式會與其他背景的人存在差異,通常前者會試圖通過邏輯性與概率來證明觀點或思考。   也就是說,其實統計學的思維,在自覺不自覺之間就融入到了個人的生活中,剛畢業後去找工作,面試官一聽說是統計學畢業,總會問一句你的專業對這份職業的優勢是什麼?曾經統計過我們這一級同學對這類問題的回答,大多數都回答“統計是工具,是一種思維方式,需要和其他的知識或領域結合……巴啦巴啦”(當然這也是由於我們這一級的傢伙,80多個人,有50多人選修了第二專業,為了側面烘托自己的優勢也會這麼去說).   所以扯了這些,其實只是想告訴題主,統計學的學習,需要先把這門知識,化為日常生活中的一點一滴,不要把統計學只落在紙面或試卷上的冰冷文字,它是有命的,在生活中習以為常的事情,背後都有各種有趣的統計知識。   雖然不清楚題主希望從事的方向(應用統計/理論統計……) 不過對於入門來講,需要事前掌握的知識不需要多麼的特殊,有一定的數理知識基礎,學習了高等數學,就基本上相當於解決了前置技能,所需要的不過是找到合適的教材與合適的老師,加上認真學習,並嘗試在生活中應用就可以。   推薦閱讀的幾本書:和樓上的幾位會有重合的部分。 《女士品茶——20世紀統計學怎樣變革了科學》,很有趣的統計學發展史; 《統計陷阱》數字是怎樣欺騙了你 《深入淺出統計學》《深入淺出資料分析》深入淺出系列出品,必屬精品 《統計與真理----怎樣運用偶然性》 《統計學的世界》《愛上統計學》有些概念性的知識,可以強化掌握 《漫畫統計學》系列 《社會心理學》戴維·邁爾斯 第8版--這本書作為心理學的教材,超經典。畢業前曾認真讀了一遍,可以看到心理學與統計學的結合   以上書籍為課外閱讀,至於正式學習的教材麼~本科時基本上全使用的是人大版的教材,黃皮封面的那些,說實話,即枯燥又無味,印象最深的是人大版的《抽樣技術》,有很多印刷錯誤,以致上課時親愛的teacher會先花十分鐘,在黑板中把本章節中錯漏的地方通知大家修改過來~(PS:teacher是本校數理統計方向數一數二的大牛)後來偶然間接觸了一些國外的教材,驚為天人。學習教材參見肖玄與李少洋,尚可的推薦即可   以上,為熬夜敲出,純屬個人畢業後混跡軟體實施行業與電商資料分析行業的小小感悟,看看就好,不必太當真。

來自:http://www.zhihu.com/question/19624858