1. 程式人生 > >資料分析/資料探勘 入門級選手建議

資料分析/資料探勘 入門級選手建議

1.資料分析和資料探勘聯絡和區別

聯絡:都是搞資料的

區別:資料分析偏統計,視覺化,出報表和報告,需要較強的表達能力。資料探勘偏演算法,重模型,需要很深的程式碼功底,要碼程式碼,很多= =。

 

2.怎麼入門

請百度“如何成為一名資料分析師”或者“如何成為一名資料探勘工程師”。英文好上Quora,不行上知乎,看看入門資料。

 

3.選哪些書

看入門資料給你提供的書,有電子版下電子版,沒電子版買紙質書,花不了多少錢。

 

4.用什麼語言

資料分析:excel是必須,R是基本,python是進階。SAS和Matlab給土豪去玩吧。

資料探勘:python是必須,java/c/c++是基礎,hadoop/mapreduce/spark先掌握一點,因為並不是所有公司都有這麼大的資料量。

 

5.需要學數學嗎

都需要

資料分析:統計學,概率論,

資料探勘:高數/數學分析,數值分析,線性代數,凸優化,運籌學(這些是基本)數字訊號處理,模式識別,矩陣論(進階)

 

6.要不要讀研究生

一般來說,只有應屆生去找工作會比較看重學歷,因為你沒有其他可以展示你能力的。但是隨著工作時間久了(兩年+),你的能力遠超於你所在的學校,學歷就不重要了。如果要讀,建議讀計算數學/概率論/模式識別/計算機 方面的研究生,爭取發論文(高質量),否則應聘的時候並沒有什麼影響,當然,有些公司可能會在初篩的時候根據學歷篩選人,正常,真想進就多工作幾年再社招進去唄,學歷不好也不能怪別人對不對。

工作幾年後,如果覺得到瓶頸了,可以再去讀書,沒什麼,這個時候可能你更清楚自己需要的是什麼。

             

7.選擇去哪個公司

大公司核心職位優先>>中型公司核心職位>大公司邊緣職位>優秀的創業小公司核心職位>中型公司邊緣職位>坑人的創業小公司邊緣職位

原因:

1.大公司資料量多,人才多。能接觸到核心專案核心職位是最佳選擇。(BAT,網易有道,微軟等)

2.中型公司發展快,機會多,壓力大,成長快。(美團滴滴58)

3.創業公司慎選,如果有創業公司的offer,一看他們差不差錢,而看他們專案贏不贏利,三看團隊技術氛圍濃不濃。不差錢+盈利但技術氛圍不濃,可以去,但不適合對技術追求高的人;不差錢+技術氛圍濃但暫時不盈利,可以考慮,但要搞清楚盈利模式。盈利+技術氛圍濃但現在差錢,可以考慮,爭取成為核心成員,一旦融資不得了。如果差錢又不盈利技術氛圍還差,算了吧,耗不起。

實在不知道怎麼選,就看兩點:1.資料量大小 2.技術氛圍。錢少可以以後賺,技術氛圍濃最重要。

 

8.怎麼面試

1.誠實 2.真誠 3.展現你的潛力

 

9.沒有專案經驗怎麼辦

應屆生要啥專案經驗,本科生就說說自己的畢業論文,數模/ACM/阿里的參賽經歷或獲獎經歷,以及可能會有的實習經歷。研究生就說實驗室的專案,負責的工作,完成的成果和發表的論文。不要誇大,如實說。

 

10.要不要培訓

因人而異,但不建議。如果連搜尋能力和自學能力都沒有,就算你入了行,也會過得很痛苦的。更何況高昂的學費和造假的簡歷了。

 

11.到底該選資料分析還是資料探勘

程式碼能力強直接搞演算法,弱就先做資料分析,慢慢來,不著急。想我畢業的時候只會Matlab,後來被領導逼著兩星期學了R,一個月學了python,自己在業餘學了java,hadoop和spark等,也是一步步來的,不要想一口吃成個大胖子。

 

12.前途怎麼樣

我從實習到現在年薪翻了5倍,你說怎樣。你要是隻衝著錢去呢,去做銷售吧;要是喜歡純數呢,去做研究吧;要是喜歡從資料裡發現一些有趣的事情並應用上去,那就來做資料分析/資料探勘吧。

 

13.一天的工作大概是怎樣的

到公司,跑資料,看結果,調優,跑資料,看結果,看論文,改程式碼,調優,跑資料,看結果。。。

 

14.有沒有推薦的網站

google(之前被牆了,某個晚上恢復了,馬上要回歸了,現在不能用的話買個vpn吧,mac本推薦shadowsocks軟體)

stack overflow:改bug神器

github:開源大法好!

Quaro:資料蒐集地/經驗借鑑處

(以及各類招聘網站:我不想學習的時候就看這個,看和自己理想的工作還有多少差距,打雞血。。)

 

15.有沒有推薦的IDE

sublime text+secureCRE/iterm夠用了(mac本,windows的話就下個notepad++和linux就可以了)

各種語言的IDE都可以下一個,除錯用。沒有推薦,哪個順手用哪個。

 

16.用什麼電腦

有錢直接上伺服器,沒錢買個配置高的,實在沒錢買個能敲的就行。以後工作有錢了再整個好的。

 

17.怎麼投簡歷

校招有網申,我沒有搞過校招,不太清楚流程。如果錯過校招,最好去拉勾周伯通等垂直網站投。不太推薦58/趕集/智聯,這些招聘網站上的職位型別主流偏低端,碰到不靠譜的公司概率較大。

 

18.怎麼看崗位要求知道我的工作內容

一個簡單的方法:所有資料分析類的崗位要求裡寫的要求會excel,PPT等的乾的都是統計員的活!所有資料分析類的崗位要求裡寫的要求會GA,pu,uv分析的都是運營部門的!所有資料探勘崗位裡寫的要求只有hadoop,spark,ETL的乾的都是資料倉庫的活!其他的自己看吧,資料探勘有好幾種職位:廣告ctr預估的,機器學習的,推薦系統,自然語言處理等等。自己選擇吧。反正入門都可以嘗試做做。

 

總之,入門容易深入難,數學不好可以學,但會制約你的發展,程式碼不好也可以,但也會制約你的職業生涯,所以那些說“我覺得我數學不好程式碼能力也不強覺得R好難英語也不好看不懂國外的網站學多了會不會掉頭髮會不會找不到男/女朋友blahblah”的,你開心就好,你的職業生涯掌握在自己手中。

 

最後,感謝當初把我帶入門的彭愛民老師,高芹老師和李海雄老師等等,好想回去看你們啊!!!!!!!

 

以上是工作半年以來想到的所有新入行的人可能會問的問題,以及我自己踩過的坑的一些總結,不全面,也沒什麼調理,大家將就看吧。除了以上問題有什麼的再問我吧,上班時間不要問哦~(雖然下班也沒什麼時間,逗玩貓看看書刷刷手機就睡覺了  =  =)。

 

不要覺得我厲害,我覺得我到現在都是入門級,周圍同事搞深度學習碼程式碼碼的飛起快被虐慘了,我是渣渣 = =

 

拜拜~學弟學妹們加油~