1. 程式人生 > >為資料探勘,資料分析師做準備

為資料探勘,資料分析師做準備

我的職業理想
      (作者:和君商學院四屆學子)

我小時候的理想是將來做一名數學家,可惜長大了發現自己天賦不夠,理想漸行漸遠,於是開始考慮現實,開始做一些人生規劃,我一直在思考將來從事何種職業,專注什麼樣的領域,重新定義著自己的職業理想。我現在的職業理想,比較簡單,就是做一名資料分析師。

為什麼要做資料分析師:

在通訊、網際網路、金融等這些行業每天產生巨大的資料量(長期更是積累了大量豐富的資料,比如客戶交易資料等等),據說到2020年,全球每年產生的資料量達到3500萬億GB;海量的歷史資料是否有價值,是否可以利用為領導決策提供參考依據?隨著軟體工具、資料庫技術、各種硬體裝置的飛快發展,使得我們分析海量資料成為可能。

而資料分析也越來越受到領導層的重視,藉助報表告訴使用者什麼已經發生了,藉助OLAP和視覺化工具等分析工具告訴使用者為什麼發生了,通過dashboard監控告訴使用者現在在發生什麼,通過預報告訴使用者什麼可能會發生。資料分析會從海量資料中提取、挖掘對業務發展有價值的、潛在的知識,找出趨勢,為決策層的提供有力依據,為產品或服務發展方向起到積極作用,有力推動企業內部的科學化、資訊化管理。

我們舉兩個通過資料分析獲得成功的例子:

(1) Facebook廣告與微博、SNS等網路社群的使用者相聯絡,通過先進的資料探勘與分析技術,為廣告商提供更為精準定位的服務,該精準廣告模式收到廣大廣告商的熱捧,根據市場調研機構eMarketer的資料,Facebook年營收額超過20億美元,成為美國最大的線上顯示廣告提供商。

(2) Hitwise釋出會上,亞太區負責人John舉例說明: 亞馬遜30%的銷售是來自其系統自動的產品推薦,通過客戶分類,測試統計,行為建模,投放優化四步,運營客戶的行為資料帶來競爭優勢。

此外,還有好多好多,資料分析,在營銷、金融、網際網路等方面應用是非常廣泛的:比如在營銷領域,有資料庫營銷,精準營銷,RFM分析,客戶分群,銷量預測等等;在金融上預測股價及其波動,套利模型等等;在網際網路電子商務上面,百度的精準廣告,淘寶的資料魔方等等。類似成功的案例會越來越多,以至於資料分析師也越來越受到重視。

然而,現實卻是另一種情況。我們來看一個來自微博上的資訊:在美國目前面臨14萬~19萬具有資料分析和管理能力的專業人員,以及150萬具有理解和決策能力(基於對海量資料的研究)的管理人員和分析人員的人才短缺。而在中國,受過專業訓練並有經驗的資料分析人才,未來三年,分析能力人才供需缺口將逐漸放大,高階分析人才難尋。也就是說,資料分析的需求在不斷增長,然而合格的為企業做分析決策的資料分析師卻寥寥無幾。好多人想做資料分析卻不知道如何入手,要麼不懂得如何清洗資料,直接把資料拿來就用;要麼亂套模型,分析的頭頭是道,其實完全不是那麼回事。按俗話說就是:見過豬跑,沒吃過豬肉。

我的職業規劃:

對於資料分析,有一句話說的非常好:spss/sql之類的軟體、決策樹、時間序列之類的方法,這些僅僅就都是個工具而已,最重要的是對業務的把握。沒有正確的業務理解,再牛的理論,再牛的工具,都是白搭。做一名合格的資料分析師,除了對資料需要有良好的敏感性之外,對相關業務的背景的深入瞭解,對客戶或業務部門的需求的清晰認識。根據實際的業務發展情況識別哪些資料可用,哪些不適用,而不是孤立地在“真空環境”下進行分析。

為此,我對自己的規劃如下:

第一步:掌握基本的資料分析知識(比如統計,概率,資料探勘基礎理論,運籌學等),掌握基本的資料分析軟體(比如,VBA,Matlab,Spss,Sql等等),掌握基本的商業經濟常識(比如巨集微觀經濟學,營銷理論,投資基礎知識,戰略與風險管理等等)。這些基礎知識,在學校裡儘量的學習,而且我來到了和君商學院,這樣我可以在商業分析、經濟分析上面領悟到一些東西,增強我的資料分析能力。

第二步:參與各種實習。研一開始我當時雖然有課,不過很幸運的找到一份一週只需去一兩天的兼職,內容是為三星做競爭對手分析,當然分析框架是leader給定了,我只是做整合資料和往ppt裡填充的內容的工作,不過通過兼職,我接觸到了諮詢行業,也向正式員工學習了很多商業分析、思考邏輯之類的東西。之後去西門子,做和VBA的事情,雖然做的事情與資料分析無關,不過在公司經常用VBA做一些自動化處理工作,為自己的資料分析工具打好了基礎。再之後去了易車,在那裡兼職了一個多月,參與了大眾汽車銷量資料短期預測的專案,一個小專案下來,資料分析的方法流程掌握了不少,也瞭解了企業是如何用一些時間序列模型去參與預測的,如何選取某個擬合曲線作為預測值。現在,我來到新的地方實習,也非常幸運的參加了一個央企的碼頭堆場優化系統設計,其實也算資料分析的一種吧,通過碼頭的資料實施排程,通過碼頭的資料進行決策,最後寫成一個可操作的自動化系統。而這個專案,最重要的就是業務流程的把握,我也參與專案最初的需求調研,和制定工作任務說明書SOW,體會頗多。

第三步:第一份工作,預計3-5年。我估計會選擇諮詢公司或者IT公司吧,主要是做資料分析這塊比較強的公司,比如Fico,埃森哲,高沃,瑞尼爾,IBM,AC等等。通過第一份工作去把自己的知識打得紮實些,學會在實際中應用所學,學會資料分析的流程方*,讓自己成長起來。

第四步:去自己喜歡的一個行業,深入瞭解這個行業,並講資料分析應用到這個行業裡。比如我可以去電子商務做資料分析師。我覺得我選擇電子商務,是因為未來必將是網際網路的時代,電子商務必將取代傳統商務,最顯著的現象就是傳統零售商老大沃爾瑪正在受到亞馬遜的挑戰。此外,電子商務比傳統的零售商具有更好的資料收集和管理能力,可以更好的跟蹤使用者、挖掘潛在使用者、挖掘潛在商品。

第五步:未知。我暫時沒有想法,不過我希望我是在一直的進步。

有一位資料分析牛人曾經總結過資料分析師的能力和目標:

能力:一定要懂點戰略、才能結合商業;一定要漂亮的presentation、才能buying;一定要有global view、才能打單;一定要懂業務、才能結合市場;一定要專幾種工具、才能幹活;一定要學好、才能有效率;一定要有強悍理論基礎、才能入門;一定要努力、才能賺錢;最重要的:一定要務實、才有reputation;不懂的話以後慢慢就明白了。

目標:1-做過多少個專案?2-業務背景有哪些,是否跨行業?3-做過多少種類型的模型?做了多少個模型?4-基於模型做過多少次完整的marketing閉環?以上四個問題,足以秒殺95%以上的忽悠和菜鳥!

我僅以此為努力之座標,時刻提醒自己。

路在前方,漫漫前行。