1. 程式人生 > >資料分析進階之路

資料分析進階之路

      博者本人一路從統計走來,從最初的年幼無知到現在無比的後悔,多多少少也是有點心路旅程的人,再此記錄下,並且推薦一些乾貨,以供學弟學妹們參考。

     首先,說說統計學的就業趨勢,筆者親身體驗,近年來難度以指數形勢增加,因為隨著機器學習以及人工智慧的告訴發展,湧現一大批演算法工程師跟我們搶飯碗,計算機學院的,演算法搞不過,程式搞不過,唯一的突破口在於分析能力,這樓主也是親身體驗的,前任天池隊友兩個都是計算機的,對於特徵構建只會怒懟,當然不排除還有很多那種分析能力也很強的演算法大佬,哎~滿滿都是淚。

資料分析師

一般任職要求如下:(圖片來源於實習森招聘)



  這些都是比較基礎的資料分析工作,只要求你掌握excel,sql就OK,小點的公司sql甚至都沒有要求,大點的話可能還對R或python有些要求,其實這類工作基本就是畫畫圖,統計一下,寫篇報告,適合不想太累,想偏運營方向的求職者,也不要求你是統計出身,畢竟excel大家都會,SPSS也特別簡單。

  但如果你有不甘於做這麼簡單的活的覺悟的話!,資料探勘歡迎你,這比資料分析又進階了一下,看看資料探勘崗位的要求:

資料探勘



咦~~,這個時候你會發現要求技能變多了,hadoop,spark出現了,linux也來了,機器學習方法也會出現一下,當然這只是博主隨便找的兩家,不能概全,但是也可以說明那麼一丟丟問題,當你工資變高的時候,職位變厲害的時候,對你自身技能要求也會變高,通常會在面試時考察你更多更廣的知識,這時候你就需要看更多的書,做更多的專案讓面試官對你滿意,否則,請返回上面職位。資料探勘技能掌握之後呢,想要更高的工資,追求更遠大的理想怎麼辦,答案是去搶別人飯碗~~

演算法工程師(機器學習演算法工程師,nlp演算法工程師,影象處理演算法工程師)

聽上去牛逼哄哄的有木有,這個職位缺失很牛逼,而且這一般是計算機專業的工作,但是工作不分專業,誰優秀誰來幹,這個職位工作比較辛苦,近年來也是越來越火,要求是越來越高,通常拿些好學歷+好技術能進去,但你沒有好學歷有好技術也ok,畢竟咱不以學歷論英雄,但你要是沒有學歷又沒有技術,你就只能等著哭哭了。



這時你可能發現了要的可能是計算機專業的學生,不怕,照懟,技術在手,天下我有,不過你要學的就更多了,機器學習,深度學習,自然語言處理,推薦系統,c語言,hive等等,對程式設計要求也會高很多,筆試一般都有很多線上程式設計題,限制時間、空間複雜度,演算法題那可不是一般腦子能輕易做的,leetcode,劍指offer瞭解下,要知道基本方法,方能遊刃有餘。

     其實,在技術方面的工作相對哪些金融業沒有那麼注重學歷,只要你有技術,BAT照收啊,前提是你要有技術,哪些技術呢,太多啦,首先程式語言:R,python,你不精通一門敢說自己是搞資料分析的,SQL你不精通你敢說你會讀資料,這些都是最最基本的啦,對了,還有excel,spss,SAS那種最簡單的所謂的“資料分析”崗位也有再招,這種的話估計就是統計一下報表,謝謝報告,畫畫圖之類的,如果你有更長遠的目光,那麼hadoop,spark之類的你要了解,mapreduce框架,scala語言你都要知道,推薦系統只是你要知道,資料結構你要懂,最好能會點c語言,hive你也要懂,機器學習方法(svm,xgboost)啊,hin重要啊,有萌友們可能覺得好像跑偏到計算機那邊去了,有這種感覺就對了,機器學習方法他們也很喜歡用,但實際上是我們統計人創始的,當然,誰能用的更好誰就贏咯,在此說明一下機器學習方法,調包大家都會!!!,所以你不止要會調包,你要懂原理啊,你要懂得應用場景啊,這才是王道,不要問我怎麼知道的~實習面試瞭解下! 還有深度學習啊,hin重要啊,各種各樣的神經網路,會推啊!,各種框架,tensorflow哇,kereas啦要知道哇,然後nlp方向啊,hin重要啊,wordvec2,LDA啊也要知道啊,總知,雖然筆者也不太瞭解,但也是盡力在逼自己瞭解啊,不學的話,失業瞭解下~

      其次,你有技術了,你知道方法了,你懂得推導了,你要學會應用,那麼就開始實戰吧,各大平臺的一些比賽

     (1)首推,kaggle,谷歌收購了,許多職業大佬,會有很多開源供學習

     (2)國內的話,比較大型的是天池大資料競賽,阿里的,一年一度的IJCAI非常有含金量啊,獲得好的名字,阿里直通哦,還有KDD這種偏推薦的,也很有名氣,平時也有很多新人練習賽,比如說o2o預測大賽可以參加,另外騰訊也會有廣告演算法大賽(這年頭,廣告推薦只會越來越火),京東也會有,獎金非常豐富,而且還有誘人的實習機會,

     好,推薦書環節

      機器學習相關:《機器學習》周志華,《統計學習方法》李航,《機器學習實戰》

      python相關:《利用python進行資料分析》

      推薦系統:《推薦系統實踐》,《計算廣告》

      資料結構:《大話資料結構》

      深度學習:《深度學習》

      C++:《C++ Primer Plus 》

      hadoop,spark:《大資料Spark企業級實戰 》,《hadoop實戰》

      linux:《鳥哥的Linux私房菜 基礎學習篇(第三版)》

      面試:《劍指offer_名企面試官精講典型程式設計題》

哈哈,百度雲連結附上,喜歡紙質的某寶買:

連結:https://pan.baidu.com/s/15NYrYgskR5j5kTaSgr8Z9A 密碼:sa16

相關推薦

資料分析

      博者本人一路從統計走來,從最初的年幼無知到現在無比的後悔,多多少少也是有點心路旅程的人,再此記錄下,並且推薦一些乾貨,以供學弟學妹們參考。     首先,說說統計學的就業趨勢,筆者親身體驗,近年來難度以指數形勢增加,因為隨著機器學習以及人工智慧的告訴發展,湧現一大

避免五大誤區丨新手資料科學家

**作者 Jan Zawadzki 編譯 Mika 本文為 CDA 資料分析師原創作品,轉載需授權** 你為成為資料科學家做了充分的準備,但實際的工作將於你的預期大不相同。 你為成為資料科學家做好了充分的準備。你參加Kaggle比賽,看了大量的Cour

數學-資料分析-Cox比例風險迴歸模型

Cox比例風險迴歸模型(Cox’s proportional hazards regression model),簡稱Cox迴歸模型。該模型由英國統計學家D.R.Cox於1972年提出,主要用於腫瘤和其

Pandas使用DataFrame進行資料分析比賽(二):日期資料處理:按日期篩選、顯示及統計資料

首先,表格的資料格式如下: 1、獲取某年某月資料 data_train = pd.read_csv('data/train.csv') # 將資料型別轉換為日期型別 data_train[

Esp8266 26【高階篇】RTOS移植分析 MQTT 實現過程,實現移植 MQTT協議在 esp8266 rtos實時系統,可斷線重連。(附帶Demo)

一、前言; esp8266的實時系統rtos是後面才出來支援的,其最後的呼叫也是呼叫樂鑫提供的API介面,所以,如果你已經玩轉了NONOS下的程式設計,那麼移植rtos程式碼是非常迅捷的,因為你已經對其的API介面非常熟悉,當然了

Java碼農~基本資料型別&運算子&流程控制-分支&三目

基本資料型別    首先先說下位元組:位元組(byte)是計算機資訊科技用於計量儲存容量的一種計量單位    通常情況下一位元組由8個二進位制位表示 0000 0000;一個位元組的取值範圍為-128~127.大家有興趣的可以瞭解下為什麼是-128~127.    一個Byt

【API】幫公司省下20萬調研費!如何巧用情感分析API實現使用者偏好調研

摘要:自從學習API後,彷彿解鎖了新技能,可別小看了一個小小的API介面,用好了都是能力無窮。這不,用情感分析API來做使用者偏好調研,沒想到這麼一個小創意給公司省了20萬調研費用。 上次藉著高考熱點整出一個刷屏的互動遊戲之後,我連續被各業務部門請了一週的午飯了,今天運營部,明天品牌部,後天市場部…心裡暗搓搓

CSS

模式 ant 表格 weight mil 比較 標題 根據 amp 下面主要引用http://www.cnblogs.com/wangfupeng1988/tag/css知多少/ CSS進階筆記: 一、學習CSS的三個突破點 1.瀏覽器如何加載和解析CSS——CSS的5個來

(基礎篇) - 011 arduino api基礎手冊

異或 change 可用 算術運算符 chan 程序結構 換算 是否 關閉 arduino 函數 api 程序結構 在Arduino中, 標準的程序入口main函數在內部被定義, 用戶只需要關心以下兩個函數:void setup()void loop()setup() 函數

(基礎篇) - 008 SPI數據傳輸(庫函數方法)

ria att clockd == bus 屏蔽 attach serial out 主機端: 1 /********************************* 2 代碼功能:SPI數據傳輸(主機端) 3 引腳說明: 4 SS/CS:片選(高電平屏

(基礎篇) - 009 通過底層AVR方法實現SPI數據傳輸

lean oop and return false 進階 from setup pie 主機端: /********************************* 代碼功能:通過底層AVR方法實現SPI數據傳輸(主機端) 創作時間:2016*10*17 使用資源:

(基礎篇) - 007 脈沖寬度測量

style 函數 long 最大 void serial 作者 println 電平 1 /********************************* 2 代碼功能:Pulse脈沖寬度測量 3 使用函數: 4 pulseIn(引腳號,脈沖響應電平,

(中級篇) - 018 基於arduino的簡易版智能衣架

檢驗 dig cloc 布線 pin on() -- mage 根據 一. 設備及要求 目的:制作一個可以自動根據事實的天氣的狀況進行對衣架上的衣服進行晾曬。 基礎裝置:可伸縮的晾衣架。 開發環境:Arduino1. 8.1 主控板:Arduino UNO 動力裝置:

【SSH】Hibernate映射——一對一單向關聯映射(五)

技術 iyu 標識 tails for sso 3.0 sdn 例如 【SSH進階之路】Hibernate基本原理(一) ,小編介紹了Hibernate的基本原理以及它的核心,採用對象化的思維操作關系型數據庫。 【SSH進階之路】Hibernate搭建開發環境+簡單實例

【SSH】Struts + Spring + Hibernate 開端(一)

height 一段 ioc 效率 陽光大道 面向對象的思想 text ase 們的 Long Long ago。就聽說過SSH。起初還以為是一個東東,詳細內容更是不詳,總認為高端大氣上檔次,經過學習之後才發現,不不過高大上,更是低調奢華有內涵,經過一段時間的

2017PHP程序員的

通信協議 thinkphp nmp 圖形圖像 update gin io模型 應用場景 單例 又是一年畢業季,可能會有好多畢業生即將進入開發這個圈子,踏上碼農這個不歸路。根據這些年在開發圈子總結的LNMP程序猿發展軌跡,結合個人經驗體會,總結出很多程序員對未來的迷漫,特別對

樹莓派 (012) - 關於Raspberry Pi樹莓派無線網卡配置

linu names interface 文件內容 動態ip down run 表示 無線網絡 Raspberry Pi樹莓派無線網卡配置[多重方法備選] 要想讓樹莓派方便操作,肯定需要配置無線網卡,這樣可以大大增強樹莓派的移動性和便利性,其實配置無線網卡基本就是和普通li

【SSH】Hibernate基本映射(三)

tor res 主動 tran clas oid 支持包 lose 包括 【SSH進階之路】Hibernate基本原理(一) ,小編介紹了Hibernate的基本原理以及它的核心。採用對象化的思維操作關系型數據庫。 【SSH進階之路】Hibernate搭建開發環境+簡單

GO語言的-go的程序結構以及包簡介

nbsp 高亮 編碼 支持 style 搜索框 責任 code 能夠                GO語言的進階之路-go的程序結構以及包簡介                                       作者:尹正傑 版權聲明:原創作品,謝絕轉載!否則將追