1. 程式人生 > >資料分析行業的誤區(二)

資料分析行業的誤區(二)


在前面的文章中我們給大家介紹了資料分析行業的誤區,就是很多人認為自己可以擔任資料分析師的工作,並能夠將其發展為資料科學家。其實並不是這樣的,其中的原因我們也給大家介紹了。而資料分析行業中第二個誤區就是資料分析是資料科學的良好訓練。其實並不是這樣的,資料分析只是資料分析,而資料科學則是資料科學,是更高階的內容。下面就由小編為大家仔細的說明一下這個內容。

一般來說,如果沒有掌握學習機器學習以及統計技術,那麼是不能夠解決問題的。這句需要我們做到探索性的資料分析以及學會一些資料分析工具的使用,比如Excel、SQL、R和Python。從資料分析師的角度來看,我們使用某種方式做事情就是有意義的事情,但是資料科學的需求是不同的。當前資料分析師投入到資料科學專案中並開始應用他們多年來發展的模式來看,結果並不理想。

在現階段的資料分析行業中,要想在新的資料上再次執行流水線需要幾周的時間,但是由於資料分析時間越長所得到的結果也就越沒有價值。所以由於技術原因迫使我們只使用少量的可用資料,於是這個工作流程使任何事情都無法完成。最重要的是,我們在進行資料分析的時候寫的的每一個指令碼都十分脆弱。具體的表現在面對任務時,分析師將開始編寫程式碼。如果它一開始不起作用,他們會加入並調整它,指導它。一旦產生結果,他們就進入下一步。沒有努力確保可再生性,可重用性,可維護性,可擴充套件性。使用這種方式我們就能夠不斷的擴充套件程式碼從而實現功能,不過如果不懂程式碼的時候,需要找一名工程師來完成編碼工作,而他們自己也會專注於準備說明書。這種安排也許不是很理想,但我保證結果會好很多。所以說,資料分析師的經驗在資料科學裡面是沒有什麼效果的,我們需要資料分析中最專業的知識,這樣才能夠做好資料分析工作。

通常來說,有些內容管理者需要意識到,這樣才能夠合理的匹配工作任務。這些內容就是資料科學是軟體工程、軟體工程很難、軟體工程界已經開發了一些工具並試著減少它的難度。需要一個軟體專家來使用這些工具、在SAS中編寫指令碼不會使其成為軟體專業人員。

通過上面的內容我們不難發現數據分析是資料科學的良好訓練這個想法是錯誤的,大家在資料分析行業的時候還是需要做好自己的本質工作,希望這篇文章能夠給大家帶來幫助。