1. 程式人生 > >看完這篇文章,再決定要不要當資料科學家?

看完這篇文章,再決定要不要當資料科學家?

如今,手把手教你當資料科學家的文章不在少數。

確實,當你下定決心從事資料科學領域工作,這些都需要考慮。不過在這之前,你們應該問自己一個問題,並且這個問題是每個有抱負的資料科學家需要認真想一想的:“我要不要當資料科學家?”

這個問題更關注你選擇這一職業的原因,而非從事這一職業的方法。那麼,吸引你選擇這一領域,讓你在未來幾年都對其保持熱情的原因是什麼?

為了回答這個問題,需要了解資料科學的緣起和未來走向。只有經過充分了解,你才能確定這個領域對你是否有價值。

緣起

在電腦科學、資料技術、視覺化、數學和統計學融合為今日我們所稱的資料科學之前,這些領域互不相干,各自為開發工具和產品奠定了基礎,例如:Oculus 、Google Home、亞馬遜Alexa、自動駕駛汽車、推薦引擎等。

 

這些基礎理論已經有了幾十年的歷史...... 追溯到19世紀前期,不同領域的科學家攜手開發第一臺計算機,研究微積分、概率論和演算法,例如:CNN(卷積神經網路)、強化學習,最小平方迴歸等。隨著資料和計算能力的激增,我們能夠重構十年前的這些理論,並將其應用於解決現實問題。

2009年和2012年,麥肯錫和《哈佛商業評論》發表了文章吹捧資料科學家,展示了他們如何顛覆企業運營方式,以及他們對未來商業的成功至關重要。他們不僅看到資料驅動的優勢,而且還看到了未來預測分析對於保持競爭力和市場聯絡的重要性。大約在2011年的同一時間,Andrew Ng推出了一個關於機器學習的免費線上課程,AI FOMO(錯失恐懼症)隨之而來。

現狀

公司開始搜尋高技術人才,來幫助他們蒐集、儲存、視覺化,並理解所有資料。 “高薪高位急聘技術人才!”這些公司對自己尋找的人才知之甚少,因此湧現了大量崗位需求。

 

今天如果你在ZipRecuiter上搜索,會發現和資料科學相關的空缺職位超過了十九萬。每個人都在尋找自己的資料獨角獸。為了吸引人才進入市場,資料科學家的定義很快就會被擴大,因為不同的公司和個人會對其有不同的定義。

另一方面,對於應聘者來說前景一片大好:薪水可觀、需求旺盛,而且公司承諾福利和頭銜。人人趨之若鶩,急不可待地開發所有需要的技能,目標是競爭這個 “21世紀最具吸引力的工作”。

我們有供也有求,那麼問題是什麼?刺激需求利用其炒作的不在少數。好像每天都有新課程來滿足那些雄心勃勃的資料科學家,例如碩士課程,新手入門、線上課程等等。這彷彿一場軍備競賽,大家爭相報名,上對了課,就能找到機器學習相關工作。 “沒有博士學位?沒問題。你只需要三到六個月的時間,給自己一筆一萬到一萬五的小額投資,畢業後即可得到一份高薪工作!” 

這些課程旨在提供一站式服務:無論程式設計、視覺化還是建模,應有盡有。你很快就會發現,許多問題都可以使用類似的方法解決(但並非所有),因此如果你正在找某種演算法,那麼肯定有一個現存的資料庫能幫助你解決問題,很簡單,對吧?

 

且慢...

如果你一直在關注資料科學,你肯定會發現一些重要現象:

1.公司在開始收集正確的資料之前就會僱傭資料科學家(他們現在面臨人工智慧的冷啟動問題),這意味著你需要參與資料流水線的每一步。包括資料收集、儲存和視覺化,然後才能進行建模。

2.如果你急於獲得資料科學的工作(採取了上述方法之一),便得和成千上萬的人競爭。你要假設他們和你有類似的經驗和專案經歷。為了讓自己脫穎而出,你需要展示自己的創造力和堅韌不拔的毅力。

 

3.自己開發演算法不太可能。除非你時間充足,否則一般都會使用現有信譽比較好的庫。與一群負責開發的博士競爭,並冒險將一些效果不佳的東西投入生產有何意義?如果是為了自己的特定用途,那便另當別論。

未來

相信未來會產生重要變化:

首先,資料科學家的技能以及對企業的預期影響將會更加明確。其次,AI模型將會走向自動化。不信的話,谷歌AutoML和TPot等軟體包已經表現出這一趨勢。技術上最具挑戰性、最吸引人的部分將自動化。正如他們所說:“不會機器學習?沒問題!”

 

未來的發展軌跡:

1.資料工程師或資料分析師不會再被冠上 “真正的”資料科學家的頭銜,享受不應得的薪酬,這可能會減少市場上資料科學家的數量。

2.人類洞察力和監督將變得越來越重要。並不是說技術專業知識地位降低,而是將分析與業務聯絡起來,瞭解軟體如何與人們互動(即資料科學的人性化方面),這些將會更加重要。

3.最後,由於作業中的機器學習部分表現最穩定,因此它將最先實現自動化(我們已經看到了這一點)。這意味著,資料科學家工作的大部分將涉及統一散亂資料、準備建模和評估。

因此,在回答 “要不要做資料科學家?的時候”,想象一下自己在未來這個熱門行業裡的表現:儘管挑戰重重,你是否能在持續快速發展的領域中成長?你是否擁有很高的應變和適應能力?如果是,歡迎來到資料分析的世界!

在這裡小編給大家推薦一個軟體開發學習圈

大資料學習qq群458345782

python學習qq群250933691

每天有免費的學習資源分享給大家