1. 程式人生 > >關於資料科學家,我們應該知道的這些事

關於資料科學家,我們應該知道的這些事

關於資料科學家,我們應該知道哪些事兒

幾年前,Harvard Business Review 讚揚資料科學家是“ 21 世紀最性感的職位”。但是你知道成為一個數據科學家意味著什麼嗎?讓我們首先看看資料科學家和專家們的一些著名的觀點吧。

資料科學家“趨向於”自然科學家,尤其是物理學家,而不是電腦科學家。 物理學家有著很強的數學背景、計算機技術,並且篤信這樣的原則:生存依靠的是從資料中發掘出最多的資訊。他們必須考慮的都是巨集觀的格局、重要的問題。 —DJ Patil,VP of Product at RelateIQ

他們必須在資料中找出最寶貴的真相,並且解釋給商業領導者們。—Rchard Snee Emc

資料科學家就是那些比電腦科學家知道更多統計知識、比統計學家知道更多電腦科學的人。—Josh Blumenstock

資料科學家只是比統計學家更性感的一個稱呼罷了。—Nate Silver

資料科學家涉及的工作有:收集資料、把資料整理揉合成一個易處理的模式,讓資料講出自己故事,並把這些故事展示給其他人。— Mike Loukides,VP,O’Reilly Media

半開玩笑的說,資料科學家被稱為穿斗篷的超人。— Ben Rooney

(資料科學家會)解析地、嚴密並且系統地思考一個商業問題,並根據可用資料得出解決方案。—Michael O’Connell, Sr. Director of Analytics, TIBCO

資料科學家 = 統計學家 + 程式設計師 + 教導者 + 講故事的人 + 藝術家 —Shlomo Aragmon

他們是一半黑客、一半分析師。他們使用資料得到產品並發現獨到的見解。—Monica Rogati

資料科學家是那些可以獲取、清理、發掘、建模並解釋資料、還混雜了具備黑客技術、統計學和機器學習知識的人。資料科學家不僅僅擅長處理資料、同時意識到資料本身就是一流的產品。—Hillary Mason

現在,給出一個來自 Drew Conway 的有趣的圖表,它解釋了成為資料科學家意味著什麼:

翻譯5-CH圖1

再看看另一個簡單圖表。這是我自己對整個資料科學過程的描述。

翻譯5-CH圖2

那麼,資料科學家是做什麼的呢? 簡單的說,資料科學家收集資料並清理資料,建立資料集,分析它們並得出新的見解。他試圖依靠手中的資料預測未來並幫助企業提升產品、服務和客戶訂單的質量。更優秀的品質意味著更好的客戶滿意度和更豐厚的收入。

以下是每個資料科學家應該具備的三個重要特質:

  1. 一個好的資料科學家知道需要提出的正確問題;
  2. 理解自己所擁有資料的結構
  3. 能夠把資料很好的翻譯解釋出來

總之,提問正確的問題,並得出有益於作出合理決策的見解,這就是資料科學家該做的事兒。