1. 程式人生 > >新手要學習大資料或雲端計算需要什麼基礎?

新手要學習大資料或雲端計算需要什麼基礎?

  新手學習大資料需要具備基礎一

  數學知識

  數學知識是資料分析師的基礎知識。

  對於初級資料分析師,瞭解一些描述統計相關的基礎內容,有一定的公式計算能力即可,瞭解常用統計模型演算法則是加分。

  對於高階資料分析師,統計模型相關知識是必備能力,線性代數(主要是矩陣計算相關知識)最好也有一定的瞭解。

  而對於資料探勘工程師,除了統計學以外,各類演算法也需要熟練使用,對數學的要求是最高的。
  大資料學習資料分享群:119599574  

  新手學習大資料需要具備基礎二

  分析工具

  對於初級資料分析師,玩轉Excel是必須的,資料透視表和公式使用必須熟練,VBA是加分。另外,還要學會一個統計分析工具,SPSS作為入門是比較好的。

  對於高階資料分析師,使用分析工具是核心能力,VBA基本必備,SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。

  對於資料探勘工程師……嗯,會用用Excel就行了,主要工作要靠寫程式碼來解決呢。

  新手學習大資料需要具備基礎三

  程式語言

  對於初級資料分析師,會寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。

  對於高階資料分析師,除了SQL以外,學習Python是很有必要的,用來獲取和處理資料都是事半功倍。當然其他程式語言也是可以的。

  對於資料探勘工程師,Hadoop得熟悉,Python/Java/C++至少得熟悉一門,Shell得會用……總之程式語言絕對是資料探勘工程師的最核心能力了。

  新手學習大資料需要具備基礎四

  業務理解

  業務理解說是資料分析師所有工作的基礎也不為過,資料的獲取方案、指標的選取、乃至最終結論的洞察,都依賴於資料分析師對業務本身的理解。

  對於初級資料分析師,主要工作是提取資料和做一些簡單圖表,以及少量的洞察結論,擁有對業務的基本瞭解就可以。

  對於高階資料分析師,需要對業務有較為深入的瞭解,能夠基於資料,提煉出有效觀點,對實際業務能有所幫助。

  對於資料探勘工程師,對業務有基本瞭解就可以,重點還是需要放在發揮自己的技術能力上。

  新手學習大資料需要具備基礎五

  邏輯思維

  這項能力在我之前的文章中提的比較少,這次單獨拿出來說一下。

  對於初級資料分析師,邏輯思維主要體現在資料分析過程中每一步都有目的性,知道自己需要用什麼樣的手段,達到什麼樣的目標。

  對於高階資料分析師,邏輯思維主要體現在搭建完整有效的分析框架,瞭解分析物件之間的關聯關係,清楚每一個指標變化的前因後果,會給業務帶來的影響。

  對於資料探勘工程師,邏輯思維除了體現在和業務相關的分析工作上,還包括演算法邏輯,程式邏輯等,所以對邏輯思維的要求也是最高的。
大資料學習資料分享群:119599574  

  新手學習大資料需要具備基礎六

  資料視覺化

  資料視覺化說起來很高大上,其實包括的範圍很廣,做個PPT裡邊放上資料圖表也可以算是資料視覺化,所以我認為這是一項普遍需要的能力。

  對於初級資料分析師,能用Excel和PPT做出基本的圖表和報告,能清楚的展示資料,就達到目標了。

  對於高階資料分析師,需要探尋更好的資料視覺化方法,使用更有效的資料視覺化工具,根據實際需求做出或簡單或複雜,但適合受眾觀看的資料視覺化內容。

  對於資料探勘工程師,瞭解一些資料視覺化工具是有必要的,也要根據需求做一些複雜的視覺化圖表,但通常不需要考慮太多美化的問題。

 無論做資料分析的哪個方向,初級還是高階,都需要有快速學習的能力,學業務邏輯、學行業知識、學技術工具、學分析框架……資料分析領域中有學不完的內容,需要大家有一顆時刻不忘學習的心。

相關推薦

新手學習資料雲端計算需要什麼基礎

  新手學習大資料需要具備基礎一   數學知識   數學知識是資料分析師的基礎知識。   對於初級資料分析師,瞭解一些描述統計相關的基礎內容,有一定的公式計算能力即可,瞭解常用統計模型演算法則是加分。   對於高階資料分析師,統計模型相關知識是必備能力,線性代數(主要

38套資料雲端計算,架構,資料分析師,Hadoop,Spark,Storm,Kafka,人工智慧,機器學習,深度學習,專案實戰視訊教程

38套大資料,雲端計算,架構,資料分析師,Hadoop,Spark,Storm,Kafka,人工智慧,機器學習,深度學習,專案實戰視訊教程 視訊課程包含: 38套大資料和人工智慧高階課包含:大資料,雲端計算,架構,資料探勘實戰,實時推薦系統實戰,電視收視率專案實戰,實時流統計專案實戰,離線電

人工智慧、資料雲端計算資料探勘與機器學習概述

一、人工智慧、大資料、雲端計算:https://blog.csdn.net/zw0pi8g5c1x/article/details/80027593 二、資料探勘與機器學習:https://blog.csdn.net/xiaogss/article/details/79316063 資料探勘

資料雲端計算的聯絡和區別理解學習

1、什麼是“雲端計算”及舉例說明     雲端計算(cloud computing)是商業化的超大規模分散式計算技術。即:使用者可以通過已有的網路將所需要的龐大的計算處理程式自動分拆成無數個較小的子程式,再交由多部伺服器所組成的更龐大的系統,經搜尋、計算、分析之後將處理的結果

資料雲端計算技術週報(第8期):NoSQL特輯

寫在第8期特輯 “大資料” 三個字事實上是個marketing語言,從技術角度看,包括範圍非常廣。計算、儲存、網路都涉及。 為了滿足眾多同學學習和工作的須要。後面社群依據情況逐漸推出專門的分類集錦。希望大家喜歡! 究竟什麼是NoSQL?公眾號一系列

資料雲端計算、人工智慧,誰才有更好的發展?

雲端計算、大資料、人工智慧這三者的發展不能分開來講,三者是有著緊密聯絡的,互相聯絡,互相依託的,脫離了誰都不能更好的發展,讓我們具體來看一下! 一、大資料 大資料指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長

資料雲端計算,架構,資料探勘實戰

資料探勘、大資料落地專案越來越多,以往一些分析師、工程師只是埋頭訓練模型,現在自媒體釋出平臺為這些幕後工作的人提供了展示的機會,我們在微信公號、部落格站點、社群網站有幸能看到許多案例展示,及實戰專案報告。對於正在學習和實踐資料探勘的人來說,這些資料非常有價值,可以從單個案例一窺當前大資料在不同行業落地應用的大

ABC(人工智慧、資料雲端計算)的關係

本文轉載自:https://digitx.cn/2018/02/21/abc/ ABC是業內對於人工智慧(Artificial Intelligence、即AI),大資料(Big Data)和雲端計算(Cloud Computing)在三種技術的首字母縮寫。這篇文章希望能夠在大資料的角度

資料雲端計算和人工智慧的深度剖析與相互關係,值得入行者典藏

雲端計算、大資料和人工智慧,這三個東西現在非常火,並且它們之間好像互相有關係:一般談雲端計算的時候會提到大資料、談人工智慧的時候會提大資料、談人工智慧的時候會提雲端計算……感覺三者之間相輔相成又不可分割。但如果是非技術的人員,就可能比較難理解這三者之間的相互關係,所以有必要解釋一下。

我們為什麼學習資料分析?(二)

在前面我們給大家說了為什麼要學習大資料分析的原因,比如大資料分析能夠增加從業人員的工資、可以獲得更多的就業機會、大資料分析滲透的領域越來越廣泛等。當然我們學習大資料分析的原因不只是這些,還有很多其他的原因。不過估計大家一時半會想不到更多的學習大資料分析的理由或原因吧?下面就由小編接著給大家講一下這個問題,

資料雲端計算技術週報(第83期)

大資料” 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、儲存、網路都涉及,知識點廣、學習難度高。      本期會給大家奉獻上精彩的:神經網路、HBase、Hive、spark、推薦系統、MangoDB、AIops。全是乾貨

資料雲端計算技術週報(第72期)

大資料” 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、儲存、網路都涉及,知識點廣、學習難度高。      本期會給大家奉獻上精彩的:MongoDB、YARN 、mysql、實時流、Kakfa 、推薦系

資料雲端計算技術週報(第71期)

大資料” 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、儲存、網路都涉及,知識點廣、學習難度高。      本期會給大家奉獻上精彩的:MongoDB、大資料 、網路安全、實時流、搜尋與推薦 、騰訊架構、

資料雲端計算技術週報(第76期)

大資料” 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、儲存、網路都涉

為什麼學習資料呢?寫給資料分析學習者的10個理由

因為大資料爆發,因此出現了大資料開發、大資料分析這兩大主流的工作方向,目前這兩個方向是很熱門,不少人已經在開始轉型往這兩個方向發展,相較而言,轉向大資料分析的人才更多一點,而同時也有不少人在觀望中,這邊科多大資料收集了十個為什麼要學習大資料分析的十個理由。 推薦下小編的大資料學習群;251956

資料雲端計算技術週報(第9期)

寫在第9期週報堅持是一種品格!社群祝大家新年快樂!“大資料” 三個字其實是個marketing語

資料雲端計算

大資料(巨量資料(IT行業術語)) 大資料技術(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中大資料指不

資料雲端計算技術》社群2018成績單

2018漸行漸遠,《大資料和雲端計算技術》社群感謝有你的一路陪伴!回望2018,社群也總結總結2018的成績單,期待新的2019。 一、週報 《大資料和雲端計算技術週報》最早從17年開始只是打算堅持半年試一試。沒有想到一整年我們風雨無阻,節假日不打烊。一直從2018.1.

資料雲端計算技術週報(第74期)

大資料” 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、儲存、網路都涉

10步帶你認識資料雲端計算,圖文並茂讓你不再蒙圈

第一步:大資料 “大資料”這個概念是近幾年開始火起來的,現在可謂是無處不在了。在瞭解什麼是大資料之前,我們先了解一下什麼是傳統資料? 傳統資料就是IT業務系統裡面的資料,如客戶資料、財務資料等。這些資料是結構化的,量也不是特別大,一般只是TB級。對比傳統資料,還有一種叫“新資料”,是來源於社