1. 程式人生 > >大資料學習路線 五個階段 層層深入

大資料學習路線 五個階段 層層深入

大資料從入門到精通,一套專業的學習路線是必不可少的,尤其是對於想要自學的同學來說,這個至關重要。個人也整理了一套大資料學習路線,像我一樣是從零基礎開始的同學,可以作為自己的學習參考。

大資料學習路線圖是分為五個大的階段的,學習時間不確定,要看自己的學習能力和集中學習的精力。

階段一:是java基礎。此階段是針對沒有程式設計基礎,或者對基礎不紮實的同學一次補習,這個很重要,就像建一座大廈,這就是地基,地基不穩,就算修再高,總有一天會轟然倒塌!

需要掌握的技術知識:

(1)Java語言基礎

Java開發介紹、熟悉Eclipse開發工具、Java語言基礎、Java流程控制、Java字串、Java陣列與類和物件、數字處理類與核心技術、I/O與反射、多執行緒、Swing程式與集合類

(2) HTML、CSS與Java

PC端網站佈局、HTML5+CSS3基礎、WebApp頁面佈局、原生Java互動功能開發、Ajax非同步互動、jQuery應用

(3)JavaWeb和資料庫

資料庫、JavaWeb開發核心、JavaWeb開發內幕

階段二:linux基礎和Hadoop生態系統。

本階段的linux也是基礎課程,幫大家進入大資料領域,以便更好地學習Hadoop、hbase、NoSQL、Spark、Storm、docker、 kvm、openstack等眾多課程。因為企業中無一例外的是使用 Linux來搭建或部署專案。

Hadoop生態系統的課程,對HDFS體系結構和shell以及java操作詳細剖析,從知曉原理到開發網盤的專案,讓大家打好學習大資料的基礎。

需要掌握的技術知識:

Linux體系、Hadoop離線計算大綱、分散式資料庫Hbase、資料倉庫Hive、資料遷移工具Sqoop、Flume分散式日誌框架

階段三:分散式計算框架和Spark&Strom生態體系

Spark大資料處理本部分內容全面涵蓋了 Spark生態系統的概述及其程式設計模型,深入核心的研究,。不僅面向專案開發人員,甚至對於研究 Spark的學員,此部分都是非常有學習指引意義的課程。

需要掌握的技術知識:

(1)分散式計算框架

Python程式語言、Scala程式語言、Spark大資料處理、Spark—Streaming大資料處理、Spark—Mlib機器學習、Spark—GraphX 圖計算、實戰一:基於Spark的推薦系統(某一線公司真實專案)、實戰二:新浪網(www.sina.com.cn)

(2)storm技術架構體系

Storm原理與基礎、訊息佇列kafka、Redis工具、zookeeper詳解、實戰一:日誌告警系統專案、實戰二:猜你喜歡推薦系統實戰

階段四:專案練習其實是穿插課程其中的,在講解大資料理論的同時,將實踐知識穿插其中,增加學生對大資料技術的理解和應用。

主要涉及的專案介紹:

階段五:此階段是深入提升階段,主要是人工智慧的一些技術知識,也為學生想轉行人工智慧打下良好的基礎,多重技能,更能大大提升就業質量。

需要掌握的技術知識如下:

這個只是大體的大資料學習路線,想要什麼深入學習,還是要找相應的視訊教程和書籍配合學習。大資料學習群142973723