1. 程式人生 > >學大資料是先學java還是先學python?

學大資料是先學java還是先學python?

大資料的發展趨勢日漸明顯,但是進入這個領域的門檻不小,除了要有心理準備,其次就是要付諸實際行動中去學習。學習方法有很多,在沒有基礎的前提下,自學是因人而異是有難度。其次是大資料目前的工作方向主要是三個:大資料應用,資料分析,大資料研發,當然還有一些機器學生有關的資料探勘什麼的,也在這個類別,我暫時歸到研發方向,因為要應用的話,還得結合一些行業和業務進行,所以你要從事大資料,可能要先定一下方向哈,就難易度來選,我建議可以在這個方向考慮一下。如果都是在小白的情況下,可以首先根據自己的性格特徵去選擇,如果自己個人比較喜歡技術也能耐得住性子,就可以選擇大資料研發方向,如果個人比較喜歡綜合性的發展方向又擔心自己坐不住害怕太難,就可以選擇資料分析方向。就這兩個學習方向的語言基礎要求是不一樣的,一個是java,一個是python。根據方向,科多大資料整理來一些,我也總結了一下需要的技能,供你參考,如下: 最基本的是JAVA核心API有關內容,當然有JAVA開發經驗的最容易入門,比如從事過JAVAWEB開發的,基本上可以很容易跳進大資料應用方向,如果沒有JAVA基礎,很多內容你會理解不了。同時除了基本的基礎以外,我在下面還給你羅列了一些列必須的技能: Java高階(VM相關、併發相關,執行緒相關) 2、Linux 基本操作(環境,命令,網路等相關內容) 3、Hadoop(此處為通常指的是HDFS+MapReduce+Yarn的相關內容 ) 4、HBase(JavaAPI操作+Phoenix ) 5、Hive(Hql基本操作和原理理解) 6、Kafka 7、Storm 8、Scala 9、Python 10、Spark (Core+sparksql+Spark streaming ) 如果要把大資料玩得比較洋氣,個人建議還要學習一些高階技術,不過不建議一開始就去觸碰,畢竟這些技術個人建議還是有一些經驗積累後再來哈,會比較快。學習建議如下: 一定要把JAVA基礎和JAVA高階部分學好,把JAVA做為第一開發語言,這個是關鍵,其次,Python也要引起重視,可以做為第二開發語言去學習掌握。 一定要把Linux的基礎操作,網路操作,檔案操作等學好,掌握熟練,特別在環境配置部分,要多熟悉各種命令,同時也要多熟悉系統的基本結構。 關於Hadoop、Hive等環境和技術應用,要結合一些實際點的案例來學要快一些,簡單的Demo很難看到一些現象。 以上是大資料研發方向,如果是資料分析方向的話,可以一開始就學習和了解一下python,從初級到高階,其次就是學會能用python寫一些爬蟲程式,能獲取簡單的一些資料。再學習Numpy及Pandas、spss,sass,及機器學習演算法和業務資料分析,spark資料分析等等; 個人建議可以買些書來看,當然看書效果因人而異也有可能效果不太好,可以去找一些網課,跟著視訊學,最直接的學習方式就是去報名參加下一些線下的專業培訓班,集中學習。當然,科多大資料是可以提供的。