第3章實戰環境搭建

阿新 • • 發佈：2018-12-17

3-1課程目錄

實戰環境搭建

Spark 原始碼編譯 Spark環境搭建 Spark 簡單使用

3-2 -Spark原始碼編譯

1、下載到官網（原始碼編譯版本）（http://spark.apache.org/downloads.html）

wget https://archive.apache.org/dist/spark/spark-2.1.0/spark-2.1.0.tgz

2、編譯步驟

http://spark.apache.org/docs/latest/building-spark.html

前置要求

1）The Maven-based build is the build of reference for Apache Spark. Building Spark using Maven requires Maven 3.3.9 or newer and Java 8+. Note that support for Java 7 was removed as of Spark 2.2.0.

2） export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m"

mvn編譯命令

./build/mvn -Pyarn -Phadoop-2.7 -Dhadoop.version=2.7.3 -DskipTests clean package

前提：需要對maven有一定了解

./build/mvn -Pyarn -Phive -Phive-thriftserver -DskipTests clean package

spark原始碼編譯

mvn編譯 make-distribution.sh

3-3 補錄：Spark原始碼編譯中的坑

1、

./dev/make-distribution.sh --name custom-spark --pip --r --tgz -Psparkr -Phadoop-2.7 -Phive -Phive-thriftserver -Pmesos -Pyarn -Pkubernetes

建議：阿里雲的機器，可能記憶體不足，建議使用虛擬機器2-4G

3-4 Spark Local模式環境搭建

Spark環境搭建

Local模式

3-5 Spark Standalone模式環境搭建

Spark Standalone模式架構和hadoop 、HDFS/ YARN 和類似的

1 master+n worker

spark-env.sh

hadoop1：master

hadoop2:worker

hadoop3:worker

hadoop4:worker

3-6 Spark簡單使用

Spark簡單使用

使用Spark完成wordcount統計

參考文件：

http://spark.apache.org/examples.html

Word Count

In this example, we use a few transformations to build a dataset of (String, Int) pairs called counts and then save it to a file.

val textFile = sc.textFile("hdfs://...") val counts = textFile.flatMap(line => line.split(" ")) .map(word => (word, 1)) .reduceByKey(_ + _) counts.saveAsTextFile("hdfs://...")

程式碼：

val textFile = sc.textFile("file:///home/hadoop/data/wc.txt") val counts = textFile.flatMap(line => line.split(",")) .map(word => (word, 1)) .reduceByKey(_ + _) counts.collect

在開發階段直接用Local模式

第3章實戰環境搭建

3-1課程目錄

實戰環境搭建

Spark 原始碼編譯 Spark環境搭建 Spark 簡單使用

3-2 -Spark原始碼編譯

3-3 補錄：Spark原始碼編譯中的坑

3-4 Spark Local模式環境搭建

Spark環境搭建

Local模式

3-5 Spark Standalone模式環境搭建

3-6 Spark簡單使用

第3章實戰環境搭建

《Java從小白到大牛精簡版》之第2章開發環境搭建

易學筆記-第0章：環境搭建/0.1 在eclipse中加入web開發外掛並設定自動提示

redis實戰筆記（3）-第3章 Redis命令

《shell編程實戰》第3章shell變量基礎（下）

《shell編程實戰》第3章shell變量基礎（上）

路飛學成-Python爬蟲實戰密訓-第3章

《Java多執行緒程式設計實戰》——第3章 Immutable Object（不可變物件）模式

第二章：自動化測試框架Cucumber，Ruby實戰----環境搭建

第3章樸素貝葉斯演算法（二演算法實戰）

Python3網路爬蟲開發實戰——第1章開發環境

Selenium2自動化測試實戰基於Python語言》讀書筆記--第3章

【機器學習實戰】第3章決策樹

tiny6410裸機實驗第0章--------------開發環境的搭建（程式碼閱讀和編寫工具 source insight ）

《Java併發程式設計實戰》學習筆記之第3章物件的共享

第3章第1講算法與流程圖

裴禮文數學分析中的典型問題與方法第3章一元微分學練習

第3章文件的權限管理

轉載---編寫高質量代碼:改善Java程序的151個建議(第3章:類、對象及方法___建議47~51)

轉載---編寫高質量代碼:改善Java程序的151個建議(第3章:類、對象及方法___建議41~46)

第3章 實戰環境搭建

3-1課程目錄

實戰環境搭建

Spark 原始碼編譯 Spark環境搭建 Spark 簡單使用

3-2 -Spark原始碼編譯

3-3 補錄：Spark原始碼編譯中的坑

3-4 Spark Local模式環境搭建

Spark環境搭建

Local模式

3-5 Spark Standalone模式環境搭建

3-6 Spark簡單使用

相關推薦

第3章實戰環境搭建