hadoop生態搭建（3節點）-10.spark配置

阿新 • • 發佈：2018-10-12

sla over doc you 環境變量添加 home usr count

# https://www.scala-lang.org/download/2.12.4.html
# ==================================================================安裝 scala

tar -zxvf ~/scala-2.12.4.tgz -C /usr/local
rm –r ~/scala-2.12.4.tgz

# http://archive.apache.org/dist/spark/spark-2.3.0/

# ==================================================================安裝 spark

tar -zxf ~/spark-2.3.0-bin-hadoop2.7.tgz -C /usr/local
mv /usr/local/spark-2.3.0-bin-hadoop2.7 /usr/local/spark-2.3.0
rm –r ~/spark-2.3.0-bin-hadoop2.7.tgz

# 環境變量
# ==================================================================node1 node2 node3

vi /etc/profile

# 在export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL下添加

export JAVA_HOME=/usr/java/jdk1.8.0_111
export ZOOKEEPER_HOME=/usr/local/zookeeper-3.4.12
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.6
export MYSQL_HOME=/usr/local/mysql
export HBASE_HOME=/usr/local/hbase-1.2.4
export HIVE_HOME=/usr/local/hive-2.1.1
export SCALA_HOME=/usr/local/scala-2.12.4
export KAFKA_HOME=/usr/local/kafka_2.12-0.10.2.1
export FLUME_HOME=/usr/local/flume-1.8.0
export SPARK_HOME=/usr/local/spark-2.3.0

export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$ZOOKEEPER_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$MYSQL_HOME/bin:$HBASE_HOME/bin:$HIVE_HOME/bin:$SCALA_HOME/bin:$KAFKA_HOME/bin:$FLUME_HOME/bin:$SPARK_HOME/bin:$SPARK_HOME/sbin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

# ==================================================================node1

# 使環境變量生效
source /etc/profile


# 查看配置結果
echo $SPARK_HOME

# ==================================================================node1

cp $SPARK_HOME/conf/docker.properties.template $SPARK_HOME/conf/docker.properties
vi $SPARK_HOME/conf/docker.properties

spark.mesos.executor.home: /usr/local/spark-2.3.0


cp $SPARK_HOME/conf/fairscheduler.xml.template $SPARK_HOME/conf/fairscheduler.xml
cp $SPARK_HOME/conf/log4j.properties.template $SPARK_HOME/conf/log4j.properties
cp $SPARK_HOME/conf/metrics.properties.template $SPARK_HOME/conf/metrics.properties


cp $SPARK_HOME/conf/slaves.template $SPARK_HOME/conf/slaves
vi $SPARK_HOME/conf/slaves

node1
node2
node3


cp $SPARK_HOME/conf/spark-defaults.conf.template $SPARK_HOME/conf/spark-defaults.conf
vi $SPARK_HOME/conf/spark-defaults.conf

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://appcluster/spark/eventslog
# 監控頁面需要監控的目錄，需要先啟用和指定事件日誌目錄，配合上面兩項使用
spark.history.fs.logDirectory    hdfs://appcluster/spark
spark.eventLog.compress          true

# 如果想 YARN ResourceManager 訪問 Spark History Server ，則添加一行：
# spark.yarn.historyServer.address http://node1:19888


cp $SPARK_HOME/conf/spark-env.sh.template $SPARK_HOME/conf/spark-env.sh
vi $SPARK_HOME/conf/spark-env.sh

export SPARK_MASTER_PORT=7077        #提交任務的端口，默認是7077
export SPARK_MASTER_WEBUI_PORT=8070  #masster節點的webui端口 默認8080改為8070
export SPARK_WORKER_CORES=1          #每個worker從節點能夠支配的core的個數
export SPARK_WORKER_MEMORY=1g        #每個worker從節點能夠支配的內存數
export SPARK_WORKER_PORT=7078        #每個worker從節點的端口（可選配置）
export SPARK_WORKER_WEBUI_PORT=8071  #每個worker從節點的wwebui端口（可選配置）
export SPARK_WORKER_INSTANCES=1      #每個worker從節點的實例（可選配置）

export JAVA_HOME=/usr/java/jdk1.8.0_111
export SCALA_HOME=/usr/local/scala-2.12.4
export HADOOP_HOME=/usr/local/hadoop-2.7.6
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR=$HADOOP_HOME/etc/Hadoop
export SPARK_PID_DIR=/usr/local/spark-2.3.0/pids
export SPARK_LOCAL_DIR=/usr/local/spark-2.3.0/tmp
export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=node1:2181,node2:2181,node3:2181 -Dspark.deploy.zookeeper.dir=/spark"


vi $SPARK_HOME/sbin/start-master.sh

SPARK_MASTER_WEBUI_PORT=8070


cp $HADOOP_HOME/etc/hadoop/hdfs-site.xml $SPARK_HOME/conf/


vi $HADOOP_HOME/etc/hadoop/log4j.properties

log4j.logger.org.apache.hadoop.util.NativeCodeLoader=ERROR


scp -r $HADOOP_HOME/etc/hadoop/log4j.properties node2:$HADOOP_HOME/etc/hadoop/
scp -r $HADOOP_HOME/etc/hadoop/log4j.properties node3:$HADOOP_HOME/etc/hadoop/

# ==================================================================node1

scp -r $SPARK_HOME node2:/usr/local/
scp -r $SPARK_HOME node3:/usr/local/

# ==================================================================node2 node3

# 使環境變量生效
source /etc/profile


# 查看配置結果
echo $FLUME_HOME

# 啟動

# ==================================================================node1 node2 node3
# 先啟動zookeeper 和 hdfs
zkServer.sh start
zkServer.sh status


# ==================================================================node1
zkCli.sh
create /spark ‘‘


$HADOOP_HOME/sbin/start-all.sh

$HADOOP_HOME/sbin/hadoop-daemon.sh start zkfc


# ==================================================================node2
$HADOOP_HOME/sbin/hadoop-daemon.sh start zkfc
$HADOOP_HOME/sbin/yarn-daemon.sh start resourcemanager

# 啟動spark

# ==================================================================node1
$SPARK_HOME/sbin/start-master.sh

$SPARK_HOME/sbin/start-slaves.sh


# ==================================================================node2
$SPARK_HOME/sbin/start-master.sh


# ==================================================================node1
# 獲取安全模式的狀態:
hdfs dfsadmin -safemode get

# 安全模式打開
# hdfs dfsadmin -safemode enter

# 安全模式關閉
# hdfs dfsadmin -safemode leave

hdfs dfs -mkdir -p /spark/eventslog


$SPARK_HOME/bin/spark-shell


# http://node1:4040
# http://node1:8070


> :quit

# test

# 需保證hdfs上該目錄不存在
# hdfs dfs -mkdir -p /spark/output
# hdfs dfs -rmr /spark/output


vi ~/sparkdata.txt

hello man
what are you doing now
my running
hello
kevin
hi man


hdfs dfs -mkdir -p /usr/file/input

hdfs dfs -put ~/sparkdata.txt /usr/file/input
hdfs dfs -ls /usr/file/input


val file1 = sc.textFile("file:///root/sparkdata.txt")
val count1=file1.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)
count1.saveAsTextFile("hdfs://node1:8020/spark/output1")

val file=sc.textFile("hdfs://appcluster/usr/file/input/sparkdata.txt")
val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)
count.saveAsTextFile("hdfs://node1:8020/spark/output")


hdfs dfs -ls /spark/output


hdfs dfs -cat /spark/output/part-00000

# stop已經啟動的進程

# ==================================================================node1
$SPARK_HOME/sbin/stop-slaves.sh

$SPARK_HOME/sbin/stop-master.sh

$HADOOP_HOME/sbin/stop-all.sh


# ==================================================================node1 node2 node3
# 停止 zookeeper
zkServer.sh stop


# ==================================================================node2
$HADOOP_HOME/sbin/yarn-daemon.sh stop resourcemanager
$HADOOP_HOME/sbin/hadoop-daemon.sh stop zkfc


# ==================================================================node1
$HADOOP_HOME/sbin/hadoop-daemon.sh stop zkfc



shutdown -h now
# 快照 spark

hadoop生態搭建（3節點）-10.spark配置

sla over doc you 環境變量添加 home usr count # https://www.scala-lang.org/download/2.12.4.html# ==============================================

hadoop生態搭建（3節點）-06.hbase配置

校驗 stc shutdown name daemon 配置環境 val main ica # http://archive.apache.org/dist/hbase/1.2.4/ # ==========================================

hadoop生態搭建（3節點）-07.hive配置

所有 chm path yarn 啟動 find extern ppc 修改 # http://archive.apache.org/dist/hive/hive-2.1.1/ # ==============================================

hadoop生態搭建（3節點）-01.基礎配置

網絡 restart sys top 基礎公鑰私鑰 script pro otp # 基礎配置# ==================================================================node1 vi /etc/host

hadoop生態搭建（3節點）-11.storm配置

zkCli.sh tmp 1.0 mysq spark 2-0 host 變量 mail # http://archive.apache.org/dist/storm/apache-storm-1.1.0/ # ===============================

hadoop生態搭建（3節點）-12.rabbitmq配置

sysctl stop 3.0 dfs use erl boot 限制 app # 安裝需要相關包# ==================================================================node1 node2 node3

hadoop生態搭建（3節點）-13.mongodb配置

# 13.mongodb配置_副本集_認證授權# ==================================================================安裝 mongodb tar -zxvf ~/mongodb-linux-x86_64-rhel70-3

hadoop生態搭建（3節點）-17.sqoop配置_單節點

# ==================================================================安裝 sqoop tar -zxvf ~/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz mv ~/sqoop-1.4.7.bin__had

hadoop-2.6.0.tar.gz的叢集搭建（3節點）（不含zookeeper叢集安裝）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言的程式設計，如paython或s

hadoop-2.6.0.tar.gz + spark-1.5.2-bin-hadoop2.6.tgz的叢集搭建（單節點）（Ubuntu系統）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言的程式設計，如paython

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz的叢集搭建（單節點）（CentOS系統）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言

Hadoop分散式叢集環境搭建（三節點）

一、安裝準備建立hadoop賬號更改ip 安裝Java 更改/etc/profile 配置環境變數 export $JAVA_HOME=/usr/java/jdk1.7.0_71 修改host檔案域名 172.16.133.149 hadoop101

Hadoop環境搭建（為分散式）

安裝前準備（centos）： 1）設定普通使用者以及設定sudo許可權----------- -----useadd hadoop -----passwd hadoop --[root]--visudo 2）關閉防火牆 ---- service iptables stop 3）設定主

Dubbo（一） zookeeper環境的搭建（單節點）

jdk的安裝下載Linux版本的jdk解壓，使用非root使用者，執行以下命令（記得授權：執行命令 visudo，進行配置許可權） vi /etc/profiel 新增如下資訊 #jdk1.7export JAVA_HOME=/home/lsq/soft/jdk

完全分散式Hadoop叢集的安裝搭建和配置（4節點）

Hadoop版本：hadoop-2.5.1-x64.tar.gz 學習參考了給力星http://www.powerxing.com/install-hadoop-cluster/的兩個節點的hadoo

HDFS環境搭建（單節點配置） hadoop叢集搭建（hdfs）

【參考文章】：hadoop叢集搭建（hdfs） 1. Hadoop下載　　官網下載地址：　　https://hadoop.apache.org/releases.html，進入官網根據自己需要下載具體的安裝包　　清華大學安裝包的映象檔案下載地址：　　https://mirrors.tuna.

10天Hadoop快速突擊（3）——開發MapReduce應用程式

開發MapReduce應用程式一、系統引數的配置1.通過API對相關元件的引數進行配置這些API被分成了一下幾個部分：org.apache.hadoop.conf：定義了系統引數的配置檔案處理APIorg.apache.hadoop.fs：定義了抽象的檔案系統APIorg.a

[Hadoop] CentOS7安裝Zookeeper-3.4.5-cdh5.7.0（單節點）

1. Zookeeper下載安裝我的環境使用的套件版本是cdh5.7，所以zookeeper也選擇對應的版本下載。下載解壓 [[email protected] software]$ wget http://archive.cloudera.com/c

hadoop-2.3.0-cdh5.1.0完全分散式搭建（基於centos）

注：本例使用root使用者搭建一、環境作業系統：CentOS 6.564位作業系統注：Hadoop2.0以上採用的是jdk環境是1.7,Linux自帶的jdk解除安裝掉，重新安裝

Hadoop學習筆記（3）－搭建Hadoop偽分散式

0.前言 1.配置core-site.xml檔案配置hadoop目錄下的etc/Hadoop/core-site.xml檔案。新增如下內容：官網上只配置了fs.defaultFS引數，這個引數是配置hdfs的url地址。配置好後就可

hadoop生態搭建（3節點）-10.spark配置

相關推薦