大資料－hadoop　安裝 spark前奏

阿新 • • 發佈：2019-01-28

單節點安裝

開發Hadoop需要的基本軟體

vmware

vmware安裝ubuntu 12虛擬機器配置：

開啟root使用者：

sudo -s

sudo passwd root

詳細參考：

http://blog.csdn.net/flash8627/article/details/44729077

安裝vsftpd:

[email protected]:/usr/lib/java# apt-getinstall vsftpd

配置vsftpd.conf即可使用本機帳戶登陸

[email protected]:/usr/lib/java# cp/etc/vsftpd.conf /etc/vsftpd.conf.bak

詳細資訊網上很多，不多說了.

Java 1.7

上傳至伺服器後解壓，設定環境變數即可，環境變數具體引數如下：

[email protected]:/usr/lib/java# tar -zxvfjdk-7u80-linux-x64.tar.gz

[email protected]:/usr/lib/java# mv jdk1.7.0_80/usr/lib/java/jdk1.7

[email protected]:/usr/lib/java# vim/root/.bashrc

export JAVA_HOME=/usr/lib/java/jdk1.7

export JRE_HOME=${JAVA_HOME}/jre

exportCLASS_PATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:/usr/local/hadoop/hadoop-2.6.0/bin:$PATH

安裝ssh

設定ssh免密碼登陸

[email protected]:/usr/lib/java# ssh-keygen -trsa -P ""

Generating public/private rsa key pair.

Enter file in which to save the key(/root/.ssh/id_rsa):

Created directory '/root/.ssh'.

Your identification has been saved in/root/.ssh/id_rsa.

Your public key has been saved in/root/.ssh/id_rsa.pub.

The key fingerprint is:

d3:bb:1e:df:10:09:ed:62:78:43:66:9f:8f:6a:b0:[email protected]

The key's randomart image is:

+--[ RSA 2048]----+

| |

| . |

| = . |

| * + o |

| S * * |

| .+ + + |

| oo o . |

| . o= o |

| =E . . |

+-----------------+

[email protected]:/usr/lib/java# ls /root/.ssh/

id_rsa id_rsa.pub

[email protected]:/usr/lib/java# cat/root/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

[email protected]:/usr/lib/java# ls /root/.ssh/

authorized_keys id_rsa id_rsa.pub

安裝rsync

[email protected]:/usr/lib/java#apt-get install rsync

hadoop 2.6

解壓hadoop　

tar -zxvf /home/ftp/hadoop-2.6.0

配置hadoop-env.sh

cd /usr/local/hadoop/hadoop-2.6.0/etc/hadoop/

vim hadoop-env.sh

# export JAVA_HOME=${JAVA_HOME}

export JAVA_HOME=/usr/lib/java/jdk1.7

配置hadoop環境變數,檔案相對於使用者目錄下.bashrc

cat ~/.bashrc

export JAVA_HOME=/usr/lib/java/jdk1.7

export JRE_HOME=${JAVA_HOME}/jre

exportCLASS_PATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:/usr/local/hadoop/hadoop-2.6.0/bin:$PATH

驗證環境變數：hadoopversion

執行wordcount

mkdir input

[email protected]:/usr/local/hadoop/hadoop-2.6.0#cp README.txt input

[email protected]:/usr/local/hadoop/hadoop-2.6.0#hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcountinput output

[email protected]:/usr/local/hadoop/hadoop-2.6.0# cat output/*

配置Hadoop單機模式並執行Wordcount示例

主要涉及以下配置資訊：修改hadoop核心配置檔案core-site.xml,主要是配置hdfs的地址和埠號.修改hadoop中hdfs的配置檔案hdfs-site.xml,主要是配置replication.修改hadoop的MapReduce的配置檔案mapred-site.xml,主要是配置JobTracker的地址和埠．檔案所在的目錄：/usr/local/hadoop/hadoop-2.6.0/etc/hadoop

core-site.xml

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

</configuration>

vim hdfs-site.xml

<name>dfs.replication></name>

<value>/usr/local/hadoop/hdfs/name</value>

</property>

<value>/usr/local/hadoop/hdfs/data</value>

</property>

[email protected]:/usr/local/hadoop/hadoop-2.6.0/etc/hadoop#cp mapred-site.xml.template mapred-site.xml

[email protected]:/usr/local/hadoop/hadoop-2.6.0/etc/hadoop#vim mapred-site.xml

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

接下來進行namenode格式化：

hadoop namenode -format

第二次格式化需要輸入Y完成格式化過程

啟動hadoop:start-all.sh

[email protected]:/usr/local/hadoop/hadoop-2.6.0/etc/hadoop#../../sbin/start-all.sh

This script is Deprecated. Instead usestart-dfs.sh and start-yarn.sh

Starting namenodes on [localhost]

localhost: starting namenode, logging to/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-namenode-ubuntu.out

localhost: starting datanode, logging to/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-datanode-ubuntu.out

Starting secondary namenodes [0.0.0.0]

The authenticity of host '0.0.0.0(0.0.0.0)' can't be established.

ECDSA key fingerprint is81:a2:0b:4d:95:43:c7:3f:84:f1:a4:d4:24:30:53:bf.

Are you sure you want to continueconnecting (yes/no)? yes

0.0.0.0: Warning: Permanently added'0.0.0.0' (ECDSA) to the list of known hosts.

0.0.0.0: starting secondarynamenode,logging to /usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-secondarynamenode-ubuntu.out

starting yarn daemons

starting resourcemanager, logging to/usr/local/hadoop/hadoop-2.6.0/logs/yarn-root-resourcemanager-ubuntu.out

localhost: starting nodemanager, logging to/usr/local/hadoop/hadoop-2.6.0/logs/yarn-root-nodemanager-ubuntu.out

檢視hadoop執行程序jps

[email protected]:/usr/local/hadoop/hadoop-2.6.0/etc/hadoop#jps

4300 NodeManager

4085 ResourceManager

4510 Jps

3951 SecondaryNameNode

3652 DataNode

3443 NameNode

叢集監控檢視：

http://localhost:50070/dfshealth.jsp

或用新的UI: http://192.168.222.143:50070/dfshealth.html#tab-overview

在hdfs上建目錄：

hadoop fs -mkdir /input

上傳檔案：

hadoop fs -copyFromLocal /usr/local/hadoop/hadoop-2.6.0/etc/hadoop/* /input

至此偽叢集完成．

如有需要可進QQ群[大資料交流 208881891]詢問.

叢集安裝

1./etc/hostname修改主機名並在/etc/hosts中配置主機名和IP的對映關係

主要修改主機名：/etc/hostname

配置對映關係：/etc/hosts

192.168.222.143 Master

192.168.222.144 Slave1

192.168.222.145 Slave2

配置ssh無密碼登陸ssh-keygen -t rsa -P ""

scp id_rsa.pub Slave1:/root/.ssh/Master.pub 遠端拷貝　　

cat id_rsa.pub >>authorized_keys

修改hadoop配置：

把先前的localhost改成Master

具體配置如下：

core-site.xml

<name>fs.default.name</name>

<value>hdfs://Master:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/hadoop-2.6.0/tmp</value>

</property>

</configuration>

hdfs-site.xml

<name>dfs.replication></name>

</property>

<value>/usr/local/hadoop/hdfs/name</value>

</property>

<value>/usr/local/hadoop/hdfs/data</value>

</property>

mapred-site.xml

<name>mapred.job.tracker</name>

<value>Master:9001</value>

</property>

slaves

Master

Slave1

Slave2

將java和hadoop拷貝到遠端節點：

[email protected]:/usr/lib/java#

scp -r jdk1.7 Slave1:/usr/lib/java/

scp -r hadoop-2.6.0 Slave1:/usr/local/hadoop/

拷貝完成後修改slave的環境配置

export JAVA_HOME=/usr/lib/java/jdk1.7

export JRE_HOME=${JAVA_HOME}/jre

export CLASS_PATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:/usr/local/hadoop/hadoop-2.6.0/bin:$PATH

先清理hdfs/name和data, tmp目錄

格式化叢集：hadoop namenode -format

啟動叢集：

[email protected]:/usr/local/hadoop/hadoop-2.6.0/sbin# ./start-all.sh

Thisscript is Deprecated. Instead use start-dfs.sh and start-yarn.sh

Startingnamenodes on [Master]

Theauthenticity of host 'master (192.168.222.143)' can't be established.

ECDSAkey fingerprint is 81:a2:0b:4d:95:43:c7:3f:84:f1:a4:d4:24:30:53:bf.

Areyou sure you want to continue connecting (yes/no)? yes

Master:Warning: Permanently added 'master,192.168.222.143' (ECDSA) to the list ofknown hosts.

Master:starting namenode, logging to/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-namenode-Master.out

Master:starting datanode, logging to /usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-datanode-Master.out

Slave2:starting datanode, logging to/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-datanode-Slave2.out

Slave1:starting datanode, logging to/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-datanode-Slave1.out

Startingsecondary namenodes [0.0.0.0]

0.0.0.0:starting secondarynamenode, logging to/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-root-secondarynamenode-Master.out

startingyarn daemons

startingresourcemanager, logging to /usr/local/hadoop/hadoop-2.6.0/logs/yarn-root-resourcemanager-Master.out

Slave1:starting nodemanager, logging to/usr/local/hadoop/hadoop-2.6.0/logs/yarn-root-nodemanager-Slave1.out

Master:starting nodemanager, logging to/usr/local/hadoop/hadoop-2.6.0/logs/yarn-root-nodemanager-Master.out

Slave2:starting nodemanager, logging to/usr/local/hadoop/hadoop-2.6.0/logs/yarn-root-nodemanager-Slave2.out

[email protected]:/usr/local/hadoop/hadoop-2.6.0/sbin# jps

2912 DataNode

3182 SecondaryNameNode

3557 NodeManager

3855 Jps

3342 ResourceManager

2699 NameNode

[email protected]:/usr/local/hadoop/hadoop-2.6.0/sbin# hadoop dfsadmin-report

DEPRECATED: Use of this script toexecute hdfs command is deprecated.

Instead use the hdfs command for it.

Configured Capacity: 56254304256(52.39 GB)

Present Capacity: 48346591232 (45.03GB)

DFS Remaining: 48346517504 (45.03 GB)

DFS Used: 73728 (72 KB)

DFS Used%: 0.00%

Under replicated blocks: 0

Blocks with corrupt replicas: 0

Missing blocks: 0

-------------------------------------------------

Live datanodes (3):

Name: 192.168.222.143:50010 (Master)

Hostname: Master

Decommission Status : Normal

Configured Capacity: 18751434752(17.46 GB)

DFS Used: 24576 (24 KB)

Non DFS Used: 2651889664 (2.47 GB)

DFS Remaining: 16099520512 (14.99 GB)

DFS Used%: 0.00%

DFS Remaining%: 85.86%

Configured Cache Capacity: 0 (0 B)

Cache Used: 0 (0 B)

Cache Remaining: 0 (0 B)

Cache Used%: 100.00%

Cache Remaining%: 0.00%

Xceivers: 1

Last contact: Sat Jun 11 10:51:41 CST2016

Name: 192.168.222.144:50010 (Slave1)

Hostname: Slave1

Decommission Status : Normal

Configured Capacity: 18751434752(17.46 GB)

DFS Used: 24576 (24 KB)

Non DFS Used: 2653249536 (2.47 GB)

DFS Remaining: 16098160640 (14.99 GB)

DFS Used%: 0.00%

DFS Remaining%: 85.85%

Configured Cache Capacity: 0 (0 B)

Cache Used: 0 (0 B)

Cache Remaining: 0 (0 B)

Cache Used%: 100.00%

Cache Remaining%: 0.00%

Xceivers: 1

Last contact: Sat Jun 11 10:51:41 CST2016

Name: 192.168.222.145:50010 (Slave2)

Hostname: Slave2

Decommission Status : Normal

Configured Capacity: 18751434752(17.46 GB)

DFS Used: 24576 (24 KB)

Non DFS Used: 2602573824 (2.42 GB)

DFS Remaining: 16148836352 (15.04 GB)

DFS Used%: 0.00%

DFS Remaining%: 86.12%

Configured Cache Capacity: 0 (0 B)

Cache Used: 0 (0 B)

Cache Remaining: 0 (0 B)

Cache Used%: 100.00%

Cache Remaining%: 0.00%

Xceivers: 1

Last contact: Sat Jun 11 10:51:42 CST 2016

[email protected]:/usr/local/hadoop/hadoop-2.6.0/sbin#./stop-all.sh

This script is Deprecated. Insteaduse stop-dfs.sh and stop-yarn.sh

Stopping namenodes on [Master]

Master: stopping namenode

Master: stopping datanode

Slave1: stopping datanode

Slave2: stopping datanode

Stopping secondary namenodes[0.0.0.0]

0.0.0.0: stopping secondarynamenode

stopping yarn daemons

stopping resourcemanager

Slave1: stopping nodemanager

Master: stopping nodemanager

Slave2: stopping nodemanager

Slave1: nodemanager did not stopgracefully after 5 seconds: killing with kill -9

Slave2: nodemanager did not stopgracefully after 5 seconds: killing with kill -9

no proxyserver to stop

下一篇：在此基礎上　spark叢集搭建　　

啥情況都可以進群討論．

QQ群：大資料交流 208881891

大資料－hadoop　安裝 spark前奏

配置Hadoop單機模式並執行Wordcount示例

大資料－hadoop　安裝 spark前奏

學習筆記:從0開始學習大資料-2.hadoop安裝

docker部署分散式大資料叢集hadoop、spark、hive、jdk、scala、

大資料之hadoop對比spark------資料儲存

首頁 Hadoop Spark Hive Kafka Flume 大資料平臺 Kylin 專題文章 Spark運算元一起學Hive Hive儲存過程 Hive分析函式 Spark On Yarn 資料

大資料入門Hadoop安裝

【大資料】Hadoop初上陣（安裝真是坑坑坑）

大資料，hadoop,spark,hive,ZooKeeper,kafka,flume等元件環境搭建

hadoop大資料04---hive 的安裝配置

大資料之hadoop單機版虛擬機器Vmware安裝教程

【大資料】CentOS6.5安裝mysql5.6(靠譜！)

大資料學習之路106-spark streaming統計結果寫入mysql

R語言大資料分析工具的安裝與應用

大資料之Hadoop學習（環境配置）——Hadoop偽分散式叢集搭建

大資料環境---hbase的安裝

資料分析師眼中的大資料和Hadoop

大資料： Hadoop reduce階段

大資料平臺--Hadoop原生搭建教程

大資料基礎Hadoop 2.x入門

ambari大資料平臺搭建的安裝（全）

大資料－hadoop 安裝 spark前奏

配置Hadoop單機模式並執行Wordcount示例

相關推薦

大資料－hadoop　安裝 spark前奏