1. 程式人生 > >Ubuntu中的Hadoop

Ubuntu中的Hadoop

Hadoop下載

Apache官網下載地址:http://hadoop.apache.org/releases.html

選binary

Hadoop安裝

1.通過windows掛載硬碟將檔案複製到Linux下。

2.然後解壓Hadoop:tar -xvzf  hadoop.tar.gz

3.配置Hadoop系統引數:

sudo nano /etc/environment

內容如下:例

JAVA_HOME=/usr/soft/jdk1.8.0_151
HADOOP_INSTALL=/usr/soft/hadoop-3.0.0
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/usr/soft/jdk1.8.0_151/bin:/usr/soft/hadoop-3.0.0/bin:/usr/soft/hadoop-3.0.0/sbin"

4.快速更新

source environment

5.檢視版本

hadoop version


處理海量資料

1.儲存

分散式檔案系統:HDFS,Hadoop  distributed file system

2.運算

MapReduce,map() + reduce


Hadoop配置:

1.獨立模式


2.偽分散式

ssh登陸遠端主機,無口令提示

sudo apt-get install shh

ssh-keygen  -t  rsa  -P  ''  -f   ~/.ssh/id_rsa

cat  id_rsa.pub  >>  ~/.ssh/authorized_keys

ssh localhost //第一次yes

exit

ssh  localhost //第二次不需要口令

3.完全分散式


Hadoop使用:

參考:http://hadoop.apache.org/docs/r1.0.4/cn/cluster_setup.html