(轉) Hadoop1.2.1安裝

阿新 • • 發佈：2017-05-07

安裝目錄文件復制 reduce mat 數據保存 jdk1.7 mapreduce tput cat

環境：ubuntu13

使用的用戶為普通用戶。如：用戶ru

jdk安裝略

1、安裝ssh

(1)

Java代碼

sudo apt-get install openssh-server

(2)配置ssh面密碼登錄

Xml代碼

$ ssh-keygen -t dsa -P ‘‘ -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

2、下載安裝Hadoop

（1）下載hadoop-1.2.1-bin.tar.gz

（2）修改權限

如果擁有者不是ru:ru，使用

Xml代碼

chown ru:ru hadoop-1.2.1-bin.tar.gz

(3)解壓

ru用戶下

Java代碼

tar -zxvf hadoop-1.2.1-bin.tar.gz

（4）將解壓後的hadoop拷貝到安裝目錄

3、配置hadoop

配置文件在$HADOOP_HOME/conf下

(1)配置hadoop-env.sh，指定jdk的安裝路徑

Xml代碼

添加jdk路徑
# The java implementation to use. Required.
export JAVA_HOME=/home/ruge/soft/jdk1.7.0_45

（2）修改hadoop的核心配置文件core-site.xml，配置namenode的地址和端口

Xml代碼

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

Java代碼

這個還是很必要的，如果不配置臨時目錄，格式化hdfs是會在/tem目錄下創建臨時目錄但是tmp目錄重啟系統會清楚下面文件。這樣namenode就啟動不起來了

<property>
<name>hadoop.tmp.dir</name>
<value>/home/ruge/hadoop/hadooptmpdir</value>
<description>A base for other temporary directories.</description>
</property>

(3)修改hadoop的hdfs-site.xml，配置replication，即數據保存份數

Java代碼

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

（4）修改hadoop的mapred-site.xml，配置jobtracker的地址和端口

Java代碼

<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>

註：涉及到IP的地方如果是完全分布式集群，需要改成具體的IP

4、格式化hadoop的文件系統HDFS

Java代碼

bin/hadoop namenode -format

5、啟動hadoop

Java代碼

bin/start-all.sh

6、驗證hadoop是否啟動成功

NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/

7、使用wordcount計算單詞數

Java代碼

(1)新建hdfs目錄，不是實際的系統文件目錄，只能使用hadoop dfs -ls /XXX查看
hadoop dfs -mkdir /input
(2)將文件復制到新建的hdfs目錄
hadoop dfs -put ./*.sh /input/
（3）使用hadoop的wordcount計算單詞數
hadoop jar hadoop-examples-1.2.1.jar wordcount /input /output
註：input 和 output都是hdfs文件目錄。不同的是input是需要分析的目錄，outpu是存放結果的目錄，且自動生成，不能手動創建

第二部分，安裝hadoop集群：

1，準備2個服務器，分別為

機器名IP地址作用

hadoop.main192.168.1.102NameNode，JobTracker，DataNode，TaskTracker

hadoop.slave192.168.1.107DataNode，TaskTracker

註：2臺主機必須使用相同的用戶名運行hadoop

2，分別在這兩個主機上，按照單機版的安裝方法，安裝hadoop

3，在/etc/hostname中修改主機名

在/etc/hosts中配置主機名和IP地址度對應關系

分別在2臺主機中，運行以下命令：

ping hadoop.main

ping hadoop.slave

修改/etc/hosts添加master和slave的ip和主機名

4，將hadoop.main節點中的~/.ssh/id_rsa.pub文件拷貝到hadoop.slave節點的~/.ssh目錄下，然後在hadoop.slave的~/.ssh/目錄下運行：

cat ./id_rsa.pub >> authorized_keys

在hadoop.main節點中運行命令: ssh hadoop.slave

5, 修改2臺主機的core-site.xml，配置HDFS的地址和端口號

vi conf/core-site.xml

<name>fs.default.name</name>

<value>hdfs://hadoop.main:9000</value>

</property>

</configuration>

6,修改2臺主機的MapReduce的配置文件，配置的是JobTracker的地址和端口

vi conf/mapred-site.xml

<name>mapred.job.tracker</name>

<value>hadoop.main:9001</value>

</property>

</configuration>

7，修改2臺主機中的hadoop配置文件masters

hadoop.main

8，修改2臺主機中的hadoop配置文件slaves

hadoop.main

hadoop.slave

9，在haddop.main節點運行

bin/hadoop namenode -format

10,啟動hadoop

bin/start-all.sh

ps: datanode time configuration

<name>heartbeat.recheck.interval</name>

</property>

http://blog.csdn.net/hxpjava1/article/details/20214049

(轉) Hadoop1.2.1安裝

安裝目錄文件復制 reduce mat 數據保存 jdk1.7 mapreduce tput cat 環境：ubuntu13 使用的用戶為普通用戶。如：用戶ru jdk安裝略 1、安裝ssh (1) Java代碼 sudo apt-get install op

《深入理解大資料-大資料處理與編輯實踐》hadoop1.2.1安裝

【第一部分】《深入理解大資料》一書的原始碼【第二部分】安裝hadoop1.2.1安裝【1】安裝java程式 jdk-6u45-linux-i586-rpm.rar 解壓後為 jdk-6u45-linux-i586-rpm.bin 安裝執行 ./jdk-6u4

(轉)eclipse3.2.1及外掛安裝基礎教程

⑤啟動eclipse，這時預設啟動為中文介面，如果想啟動英文eclipse，只要新建一eclipse.exe快捷方式，快捷方式”屬性”==>“目標”中輸入D:/eclipse/eclipse.exe -nl "en_US" 即可（中文介面可以設定-nl "zh_CN"，繁體中文為-nl "zh_TW"）

基於hadoop1.2.1的hive偽分散式安裝

主要參考的這篇blog http://www.kankanews.com/ICkengine/archives/72851.shtml 使用的hive版本是hive-0.11.0-bin.tar.gz 作業系統是 ubuntu12.04 64位 1、下載

nagios客戶端之nrpe3.2.1安裝

init nagios插件源碼 load 啟動 files plugin ubunt tar.gz 1、刪除dpkg安裝的nrpedpkg -l | grep nrpedkpg -P nagios-nrpe-server 2、ubuntu下nrpe3.2.1安裝下載nr

[轉]webpack4.0.1安裝問題和webpack.config.js的配置變化

using ack LV rules 安裝 ont loader 問題 TP 本文轉自：https://blog.csdn.net/jiang7701037/article/details/79403637 The CLI moved into a separate pa

zabbix3.2.1安裝graphtrees插件

上下官網 apach zabbix3.2 nload 直接 aik alt 下載 https://blog.csdn.net/liang_baikai/article/details/53542317 graphtree介紹由於zabbix的圖像顯示一塊不太友好，圖像沒

在CDH上用外部Spark2.2.1安裝和配置 CarbonData

表示相關 iyu top arch slaves path 中央倉庫 tar -zcvf 在CDH上用外部Spark2.2.1 （hadoop free版本）standalone 模式安裝和配置 CarbonData ===================

Android Studio 3.2.1安裝問題解決辦法

由於公司設定代理伺服器，導致安卓工程一直停留在gradle中迴圈，解決辦法如下：修改兩個檔案，在目錄C:\Users\Administrator.20181015CSB\.gradle下： gradle.properties init.gradle 其中：【gradle.

elasticsearch 5.2.1安裝問題解答

1、啟動 elasticsearch 如出現異常 can not run elasticsearch as root 解決方法：建立ES 賬戶，修改資料夾檔案所屬使用者組 2、啟動異常：ERROR: bootstrap checks failed syst

不安裝msyql的情況下為php7.2.1安裝mysqli擴充套件

環境為新的阿里雲ECS雲主機，沒有事先編譯安裝mysql，也沒有事先yum安裝mysql。在編譯安裝php7.2.1完成後，發現mysqli擴充套件沒有安裝。解決辦法為進入到php7.2.1原始碼包( 實際路徑可能不同): cd /mnt/soft/php-7.2.1/ext

hadoop 1.2.1 安裝步驟偽分散式

最近在系統的學習hadoop 課程第一步是安裝hadoop1.x，具體安裝步驟如下：一、系統安裝本文使用centos6.5安裝，具體安裝步驟省略二、jdk安裝下載jdk1.7.0_51解壓，在環境中設定環境變數： vi /etc/profile,新增如下行： export JAVA_HOME=/u

Ambari 2.1安裝HDP2.3.2 之六、安裝部署HDP叢集詳細步驟

六、安裝部署HDP叢集瀏覽器訪問 http://master:8080，進入amabri登入頁面，使用者名稱：admin，密碼： admin 選擇 Launch Install Wizard: 1. Get started 給叢集起個名字

Hive 2.1 安裝

安裝Hive2.1 1. 準備工作：安裝JDK、Hadoop 2. 下載並解壓Hive，設定環境變數 HIVE_HOME、PATH 3. 設定Hadoop環境變數 ./hadoop fs -mkdir /tmp ./hadoop fs -mkdir /usr/hive/w

hive2.2.1安裝

1下載hive 安裝包 2hive_home/conf cp hive-default.xml.templatehive-site.xml 把所有模板都改成去掉template的配置檔案 3修改hive-env.sh export HIVE_CONF_DIR=/app

Amabri 2.1安裝HDP2.3.2 之一、HDP介紹

一、HDP （一）簡介 HDP全稱是Hortonworks Data Platform，是由一家美國大資料公司Hortonworks開發的企業級Hadoop平臺。 Hortonworks致力於幫助客戶利用Hadoop開源大資料平臺管理資料。HDP是完全

hive1.2.1安裝指南

Hive安裝指南該文件是建立在已經安裝好hadoop和jdk的基礎上，並且已經設定好HADOOP_HOME環境變數以及JAVA_HOME環境變數, 在hadoop機群的主節點（192.168.22.135）上安裝。 1 下載安裝包從htt

nutch2.2.1安裝部署

Enough has changed from Nutch 2.1 to Nutch 2.2 to warrant an update to the installation instructions. These instructions assume Ubuntu 12.04 and Java

Hive 1.2.1安裝部署

java.sql.SQLException: Unable to open a test connection to the given database. J

Hive 1.2.1 安裝測試

1 安裝MySQL 安裝伺服器： sudo apt-get install mysql-server (注意：期間需要設定root使用者的密碼喲) 安裝客戶端: sudo apt-get install mysql-client sud

(轉) Hadoop1.2.1安裝

相關推薦