1. 程式人生 > >Hadoop實戰(1)_阿里雲搭建Hadoop2.x的偽分散式環境

Hadoop實戰(1)_阿里雲搭建Hadoop2.x的偽分散式環境

環境:阿里雲伺服器 CentOS 7 x86_64

安裝介質:jdk-7u75-linux-i586.tar.gz,hadoop-2.4.1.tar.gz

安裝jdk

tar -zxvf jdk-7u75-linux-i586.tar.gz

配置環境變數:

# vi .bash_profile

JAVA_HOME=/root/training/jdk1.7.0_75
export JAVA_HOME

PATH=$JAVA_HOME/bin:$PATH
export PATH

# source .bash_profile
# which java
# java -version

bug解決:64bit的作業系統,無法執行32bit的應用程式,需要安裝32bit的glibc庫。

-bash: /root/training/jdk1.7.0_75/bin/java: /lib/ld-linux.so.2: bad ELF interpreter: No such file or directory
# yum install glibc*.i686
# locate /lib/ld-linux.so.2
# rpm -qf /lib/ld-linux.so.2

安裝Hadoop

tar -zxvf hadoop-2.4.1.tar.gz

配置環境變數:

# vi .bash_profile
HADOOP_HOME=/root/training/hadoop-2.4.1 export HADOOP_HOME PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH export PATH # source .bash_profile

本地模式的配置

引數檔案 配置引數 參考值
hadoop-env.sh JAVA_HOME /root/training/jdk1.7.0_75
# vi hadoop-env.sh

export JAVA_HOME=/root/training/jdk1.7.0_75

修改hostname,/etc/hosts下的地址必須使用私有地址。

# vi /etc/hosts

192.168.1.107 izwz985sjvpoji48moqz01z

驗證mapreduce

# hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount ~/training/data/input/data.txt ~/training/data/output/
# more part-r-00000

偽分散式模式配置

引數檔案 配置引數 參考值 備註
hadoop-env.sh JAVA_HOME /root/training/jdk1.7.0_75 Java的home目錄
hdfs-site.xml dfs.replication 1 資料的冗餘度
core-site.xml fs.defaultFS hdfs://<hostname>:9000 namenode的IP地址和埠,9000是RPC通訊的埠
core-site.xml hadoop.tmp.dir /root/training/hadoop-2.4.1/tmp 如不修改預設為/tmp,設定的路徑必須事先存在
mapred-site.xml mapreduce.framework.name yarn 指定MR執行在yarn上
yarn-site.xml yarn.resourcemanager.hostname <hostname> 指定YARN的老大(ResourceManager)的地址
yarn-site.xml yarn.nodemanager.aux-services mapreduce_shuffle reducer獲取資料的方式

hdfs-site.xml

<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>

core-site.xml

<property>
    <name>fs.defaultFS</name>
    <value>hdfs://192.168.1.107:9000</value>
</property>
<property>
    <name>hadoop.tmp.dir</name>
    <value>/root/training/hadoop-2.4.1/tmp</value>
</property>

mapred-site.xml,cp mapred-site.xml.template mapred-site.xml

<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

yarn-site.xml

<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>192.168.1.107</value>
</property>
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

驗證HDFS和mapreduce

# cd ~/trainging
# ls hadoop-2.4.1/tmp/
# hdfs namenode -format
# start-all.sh
# jps
5828 NodeManager
6284 Jps
5438 SecondaryNameNode
5288 DataNode
5579 ResourceManager
5172 NameNode
# hdfs dfsadmin -report
# hdfs dfs -mkdir /input
# hdfs dfs -put data/input/data.txt /input/data.txt
# hdfs dfs -lsr /
# hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /input/data.txt /output
# hdfs dfs -cat /output/part-r-00000
# stop-all.sh
# jps

配置Hadoop的SSH免密碼登入

Server A Server B
1、生成A的金鑰和公鑰ssh-keygen -t rsa -
2、將A的公鑰 –> B,ssh-copy -i –> B 3、 得到Server A的公鑰
- 4、隨機產生一個字串:helloworld
- 5、使用A的公鑰進行加密:*
- 6、將加密後的字串*發給A
7、得到B發來的加密字串 -
8、使用私鑰進行解密 –> helloworld -
9、將解密後的helloworld發給B 10、得到A發來的解密後的字串helloworld
- 11、對比step4和step10這兩個字串,一樣則Server B允許Server A免密碼登入到Server B
# cd ~
# ls .ssh/
hnown_hosts
# ssh-keygen -t rsa
# ssh-copy-id -i .ssh/id_rsa.pub [email protected]
# more .ssh/authorized_keys

微信公眾號「資料分析」,分享資料科學家的自我修養,既然遇見,不如一起成長。
資料分析

相關推薦

Hadoop實戰1_阿里搭建Hadoop2.x分散式環境

環境:阿里雲伺服器 CentOS 7 x86_64 安裝介質:jdk-7u75-linux-i586.tar.gz,hadoop-2.4.1.tar.gz 安裝jdk tar -zxvf jdk-7u75-linux-i586.tar.gz 配置

阿里學生伺服器搭建網站1-購買阿里學生伺服器

(1)建立阿里雲賬號,完成實名認證和學生認證 (2)登入阿里雲賬號,點選進入“雲翼計劃”購買學生伺服器(阿里雲翼計劃) 我的目的是購買一個用於PHP網站開發的伺服器,選擇的伺服器配置是:Ubuntu 16.04 64位系統。 預設的系統的登入賬號是 root,沒有登

深度學習之PyTorch實戰1——基礎學習及搭建環境

  最近在學習PyTorch框架,買了一本《深度學習之PyTorch實戰計算機視覺》,從學習開始,小編會整理學習筆記,並部落格記錄,希望自己好好學完這本書,最後能熟練應用此框架。   PyTorch是美國網際網路巨頭Facebook在深度學習框架Torch的基礎上使用Python重寫的一個全新的深度學習框架,

Hadoop實戰 在VMWare上搭建centos虛擬機器叢集

一、VMware的下載和安裝 下載VMware 安裝VMware:一路Next即可 二、centos的下載和安裝 下載centos 安裝三個centos 64位虛擬機器(master slave1 slave2)   在搭建Hadoop時,master將會作為namenod

kubernetes學習筆記 阿里遊戲業務實戰

本人一直做業務開發,不曾瞭解過運維知識,因為要對一個專案的技術部分負責,開發業務的同時還需要思考系統層面的事情,團隊人數又少,不得不採用k8s這種能達到事半功倍效果的工具。本文是在阿里雲kubernetes部署遊戲業務的實戰筆記,不涉及k8s原理等深層知識。我學習k8s的時間也比較短,如有理解錯誤的地方,還望

第6章 靜態路由和動態路由1_靜態路由

align 將在 跟蹤 添加 測試 字母 ppp協議 必須 缺少 1. 路由——網絡層實現的功能 1.1 路由功能 (1)網絡層的功能:給傳輸層協議提供簡單靈活的、無連接的、盡最大努力交付的數據包服務。 (2)路由器為每一個數據包單獨地選擇轉發路徑,網絡層並不提供服務質量的

第11章 拾遺4:IPv6和IPv4共存技術1_雙棧技術和6to4隧道技術

說明 images 測試結果 ges conf alt style dns服務 數據 6. IPv6和IPv4共存技術 6.1 雙棧技術 (1)雙協議主機的協議結構 (2)雙協議棧示意圖   ①雙協議主機在通信時首先通過支持雙協議的DNS服務器查詢與目的主機名對應的

第6課 列表初始化1_統一初始化

nio 概念 基類 class 臨時對象 clas 靜態 logs char 1. 統一初始化(Uniform Initialization) (1)在C++11之前,很多程序員特別是初學者對如何初始化一個變化或對象的問題很容易出現困惑。因為可以用小括號、大括號或賦值操作符

ceph分布式存儲實戰1——ceph集群測試主機規劃

monit dep release host eas rst 存儲 實戰 hostname 主機規劃節點磁盤(4塊)網卡(2塊)mem/cpuOSHostName節點1os-ceph-node1/10G私Eth0:dhcp1G/1CentOS Linux release

Hadoop學習1

分布 ont zookeepe str 過程 pac 穩定版 進行 動態 什麽是Hadoop? hadoop是Apache 開源發布的分布式系統基礎架構。它實現了分布式文件系統(hadoop Distributed File System,HDFS),分布式系統是運行在多個

三、Java基礎工具1_常用類——用戶和程序交互

size 數據 輸入 方法 main方法 main scanner類 style 輸入數據 2018-05-12 用戶和程序交互 程序接受用戶的輸入數據,有以下三種方式 一、main方法接受參數 二、Console 三、Scanner類 三、Java基

三、Java基礎工具1_常用類——數學相關類

ref .com 工具 www 小數 spa -- 指數 target 2018-05-13 數學相關類 一、Math類    Java 的 Math 包含了用於執行基本數學運算的屬性和方法,如初等指數、對數、平方根和三角函數。   Math 的方法都被定義為 s

三、Java基礎工具1_常用類——日期類

for 我們 size CA calendar 大量 col -- bsp 2018-05-14 日期類 一、Date類   講java.util.Date,類 Date 表示特定的瞬間,精確到毫秒。   Date類中大量方法讀已經過時,過時不代表不存在,依然可以

Spring實戰1

手動 之前 ava singleton 標簽 測試 之間 解決 業務邏輯 本博客是參考Spring實戰第四版,對其中重要的知識點進行總結。 Spring是如何簡化java開發的? 答:(1)基於POJO的輕量級和最小侵入性編程;(2)通過依賴註入和面向接口來松耦合;

靈活強大的MySQL代理中間件ProxySQL應用實戰1

sys www 流量 均可 rpm -ivh 硬盤 代理 發的 table 一、常見的Mysql中間件介紹 很多人都會把中間件認為是讀寫分離,其實讀寫分離只是中間件可以提供的一種功能,最主要的功能還是在於他可以分庫分表。下面介紹下常見的開源mysql中間件。 DBProx

ServiceComb實戰 1org.springframework.web.HttpMediaTypeNotSupportedException

一、異常現象: @Override @PostMapping(path = "logon") public ResponseEntity<Boolean> logon(@RequestBody UserDTO user) { if (validateUs

springboot實戰1springboot基本配置

1 入口類和@SpringBootApplication package com.wuk.springbootHello; import org.springframework.boot.SpringApplication; import org.springframework.b

第7章 網路層協議1_網路層首部

1. 網路層首部 1.1 網路層協議 (1)TCP/IP協議棧網路層的4個協議:IP協議、ICMP協議、IGMP協議和ARP協議。 (2)IP協議:動態路上協議的統稱,包括RIP和OSPF協議。 (3)TCP/IP協議分成四層:應用層定義了客戶端和伺服器通訊規範,傳輸層實現可靠

第9章 應用層1_域名系統DNS

1. 域名系統DNS 1.1 主機名和域名的關係 (1)完全限定域名(Fully Qualified Domain Name, FQDN) = 主機名 + 域名   ①一個域名下可以有多個伺服器/主機(如上圖中有3臺伺服器/主機)。   ②主機名更多的代表一個服務或應用,它物理

第11章 拾遺5:IPv6和IPv4共存技術1_雙棧技術和6to4隧道技術

6. IPv6和IPv4共存技術 6.1 雙棧技術 (1)雙協議主機的協議結構 (2)雙協議棧示意圖   ①雙協議主機在通訊時首先通過支援雙協議的DNS伺服器查詢與目的主機名對應的IP地址。   ②再根據指定的IPv6或IPv4地址開始通訊。   ③Win2008