Hadoop2.7.2 HBase2.0.0環境搭建

阿新 • • 發佈：2018-11-15

叢集配置

HBase – Hadoop Database，是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化儲存叢集。

一、基礎環境

JDK　　　：1.8.0_65 （要求1.6+）

ZooKeeper：3.4.10

Hadoop：2.7.2

HBase：2.0.0-alpha4

主機數：3（要求3+，且必須是奇數，因為ZooKeeper的選舉演算法）

伺服器列表：

主機名	IP地址	JDK	ZooKeeper	myid
Master	10.116.33.109	1.8.0_65	server.1	1
Slave1	10.27.185.72	1.8.0_65	server.2	2
slave2	10.25.203.67	1.8.0_65	server.3	3

二、zk、hadoop安裝

zk 安裝參考《

分散式ZooKeeper-3.4.10叢集安裝》 hadoop 安裝參考《 spark-2.2.0 叢集安裝部署以及hadoop叢集部署》

三、HBase 安裝(HBase 自管理ZK)

下載解壓HBase檔案

cd /data/spark/
wget "http://archive.apache.org/dist/hbase/2.0.0-alpha4/hbase-2.0.0-alpha4-bin.tar.gz"
tar zxvf hbase-2.0.0-alpha4-bin.tar.gz

環境變數

vim ~/.bash_profile

export HBASE_HOME=/data/spark/hbase-2.0.0-alpha4 
export PATH=$HBASE_HOME/bin:$PATH  
export HBASE_CLASSPATH=/data/spark/hbase-2.0.0-alpha4/conf

執行 source ~/.bash_profile使環境變數生效

配置hbase-env.sh JAVA_HOME

export JAVA_HOME=/opt/jdk1.8.0_65 
export HBASE_MANAGES_ZK=true   使用自帶zookeeper

修改配置檔案hbase-site.xml

<configuration>  
    <property>  
        <name>hbase.rootdir</name>  
        <value>hdfs://Master:9000/hbase</value>  
    </property>  
    <property>  
        <name>hbase.cluster.distributed</name>  
        <value>true</value>  
    </property>  
    <property>  
        <name>hbase.zookeeper.quorum</name>  
        <value>Master,Slave1,Slave2</value>  
    </property>  
    <property>  
        <name>hbase.temp.dir</name>  
        <value>/data/spark/hbase-2.0.0-alpha4/tmp</value>  
    </property>  
    <property>  
        <name>hbase.zookeeper.property.dataDir</name>  
        <value>/data/spark/hbase-2.0.0-alpha4/tmp/zookeeper</value>  
    </property>  
    <property>  
        <name>hbase.master.info.port</name>  
        <value>60010</value>  
    </property>  
</configuration>

hbase.zookeeper.quorum 配置必須用IP，使用hostname會報錯，與MapReduce 衝突。

各個主機之間複製HBase

 scp -r /data/spark/hbase-2.0.0-alpha4 Slave1:/data/spark
 scp -r /data/spark/hbase-2.0.0-alpha4 Slave2:/data/spark

啟動HBase

啟動之前先啟動hadoop和zookeeper叢集
HBase只需在一個節點上執行啟動HBase命令，與Hadoop一樣

$HADOOP_HOME/sbin/start-all.sh
cd /data/spark/hbase-2.0.0-alpha4/bin
./start-hbase.sh

檢查hbase啟動情況

Slave 程序檢查

29541 NodeManager
30456 HQuorumPeer
29435 DataNode
30541 HRegionServer
30718 Jps

Master程序檢查

532 Jps
14278 NodeManager
18376 HMaster
18313 HQuorumPeer
14172 DataNode
18511 HRegionServer

HBase配置web介面
http://Maseter IP:60010/master-status
注意：HBase自管理ZK中，hosts檔案中有主機名對應的IP，否則會報錯。 zookeeper.ClientCnxn: Opening socket connection to server iZwz9evsidoafzcicmva9nZ/10.25.203.67:2181. Will not attempt to authenticate using SASL (unknown error)

匯入資料

hdsf dfs -put test_hbase.csv /lw6/test
hbase  org.apache.hadoop.hbase.mapreduce.ImportTsv  -Dimporttsv.separator="," -Dimporttsv.columns=HBASE_ROW_KEY,f1 t1 /lw6/test/test_hbase.csv -Dimporttsv.bulk.output=/lw6/test/output.txt

Import 工具主要是通過轉換為MapReduce 匯入HBase。注意：匯入過程中出現任務無法Running，yarn日誌顯示無法找到主機，主要是因為主機名未修改，只是配置節點名稱導致。

Hbase基本命令

參考：https://www.cnblogs.com/xiaolei2017/p/7245299.html

與資料庫一樣有DML、DDL操作，命令操作不一樣。

名稱	命令表示式
建立表	create '表名稱', '列名稱1','列名稱2','列名稱N'
新增記錄	put '表名稱', '行名稱', '列名稱:', '值'
檢視記錄	get '表名稱', '行名稱'
查看錶中的記錄總數	count '表名稱'
刪除記錄	delete '表名' ,'行名稱' , '列名稱'
刪除一張表	先要遮蔽該表，才能對該表進行刪除，第一步 disable '表名稱' 第二步 drop '表名稱'
檢視所有記錄	scan "表名稱"
檢視某個表某個列中所有資料	scan "表名稱" , ['列名稱:']
更新記錄	就是重寫一遍進行覆蓋

hadoop2.7.2 window win7 基礎環境搭建

hadoop環境搭建相對麻煩，需要安裝虛擬機器過著cygwin什麼的，所以通過查資料和摸索，在window上搭建了一個，不需要虛擬機器和cygwin依賴，相對簡便很多。下面執行步驟除了配置檔案有部分

Hadoop2.7.2 HBase2.0.0環境搭建

叢集配置 HBase – Hadoop Database，是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化儲存叢集。一、基礎環境 JDK　　　：1.8.0_65 （要求1

ubuntu 16.04搭建hadoop2.7.2(Vmware 12.0搭建完全分散式三臺虛擬機器)

此做法無實際意義，只是用來學習搭建過程和了解hadoop相關配置。版本：Ubuntu16.04 hadoop2.7.2（一臺電腦開三臺虛擬機器完全分散式）主結點：192.168.150.112 Caxiongyu1 從結點：192.168.150.113 Caix

Hadoop2.7.2高可用(HA)環境下Hbase高可用(HA)環境的搭建（在Ubuntu14.04下以root使用者進行配置）

Hadoop2.7.2高可用(HA)環境下Hbase高可用(HA)環境的搭建轉載請註明出處：http://blog.csdn.net/qq_23181841/article/details/75095370 （在Ubuntu14.04下以root使用者進行配置）下載

Hadoop2.7.3單機偽分散式環境搭建

Hadoop2.7.3單機偽分散式環境搭建作者：家輝，日期：2018-07-10 CSDN部落格： http://blog.csdn.net/gobitan 說明：Hadoop測試環境經常搭建，這裡也做成一個模板並記錄下來。基礎環境

Spark之——Hadoop2.7.3+Spark2.1.0 完全分散式環境搭建全過程

一、修改hosts檔案在主節點，就是第一臺主機的命令列下;vim /etc/hosts我的是三臺雲主機：在原檔案的基礎上加上;ip1 master worker0 namenode ip2 worker1 datanode1 ip3 worker2 datanode2其中的i

Hadoop-0.20.2原始碼學習（2）——原始碼學習環境搭建

參考： JeffreyZhou的部落格園《Hadoop權威指南》第四版 0 本文前提在上一篇文章中，通過啟動指令碼xxx.sh檔案的探索，對hadoop的原始碼有了一個初步的認識，發現最終都是執行

3 webpack 4 加vue 2.0生產環境搭建

環境配置文件搭建 all pack cif vue pac title 1 在前兩篇筆記中已經能把開發環境弄好了，接來下構建他的生產環境 2 使用npm 安裝url-loader和file-loader來支持圖片和字體 npm install --save-dev

CentOS7+Hadoop2.7.2(HA高可用+Federation聯邦)+Hive1.2.1+Spark2.1.0 完全分散式叢集安裝

本文件主要記錄了Hadoop+Hive+Spark叢集安裝過程，並且對NameNode與ResourceManager進行了HA高可用配置，以及對NameNode的橫向擴充套件（Federation聯邦） 1VM網路配置將子網IP設定為192.168.1.0：將閘道器設定

OpenCV3.2.0+VS2017環境搭建

本人小白，初學影象處理，安裝OpenCV 1、下載並安裝VS2017 2、下載、安裝並配置OpenCV （1）下載連結（Windows版）：點選開啟連結（2）雙擊，會提示解壓到某個地方，比如： D:\Program Files，（因為OpenCV專案檔案打包的時候，根目錄

在VM虛擬機器上搭建Hadoop2.7.3+Spark2.1.0完全分散式叢集

1.選取三臺伺服器（CentOS系統64位） 114.55.246.88主節點　　114.55.246.77 從節點　　114.55.246.93 從節點之後的操作如果是用普通使用者操作的話也必須知道root使用者的密碼，因為有些操作是得

Hadoop2.7.5 +Spark2.3.0+Anaconda2-5.1.0分散式叢集搭建

這幾天因為學習需要搭建了一個由3個節點組成的hadoop和spark分散式叢集，做記錄如下（已生成目錄，可按需檢視）。叢集搭建環境及安裝軟體版本 centos6 jdk1.8.0_161 hadoop2.7.5 Spark2.3.0 Scala-2.11.8 An

hadoop2.9.0 hdfs環境搭建(偽分散式)

搭建hadoop2.9.0偽分散式步驟使用了centos7,jdk1.8,hadoop2.9.0 版本算是很新的了.沒有使用什麼古老的版本. 1. 檢視自帶的jdk,解除安裝centos中自帶的jdk 檢視: rpm -qa |grep java 解除安

Hadoop2.7.2+Hbase1.2.1分散式環境搭建整理

一.準備環境 1.1. 安裝包 1）準備4臺PC 2）安裝配置Linux系統：CentOS-7.0-1406-x86_64-DVD.iso 3）安裝配置Java環境：jdk-8u91-linux-x64.gz 4）安裝配置Hadoop：hadoop-2.7.2-x64.ta

VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

執行WordCount作業步驟：進入hadoop目錄，刪除input目錄和output目錄（如果有）；啟動hdfs系統，ResourceManager和NodeManager。 $cd /usr/hadoop-2.7.2 $sbin/start-dfs.sh $s

win10下ASP.NET Core 2.0部署環境搭建

此文用於記錄在win10環境下，新建的Asp.net Core 2.0 Web應用專案如何執行在IIS上一、執行環境作業系統: Window10 家庭中文版版本 10.0.15063 版本 15063 IDE: Visual Studio Community 20

hadoop2.7.2 win7 eclipse環境搭建測試

環境搭建參照上一篇hadoop2.7.2 win7基礎環境搭建。 Eclipse hadoop外掛下載2.7.2：http://download.csdn.net/detail/fly_leopard/9503172 將下載的檔案解壓，將jar包放到Eclipse/plug

Hadoop2.7.3+Spark2.1.0完全分散式叢集搭建過程

1.選取三臺伺服器（CentOS系統64位）　　114.55.246.88 主節點　　114.55.246.77 從節點　　114.55.246.93 從節點之後的操作如果是用普通使用者操作的話也必須知道root使用者的密碼，因為有些操作是得用root使用者操作。如

Hadoop-2.8.0 開發環境搭建（Mac）

Hadoop是一個由Apache基金會開發的分散式系統架構，簡稱HDFS，具有高容錯性、可伸縮性等特點，並且可以部署在低配置的硬體上；同時，提供了高吞吐量的資料訪問效能，適用於超大資料集的應用程式，以及通過叢集拓撲高效快速的處理資料的能力。本文主要介紹一下Hadoop的開

eclipse配置hadoop2.7.2開發環境

amt res project star ast text package fin super 　　先安裝並啟動hadoop，怎麽弄見上文http://www.cnblogs.com/wuxun1997/p/6847950.html。這裏說下怎麽設置IDE來開發hadoop

Hadoop2.7.2 HBase2.0.0環境搭建

叢集配置

二、zk、hadoop安裝

三、HBase 安裝(HBase 自管理ZK)

環境變數

修改配置檔案hbase-site.xml

各個主機之間複製HBase

啟動HBase

匯入資料

Hbase基本命令

相關推薦