1. 程式人生 > >Ambari搭建大資料平臺教程(HDP)

Ambari搭建大資料平臺教程(HDP)

搭建測試環境

本文是公司搭建測試環境大資料平臺時總結的,按安裝相應版本的官方文件的步驟翻譯過來的。其中遇到了一些問題,相應的解決方案也都一一列舉了。按照這個方式一定可以搭建成功。

  • 基本資訊:
系統:Ubuntu-14.04.1JDK版本:jdk-8u111SCALA版本:MySQL資料庫:
  • 各個伺服器的角色:
172.28.44.120:nn0172.28.44.121:dn0172.28.44.122:dn1一 配置網路環境(三臺機器分別配置):1 設定靜態ip/etc/network/interfaces配置靜態ip:auto eth0                  #設定自動啟動eth0介面iface eth0 inet static     #配置靜態IPaddress 172.28.44.120      #IP地址netmask 255.255.255.0      #子網掩碼gateway 172.28.44.254        #預設閘道器2 修改DNS/etc/resolvconf/resolv.conf.d/base配置nameservernameserver 172.25.9.10nameserver 172.26.9.103 重啟網路,使配置生效sudo /etc/init.d/networking restart4 用指令碼linux_logon.sh進行聯網認證sh linux_logon.sh需要的username和password是OA系統的使用者名稱和密碼。5 可以ping www.baidu.com驗證是否可以訪問外網。二 配置基礎環境(三臺機器分別配置):1 配置ssh免密碼登入
  • 生成ssh-key
ssh-keygen
  • 將namenode的id_rsa.pub新增到datenode的authorized_keys
分別在nn0、dn0、dn1的節點上執行ssh-copy-id -i id_rsa [email protected]
  • 測試免密碼登入
2 配置ntp事件同步服務
  • 安裝ntp
apt-get install ntp
  • 執行ntp服務
update-rc.d ntp defaults3 檢查DNS和NSCD
  • 修改hosts檔案,新增一下內容
vim /etc/hosts 172.28.44.120 nn0.bigo.baina172.28.44.121 dn0.bigo.baina172.28.44.122 dn1.bigo.baina
  • 設定hostname
vim /etc/hostname` nn0:nn0.bigo.baina dn0:dn0.bigo.baina dn1:dn1.bigo.baina
  • 重啟生效
4 關閉防火牆依次執行一下命令sudo ufw disablesudo iptables -Xsudo iptables -t nat -Fsudo iptables -t nat -Xsudo iptables -t mangle -Fsudo iptables -t mangle -Xsudo iptables -P INPUT ACCEPTsudo iptables -P FORWARD ACCEPTsudo iptables -P OUTPUT ACCEPT5 關閉SELINUXsetenforce 06 安裝配置資料庫MySQL 5.6
GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root' WITH GRANT OPTION;FLUSH PRIVILEGES;
  • 修改mysql編碼方式
vim /etc/mysql/my.cnf
  • 在[client]下追加 default-character-set = utf8 
  • 在[mysqld]下追加 character-set-server=utf8 
  • 在[mysql]下追加 default-character-set=utf8 
  • 重啟,登入mysql,採用status校驗編碼是否生效
  • 預先建立Ambari需要依賴的資料庫,建立相關使用者
(1) 在Ambari Server host安裝connector
  • 安裝connector
apt-get install libmysql-java
  • 確保mysql-connector-java.jar在/usr/share/java/目錄下
  • 確保mysql-connector-java.jar有644的許可權
(2) 為Ambri建立一個使用者,並賦許可權# mysql -u root -pCREATE USER '<AMBARIUSER>'@'%' IDENTIFIED BY '<AMBARIPASSWORD>';GRANT ALL PRIVILEGES ON *.* TO '<AMBARIUSER>'@'%';CREATE USER '<AMBARIUSER>'@'localhost' IDENTIFIED BY '<AMBARIPASSWORD>';GRANT ALL PRIVILEGES ON *.* TO '<AMBARIUSER>'@'localhost';CREATE USER '<AMBARIUSER>'@'<AMBARISERVERFQDN>' IDENTIFIED BY '<AMBARIPASSWORD>';GRANT ALL PRIVILEGES ON *.* TO '<AMBARIUSER>'@'<AMBARISERVERFQDN>';FLUSH PRIVILEGES;* AMBARIUSER是Ambari使用者名稱,AMBARIPASSWORD是Ambari使用者密碼,AMBARISERVERFQDN是Ambari服務主機對應的域名。(3) 載入Ambri資料庫schemamysql -u <AMBARIUSER> -pCREATE DATABASE <AMBARIDATABASE>;USE <AMBARIDATABASE>;SOURCE /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql;
  • 預先建立hive需要依賴的資料庫,建立相關使用者
(1) 在Ambari Server host安裝connector(之前有操作過,可以省略)* 需要執行一下命令初始化JDBC Driver:ambari-server setup --jdbc-db=mysql --jdbc-driver=/usr/share/java/mysql-connector-java.jar(2) 建立hive資料庫CREATE DATABASE hive;
  • 預先建立oozie需要依賴的資料庫,建立相關使用者
(1) 在Ambari Server host安裝connector(之前有操作過,可以省略)(2) 建立oozie資料庫三 配置本地源(只需要在主節點上配置即可,nn0)1 準備配置本地源
  • 建立HTTP伺服器
    • 安裝Apache httpd
    • 啟動httpd
  • 在nn0為web伺服器建立目錄
    • mkdir -p /var/www/html/
三 安裝Ambri1 下載,安裝Ambari
  • 用root使用者登入
  • 下載package
    • wget -nv http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.2.18-1/ambari.list -O /etc/apt/sources.list.d/ambari.list
    • apt-key adv --recv-keys --keyserver keyserver.ubuntu.com B9733A7A07513CAD
    • apt-get update
  • 確認name list裡面的package是否都下載成功,如果下載成功可以看到版本號
    • apt-cache showpkg ambari-server
    • apt-cache showpkg ambari-agent
    • apt-cache showpkg ambari-metrics-assembly
  • 安裝Ambari,會預設安裝PostgreSQL Ambari database
    • apt-get install ambari-server
  • 執行配置程式。
ambari-server setup
  • 如果沒有關閉SELinux,會收到提示,輸入“y”。
  • Customize user account for ambari-server daemon,輸入root使用者。
  • 如果沒有關閉防火牆,也會收到提示,輸入“y”。
  • 選擇下載Oracle JDK 1.8,接收Oracle的協議。
  • 選擇“y”,再選擇3:MySQL,使用我們提前安裝好的Mysql資料庫
(1) 輸入Hostname (localhost)。(2) 輸入Port (3306)。(3) 輸入Database name (ambari)。(4) 輸入Username (ambari)。(5) 輸入Database Password (******)。(6) 重複輸入Password。(7) 此時會有一個警告:WARNING: Before starting Ambari Server, you must run the following DDL against the database to create the schema: /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql。(8) 我們已經執行過load過schema,選擇“y”即可安裝成功。3 啟動Ambari Server
  • 啟動命令
ambari-server start
  • 檢查狀態的命令
ambari-server status
  • 停止命令
ambari-server stop* 如果之後需要安裝的hive和oozie需要依賴自己安裝的MySQL資料庫,需要事先建立hive和oozie相關的資料庫,建立使用者,賦許可權。四 安裝、配置、部署HDP叢集1 登入Apache Ambari叢集
  • 使用Ambari伺服器的host登入Ambari介面
  • 使用者名稱:admin 密碼:admin

2 選擇Lunch Install Wizard
3 給叢集命名4 選擇HDP版本
5 配置hosts和Private Key
  • 如果需要程式自動安裝Ambari Angent,選擇Provide your SSH Private Key to automatically register hosts;如果需要手動安裝Ambari Angent,選擇Perform manual registration on hosts and do not use SSH。
  • 如果選擇了Provide your SSH Private Key to automatically register hosts,需要新增id_rsa私鑰,或者複製進text輸入框。
  • 輸入ssh-key對應的使用者名稱。
  • 註冊和確認。

6 確認hosts校驗hosts

7 選擇需要安裝的服務
8 指派Master
9 指派Slaves和clients
10 定製服務
11 預覽

12 安裝、啟動、測試* 由於在預先安裝MySQL資料庫的時候,安裝過mysql-connector-java,和ambari預設的版本有衝突,導致安裝Ooize失敗。錯誤日誌:Preparing to unpack .../mysql-connector-java_5.1.37-2_all.deb ...Unpacking mysql-connector-java (5.1.37-2) ...dpkg: error processing archive /var/cache/apt/archives/mysql-connector-java_5.1.37-2_all.deb (--unpack): trying to overwrite '/usr/share/java/mysql-connector-java.jar', which is also in package libmysql-java 5.1.28-1Errors were encountered while processing: /var/cache/apt/archives/mysql-connector-java_5.1.37-2_all.debE: Sub-process /usr/bin/dpkg returned an error code (1) * 解決方案:手動解除安裝之前安裝的mysql-connector-java即可。apt-get remove libmysql-java


13 完成
14 管理介面
參考連結:https://docs.hortonworks.com/HDPDocuments/Ambari-2.6.1.0/bk_ambari-installation/content/enable_ntp_on_the_cluster_and_on_the_browser_host.html

相關推薦

Ambari搭建資料平臺教程HDP

搭建測試環境本文是公司搭建測試環境大資料平臺時總結的,按安裝相應版本的官方文件的步驟翻譯過來的。其中遇到了一些問題,相應的解決方案也都一一列舉了。按照這個方式一定可以搭建成功。基本資訊:系統:Ubuntu-14.04.1JDK版本:jdk-8u111SCALA版本:MySQ

CM+CDH構建企業資料平臺系列

問題導讀:1、CM是什麼?2、CDH是什麼?3、CM+CDH是什麼?4、什麼是企業大資料平臺?5、如何用CM+CDH構建企業大資料平臺?..........帶著種種疑問讓我們開啟真正的企業級大資料平臺搭建之旅。    隨著網際網路,尤其是移動網際網路和智慧移動裝置的高速發展和

CM+CDH構建企業資料平臺系列

一、克隆Linux虛擬機器    1、為什麼要克隆虛擬機器?    第一:我們要搭建分散式叢集,需要多臺虛擬機器    第二:我們不想像安裝第一臺虛擬機器那樣從頭到尾做多次重複的操作,既浪費時間又沒有什麼技術含量。    那麼怎麼辦呢?    所以我們就採用克隆的方式,你想要多少臺虛擬機器就克隆多少臺。但是我

Win10不需要Cygwin搭建資料測試環境4---Hive

系列文章 前言 這篇文章是系列文章中的第四篇,主要描述了win10系安裝Hive。 準備工作 1:完成第一篇教程,確保Hadoop正常執行。 2:下載Hive,我安裝的版本是apache-hive-2.1.1-bin。安裝路徑是D:\apach

CM+CDH構建企業資料平臺系列

安裝部署多臺Linux虛擬機器一、如何理解安裝部署多臺Linux虛擬機器   1、什麼是Linux虛擬機器?        虛擬機器簡單的你可以把它理解為虛擬的電腦,從功能角度來說,這個虛擬的電腦和真實的電腦幾乎完全一樣,只是說虛擬機器的硬碟是在一個檔案中虛擬出來的。這個簡單

阿里雲搭建資料平臺3:安裝JDK和Hadoop偽分佈環境

一、安裝jdk 1.解除安裝Linux自帶的JDK rpm -qa|grep jdk   #查詢原始JDK yum -y remove  <舊JDK> 2.解壓縮 tar -zxvf /opt/softwares/jdk-8u151-linux-x64.t

從零開始搭建資料平臺系列之0——目錄彙總

寫在前面 看了許多別人寫的技術系列博文,也想把自己所學系統歸納一下,正好現在打算從零開始搭建一個大資料平臺,就把自己的所學所獲系統整理一下,寫成從零開始搭建大資料平臺系列,歡迎轉載。 以下是本系列博文的目錄。 目錄 6.  Oozie 平臺搭建    

從零開始搭建資料平臺系列之1——環境準備

1、機器準備 (1)物理機配置 處理器:Intel® Core™ i7 處理器 記憶體:8.00GB 系統型別:64 位作業系統,基於 x64 的處理器 作業系統:Windows 10 專業版 (2)磁碟陣列 常用磁碟陣列型別:RAID 0,RAID 1,RAI

從零開始搭建資料平臺系列之2.1—— Apache Hadoop 2.x 偽分散式環境搭建

JDK 版本:jdk 1.7.0_67 Apache Hadoop 版本:Hadoop 2.5.0 1、安裝目錄準備 ~]$ cd /opt/ opt]$ sudo mkdir /opt/modules opt]$ sudo chown beifeng:b

關於在真實物理機器上用cloudermanger或ambari搭建資料叢集注意事項總結、經驗和感悟心得圖文詳解

寫在前面的話   (1) 最近一段時間,因擔任我團隊實驗室的大資料環境叢集真實物理機器工作,至此,本人秉持負責、認真和細心的態度,先分別在虛擬機器上模擬搭建ambari(基於CentOS6.5版本)和cloudermanager(基於CentOS6.5或Ubuntu14.04版本)。   (2)  大

使用docker搭建資料平臺

我們以Ambari+HDP為例。儘管說運維堅決不同意在docker上執行大資料元件,但是我覺得,作為測試和學習目的在本地快速構建大資料叢集仍然是一件非常有意義的事情。 如果我們想採取Ambari來安裝HDP的話,其包含的主要元件如下 ambari-server: 主要部署的控

D001.5 Docker搭建資料叢集環境基礎篇

0x00 教程內容 0x01 Docker的安裝 1. 2. 3. 0x02 Docker的簡單操作 1. 2. 3. 0x03 Docker資料卷 Docker的資料卷與Centos的

【Redhat7.3】在區域網內安裝ambari,通過ambari安裝資料平臺

      以下是文章目錄: 前提條件 4 修改機器的hostname 5 修改主機名 6 配置所有節點 8 在hosts中新增其他機器資訊 8 檢查配置是否生效 9 關閉所有節點防火牆 10

搭建資料處理叢集Hadoop,Spark,Hbase

搭建Hadoop叢集 配置每臺機器的 /etc/hosts保證每臺機器之間可以互訪。 120.94.158.190 master 120.94.158.191 secondMaster 1、建立hadoop使用者 先建立had

CM+CDH構建企業資料平臺系列十二

完整視訊+圖文資料獲取及技術答疑請加:大講臺大資料研習社⑦ :695520445                            搭建時間伺服器並配置叢集自動時鐘同步一、搭建時間伺服器   (一)為什麼要搭建時間伺服器          因為Hadoop 對叢集中各個機

CM+CDH構建企業資料平臺系列十六

完整視訊+圖文資料獲取及技術答疑請加:大講臺大資料研習社⑦ :695520445                        安裝Cloudera Manager Server四、安裝Cloudera

CM+CDH構建企業資料平臺系列十七

五、下載CDH的parcels包並配置到Cloudera Manager主伺服器上    CM安裝成功之後,接下來我們就可以通過CM安裝CDH的方式構建企業大資料平臺。所以首先需要把CDH的parcels包下載到CM主伺服器上。    那麼Parcels包是什麼?從哪下載呢?怎麼安裝配置到CM主伺服器上?首先

知名大廠如何搭建資料平臺&架構

今天我們來看一下淘寶、美團和滴滴的大資料平臺,一方面進一步學習大廠大資料平臺的架構,另一方面也學習大廠的工程師如何畫架構圖。通過大廠的這些架構圖,你就會發現,不但這些知名大廠的大資料平臺設計方案大同小異,架構圖的畫法也有套路可以尋覓。 淘寶大資料平臺 淘寶可能是中國網際網路業界較早搭建了自己大資料平臺的公司,

資料重新定義未來,2018 中國資料技術大會BDTC豪華盛宴搶先看!

隨著資訊科技的迅猛發展,資料的重要性和價值已毋庸置疑,資料正在改變競爭格局,成為重要的生產因素,更被定義為“21世紀的新石油”。在資訊高速傳播的今天,資料已經滲透到每一個行業和業務職能領域,指數級的速度增長將我們帶入大資料時代。作為年度技術趨勢與行業應用的風向標,2018 中國大資料技術大會(BDT

資料之Spark--- Spark的SQL模組,Spark的JDBC實現,SparkSQL整合MySQL,SparkSQL整合Hive和Beeline

一、Spqrk的SQL模組 ---------------------------------------------------------- 1.該模組能在Spack上執行Sql語句 2.可以處理廣泛的資料來源 3.DataFrame --- RDD --- tabl