Ambari搭建大資料平臺教程(HDP)
本文是公司搭建測試環境大資料平臺時總結的,按安裝相應版本的官方文件的步驟翻譯過來的。其中遇到了一些問題,相應的解決方案也都一一列舉了。按照這個方式一定可以搭建成功。
- 基本資訊:
- 各個伺服器的角色:
- 生成ssh-key
- 將namenode的id_rsa.pub新增到datenode的authorized_keys
- 測試免密碼登入
- 安裝ntp
- 執行ntp服務
- 修改hosts檔案,新增一下內容
- 設定hostname
- 重啟生效
- 修改mysql編碼方式
- 在[client]下追加 default-character-set = utf8
- 在[mysqld]下追加 character-set-server=utf8
- 在[mysql]下追加 default-character-set=utf8
- 重啟,登入mysql,採用status校驗編碼是否生效
- 預先建立Ambari需要依賴的資料庫,建立相關使用者
- 安裝connector
- 確保mysql-connector-java.jar在/usr/share/java/目錄下
- 確保mysql-connector-java.jar有644的許可權
- 預先建立hive需要依賴的資料庫,建立相關使用者
- 預先建立oozie需要依賴的資料庫,建立相關使用者
- 建立HTTP伺服器
- 安裝Apache httpd
- 啟動httpd
- 在nn0為web伺服器建立目錄
- mkdir -p /var/www/html/
- 用root使用者登入
- 下載package
- wget -nv http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.2.18-1/ambari.list -O /etc/apt/sources.list.d/ambari.list
- apt-key adv --recv-keys --keyserver keyserver.ubuntu.com B9733A7A07513CAD
- apt-get update
- 確認name list裡面的package是否都下載成功,如果下載成功可以看到版本號
- apt-cache showpkg ambari-server
- apt-cache showpkg ambari-agent
- apt-cache showpkg ambari-metrics-assembly
- 安裝Ambari,會預設安裝PostgreSQL Ambari database
- apt-get install ambari-server
- 執行配置程式。
- 如果沒有關閉SELinux,會收到提示,輸入“y”。
- Customize user account for ambari-server daemon,輸入root使用者。
- 如果沒有關閉防火牆,也會收到提示,輸入“y”。
- 選擇下載Oracle JDK 1.8,接收Oracle的協議。
- 選擇“y”,再選擇3:MySQL,使用我們提前安裝好的Mysql資料庫
- 啟動命令
- 檢查狀態的命令
- 停止命令
- 使用Ambari伺服器的host登入Ambari介面
- 使用者名稱:admin 密碼:admin
2 選擇Lunch Install Wizard
3 給叢集命名4 選擇HDP版本
5 配置hosts和Private Key
- 如果需要程式自動安裝Ambari Angent,選擇Provide your SSH Private Key to automatically register hosts;如果需要手動安裝Ambari Angent,選擇Perform manual registration on hosts and do not use SSH。
- 如果選擇了Provide your SSH Private Key to automatically register hosts,需要新增id_rsa私鑰,或者複製進text輸入框。
- 輸入ssh-key對應的使用者名稱。
- 註冊和確認。
6 確認hosts校驗hosts
7 選擇需要安裝的服務
8 指派Master
9 指派Slaves和clients
10 定製服務
11 預覽
12 安裝、啟動、測試* 由於在預先安裝MySQL資料庫的時候,安裝過mysql-connector-java,和ambari預設的版本有衝突,導致安裝Ooize失敗。錯誤日誌:Preparing to unpack .../mysql-connector-java_5.1.37-2_all.deb ...Unpacking mysql-connector-java (5.1.37-2) ...dpkg: error processing archive /var/cache/apt/archives/mysql-connector-java_5.1.37-2_all.deb (--unpack): trying to overwrite '/usr/share/java/mysql-connector-java.jar', which is also in package libmysql-java 5.1.28-1Errors were encountered while processing: /var/cache/apt/archives/mysql-connector-java_5.1.37-2_all.debE: Sub-process /usr/bin/dpkg returned an error code (1) * 解決方案:手動解除安裝之前安裝的mysql-connector-java即可。apt-get remove libmysql-java
13 完成
14 管理介面
參考連結:https://docs.hortonworks.com/HDPDocuments/Ambari-2.6.1.0/bk_ambari-installation/content/enable_ntp_on_the_cluster_and_on_the_browser_host.html
相關推薦
Ambari搭建大資料平臺教程(HDP)
搭建測試環境本文是公司搭建測試環境大資料平臺時總結的,按安裝相應版本的官方文件的步驟翻譯過來的。其中遇到了一些問題,相應的解決方案也都一一列舉了。按照這個方式一定可以搭建成功。基本資訊:系統:Ubuntu-14.04.1JDK版本:jdk-8u111SCALA版本:MySQ
CM+CDH構建企業大資料平臺系列(一)
問題導讀:1、CM是什麼?2、CDH是什麼?3、CM+CDH是什麼?4、什麼是企業大資料平臺?5、如何用CM+CDH構建企業大資料平臺?..........帶著種種疑問讓我們開啟真正的企業級大資料平臺搭建之旅。 隨著網際網路,尤其是移動網際網路和智慧移動裝置的高速發展和
CM+CDH構建企業大資料平臺系列(六)
一、克隆Linux虛擬機器 1、為什麼要克隆虛擬機器? 第一:我們要搭建分散式叢集,需要多臺虛擬機器 第二:我們不想像安裝第一臺虛擬機器那樣從頭到尾做多次重複的操作,既浪費時間又沒有什麼技術含量。 那麼怎麼辦呢? 所以我們就採用克隆的方式,你想要多少臺虛擬機器就克隆多少臺。但是我
Win10不需要Cygwin搭建大資料測試環境(4)---Hive
系列文章 前言 這篇文章是系列文章中的第四篇,主要描述了win10系安裝Hive。 準備工作 1:完成第一篇教程,確保Hadoop正常執行。 2:下載Hive,我安裝的版本是apache-hive-2.1.1-bin。安裝路徑是D:\apach
CM+CDH構建企業大資料平臺系列(二)
安裝部署多臺Linux虛擬機器一、如何理解安裝部署多臺Linux虛擬機器 1、什麼是Linux虛擬機器? 虛擬機器簡單的你可以把它理解為虛擬的電腦,從功能角度來說,這個虛擬的電腦和真實的電腦幾乎完全一樣,只是說虛擬機器的硬碟是在一個檔案中虛擬出來的。這個簡單
阿里雲搭建大資料平臺(3):安裝JDK和Hadoop偽分佈環境
一、安裝jdk 1.解除安裝Linux自帶的JDK rpm -qa|grep jdk #查詢原始JDK yum -y remove <舊JDK> 2.解壓縮 tar -zxvf /opt/softwares/jdk-8u151-linux-x64.t
從零開始搭建大資料平臺系列之(0)——目錄彙總
寫在前面 看了許多別人寫的技術系列博文,也想把自己所學系統歸納一下,正好現在打算從零開始搭建一個大資料平臺,就把自己的所學所獲系統整理一下,寫成從零開始搭建大資料平臺系列,歡迎轉載。 以下是本系列博文的目錄。 目錄 6. Oozie 平臺搭建
從零開始搭建大資料平臺系列之(1)——環境準備
1、機器準備 (1)物理機配置 處理器:Intel® Core™ i7 處理器 記憶體:8.00GB 系統型別:64 位作業系統,基於 x64 的處理器 作業系統:Windows 10 專業版 (2)磁碟陣列 常用磁碟陣列型別:RAID 0,RAID 1,RAI
從零開始搭建大資料平臺系列之(2.1)—— Apache Hadoop 2.x 偽分散式環境搭建
JDK 版本:jdk 1.7.0_67 Apache Hadoop 版本:Hadoop 2.5.0 1、安裝目錄準備 ~]$ cd /opt/ opt]$ sudo mkdir /opt/modules opt]$ sudo chown beifeng:b
關於在真實物理機器上用cloudermanger或ambari搭建大資料叢集注意事項總結、經驗和感悟心得(圖文詳解)
寫在前面的話 (1) 最近一段時間,因擔任我團隊實驗室的大資料環境叢集真實物理機器工作,至此,本人秉持負責、認真和細心的態度,先分別在虛擬機器上模擬搭建ambari(基於CentOS6.5版本)和cloudermanager(基於CentOS6.5或Ubuntu14.04版本)。 (2) 大
使用docker搭建大資料平臺
我們以Ambari+HDP為例。儘管說運維堅決不同意在docker上執行大資料元件,但是我覺得,作為測試和學習目的在本地快速構建大資料叢集仍然是一件非常有意義的事情。 如果我們想採取Ambari來安裝HDP的話,其包含的主要元件如下 ambari-server: 主要部署的控
D001.5 Docker搭建大資料叢集環境(基礎篇)
0x00 教程內容 0x01 Docker的安裝 1. 2. 3. 0x02 Docker的簡單操作 1. 2. 3. 0x03 Docker資料卷 Docker的資料卷與Centos的
【Redhat7.3】在區域網內安裝ambari,通過ambari安裝大資料平臺
以下是文章目錄: 前提條件 4 修改機器的hostname 5 修改主機名 6 配置所有節點 8 在hosts中新增其他機器資訊 8 檢查配置是否生效 9 關閉所有節點防火牆 10
搭建大資料處理叢集(Hadoop,Spark,Hbase)
搭建Hadoop叢集 配置每臺機器的 /etc/hosts保證每臺機器之間可以互訪。 120.94.158.190 master 120.94.158.191 secondMaster 1、建立hadoop使用者 先建立had
CM+CDH構建企業大資料平臺系列(十二)
完整視訊+圖文資料獲取及技術答疑請加:大講臺大資料研習社⑦ :695520445 搭建時間伺服器並配置叢集自動時鐘同步一、搭建時間伺服器 (一)為什麼要搭建時間伺服器 因為Hadoop 對叢集中各個機
CM+CDH構建企業大資料平臺系列(十六)
完整視訊+圖文資料獲取及技術答疑請加:大講臺大資料研習社⑦ :695520445 安裝Cloudera Manager Server四、安裝Cloudera
CM+CDH構建企業大資料平臺系列(十七)
五、下載CDH的parcels包並配置到Cloudera Manager主伺服器上 CM安裝成功之後,接下來我們就可以通過CM安裝CDH的方式構建企業大資料平臺。所以首先需要把CDH的parcels包下載到CM主伺服器上。 那麼Parcels包是什麼?從哪下載呢?怎麼安裝配置到CM主伺服器上?首先
知名大廠如何搭建大資料平臺&架構
今天我們來看一下淘寶、美團和滴滴的大資料平臺,一方面進一步學習大廠大資料平臺的架構,另一方面也學習大廠的工程師如何畫架構圖。通過大廠的這些架構圖,你就會發現,不但這些知名大廠的大資料平臺設計方案大同小異,架構圖的畫法也有套路可以尋覓。 淘寶大資料平臺 淘寶可能是中國網際網路業界較早搭建了自己大資料平臺的公司,
大資料重新定義未來,2018 中國大資料技術大會(BDTC)豪華盛宴搶先看!
隨著資訊科技的迅猛發展,資料的重要性和價值已毋庸置疑,資料正在改變競爭格局,成為重要的生產因素,更被定義為“21世紀的新石油”。在資訊高速傳播的今天,資料已經滲透到每一個行業和業務職能領域,指數級的速度增長將我們帶入大資料時代。作為年度技術趨勢與行業應用的風向標,2018 中國大資料技術大會(BDT
大資料之Spark(五)--- Spark的SQL模組,Spark的JDBC實現,SparkSQL整合MySQL,SparkSQL整合Hive和Beeline
一、Spqrk的SQL模組 ---------------------------------------------------------- 1.該模組能在Spack上執行Sql語句 2.可以處理廣泛的資料來源 3.DataFrame --- RDD --- tabl