1. 程式人生 > >Amabri 2.1安裝HDP2.3.2 之 一、HDP介紹

Amabri 2.1安裝HDP2.3.2 之 一、HDP介紹

一、HDP

(一)簡介

HDP全稱是Hortonworks Data Platform,是由一家美國大資料公司Hortonworks開發的企業級Hadoop平臺。
Hortonworks致力於幫助客戶利用Hadoop開源大資料平臺管理資料。HDP是完全在開源的環境下設計、開發和構建的,它以 YARN 作為其架構中心,該平臺支援一系列處理方法——批處理、互動式處理、實時處理。

(二)功能與特點

HDP的功能包括資料管理、資料訪問、資料管制與整合、運營、安全性。圖1.2.1是HDP的功能架構。
這裡寫圖片描述
圖1.2.1

1. 資料管理

這裡寫圖片描述
圖1.2.2

YARN和HDFS是HDP的核心元件。YARN是一種資源管理器,可以給上層應用提供統一的資源管理和排程。YARN將資源管理元件和任務處理元件分離,提供可插拔架構,可以支援廣泛的資料訪問方法。
HDFS 是一種分散式檔案系統,它為大資料提供了有效可靠的儲存,使得我們在大規模叢集中以低成本更有效地儲存共享資料集。

2. 資料訪問

這裡寫圖片描述
圖1.2.3

(1)YARN
YARN給各種處理引擎提供基礎,HDP允許使用者和資料以多種並行方式進行互動,並不需要為每個資料集或應用程式建立單獨的叢集,這樣應用程式可以以最佳方式和資料互動。
Strom和Spark能滿足這些需求,HDP作為真正的資料平臺,它基於YARN的架構能夠使盡可能廣泛的訪問方法共存於叢集中,而避免不必要的、昂貴的資料儲存成本。
(2)資料訪問方式
HDP提供的資料訪問方式有批處理,指令碼,互動式SQL查詢, 使用NoSQL低延遲,基於Solr的搜尋和流處理。
Apache MapReduce是Hadoop預設的處理引擎,已經得到了廣泛的測試和信賴。Apache Pig作為一種指令碼語言,可以在MapReduce和Apache Tez 上執行,能夠做到對資料進行聚集、分類等。Apache Hive 可以進行互動式、批量SQL查詢。而Apache Hbase 則提供及其快速的NoSQL訪問。Apache Strom 能夠實時處理流資料,即當資料流入HDFS時分析資料。

3.資料管理與整合

HDP是通過用語資料管理和整合的強大工具擴充套件資料訪問和管理的,這些工具提供可靠可重複使用的以及簡單的框架來管理資料流在 Hadoop 中的進出。Hortonworks 和所有資料管理提供商具有工程關係,支援將他們的工具與 HDP 進行協作、整合。

4. 安全性

HDP從多次層次角度加入、集成了安全性,它提供了用於身份驗證、授權、可歸責性以及資料保護的關鍵功能,確保 HDP 安全。HDP 在所有企業 Hadoop 功能上保持方法一致,而且確保我們可整合和擴充套件自己當前的安全解決方案,在企業現代化資料架構上提供單一、一致、安全的保護。

5 運營

HDP 提供一整套運營功能,使運營團隊在企業資料生態系統中部署、監控和管理 Hadoop 群集。HDP不僅提供群集執行狀況的可見性,還提供工具來管理配置優化效能。Apache Ambari 作為HDP的管理工具,提供 了API ,可在現有叢集基礎上簡單容易地擴充套件服務,增加元件。

(三)叢集部署選項

這裡寫圖片描述
圖1.3.1

HDP 為Hadoop提供了最廣泛的部署選項:它支援從Windows Server或Linux,到虛擬雲部署,是可移植性最高的Hadoop發行版,允許使用者輕易地在不同部署型別之間進行遷移。
HDP不僅是開源的,而且是通過社群完全在開放的環境中構建的。雖然通過釋出到github可以很方便的將專用hadoop擴充套件成開源的,但是隨之而來會有相容性問題。而社群導向的開發,通過結合跨各種公司的技術,質量更加可靠。對於企業而言,HDP為之提供了高度可靠、管理便捷、高擴充套件性的叢集服務,也為大資料分析提供了十分有效的平臺。

相關推薦

Amabri 2.1安裝HDP2.3.2 HDP介紹

一、HDP (一)簡介 HDP全稱是Hortonworks Data Platform,是由一家美國大資料公司Hortonworks開發的企業級Hadoop平臺。 Hortonworks致力於幫助客戶利用Hadoop開源大資料平臺管理資料。HDP是完全

Amabri 2.1安裝HDP2.3.2 需求配置說明

二、需求配置說明 Ambari 安裝hortonworks相應ambari版本可以支援的hdp版本如下: 圖2.0 我們選擇的是ambari2.1.2,hdp是2.3.2.0 此時我們準備好一臺純淨虛擬機器作為master機,完整克隆出兩臺slave

Ambari 2.1安裝HDP2.3.2 安裝部署HDP叢集 詳細步驟

六、安裝部署HDP叢集 瀏覽器訪問 http://master:8080,進入amabri登入頁面,使用者名稱:admin,密碼: admin 選擇 Launch Install Wizard: 1. Get started 給叢集起個名字

【轉】CentOS 7.0 安裝Redis 3.2.1詳細過程和使用常見問題

nec count ges des useful 內存 warning before outside http://www.linuxidc.com/Linux/2016-09/135071.htm 環境:CentOS 7.0 Redis 3.2.1 Redis的安裝與啟動

nagios客戶端nrpe3.2.1安裝

init nagios插件 源碼 load 啟動 files plugin ubunt tar.gz 1、刪除dpkg安裝的nrpedpkg -l | grep nrpedkpg -P nagios-nrpe-server 2、ubuntu下nrpe3.2.1安裝 下載nr

12.1 LNMP架構介紹 12.2 MySQL安裝 12.3/12.4 PHP安裝 12.5 Nginx介紹

mcrypt .... game post mcr default .tar.gz sta fig Nginx設計的初衷是提供一種快速、高效、多並發的Web服務軟件。在靜態頁面的處理上,Nginx較Apache更勝一籌;但是在動態頁面的處理上,Nginx並不比Apache

12.1 LNMP架構介紹12.2 MySQL安裝12.3/12.4 PHP安裝12.5 Nginx

12.1 LNMP架構介紹12.2 My12.1 LNMP架構介紹 13.12.2 MySQL安裝 [root@martin001 ~]# service mysql stopRedirecting to /bin/systemctl stop mysql.service[root@martin001 ~

12.1 LNMP架構介紹 12.2 MySQL安裝 12.3/12.4 PHP安裝 12.5 Ng

12.1 LNMP架構介紹 12.2 M12.1 LNMP架構介紹 12.2 MySQL安裝12.3/12.4 PHP安裝12.5 Nginx介紹12.1 LNMP架構介紹 12.2 MySQL安裝 12.3/12.4 PHP安裝 12.5 Ng

Android Studio 3.2.1安裝問題解決辦法

由於公司設定代理伺服器,導致安卓工程一直停留在gradle中迴圈,解決辦法如下: 修改兩個檔案,在目錄C:\Users\Administrator.20181015CSB\.gradle下: gradle.properties init.gradle 其中: 【gradle.

Apache Hadoop1.1.1+Apache Oozie3.3.2搭建安裝過程詳解(親測)

寫在前面: 最近需要定製的原因,需要將原來Cloudera版本的Hadoop更改為Apache版本的Hadoop和Oozie,對官方文件的學習,發現Hadoop1.1.1和Oozie3.3.2的組合比較好,所以,經過幾天的搭建,終於成功了,現在把心得分享出來,希望給需要的朋

vtk6.1.0+qt5.3.2+cmake2.8.12.2+win7+64位安裝配置過程

系統win7 64位,已裝vs2012,所有軟體安裝及開啟都用管理員身份。 下面詳細介紹QT和VTK結合開發的環境配置步驟 1.      下載軟體版本及地址 ①      qt的安裝檔案qt-opensource-windows-x86-msvc2012_opengl-5

在Hortonworks HDP 2.2安裝Hue 3.7.1

Hortonworks 的招牌一直是採用全部apache 開源方案搭建hadoop 大資料系統。  Hortonworks HDP 2.2 今年新鮮出爐, 裡面集成了開源hadoop社群幾乎所有最新的內容。   遺憾的是 Hue 這個目前在hadoop上最好用的查詢介面 在

kubernetes 1.5安裝 Redis 3.2.6 Cluster StatefulSet

聽說Redis 3以後安裝叢集比較簡單,幾個命令就可以完全搞定,在自己的電腦上面安裝試了下,果然比較爽。 今天準備把Redis 3的叢集安裝在K8s上面,通常的做法都是在github上面查詢是不是有人已經做過,果然很多。下面的程式碼基本上來自於github上面。不過就算用

(轉) Hadoop1.2.1安裝

安裝目錄 文件復制 reduce mat 數據保存 jdk1.7 mapreduce tput cat 環境:ubuntu13 使用的用戶為普通用戶。如:用戶ru jdk安裝略 1、安裝ssh (1) Java代碼 sudo apt-get install op

在CentOS 7上使用Yum源安裝 Zabbix 3.2

zabbix mysql centos 在CentOS 7上使用Yum源安裝 Zabbix 3.2 1. 環境準備[[email protected]/* */ ~]# setenforce 0 [[email protected]/* */ ~]# sed -i "s/S

源碼安裝zabbix_agent 3.2.3

監控 下載地址 local 一,環境centos/zabbix3.2.31、安裝包選擇下載地址:http://www.zabbix.com/download.php這裏有兩種源碼包,一種是安裝 Zabbix Server 的包,可以通過指定參數 --enable-agent 的方式安裝 Agent

CentOS7.3安裝Jumpserver0.3.2

jumpserver 堡壘機 開源公司服務器前端增加堡壘機,選用開源的jumpserver軟件環境CentOS Linux release 7.3.1611 python 2.7.5 mysql5.7安裝gityum -y install git克隆jumpserver# cd /opt # git cl

Qt5.5.1和Qt5.3.2編譯OCI驅動教程及驗證方法

oracle下載 電腦 博客 size 版權 ring nbsp scott 所有 我們都知道oracle數據庫的強大,並且好多企業或者教學用到數據庫時都會推薦使用。但是Qt因為版權問題沒有封裝oracle數據庫專用驅動,網上也有一大堆說法和教程,但是或多或少的都有問題。下

redis系列01:源碼安裝redis-3.2.10

創建 好的 color netstat mon compress 手動 idf sta 前段時間安裝好的redis,今天用腳本安裝的時候突然出現版本異常的問題,所以更新一篇為大家提供參考 本次安裝在CentOS6.5,采用的redis-3.2.10,最新的redis-4.0