1. 程式人生 > >世界杯項目案例:HDFS分布式文件系統

世界杯項目案例:HDFS分布式文件系統

tar 中文 刷新 str 裏的 技術分享 family 項目案例 nod

項目案例:HDFS分布式文件系統


Hadoop的簡介
Hadoopapache軟件基金會的開源分布式計算平臺hadoop集群包括兩種角色MaterSlave。一個HDFS集群由一個運行於Master上的NameNode和若幹個運行於Slave節點的DataNode組成。NameNode負責管理文件系統命名空間和客戶端對文件系統的訪問操作;DataNode管理存儲的數據。文件以塊形式在DataNode中存儲,假如一個塊大小設置為50MB,塊的副本數為3(通過設置塊的副本數來達到冗余效果,防止單個DataNode磁盤故障後數據丟失),一個40MB的文件將被存儲在一個塊中,然後將相同的3個塊存儲在3

DataNode中實現冗余。大文件將被切成小塊存儲。

本實驗的目的

搭建hadoopHDFS,通過DataNode節點的添加與刪除實現HDFS空間動態增加與減少,以及HDFS文件系統的基本管理。

需要掛載hadoop光盤 hadoop.iso

技術分享圖片

將文件復制到腳本裏的指定路徑

技術分享圖片

腳本解釋

技術分享圖片

安裝完成,重啟生效

技術分享圖片

驗證

技術分享圖片

其他主機操作類似,需修改腳本的IP地址和主機名

slave-1配置

技術分享圖片

驗證

技術分享圖片

slave-3配置

技術分享圖片

驗證

技術分享圖片

slave-3配置

技術分享圖片

驗證

技術分享圖片

master配置SSH密鑰對要求master免密碼登錄各slave,用於開啟相應服務。

Master無密碼連接slave,先切換hadoop用戶,用ssh-keygen

按照默認配置直接按Enter鍵生成密鑰對

通過ssh-copy-id將公鑰復制至3slave主機中,復制過程需要輸入slave主機的hadoop用戶密碼,作用是master遠程啟動slave

技術分享圖片

技術分享圖片

確定hadoop用戶對文件的屬主和屬組權限

技術分享圖片

配置hadoop

技術分享圖片

復制文件,並給權限

技術分享圖片

如果是手動修改需要修改以下地方

技術分享圖片

技術分享圖片

技術分享圖片技術分享圖片技術分享圖片

技術分享圖片

技術分享圖片

master通過SSH安全通道把剛才配置的6個文件復制給每個slave

技術分享圖片

slave需要對文件有755權限

技術分享圖片

技術分享圖片

初始化master

技術分享圖片

檢查新生成的目錄

技術分享圖片

啟動hadoop群集(開機hadoop的冗余功能)

啟停hadoopde的管理命令位於@HADOOP_HOME/sbin下,以start

-*stop-*開頭;單獨啟動HDFS分布式文件系統可使用start-dfs.sh,也可以使用以下命令啟動整個hadoop集群。

技術分享圖片

通過jps查看各節點上的進程是否正常

技術分享圖片

驗證訪問

技術分享圖片

技術分享圖片

hadoop基本命令

使用hadoopfs”命令可以結合普通的文件管理命令實現很多操作,如查看、修改權限、統計、獲取幫助、創建、刪除、上傳下載文件等,更多的用法可使用“hadoop fs -help”或“hadoop fs -usage”命令查看。

技術分享圖片

查看節點狀態

技術分享圖片

HDFS高級命令

開機安全模式

技術分享圖片

將本地文件復制到HDFS

技術分享圖片

HDFS上的文件復制到本地

技術分享圖片

修改屬組

技術分享圖片

修改權限

技術分享圖片

修改所有者

技術分享圖片

統計顯示目錄中文件大小

技術分享圖片

合並文件

技術分享圖片

技術分享圖片

HDFS集群添加節點

slave4節點安裝jdkhadoop,配置環境變量

技術分享圖片

復制hosts文件到每臺服務器

技術分享圖片

配置ssh無密碼連接

技術分享圖片

master上修改hadoop後,復制到其他節點

技術分享圖片

新節點上啟動並平衡節點以及存儲的數據

技術分享圖片

查看集群信息

技術分享圖片

技術分享圖片

技術分享圖片

刪除DataNode節點

技術分享圖片

添加要刪除的節點

技術分享圖片

刷新配置

技術分享圖片

查看集群信息

技術分享圖片 技術分享圖片

技術分享圖片

技術分享圖片

hadoop集群搭建完成!


總結:需要懂得原理加強自身不斷完善自己!


世界杯項目案例:HDFS分布式文件系統