1. 程式人生 > >Hadoop分散式檔案系統架構及設計要點

Hadoop分散式檔案系統架構及設計要點

Datanode
   HDFS
採用master/slave架構。一個HDFS叢集是有一個Namenode和一定數目的Datanode組成。Namenode是一箇中心伺服器,負責管理檔案系統的namespace和客戶端對檔案的訪問。Datanode在叢集中一般是一個節點一個,負責管理節點上它們附帶的儲存。在內部,一個檔案其實分成一個或多個block,這些block儲存在Datanode集合裡。Namenode執行檔案系統的namespace操作,例如開啟、關閉、重新命名檔案和目錄,同時決定block到具體Datanode節點的對映。DatanodeNamenode的指揮下進行block的建立、刪除和複製。Namenode
Datanode都是設計成可以跑在普通的廉價的執行linux的機器上。HDFS採用java語言開發,因此可以部署在很大範圍的機器上。一個典型的部署場景是一臺機器跑一個單獨的Namenode節點,叢集中的其他機器各跑一個Datanode例項。這個架構並不排除一臺機器上跑多個Datanode,不過這比較少見。