預設一個塊大小是64MB，在HDFS中的檔案會被拆分成多個塊，每個塊作為獨立的單元進行儲存。HDFS在檔案塊大小設定上要遠遠大於普通檔案系統，以期在處理大規模檔案時能得到更好的效能。但是，通常MapReduce中的Map任務一次只處理一個塊中的資料，如果啟動的任務太少會降低作業並行處理速度，所以塊的大小設定也不易過大。

HDFS架構

名稱節點(NameNode)

名稱節點主要負責檔案和目錄的建立，刪除和重新命名等，同時管理著資料節點和檔案塊的對映關係。因此客戶端只有訪問名稱節點才能找到請求的檔案塊所在的位置，進而到相應位置讀取所需檔案塊。
同時，名稱節點還負責管理分散式檔案系統的名稱空間，儲存了兩個核心的資料結構，即FsImage(元資料映象檔案)和EditLog(日誌檔案)。FsImage用於維護檔案系統樹以及檔案樹中所有檔案和資料夾的元資料（檔案的名稱，位置，副本數，擁有者，組，許可權，儲存塊，各塊在哪些節點上）。操作日誌檔案EditLog中記錄了所有針對檔案的建立，刪除，重新命名等操作。

名稱節點啟動時，會將FsImage的內容載入到記憶體中，然後執行EditLog中的各項操作，使得記憶體中的元資料保持最新，操作完成後，會建立新的FsImage檔案和一個空的EditLog。

FsImage和EditLog展示

資料節點(DataNode)

資料節點負責資料的儲存和讀取。在儲存時，由名稱節點分配儲存位置，然後由客戶端把資料直接寫入相應資料節點；在讀取時，客戶端從名稱節點獲得資料節點和檔案塊的對映關係，從而找到相應位置訪問檔案塊。資料節點還要根據名稱節點的命令建立，刪除資料塊和冗餘複製。
每個資料節點會週期性向名稱節點發送"心跳"資訊，報告自己的狀態，沒有按時傳送心跳資訊的節點會被標記為"宕機"，不會給他分配任何I/O請求。

第二名稱節點(Secondary NameNode)

在設計中,HDFS採用第二名稱節點"Secondary NameNode"，以解決實際操作中EditLog逐漸變大的問題。

功能：

首先，可完成EditLog和FsImage的合併操作，減小EditLog檔案大小，縮短名稱節點重啟時間；
其次，作為名稱節點的"檢查點"，儲存名稱節點的元資料資訊，起到"冷備份"的作用。

第二名稱節點工作過程

體系結構圖示

HDFS體系結構

HDFS核心設計

Block大小設定

前文我們有提到，在這裡不進行過分的贅述。

HDFS儲存原理

1.資料的冗餘儲存
HDFS採用了多副本方式對資料進行冗餘儲存，通常一個數據塊的多個副本會被分佈到不同資料節點上。可加快資料傳輸速度，容易檢查資料錯誤，保證資料可靠性。
2.資料副本存取策略（機架感知：就近寫入，就近讀取）
HDFS預設的冗餘複製因子是3，每一個檔案塊會被同時儲存到3個地方。其中，兩份副本在同一機架的不同機器上，第三個副本放在不同機架的機器上面。

資料副本存放策略

資料複製（流水線）

當客戶端向HDFS檔案寫資料的時候，一開始是寫入本地的臨時檔案，假設該檔案的複製因子是3，那麼客戶端會從NameNode獲取一張DataNode列表來存放副本。然後客戶端再向第一個DataNode傳輸資料，第一個DadaNode會一小部分一小部分(4KB)地接受資料，將每個部分寫入本地倉庫，同時傳輸給第二個DataNode。其他節點也是這樣，邊接受邊傳輸，直到最後一個副本節點，只接受並存儲。

HDFS 資料讀寫(使用Java API)

讀檔案

1.呼叫java.net.URL（簡單粗暴法）

(1)呼叫java.net.URL類獲得輸入流
(2)通過IOUtils操作輸入流對檔案讀取

static {
        URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
        //識別URL路徑
    }
    
    InputStream in = new URL("hdfs://bigdata-hadoop.wbc.com/user/wbc/datas/").openStream();
        //do something for in
    IOUtils.closeStream(in);

2.呼叫FileSystem類

(1)例項化FileSystem物件

在FileSystem類中有兩種靜態方法可以獲得FileSystem類物件

1. public static FileSystem get（Configuration conf）
//預設載入core-site.xml，並返回預設檔案系統。
2. public static FileSystem get(URI uri, Configuration conf)
//根據傳入的完整的URI來確定返回的檔案系統型別。根據傳入的完整的URI來確定返回的檔案系統型別。

(2)通過.open()方法開啟檔案，DistributedFileSystem會建立輸入流FSDataInputStream物件(兩種)。
對於HDFS而言,具體的輸入流就是DFSInputStream。

 1. public FSDataInputStream open (path f)
   //預設使用4KB的緩衝大小
 2. public abstract FSDataInputStream open (Path f, int bufferSize)
 //自定義快取大小

為了深入瞭解FSDataInputStream，可以看一下它的原始碼

//擷取部分原始碼
1.public class FSDataInputStream extends DataInputStream
    implements Seekable, PositionedReadable, 
      ByteBufferReadable, HasFileDescriptor, CanSetDropBehind, CanSetReadahead,
      HasEnhancedByteBufferAccess, CanUnbuffer, StreamCapabilities {
//可以看到FSDataInputStream實現了Seekable和PositionedReadable介面，因此實現了隨機查詢和讀取的方法
2.  public long getPos() throws IOException {
    return ((Seekable)in).getPos();
  }
//用於查詢當前位置相對於檔案開始處的偏移量
3.public int read(long position, byte[] buffer, int offset, int length)
    throws IOException {
    return ((PositionedReadable)in).read(position, buffer, offset, length);
  }
//從檔案給定位置開始讀取length長度的位元組數到buffer中，並返回讀取到位元組數目，（且是安全函式）
4.public void readFully(long position, byte[] buffer)
    throws IOException {
    ((PositionedReadable)in).readFully(position, buffer, 0, buffer.length);
  }
//從檔案給定位置開始讀取buffer長度的位元組數到buffer中，並返回讀取到位元組數目，（且是安全函式）  
4.public void readFully(long position, byte[] buffer, int offset, int length)
    throws IOException {
    ((PositionedReadable)in).readFully(position, buffer, offset, length);
  }
//readFully過載方法。讀取length長度的位元組陣列到buffer中。（安全）
5.public void seek(long desired) throws IOException {
    ((Seekable)in).seek(desired);
  }
//從檔案的開始搜尋到給定的偏移量，下一個read()函式將從該位置偏移開始讀取

(3)在DFSInputStream的建構函式中，輸入流通過ClientProtocal.getBlockLocations()遠端呼叫名稱節點，獲得檔案開始部分資料塊存放位置。
對於該資料塊，名稱節點返回儲存該資料塊的所有資料節點的地址，同時根據距離客戶端的遠近對資料節點進行排序，然後，DistributedFileSystem會利用DFSInputStream來例項化FSDataInputStream，返回給客戶端，同時返回了資料塊的資料節點地址。
(4)獲得輸入流FSDataInputStream後，客戶端呼叫read()函式開始讀取資料。輸入流根據排序結果，選擇距離客戶端最近的資料節點建立連線並讀取資料。
(5)資料從該資料節點讀到客戶端。當該資料塊讀取完畢後，FSDataInputStream關閉與該資料節點的連線。
(6)輸入流通過getBlockLocations()方法查詢下一個資料塊(如果客戶端快取中已包含該資料塊的位置資訊，就不需要呼叫該方法)
(7)找到該資料塊的最佳資料節點，讀取資訊。
(8)當客戶端讀取完畢資料時，呼叫FSDataInputStream的close()函式，關閉資料流。

讀操作

3.程式碼實戰練習(讀檔案)

下面通過一個簡單的測試例子來說明如何讀取文字檔案。

package com.hadoop.hdfs;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.net.URI;


public class HdfsRead {
        public static void main(String[] args) throws Exception{

            String uri = args[0];
            //讀取args陣列的第一個元素
            Configuration conf = new Configuration();
            //讀取配置檔案
            FileSystem hdfs = FileSystem.get(URI.create(uri),conf);
            //例項化FileSystem物件
            FSDataInputStream in = null;

            try{
                in = hdfs.open(new Path(uri));
                //相當於 Path path = new Path（uri）-> hdfs.open(path)
                //呼叫open（）方法獲得輸入流名為in的FSDataInputStream物件 
                byte buffer[] = new byte[256];

                int bytesRead = 0;

                while ((bytesRead = in.read(buffer)) > 0){
                //讀取檔案
                    System.out.write(buffer, 0, bytesRead);
                    //列印輸出
                }

            }finally {
                IOUtils.closeStream(in);
                //讀取完畢關閉流
            }
        }
}

將程式打包並提交到hdfs上執行

hadoop jar HdfsRead.jar com.hadoop.hdfs.HdfsRead /user/datas/hdfs_read.txt
//hadoop + jar + jar名 + class名 + 檔案路徑

當然，檔案目錄和URI引數也可以由使用者在程式中定義。

寫檔案

(1)通過FileSystem類獲得HDFS檔案系統物件。
(2)客戶端通過FileSystem.create()建立檔案，相應地，DistributedFileSystem具體實現了FileSystem，因此，呼叫create()方法後，DistributedFileSystem會建立輸出流FSDataOutputStream。

對於HDFS而言，具體的輸出流就是DFSOutputStream。
這裡介紹FileSystem中兩個與寫檔案相關的重要方法：create()和append()，通過使用這兩個函式可以得到檔案輸出流FSDataOutputStream的物件。
FSDataOutputStream繼承了java.io.DataOutputStream，實現了Syncable()介面，通過write()函式就可以對HDFS上的檔案進行寫入操作

(1)create ()方法
public FSDataOutputStream create (Path f) throws IOException
//如果檔案存在則預設覆蓋
public FSDataOutputStream create (Path f, boolean overwrite) throw IOException
//可以指定是否覆蓋
(2)如果使用者要寫入一個大檔案，通常需要程式反饋寫入進度，這時可以呼叫以下介面：
public FSDataOutputStream create (Path f, Progressable progress) throw IOException
public void progress () { System.out.print ("."); }
  //該方法也會覆蓋已存在檔案，需要使用者實現progress()函式。每寫入64KB列印一個點號。
(3)append()方法
   1.public abstract FSDataOutputStream append(Path f, int bufferSize, Progressable progress) throws IOException
   //bufferSize：寫入時使用的緩衝buffer大小
   //progress：進度報告
   2.public  FSDataOutputStream append (Path f) throws IOException 
   //相當於呼叫append(f, getConf().getInt("io.file.buffer.size",4096),null)函式
   3.public FSDataOutputStream append (Path f, int bufferSize) throws IOException
   //相當於呼叫append(f,bufferSize,null)函式

(3)DistributedFileSystem通過RPC遠端呼叫名稱節點，在檔案系統的名稱空間中建立新檔案。遠端方法呼叫結束後，DistributedFileSystem會利用DFSOutputStream來例項化FSDataOutputStream，返回給客戶端，客戶端使用這個輸出流寫入資料。
(4)獲得輸出流FSDataOutputStream以後，客戶端呼叫輸出流的write()方法向HDFS中對應的檔案寫入資料。
(5)客戶端向輸出流FSDataOutputStream中寫入資料會首先被分成一個個分包，放入DFSOutputStream物件的內部佇列。輸出流FSDataOutputStream會向名稱節點申請儲存檔案和副本資料塊的若干個資料節點，這些資料節點形成一個資料流管道，佇列中的分包被打包成資料包，進行流水線複製傳輸。
(6)接收到資料的資料節點向傳送者傳送“確認包”(ACK Packet)。確認包隨資料流管道逆流而上，最終發往客戶端，當客戶端收到應答時，將對應分包從內部佇列移除。不斷執行(3)～(5)步，知道資料全部寫完。
(7)客戶端呼叫close()方法關閉輸出流。當DFSOutputStream物件內部佇列中的分包都收到應答以後，可使用ClientProtocol.complete()方法通知名稱節點關閉檔案，完成一次寫檔案過程。

程式碼實戰練習(寫檔案)

下面通過一個簡單的測試例子來說明如何寫入文字檔案。

package com.hadoop.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.util.Progressable;

import java.io.IOException;


public class HdfsWrite {
    public static void main(String[] args) throws IOException {
        Configuration conf = new Configuration();
        //載入配置檔案
        FileSystem local = FileSystem.getLocal(conf);
        //獲取本地檔案系統物件
        FileSystem hdfs = FileSystem.get(conf);
        //獲取hdfs檔案系統物件
        Path localdir = new Path(args[0]);
        //獲取本地目錄
        Path hdfsFile = new Path(args[1]);
        //獲取hdfs資料夾目錄
        try{
            FileStatus[] inputFiles = local.listStatus(localdir);
            //得到本地檔案系統目錄下所有檔案資訊
            FSDataOutputStream out = hdfs.create(hdfsFile, new Progressable() {
                public void progress() {
                    System.out.print(".");
                }
                //呼叫反饋進度函式
            });
            //呼叫create()函式，獲得輸出流
            for(int i = 0;i < inputFiles.length; i++){
                System.out.println(inputFiles[i].getPath().getName());
                //輸出檔名
                FSDataInputStream in = local.open(inputFiles[i].getPath());
                //得到FSDataInputStream物件
                byte buffer[] = new byte[512];
                int bytesRead = 0;
                while ((bytesRead = in.read(buffer)) > 0){
                    out.write(buffer,0,bytesRead);
                    //寫入檔案
                }
                in.close();
            }
            out.close();
        }catch (IOException e){
            e.printStackTrace();
        }
    }
}

提交執行方法與讀檔案相同

【Hadoop】HDFS分散式檔案系統

HDFS分散式檔案系統 HDFS基本知識前言目標侷限性 HDFS相關概念塊(Block) HDFS架構名稱節點(NameNode) 資料

【史上最全】Hadoop 核心 - HDFS 分散式檔案系統詳解(上萬字建議收藏)

## 1. HDFS概述 Hadoop 分散式系統框架中，首要的基礎功能就是檔案系統，在 Hadoop 中使用 FileSystem 這個抽象類來表示我們的檔案系統，這個抽象類下面有很多子實現類，究竟使用哪一種，需要看我們具體的實現類，在我們實際工作中，用到的最多的就是HDFS(分散式檔案系統)以及Loca

hadoop[4]-hdfs分散式檔案系統的基本工作機制

一、Namenode 和 Datanode HDFS採用master/slave架構。一個HDFS叢集是由一個Namenode和一定數目的Datanodes組成。Namenode是一箇中心伺服器，負責管理檔案系統的名字空間(namespace)以及客戶端對檔案的訪問。叢集中的Datanode一般是一個節點一

【Fastdfs】Fastdfs分散式檔案系統的安裝部署使用，以及fastdfs連線池connectionpool編寫使用

環境：centos 7.X 預編譯安裝元件 yum install gcc gcc-c++ automake pcre pcre-devel zlip zlib-devel openssl openssl-devel libevent-dev git -y 以上安裝完，後續的各

【Fastdfs】Fastdfs分散式檔案系統的安裝部署使用，結合nginx訪問圖片，fastdfs連線池connectionpool編寫使用，文末有github連結

環境：centos 7.X 預編譯安裝元件 yum install gcc gcc-c++ automake pcre pcre-devel zlip zlib-devel openssl openssl-devel libevent-dev git -y 以上安裝

【FastDFS】FastDFS 分散式檔案系統的安裝與使用，看這一篇就夠了！！

## 寫在前面 > 有不少小夥伴在實際工作中，對於如何儲存檔案（圖片、視訊、音訊等）沒有一個很好的解決思路。都明白不能將檔案儲存在單臺伺服器的磁碟上，也知道需要將檔案進行副本備份。如果自己手動寫檔案的副本機制，那就太麻煩了，這會涉及冗餘副本機制、伺服器的排程、副本檢測、伺服器節點檢測、檔案副本存放策略

Hadoop HDFS分散式檔案系統設計要點與架構

Hadoop簡介：一個分散式系統基礎架構，由Apache基金會開發。使用者可以在不瞭解分散式底層細節的情況下，開發分散式程式。充分利用叢集的威力高速運算和儲存。Hadoop實現了一個分散式檔案系統（Hadoop Distributed File System），簡稱HDFS。HDFS有著高容錯性的特點，並

Hadoop 《一》，HDFS 分散式檔案系統

Hadoop-HDFS 儲存模型：位元組 -檔案線性切割成塊（Block）：偏移量 offset -block分散儲存在叢集結點中 -單一檔案block大小一致，檔案與檔案可以不一致 -block可以設定副本數，副本無序分散在不同結點中 >副本數不要超過結點數量 -檔案上傳可以

hadoop hdfs分散式檔案系統工作原理

非HA下的namenode 工作原理 nameNode的作用：1.管理元資料 2.維護目錄樹 3.響應客戶請求（主要就是記錄一些真實資料存放在被切割後放在了哪些機器上，等客戶端下載時找到這些檔案塊在合併返回給客戶端） 1.當客戶端沒請求一次時 nameN

【C#程式設計最佳實踐九】DFS分散式檔案系統

最近在專案中使用到了DFS分散式檔案系統，這裡蒐集一些資料瞭解一下這個系統以及如何在我的專案裡使用。 DFS定義 Microsoft檔案分佈系統 (Dfs) 是一個網路伺服器元件，它能夠使你更容易地在網路上查詢和管理資料。分散式檔案系統是將分佈於不同電腦

【Hadoop】HDFS的執行原理

【Hadoop】HDFS的執行原理一部落格轉自–http://www.daniubiji.cn/archives/596 簡介 HDFS（Hadoop Distributed File System

【Hadoop】HDFS開發手冊（JavaAPI）

文章目錄前言準備 Core Code 建立資料夾建立新檔案讀取檔案檔案是否存在下載檔案從指定目錄上傳檔案到指定目錄刪除檔案或資料夾追加內容重新命名檔案或資

1、HDFS分散式檔案系統

1、HDFS分散式檔案系統分散式儲存分散式計算 2、hadoop hadoop含有四個模組，分別是 common、 hdfs和yarn。 common 公共模組。 HDFS hadoop distributed file system，hadoop分散式檔案系統，負責檔案的

BigData_A_A_01-hdfs分散式檔案系統（2）高可用

楔子 Hadoop 3 高可用搭建記錄 1 zookeeper叢集 zoo.cfg 檔案配置資料檔案位置等資訊 #其他使用預設 dataDir=/opt/data/zk server.1=had2:2888:3888 server.2=had3:2888:3

BigData_A_A_01-hdfs分散式檔案系統（1）全分散式

楔子學習 hadoop(基於hadoop3.1.1)，學習視訊可以參看大資料第二階段：hadoop體系之離線計算 1 前期準備 1.1 hosts修改 win10修改hosts許可權虛擬機器4 臺，分配如下

HDFS分散式檔案系統架構

HDFS: Hadoop Distributed File System 特點：hadoop分散式的檔案系統，具備高容錯、部署方便的特點，master/slave架構元件：NameNode和D

HDFS分散式檔案系統學習總結

結構：主從結構（Master/slave）名稱節點/資料節點；缺點：不適合低延時資料訪問；無法高效儲存大量小檔案；不支援併發寫及任意修改檔案；NN：儲存元資料；元資料儲存在記憶體中；儲存檔案，block，DN之間的對映關係；DN：儲存檔案內容；檔案內容儲存在磁碟中；維護blo

【Linux】索引式檔案系統

每個block的大小要合理地選擇，如果太大，會造成最後一個block中會有大量剩餘的空間；如果太小，那麼inode中就要記錄更多的block號碼，每次找block要耗時，所以這樣效率也不高。由於每個inode在格式化的時候大小就已經固定了，並且只有128bytes，並且每個檔案僅能佔用一個inode，因此，

HDFS分散式檔案系統簡介

HDFS（Hadoop Distributed File System）Hadoop 分散式檔案系統基於流資料模式訪問就是可以位元組序列化的資料，java.io.Serializable介面分散式檔案系統處理的資料必須是流資料，可以寫IO

大資料-Hadoop-HDFS（分散式檔案系統）環境搭建

1：Hadoop三大核心元件 A：分散式檔案系統HDFS B：分散式資源排程器 C：分散式計算框架MapReduce 2：HDFS簡介： HDFS架構：HDFS採用Master/Slave架構即：一個Master（NameNode）對應多個Slave(DataNode)