二、HDFS檔案系統

阿新 • • 發佈：2018-12-27

HDFS檔案系統的組成

NameNode 負責管理整個檔案系統的元資料，以及每一個路徑（檔案）所對應的資料塊資訊。
DataNode 負責管理使用者的檔案資料塊，每一個數據塊都可以在多個datanode上儲存多個副本。
Secondary NameNode 用來監控HDFS狀態的輔助後臺程式，每隔一段時間獲取HDFS元資料的快照。

HDFS寫資料流程

1）客戶端向namenode請求上傳檔案，namenode檢查目標檔案是否已存在，父目錄是否存在。
2）namenode返回是否可以上傳。
3）客戶端請求第一個 block上傳到哪幾個datanode伺服器上。

4）namenode返回3個datanode節點，分別為dn1、dn2、dn3。
5）客戶端請求dn1上傳資料，dn1收到請求會繼續呼叫dn2，然後dn2呼叫dn3，將這個通訊管道建立完成
6）dn1、dn2、dn3逐級應答客戶端
7）客戶端開始往dn1上傳第一個block（先從磁碟讀取資料放到一個本地記憶體快取），以packet為單位，dn1收到一個packet就會傳給dn2，dn2傳給dn3；dn1每傳一個packet會放入一個應答佇列等待應答
8）當一個block傳輸完成之後，客戶端再次請求namenode上傳第二個block的伺服器。（重複執行3-7步）

HDFS讀資料流程

1）客戶端向namenode請求下載檔案，namenode通過查詢元資料，找到檔案塊所在的datanode地址。
2）挑選一臺datanode（就近原則，然後隨機）伺服器，請求讀取資料。
3）datanode開始傳輸資料給客戶端（從磁盤裡面讀取資料放入流，以packet為單位來做校驗）。
4）客戶端以packet為單位接收，先在本地快取，然後合併寫入目標檔案。

機架感知

第一個副本在client所處的節點上。如果客戶端在叢集外，隨機選一個。
第二個副本和第一個副本位於相同機架，隨機節點。
第三個副本位於不同機架，隨機節點。

HDFS Shell命令

#列出HDFS下的檔案
$ hadoop fs -ls /

#遞迴列出HDFS下的檔案
$ hadoop fs -ls -R /user

#上傳資料夾到HDFS
$ hadoop fs -put wordcount/ /user/hadoop/test
$ hadoop fs -put ./wordcount/ /user/hadoop/test

#上傳多個檔案到HDFS
$ hadoop fs -put LICENSE.txt NOTICE.txt README.txt /wordcount/in
$ hadoop fs -put wc.input tt.input /user/hadoop/test

#將HDFS的檔案下載到本地
$ hadoop fs -get /wordcount/test1.txt .
$ hadoop fs -get /wordcount/test2.txt

#刪除HDFS下的資料夾
$ hadoop fs -rm -r /wordcount
$ hadoop fs -rm -R /user/hadoop/test/wcinput

#檢視HDFS下某個檔案的內容
$ hadoop fs -cat /wordcount/test1.txt

#在HDFS下遞迴建立資料夾
$ hadoop fs -mkdir -p /a/b/c
$ hadoop fs -mkdir -p /user/hadoop/test

#檢視HDFS基本統計資訊
$ hdfs dfsadmin -report

常用命令引數介紹

-moveFromLocal            
功能：從本地剪下貼上到hdfs
示例：hadoop  fs  -moveFromLocal  /home/hadoop/a.txt  /aaa/bbb/cc/dd

-moveToLocal              
功能：從hdfs剪下貼上到本地
示例：hadoop  fs  -moveToLocal   /aaa/bbb/cc/dd  /home/hadoop/a.txt 

-appendToFile  
功能：追加一個檔案到已經存在的檔案末尾
示例：hadoop  fs  -appendToFile  ./hello.txt  hdfs://hadoop-server01:9000/hello.txt
可以簡寫為：Hadoop  fs  -appendToFile  ./hello.txt  /hello.txt

-tail                 
功能：顯示一個檔案的末尾
示例：hadoop  fs  -tail  /weblog/access_log.1

-text                  
功能：以字元形式列印一個檔案的內容（類似-cat）
示例：hadoop  fs  -text  /weblog/access_log.1

-chgrp 
-chmod
-chown
功能：linux檔案系統中的用法一樣，對檔案所屬許可權
示例：
hadoop  fs  -chmod  666  /hello.txt
hadoop  fs  -chown  someuser:somegrp   /hello.txt

-copyFromLocal    
功能：從本地檔案系統中拷貝檔案到hdfs路徑去
示例：hadoop  fs  -copyFromLocal  ./jdk.tar.gz  /aaa/

-copyToLocal      
功能：從hdfs拷貝到本地
示例：hadoop fs -copyToLocal /aaa/jdk.tar.gz

-cp              
功能：從hdfs的一個路徑拷貝hdfs的另一個路徑
示例： hadoop  fs  -cp  /aaa/jdk.tar.gz  /bbb/jdk.tar.gz.2

-mv                     
功能：在hdfs目錄中移動檔案
示例： hadoop  fs  -mv  /aaa/jdk.tar.gz  /

-get              
功能：等同於copyToLocal，就是從hdfs下載檔案到本地
示例：hadoop fs -get  /aaa/jdk.tar.gz

-getmerge             
功能：合併下載多個檔案
示例：比如hdfs的目錄 /aaa/下有多個檔案:log.1, log.2,log.3,...
hadoop fs -getmerge /aaa/log.* ./log.sum

-put                
功能：等同於copyFromLocal
示例：hadoop  fs  -put  /aaa/jdk.tar.gz  /bbb/jdk.tar.gz.2

-df               
功能：統計檔案系統的可用空間資訊
示例：hadoop  fs  -df  -h  /

-du 
功能：統計資料夾的大小資訊
示例：hadoop  fs  -du  -s  -h /aaa/*
$ hadoop fs -du -s -h hdfs://cmaster0:9000/*

-count         
功能：統計一個指定目錄下的檔案節點數量
示例：hadoop fs -count /aaa/

-setrep                
功能：設定hdfs中檔案的副本數量
示例：hadoop fs -setrep 3 /aaa/jdk.tar.gz
<這裡設定的副本數只是記錄在namenode的元資料中，是否真的會有這麼多副本，還得看datanode的數量>

二、HDFS檔案系統

HDFS檔案系統的組成 NameNode 負責管理整個檔案系統的元資料，以及每一個路徑（檔案）所對應的資料塊資訊。 DataNode 負責管理使用者的檔案資料塊，每一個數據塊都可以在多個datanode上儲存多個副本。 Secondary NameNode 用來監控H

[日更-2019.5.22、23] Android 系統的分割槽和檔案系統（二）--Android 檔案系統中的檔案

宣告 Android系統中有很多分割槽，每個分割槽內的檔案系統一般都不同的，使用ADB進入系統/目錄下可發現掛載這很多的目錄，不

Linux基礎（二）——/proc檔案系統

1、/proc檔案系統簡介 /proc檔案系統由一組目錄和檔案組成，裝配（mount）於/proc目錄下。/proc檔案系統是一種虛擬檔案系統，以檔案系統目錄和檔案形式提供一個只想核心資料結構的介面。這為檢視和改變各種系統屬性開啟了方便之門。此外，還能通過一組以/proc

Linux叢集儲存——day5——Ceph叢集上部署Linux系統、Ceph檔案系統、Ceph的物件儲存系統

Ceph叢集儲存的應用紅帽的Linux已經把Ceph整合到核心中了，可以直接把作業系統裝在分佈儲存檔案中。將虛擬機器的Linux作業系統安裝在Ceph叢集中： 0. 如同Ceph叢集進行初期環境部署。

安裝系統以及磁碟分割槽所要知道的磁碟的型別、分割槽檔案系統等知識

終於你明白，這就是愛情。終有一個人，老是跟你過不去，你卻很想跟他過下去。磁碟的型別： MBR磁碟：MBR磁碟最大支援2TB，如果是大於2TB的磁碟選擇MBR格式會造成磁碟容量的浪費，建議選擇GPT格式。 GPT磁碟：大於2TB的磁碟或者需要安裝系統到該

java連線hdfs檔案系統並訪問檔案

package hadoop; import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.net.URL; import org.apache.

如何將HDFS檔案系統掛載到Linux本地檔案系統

本文轉自https://cloud.tencent.com/developer/article/1078538，如果侵權請聯絡我刪除。 1.文件編寫目的 Hadoop支援通過NFSv3掛載HDFS檔案系統到本地目錄，允許使用者像訪問本地檔案系統一樣訪問HDFS，對於普通使用者來說大大的簡

Hive 安裝-使用HDFS檔案系統

1.下載、解壓Hive 下載網站：http://www.apache.org/dyn/closer.cgi/hive/ 百度網盤：連結：https://pan.baidu.com/s/16QzSgxa_VLnJ7ksnLUrtEw 提取碼：ef9b 這裡下載的是2.3.4 版本。

Hadoop學習記錄（二、hdfs shell命令）

在/usr/local/hadoop-2.9.2/bin目錄下執行命令 1.檢視根目錄： ./hdfs dfs -ls / 2.檔案上傳：上傳到根目錄 ./hdfs dfs -put /tmp/test.txt / 3.檢視檔案內容 ./hdfs df

三十二、HDFS產生背景、概念、優缺點、塊大小

HDFS產生背景、概念、優缺點、塊大小 1、HDFS概念 HDFS，它是一個檔案系統，用於儲存檔案，通過目錄樹來定位檔案；其次，它是

Spark核心程式設計：建立RDD（集合、本地檔案、HDFS檔案）

1,建立RDD 1.進行Spark核心程式設計時，首先要做的第一件事，就是建立一個初始的RDD。該RDD中，通常就代表和包含了Spark應用程式的輸入源資料。然後在建立了初始的RDD之後，才可以通過Spark Core提供的transformation運算元，

Linux命令操作HDFS檔案系統

HDFS命令操作 # 格式化操作 $ bin/hdfs namenode -format # 展示檔案和資料夾列表 $ bin/hdfs dfs -ls / # 建立資料夾 # 在使用者目錄下建立 $ bin/hdfs dfs -mkdir AAA/ # 在根目錄下建立 $ bi

HDFS檔案系統的基本操作

從本地系統複製一個檔案到HDFS hadoop fs -copyFromLocal input/text.txt \ hdfs://localhost/user/saikikky/text.txt 上述命令可以將本地的text.txt檔案複製到執行在localhost上的HDFS例項中，且上

02、建立RDD（集合、本地檔案、HDFS檔案）

Spark Core提供了三種建立RDD的方式，包括：使用程式中的集合建立RDD；使用本地檔案建立RDD；使用HDFS檔案建立RDD。1、並行化集合如果要通過並行化集合來建立RDD，需要針對程式中的集合，呼叫SparkContext的parallelize()方法。Spark會將集合中的資料拷貝到叢集上去，形

以太坊開發DApp實戰教程——用區塊鏈、星際檔案系統（IPFS）、Node.js和MongoDB來構建電商平臺

第一節簡介歡迎和我們一起來用以太坊實戰開發構建一個去中心化電商DApp！我們將會構建一個類似淘寶的線上電子商務應用，我將使用區塊鏈、星際檔案系統（IPFS）、Node.js和MongoDB來構建電商平臺，賣家可以自由地出售商品，買家可以自由地購物：去中心化：

開發板通過網路載入核心、裝置樹、根檔案系統

開發板要通過網路載入核心、裝置樹、檔案系統，首先要搭建好tftp和nfs服務1.搭建tftp伺服器tftp服務安裝//----虛擬機器上安裝tftp服務$ sudo dpkg -s tftpd-hpa //檢查是否安裝tftp server$ sudo apt-g

分割槽、建立檔案系統和掛載

分割槽分割槽命令主要有fdisk （主要使用）、gdisk（建立gpt型別的分割槽）、parted（可以建立任何型別的分割槽，但是分割槽過程提示對於分割槽大小的提示較少）fdisk -l /dev/sdX 檢視硬碟分割槽資訊 -c （centos6) 開啟或禁用dos模

gfs和hdfs檔案系統的區別

轉載:http://blog.csdn.net/mindfloating/article/details/49103611 我們知道 HDFS 最早是根據 GFS（Google File System）的論文概念模型來設計實現的。然後呢，我就去把 GFS 的原始論文

Linux核心驅動學習（二）----根檔案系統的構成 (root filesystem)

1、建立根檔案系統目錄和檔案 1.1建立目錄 1.2建立裝置檔案（命令mknod）；必須建立裝置檔案---consle\null 1.3建立配置檔案---複製已有的/etc目錄下的檔案

《Linux系統》之"皮毛系列"（二） Linux檔案系統的簡介

一、Linux檔案系統 1、檔案系統簡介 Linux系統的理念是：一切都是檔案。其實這個是Unix系統的哲學思想，而Linux是由Unix系統而來，所以也繼承了這個思想： Unix系統把一切資源都看作是檔案，包括硬體裝置。硬體所形成的檔案，通常稱為裝置檔案。這樣使用者

二、HDFS檔案系統

HDFS檔案系統的組成

HDFS寫資料流程

HDFS讀資料流程

機架感知

HDFS Shell命令

常用命令引數介紹

相關推薦