淺談HDFS（一）

產生背景及定義

HDFS：分散式檔案系統，用於儲存檔案，主要特點在於其分散式，即有很多伺服器聯合起來實現其功能，叢集中的伺服器各有各的角色

隨著資料量越來越大，一個作業系統存不下所有的資料，那麼就分配到更多的作業系統管理的磁碟中，但是管理和維護極不方便，於是迫切需要一種系統來管理多臺機器上的檔案，這就是分散式管理系統，HDFS是其中一種。
HDFS的使用適合一次寫入，多次讀出的場景，且不支援對檔案的直接修改，僅支援在檔案末尾追加
HDFS採用流式的資料訪問方式：特點就是像流水一樣，資料不是一次過來，而是一點一點“流”過來，處理資料也是一點一點處理。如果是資料全部過來之後才處理，那麼延遲就會很大，而且會消耗很大的記憶體。

優缺點

高容錯性
- 資料自動儲存多個副本，通過增加副本的方式，提高容錯性
- 若某一個副本丟失後，它可以自動分配到其它節點作為新的副本
處理大資料
- 資料規模：能夠處理的資料規模可以達到GB，TB，甚至PB級別的資料
- 檔案規模：能夠處理百萬規模以上的檔案數量，數量相當之大
可構建在廉價的機器上，通過多副本機制，提高可靠性

組成架構

namenode（nn）：就是Master，是一個管理者，存放元資料
- 管理HDFS的名稱空間
- 配置副本策略
- 管理資料塊的對映資訊
- 處理客戶端的讀寫請求
datanode（dn）：就是slave，真正儲存檔案的地方
- 儲存實際的資料塊
- 執行資料塊的讀寫操作
secondarynamenode（2nn）：並非namenode的熱備，當namenode掛掉的時候，並不能馬上替換namenode並提供服務
- 作為namenode的輔助，分擔其工作量，比如定期合併Fsimage和Edits（文章後邊會講到這兩個東西），並推送給namenode
- 在緊急情況下，可輔助恢復namenode，但是隻能恢復部分，而不能全部恢復
client：客戶端
- 檔案的切分，在上傳HDFS之前，client將檔案切分為一個一個的Block，然後一個一個進行上傳
- 與namenode互動，獲取檔案的datanode資訊
- 與datanode互動，讀取或寫入資料
- client提供一些命令來管理HDFS，比如namenode的格式化
- client通過一些命令來訪問HDFS，比如對HDFS的增刪查改等

檔案塊大小

為什麼要把檔案抽象為Block塊儲存？

block的拆分使得單個檔案大小可以大於整個磁碟的容量，構成檔案的Block可以分佈在整個叢集，理論上，單個檔案可以佔據叢集中所有機器的磁碟。

Block的抽象也簡化了儲存系統，對於Block，無需關注其許可權，所有者等內容（這些內容都在檔案級別上進行控制）。

Block作為容錯和高可用機制中的副本單元，即以Block為單位進行復制。

HDFS中的檔案在實體記憶體中分塊儲存（Block），塊的大小在Hadoop2.x版本中預設為128M，在老版本中為64M，那麼為什麼為128M呢？

其實，HDFS的塊的大小的設定主要取決於磁碟傳輸速率，如下：

如果在HDFS中，定址時間為10ms，即查詢到目標Block的時間為10ms
專家說操作的最佳狀態為：定址時間為傳輸時間的1%，因此傳輸時間為1s
而目前磁碟的傳輸速率普遍為100M/s

為什麼塊大小不能設定太小，也不能設定太大？

HDFS的塊設定太小，會增加定址時間，使得程式可能一直在尋找塊的開始位置

如果設定的太大，從磁碟傳輸資料的時間會明顯大於定位這個塊所需的定址時間，導致程式處理這塊資料時會非常慢

HDFS的資料流

HDFS寫資料流程

客戶端通過Distributed FileSystem模組向NameNode請求上傳檔案，NameNode檢查目標檔案是否已存在，父目錄是否存在。
NameNode返回是否可以上傳。
客戶端請求第一個 Block上傳到哪幾個DataNode伺服器上。
NameNode返回3個DataNode節點，分別為dn1、dn2、dn3，如果有多個節點，返回實際的副本數量，並根據距離及負載情況計算
客戶端通過FSDataOutputStream模組請求dn1上傳資料，dn1收到請求會繼續呼叫dn2，然後dn2呼叫dn3，將這個通訊管道建立完成。
dn1、dn2、dn3逐級應答客戶端。
客戶端開始往dn1上傳第一個Block（先從磁碟讀取資料放到一個本地記憶體快取），以Packet為單位，dn1收到一個Packet就會傳給dn2，dn2傳給dn3；dn1每傳一個packet會放入一個應答佇列等待應答。
當一個Block傳輸完成之後，客戶端再次請求NameNode上傳第二個Block的伺服器。（重複執行3-7步）。

網路拓撲---節點距離計算

在HDFS寫資料的過程中，NameNode會選擇距離待上傳資料最近距離的DataNode接收資料，那麼這個最近距離是怎麼計算的呢？

結論：兩個節點到達最近的共同祖先的距離總和，即為節點距離。

如上圖所示：

同一節點上的程序節點距離為0
同一機架上不同節點的距離為兩個節點到共同機架r1的距離總和，為2
同一資料中心不同機架的節點距離為兩個節點到共同祖先叢集d1的距離之和，為4
不同資料中心的節點距離為兩個節點到達共同祖先資料中心的距離之和，為6

機架感知（副本儲存的節點選擇）

副本的數量我們可以從配置檔案中設定，那麼HDFS是怎麼選擇副本儲存的節點的呢？

如上圖所示，為了提高容錯性，有如下設定，加入現在有3個副本：

第一個副本在Client所在的節點上，如果客戶端在叢集外，則隨機選一個
第二個副本和第一個副本位於相同機架，隨機節點
第三個副本位於不同機架，隨機節點

這樣做的目的就是為了提高容錯性。

HDFS讀資料流程

客戶端通過Distributed FileSystem向NameNode請求下載檔案，NameNode通過查詢元資料，找到檔案塊所在的DataNode地址。
挑選一臺DataNode（就近原則，然後隨機）伺服器，請求讀取資料。
DataNode開始傳輸資料給客戶端（從磁盤裡面讀取資料輸入流，以Packet為單位來做校驗）。
客戶端以Packet為單位接收，先在本地快取，然後寫入目標檔案。

產生背景及定義 HDFS：分散式檔案系統，用於儲存檔案，主要特點在於其分散式，即有很多伺服器聯合起來實現其功能，叢集中的伺服器各有各的角色隨著資料量越來越大，一個作業系統存不下所有的資料，那麼就分配到更多的作業系統管理的磁碟中，但是管理和維護極不方便，於是迫切需要一種系統來管理多臺機器上的檔案，這就是

【原創】淺談webview（一）——驚鴻一瞥

版本開發 spa 占用混合原創大量功能性內存泄漏眾所周知，APP開發過程中經常會通過webview實現HTML5(H5)的渲染，實現H5和Native的混合開發(Hybrid Development)。Hybrid Development可以加速

淺談資料庫（一）

** 1、MySQL概述 a、什麼是資料庫儲存資料的倉庫 b、哪些公司在用資料庫金融機構、遊戲網站、購物網站、論壇網站 ... ... c、資料庫服務軟體 ***1、軟體分類*** MySQL、Oracle、SQL_Server、MongoDB、DB2、M

淺談SEO（一）搜尋引擎與SEO

淺談SEO（一）搜尋引擎與SEO 作為一個Web開發者，除了要能夠寫出可用的業務程式碼，還要在其他方面進行優化。所以我就開了這樣一個系列的文章記錄我的學習過程. 搜尋引擎搜尋引擎（Search Engine）是指根據一定的策略、運用特定的計算機程式從網

淺談ActiveMQ（一）-架構

1.簡介ActiveMQ為apache下頂級開源專案，符合jms規約的訊息中介軟體。關於部署方式，網上有很多這裡不再贅述。2.基於中介軟體的架構2.1架構圖對比一、傳統架構：系統間直接互相呼叫，如果系統比較多那麼就會形成網狀呼叫圖，各個系統互相嵌入比價深，形成強依賴，可能一個

淺談AOP（一）

什麼是AOP? 　　Aspect Oriented Programming，裝逼的最高境界就是不假思索的說出來這三個詞，換成中國話就是面向切面程式設計，聽師姐講過一次，前幾天總結SSH的時候，其中的spring的核心技術就是AOP和IOC，今天就做一個關於AO

淺談Kotlin（三）：類

ide pos 中一 androi 文件 rri object 淺談 spa 淺談Kotlin（一）：簡介及Android Studio中配置淺談Kotlin（二）：基本類型、基本語法、代碼風格前言：　　已經學習了前兩篇文章，對Kotlin有了一個基本的認識，往後

淺談表格（jq）的增、刪、改、查

false als 刪除 parse ++ script span 原生js true html代碼： <table border="1" cellpadding="20" cellspacing="0"> <thead> <t

Hadoop源碼學習之HDFS（一）

-a node bsp ima 數據 layout 版本號 name 技術　　Hadoop的HDFS可以分為NameNode與DataNode,NameNode存儲所有DataNode中數據的元數據信息。而DataNode負責存儲真正的數據（數據塊）信息以及數據塊的ID。

淺談splay（雙旋）

搜索 roo alt 大小 index swa del using 函數今天剛剛學習完splay，講一下自己的想法吧首先splay和treap不一樣，treap通過隨機數來調整樹的形態。但splay不一樣，再每插入或操作一次後，你都會把他旋轉到根，再旋轉過程中樹的形態

淺談ThinkPHP（三）

實現商品的新增 1、在add.html頁面中更改表單元素的名稱 Goods控制器的add（）方法中獲取商品分類在add.html中迴圈獲取 2、設定提交的位置 3、新增商品程式碼參見GoodsController.class.php

淺談資料庫（三）

1、SQL查詢 1、distinct : 不顯示欄位的重複值 1、語法：select distinct 欄位1,欄位2 from 表名; 2、示例 1、表中都有哪些國家 select distinct country from sanguo;

淺談資料庫（二）

1、資料型別 1、數值型別 2、字元型別 3、列舉型別 4、日期時間型別 1、date ："YYYY-MM-DD" 2、datetime ："YYYY-MM-DD HH:MM:SS" 3、timestamp ："YYYY-MM-DD HH:MM:SS"

淺談資料庫（五）

1、資料備份(mysqldump,在Linux終端操作) 1、命令格式 mysqldump -u使用者名稱 -p 源庫名 > ***.sql 2、源庫名的表示方式 --all-databases 備份所有庫庫名備份1

淺談資料庫（四）

** 淺談資料庫（四） ** ** ``` 1、外來鍵(foreign key) 1、定義：讓當前表的欄位值在另一張表的範圍內去選擇 2、語法格式 foreign key(參考欄位名) references 主表(被參考欄位名) on delet

HDFS（一）—— 使用 HDFS 的 WebConsole

當執行啟動 HDFS 的時候，可以通過 WebConsole（網頁管理介面）來檢視 HDFS 的狀態，執行一些操作。一些常用的 WebConsole 埠： 8088：Yarn 50070：NameNode 50090：SecondaryNameNode

淺談彙編（2）——堆疊指令

現今的CPU中都有棧的設計。8086CPU提供相關的指令來以棧的方式訪問記憶體空間。這意味著，我們在基於8086CPU程式設計的時候，可以將一段記憶體當作棧來使用。 8086CPU提供入棧和出棧指令：（最基本的） PUSH（入棧） push ax：將暫存器ax中的資料送

淺談移動開發(一）趨勢

移動開發這幾年的發展異常迅猛，在這個智慧手機普及得像人體器官的時代，遊戲、電商移動平臺和社交軟體給人們生活帶來的的鉅變。隨著移動網際網路向各行各業的滲透，企業級的應用也開始發力，專家們預測現階段已經進入企業級移動應用爆發的時代，各企業級應用平臺廠商和IT服務企業對移動開發人才的爭奪也日

Mysql 流增量寫入 Hdfs（一） --從 mysql 到 kafka

一. 概述在大資料的靜態資料處理中，目前普遍採用的是用 Spark + Hdfs （Hive / Hbase）的技術架構來對資料進行處理。但有時候有其他的需求，需要從其他不同資料來源不間斷得采集資料，然後儲存到 Hdfs 中進行處理。而追加（append）這種操作在 Hdfs 裡面明顯是比較麻煩的一件事

泰勒公式淺談原理（轉） ----- 深度好文，一點是如何蘊含整個世界

泰勒公式淺談原理（轉）上週寫完了《《三體》讀後思考-泰勒展開/維度打擊/黑暗森林》後收到一些郵件，進一步思考了關於泰勒展開的意義。也許我掌握的那些網路技術比如Linux Netfilter，NAT之類，太過底層太過小眾，所以大家幾乎都是沒有感興趣的