1. 程式人生 > >第123講:Hadoop叢集管理之Namenode目錄元資料結構詳解學習筆記

第123講:Hadoop叢集管理之Namenode目錄元資料結構詳解學習筆記

123講:Hadoop叢集管理之Namenode目錄元資料結構詳解學習筆記

hadoop-2.x的叢集管理與hadoop-1.x有很大不同

hdfs-site.xml

dfs.replication

dfs.namenode.name.dir  存放namenode元資料資訊

可以配置多個目錄,這些目錄完全相同,一個損壞不影響hdfs上的資料。

hadoop-2.6.0/dfs/name/current就是存放namenode元資料資訊的地方

fsimage是映象檔案,包含了namenode所有的元資料資訊。

VERSION中有namespaceID/clusterID/cTime/storagetype/bolckpoolID/layoutVersion

namespaceID是檔案系統的唯一識別符號,格式化檔案系統後就會生成這個ID

clusterID是系統生成的叢集的ID;

cTimenamenode儲存系統建立是時間,第一次格式化系統就是0,再次格式化時就會更新;

toragetype說明檔案儲存的是什麼系統儲存的資訊,可能是namenode/datanode

bolckpoolID是針對每一個namespace對應的bolckpoolID,包含儲存節點的IP等資訊

seen_txid:存放transactionID,格式化檔案系統後這個數字是0,代表一系列edits_*檔案的尾數,namenode重啟時會迴圈從0001seen_txid中的數字,

hdfs重啟時會比對這個數字是不是edits檔案的尾數,如果不是的話可能會有元資料丟失。

fsimage是整個namenode的映象,包含臨時檔案edits。後面還會講解。

in_user.lock是因為我們啟動了叢集。

以上內容是從王家林老師DT大資料課程第121講的學習筆記。
DT大資料微信公眾賬號:DT_Spark  

王家林老師QQ:1740415547 

王家林老師微訊號:18610086859
 王家林的第一個中國夢:免費為全社會培養100萬名優秀的大資料從業人員!
您可以通過王家林老師的微訊號18610086859發紅包捐助大資料、網際網路+O2O、工業4.0、微營銷、移動網際網路等系列免費實戰課程, 目前已經發布的王家林免費視訊全集如下:

1,《大資料不眠夜:Spark核心天機解密(共100講)》: http://pan.baidu.com/s/1eQsHZAq

2,《Hadoop深入淺出實戰經典》http://pan.baidu.com/s/1mgpfRPu 

3,《Spark純實戰公益大講壇》http://pan.baidu.com/s/1jGpNGwu 

4,《Scala深入淺出實戰經典》http://pan.baidu.com/s/1sjDWG25 

5,《Docker公益大講壇》http://pan.baidu.com/s/1kTpL8UF 

6,《Spark亞太研究院Spark公益大講堂》http://pan.baidu.com/s/1i30Ewsd 

7DT大資料夢工廠SparkScalaHadoop的所有視訊、PPT和程式碼在百度雲網盤的連結:

http://pan.baidu.com/share/home?uk=4013289088#category/type=0&qq-pf-to=pcqq.group 

王家林免費在51CTO釋出的1000集合大資料sparkhadoopscaladocker視訊:

1,《Scala深入淺出實戰初級入門經典視訊課程》http://edu.51cto.com/lesson/id-66538.html 

2,《Scala深入淺出實戰中級進階經典視訊課程》http://edu.51cto.com/lesson/id-67139.html 

3,《Akka深入淺出實戰經典視訊課程》http://edu.51cto.com/lesson/id-77672.html 

4,《Spark亞太研究院決勝大資料時代公益大講堂》http://edu.51cto.com/lesson/id-30815.html 

5,《雲端計算Docker虛擬化公益大講壇 》http://edu.51cto.com/lesson/id-61776.html 

6,《Spark 大講堂(純實戰手動操作)》http://edu.51cto.com/lesson/id-78653.html 

7,《Hadoop深入淺出實戰經典視訊課程-叢集、HDFSYarnMapReducehttp://edu.51cto.com/lesson/id-77141.html 

8,《從技術角度思考Hadoop到底是什麼》http://edu.51cto.com/course/course_id-1151.html 

DT大資料夢工廠”團隊第一個中國夢:免費為社會培養100萬名優秀的大資料從業人員。每天早上4點起持續分享大資料、網際網路+O2O、工業4.0、微營銷、移動網際網路等領域的

第121講視訊網站地址:

51CTO

http://edu.51cto.com/lesson/id-77802.html

相關推薦

123Hadoop叢集管理Namenode目錄資料結構學習筆記

第123講:Hadoop叢集管理之Namenode目錄元資料結構詳解學習筆記 hadoop-2.x的叢集管理與hadoop-1.x有很大不同 hdfs-site.xml: dfs.replication dfs.namenode.name.dir  存放namenode元資

127Hadoop叢集管理安全模式解析及動手實戰學習筆記

第127講:Hadoop叢集管理之安全模式解析及動手實戰學習筆記 hadoop在啟動時namenode會把fsimage載入進記憶體,同時和edits內容合併,以此建立整個檔案系統的元資料的映象(記憶體級別),所以客戶端可以通過namenode訪問檔案系統的資訊。完成後變成

六六seo基礎運營seo基礎術語網站外鏈

關鍵字排名 置疑 ip) seo技術 流量 爬取 傳播 站點 簡單 第五講六六和同學們闡述了網站內鏈建設布局的重要性。本文六六seo基礎運營第六講給同學們介紹網站外鏈的建設。外鏈是seo術語之一,內鏈的排名是依托於良好外鏈的建設。下面六六詳細給大家百科一下網站外鏈。 六六s

11課--11_04_Linux網絡配置四 ifconfig及ip命令

config linux 在線 自動分配 隨機 隨機生成 內核的功能 conf 而不是 一、備用DNS,主DNS是最快的。當主DNS不在線時才用備用DNS。而不是主DNS解析不出來的時候就。主的解析不出來,備用 的肯定也解析不出來,都是國際聯網的。二、DHCP(dynami

SpringMVC(19)Date、DateTime、String於springmvc 的資料傳遞

2018年1月24日 【1】java-SE: Date型別: Methods Modifier and Type Method and Description int Deprecated.   int int void Deprecated.

hashmap資料結構(五)HashMap、HashTable、ConcurrentHashMap 的區別

【hashmap 與 hashtable】   hashmap資料結構詳解(一)之基礎知識奠基 hashmap資料結構詳解(二)之走進JDK原始碼 hashmap資料結構詳解(三)之hashcode例項及大小是2的冪次方解釋 hashmap資料結構詳解(四)之has

資料結構與演算法學習筆記後進先出的“桶”

前言 棧最為一種的常用的資料結構,用“桶”來形容最合適不過;今天我們就來學習一下 正文 一、棧的定義? 1.“後進先出,先進後出”的資料結構。 2.從操作特性來看,是一種“操作受限”的線性表,只可以在一端插入和刪除資料。   二、為什麼需要棧?  

#資料結構與演算法學習筆記#劍指Offer29整數中1出現的次數 + 分段思想/按位考慮 + 測試用例(Java、C/C++)

2018.10.5 感受到開學之後工作和課業的雙重壓力,加上近段時間自己出了點小事故,因此斷更了許久。沒事,繼續。 這道題有兩種複雜度為的演算法。 方法1:遞迴(分段思想)。 所有數字出現1的個數 = 每一段數字中出現1的個數之和 1. 對於輸出的數字n,其最高位為

#資料結構與演算法學習筆記#劍指Offer30把陣列排成最小的數 + 自定義比較器 + 測試用例(Java、C/C++)

2018.10.6 1.求全排列最小。事實上用全排列硬剛這道題確實是最直接的辦法,因為乍一眼看上去實在不好歸納數字之間的順序關係,全排列具體實現原理可以參考上述文章。 2.自定義比較器。為什麼說

資料結構與演算法學習筆記 複雜度分析

前言:   大家都知道資料結構和英語,就如同程式設計師的兩條腿一樣;只有不斷的積累,學習,擁有了健壯的“雙腿”才能越走越遠;在資料結構和演算法的領域,不得不承認自己就是一隻菜鳥;需要不斷的學習;在學習過程中,經常會有一些自己的看法,和別人獨特的見解;我都會一一做好筆記,以便進步; 正文:複雜度分析

資料結構與演算法學習筆記 提高讀取效能的連結串列(上)

前言   連結串列(Linked list)比陣列稍微複雜一點,在我們生活中用到最常見的應該是快取,它是一種提高資料讀取效能的技術,常見的如cpu快取,瀏覽器快取,資料庫快取等。今天我們就來學習一下連結串列 正文 一、連結串列的定義? 1.一種線性表(資料排成像一條線一樣的結構。每個線性表上的資料最多

資料結構與演算法學習筆記先進先出的佇列

前言   佇列是一種非常實用的資料結構,類似於生活中發排隊,可應用於生活,開發中各個方面,比如共享印表機(先請求先列印),訊息佇列。你想知道他們是怎麼工作的麼。那就來一起學習一下佇列吧 正文 一、佇列的定義? 1.一種先進先出的線性表 2.只允許入棧 push()和出棧 pop() 在後端(稱

資料結構與演算法學習筆記高效、簡潔的編碼技巧“遞迴”

前言 盜夢空間想象大多數人都看過:電影講述的是主人公諾蘭進入希裡安·墨菲夢境植入想法的行動。為了向希裡安·墨菲夢植入理念,影片進入四層夢境,即所謂:“夢中的夢中 夢中人的夢中”。 有一對兔子,每隔三個月會產下一對小兔子,小免子每隔三個月,也會產生新的一對免子,問36個月後,共有多少對兔子。 諸如此類:其

資料結構與演算法學習筆記如何分析一個排序演算法?

前言 現在IT這塊找工作,不會幾個演算法都不好意思出門,排序演算法恰巧是其中最簡單的,我接觸的第一個演算法就是它,但是你知道怎麼分析一個排序演算法麼?有很多時間複雜度相同的排序演算法,在實際編碼中,那又如何選擇呢?下面我們帶著問題一起學習一下。  正文 一、常見經典的排序方法 (圖片來自於一畫素)

#資料結構與演算法學習筆記#劍指Offer34兩個連結串列的第一個公共結點 + 等長遍歷/輔助棧 + 測試用例(Java、C/C++)

2018.10.21 這道題也是屬於效率題,實現難度不大,但是要降低複雜度還是需要思考一下。有兩個o(n)的做法: 方法一:等長連結串列法。先計算兩條連結串列的長度,然後先遍歷長連結串列直到兩條連結串列等長,最後依次按奇偶順序挨個遍歷兩條連結串列各個結點。 方法二:輔助

#資料結構與演算法學習筆記#劍指Offer35數字在排序陣列中出現的次數 + 測試用例(Java、C/C++)

2018.10.24 今天是程式設計師節,但是程式設計師有啥節好過的,還是好好幹活吧~ 這道題也是一道效率題,根據實際情況的不同有兩個比較好用的方法: 方法一:平均複雜度o(n)。二分找到某一個K

資料結構與演算法學習筆記 適合大規模的資料排序

前言   在資料排序的演算法中,不同資料規模應當使用合適的排序演算法才能達到最好的效果,如小規模的資料排序,可以使用氣泡排序、插入排序,選擇排序,他們的時間複雜度都為O(n2),大規模的資料排序就可以使用歸併排序和快速排序,時間複雜度為O(nlogn)。今天我們就來看一下歸併排序和快速排序。 正文   

資料結構與演算法學習筆記為用於高考名次排序的排序演算法

前言   在高考結束以後,所有人都在等著成績,政府部門面對幾百萬的資料,你知道他們是怎麼算名次的麼?上一次學到遞迴排序以及快排,確實,用他們可以實現,可是他們的時間複雜度最低都是O(nlogn)。今天我們來看看有沒有更快捷的排序方法? 正文   桶排序   原理: 將需要排序的資料分到幾個有序的

#資料結構與演算法學習筆記#劍指Offer35是否平衡二叉樹/AVL樹 + 測試用例(Java、C/C++)

2018.11.3 前幾天有用遞迴實現了二叉樹的深度#資料結構與演算法學習筆記#劍指Offer36:二叉樹的深度(Java),因此可以對每個結點先序遍歷進行一次平衡驗證,只要確定每個結點都是平衡的

資料結構與演算法學習筆記複雜度分析

一、為什麼要進行復雜度分析     資料結構是用來解決“快”和“省”的問題,也就是如何是程式碼執行更快以及如何節省更多的空間。因此執行效率在演算法中就是一個非常重要的考核指標。時間、空間複雜度分析就是用來衡量一個演算法程式碼的執行效率的指標。複雜度分析在資料結構和演算法中佔