深入剖析MongoDB架構（資料儲存架構）

阿新 • • 發佈：2019-02-15

近日，軟體工程師Ricky Ho的在他的部落格裡發表了一篇關於MongoDB架構（ MongoDB Architecture）的博文，雖然這是一個聽起來感覺很寬泛的話題，但是作者在文章中確實對MongoDB由內至外的架構進行了剖析。本文截取了其文章中的幾張重點架構示意圖進行簡要描述。

1、MongoDB資料檔案內部結構

深入剖析MongoDB架構

MongoDB在資料儲存上按名稱空間來劃分，一個Collection是一個名稱空間，一個索引也是一個名稱空間。
同一個名稱空間的資料被分成很多個Extent，Extent之間使用雙向連結串列連線。
在每一個Extent中，儲存了具體每一行的資料，這些資料也是通過雙向連結來連線的。

每一行資料儲存空間不僅包括資料佔用空間，還可能包含一部分附加空間，這使得在資料Update變大後可以不移動位置。
索引以BTree結構實現。

2、在MongoDB中實現事務

深入剖析MongoDB架構

眾所周知， MongoDB只支援對單行記錄的原子性修改，並不支援對多行資料的原子操作。但是通過上圖中的不可思議的操作步驟，實際上你也可以自己實現該事務。其步驟如下：

第1步：先記錄一條事務記錄，將要修改的多行記錄的修改值寫到裡面，並設定其狀態為init（如果這時候操作中斷，那麼在重新啟動時，會判斷到它處於init狀態，從而將其儲存的多行修改操作應用到具體的行上）。
第2步：然後更新具體要修改的行，將剛才寫的事務記錄的標識寫到它的tran欄位中。

第3步：將事務記錄的狀態從 init變成pending（如果在這時候操作中斷，那麼在重新啟動時，會判斷到它的狀態是pending，這時檢視其所有對應的多條要修改的記錄，如果其tran值不為空，那麼就進行第4步；如果值為空，說明第4步已經執行過了，直接將其狀態從pending變成 commited就行）。
第4步：將需要修改的多條記錄的相應值加以修改，並且unset掉之前的tran欄位。
第5步：將事務記錄那一條的狀態從pending變成commited，事務至此完成。

其實上面的步驟並不罕見，在支援事務的DBMS中，其事務原子性提交的保證大多都與上面類似。而事務記錄的tran那條記錄，就類似於這些DBMS中的redolog。

3、MongoDB資料同步

深入剖析MongoDB架構

MongoDB採用Replica Sets模式的同步流程
本流程可簡要描述如下：

紅色箭頭表示寫操作可以寫到Primary上，然後非同步同步到多個Secondary上。
藍色箭頭表示讀操作可以從Primary或Secondary任意一箇中讀取。
各個Primary與Secondary之間一直保持心跳同步檢測，用於判斷Replica Sets的狀態。

4、分片機制

MongoDB的分片是指定一個分片key來進行，資料按範圍分成不同的chunk，每個chunk的大小有限制。
有多個分片節點儲存這些chunk，每個節點儲存一部分的chunk。
每一個分片節點都是一個Replica Sets，這樣保證資料的安全性。
當一個chunk超過其限制的最大體積時，會分裂成兩個小的chunk。
當chunk在分片節點中分佈不均衡時，會引發chunk遷移操作。

5、伺服器角色

前面講了分片的機制，下面是具體在分片時幾種節點的角色：

客戶端訪問路由節點mongos來進行資料讀寫。
config伺服器儲存了兩個對映關係，一個是key值的區間對應哪一個chunk的對映關係，另一個是chunk存在哪一個分片節點的對映關係。
路由節點通過config伺服器獲取資料資訊，通過這些資訊，找到真正存放資料的分片節點進行對應操作。
路由節點還會在寫操作時判斷當前chunk是否超出限定大小。如果超出，就分列成兩個chunk。
對於按分片key進行的查詢和update操作來說，路由節點會查到具體的chunk然後再進行相關的工作。

對於不按分片key進行的查詢和update操作來說，mongos會對所有下屬節點發送請求然後再對返回結果進行合併。
轉自：http://www.open-open.com/lib/view/open1348919251822.html

深入剖析MongoDB架構（資料儲存架構）

近日，軟體工程師Ricky Ho的在他的部落格裡發表了一篇關於MongoDB架構（ MongoDB Architecture）的博文，雖然這是一個聽起來感覺很寬泛的話題，但是作者在文章中確實對MongoDB由內至外的架構進行了剖析。本文截取了其文章中的幾張重點架構示意圖

WPF基礎到企業應用系列7——深入剖析依賴屬性（WPF/Silverlight核心）

一. 摘要　　首先聖殿騎士很高興這個系列能得到大家的關注和支援，這個系列從七月份開始到現在才第七篇，上一篇釋出是在8月2日，掐指一算有二十多天沒有繼續更新了，最主要原因一來是想把它寫好，二來是因為最近幾個月在籌備“雲端計算之旅”系列，所以一再推遲了釋出進度。之前一直都沒有想過

如何做資料儲存架構技術選型？（關於儲存的一些好文轉載--4）

在網際網路應用中，資料爆發式的增長，實際上軟體架構的本質就是對資料的維護。對資料的操作可以歸納為三類:讀、寫和檢索。隨著網站的流量越來越大，資料量也爆發式的增長，網站響應越來越慢，伺服器經常宕機。傳統的關係型資料庫已經不能滿足流量和資料的爆發式增長。於是根據不同的業務需求，出現了很多不同的資料

如何做資料儲存架構技術選型？（關於儲存的一些好文轉載--1）

在網際網路應用中，資料爆發式的增長，實際上軟體架構的本質就是對資料的維護。對資料的操作可以歸納為三類:讀、寫和檢索。隨著網站的流量越來越大，資料量也爆發式的增長，網站響應越來越慢，伺服器經常宕機。傳統的關係型資料庫已經不能滿足流量和資料的爆發式增長。於是根據不同的業務需求

資料整理——Oracle 18C技術架構（第四部分）

19. Database Writer Process (DBWn) 20. Checkpoint Process (CKPT) 21. Manageability Monitor Proc

[大資料] 搜尋日誌資料採集系統 flume+hbase+kafka架構（資料搜狗實驗室）

1 採集規劃說明： D1 日誌所在伺服器1 —bigdata02.com D2 日誌所在伺服器2 —bigdata03.com 日誌收集日誌收集日誌整合儲存到kafka 儲存到HBase 2版本 kafka kafka_2.11-0.10

深入剖析 Redis5.0 全新資料結構 Streams（訊息佇列的新選擇）

點選上方“芋道原始碼”，選擇“置頂公眾號”技術文章第一時間送達！原始碼精品專欄來源：阿飛的部落

分析h5牛牛制作服務器的架構（總體設計篇）

pool esql 執行存儲過程遊戲玩家是什麽包含 http name 休閑遊戲 h5牛牛制作服務器的架構交流論壇：aqiulian.com，更多服務器的架構咨詢Q:212303635。首先要說明的是, 這個棋牌遊戲的服務器架構參考了網狐棋牌的架構。網狐棋牌最令人印象

分散式系統詳解--架構（Hadoop-克隆伺服器）

分散式系統詳解--架構（Hadoop-克隆伺服器）分散式系統上一個呢，寫了一下分散式系統

Android 資料持久化技術（即資料儲存方式）

在討論資料持久化技術之前我們先了解幾個概念？什麼是瞬時資料：儲存在記憶體當中，有可能會因為程式的關閉或其他原因導致記憶體被收回而丟失的資料。為什麼採用資料持久化技術：為了保證關鍵資料在程式退出時不被丟失。什麼是資料持久化技術：將記憶體中的瞬時資料

從無到有構建大型電商微服務架構（共三階段）

從無到有構建大型電商微服務架構（共三階段）非常不錯的教程該專案按照企業的任務分工模式進行講解，完全還原企業的開發場景，讓大家體驗到正式的企業開發流程。每個階段都是一個進階，同時每個階段的程式碼都是具有極高的商業價值的，大家可以根據自己公司的業務，修改下即可以複用。我也打算逐步學習這

《Python程式設計從入門到實踐》記錄之json模組（資料儲存）

模組json讓你能夠將簡單的Python資料結構轉儲到檔案中，並在程式再次執行時載入該檔案中的資料。你還可以使用json在Python程式之間分享資料。更重要的是，JSON資料格式並非Python專用的，這讓你能夠將以JSON格式儲存的資料與使用其他程式語言的人分享。這是一種輕便格式，很有用

SpringBoot SpringCloud運用Euraka微服務架構（聚合分散式架構）Euraka釋出與消費

SpringBoot SpringCloud運用Euraka微服務架構首先說到SpringBooot專案架構，首選jdk1.8以上，當然啊，jdk1.7也不是不可以；我們本次要做的是建立父工程（pom），和多個子工程（pojo，common，server，web等），一箇中間件E

從無到有構建大型電商微服務億級架構（第三階段）

本課程將手把手帶大家從無到有實現一個真實的大型電商微服務專案，該專案是基於真實的知名網際網路企業專案講解的，本課程將分為3個階段：第一階段：會實現電商系統的大部分功能，包括：使用者管理，訂單管理，商品管理，支付功能，後臺管理系統，單點登入，購物車，搜尋功能，個人中心等等。第二階段：進一步完善系

Redis原始碼剖析和註釋（二十五）--- Redis Cluster 的通訊流程深入剖析（載入配置檔案、節點握手、分配槽）

Redis Cluster 通訊流程深入剖析 1. Redis Cluster 介紹和搭建這篇部落格會介紹Redis Cluster的資料分割槽理論和一個三主三從叢集的搭建。 2. Redis Cluster 和 Redis Sentin

Memcached,Redis,MongoDB（資料快取系統）方案分析與對比

一、問題每次查詢的資料量極大，需要讓伺服器更加快速地響應使用者的請求。二、解決方案 1. 通過高速伺服器Cache快取資料庫資料 2. 記憶體資料庫三、主流Cache和資料庫對比普通關係資料庫 mysql 記憶體資料庫 redis no

Hawq學習筆記 --- MPP(大規模並行處理)架構（Massively Parallel Processing）

MPP是 Massively Parallel Processing的縮寫。 MPP 是將任務並行的分散到多個伺服器和節點上，在每個節點上計算完成後，將各自部分的結果彙總在一起得到最終的結果。　　首先MPP 必須消除手工切分資料的工作量。這是MySQL

看資料結構寫程式碼（20）稀疏矩陣（順序儲存方式）

雜談：昨天辭職了，告別了繁重又無意義的工作。準備在家專心學習資料結構,好好磨練自己的基本功。在寫這個小例子的時候遇到了 stack overflow(棧溢位）的問題，是自己分配了過大的棧變數，導致棧溢位。說實話，這還是第一次遇到，呵呵，別笑話我。看到網上的部落

Memcache,Redis,MongoDB（資料快取系統）方案對比與分析

應該說Memcached和Redis都能很好的滿足解決我們的問題，它們效能都很高，總的來說，可以把Redis理解為是對Memcached的拓展，是更加重量級的實現，提供了更多更強大的功能。具體來說： 1.效能上：效能上都很出色，具體到細節，由於Redis只使用單核，而Memcached可以使

SAP叢集與OSB叢集的夢幻架構（Oracle service bus）

在本次的整車工廠專案中，我們部署了SAP S4HANA的伺服器叢集，Oracle service bus的伺服器叢集， ERP系統服務依然還是各系統的核心，本次匯流排專案共100個介面，ERP系統佔了一半。在藍圖階段，我們實現了OSB叢集伺服器同SAP伺服器的連線： OSB同

深入剖析MongoDB架構（資料儲存架構）

相關推薦