1. 程式人生 > >MogoDB(6)--mongoDB高可用和4.0特性

MogoDB(6)--mongoDB高可用和4.0特性

for docs 提供服務 restore 參數 分塊 tar 5.7 chunk

5.1、MongoDB 用戶管理

1、用戶管理
1.1、添加用戶
為 testdb 添加 tom 用戶

use testdb
db.createUser({user:"tom",pwd:"123",roles:[{ role:"dbAdmin",db:"testdb"}]})

具體角色有
read:允許用戶讀取指定數據庫
readWrite:允許用戶讀寫指定數據庫
dbAdmin:允許用戶在指定數據庫中執行管理函數,如索引創建、刪除,查看統計或訪問 system.profile
userAdmin:允許用戶向 system.users 集合寫入,可以找指定數據庫裏創建、刪除和管理用戶
clusterAdmin:只在 admin 數據庫中可用,賦予用戶所有分片和復制集相關函數的管理權限。

readAnyDatabase:只在 admin 數據庫中可用,賦予用戶所有數據庫的讀權限
readWriteAnyDatabase:只在 admin 數據庫中可用,賦予用戶所有數據庫的讀寫權限
userAdminAnyDatabase:只在 admin 數據庫中可用,賦予用戶所有數據庫的 userAdmin 權限
dbAdminAnyDatabase:只在 admin 數據庫中可用,賦予用戶所有數據庫的 dbAdmin 權限。
root:只在 admin 數據庫中可用。超級賬號,超級權限

1.2 查看所有用戶

db.system.users.find()

和用戶管理相關的操作基本都要在 admin 數據庫下運行,要先 use admin;

如果在某個單一的數據庫下,那只能對當前數據庫的權限進行操作;

1.3、用戶刪除操作

db.system.users.remove({user:"tom"});

1.4 查看當前用戶權限

db.runCommand({usersInfo:"tom",showPrivileges:true})

1.5 修改密碼

use testdb
db.changeUserPassword("tom", "123456")

1.6、啟用用戶

db.auth("tom","123")

 

1.7、安全檢查 --auth
非 testdb 是不能操作數據庫的,啟用自己的用戶才能訪問

非 admin 數據庫的用戶不能使用數據庫命令,admin 數據庫中的數據經過認證為管理員用戶

5.2、MongoDB 高可用方案實戰演

詳解 RouteServer(路由服務器)、
ConfigServer(配置服務器)、
Replica Set(副本集)、
Shard(切片)、
Chunk(分塊)MongDB 啟動與關閉


1、命令行啟動

$ ./mongod --fork --dbpath=/opt/mongodb/data

 

2、配置文件啟動

$ ./mongod -f mongodb.cfg

  mongoDB 基本配置/opt/mongodb/mongodb.cfg

dbpath=/opt/mongodb/data
logpath=/opt/mongodb/logs/mongodb.log
logappend=true
fork=true
bind_ip=192.168.209.128
port=27017

  環境變量配置

export PATH=/opt/mongodb/bin:$PATH

  Mongodb 的三種集群方式的搭建:Master-Slaver/Replica Set / Sharding。

5.3、MongoDB 主從搭建


這個是最簡答的集群搭建,不過準確說也不能算是集群,只能說是主備(3.2版本時推薦)。並且官方(4.0版本)已經不推薦這種方式,
所以在這裏只是簡單的介紹下吧,搭建方式也相對簡單。
主機配置 /opt/mongodb/master-slave/master/mongodb.cfg

dbpath=/opt/mongodb/master-slave/master/data
logpath=/opt/mongodb/master-slave/master/logs/mongodb.log
logappend=true
fork=true
bind_ip=192.168.209.128
port=27001
master=true
source=192.168.209.128:27002

  從機配置 /opt/mongodb/master-slave/slave/mongodb.cfg

dbpath=/opt/mongodb/master-slave/slave/data
logpath=/opt/mongodb/master-slave/slave/logs/mongodb.log
logappend=true
fork=true
bind_ip=192.168.209.128
port=27002
slave=true
source=192.168.209.128:27001

  啟動服務

cd /opt/mongodb/master-slave/master/
mongod --config mongodb.cfg #主節點
cd /opt/mongodb/master-slave/slave/
mongod --config mongodb.cfg #從節點

  連接測試

#客戶端連接主節點
mongo --host 192.168.209.128 --port 27001
#客戶端從節點
mongo --host 192.168.209.128 --port 27002

  

基本上只要在主節點和備節點上分別執行這兩條命令,Master-Slaver 就算搭建完成了。我沒有試過
主節點掛掉後備節點是否能變成主節點,不過既然已經不推薦了,大家就沒必要去使用了。

5.4、MongoDB 副本集

中文翻譯叫做副本集,不過我並不喜歡把英文翻譯成中文,總是感覺怪怪的。其實簡單來說就是集
群當中包含了多份數據,保證主節點掛掉了,備節點能繼續提供數據服務,提供的前提就是數據需要和主節點一致。如下圖:(安裝時圖中)

Mongodb(M)表示主節點,Mongodb(S)表示備節點,Mongodb(A)表示仲裁節點。主備節點存儲數據,仲裁節點不存儲數據。客戶端同時連接主節點與備節點,不連接仲裁節點。
默認設置下,主節點提供所有增刪查改服務,備節點不提供任何服務。但是可以通過設置使備節點提供查詢服務,這樣就可以減少主節點的壓力,當客戶端進行數據查詢時,請求自動轉到備節點上。這
個設置叫做 Read Preference Modes,同時 Java 客戶端提供了簡單的配置方式,可以不必直接對數據庫進行操作。

仲裁節點是一種特殊的節點,它本身並不存儲數據,主要的作用是決定哪一個備節點在主節點掛掉之後提升為主節點,所以客戶端不需要連接此節點。這裏雖然只有一個備節點,但是仍然需要一個仲裁節點
來提升備節點級別。我開始也不相信必須要有仲裁節點,但是自己也試過沒仲裁節點的話,主節點掛了備節點還是備節點,所以咱們還是需要它的。

介紹完了集群方案,那麽現在就開始搭建了。(註意版本,3.2等低版本不支持)

1.建立數據文件夾
一般情況下不會把數據目錄建立在 mongodb 的解壓目錄下,不過這裏方便起見,就建在 mongodb 解壓目錄下吧。

#三個目錄分別對應主,備,仲裁節點
mkdir -p /opt/mongodb/replset/master
mkdir -p /opt/mongodb/replset/slaver
mkdir -p /opt/mongodb/replset/arbiter

  

2.建立配置文件
由於配置比較多,所以我們將配置寫到文件裏。
vi /opt/mongodb/replset/master/mongodb.cfg

dbpath=/opt/mongodb/replset/master/data
logpath=/opt/mongodb/replset/master/logs/mongodb.log
logappend=true
replSet=shard002
bind_ip=192.168.25.128
port=27017
fork=true

  vi /opt/mongodb/replset/slave/mongodb.cfg

dbpath=/opt/mongodb/replset/slave/data
logpath=/opt/mongodb/replset/slave/logs/mongodb.log
logappend=true
replSet=shard002
bind_ip=192.168.25.129
port=27017
fork=true

  vi /opt/mongodb/replset/arbiter/mongodb.cfg

dbpath=/opt/mongodb/replset/arbiter/data
logpath=/opt/mongodb/replset/arbiter/logs/mongodb.log
logappend=true
replSet=shard002
bind_ip=192.168.25.130
port=27017
fork=true 

參數解釋:
dbpath:數據存放目錄
logpath:日誌存放路徑
logappend:以追加的方式記錄日誌
replSet:replica set 的名字
bind_ip:mongodb 所綁定的 ip 地址
port:mongodb 進程所使用的端口號,默認為 27017
fork:以後臺方式運行進程

3、分發到集群下的其他機器

#將從節點配置發送到 192.168.25.129
scp -r /opt/mongodb/replset/slave
[email protected]:/opt/mongodb/replset
#將仲裁節點配置發送到 192.168.25.130
scp -r /opt/mongodb/replset/arbiter
[email protected]:/opt/mongodb/replset

 

4.啟動 mongodb
進入每個 mongodb 節點的 bin 目錄下

#登錄 192.168.25.128 啟動主節點
monood -f /opt/mongodb/replset/master/mongodb.cfg
#登錄 192.168.25.129 啟動從節點
mongod -f /opt/mongodb/replset/slave/mongodb.cfg
#登錄 192.168.25.130 啟動仲裁節點
mongod -f /opt/mongodb/replset/arbiter/mongodb.cfg

  註意配置文件的路徑一定要保證正確,可以是相對路徑也可以是絕對路徑

5.配置主,備,仲裁節點
可以通過客戶端連接 mongodb,也可以直接在三個節點中選擇一個連接 mongodb。

#ip 和 port 是某個節點的地址
mongo 192.168.25.128:27017
use admin
cfg={_id:"shard002",members:[{_id:0,host:‘192.168.25.128:27017‘,pri
ority:9},{_id:1,host:‘192.168.25.129:27017‘,priority:1},{_id:2,host
:‘192.168.25.130:27017‘,arbiterOnly:true}]};
#使配置生效
rs.initiate(cfg)

  

註意:cfg 是相當於設置一個變量,可以是任意的名字,當然最好不要是 mongodb 的關鍵字,conf,config 都可以。最外層的_id 表示 replica set 的名字,members 裏包含的是所有節點的地址以及優
先級。優先級最高的即成為主節點,即這裏的 192.168.209.128:27017。特別註意的是,對於仲裁節點,需要有個特別的配置——arbiterOnly:true。這個千萬不能少了,不然主備模式就不能生效

配置的生效時間根據不同的機器配置會有長有短,配置不錯的話基本上十幾秒內就能生效,有的配置需要一兩分鐘。如果生效了,執行 rs.status()命令會看到如下信息:

{
	"set" : "testrs",
	9
	"date" : ISODate("2013-01-05T02:44:43Z"),
	"myState" :
	1,
	"members" : [
	{
	"_id" : 0,
	"name" : "192.168.209.128:27004",
	"health" :
	1,
	"state" : 1,
	"stateStr" : "PRIMARY",
	"uptime" : 200,
	"optime" :
	Timestamp(1357285565000, 1),
	"optimeDate" :
	ISODate("2017-12-22T07:46:05Z"),
	"self" : true
	},
	{
	"_id" : 1,
	"name" :
	"192.168.209.128:27003",
	"health" : 1,
	"state" : 2,
	"stateStr" :
	"SECONDARY",
	"uptime" : 200,
	10
	"optime" : Timestamp(1357285565000, 1),
	"optimeDate" :
	ISODate("2017-12-22T07:46:05Z"),
	"lastHeartbeat" :
	ISODate("2017-12-22T02:44:42Z"),
	"pingMs" : 0
	},
	{
	"_id" : 2,
	"name" :
	"192.168.209.128:27005",
	"health" : 1,
	"state" : 7,
	"stateStr" :
	"ARBITER",
	"uptime" : 200,
	"lastHeartbeat" :
	ISODate("2017-12-22T02:44:42Z"),
	"pingMs" : 0
	}
	],
	"ok" : 1
	}

  如果配置正在生效,其中會包含如下信息:

"stateStr" : "STARTUP"

  

同時可以查看對應節點的日誌,發現正在等待別的節點生效或者正在分配數據文件。現在基本上已經完成了集群的所有搭建工作。至於測試工作,可以留給大家自己試試。一個是往主節點插入數據,能從備節點查到之前插入的數據(查詢備節點可能會遇到某個問題,可以自己去網上查查看)。二是停掉主節點,備節點能變成主節點提供服務。三是恢復主節點,備節點也能恢復其備的角色,而不是繼續充當主的角色。二和三都可以通過 rs.status()命令實時查看集群的變化

5.5、MongoDB 數據分片

和 Replica Set 類似,都需要一個仲裁節點,但是 Sharding 還需要配置節點和路由節點。就三種集群搭建方式來說,這種是最復雜的。(因所需虛擬機較多,故用端口號不同,來代替虛擬機)
1.配置數據節點

mkdir -p /opt/mongodb/shard/replset/replica1/data
mkdir -p /opt/mongodb/shard/replset/replica1/logs
mkdir -p /opt/mongodb/shard/replset/replica2/data
mkdir -p /opt/mongodb/shard/replset/replica2/logs
mkdir -p /opt/mongodb/shard/replset/replica3/data
mkdir -p /opt/mongodb/shard/replset/replica3/logs

  vi /opt/mongodb/shard/replset/replica1/mongodb.cfg

dbpath=/opt/mongodb/shard/replset/replica1/data
logpath=/opt/mongodb/shard/replset/replica1/logs/mongodb.log
logappend=true
fork=true
bind_ip=192.168.25.128
port=27001
replSet=shard001
shardsvr=true

  vi /opt/mongodb/shard/replset/replica2/mongodb.cfg

dbpath=/opt/mongodb/shard/replset/replica2/data
logpath=/opt/mongodb/shard/replset/replica2/logs/mongodb.log
logappend=true
fork=true
bind_ip=192.168.25.128
port=27002
replSet=shard001
shardsvr=true

  vi /opt/mongodb/shard/replset/replica3/mongodb.cfg

dbpath=/opt/mongodb/shard/replset/replica3/data
logpath=/opt/mongodb/shard/replset/replica3/logs/mongodb.log
logappend=true
fork=true
bind_ip=192.168.25.128
port=27003
replSet=shard001
shardsvr=true

  2.啟動數據節點

mongod -f /opt/mongodb/shard/replset/replica1/mongodb.cfg
#192.168.25.128:27001
mongod -f /opt/mongodb/shard/replset/replica2/mongodb.cfg
#192.168.25.128:27002
mongod -f /opt/mongodb/shard/replset/replica3/mongodb.cfg
#192.168.25.128:27003

  3、使數據節點集群生效

mongo 192.168.25.128:27001 #ip 和 port 是某個節點的地址
cfg={_id:"shard001",members:[{_id:0,host:‘192.168.25.128:27001‘},{_i
d:1,host:‘192.168.25.128:27002‘},{_id:2,host:‘192.168.25.128:27003‘
}]};
rs.initiate(cfg) #使配置生效

  4、配置 configsvr

  

mkdir -p /opt/mongodb/shard/configsvr/config1/data
mkdir -p /opt/mongodb/shard/configsvr/config1/logs
mkdir -p /opt/mongodb/shard/configsvr/config2/data
mkdir -p /opt/mongodb/shard/configsvr/config2/logs
mkdir -p /opt/mongodb/shard/configsvr/config3/data
mkdir -p /opt/mongodb/shard/configsvr/config3/logs

  /opt/mongodb/shard/configsvr/config1/mongodb.cfg

dbpath=/opt/mongodb/shard/configsvr/config1/data
configsvr=true
port=28001
fork=true
logpath=/opt/mongodb/shard/configsvr/config1/logs/mongodb.log
replSet=configrs
logappend=true
bind_ip=192.168.25.128

  /opt/mongodb/shard/configsvr/config2/mongodb.cfg

dbpath=/opt/mongodb/shard/configsvr/config2/data
configsvr=true
port=28002
fork=true
logpath=/opt/mongodb/shard/configsvr/config2/logs/mongodb.log
replSet=configrs
logappend=true
bind_ip=192.168.25.128

  /opt/mongodb/shard/configsvr/config3/mongodb.cfg

dbpath=/opt/mongodb/shard/configsvr/config3/data
configsvr=true
port=28003
fork=true
logpath=/opt/mongodb/shard/configsvr/config3/logs/mongodb.log
replSet=configrs
logappend=true
bind_ip=192.168.25.128

  5、啟動 configsvr 節點

mongod -f /opt/mongodb/shard/configsvr/config1/mongodb.cfg
#192.168.25.128:28001
mongod -f /opt/mongodb/shard/configsvr/config2/mongodb.cfg
#192.168.25.128:28002
mongod -f /opt/mongodb/shard/configsvr/config3/mongodb.cfg
#192.168.25.128:28003

  6、使 configsvr 節點集群生效

mongo 192.168.25.128:28001 #ip 和 port 是某個節點的地址
use admin #先切換到 admin
cfg={_id:"configrs",members:[{_id:0,host:‘192.168.25.128:28001‘},{_i
d:1,host:‘192.168.25.128:28002‘},{_id:2,host:‘192.168.25.128:28003‘
}]};
rs.initiate(cfg) #使配置生效

  配置路由節點

mkdir -p /opt/mongodb/shard/routesvr/logs
#註意:路由節點沒有 data 文件夾

  vi /opt/mongodb/shard/routesvr/mongodb.cfg

configdb=configrs/192.168.25.128:28001,192.168.25.128:28002,192.168
.25.128:28003
port=30000
fork=true
logpath=/opt/mongodb/shard/routesvr/logs/mongodb.log
logappend=true
bind_ip=192.168.25.128

 7.啟動路由節點

./mongos -f /opt/mongodb/shard/routesvr/mongodb.cfg
#192.168.25.128:30000

這裏我們沒有用配置文件的方式啟動,其中的參數意義大家應該都明白。一般來說一個數據節點對應一
個配置節點,仲裁節點則不需要對應的配置節點。註意在啟動路由節點時,要將配置節點地址寫入到啟動命令裏。


  配置 Replica Set

這裏可能會有點奇怪為什麽 Sharding 會需要配置 Replica Set。其實想想也能明白,多個節點的數據肯定是相關聯的,如果不配一個 Replica Set,怎麽標識是同一個集群的呢。這也是人家 mongodb 的規定,咱們還是遵守吧。配置方式和之前所說的一樣,定一個 cfg,然後初始化配置

  8.配置 Sharding

  

mongo 192.168.25.128:30000 #這裏必須連接路由節點
sh.addShard("shard001/192.168.25.128:27001");
sh.addShard("shard002/192.168.25.128:27017");
#shard001、shard002 表示 replica set 的名字 當把主節點添加到 shard 以後,會
自動找到 set 裏的主,備,決策節點
use testdb
sh.enableSharding("testdb") #testdb is database name
sh.shardCollection("testdb.testcon",{"name":”hashed”})
db.collection.status()

  

第一個命令很容易理解,第二個命令是對需要進行 Sharding 的數據庫進行配置,第三個命令是對需要進行 Sharding 的 Collection 進行配置,這裏的 testcon 即為 Collection 的名字。另外還有個 key,這個是比較關鍵的東西,對於查詢效率會有很大的影響。

到這裏 Sharding 也已經搭建完成了,以上只是最簡單的搭建方式,其中某些配置仍然使用的是默認配置。如果設置不當,會導致效率異常低下,所以建議大家多看看官方文檔再進行默認配置的修改。

以上三種集群搭建方式首選 Replica Set,只有真的是大數據,Sharding 才能顯現威力,畢竟備節點同步數據是需要時間的。Sharding 可以將多片數據集中到路由節點上進行一些對比,然後將數據返回給客戶端,但是效率還是比較低的說。

我自己有測試過,不過具體的機器配置已經不記得了。Replica Set 的 ips 在數據達到 1400W 條時基本能達到 1000 左右,而 Sharding 在 300W 時已經下降到 500 IPS,兩者的單位數據大小大概是 10kb。
大家在應用的時候還是多多做下性能測試,畢竟不像 Redis 有 benchmark。

5.6、MongoDB 索引

1、索引
  1.1、創建索引

db.books.ensureIndex{{number:1}}

  創建索引同時指定索引的名字

db.books.ensureIndex({number:1},{name:"book_"})

  1.2、索引使用需要註意的地方  

    1)創建索引的時候註意 1 是正序創建索引-1 是倒序創建索引
    2)索引的創建在提高查詢性能的同事會影響插入的性能 對於經常查詢少插入的文檔可以考慮用索引
    3)符合索引要註意索引的先後順序
    4)每個鍵全建立索引不一定就能提高性能呢 索引不是萬能的
    5)在做排序工作的時候如果是超大數據量也可以考慮加上索引 用來提高排序的性能
  1.3、唯一索引
    解決文檔 books 不能插入重復的數值

  1.4、剔除重復值

  

#則插入相同的 name 值會報錯
db.books.ensureIndex({name:-1},{unique:true})

  如果建議唯一索引之前已經有重復數值如何處理

#剔除重復數值
db.books.ensureIndex({name:1},{name:"book_",unique:true,dropDups:true})

  

  1.5、後臺執行創建索引
    為了解決創建索引鎖表的問題,在不影響查詢功能,可以在後臺運行

  

db.books.ensureIndex({name:1},{background:true})

  1.6、強制查詢已經建立好的索引

  

#後一個 name 為索引名,正序倒序依據建立索引的規則,否則會報錯
db.books.find({name:"323book"}).hint({name:1})

  1.7、在 shell 查看數據庫已經建立的索引

·

db.system.indexes.find()
db.system.namespaces.find()

  1.8、查詢索引信息和查詢狀態信息

db.books.find({name:"123book"}).explain()

  1.9、批量和精確刪除索引

  

db.runCommand({dropIndexes : "books" , index:"name_-1"})
db.runCommand({dropIndexes : "books" , index:"*"})

2、二維索引
  建立二維索引

#默認會建一個[-108,108]的範圍
db.map.ensureIndex({gis:"2d"},{min:-1,max:201})

  

5.7、MongoDB 數據轉存及恢復

1、導出數據(中斷其他操作)
  使用 mongoexport 命令行
  -d 指明使用的庫
  -c 指明要導出的表
  -o 指明要導出的文件名
  -csv 指定導出的 csv 格式
  -q 過濾導出
  --type<json|csv|tsv>

  把數據好 testdb 中的 persons 導出

mongoexport -d testdb -c persons -o D:/persons.json

  
導出其他主機數據庫的文檔

mongoexport --host 192.168.0.16 --port 37017

  2、導入數據(中斷其他操作)

  

mongoimport --db testdb --collections persons --file d:/persons.json

  

3、運行時備份 mongodump.exe
API: http://cn.docs.mongodb.org/manual/reference/mongodump

mongodump --host 127.0.0.1:27017 -d testdb -o d:/testdb

  

4、運行時恢復 mongorestore.exe
API:http://cn.docs.mongodb.org/manual/reference/mongorestore
恢復數據庫

db.dropDatabase()
mongorestore --host 127.0.0.1:27017 -d testdb -directoryperdb d:/testdb/testdb

  

5、mongoDB 是文件數據庫這其實就可以用拷貝文件的方式進行備份


6、上鎖和解鎖

db.runCommand({fsync:1,lock:1}) #上鎖
db.currentOp() #解鎖

  

7、數據修復
當停電等不可逆轉災難來臨的時候,由於 mongodb 的存儲結構導致會產生垃圾數據,在數據恢復以後這垃圾數據依然存在,這是數據庫提供一個自我修復的能力.使用起來很簡單

db.repairDatabase()

  



MogoDB(6)--mongoDB高可用和4.0特性