【高效能MySQL】第一章MySQL架構與歷史
前言:
本章概要描述MySQL伺服器架構、各種儲存引擎間的主要區別及區別的重要性
回顧MySQL歷史背景、基準測試,通過簡化細節和演示案例來討論MySQL的原理
正文:
MySQL架構可在多種不同場景中應用,可嵌入到應用程式中農,支援資料倉庫、內容索引、部署軟體、高可用冗餘系統、線上事務處理系統等;
MySQL最重要的特性是他的儲存引擎架構,使得查詢處理及其他系統任務和資料儲存、提取分離;
1.1MySQL邏輯架構
1.2併發控制
鎖粒度:
鎖策略:在鎖開銷和資料安全性間尋求平衡,每個儲存引擎可實現指定鎖策略和粒度
表鎖:table lock 最基本的 開銷最小 鎖定整表
行級鎖:row lock 最大程度支援併發 最大的鎖開銷 在儲存引擎層(以自己的方式)實現
1.3事務
獨立工作單元,一組原子性SQL查詢
隔離級別:
四種,每種規定了事務中所作的修改,較低的隔離可以執行更高的併發、開銷也更低
READ UNCOMMITTED未提交讀
事務中的修改及時沒有提交,對其他事務也是可見的;事務讀取未提交的資料:髒讀;很少使用
READ COMMITTED提交讀
almost庫預設隔離級別,非MySQL;事務從開始到結束只看見已提交的事務所作的修改,本身所做的修改對其他事務不可見;不可重複讀
REPEATABLE READ可重複讀
MySQL預設,解決了髒讀,同一事務多次讀同樣結果;幻讀:當某個事務在讀取某個範圍內的記錄時、另一個事務在該範圍內插入新的記錄,當前事務再次讀取該範圍記錄、幻行
SERIALIZABLE:可序列化
最高,強制事務序列執行,避免幻讀問題,讀取每行資料時加鎖(可導致大量超時和鎖爭用),很少使用
死鎖
1、兩個多個事務在同一個資源上相互佔用並請求鎖定對方佔用的資源;
2、多個事務試圖以不同的順序鎖定資源,可能產生死鎖;
3、多個事務同時鎖定同一個資源;
鎖的行為和順序和存取引擎相關,同樣的順序執行語句,一些儲存引擎會產生死鎖一些不會;
死鎖產生的雙重原因:因為真正的資料衝突(很難避免),因為儲存引擎的實現方式導致;
死鎖傳送後,只有部分或完全回滾其中一個事務,才能打破死鎖:InnoDB即回滾持有最少行級排他鎖的事務;
1.3.4MySQL中的事務:儲存引擎實現
MySQL兩種事務型儲存引擎:InnoDB、NDB Cluster
自動提交AUTOCOMMIT;
預設採用自動提交模式,如果不顯式開始一個事務,則每個查詢都被當做一個事務執行提交操作,可通過AUTOCOMMIT變數來啟用=1 =ON 、禁用=0 =OFF(all查詢都在一個事務中直到顯式commit rollback)事務結束同時開始新的事務,修改這個變數對非事務型表沒有任何影響;
MySQL可以通過set transaction isolation level設定隔離級別,新的級別在下一個事務開始時生效,配置檔案設定整個庫的,也可只改變當前會話的隔離級別
set session transaction isolation level read committed;
建議:不管何時都不要顯示執行LOCK TABLES ,不管使用的是什麼儲存引擎
1.4多版本併發控制MVCC
資料庫MySQL、Oracle、postgresql等都實現了MVCC,各自實現機制不同【源】
MVCC:每個連線到資料庫的讀、在某個瞬間看到的是資料庫的快照,寫操作在提交之前對外不可見;【源】
更新時,將舊資料標記為過時且在別處增加新版本的資料(多個版本的資料,只有一個最新),容許讀取之前的資料
特點:
1、每行資料都存在一個版本,每次資料更新時都更新該版本
2、修改時copy出當前版本、隨意修改,各事務間不干擾
3、儲存時比較版本號,成功commit則覆蓋原紀錄,失敗則放棄rollback
4、只在REPEATABLE READ 和READ COMMITTED兩個隔離級別下工作
1.5MySQL儲存引擎
mysql將每個資料庫儲存位資料目錄下的一個子目錄,建立表示,mysql在子目錄下建立與表同名的.frm檔案儲存表的定義,不同儲存引擎儲存資料和索引的方式不同,但表的定義在MySQL服務層同一處理;
InnoDB:預設事務型引擎、最重要、廣泛使用
處理大量短期事務;其效能和自動崩潰恢復特性、非事務型儲存的需求中也很流行
資料儲存在由InnoDB管理的表空間中,由一系列資料檔案組成;
使用MVCC支援高併發,並實現了四個標準的隔離級別,預設是REPEATABLE READ可重複讀,通過間隙鎖next-key locking防止幻讀,間隙鎖使得InnoDB鎖定查詢設計的行還鎖定索引中的間隙防止喚影行;
間隙鎖:
當使用範圍條件並請求鎖時,InnoDB給符合條件的已有資料記錄的索引項加鎖,對應鍵值在條件範圍內但是不存在的記錄(間隙)加鎖,間隙鎖:【源】
//如emp表中有101條記錄,其empid的值分別是 1,2,...,100,101
Select * from emp where empid > 100 for update;
InnoDB對符合條件的empid值為101的記錄加鎖,也會對empid大於101(這些記錄並不存在)的“間隙”加鎖;
1、上面的例子,如果不使用間隙鎖,如果其他事務插入大於100的記錄,本事務再次執行則幻讀,但是會造成鎖等待,在併發插入比較多時、要儘量優化業務邏輯,使用相等條件來訪問更新資料,避免使用範圍條件;
2、 在使用相等條件請求給一個不存在的記錄加鎖時,也會使用間隙鎖,當我們通過引數刪除一條記錄時,如果引數在資料庫中不存在,庫會掃描索引,發現不存在,delete語句獲得一個間隙鎖,庫向左掃描掃到第一個比給定引數小的值,向右掃描到第一個比給定引數大的值,構建一個區間,鎖住整個區間內資料;【源】
1.5.2MyIsSAM儲存引擎
全文索引、壓縮、空間函式,不支援事務和行級鎖,崩潰後無法安全恢復
儲存:
將表儲存在兩個檔案中:資料.MYD、索引檔案.MYI
表可以包含動態或靜態(長度固定)行,MySQL據表定義來決定採用何種行格式
表如是變長行,預設配置只能處理256TB資料(指向記錄的指標長度6位元組),改變表指標長度,修改表的MAX_ROWS和AVG_ROW_LENGTH,兩者相乘=表可到達的max大小,修改會導致重建整個表、表all索引;
特性:
1、對整張表加鎖,讀、共享鎖,寫、排他鎖,但在讀的同時可從表中插入新記錄:併發插入
2、修復:可手工、自動執行檢查和修復操作,CHECK TABLE mytable檢查表錯誤,REPAIR TABLE mytable進行修復,執行修復可能會丟失些資料,如果伺服器關閉,myisamchk命令列根據檢查和修復操作;
3、索引特性:支援全文索引,基於分詞建立的索引,支援複雜查詢
4、延遲更新索引鍵Delayed Key Write,如果指定了DELAY_KEY_WRITE選項,每次修改完,不會立即將修改的索引資料寫入磁碟,寫入到記憶體的鍵緩衝區,清理此區或關閉表時將對應的索引塊寫入到磁碟,提升寫效能,但是在庫或主機崩潰時造成索引損壞、需要執行修復操作
壓縮表:
表在建立並匯入資料後,不再修改,比較適合,可使用myisampack對MyISAM表壓縮(打包),壓縮表不能修改(除非先解除壓縮、修改資料、再次壓縮);減少磁碟空間佔用、磁碟IO,提升查詢效能,也支援只讀索引;
現在的硬體能力,讀取壓縮表資料時解壓的開銷不大,減少IO帶來的好處大得多,壓縮時表記錄獨立壓縮,讀取單行時不需要解壓整個表
效能:
設計簡單,緊密格式儲存;典型的效能問題是表鎖的問題,長期處於locked狀態:找表鎖
1.5.3內建的其他儲存引擎
Archive:適合日誌和資料採集類應用,針對高速插入和壓縮優化,支援行級鎖和專業快取區,快取寫利用zlib壓縮插入的行,select掃描全表;
Blackhole:複製架構和日誌稽核,其伺服器記錄blackhole表日誌,可複製資料到備庫 日誌;
CSV:資料交換機制,將CSV檔案作為MySQL表來處理,不支援索引;
Federated:訪問其他MySQL伺服器的代理,建立遠端mysql的客戶端連線將查詢傳輸到遠端伺服器執行,提取傳送需要的資料,預設禁用;
Memory:快速訪問不會被修改的資料,資料儲存在記憶體、不IO,表結構重啟後還在但資料沒了
1、查詢 或 對映 表 ,2、快取週期性聚合資料, 3、儲存資料分析中產生的中間資料
支援hash索引,表級鎖,查詢快併發寫入效能低,不支援BLOB/TEXT型別的列,每行長度固定,記憶體浪費
Merge:myisam變種,多個myisam合併的虛擬表
NDB叢集引擎:
1.5.4第三方儲存引擎
OLTP類:
XtraDB基於InnoDB改進,效能、可測量性、操作靈活
PBXT:ACID/MVCC,引擎級別的複製、外來鍵約束,較複雜架構對固態儲存SSD適當支援,較大值型別BLOB優化
TokuDB:大資料,高壓縮比,大資料量創大量索引
RethinkDB:固態儲存
面向列的
列單獨儲存,壓縮效率高
Infobright:大資料量,資料分析、倉庫應用設計的,高度壓縮,按照塊(一組元資料)排序;塊結構準索引,不支援索引(量大索引也沒用),如查詢無法再儲存層使用面向列的模式執行,則需要在伺服器層轉換成按行處理
社群儲存引擎:***
1.5.5選擇合適的引擎
除非需要用到某些InnoDB不具備的特性,且無辦法可以替代,否則優先選擇InnoDB引擎
不要混合使用多種儲存引擎,如果需要不同的儲存引擎:
1、事務:需要事務支出,InnoDB XtraDB;不需要 主要是select insert 那MyISAM
2、備份:定期關閉伺服器來執行備份,該因素可忽略;線上熱備份,InnoDB
3、崩潰恢復:資料量較大,MyISAM崩後損壞概率比InnoDB高很多、恢復速度慢
4、持有的特性:
1.5.6轉換表的引擎
ALTER TABLE:最簡單
ALTER TABLE mytable ENGINE=InnoDB
此會執行很長時間,MySQL按行將資料從原表複製到新表中,在複製期間可能會消耗掉系統all的I/O能力,同時原表上加讀鎖;會失去和原引擎相關的all特性
匯出與匯入:
mysqldump工具將資料匯出到檔案,修改檔案中CREATE_TABLE語句的儲存引擎選項,同時修改表名(同一個庫不能存在相同的表名),mysqldump預設會自動在CREATE_TABLE語句前加上DROP TABLE語句
建立與查詢:CREATE SELECT
綜合上述兩種方法:先建新儲存引擎表,利用INSERT……SELECT語法導數
CREATE TABLE innodb_table LIKE myisam_table
ALTER TABLE innodb_table ENGINE=InnoDB;
INSERT INTO innodb_table SELECT * FROM myisam_table;
資料量大的話,分批處理(放事務中)
1.6MySQL時間線Timeline
早期MySQL破壞性創新,有諸多限制,且很多功能只能說是二流的,但特性支援和較低的使用成本,使受歡迎;5.x早起引入檢視、儲存過程等,期望成為“企業級”資料庫,但不算成功,5.5顯著改善
1.7MySQL開發模式
遵循GPL開源協議,全部原始碼開發給社群,部分外掛收費;
1.8總結
mysql分層架構,上層是伺服器層的訪問和查詢執行引擎,下層儲存引擎(最重要)