1. 程式人生 > >【高效能MySQL】第一章MySQL架構與歷史

【高效能MySQL】第一章MySQL架構與歷史

前言:

      本章概要描述MySQL伺服器架構、各種儲存引擎間的主要區別及區別的重要性

      回顧MySQL歷史背景、基準測試,通過簡化細節和演示案例來討論MySQL的原理

正文:

      MySQL架構可在多種不同場景中應用,可嵌入到應用程式中農,支援資料倉庫、內容索引、部署軟體、高可用冗餘系統、線上事務處理系統等;

       MySQL最重要的特性是他的儲存引擎架構,使得查詢處理及其他系統任務和資料儲存、提取分離;

1.1MySQL邏輯架構

1.2併發控制

鎖粒度:

鎖策略:在鎖開銷和資料安全性間尋求平衡,每個儲存引擎可實現指定鎖策略和粒度

表鎖:table lock  最基本的 開銷最小 鎖定整表 

行級鎖:row lock 最大程度支援併發  最大的鎖開銷 在儲存引擎層(以自己的方式)實現 

1.3事務

獨立工作單元,一組原子性SQL查詢

隔離級別:

四種,每種規定了事務中所作的修改,較低的隔離可以執行更高的併發、開銷也更低

READ UNCOMMITTED未提交讀

        事務中的修改及時沒有提交,對其他事務也是可見的;事務讀取未提交的資料:髒讀;很少使用

READ COMMITTED提交讀

        almost庫預設隔離級別,非MySQL;事務從開始到結束只看見已提交的事務所作的修改,本身所做的修改對其他事務不可見;不可重複讀

:兩次執行同樣的查詢,結果可能不一樣(其他事務的修改)

REPEATABLE READ可重複讀

        MySQL預設,解決了髒讀,同一事務多次讀同樣結果;幻讀:當某個事務在讀取某個範圍內的記錄時、另一個事務在該範圍內插入新的記錄,當前事務再次讀取該範圍記錄、幻行

SERIALIZABLE:可序列化

        最高,強制事務序列執行,避免幻讀問題,讀取每行資料時加鎖(可導致大量超時和鎖爭用),很少使用

死鎖

1、兩個多個事務在同一個資源上相互佔用並請求鎖定對方佔用的資源;

2、多個事務試圖以不同的順序鎖定資源,可能產生死鎖;

3、多個事務同時鎖定同一個資源;

鎖的行為和順序和存取引擎相關,同樣的順序執行語句,一些儲存引擎會產生死鎖一些不會;

死鎖產生的雙重原因:因為真正的資料衝突(很難避免),因為儲存引擎的實現方式導致;

死鎖傳送後,只有部分或完全回滾其中一個事務,才能打破死鎖:InnoDB即回滾持有最少行級排他鎖的事務;

1.3.4MySQL中的事務:儲存引擎實現

MySQL兩種事務型儲存引擎:InnoDB、NDB Cluster

自動提交AUTOCOMMIT;

      預設採用自動提交模式,如果不顯式開始一個事務,則每個查詢都被當做一個事務執行提交操作,可通過AUTOCOMMIT變數來啟用=1  =ON 、禁用=0  =OFF(all查詢都在一個事務中直到顯式commit rollback)事務結束同時開始新的事務,修改這個變數對非事務型表沒有任何影響;

MySQL可以通過set transaction isolation level設定隔離級別,新的級別在下一個事務開始時生效,配置檔案設定整個庫的,也可只改變當前會話的隔離級別

set session transaction isolation level read committed;

建議:不管何時都不要顯示執行LOCK TABLES ,不管使用的是什麼儲存引擎

1.4多版本併發控制MVCC

        資料庫MySQL、Oracle、postgresql等都實現了MVCC,各自實現機制不同【

        MVCC:每個連線到資料庫的讀、在某個瞬間看到的是資料庫的快照,寫操作在提交之前對外不可見;【

       更新時,將舊資料標記為過時且在別處增加新版本的資料(多個版本的資料,只有一個最新),容許讀取之前的資料

特點:

1、每行資料都存在一個版本,每次資料更新時都更新該版本

2、修改時copy出當前版本、隨意修改,各事務間不干擾

3、儲存時比較版本號,成功commit則覆蓋原紀錄,失敗則放棄rollback

4、只在REPEATABLE READ 和READ COMMITTED兩個隔離級別下工作

1.5MySQL儲存引擎

     mysql將每個資料庫儲存位資料目錄下的一個子目錄,建立表示,mysql在子目錄下建立與表同名的.frm檔案儲存表的定義,不同儲存引擎儲存資料和索引的方式不同,但表的定義在MySQL服務層同一處理;

InnoDB:預設事務型引擎、最重要、廣泛使用

     處理大量短期事務;其效能和自動崩潰恢復特性、非事務型儲存的需求中也很流行

     資料儲存在由InnoDB管理的表空間中,由一系列資料檔案組成;

     使用MVCC支援高併發,並實現了四個標準的隔離級別,預設是REPEATABLE READ可重複讀,通過間隙鎖next-key locking防止幻讀,間隙鎖使得InnoDB鎖定查詢設計的行還鎖定索引中的間隙防止喚影行;

間隙鎖:

  當使用範圍條件並請求鎖時,InnoDB給符合條件的已有資料記錄的索引項加鎖,對應鍵值在條件範圍內但是不存在的記錄(間隙)加鎖,間隙鎖:【

//如emp表中有101條記錄,其empid的值分別是 1,2,...,100,101
Select * from  emp where empid > 100 for update;

    InnoDB對符合條件的empid值為101的記錄加鎖,也會對empid大於101(這些記錄並不存在)的“間隙”加鎖;

      1、上面的例子,如果不使用間隙鎖,如果其他事務插入大於100的記錄,本事務再次執行則幻讀,但是會造成鎖等待,在併發插入比較多時、要儘量優化業務邏輯,使用相等條件來訪問更新資料,避免使用範圍條件;

      2、 在使用相等條件請求給一個不存在的記錄加鎖時,也會使用間隙鎖,當我們通過引數刪除一條記錄時,如果引數在資料庫中不存在,庫會掃描索引,發現不存在,delete語句獲得一個間隙鎖,庫向左掃描掃到第一個比給定引數小的值,向右掃描到第一個比給定引數大的值,構建一個區間,鎖住整個區間內資料;【

1.5.2MyIsSAM儲存引擎

   全文索引、壓縮、空間函式,不支援事務和行級鎖,崩潰後無法安全恢復

儲存:

    將表儲存在兩個檔案中:資料.MYD、索引檔案.MYI

    表可以包含動態或靜態(長度固定)行,MySQL據表定義來決定採用何種行格式

    表如是變長行,預設配置只能處理256TB資料(指向記錄的指標長度6位元組),改變表指標長度,修改表的MAX_ROWS和AVG_ROW_LENGTH,兩者相乘=表可到達的max大小,修改會導致重建整個表、表all索引;

特性:

    1、對整張表加鎖,讀、共享鎖,寫、排他鎖,但在讀的同時可從表中插入新記錄:併發插入

    2、修復:可手工、自動執行檢查和修復操作,CHECK TABLE mytable檢查表錯誤,REPAIR TABLE mytable進行修復,執行修復可能會丟失些資料,如果伺服器關閉,myisamchk命令列根據檢查和修復操作;

    3、索引特性:支援全文索引,基於分詞建立的索引,支援複雜查詢

    4、延遲更新索引鍵Delayed Key Write,如果指定了DELAY_KEY_WRITE選項,每次修改完,不會立即將修改的索引資料寫入磁碟,寫入到記憶體的鍵緩衝區,清理此區或關閉表時將對應的索引塊寫入到磁碟,提升寫效能,但是在庫或主機崩潰時造成索引損壞、需要執行修復操作

壓縮表:

    表在建立並匯入資料後,不再修改,比較適合,可使用myisampack對MyISAM表壓縮(打包),壓縮表不能修改(除非先解除壓縮、修改資料、再次壓縮);減少磁碟空間佔用、磁碟IO,提升查詢效能,也支援只讀索引;

    現在的硬體能力,讀取壓縮表資料時解壓的開銷不大,減少IO帶來的好處大得多,壓縮時表記錄獨立壓縮,讀取單行時不需要解壓整個表

效能:

   設計簡單,緊密格式儲存;典型的效能問題是表鎖的問題,長期處於locked狀態:找表鎖

1.5.3內建的其他儲存引擎

Archive:適合日誌和資料採集類應用,針對高速插入和壓縮優化,支援行級鎖和專業快取區,快取寫利用zlib壓縮插入的行,select掃描全表;

Blackhole:複製架構和日誌稽核,其伺服器記錄blackhole表日誌,可複製資料到備庫 日誌;

CSV:資料交換機制,將CSV檔案作為MySQL表來處理,不支援索引;

Federated:訪問其他MySQL伺服器的代理,建立遠端mysql的客戶端連線將查詢傳輸到遠端伺服器執行,提取傳送需要的資料,預設禁用;

Memory:快速訪問不會被修改的資料,資料儲存在記憶體、不IO,表結構重啟後還在但資料沒了

     1、查詢 或 對映 表 ,2、快取週期性聚合資料, 3、儲存資料分析中產生的中間資料

     支援hash索引,表級鎖,查詢快併發寫入效能低,不支援BLOB/TEXT型別的列,每行長度固定,記憶體浪費

Merge:myisam變種,多個myisam合併的虛擬表

NDB叢集引擎:

1.5.4第三方儲存引擎

OLTP類:

XtraDB基於InnoDB改進,效能、可測量性、操作靈活

PBXT:ACID/MVCC,引擎級別的複製、外來鍵約束,較複雜架構對固態儲存SSD適當支援,較大值型別BLOB優化

TokuDB:大資料,高壓縮比,大資料量創大量索引

RethinkDB:固態儲存

面向列的

列單獨儲存,壓縮效率高

Infobright:大資料量,資料分析、倉庫應用設計的,高度壓縮,按照塊(一組元資料)排序;塊結構準索引,不支援索引(量大索引也沒用),如查詢無法再儲存層使用面向列的模式執行,則需要在伺服器層轉換成按行處理

社群儲存引擎:***

1.5.5選擇合適的引擎

 除非需要用到某些InnoDB不具備的特性,且無辦法可以替代,否則優先選擇InnoDB引擎

不要混合使用多種儲存引擎,如果需要不同的儲存引擎:

1、事務:需要事務支出,InnoDB XtraDB;不需要 主要是select insert 那MyISAM

2、備份:定期關閉伺服器來執行備份,該因素可忽略;線上熱備份,InnoDB

3、崩潰恢復:資料量較大,MyISAM崩後損壞概率比InnoDB高很多、恢復速度慢

4、持有的特性:

1.5.6轉換表的引擎

ALTER TABLE:最簡單

ALTER TABLE mytable ENGINE=InnoDB

此會執行很長時間,MySQL按行將資料從原表複製到新表中,在複製期間可能會消耗掉系統all的I/O能力,同時原表上加讀鎖;會失去和原引擎相關的all特性

匯出與匯入:

mysqldump工具將資料匯出到檔案,修改檔案中CREATE_TABLE語句的儲存引擎選項,同時修改表名(同一個庫不能存在相同的表名),mysqldump預設會自動在CREATE_TABLE語句前加上DROP TABLE語句

建立與查詢:CREATE SELECT 

綜合上述兩種方法:先建新儲存引擎表,利用INSERT……SELECT語法導數

CREATE TABLE innodb_table LIKE myisam_table
ALTER TABLE innodb_table ENGINE=InnoDB;
INSERT INTO innodb_table SELECT * FROM myisam_table;
資料量大的話,分批處理(放事務中)

1.6MySQL時間線Timeline

   早期MySQL破壞性創新,有諸多限制,且很多功能只能說是二流的,但特性支援和較低的使用成本,使受歡迎;5.x早起引入檢視、儲存過程等,期望成為“企業級”資料庫,但不算成功,5.5顯著改善

1.7MySQL開發模式

遵循GPL開源協議,全部原始碼開發給社群,部分外掛收費;

1.8總結

mysql分層架構,上層是伺服器層的訪問和查詢執行引擎,下層儲存引擎(最重要)