1. 程式人生 > >MySQL數據庫工作原理

MySQL數據庫工作原理

區別 通過 查詢語句 需要 我們 判斷 完數 ava 一次

接觸一個新的事物的時候,是有必要從其工作原理入手,弄清楚這個東西的來龍去脈,為接下來的繼續深入學習做好鋪墊,掌握好其原理有助於我們從整體上來把握這個東西,並且幫助我們在排錯過程中理清思路。接下來,還是從mysql的工作原理開始入手,下面先來一張經典的圖:
技術分享圖片

上面的圖就是mysql的內部架構,可以清楚的看到Mysql是由SQL接口,解析器,優化器,緩存,存儲引擎組成的。

下面是關於上述部件的介紹:

  1. connectors

    與其他編程語言中的sql 語句進行交互,如php、java等。

  2. Management Serveices & Utilities

    系統管理和控制工具

  3. Connection Pool (連接池)

管理緩沖用戶連接,線程處理等需要緩存的需求

  1. SQL Interface (SQL接口)
    接受用戶的SQL命令,並且返回用戶需要查詢的結果。比如select from就是調用SQL Interface

  2. Parser (解析器)
    SQL命令傳遞到解析器的時候會被解析器驗證和解析。
    主要功能:
    a . 將SQL語句分解成數據結構,並將這個結構傳遞到後續步驟,後面SQL語句的傳遞和處理就是基於這個結構的
    b. 如果在分解構成中遇到錯誤,那麽就說明這個sql語句是不合理的,語句將不會繼續執行下去

  3. Optimizer (查詢優化器)
    SQL語句在查詢之前會使用查詢優化器對查詢進行優化(產生多種執行計劃,最終數據庫會選擇最優化的方案去執行,盡快返會結果) 他使用的是“選取-投影-聯接”策略進行查詢。

    用一個例子就可以理解: select uid,name from user where gender = 1;
    這個select 查詢先根據where 語句進行選取,而不是先將表全部查詢出來以後再進行gender過濾
    這個select查詢先根據uid和name進行屬性投影,而不是將屬性全部取出以後再進行過濾
    將這兩個查詢條件聯接起來生成最終查詢結果.

  4. Cache和Buffer (查詢緩存)
    如果查詢緩存有命中的查詢結果,查詢語句就可以直接去查詢緩存中取數據。
    這個緩存機制是由一系列小緩存組成的。比如表緩存,記錄緩存,key緩存,權限緩存等

8.Engine (存儲引擎)

存儲引擎是MySql中具體的與文件打交道的子系統。也是Mysql最具有特色的一個地方。

Mysql的存儲引擎是插件式的。它根據MySql AB公司提供的文件訪問層的一個抽象接口來定制一種文件訪問機制(這種訪問機制就叫存儲引擎)

SQL 語句執行過程

數據庫通常不會被直接使用,而是由其他編程語言通過SQL語句調用mysql,由mysql處理並返回執行結果。那麽Mysql接受到SQL語句後,又是如何處理的呢?

首先程序的請求會通過mysql的connectors與其進行交互,請求到處後,會暫時存放在連接池(connection pool)中並由處理器(Management Serveices & Utilities)管理。當該請求從等待隊列進入到處理隊列,管理器會將該請求丟給SQL接口(SQL Interface)。SQL接口接收到請求後,它會將請求進行hash處理並與緩存中的結果進行對比,如果完全匹配則通過緩存直接返回處理結果;否則,需要完整的走一趟流程:

(1)由SQL接口丟給後面的解釋器(Parser),上面已經說到,解釋器會判斷SQL語句正確與否,若正確則將其轉化為數據結構。

(2)解釋器處理完,便來到後面的優化器(Optimizer),它會產生多種執行計劃,最終數據庫會選擇最優化的方案去執行,盡快返會結果。

(3)確定最優執行計劃後,SQL語句此時便可以交由存儲引擎(Engine)處理,存儲引擎將會到後端的存儲設備中取得相應的數據,並原路返回給程序。

這裏有幾點需要註意:

(1)如何緩存查詢數據?

存儲引擎處理完數據,並將其返回給程序的同時,它還會將一份數據保留在緩存中,以便更快速的處理下一次相同的請求。具體情況是,mysql會將查詢的語句、執行結果等進行hash,並保留在cache中,等待下次查詢。

(2)buffer與cache的區別?

從上面的圖可以看到,緩存那裏實際上有buffer和cache兩個,那它們之間是否有什麽不同呢?簡單的說就是,buffer是寫緩存,cache是讀緩存。

(3)如何判斷緩存中是否已緩存需要的數據

這裏可能有一個誤區,覺得處理SQL語句的時候,為了判斷是否已緩存查詢結果,會將整個流程走一遍,取得執行結果後再與需要的進行對比,看看是否命中,並以此說,既然不管緩存中有沒有緩存到查詢內容,都要整個流程走一遍,那麽緩存的優勢又在哪裏??

實際上,並非如此,在第一次查詢後,mysql便將查詢語句以及查詢結果進行hash處理並保留在緩存中,SQL查詢到達之後,對其進行同樣的hash處理後,將兩個hash值進行對照,如果一樣,則命中,從緩存中返回查詢結果;否則,需要整個流程走一遍。

MySQL數據庫工作原理