淺談SQL Server內部執行機制
對於已經很熟悉T-SQL的讀者,或者對於較專業的DBA來說,邏輯的增刪改查,或者較複雜的SQL語句,都是非常簡單的,不存在任何挑戰,不值得一提,那麼,SQL的哪些方面是他們的挑戰 或者軟肋呢?
那就是sql優化。然而,要向成為一個好的Sql優化高手,首先要做的一件事無疑就是了解sql語句在SQL Server中是如何執行的。在這一系列中,我們將開始sqlserver優化系列講解,本 講為優化系列的開篇文章,
在本篇文章中,我們將重點講解SQL Server體系結構
在正式講解之前,我們先來看看如下問題,你是否遇到過,若你遇到過且成功解決,那麼這篇文章,你可以跳過。
為了測試需要,我們先模擬插入5億3千多萬條資料。
SELECT COUNT(1) FROM BigDataTest
(一)查詢緩慢問題
*,臨時表,表連線,子查詢等造成的查詢緩慢問題,你能解決嗎?
(二)記憶體洩漏
如下查詢了8分2秒,然後記憶體溢位,你知道問題嗎?
SELECT * FROM BigDataTest
(三)經常聽說如下概念,你都能解決嗎?
事務與鎖(請參考我另一篇文章:ofollow,noindex" target="_blank">淺談SQL Server事務與鎖(上篇) ),ACID,隔離級別,髒讀,分表分庫,水平拆分,垂直拆分,高併發等
一 SQL Server體系結構抽象
二 SQL Server體系結構概述
SQL Server核心體系結構,大致包括六大部分:客戶端訪問工具、SQL Server 網路介面(SQL Server Network Interface,SNI)、關係引擎、儲存引擎、
磁碟和緩衝池。下圖為SQL Server核心體系大致輪廓圖。
(一)SQL Server客戶端訪問工具
SQL Server客戶端訪問工具,提供了遠端訪問技術,它與SQL Server服務端基於一定的協議,使其能夠遠端訪問資料庫,就像在本地操作資料庫一樣,如我們經常用的
Microsoft SQL Server Management Studio。
SQL Server客戶端訪問工具是比較多的,其中比較流行的要數Microsoft SQL Server Management Studio 和Navicat(Navicat在MySQL中也是比較常用的)了,至於其他工具,
本篇文章就不列舉了,感興趣的讀者朋友,可以查詢一下。
(二)SQL Server網路協議
SQL Server網路協議,又叫SQL Server網路介面(SNI),它是構成客戶端和服務端通訊的橋樑,它與SQL Server服務端基於一定協議,方可通訊,
如我們在客戶端輸入一條查詢語句SELECT * FROM BigDataTest,這條語句,只有客戶端和服務端基於一定協議,方可被服務端解析,否則,被視為無
效語句。
SQL Server網路協議,由一組API構成,這些API供SQL Server資料庫引擎和SQL Server本地客戶端呼叫,如實現最基本的CRUD通訊。
SQL Server 網路介面(SQL Server Network Interface,SNI)只需要在客戶端和服務端配置網路協議即可,它支援一下協議:
(1)共享記憶體
(2)TCP/IP
(3)命名管道
(4)VIA
(三)關係引擎
關係引擎,也叫查詢引擎,其主要功能是負責處理SQL語句,其核心元件由三部分組成:命令分析器、查詢優化器和查詢執行器。
(1)命令分析器:負責解析客戶端傳遞過來的T-SQL語句,如客戶端傳遞一條SQL語句:SELECT * FROM BigDataTest,它會檢查該語句的語法結構,若語法
錯誤,它會將錯誤返回給協議層,然後協議層將錯誤返回給客戶端;如果語法結構正確,它會根據查詢命令生成查詢計劃或尋找一個已存在的查詢計劃(先在緩衝池計劃緩
存中查詢,若找到,則直接給查詢執行器執行,若未找到,則會生成基於T-SQL的查詢樹,然後交給查詢優化器優化)
(2)查詢優化器:負責優化命令解析器生成的T-SQL查詢樹(基於資源的優化,而非基於時間的優化),然後將最終優化結果傳遞給查詢執行器執行。查詢優化器是基於
“資源開銷”的優化器,這種演算法評估多種可執行的查詢方式,並從中選擇開銷最低的方案作為優化結果,然後將該結果生成查詢計劃輸出給查詢執行器。注意,查詢優化器是
“基於資源開銷最優”而非“基於方案最優”,也就是,查詢優化器的最終優化結果未必是最好的方案,但一定是資源開銷最低的方案。
(3)查詢執行器:負責執行查詢。假若查詢執行器接收到命令解析器或查詢優化器傳遞過來的SQL語句:SELECT * FROM BigDataTest,它通過OLE DB介面傳遞到儲存
引擎,再傳遞到儲存引擎的訪問方法。
(四)儲存引擎
儲存引擎,本質就是管理資源儲存的,它的核心元件包括三部分:訪問方法、事務管理器和緩衝區管理器。
(1)訪問方法:訪問方法本質是一個介面,供查詢執行器呼叫(該介面提供了所有檢索資料的程式碼,介面的實際執行是由緩衝區管理器來執行的),假若查詢執行器傳遞一條SQL語句:
SELECT * FROM BigDataTest,訪問方法接收到該請求命令後,就會呼叫緩衝區管理器,緩衝區管理器就會呼叫緩衝池的計劃快取,在計劃快取中尋找到相應的結果集,然後返回給關係
引擎。
(2)緩衝區管理器:供訪問方法呼叫,管理緩衝池,在緩衝池中查詢相應資源並返回結果集,供訪問方法返回給關係引擎。
(3)事務管理器:主要負責事務的管理(ACID管理)和高併發管理(鎖),它包括兩個核心元件(日誌管理器和鎖管理器),鎖管理器負責提供併發資料訪問,設定隔離級別等;日誌管理器負責
記錄所有訪問方法操作動作,如基本的CRUD。
(五)緩衝池
緩衝池駐於記憶體中,是磁碟和緩衝區管理器的橋樑SQL Server中,所有資源的查詢都是在記憶體中進行的,即在緩衝池中進行的,假若緩衝池
接收到緩衝區管理器傳遞過來的的一條SQL語句:SELECT * FROM BigDataTest,緩衝區管理器資料快取先從磁碟資料庫中取滿足條件的結果集,
然後放在緩衝池資料緩衝中,然後以結果集的形式返回給緩衝區管理器,供訪問方法返回給關係引擎的查詢執行器,然後返回給協議層,協議層再
返回給客戶端。注意,這裡操作的是緩衝池中資料,而不是磁碟DB中的資料,並且操作的緩衝池資料不會立即寫入磁碟,因此就會造成查詢到結果
與BD中的結果不一致,這就是所謂的髒讀。
緩衝池主要包括兩部分:計劃快取(生成執行計劃是非常耗時耗資源的,計劃快取主要用來儲存執行計劃,以備後續使用)和資料快取(通常是快取池
中容量最大的,消耗記憶體最大,從磁碟中讀取的資料頁只要放在這裡,方可呼叫)
(六)磁碟
磁碟主要是用來儲存持久化資源的,如日誌資源,資料庫資源和快取池持久化支援等。
三 一個查詢的完整流程
如下為一個比較完善的查詢過程,即第二部分查詢語句:SELECT * FROM BigDataTest 整個過程。
四 參考文獻
【01】《SQL Server 2012 深入解析與效能優化 第3版》Christian Bolton,Justin Langford,Glenn Berry,Gavin Payne,Amit Banerjee,Rob Farley著
五 版權區
- 感謝您的閱讀,若有不足之處,歡迎指教,共同學習、共同進步。
- 博主網址:http://www.cnblogs.com/wangjiming/。
- 極少部分文章利用讀書、參考、引用、抄襲、複製和貼上等多種方式整合而成的,大部分為原創。
- 如您喜歡,麻煩推薦一下;如您有新想法,歡迎提出,郵箱:[email protected]。
- 可以轉載該部落格,但必須著名部落格來源。