1. 程式人生 > >Sql Server之旅---你必須知道的非聚集索引掃描

Sql Server之旅---你必須知道的非聚集索引掃描

      非聚集索引,這個是大家都非常熟悉的一個東西,有時候我們由於業務原因,sql寫的非常複雜,需要join很多張表,然後就淚流滿面了。這時候就有DBA或者資深的開發給你看這個猥瑣的sql,通過執行計劃一分析,或許就看出了不該有的表掃描,萬惡之源。然後給你在關鍵的欄位加上非聚集索引後,才發現提速比阿斯頓馬丁還要快。那麼一個問題來了,為什麼非聚集索引能提速這麼快?怎麼做到的??是不是非常的好奇???

這篇我們來解開神祕面紗。

一:現象

      先讓我們一睹非聚集索引的真容,看看到底在執行計劃看來是個什麼玩意。我這裡有個product表,裡面灌了8w多資料,然後在Name列上建立一個非聚集索引,就像下圖一樣:

  

從上圖中看到了兩個好玩的東西,一個就是我想看到的“索引查詢[nonclustered]”,這個大家很熟悉,也是這篇要說的,然後我們還看到了一個“RID查詢”,乍一看這是什麼玩意?非聚集索引跟它扯上什麼關係了?

二:什麼是RID

  通過前面幾篇,我想大家都知道了資料頁中的記錄是如何尋找的?祕密就是通過slot槽位中的偏移量決定的,那問題來了,如果上升到資料頁層面,我只需要(pageID:slotID)就可以找到記錄了,對不對?那如果我上升了檔案層面,那是不是隻需要知道(fileID:pageID:slotID)就可以找到資料頁中的記錄了?其實這裡的RID就是站在檔案的高度通過(fileID:pageID:slotID)找到表記錄的。既RID=RowID=(fileID:pageID:slotID),如果你非要眼見為實的話,在sql中還真提供了這麼個函式(sys.fn_PhysLocFormatter(%%physloc%%)),我們看下圖:

看了上面的圖,是不是很興奮,一目瞭然,比如productID=18088這條記錄,然來是在1號檔案,34941號資料頁,0號槽位上,productID=18089是在1號槽位上,好了,當你知道RID是個什麼東西的時候,我想你已經離徹底理解非聚集索引不遠啦。

三:非聚集索引

  有一點我們肯定知道,就是非聚集索引是可以加速查詢的,要是跟表掃描那樣的龜速,那也就失去了索引的目的,既然能加速,是因為它和聚集索引一樣,在底層都玩起了B樹,首先我們插入一些樣例資料。

 1 DROP TABLE dbo.Person
 2 
 3 CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900))
 4 CREATE  INDEX idx_Person_Name ON dbo.Person(Name)
 5 
 6 DECLARE @ch AS INT=97
 7 
 8 WHILE @ch<=122
 9 BEGIN
10     INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5))
11     SET @
[email protected]
+1 12 END

上面的sql,我故意在Name列設定為900個char,這也是索引的上限值,這樣的話,我DBCC就可以匯出很多資料頁和索引頁了。

可以看到,當我dbcc ind 的時候,發現Person表中已經有4個數據頁,5個索引頁,其中151號資料頁是表跟蹤頁,174號為索引跟蹤頁,這也就說明當我建立索引後,引擎給我們分配了專門的索引頁來存放我們建立的Name索引,那下一步就是我們來看看這些索引中都存放著什麼,這也是我非常關心的,接下來我匯出173號索引頁。

1 DBCC PAGE(Ctrip,1,173,1)

 1 Slot 0, Offset 0x60
, Length 912, DumpStyle BYTE 2 3 Record Type = INDEX_RECORD Record Attributes = NULL_BITMAP Record Size = 912 4 5 Memory Dump @0x000000000EF1C060 6 7 0000000000000000: 16616161 61612020 20202020 20202020 †.aaaaa 8 0000000000000010: 20202020 20202020 20202020 20202020 9 0000000000000020: 20202020 20202020 20202020 2020202010 0000000000000030: 20202020 20202020 20202020 2020202011 0000000000000040: 20202020 20202020 20202020 2020202012 0000000000000050: 20202020 20202020 20202020 2020202013 0000000000000060: 20202020 20202020 20202020 2020202014 0000000000000070: 20202020 20202020 20202020 2020202015 0000000000000080: 20202020 20202020 20202020 2020202016 0000000000000090: 20202020 20202020 20202020 2020202017 00000000000000A0: 20202020 20202020 20202020 2020202018 00000000000000B0: 20202020 20202020 20202020 2020202019 00000000000000C0: 20202020 20202020 20202020 2020202020 00000000000000D0: 20202020 20202020 20202020 2020202021 00000000000000E0: 20202020 20202020 20202020 2020202022 00000000000000F0: 20202020 20202020 20202020 2020202023 0000000000000100: 20202020 20202020 20202020 2020202024 0000000000000110: 20202020 20202020 20202020 2020202025 0000000000000120: 20202020 20202020 20202020 2020202026 0000000000000130: 20202020 20202020 20202020 2020202027 0000000000000140: 20202020 20202020 20202020 2020202028 0000000000000150: 20202020 20202020 20202020 2020202029 0000000000000160: 20202020 20202020 20202020 2020202030 0000000000000170: 20202020 20202020 20202020 2020202031 0000000000000180: 20202020 20202020 20202020 2020202032 0000000000000190: 20202020 20202020 20202020 2020202033 00000000000001A0: 20202020 20202020 20202020 2020202034 00000000000001B0: 20202020 20202020 20202020 2020202035 00000000000001C0: 20202020 20202020 20202020 2020202036 00000000000001D0: 20202020 20202020 20202020 2020202037 00000000000001E0: 20202020 20202020 20202020 2020202038 00000000000001F0: 20202020 20202020 20202020 2020202039 0000000000000200: 20202020 20202020 20202020 2020202040 0000000000000210: 20202020 20202020 20202020 2020202041 0000000000000220: 20202020 20202020 20202020 2020202042 0000000000000230: 20202020 20202020 20202020 2020202043 0000000000000240: 20202020 20202020 20202020 2020202044 0000000000000250: 20202020 20202020 20202020 2020202045 0000000000000260: 20202020 20202020 20202020 2020202046 0000000000000270: 20202020 20202020 20202020 2020202047 0000000000000280: 20202020 20202020 20202020 2020202048 0000000000000290: 20202020 20202020 20202020 2020202049 00000000000002A0: 20202020 20202020 20202020 2020202050 00000000000002B0: 20202020 20202020 20202020 2020202051 00000000000002C0: 20202020 20202020 20202020 2020202052 00000000000002D0: 20202020 20202020 20202020 2020202053 00000000000002E0: 20202020 20202020 20202020 2020202054 00000000000002F0: 20202020 20202020 20202020 2020202055 0000000000000300: 20202020 20202020 20202020 2020202056 0000000000000310: 20202020 20202020 20202020 2020202057 0000000000000320: 20202020 20202020 20202020 2020202058 0000000000000330: 20202020 20202020 20202020 2020202059 0000000000000340: 20202020 20202020 20202020 2020202060 0000000000000350: 20202020 20202020 20202020 2020202061 0000000000000360: 20202020 20202020 20202020 2020202062 0000000000000370: 20202020 20202020 20202020 2020202063 0000000000000380: 20202020 20940000 00010000 00020000 † ...........
1 Row - Offset                         
2 7 (0x7) - 6480 (0x1950)              
3 6 (0x6) - 5568 (0x15c0)              
4 5 (0x5) - 4656 (0x1230)              
5 4 (0x4) - 3744 (0xea0)               
6 3 (0x3) - 2832 (0xb10)               
7 2 (0x2) - 1920 (0x780)               
8 1 (0x1) - 1008 (0x3f0)               
9 0 (0x0) - 96 (0x60)     

從上面至少可以發現三個有趣的現象:

<1>:173號索引頁中slot0和slot1槽位指向記錄的內容已經有序了,比如:aaaaa,bbbbb這樣。原來非聚集索引也是有序呀。

<2>:6161616161就是16進位制的aaaaa。

    9400000001000000 :這幾個數字非常重要,因為是16進製表示,所以2位16進製表示一個位元組,所以可以這麼解釋,前面4個位元組表示 pageID,中間2個位元組表示fileID,後面2個位元組表示slot,看到這裡你是不是想起了RID?因為RID就是這三樣的組合,原來非聚集索引的記錄存放的就是“key+RowID”呀。

<3>:通過最後的槽位列表,可以得知173號索引頁上存放著8條索引記錄。

  好了,看完了葉子節點,我們再看分支節點,也就是IndexLevel=1的那條索引資料頁,也就是78號。ok,dbcc看看吧。

當看到這個列表的時候,不知道你腦子裡面是不是有一幅圖出來了,就像上一篇看到聚集索引一樣,因為它的結構和聚集索引非常像,只不過非聚集索引這裡多了一個RID而已。最後我也把圖貢獻一下。


總結一下:在走非聚集索引的時候,比如你的條件是where name='jjjjj' 時,它的邏輯是這樣的,根據78號索引資料頁的key的範圍,然後通過rowid走到了79號索引資料頁,然後在79號索引資料頁中順利的找到了jjjjj,這時候就可以拿出jjjjj的rowid去表資料頁中直接定位記錄,最後輸出。這個也就是部落格開頭的地方為什麼會出現RID的查詢。

出處:https://www.cnblogs.com/huangxincheng/p/4243080.html

相關推薦

Sql Server---必須知道聚集索引掃描

      非聚集索引,這個是大家都非常熟悉的一個東西,有時候我們由於業務原因,sql寫的非常複雜,需要join很多張表,然後就淚流滿面了。這時候就有DBA或者資深的開發給你看這個猥瑣的sql,通過執行計劃一分析,或許就看出了不該有的表掃描,萬惡之源。然後給你在關鍵的欄位加

關於SQL Server 2017,需要知道這5個重點

SQL Server 2017增加了一些最新的資料服務和分析功能,包括強大的AI功能、對R和Python的支援。 當技術主管為公司定義其分析策略時,大多數人認為AI、機器學習、自然語言處理和資料探勘是這些計劃的關鍵組成部分。在過去幾年中,許多分析功能很受歡迎,但它們仍然是複雜、昂貴,並且有一些特殊

Sql Server——第十一站 簡單說說sqlserver的執行計劃

我們知道sql在底層的執行給我們上層人員開了一個視窗,那就是執行計劃,有了執行計劃之後,我們就清楚了那些爛sql是怎麼執行的,這樣 就可以方便的找到sql的缺陷和優化點。 一:執行計劃生成過程   說到執行計劃,首先要知道的是執行計劃大概生成的過程,這樣就可以做到就心中有數了

正確評估SQL資料庫效能,必須知道的原理和方法!

作者簡介: Max Shen(阿特),為了成為資料專家而努力,萬一實現了呢! 昨天寫了一篇如何監視資料庫效能,瞭解資料庫的執行狀態。被有人質疑,說沒有用。說要直接用資料庫的profile和monitor就可以了,到這一步那已經是到了資料庫查詢效能,已經

[必須知道的.NET]第三十三回,深入.NET 4.0,Lazy<T>點滴

釋出日期:2009.10.29 作者:Anytao © 2009 Anytao.com ,Anytao原創作品,轉貼請註明作者和出處。   物件的建立方式,始終代表了軟體工業的生產力方向,代表了先進軟體技術發展的方向,也代表了廣大程式開發者的集體

Android進階Context(上下文)必須知道的一切

1 Context概念 (1)在啟動Activity/Service,傳送廣播,獲取系統資源,獲取系統服務等都需要Context的參與,可見Context的常見性。到底什麼是Context,Context字面意思上下文,或者叫做場景,也就是使用者與作業系統操作的一個過程,比如你打電話,場

雲端計算必須知道的幾個會議和雜誌

雲端計算現在被大家炒的熱火朝天,那麼很多人也想更多瞭解雲端計算。那麼我就給大家介紹幾個雜誌和網站。 IEEE International Conference on Cloud Computingh

必須知道的.NET特性和屬性

1、引言 attribute是.NET框架引入的一大技術亮點,因此我們有必要花點時間走進一個發現attribute登堂入室的入口。因為.NET Framework中使用了大量的定製特性來完成程式碼約定,[Serializable]、[Flags]、[DLLIm

sql serverexists用法

nbsp http ima 技術分享 mage .com .cn img bsp sql server之exists用法

C#刨根究底:《必須知道的.NET》讀書筆記系列

wid 最終 table bsp 圖解 萬能 展望 應用 light 一、此書到底何方神聖?   《你必須知道的.NET》來自於微軟MVP—王濤(網名:AnyTao,博客園大牛之一,其博客地址為:http://anytao.cnblogs.com/)的最新技術心得和感悟,

必須知道的.NET》讀書筆記一:小OO有大智慧

實現 職責 可靠性 基本 code cfile 生存 最好 min() 此篇已收錄至《你必須知道的.Net》讀書筆記目錄貼,點擊訪問該目錄可以獲取更多內容。 一、對象   (1)出生:系統首先會在內存中分配一定的存儲空間,然後初始化其附加成員,調用構造函數執行初始化,這

必須知道的改變中國人工智能命運的20個人

.com 翻譯 智能 團隊 自己 世界 榜單 中心 我們 近日,福布斯發表一篇名為《20個推動人工智能改革的科技領導者》的署名文章,介紹了中國頂尖科技公司中的20位致力於人工智能的重要人物,並認為在人工智能領域中國正在挑戰美國的領導地位。在福布斯列出的20位重要人物中,有1

為什麽要開展等級保護測評?必須知道

等保測評 隨著我國信息技術的快速發展,為維護國家安全和社會穩定,維護信息網絡安全,國務院於1994年頒布了《中華人民共和國計算機信息系統安全保護條例》(國務院147號令)。條例中規定:我國的“計算機信息系統實行安全等級保護。 2003年**辦公廳、國務院辦公廳轉發的《國家信息化領導

SQL Server連接

而且 表示 rom 技術 str 過濾 join 了解 返回 在sql server中,我們經常能用到連接,今天總結一下連接的基礎知識。連接的分類: 交叉連接CROSS JOIN 內連接INNER JOIN 外連接{左外連接LEFT [OUTER] JOIN ;右外連接R

SQL Server排序函數

多條 數據分區 com log server2 窗函數 tro 原理 clas Sql Server2005數據庫自帶一個排序函數ROW_NUMBER(),列表為: 語法:row_number() : over(子句)1.使用row_number()函數進行編號: sel

【微服務幹貨系列】使用微服務架構之前,必須知道

ces pop 負載 average led dsm 部署 通用 works 正如敏捷之父MartinFowler所說的那樣,單體架構和微服務並非簡單的二選一,兩者都是模糊的定義。這就意味著大多數系統都將在一個模糊的邊界區域。非常多開發團隊已經認識到微服務架構比

HTML5必須知道的28個新特性

html5你必須知道的28個新特性HTML5有很多的新功能.新代碼.非常不錯.現在總結一下.僅供參考1. 新的Doctype盡管使用<!DOCTYPE html>,即使瀏覽器不懂這句話也會按照標準模式去渲染2. Figure元素 用<figure>和<figcaption>

【火的不行的前端必須知道】一、淺談node.js

images 事件驅動 webp bsp 打包 前端框架 公司 org 詳細分析 引子: 現在都2017年了,在這個前端盛行的年頭,在不懂一些前端流行的技術就落伍了,恰好公司H5端項目也是讓這個方向去替換。 技術選型:   這裏主要是簡單說一下,後面會分章節詳細分

SQL Server增刪改操作

values 數據表 所有 var rop varchar con foreign entity -------添加約束、增刪改 1 use StudentDB2 2 go 3 --------創建學生表--------- 4 create table Stud

SQL Server 聚集索引的覆蓋,連接,交叉和過濾 <第二篇>

相對 col 超過 引用 保持 書簽 基本 nbsp 當我   在SQL Server中,非聚集索引其實可以看做是一個含有聚集索引的表,但相對實際的表來說,非聚集索引中所存儲的表的列數要少得多,一般就是索引列,聚集鍵(或RID)。非聚集索引僅僅包含源表中的非聚集索引的列和指