1. 程式人生 > >SQL Server 變更資料捕獲(CDC)監控表資料

SQL Server 變更資料捕獲(CDC)監控表資料

一.本文所涉及的內容(Contents)

二.背景(Contexts)

  在SQL Server 2008版本之前,對錶資料庫的變更監控,我們通常使用DML觸發器進行監控,把DML操作中的INSERT/UPDATE/DELETE資料記錄下來,但是觸發器的維護比較困難;

  當SQL Server 2008新功能:變更資料捕獲(Change Data Capture,即CDC)出來之後,我發現這正是我想要的,因為我之前使用DML觸發器實現的時候也是把UPDATE操作按照兩條記錄進行記錄的,共同的缺點都是在使用者修改了表結構後,CDC不會自動同步到記錄中,不過CDC也有DDL的監控可以補充這個缺陷;CDC的優點就是以非同步程序讀取事務日誌進行捕獲資料變更的。

三.實現過程(Realization)

(一) 建立一個測試資料庫;

/******* Step1:建立示例資料庫*******/
USE master
GO
IF EXISTS(SELECT name FROM sys.databases WHERE name = 'CDC_DB')
DROP DATABASE CDC_DB
GO
CREATE DATABASE CDC_DB
GO

(二) 在開啟資料庫的CDC之前先查詢一下狀態,is_cdc_enabled值為0表示沒有開啟,1表示開啟,當為資料庫[CDC_DB]啟用了CDC之後,在CDC_DB系統表中會出現下圖Figure2所示的6個表;

/******* Step2:開啟資料庫CDC *******/
--檢視資料庫是否啟用CDC
SELECT name,is_cdc_enabled FROM sys.databases WHERE name = 'CDC_DB'

--啟用資料庫CDC
USE CDC_DB
GO
EXECUTE sys.sp_cdc_enable_db;
GO

--檢查啟用是否成功
SELECT is_cdc_enabled,CASE WHEN is_cdc_enabled=0 THEN 'CDC功能禁用' ELSE 'CDC功能啟用' END 描述
FROM sys.databases
WHERE NAME = 'CDC_DB'

wps_clip_image-1021

(Figure1:資料庫CDC狀態)

wps_clip_image-29510

(Figure2:啟用資料庫CDC建立的系統表)

wps_clip_image-13454

(Figure3:資料庫CDC狀態)

wps_clip_image-14649

(Figure4:新增新使用者和架構)

開啟資料庫的CDC之後,分別在使用者和架構上建立新的使用者cdc,新的架構cdc;

(三) 建立一個測試表,對錶行變更啟用捕獲,為表[Department]啟用CDC,首先會在系統表中建立[cdc].[dbo_Department_CT],會在Agent中建立兩個作業,cdc.CDC_DB_capture和cdc.CDC_DB_cleanup,啟用表變更捕獲需要開啟SQL Server Agent服務,不然會報錯。每對一個表啟用捕獲就會生成一個向對應的記錄表。

/******* Step3:對錶啟用變更捕獲*******/
--建立測試表
USE CDC_DB
GO
CREATE TABLE [dbo].[Department](
    [DepartmentID] [smallint] IDENTITY(1,1) NOT NULL,
    [Name] [nvarchar](200) NULL,
    [GroupName] [nvarchar](50) NOT NULL,
    [ModifiedDate] [datetime] NOT NULL,
    [AddName] [nvarchar](120) NULL,
 CONSTRAINT [PK_Department_DepartmentID] PRIMARY KEY CLUSTERED 
(
    [DepartmentID] ASC
) ON [PRIMARY]
) ON [PRIMARY]
GO

--對錶啟用捕獲
EXEC sys.sp_cdc_enable_table 
    @source_schema= 'dbo',
       @source_name = 'Department',
       @role_name = N'cdc_Admin',
       @capture_instance = DEFAULT,
       @supports_net_changes = 1,
    @index_name = NULL,
    @captured_column_list = NULL,
    @filegroup_name = DEFAULT

--檢查是否成功
SELECT name, is_tracked_by_cdc ,
    CASE WHEN is_tracked_by_cdc = 0 THEN 'CDC功能禁用' ELSE 'CDC功能啟用' END 描述
FROM sys.tables
WHERE OBJECT_ID= OBJECT_ID('dbo.Department')

--返回某個表的變更捕獲配置資訊
EXEC sys.sp_cdc_help_change_data_capture 'dbo', 'Department'

wps_clip_image-12260

(Figure5:提示資訊)

wps_clip_image-25427

(Figure6:新增加的系統表)

wps_clip_image-21092

(Figure7:生成的捕獲和清理作業)

wps_clip_image-14851

(Figure8:表的CDC狀態)

wps_clip_image-12771

(Figure9:多了個數據庫角色)

wps_clip_image-5760

wps_clip_image-15007

(Figure10:sys.sp_cdc_enable_table配置選項)

上圖深色部分的欄位值是在執行sys.sp_cdc_enable_table的時候設定的。

(四) 測試插入資料、更新資料、刪除資料,執行完這些DML,我們來觀察下cdc.dbo_Department_CT幫我們記錄些什麼?

/******* Step4:測試DML變更捕獲*******/
--測試插入資料
INSERT  INTO dbo.Department(
    Name ,
    GroupName ,
    ModifiedDate
)VALUES('Marketing','Sales and Marketing',GETDATE())

--測試更新資料
UPDATE dbo.Department SET Name = 'Marketing Group',ModifiedDate = GETDATE()
WHERE Name = 'Marketing'

--測試刪除資料
DELETE FROM dbo.Department WHERE Name='Marketing Group'

--查詢捕獲資料
SELECT * FROM cdc.dbo_Department_CT

wps_clip_image-29776

(Figure11:變更記錄表)

對於insert/delete操作,會有對應的一行記錄,而對於update,會有兩行記錄。__$operation列:1 = 刪除、2= 插入、3= 更新(舊值)、4= 更新(新值);

(五) 啟用CDC之後,你怎麼從中獲取到資料呢?通過資料我們可以對資料進行恢復;

/******* Step6:使用LSN 檢視CDC記錄*******/
--http://msdn.microsoft.com/zh-cn/library/bb500137%28v=sql.100%29.aspx
SELECT sys.fn_cdc_map_time_to_lsn
('smallest greater than or equal', '2013-07-24 09:00:30') AS BeginLSN

SELECT sys.fn_cdc_map_time_to_lsn
('largest less than or equal', '2013-07-24 23:59:59') AS EndLSN


/******* 檢視某時間段所有CDC記錄*******/
DECLARE @FromLSN binary(10) =
sys.fn_cdc_map_time_to_lsn
('smallest greater than or equal' , '2013-06-23 09:00:30')

DECLARE @ToLSN binary(10) =
sys.fn_cdc_map_time_to_lsn
('largest less than or equal' , '2013-07-26 23:59:59')

SELECT CASE [__$operation]
WHEN 1 THEN 'DELETE'
WHEN 2 THEN 'INSERT'
WHEN 3 THEN 'Before UPDATE'
WHEN 4 THEN 'After UPDATE'
END Operation,[__$operation],[__$update_mask],DepartmentId,Name,GroupName,ModifiedDate,AddName
FROM [cdc].[fn_cdc_get_all_changes_dbo_Department]
(@FromLSN, @ToLSN,  N'all update old')
/*
all 其中的update,只包含新值
all update old 包含新值和舊值
*/

wps_clip_image-16708

(Figure15:通過時間獲取LSN更新)

(六) CDC的維護

/******* Step5:維護CDC *******/
--返回所有表的變更捕獲配置資訊
EXECUTE sys.sp_cdc_help_change_data_capture;

--返回某個表的變更捕獲配置資訊
EXEC sys.sp_cdc_help_change_data_capture 'dbo', 'Department'

--檢視對某個表的哪些列做了捕獲監控,使用上面返回的capture_instance列值
EXEC sys.sp_cdc_get_captured_columns
@capture_instance = 'dbo_Department'

wps_clip_image-26559

(Figure12:監控表字段資訊)

由於sys.sp_cdc_enable_table 的引數:@captured_column_list = NULL,所以dbo.Department表的所有欄位都進行監控了,如果你只關心某些欄位,強烈建議在建立捕獲的時候設定這個屬性;

--所有資料庫CDC Job資訊
SELECT B.name,A.* FROM msdb.dbo.cdc_jobs AS A
LEFT JOIN sys.databases AS B
ON A.database_id = B.database_id

--當前資料庫CDC Job資訊
EXEC sp_cdc_help_jobs

wps_clip_image-6647

(Figure13:資料庫作業資訊)

四.補充說明(Addon)

  SQL Server記錄資料變更有四種方法:觸發器、Output子句、變更資料捕獲(Change Data Capture 即CDC)功能、同步更改跟蹤。其中後兩個為SQL Server 2008所新增。

CDC功能主要捕獲SQLServer指定表的增刪改操作;

CDC除了捕獲資料變更之外,還能捕獲DDL操作的變化;

無法對系統資料庫和分發資料庫啟用該功能。且執行者需要用sysadmin角色許可權;

cdc.<capture_instance>_CT   可以看到,這樣命名的表,是用於記錄源表更改的表。對於insert/delete操作,會有對應的一行記錄,而對於update,會有兩行記錄;

對於__$start_lsn列:由於更改是來源與資料庫的事務日誌,所以這裡會儲存其事務日誌的開始序列號(LSN);

對於__$end_lsn列:

對於__$seqval列:

對於__$operation列:1 = 刪除、2= 插入、3= 更新(舊值)、4= 更新(新值);

對於__$update_mask列:

恢復模式為簡單模式一樣可以進行CDC;

雖然能捕獲到資料變更,但是沒有辦法找到是誰更新的?

能使用這個做回滾嘛?備份的另外一種路徑?對錶更新不頻繁的情況下?

如果是新增或者刪除了某些欄位DDL,那麼建立的CDC表並沒有做更改,那新欄位的資料怎麼捕獲呢?修改欄位長度等這些操作同樣會一起修改CDC對應的表字段;

sys.sp_cdc_enable_table 的@role_name引數,是指角色-資料庫角色,這個有什麼用呢?應用程式角色又有什麼用呢?

cdc.Person_Contact_CT這名字中CT代表什麼意思呢?Capture Table?(使用者.架構_表_CT)

SQL Server 自啟動了兩個job,一個捕獲,一個清除,注意清除是預設凌晨2點,清除72小時以上的資料。如果同一資料庫的表中CDC已經啟用,不會重建job。

all

返回指定 LSN 範圍內的所有更改。 對於由更新操作導致的更改,此選項只返回在應用更新之後包含新值的行。

all update old

返回指定 LSN 範圍內的所有更改。 對於由更新操作導致的更改,此選項將返回在更新之前包含列值的行和更新之後包含列值的行。

五.參考文獻(References)