PostgreSQL_樹形結構的遞迴查詢
處理不確定深度的層級結構,比如組織機構,一個常用的設計是在一張表裡面儲存 ID 和 Parent_ID ,並且通過自聯結的辦法構造一顆樹。這種方式對寫資料的過程很友好,但是查詢過程就變得相對複雜。在不引入MPTT模型的前提下,必須通過遞迴演算法來查詢某個節點和下級子節點。
Oracle提供的connect by擴充套件語法,簡單好用。但是其他的RDBMS就沒這麼人性化了(或者我不知道)。最近在專案中使用PostgreSQL來查詢樹形資料,記錄一下。
構造樣本資料
drop table if exists demo.tree_data; create table demo.tree_data ( id integer, code text, pid integer, sort integer ); insert into demo.tree_data values(1, '中國', null, 1); insert into demo.tree_data values(2, '四川', 1, 1); insert into demo.tree_data values(3, '雲南', 1, 2); insert into demo.tree_data values(4, '成都', 2, 1); insert into demo.tree_data values(5, '綿陽', 2, 2); insert into demo.tree_data values(6, '武侯區', 4, 1); insert into demo.tree_data values(7, '昆明', 3, 1); 複製程式碼
connectby函式
如果安裝了tablefunc 擴充套件,就可以使用PG版本的connectby函式。這個沒有Oracle那麼強大,但是可以滿足基本要求。
-- API 如下 connectby(text relname, -- 表名稱 text keyid_fld, -- id欄位 text parent_keyid_fld-- 父id欄位 [, text orderby_fld ], -- 排序欄位 text start_with, -- 起始行的id值 int max_depth-- 樹深度,0表示無限 [, text branch_delim ])-- 路徑分隔符 複製程式碼
-- 基本用法如下,必須通過AS子句定義返回的欄位名稱和型別 select * from connectby('demo.tree_data', 'id', 'pid', 'sort', '1', 0, '~') as (id int, pid int, lvl int, branch text, sort int); -- 查詢結果 id | pid | lvl | branch| sort ----+-----+-----+---------+------ 1 ||0 | 1|1 2 |1 |1 | 1~2|2 4 |2 |2 | 1~2~4|3 6 |4 |3 | 1~2~4~6 |4 5 |2 |2 | 1~2~5|5 3 |1 |1 | 1~3|6 7 |3 |2 | 1~3~7|7 (7 rows) 複製程式碼
-- 僅僅使用基本用法,只能查詢出id的相關資訊,如果要查詢code等其他欄位,就需要通過額外的join操作來實現。 select t.id, n.code, t.pid, p.code as pcode, lvl, branch from ( select * from connectby('demo.tree_data', 'id', 'pid', 'sort', '1', 0, '~') as (id int, pid int, lvl int, branch text, sort int) ) as t left join demo.tree_data as n on (t.id = n.id) left join demo.tree_data as p on (t.pid = p.id) order by t.sort ; id |code| pid | pcode | lvl | branch ----+--------+-----+-------+-----+--------- 1 | 中國|||0 | 1 2 | 四川|1 | 中國|1 | 1~2 4 | 成都|2 | 四川|2 | 1~2~4 6 | 武侯區 |4 | 成都|3 | 1~2~4~6 5 | 綿陽|2 | 四川|2 | 1~2~5 3 | 雲南|1 | 中國|1 | 1~3 7 | 昆明|3 | 雲南|2 | 1~3~7 (7 rows) 複製程式碼
PS:雖然通過join可以查詢出節點的code,但是branch部分不能直接轉換成對應的code,使用上還是不太方便。
CTE語法
使用CTE語法,通過 with recursive 來實現樹形資料的遞迴查詢。這個方法雖然沒有connectby那麼直接,但是靈活性和顯示效果更好。
-- with recursive cte as ( -- 先查詢root節點 select id, code, pid, '' as pcode, code as branch fromdemo.tree_data where id = 1 union all -- 通過cte遞迴查詢root節點的直接子節點 select origin.id, origin.code, cte.id as pid, cte.code as pcode, cte.branch || '~' || origin.code from cte join demo.tree_data as origin on origin.pid = cte.id ) select id,code, pid, pcode, branch, -- 通過計算分隔符的個數,模擬計算出樹形的深度 (length(branch)-length(replace(branch, '~', ''))) as lvl from cte; -- id |code| pid | pcode |branch| lvl ----+--------+-----+-------+-----------------------+----- 1 | 中國||| 中國|0 2 | 四川|1 | 中國| 中國~四川|1 3 | 雲南|1 | 中國| 中國~雲南|1 4 | 成都|2 | 四川| 中國~四川~成都|2 5 | 綿陽|2 | 四川| 中國~四川~綿陽|2 7 | 昆明|3 | 雲南| 中國~雲南~昆明|2 6 | 武侯區 |4 | 成都| 中國~四川~成都~武侯區|3 (7 rows) 複製程式碼
執行過程說明
從上面的例子可以看出,WITH RECURSIVE語句包含了兩個部分
- non-recursive term(非遞迴部分),即上例中的union all前面部分
- recursive term(遞迴部分),即上例中union all後面部分
執行步驟如下
- 執行non-recursive term。(如果使用的是union而非union all,則需對結果去重)其結果作為recursive term中對result的引用,同時將這部分結果放入臨時的working table中
- 重複執行如下步驟,直到working table為空:用working table的內容替換遞迴的自引用,執行recursive term,(如果使用union而非union all,去除重複資料),並用該結果(如果使用union而非union all,則是去重後的結果)替換working table
以上面的query為例,來看看具體過程
- 執行non-recursive query
-- step 1 執行 select id, code, pid, '' as pcode, code as branch fromdemo.tree_data where id = 1 -- 結果集和working table為 id | code | pid | pcode | branch ----+------+-----+-------+-------- 1 | 中國 ||| 中國 複製程式碼
- 執行recursive query
-- step 2 執行遞迴,此時自引用cte中的資料是step 1的結果 select origin.id, origin.code, cte.id as pid, cte.code as pcode, cte.branch || '~' || origin.code from cte join demo.tree_data as origin on origin.pid = cte.id -- 結果集和working table為 id |code| pid | pcode |branch ----+--------+-----+-------+--------------------- 2 | 四川|1 | 中國| 中國~四川 3 | 雲南|1 | 中國| 中國~雲南 複製程式碼
-
繼續執行recursive query,直到結果集和working table為空
-
結束遞迴,將前三個步驟的結果集合並,即得到最終的WITH RECURSIVE的結果集。
嚴格來講,這個過程實現上是一個迭代的過程而非遞迴,不過RECURSIVE這個關鍵詞是SQL標準委員會定立的,所以PostgreSQL也延用了RECURSIVE這一關鍵詞。