1. 程式人生 > >MySQL中行列轉換的SQL技巧 • cenalulu's Tech Blog

MySQL中行列轉換的SQL技巧 • cenalulu's Tech Blog

詳細介紹MySQL中用SQL實現行列轉換的技巧

行列轉換常見場景

由於很多業務表因為歷史原因或者效能原因,都使用了違反第一正規化的設計模式。即同一個列中儲存了多個屬性值(具體結構見下表)。 這種模式下,應用常常需要將這個列依據分隔符進行分割,並得到列轉行的結果。

表資料:

ID Value
1 tiny,small,big
2 small,medium
3 tiny,big

期望得到結果:

ID Value
1 tiny
1 small
1 big
2 small
2 medium
3 tiny
3 big

具體方法

先從一個具體例項開始我們的介紹:

#準備示例資料
create table tbl_name (ID int ,mSize varchar(100));
insert into tbl_name values (1,'tiny,small,big');
insert into tbl_name values (2,'small,medium');
insert into tbl_name values (3,'tiny,big');

#用於行列轉換迴圈的自增表
create table incre_table (AutoIncreID int);
insert into incre_table values (1);
insert into incre_table values (2);
insert into incre_table values (3);
 

#實現行列轉換的SQL
select a.ID,substring_index(substring_index(a.mSize,',',b.AutoIncreID),',',-1) 
from 
tbl_name a
join
incre_table b
on b.AutoIncreID <= (length(a.mSize) - length(replace(a.mSize,',',''))+1)
order by a.ID;

原理分析: 這個join最基本原理是笛卡爾積。通過這個方式來實現迴圈。 以下是具體問題分析: length(a.Size) - length(replace(a.mSize,',',''))+1 表示了,按照逗號分割後,改列擁有的數值數量,下面簡稱n join過程的虛擬碼:

根據ID進行迴圈
{
    判斷:i 是否 <= n
    {
        獲取最靠近第 i 個逗號之前的資料, 即 substring_index(substring_index(a.mSize,',',b.ID),',',-1)
        i = i +1 
    }
    ID = ID +1 
}

改進版本

上面一種方法方法的缺點在於,我們需要一個擁有連續數列的獨立表(也就是上文中的incre_table)。並且連續數列的最大值一定要大於符合分割的值的個數。 例如有一行的mSize 有100個逗號分割的值,那麼我們的incre_table 就需要有至少100個連續行。 當然,mysql內部也有現成的連續數列表可用。如mysql.help_topichelp_topic_id 共有504個數值,一般能滿足於大部分需求了。

改寫後如下:

select a.ID,substring_index(substring_index(a.mSize,',',b.help_topic_id+1),',',-1) 
from 
tbl_name a
join
mysql.help_topic b
on b.help_topic_id < (length(a.mSize) - length(replace(a.mSize,',',''))+1)
order by a.ID;