1. 程式人生 > >深入理解SQL的四種連線-左外連線、右外連線、內連線、全連線

深入理解SQL的四種連線-左外連線、右外連線、內連線、全連線

1、內聯接(典型的聯接運算,使用像 = 或 <> 之類的比較運算子)。包括相等聯接和自然聯接。 內聯接使用比較運算子根據每個表共有的列的值匹配兩個表中的行。例如,檢索 students和courses表中學生標識號相同的所有行。

2、外聯接。外聯接可以是左向外聯接、右向外聯接或完整外部聯接。 在 FROM子句中指定外聯接時,可以由下列幾組關鍵字中的一組指定: 1)LEFT JOIN或LEFT OUTER JOIN 左向外聯接的結果集包括 LEFT OUTER子句中指定的左表的所有行,而不僅僅是聯接列所匹配的行。如果左表的某行在右表中沒有匹配行,則在相關聯的結果集行中右表的所有選擇列表列均為空值。 2)RIGHT JOIN 或 RIGHT OUTER JOIN 右向外聯接是左向外聯接的反向聯接。將返回右表的所有行。如果右表的某行在左表中沒有匹配行,則將為左表返回空值。 3)FULL JOIN 或 FULL OUTER JOIN 完整外部聯接返回左表和右表中的所有行。當某行在另一個表中沒有匹配行時,則另一個表的選擇列表列包含空值。如果表之間有匹配行,則整個結果集行包含基表的資料值。

3、交叉聯接 交叉聯接返回左表中的所有行,左表中的每一行與右表中的所有行組合。交叉聯接也稱作笛卡爾積。 FROM 子句中的表或檢視可通過內聯接或完整外部聯接按任意順序指定;但是,用左或右向外聯接指定表或檢視時,表或檢視的順序很重要。有關使用左或右向外聯接排列表的更多資訊,請參見使用外聯接。

例子:

a表 id name b表 id job parent_id 1 張3 1 23 1 2 李四 2 34 2 3 王武 3 34 4 a.id同parent_id 存在關係

1) 內連線 select a.,b. from a inner join b on a.id=b.parent_id 結果是 1 張3 1 23 1 2 李四 2 34 2

2)左連線 select a.,b. from a left join b on a.id=b.parent_id 結果是 1 張3 1 23 1 2 李四 2 34 2 3 王武 null

3) 右連線 select a.,b. from a right join b on a.id=b.parent_id 結果是 1 張3 1 23 1 2 李四 2 34 2 null 3 34 4

4) 完全連線 select a.,b. from a full join b on a.id=b.parent_id 結果是 1 張3 1 23 1 2 李四 2 34 2 null    3 34 4 3 王武 null --------------------------------------------------------------------------------------------一、交叉連線(CROSS JOIN) 交叉連線(CROSS JOIN):有兩種,顯式的和隱式的,不帶ON子句,返回的是兩表的乘積,也叫笛卡爾積。 例如:下面的語句1和語句2的結果是相同的。

語句1:隱式的交叉連線,沒有CROSS JOIN。 SELECT O.ID, O.ORDER_NUMBER, C.ID, C.NAME FROM ORDERS O , CUSTOMERS C WHERE O.ID=1;

語句2:顯式的交叉連線,使用CROSS JOIN。 SELECT O.ID,O.ORDER_NUMBER,C.ID, C.NAME FROM ORDERS O CROSS JOIN CUSTOMERS C WHERE O.ID=1; 語句1和語句2的結果是相同的,查詢結果如下:

二、內連線(INNER JOIN) 內連線(INNER JOIN):有兩種,顯式的和隱式的,返回連線表中符合連線條件和查詢條件的資料行。(所謂的連結表就是資料庫在做查詢形成的中間表)。 例如:下面的語句3和語句4的結果是相同的。

語句3:隱式的內連線,沒有INNER JOIN,形成的中間表為兩個表的笛卡爾積。 SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME FROM CUSTOMERS C,ORDERS O WHERE C.ID=O.CUSTOMER_ID;

語句4:顯示的內連線,一般稱為內連線,有INNER JOIN,形成的中間表為兩個表經過ON條件過濾後的笛卡爾積。 SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID; 語句3和語句4的查詢結果:

三、外連線(OUTER JOIN):外連不但返回符合連線和查詢條件的資料行,還返回不符合條件的一些行。外連線分三類:左外連線(LEFT OUTER JOIN)、右外連線(RIGHT OUTER JOIN)和全外連線(FULL OUTER JOIN)。 三者的共同點是都返回符合連線條件和查詢條件(即:內連線)的資料行。不同點如下: 左外連線還返回左表中不符合連線條件單符合查詢條件的資料行。 右外連線還返回右表中不符合連線條件單符合查詢條件的資料行。 全外連線還返回左表中不符合連線條件單符合查詢條件的資料行,並且還返回右表中不符合連線條件單符合查詢條件的資料行。全外連線實際是上左外連線和右外連線的數學合集(去掉重複),即“全外=左外 UNION 右外”。 說明:左表就是在“(LEFT OUTER JOIN)”關鍵字左邊的表。右表當然就是右邊的了。在三種類型的外連線中,OUTER 關鍵字是可省略的。

下面舉例說明: 語句5:左外連線(LEFT OUTER JOIN) SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句6:右外連線(RIGHT OUTER JOIN) SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID; 注意:WHERE條件放在ON後面查詢的結果是不一樣的。例如:

語句7:WHERE條件獨立。 SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID WHERE O.ORDER_NUMBER<>‘MIKE_ORDER001’;

語句8:將語句7中的WHERE條件放到ON後面。 SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID AND O.ORDER_NUMBER<>‘MIKE_ORDER001’;

從語句7和語句8查詢的結果來看,顯然是不相同的,語句8顯示的結果是難以理解的。因此,推薦在寫連線查詢的時候,ON後面只跟連線條件,而對中間表限制的條件都寫到WHERE子句中。

語句9:全外連線(FULL OUTER JOIN)。 SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID; 注意:MySQL是不支援全外的連線的,這裡給出的寫法適合Oracle和DB2。但是可以通過左外和右外求合集來獲取全外連線的查詢結果。下圖是上面SQL在Oracle下執行的結果:

語句10:左外和右外的合集,實際上查詢結果和語句9是相同的。 SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID UNION SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID; 語句9和語句10的查詢結果是相同的,如下:

四、聯合連線(UNION JOIN):這是一種很少見的連線方式。Oracle、MySQL均不支援,其作用是:找出全外連線和內連線之間差異的所有行。這在資料分析中排錯中比較常用。也可以利用資料庫的集合操作來實現此功能。 語句11:聯合查詢(UNION JOIN)例句,還沒有找到能執行的SQL環境。 SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O UNION JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID

語句12:語句11在DB2下的等價實現。還不知道DB2是否支援語句11呢! SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID EXCEPT SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句13:語句11在Oracle下的等價實現。 SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID MINUS SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID; 查詢結果如下:

五、自然連線(NATURAL INNER JOIN):說真的,這種連線查詢沒有存在的價值,既然是SQL2標準中定義的,就給出個例子看看吧。自然連線無需指定連線列,SQL會檢查兩個表中是否相同名稱的列,且假設他們在連線條件中使用,並且在連線條件中僅包含一個連線列。不允許使用ON語句,不允許指定顯示列,顯示列只能用*表示(ORACLE環境下測試的)。對於每種連線型別(除了交叉連線外),均可指定NATURAL。下面給出幾個例子。 語句14: SELECT * FROM ORDERS O NATURAL INNER JOIN CUSTOMERS C;

語句15: SELECT * FROM ORDERS O NATURAL LEFT OUTER JOIN CUSTOMERS C;

語句16: SELECT * FROM ORDERS O NATURAL RIGHT OUTER JOIN CUSTOMERS C;

語句17: SELECT * FROM ORDERS O NATURAL FULL OUTER JOIN CUSTOMERS C;

六、SQL查詢的基本原理:兩種情況介紹。 第一、單表查詢:根據WHERE條件過濾表中的記錄,形成中間表(這個中間表對使用者是不可見的);然後根據SELECT的選擇列選擇相應的列進行返回最終結果。

第二、兩表連線查詢:對兩表求積(笛卡爾積)並用ON條件和連線連線型別進行過濾形成中間表;然後根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。

第三、多表連線查詢:先對第一個和第二個表按照兩表連線做查詢,然後用查詢結果和第三個表做連線查詢,以此類推,直到所有的表都連線上為止,最終形成一箇中間的結果表,然後根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。 理解SQL查詢的過程是進行SQL優化的理論依據。

七、ON後面的條件(ON條件)和WHERE條件的區別: ON條件:是過濾兩個連結表笛卡爾積形成中間表的約束條件。 WHERE條件:在有ON條件的SELECT語句中是過濾中間表的約束條件。在沒有ON的單表查詢中,是限制物理表或者中間查詢結果返回記錄的約束。在兩表或多表連線中是限制連線形成最終中間表的返回結果的約束。 從這裡可以看出,將WHERE條件移入ON後面是不恰當的。推薦的做法是: ON只進行連線操作,WHERE只過濾中間表的記錄。

八、總結 連線查詢是SQL查詢的核心,連線查詢的連線型別選擇依據實際需求。如果選擇不當,非但不能提高查詢效率,反而會帶來一些邏輯錯誤或者效能低下。下面總結一下兩表連線查詢選擇方式的依據: 1、 查兩表關聯列相等的資料用內連線。 2、 Col_L是Col_R的子集時用右外連線。 3、 Col_R是Col_L的子集時用左外連線。 4、 Col_R和Col_L彼此有交集但彼此互不為子集時候用全外。 5、 求差操作的時候用聯合查詢。 多個表查詢的時候,這些不同的連線型別可以寫到一塊。例如: SELECT T1.C1,T2.CX,T3.CY FROM TAB1 T1 INNER JOIN TAB2 T2 ON (T1.C1=T2.C2) INNER JOIN TAB3 T3 ON (T1.C1=T2.C3) LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3); WHERE T1.X >T3.Y;