1. 程式人生 > >深入具體解釋SQL中的Null

深入具體解釋SQL中的Null

方便 not null sql語句 sdn 執行 轉換 des != mark

NULL 在計算機和編程世界中表示的是未知,不確定。盡管中文翻譯為 “空”, 但此空(null)非彼空(empty)。 Null表示的是一種未知狀態。未來狀態,比方小明兜裏有多少錢我不清楚,但也不能肯定為0,這時在計算機中就使用Null來表示未知和不確定。

盡管熟練掌握SQL的人對於Null不會有什麽疑問,但總結得非常全的文章還是非常難找,看到一篇英文版的, 感覺還不錯。

Tony Hoare 在1965年發明了 null 引用, 並覺得這是他犯下的“幾十億美元的錯誤”. 即便是50年後的今天, SQL中的 null 值還是導致很多常見錯誤的罪魁禍首.

我們一起來看那些最令人震驚的情況。

Null不支持大小/相等推斷

以下的2個查詢,無論表 users 中有多少條記錄,返回的記錄都是0行:

select * from users where deleted_at = null;

– result: 0 rows

select * from users where deleted_at != null;

– result: 0 rows

怎麽會這樣子? 一切僅僅由於 null 是表示一種“未知”的類型。也就是說。用常規的比較操作符(normal conditional operators)來將 null

與其它值比較是沒有意義的。 Null 也不等於 Null(近似理解: 未知的值不能等於未知的值。兩者間的關系也是未知。否則數學和邏輯上就亂套了)。

註意: 以下的SQL適合於MySQL,假設是Oracle,你須要加上 … from dual;

select null > 0;

– result: null

select null < 0;

– result: null

select null = 0;

– result: null

select null = null;

– result: null

select null != null;

– result: null

將某個值與 null 進行比較的正確方法是使用 is keyword, 以及 is not 操作符:

select * from users
where deleted_at is null;

– result: 全部未被刪除的 users

select * from users
where deleted_at is not null;

– result: 全部被標記為刪除的 users

假設想要推斷兩列的值是否不相同,則能夠使用 is distinct from:

select * from users
where has_address is distinct from has_photo

– result: 地址(address)或照片(photo)兩者僅僅有其一的用戶

not in 與 Null

子查詢(subselect)是一種非常方便的過濾數據的方法。比如,假設想要查詢沒有不論什麽包的用戶,能夠編寫以下這樣一個查詢:

select * from users 
where id not in (select user_id from packages)

但此時假若 packages 表中某一行的 user_idnull 的話。問題就來了: 返回結果是空的! 要理解為什麽會發生這樣的古怪的事情, 我們須要理解SQL編譯器到底幹了些什麽. 以下是一個更簡單的演示樣例:

select * from users 
where id not in (1, 2, null)

這個SQL語句會被轉換為:

select * from users 
where id != 1 and id != 2 and id != null

我們知道。id != null 結果是個未知值, null. 而隨意值和 null 進行 and 運算的結果都是 null, 所以相當於沒有其它條件. 那麽出這樣的結果的原因就是 null 的邏輯值不為 true.

假設條件調換過來, 查詢結果就沒有問題。 如今我們查詢有package的用戶.

select * from users 
where id in (select user_id from packages)

相同我們能夠使用簡單的樣例:

select * from users 
where id in (1, 2, null)

這條SQL被轉換為:

select * from users 
where id = 1 or id = 2 or id = null

由於 where 子句中是一串的 or 條件,所以當中某個的結果為 null 也是無關緊要的。非真(non-true)值並不影響子句中其它部分的計算結果,相當於被忽略了。

Null與排序

在排序時, null 值被覺得是最大的. 在降序排序時(descending)這會讓你非常頭大,由於 null值排在了最前面。

以下這個查詢是為了依據得分顯示用戶排名, 但它將沒有得分的用戶排到了最前面!

select name, points
from users
order by 2 desc;

– points 為 null 的記錄排在全部記錄之前!

解決這類問題有兩種思路。

最簡單的一種是用 coalesce 消除 null的影響:

– 在輸出時將 null 轉換為 0 :

select name, coalesce(points, 0)
from users
order by 2 desc;

– 輸出時保留 null, 但排序時轉換為 0 :

select name, points
from users
order by coalesce(points, 0) desc;

另一種方式須要數據庫的支持,指定排序時將 null 值放在最前面還是最後面:

select name, coalesce(points, 0)
from users
order by 2 desc nulls last;

當然, null 也能夠用來防止錯誤的發生,比方處理除數為0的數學運算錯誤。

被 0 除

除數為0是一個非常 egg-painfull 的錯誤。昨天還執行得好好的SQL。突然被0除一下子就出錯了。一個經常使用的解決方法是先用 case 語句推斷分母(denominator)是否為0,再進行除法運算。

select case when num_users = 0 then 0 
else total_sales/num_users end;

case 語句的方式事實上非常難看,並且分母被反復使用了。

假設是簡單的情況還好,假設分母是個非常復雜的表達式,那麽悲劇就來了: 非常難讀,非常難維護和改動,一不小心就是一堆BUG.

這時候我們能夠看看 null 的優點. 使用 nullif 使得分母為0時變成 null. 這樣就不再報錯, num_users = 0 時返回結果變為 null.

select total_sales/nullif(num_users, 0);

nullif 是將其它值轉為 null, 而Oracle的 nvl 是將 null 轉換為其它值。

假設不想要 null,而是希望轉換為 0 或者其它數, 則能夠在前一個SQL的基礎上使用 coalesce函數:

select coalesce(total_sales/nullif(num_users, 0), 0);

null 再轉換回0

Conclusion

Tony Hoare 或許會懊悔自己的錯誤, 但至少 null 存在的問題非常easy地就攻克了. 那麽快去練練新的大招吧。從此遠離 null 挖出來的無效大坑(nullifying)!

原文鏈接: Understanding SQL’s Null

原文日期: 2015年03月17日

翻譯日期: 2015年03月18日

翻譯人員: 鐵錨 http://blog.csdn.net/renfufei

深入具體解釋SQL中的Null