詳解mysql三值邏輯與NULL
NULL 用于表示缺失的值或遺漏的未知數(shù)據(jù),不是某種具體類型的值。數(shù)據(jù)表中的 NULL 值表示該值所處的字段為空,值為 NULL 的字段沒有值,尤其要明白的是:NULL 值與 0 或者空字符串是不同的。
兩種 NULL這種說法大家可能會覺得很奇怪,因為 SQL 里只存在一種 NULL 。然而在討論 NULL 時,我們一般都會將它分成兩種類型來思考:“未知”(unknown)和“不適用”(not applicable,inapp licable)。
以“不知道戴墨鏡的人眼睛是什么顏色”這種情況為例,這個人的眼睛肯定是有顏色的,但是如果他不摘掉眼鏡,別人就不知道他的眼睛是什么顏色。這就叫作未知。而“不知道冰箱的眼睛是什么顏色”則屬于“不適用”。因為冰箱根本就沒有眼睛,所以“眼睛的顏色”這一屬性并不適用于冰箱?!氨涞难劬Φ念伾边@種說法和“圓的體積”“男性的分娩次數(shù)”一樣,都是沒有意義的。平時,我們習(xí)慣了說“不知道”,但是“不知道”也分很多種?!安贿m用”這種情況下的 NULL ,在語義上更接近于“無意義”,而不是“不確定”。這里總結(jié)一下:“未知”指的是“雖然現(xiàn)在不知道,但加上某些條件后就可以知道”;而“不適用”指的是“無論怎么努力都無法知道”。
關(guān)系模型的發(fā)明者 E.F. Codd 最先給出了這種分類。下圖是他對“丟失的信息”的分類
我相信不少人有這樣的困惑吧,尤其是相信剛學(xué) SQL 的小伙伴。我們來看個具體的案例,假設(shè)我們有如下表以及數(shù)據(jù)
DROP TABLE IF EXISTS t_sample_null;CREATE TABLE t_sample_null ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT ’自增主鍵’, name VARCHAR(50) NOT NULL COMMENT ’名稱’, remark VARCHAR(500) COMMENT ’備注’, primary key(id)) COMMENT ’NULL樣例’;INSERT INTO t_sample_null(name, remark)VALUES(’zhangsan’, ’張三’),(’李四’, NULL);
我們要查詢備注為 NULL 的記錄(為 NULL 這種叫法本身是不對的,只是我們?nèi)粘V幸呀?jīng)叫習(xí)慣了,具體往下看),怎么查,很多新手會寫出這樣的 SQL
-- SQL 不報錯,但查不出結(jié)果SELECT * FROM t_sample_null WHERE remark = NULL;
執(zhí)行時不報錯,但是查不出我們想要的結(jié)果, 這是為什么了 ?這個問題我們先放著,我們往下看
三值邏輯這個三值邏輯不是三目運算,指的是三個邏輯值,有人可能有疑問了,邏輯值不是只有真(true)和假(false)嗎,哪來的第三個?說這話時我們需要注意所處的環(huán)境,在主流的編程語言中(C、JAVA、Python、JS等)中,邏輯值確實只有 2 個,但在 SQL 中卻存在第三個邏輯值:unknown。這有點類似于我們平時所說的:對、錯、不知道。
邏輯值 unknown 和作為 NULL 的一種的 UNKNOWN (未知)是不同的東西。前者是明確的布爾型的邏輯值,后者既不是值也不是變量。為了便于區(qū)分,前者采用小寫字母 unknown ,后者用大寫字母 UNKNOWN 來表示。為了讓大家理解兩者的不同,我們來看一個 x=x 這樣的簡單等式。x 是邏輯值 unknown 時,x=x 被判斷為 true ,而 x 是 UNKNOWN 時被判斷為 unknown
-- 這個是明確的邏輯值的比較unknown = unknown → true-- 這個相當(dāng)于NULL = NULLUNKNOWN = UNKNOWN → unknown三值邏輯的邏輯值表
NOT
AND
OR
圖中藍(lán)色部分是三值邏輯中獨有的運算,這在二值邏輯中是沒有的。其余的 SQL 謂詞全部都能由這三個邏輯運算組合而來。從這個意義上講,這個幾個邏輯表可以說是 SQL 的母體(matrix)。
NOT 的話,因為邏輯值表比較簡單,所以很好記;但是對于 AND 和 OR,因為組合出來的邏輯值較多,所以全部記住非常困難。為了便于記憶,請注意這三個邏輯值之間有下面這樣的優(yōu)先級順序。
AND 的情況:false > unknown > true
OR 的情況:true > unknown > false
優(yōu)先級高的邏輯值會決定計算結(jié)果。例如 true AND unknown ,因為 unknown 的優(yōu)先級更高,所以結(jié)果是 unknown 。而 true OR unknown 的話,因為 true 優(yōu)先級更高,所以結(jié)果是 true 。記住這個順序后就能更方便地進行三值邏輯運算了。特別需要記住的是,當(dāng) AND 運算中包含 unknown 時,結(jié)果肯定不會是 true (反之,如果AND 運算結(jié)果為 true ,則參與運算的雙方必須都為 true )。
-- 假設(shè) a = 2, b = 5, c = NULL,下列表達(dá)式的邏輯值如下a < b AND b > c → unknowna > b OR b < c → unknowna < b OR b < c → trueNOT (b <> c) → unknown“IS NULL” 而非 “= NULL”
我們再回到問題:為什么必須寫成“IS NULL”,而不是“= NULL”
對 NULL 使用比較謂詞后得到的結(jié)果總是 unknown 。而查詢結(jié)果只會包含 WHERE 子句里的判斷結(jié)果為 true 的行,不會包含判斷結(jié)果為 false 和 unknown 的行。不只是等號,對 NULL 使用其他比較謂詞,結(jié)果也都是一樣的。所以無論 remark 是不是 NULL ,比較結(jié)果都是 unknown ,那么永遠(yuǎn)沒有結(jié)果返回。以下的式子都會被判為 unknown
-- 以下的式子都會被判為 unknown= NULL> NULL< NULL<> NULLNULL = NULL
那么,為什么對 NULL 使用比較謂詞后得到的結(jié)果永遠(yuǎn)不可能為真呢?這是因為,NULL 既不是值也不是變量。NULL 只是一個表示“沒有值”的標(biāo)記,而比較謂詞只適用于值。因此,對并非值的 NULL 使用比較謂詞本來就是沒有意義的?!傲械闹禐?NULL ”、“NULL 值” 這樣的說法本身就是錯誤的。因為 NULL不是值,所以不在定義域(domain)中。相反,如果有人認(rèn)為 NULL 是值,那么我們可以倒過來想一下:它是什么類型的值?關(guān)系數(shù)據(jù)庫中存在的值必然屬于某種類型,比如字符型或數(shù)值型等。所以,假如 NULL 是值,那么它就必須屬于某種類型。
NULL 容易被認(rèn)為是值的原因有兩個。第一個是高級編程語言里面,NULL 被定義為了一個常量(很多語言將其定義為了整數(shù)0),這導(dǎo)致了我們的混淆。但是,SQL 里的 NULL 和其他編程語言里的 NULL 是完全不同的東西。第二個原因是,IS NULL 這樣的謂詞是由兩個單詞構(gòu)成的,所以我們?nèi)菀装?IS 當(dāng)作謂詞,而把 NULL 當(dāng)作值。特別是 SQL 里還有 IS TRUE 、IS FALSE 這樣的謂詞,我們由此類推,從而這樣認(rèn)為也不是沒有道理。但是正如講解標(biāo)準(zhǔn) SQL 的書里提醒人們注意的那樣,我們應(yīng)該把 IS NULL 看作是一個謂詞。因此,寫成 IS_NULL 這樣也許更合適。
溫柔的陷阱比較謂詞和 NULL排中律不成立排中律指同一個思維過程中,兩個相互矛盾的思想不能同假,必有一真,即“要么A要么非A”
假設(shè)我們有學(xué)生表:t_student
DROP TABLE IF EXISTS t_student;CREATE TABLE t_student ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT ’自增主鍵’, name VARCHAR(50) NOT NULL COMMENT ’名稱’, age INT(3) COMMENT ’年齡’, remark VARCHAR(500) NOT NULL DEFAULT ’’ COMMENT ’備注’, primary key(id)) COMMENT ’學(xué)生信息’;INSERT INTO t_student(name, age)VALUE(’zhangsan’, 25),(’wangwu’, 60),(’bruce’, 32),(’yzb’, NULL),(’boss’, 18);SELECT * FROM t_student;
表中數(shù)據(jù) yzb 的 age 是 NULL,也就是說 yzb 的年齡未知。在現(xiàn)實世界里,yzb 是 20 歲,或者不是 20 歲,二者必居其一,這毫無疑問是一個真命題。那么在 SQL 的世界里了,排中律還適用嗎? 我們來看一個 SQL
SELECT * FROM t_studentWHERE age = 20 OR age <> 20;
咋一看,這不就是查詢表中全部記錄嗎?我們來看下實際結(jié)果
yzb 沒查出來,這是為什么了?我們來分析下,yzb 的 age 是 NULL,那么這條記錄的判斷步驟如下
-- 1. 約翰年齡是 NULL (未知的 NULL !)SELECT *FROM t_studentWHERE age = NULLOR age <> NULL;-- 2. 對 NULL 使用比較謂詞后,結(jié)果為unknownSELECT *FROM t_studentWHERE unknownOR unknown;-- 3.unknown OR unknown 的結(jié)果是unknown (參考三值邏輯的邏輯值表)SELECT *FROM t_studentWHERE unknown;
SQL 語句的查詢結(jié)果里只有判斷結(jié)果為 true 的行。要想讓 yzb 出現(xiàn)在結(jié)果里,需要添加下面這樣的 “第 3 個條件”
-- 添加 3 個條件:年齡是20 歲,或者不是20 歲,或者年齡未知SELECT * FROM t_studentWHERE age = 20 OR age <> 20 OR age IS NULL;
CASE 表達(dá)式和 NULL
簡單 CASE 表達(dá)式如下
CASE col_1 WHEN = 1 THEN ’o’ WHEN NULL THEN ’x’END
這個 CASE 表達(dá)式一定不會返回 ×。這是因為,第二個 WHEN 子句是 col_1 = NULL 的縮寫形式。正如我們所知,這個式子的邏輯值永遠(yuǎn)是 unknown ,而且 CASE 表達(dá)式的判斷方法與 WHERE 子句一樣,只認(rèn)可邏輯值為 true 的條件。正確的寫法是像下面這樣使用搜索 CASE 表達(dá)式
CASE WHEN col_1 = 1 THEN ’o’ WHEN col_1 IS NULL THEN ’x’ENDNOT IN 和 NOT EXISTS 不是等價的
我們在對 SQL 語句進行性能優(yōu)化時,經(jīng)常用到的一個技巧是將 IN 改寫成 EXISTS ,這是等價改寫,并沒有什么問題。但是,將 NOT IN 改寫成 NOT EXISTS 時,結(jié)果未必一樣。
我們來看個例子,我們有如下兩張表:t_student_A 和 t_student_B,分別表示 A 班學(xué)生與 B 班學(xué)生
DROP TABLE IF EXISTS t_student_A;CREATE TABLE t_student_A ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT ’自增主鍵’, name VARCHAR(50) NOT NULL COMMENT ’名稱’, age INT(3) COMMENT ’年齡’, city VARCHAR(50) NOT NULL COMMENT ’城市’, remark VARCHAR(500) NOT NULL DEFAULT ’’ COMMENT ’備注’, primary key(id)) COMMENT ’學(xué)生信息’;INSERT INTO t_student_A(name, age, city)VALUE(’zhangsan’, 25,’深圳市’),(’wangwu’, 60, ’廣州市’),(’bruce’, 32, ’北京市’),(’yzb’, NULL, ’深圳市’),(’boss’, 43, ’深圳市’);DROP TABLE IF EXISTS t_student_B;CREATE TABLE t_student_B ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT ’自增主鍵’, name VARCHAR(50) NOT NULL COMMENT ’名稱’, age INT(3) COMMENT ’年齡’, city VARCHAR(50) NOT NULL COMMENT ’城市’, remark VARCHAR(500) NOT NULL DEFAULT ’’ COMMENT ’備注’, primary key(id)) COMMENT ’學(xué)生信息’;INSERT INTO t_student_B(name, age, city)VALUE(’馬化騰’, 45, ’深圳市’),(’馬三’, 25, ’深圳市’),(’馬云’, 43, ’杭州市’),(’李彥宏’, 41, ’深圳市’),(’年輕人’, 25, ’深圳市’); * FROM t_student_B;
需求:查詢與 A 班住在深圳的學(xué)生年齡不同的 B 班學(xué)生,也就說查詢出 :馬化騰 和 李彥宏,這個 SQL 該如何寫,像這樣?
-- 查詢與 A 班住在深圳的學(xué)生年齡不同的 B 班學(xué)生 ?SELECT * FROM t_student_BWHERE age NOT IN ( SELECT age FROM t_student_A WHERE city = ’深圳市’);
我們來看下執(zhí)行結(jié)果
我們發(fā)現(xiàn)結(jié)果是空,查詢不到任何數(shù)據(jù),這是為什么了 ?這里 NULL 又開始作怪了,我們一步一步來看看究竟發(fā)生了什么
-- 1. 執(zhí)行子查詢,獲取年齡列表SELECT * FROM t_studentWHERE age NOT IN(43, NULL, 25);-- 2. 用NOT 和IN 等價改寫NOT INSELECT * FROM t_studentWHERE NOT age IN (43, NULL, 25);-- 3. 用OR 等價改寫謂詞INSELECT * FROM t_studentWHERE NOT ( (age = 43) OR (age = NULL) OR (age = 25) );-- 4. 使用德· 摩根定律等價改寫SELECT * FROM t_studentWHERE NOT (age = 43) AND NOT(age = NULL) AND NOT (age = 25);-- 5. 用<> 等價改寫 NOT 和 =SELECT * FROM t_studentWHERE (age <> 43) AND (age <> NULL) AND (age <> 25);-- 6. 對NULL 使用<> 后,結(jié)果為 unknownSELECT * FROM t_studentWHERE (age <> 43) AND unknown AND (age <> 25);-- 7.如果 AND 運算里包含 unknown,則結(jié)果不為true(參考三值邏輯的邏輯值表)SELECT * FROM t_studentWHERE false 或 unknown;
可以看出,在進行了一系列的轉(zhuǎn)換后,沒有一條記錄在 WHERE 子句里被判斷為 true 。也就是說,如果 NOT IN 子查詢中用到的表里被選擇的列中存在 NULL ,則 SQL 語句整體的查詢結(jié)果永遠(yuǎn)是空。這是很可怕的現(xiàn)象!
為了得到正確的結(jié)果,我們需要使用 EXISTS 謂詞
-- 正確的SQL 語句:馬化騰和李彥宏將被查詢到SELECT * FROM t_student_B BWHERE NOT EXISTS ( SELECT * FROM t_student_A A WHERE B.age = A.age AND A.city = ’深圳市’ );
執(zhí)行結(jié)果如下
同樣地,我們再來一步一步地看看這段 SQL 是如何處理年齡為 NULL 的行的
-- 1. 在子查詢里和 NULL 進行比較運算,此時 A.age 是 NULLSELECT * FROM t_student_B BWHERE NOT EXISTS ( SELECT * FROM t_student_A A WHERE B.age = NULL AND A.city = ’深圳市’ );-- 2. 對NULL 使用“=”后,結(jié)果為 unknownSELECT * FROM t_student_B BWHERE NOT EXISTS ( SELECT * FROM t_student_A A WHERE unknown AND A.city = ’深圳市’ );-- 3. 如果AND 運算里包含 unknown,結(jié)果不會是trueSELECT * FROM t_student_B BWHERE NOT EXISTS ( SELECT * FROM t_student_A A WHERE false 或 unknown);-- 4. 子查詢沒有返回結(jié)果,因此相反地,NOT EXISTS 為 trueSELECT * FROM t_student_B BWHERE true;
也就是說,yzb 被作為 “與任何人的年齡都不同的人” 來處理了。EXISTS 只會返回 true 或者false,永遠(yuǎn)不會返回 unknown。因此就有了 IN 和 EXISTS 可以互相替換使用,而 NOT IN和 NOT EXISTS 卻不可以互相替換的混亂現(xiàn)象。
還有一些其他的陷阱,比如:限定謂詞和 NULL、限定謂詞和極值函數(shù)不是等價的、聚合函數(shù)和 NULL 等等。
總結(jié)1、NULL 用于表示缺失的值或遺漏的未知數(shù)據(jù),不是某種具體類型的值,不能對其使用謂
2、對 NULL 使用謂詞后的結(jié)果是 unknown,unknown 參與到邏輯運算時,SQL 的運行會和預(yù)想的不一樣3、 IS NULL 整個是一個謂詞,而不是:IS 是謂詞,NULL 是值;類似的還有 IS TRUE、IS FALSE4、要想解決 NULL 帶來的各種問題,最佳方法應(yīng)該是往表里添加 NOT NULL 約束來盡力排除 NULL
以上就是詳解mysql三值邏輯與NULL的詳細(xì)內(nèi)容,更多關(guān)于mysql三值邏輯與NULL的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 省時又省力 用Oracle擴展SQL跟蹤數(shù)據(jù)2. 關(guān)于Oracle數(shù)據(jù)庫熱備份腳本深入剖析3. Access數(shù)據(jù)庫安全的幾個問題4. MySQL存儲過程例子(包含事務(wù)、參數(shù)、嵌套調(diào)用、游標(biāo)循環(huán)等)5. MySQL雙主(主主)架構(gòu)配置方案6. MySQL 的啟動選項和系統(tǒng)變量實例詳解7. 一文帶你了解MySQL的左連接與右連接8. mysql-bin.000001文件的來源及處理方法9. Sql server數(shù)據(jù)庫開發(fā)常用匯總10. 如何遠(yuǎn)程調(diào)用ACCESS數(shù)據(jù)庫
