MYSQL數(shù)據(jù)庫基礎之Join操作原理
Join使用的是Nested-Loop Join算法,Nested-Loop Join有三種
select * from t1 join t2 on t1.a = t2.a;-- a 100條數(shù)據(jù), b 1000條數(shù)據(jù)Simple Nested-Loop Join
會遍歷t1全表,t1作為驅動表,t1中的每一條數(shù)據(jù)都會到t2中做一次全表查詢,該過程會比較100*1000次。
每次在t2中做全表查詢時,全表掃描可就不保證在內存里了,Buffer Pool會淘汰,有可能在磁盤。
Block Nested-Loop Join(MYSQL驅動鏈接沒有使用索引)會遍歷t1全表,將t1數(shù)據(jù)加載到join_buffer中,再遍歷t2全表,讓t2的每條數(shù)據(jù)去匹配join_buffer中t1緩存的數(shù)據(jù)。
t1全表掃描 = 100次
t2全表掃描 = 1000次
查詢次數(shù) = 1100次
join_buffer中比較 = 100 * 1000次
比較的次數(shù)和Simple Nested-Loop Join是一樣的,但是比較的過程會比Simple Nested-Loop Join快很多,性能更好。
join_buffer是有大小的,如果t1查出來的數(shù)據(jù)是大于join_buffer大小的,則會先加載部分t1中的數(shù)據(jù),比較完t2以后,清空join_buffer,再加載t1中剩余數(shù)據(jù),加載不完全,再重復該操作。
t1全表掃描次數(shù)和join_buffer中比較1次數(shù)不變,但是t2的掃描次數(shù)會根據(jù)分段次數(shù)做一個乘法。
假設,驅動表的數(shù)據(jù)行數(shù)是 N,需要分 K 段才能完成算法流程,被驅動表的數(shù)據(jù)行數(shù)是 M。
K = λ * N
掃描被驅動表次數(shù) = M * λ * N
λ是和join_buffer的大小有關的,join_buffer大小足夠的情況下,大表驅動和小表驅動的時間是一樣的。
需要分段的情況下,分段次數(shù)越少,被驅動表掃描的次數(shù)也會越少,所以應該采用小表驅動。
Index Nested-Loop Join(MYSQL驅動鏈接使用索引)還是以上面的sql為例,如果a字段是有索引的。
t1表會掃描全表,t1表中每條數(shù)據(jù)會去t2表中做索引查詢,查到id后再進行回表查詢(如果連接字段是t2表的主鍵,回表操作將省略)。
t1掃描全表 = 100次
t2索引查詢 = log1000次
t2回表查詢 = log1000次
假設,驅動表的數(shù)據(jù)行數(shù)是 N,被驅動表的數(shù)據(jù)行數(shù)是 M。
總查詢次數(shù) = N + N * 2logM
由上可見,驅動表數(shù)據(jù)越大,查詢的次數(shù)會越多,所以應該使用小表作為驅動表。
文章參考《MySQL實戰(zhàn)45講--第34講》
總結到此這篇關于MYSQL數(shù)據(jù)庫基礎之Join操作原理的文章就介紹到這了,更多相關MYSQL Join原理內容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網(wǎng)!
相關文章:
1. MariaDB數(shù)據(jù)庫的外鍵約束實例詳解2. MariaDB的安裝與配置教程3. MariaDB性能調優(yōu)工具mytop的使用詳解4. Window7安裝MariaDB數(shù)據(jù)庫及系統(tǒng)初始化操作分析5. access不能打開注冊表關鍵字錯誤處理方法(80004005錯誤)6. SQL Server一個字符串拆分多行顯示或者多行數(shù)據(jù)合并成一個字符串7. SQL案例學習之字符串的合并與拆分方法總結8. SQLite 性能優(yōu)化實例分享9. Centos7 下mysql重新啟動MariaDB篇10. centos 7安裝mysql5.5和安裝 mariadb使用的命令
