<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
#1.建立員工表,並建立name,age,position索引,id為自增主鍵 CREATE TABLE `employees` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名', `age` int(11) NOT NULL DEFAULT '0' COMMENT '年齡', `position` varchar(20) NOT NULL DEFAULT '' COMMENT '職位', `hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入職時間', PRIMARY KEY (`id`), KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE ) ENGINE=InnoDB AUTO_INCREMENT=100010 DEFAULT CHARSET=utf8 COMMENT='員工記錄表' # 2.前面插入三條資料,並建立employees_min_copy表插入這三條資料 INSERT INTO employees (name,age,`position`,hire_time) VALUES ('LiLei',22,'manager','2021-08-17 21:00:55') ,('HanMeimei',23,'dev','2021-08-17 21:00:55') ,('Lucy',23,'dev','2021-08-17 21:00:55') ; #3.再通過執行計劃向表中插入十萬條資料 #3.1建立儲存過程,往employees表中插入資料(MySQL8.0版本) DELIMITER $$ USE `zhebase`$$ DROP PROCEDURE IF EXISTS `batch_insert_employees`$$ CREATE PROCEDURE `batch_insert_employees`(IN `start_number` BIGINT,IN `counts` BIGINT) BEGIN DECLARE start_number BIGINT DEFAULT start_number; DECLARE stop_number BIGINT DEFAULT start_number; SET stop_number=start_number + counts; WHILE start_number < stop_number DO INSERT INTO employees(name,age,position,hire_time) VALUES(CONCAT('zhang',start_number),start_number,'dev',now()); SET start_number=start_number+1; END WHILE ; COMMIT; END$$ DELIMITER ; #3.2執行儲存過程插入十萬條資料 CALL batch_insert_employees(1,100000);
1.聯合索引第一個欄位用範圍不會走索引
EXPLAIN SELECT * FROM employees WHERE name > 'LiLei' AND age = 22 AND position ='manager';
原因:MySQL 內部可能覺得第一個欄位就用範圍,結果集應該很大,還需要回表,回表效率不高,不如直接採用全表掃描 但是我們可以強制走索引
EXPLAIN SELECT * FROM employees force index(idx_name_age_position) WHERE name > 'LiLei' AND age = 22 AND position ='manager';
-- 關閉查詢快取 set global query_cache_size=0; set global query_cache_type=0; -- 執行時間0.321s SELECT * FROM employees WHERE name > 'LiLei'; -- 執行時間0.458s SELECT * FROM employees force index(idx_name_age_position) WHERE name > 'LiLei';
使用了強制走索引讓聯合索引第一個欄位範圍查詢也走索引,掃描的行rows看上去也少了點,但是最終查詢效率不一定比全表掃描高,因為回表效率不高
對於這種情況,如果可以使用覆蓋索引,就使用覆蓋索引進行優化
EXPLAIN SELECT name,age,position FROM employees WHERE name > 'LiLei' AND age = 22 AND position ='manager';
2.in 和 or 在表資料量比較大的情況會走索引,在表記錄不多的情況下會選擇全表掃描
EXPLAIN SELECT * FROM employees WHERE name in ('LiLei','HanMeimei','Lucy') AND age = 22 AND position ='manager'; #表資料量大走索引,資料量小全表掃描 EXPLAIN SELECT * FROM employees WHERE (name = 'LiLei' or name = 'HanMeimei') AND age = 22 AND position ='manager';
將十萬行資料的employees表複製一份插入幾行資料,再進行查詢
發現進行了全表掃描
3.like xx% 無論資料量多少一般情況都會走索引
EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' AND age = 22 AND position ='manager';
MySQL 底層使用索引下推(Index Condition Pushdown,ICP) 來對 like xx%進行優化。
索引下推: 對於輔助的聯合索引(idx_name_age_position),通常按照最左字首原則,SELECT * FROM employees WHERE name like 'LiLei%' AND age = 22 AND position ='manager'
因為在 name 是範圍查詢,過濾完後,age 和 position 是無序的,後續索引無法使用,只會走name欄位索引。
MySQL 範圍查詢為什麼沒有使用索引下推優化? 可能因為範圍查詢結果集一般較大,like xx%在大多數情況下,過濾後結果集較小。而結果集大的時候,每次檢索出來都要匹配後面的欄位,不一定比立即回表要快。但是也不是絕對的,有些時候 Like xx%也不會走索引下推。
先來看兩條 SQL 語句:
# MySQL直接使用全表掃描 EXPLAIN select * from employees where name > 'a'; # MySQL走索引 EXPLAIN select * from employees where name > 'zzz';
我們發現第一條 SQL 進行了全表掃描,第二條 SQL 走了索引。對應第一條SQL,MySQL 通過計算執行成本發現走索引成本比全部掃描更高(走索引需要遍歷 name 欄位,再進行回表操作查出最終資料,比直接查聚簇索引樹更慢)。對於這種情況可以使用覆蓋索引進行優化
。至於 MySQL 如何選擇最終索引,可以用 Trace 工具進行檢視。但開啟trace工具會影響 MySQL 效能,用完之後需立即關閉。
#開啟trace set session optimizer_trace="enabled=on",end_markers_in_json=on; #關閉trace set session optimizer_trace="enabled=off"; #使用trace select * from employees where name > 'a' order by position; select * from information_schema.OPTIMIZER_TRACE;
下面是執行後的Trace中的內容:
{ "steps": [ { #第一階段:SQL準備階段,格式化sql "join_preparation": { "select#": 1, "steps": [ { "expanded_query": "/* select#1 */ select `employees`.`id` AS `id`,`employees`.`name` AS `name`,`employees`.`age` AS `age`,`employees`.`position` AS `position`,`employees`.`hire_time` AS `hire_time` from `employees` where (`employees`.`name` > 'a') order by `employees`.`position` limit 0,200" } ] /* steps */ } /* join_preparation */ }, { #第二階段:SQL優化階段 "join_optimization": { "select#": 1, "steps": [ { #條件處理 "condition_processing": { "condition": "WHERE", "original_condition": "(`employees`.`name` > 'a')", "steps": [ { "transformation": "equality_propagation", "resulting_condition": "(`employees`.`name` > 'a')" }, { "transformation": "constant_propagation", "resulting_condition": "(`employees`.`name` > 'a')" }, { "transformation": "trivial_condition_removal", "resulting_condition": "(`employees`.`name` > 'a')" } ] /* steps */ } /* condition_processing */ }, { "substitute_generated_columns": { } /* substitute_generated_columns */ }, { #表依賴詳情 "table_dependencies": [ { "table": "`employees`", "row_may_be_null": false, "map_bit": 0, "depends_on_map_bits": [ ] /* depends_on_map_bits */ } ] /* table_dependencies */ }, { "ref_optimizer_key_uses": [ ] /* ref_optimizer_key_uses */ }, { #預估表的存取成本 "rows_estimation": [ { "table": "`employees`", "range_analysis": { "table_scan": { --全表掃描情況 "rows": 93205, --掃描行數 "cost": 9394.9 --查詢成本 } /* table_scan */, #查詢可能使用的索引 "potential_range_indexes": [ { "index": "PRIMARY", --主鍵索引 "usable": false, -- 是否使用 "cause": "not_applicable" }, { #輔助索引 "index": "idx_name_age_position", "usable": true, "key_parts": [ "name", "age", "position", "id" ] /* key_parts */ } ] /* potential_range_indexes */, "setup_range_conditions": [ ] /* setup_range_conditions */, "group_index_range": { "chosen": false, "cause": "not_group_by_or_distinct" } /* group_index_range */, "skip_scan_range": { "potential_skip_scan_indexes": [ { "index": "idx_name_age_position", "usable": false, "cause": "query_references_nonkey_column" } ] /* potential_skip_scan_indexes */ } /* skip_scan_range */, #分析各個索引使用成本 "analyzing_range_alternatives": { "range_scan_alternatives": [ { "index": "idx_name_age_position", "ranges": [ "a < name" --索引使用範圍 ] /* ranges */, "index_dives_for_eq_ranges": true, "rowid_ordered": false, --使用該索引獲取的記錄是否按照主鍵排序 "using_mrr": false, "index_only": false, --是否使用覆蓋索引 "rows": 46602, --索引掃描行數 "cost": 16311, --索引使用成本 "chosen": false, --是否選擇該索引 "cause": "cost" } ] /* range_scan_alternatives */, "analyzing_roworder_intersect": { "usable": false, "cause": "too_few_roworder_scans" } /* analyzing_roworder_intersect */ } /* analyzing_range_alternatives */ } /* range_analysis */ } ] /* rows_estimation */ }, { "considered_execution_plans": [ { "plan_prefix": [ ] /* plan_prefix */, "table": "`employees`", "best_access_path": { --最優存取路徑 "considered_access_paths": [ --最終選擇的存取路徑 { "rows_to_scan": 93205, "filtering_effect": [ ] /* filtering_effect */, "final_filtering_effect": 0.5, "access_type": "scan", --存取型別:為scan,全表掃描 "resulting_rows": 46602, "cost": 9392.8, "chosen": true --確定選擇 } ] /* considered_access_paths */ } /* best_access_path */, "condition_filtering_pct": 100, "rows_for_plan": 46602, "cost_for_plan": 9392.8, "chosen": true } ] /* considered_execution_plans */ }, { "attaching_conditions_to_tables": { "original_condition": "(`employees`.`name` > 'a')", "attached_conditions_computation": [ { "table": "`employees`", "rechecking_index_usage": { "recheck_reason": "low_limit", "limit": 200, "row_estimate": 46602 } /* rechecking_index_usage */ } ] /* attached_conditions_computation */, "attached_conditions_summary": [ { "table": "`employees`", "attached": "(`employees`.`name` > 'a')" } ] /* attached_conditions_summary */ } /* attaching_conditions_to_tables */ }, { "optimizing_distinct_group_by_order_by": { "simplifying_order_by": { "original_clause": "`employees`.`position`", "items": [ { "item": "`employees`.`position`" } ] /* items */, "resulting_clause_is_simple": true, "resulting_clause": "`employees`.`position`" } /* simplifying_order_by */ } /* optimizing_distinct_group_by_order_by */ }, { "reconsidering_access_paths_for_index_ordering": { "clause": "ORDER BY", "steps": [ ] /* steps */, "index_order_summary": { "table": "`employees`", "index_provides_order": false, "order_direction": "undefined", "index": "unknown", "plan_changed": false } /* index_order_summary */ } /* reconsidering_access_paths_for_index_ordering */ }, { "finalizing_table_conditions": [ { "table": "`employees`", "original_table_condition": "(`employees`.`name` > 'a')", "final_table_condition ": "(`employees`.`name` > 'a')" } ] /* finalizing_table_conditions */ }, { "refine_plan": [ { "table": "`employees`" } ] /* refine_plan */ }, { "considering_tmp_tables": [ { "adding_sort_to_table_in_plan_at_position": 0 } /* filesort */ ] /* considering_tmp_tables */ } ] /* steps */ } /* join_optimization */ }, { #第三階段:SQL執行階段 "join_execution": { "select#": 1, "steps": [ { "sorting_table_in_plan_at_position": 0, "filesort_information": [ { "direction": "asc", "table": "`employees`", "field": "position" } ] /* filesort_information */, "filesort_priority_queue_optimization": { "limit": 200, "chosen": true } /* filesort_priority_queue_optimization */, "filesort_execution": [ ] /* filesort_execution */, "filesort_summary": { "memory_available": 262144, "key_size": 40, "row_size": 186, "max_rows_per_buffer": 201, "num_rows_estimate": 285696, "num_rows_found": 100003, "num_initial_chunks_spilled_to_disk": 0, "peak_memory_used": 38994, "sort_algorithm": "std::stable_sort", "unpacked_addon_fields": "using_priority_queue", "sort_mode": "<fixed_sort_key, additional_fields>" } /* filesort_summary */ } ] /* steps */ } /* join_execution */ } ] /* steps */ }
由 Trace欄位可知,全表掃描的 cost_for_plan = 9394.9 小於使用索引 cost_for_plan = 16311,故最終選擇全表掃描。
# 案例1 explain select * from employees where name = 'Lucy' and position = 'dev' order by age;
分析: 案例1 由最左字首法則分析出索引中間不能出現斷層,只使用了 name 索引字首,也可以從key_len = 3n + 2 看出。age 索引列用在排序過程中,因為Extra欄位裡沒有 Using filesort 而是 Using index condition 。
#案例2 explain select * from employees where name = 'Lucy' order by position;
分析: 案例2 索引查詢使用了 name 索引字首,但排序由於跳過了 age 所以Extra欄位出現了 Using filesort 。
#案例3 explain select * from employees where name = 'Lucy' order by age, position;
分析: 案例3 查詢時使用了 name 索引,age 和 postion 用於排序,不會出現 Using filesort
#案例4 explain select * from employees where name = 'Lucy' order by position,age;
分析: 案例4 查詢時使用了 name 索引,age 和 postion 順序與建立索引樹不一致,出現了 Using filesort
#案例5 explain select * from employees where name = 'Lucy' and age = 22 order by position,age;
分析: 案例5 查詢時使用了 name 索引,age 和 postion 順序與建立索引樹不一致,但 name、age 為常數,MySQL 會自動優化,不會出現 Using filesort
#案例6 explain select * from employees where name = 'Lucy' order byage,position desc;
分析: 案例6 排序順序一樣,但 order by 預設升序,導致與索引的排序方式不同,出現了 Using filesort 。 MySQL8.0 以上版本有降序索引可以支援這種查詢。
#案例7 explain select * from employees where name = 'Lucy' or name = 'LiLei' order by age;
分析: 案例7 對於排序來說,多個相等條件也是範圍查詢,出現了 Using filesort 。
#案例8 #SQL-1 explain select * from employees where name > 'zzz' order by name; #SQL-2 explain select * from employees where name > 'a' order by name;
分析: 案例8 原因同前面的例子,可以使用覆蓋索引優化。
MySQL排序總結:
1、MySQL支援兩種方式的排序 filesort 和 index,Using index是指MySQL掃描索引本身完成排序。Using filesort 是指MySQL掃描聚簇索引(整張表)進行排序。index效率高,filesort效率低。
2、order by 滿足兩種情況會使用 Using index(不絕對)
3、儘量在索引列上完成排序,遵循最左字首法則。
4、如果 order by 的條件不在索引列上,就會產生Using filesort。
5、能用覆蓋索引儘量用覆蓋索引
6、group by 與 order by 很類似,其實質是先排序後分組(group by 底層:先執行一次 order by 再進行分組),遵照索引建立順序的最左字首法則。對於group by的優化如果不需要排序的可以加上order by null 禁止排序。注意,where高於having,能寫在where中的限定條件就不要去having限定了。
Using filesort 檔案排序原理 filesort檔案排序方式有:
MySQL 通過比較系統變數 max_length_for_sort_data(預設1024位元組) 的大小和需要查詢的欄位總大小來判斷使用哪種排序模式。
select * from employees where name = 'Lucy' order by position;
"join_execution": { --Sql執行階段 "select#": 1, "steps": [ { "filesort_information": [ { "direction": "asc", "table": "`employees`", "field": "position" } ] /* filesort_information */, "filesort_priority_queue_optimization": { "usable": false, "cause": "not applicable (no LIMIT)" } /* filesort_priority_queue_optimization */, "filesort_execution": [ ] /* filesort_execution */, "filesort_summary": { --檔案排序資訊 "rows": 10000, --預計掃描行數 "examined_rows": 10000, --參與排序的行 "number_of_tmp_files": 3, --使用臨時檔案的個數,如果為0代表全部使用的sort_buffer記憶體排序,否則使用的磁碟檔案排序 "sort_buffer_size": 262056, --排序快取的大小,單位Byte "sort_mode": "<sort_key, packed_additional_fields>" --排序方式,此處是路排序 } /* filesort_summary */ } ] /* steps */ } /* join_execution */
單路排序會把所有需要查詢的欄位都放到 sort buffer 中排序,而雙路排序只會把主鍵和需要排序的欄位放到 sort buffer 中進行排序,然後再通過主鍵回到原表查詢需要的欄位。
單路排序過程:
雙路排序過程:
select * from employees limit 10000,10
這條 SQL 語句實際查詢了 10010 條記錄,然後丟棄了前面的 10000 條記錄,所以,在 資料量很大時,執行效率是非常非常低的。一般需要對分頁查詢進行優化。 優化方法: 1.根據自增且連續的主鍵排序的分頁查詢
select * from employees where id > 90000 limit 5;
當一個表的主鍵連續且自增時,可以使用該方法進行優化,但如果自增不連續會造成資料丟失。
2.根據非主鍵欄位排序的分頁查詢
#優化前 select * from employees ORDER BY name limit 90000,5; #優化後 select * from employees e inner join (select id from employees order by name limit 90000,5) ed on e.id = ed.id;
先通過排序和分頁操作先查出主鍵,然後根據主鍵查出對應的記錄。
#範例表 # 建立t1,t2表,主鍵id,單值索引a CREATE TABLE `t1` ( `id` int(11) NOT NULL AUTO_INCREMENT, `a` int(11) DEFAULT NULL, `b` int(11) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_a` (`a`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; create table t2 like t1; #儲存過程往t1,t2表插入資料 DELIMITER $$ USE `zhebase`$$ DROP PROCEDURE IF EXISTS `batch_insert_t1`$$ CREATE PROCEDURE `batch_insert_t1`(IN `start_number` BIGINT,IN `counts` BIGINT) BEGIN DECLARE start_number BIGINT DEFAULT start_number; DECLARE stop_number BIGINT DEFAULT start_number; SET stop_number=start_number + counts; WHILE start_number < stop_number DO INSERT INTO t1(a,b) VALUES(start_number,start_number); SET start_number=start_number+1; END WHILE ; COMMIT; END$$ DELIMITER ; DELIMITER $$ USE `zhebase`$$ DROP PROCEDURE IF EXISTS `batch_insert_t2`$$ CREATE PROCEDURE `batch_insert_t2`(IN `start_number` BIGINT,IN `counts` BIGINT) BEGIN DECLARE start_number BIGINT DEFAULT start_number; DECLARE stop_number BIGINT DEFAULT start_number; SET stop_number=start_number + counts; WHILE start_number < stop_number DO INSERT INTO t2(a,b) VALUES(start_number,start_number); SET start_number=start_number+1; END WHILE ; COMMIT; END$$ DELIMITER ; #執行儲存過程往t1表插入10000條記錄,t2表插入100條記錄 CALL batch_insert_t1(1,10000); CALL batch_insert_t2(1,100);
1.巢狀迴圈連線 Nested-Loop Join(NLJ) 演演算法 原理:一次一行迴圈地從第一張表(驅動表)中讀取行,在這行資料中取到關聯欄位,根據關聯欄位在另一張表(被驅動表)裡取出滿足條件的行,然後取出兩張表的結果合集。
explain select * from t1 inner join t2 on t1.a= t2.a;
從執行計劃可以瞭解的資訊:
整個過程會讀取 t2 表的所有資料(掃描100行),然後遍歷這每行資料中欄位 a 的值,根據 t2 表中 a 的值索引掃描 t1 表中的對應行(掃描100次 t1 表的索引,1次掃描可以認為最終只掃描 t1 表一行完整資料,也就是總共 t1 表也掃描了100行)。因此整個過程掃描了 200 行 。
2. 基於塊的巢狀迴圈連線 Block Nested-Loop Join(BNL)演演算法 原理:把驅動表的資料讀入到 join_buffer 中,然後掃描被驅動表,把被驅動表每一行取出來跟 join_buffer 中的資料做對比
explain select * from t1 inner join t2 on t1.b= t2.b;
整個過程對錶 t1 和 t2 都做了一次全表掃描,因此掃描的總行數為10000(表 t1 的資料總量) + 100(表 t2 的資料總量) = 10100。並且 join_buffer 裡的資料是無序的,因此對錶 t1 中的每一行,都要做 100 次判斷,所以記憶體中的判斷次數是 100 * 10000= 100 萬次(非掃描次數) 。 注意: join_buffer 的大小是由引數 join_buffer_size 控制,預設256k。如果 t2 放不下就會使用分段策略(先從 t2 表取出部分資料,比對完就清空 join_buffer,再重新拿出來餘下的部分進行比對)。
被驅動表的關聯欄位無索引為什麼要選擇使用 BNL 演演算法而不使用 NLJ 演演算法? 如第二條 SQL,如果使用 NLJ 演演算法掃描行數為 100 * 10000 = 100萬,這個是磁碟掃描。使用 BNL 演演算法僅需掃描 100100 行。
對於表關聯 SQL 的優化
select * from t2 straight_join t1 on t2.a = t1.a; 代表指定mysql選著 t2 表作為驅動表
原則:小表驅動大表
# in 先執行括號裡面的 select * from A where id in (select id from B) #exists 先執行括號外面的 #select * 可以用 select 1 替換,沒有區別 #exists 子查詢內部會進行優化,並非逐條對比 #exists 子查詢往往也可以用 jion 來代替,何種最優需要具體問題具體分析 select * from A where exists (select 1 from B where B.id = A.id)
注意:根據某個欄位 count 不會統計欄位為 null 的行
#掃描二級索引,按行累加 explain select count(1) from employees; #掃描輔助索引按行累加(輔助索引比聚簇索引小) explain select count(id) from employees; #把 name 拿到記憶體,不為 null 就累加 explain select count(name) from employees; #不取值,按行累加 explain select count(*) from employees;
四條語句的效率幾乎可以忽略,效率對比如下: 欄位有索引: count(* )≈count(1)>count(欄位)>count(主鍵 id) 段)>count(主鍵 id) 欄位無索引: count(*)≈count(1)>count(主鍵 id)>count(欄位)
常見優化方法:
show table status
,它是一個估值,使用該查詢效率很高到此這篇關於MySQL索引優化範例分析的文章就介紹到這了,更多相關MySQL索引優化內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45