一文解答為什麼MySQL的count()方法這麼慢

2022-07-01 14:01:15

前言

mysql用count方法查全表資料，在不同的儲存引擎裡實現不同，myisam有專門欄位記錄全表的行數，直接讀這個欄位就好了。而innodb則需要一行行去算。

比如說，你有一張簡訊表(sms)，裡面放了各種需要傳送的簡訊資訊。

sms建表sql：

sms表;

需要注意的是state欄位，為0的時候說明這時候簡訊還未傳送。

此時還會有一個非同步執行緒不斷的撈起未傳送（state=0）的簡訊資料，執行傳簡訊操作，傳送成功之後state欄位會被置為1（已傳送）。也就是說未傳送的資料會不斷變少。

非同步執行緒傳送簡訊:

假設由於某些原因，你現在需要做一些監控，比如監控的內容是，你的sms資料表裡還有沒有state=0（未傳送）的簡訊，方便判斷一下堆積的未傳送簡訊大概在什麼樣的一個量級。

為了獲取滿足某些條件的行數是多少，我們一般會使用count()方法。

這時候為了獲取未傳送的簡訊資料，我們很自然就想到了使用下面的sql語句進行查詢。

select count(*) from sms where state = 0;

然後再把獲得資料作為打點發給監控服務。

當資料表小的時候，這是沒問題的，但當資料量大的時候，比如未傳送的簡訊到了百萬量級的時候，你就會發現，上面的sql查詢時間會變得很長，最後timeout報錯，查不出結果了。

為什麼？

我們先從count()方法的原理聊起。

count()的原理

count()方法的目的是計算當前sql語句查詢得到的非NULL的行數。

我們知道mysql是分為server層和儲存引擎層的。

Mysql架構:

儲存引擎層裡可以選擇各種引擎進行儲存，最常見的是innodb、myisam。具體使用哪個儲存引擎，可以通過建表sql裡的ENGINE欄位進行指定。比如這篇文章開頭的建表sql裡用了ENGINE=InnoDB，那這張表用的就是innodb引擎。

雖然在server層都叫count()方法，但在不同的儲存引擎下，它們的實現方式是有區別的。

比如同樣是讀全表資料 select count(*) from sms；語句。

使用 myisam引擎的資料表裡有個記錄當前表裡有幾行資料的欄位，直接讀這個欄位返回就好了，因此速度快得飛起。

而使用innodb引擎的資料表，則會選擇體積最小的索引樹，然後通過遍歷葉子節點的個數挨個加起來，這樣也能得到全表資料。

因此回到文章開頭的問題裡，當資料表行數變大後，單次count就需要掃描大量的資料，因此很可能就會出現超時報錯。

那麼問題就來了。

為什麼innodb不能像myisam那樣實現count()方法

myisam和innodb這兩個引擎，有幾個比較明顯的區別，這個是八股文常考了。

其中最大的區別在於myisam不支援事務，而innodb支援事務。

而事務，有四層隔離級別，其中預設隔離級別就是可重複讀隔離級別（RR）。

四層隔離級別:

innodb引擎通過MVCC實現了可重複隔離級別，事務開啟後，多次執行同樣的select快照讀，要能讀到同樣的資料。

於是我們看個例子:為什麼innodb不單獨記錄錶行數?

對於兩個事務A和B，一開始sms表假設就2條資料，那事務A一開始確實是讀到2條資料。事務B在這期間插入了1條資料，按道理資料庫其實有3條資料了，但由於可重複讀的隔離級別，事務A依然還是隻能讀到2條資料。

因此由於事務隔離級別的存在，不同的事務在同一時間下，看到的表內資料行數是不一致的，因此innodb，沒辦法，也沒必要像myisam那樣單純的加個count欄位資訊在資料表上。

那如果不可避免要使用count()，有沒有辦法讓它快一點？

各種count()方法的原理

count()的括號裡，可以放各種奇奇怪怪的東西，想必大家應該看過，比如放個星號*，放個1，放個索引列啥的。

我們來分析下他們的執行流程。

count方法的大原則是server層會從innodb儲存引擎裡讀來一行行資料，並且只累計非null的值。但這個過程，根據count()方法括號內的傳參，有略有不同。

count(*):server層拿到innodb返回的行資料，不對裡面的行資料做任何解析和判斷，預設取出的值肯定都不是null，直接行數+1。

count(1):server層拿到innodb返回的行資料，每行放個1進去，預設不可能為null，直接行數+1.

count(某個列欄位):由於指明瞭要count某個欄位，innodb在取資料的時候，會把這個欄位解析出來返回給server層，所以會比count(1)和count(*)多了個解析欄位出來的流程。

如果這個列欄位是主鍵id，主鍵是不可能為null的，所以server層也不用判斷是否為null，innodb每返回一行，行數結果就+1.

如果這個列是普通索引欄位，innodb一般會走普通索引，每返回一行資料，server層就會判斷這個欄位是否為null，不是null的情況下+1。當然如果建表sql裡欄位定義為not null的話，那就不用做這一步判斷直接+1。

如果這個列沒有加過索引，那innodb可能會全表掃描，返回的每一行資料，server層都會判斷這個欄位是否為null，不是null的情況下+1。同上面的情況一樣，欄位加了not null也就省下這一步判斷了。

理解了原理後我們大概可以知道他們的效能排序是

count(*) ≈ count(1) > count(主鍵id) > count(普通索引列) > count(未加索引列)

所以說count(*)，已經是最快的了。

知道真相的我眼淚掉下來。

那有沒有其他更好的辦法？

允許粗略估計行數的場景

我們回過頭來細品下文章開頭的需求，我們只是希望知道資料庫裡還有多少簡訊是堆積在那沒發的，具體是1k還是2k其實都是差不多量級，等到了百萬以上，具體數值已經不重要了，我們知道它現在堆積得很離譜，就夠了。因此這個場景，其實是允許使用比較粗略的估計的。

那怎麼樣才能獲得粗略的數值呢？

還記得我們平時為了檢視sql執行計劃用的explain命令不。

其中有個rows，會用來估計接下來執行這條sql需要掃描和檢查多少行。它是通過取樣的方式計算出來的，雖然會有一定的偏差，但它能反映一定的數量級。

explain裡的rows

有些語言的orm裡可能沒有專門的explain語法，但是肯定有執行raw sql的功能，你可以把explain語句當做raw sql傳入，從返回的結果裡將rows那一列讀出來使用。

一般情況下，explain的sql如果能走索引，那會比不走索引的情況更準。單個欄位的索引會比多個欄位組成的複合索引要準。索引區分度越高，rows的值也會越準。

這種情況幾乎滿足大部分的監控場景。但總有一些場景，它要求必須得到精確的行數，這種情況該怎麼辦呢？

必須精確估計行數的場景

這種場景就比較頭疼了，但也不是不能做。

我們可以單獨拉一張新的資料庫表，只為儲存各種場景下的count。

CREATE TABLE `count_table` (
  `id` int NOT NULL AUTO_INCREMENT COMMENT '主鍵',
  `cnt_what` char(20) NOT NULL DEFAULT '' COMMENT '各種需要計算的指標',
  `cnt` tinyint NOT NULL COMMENT 'cnt指標值',
  PRIMARY KEY (`id`),
  KEY `idx_cnt_what` (`cnt_what`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4;

count_table表儲存各種場景下的count

當需要獲取某個場景下的cout值時，可以使用下面的sql進行直接讀取，快得飛起。

select cnt from count_table where cnt_what = "未傳送的簡訊數量";

那這些count的結果值從哪來呢？這裡分成兩種情況。

實時性要求較高的場景

如果你對這個cnt計算結果的實時性要求很高，那你需要將更新cnt的sql加入到對應變更行數的事務中。比如我們有兩個事務A和B，分別是增加未傳送簡訊和減少未傳送簡訊。

將更改錶行數的操作放入到事務裡

這樣做的好處是事務內的cnt行數依然符合隔離級別，事務回滾的時候，cnt的值也會跟著回滾。

壞處也比較明顯，多個執行緒對同一個cnt進行寫操作，會觸發悲觀鎖，多個執行緒之間需要互相等待。對於高頻寫的場景，效能會有折損。

實時性沒那麼高的場景

如果實時性要求不高的話，比如可以一天一次，那你可以通過全表掃描後做計算。

舉個例子，比如上面的簡訊表，可以按id排序，每次取出1w條資料，記下這一批裡最大的id，然後下次從最大id開始再拿1w條資料出來，不斷迴圈。

對於未傳送的簡訊，就只需要在撈出的那1w條資料裡，篩選出state=0的條數。

batch分批獲取簡訊表

當然如果有條件，這種場景最好的方式還是消費binlog將資料匯入到hive裡，然後在hive裡做查詢，不少公司也已經有現成的元件可以做這種事情，不用自己寫指令碼，豈不美哉。

mysql同步hive

總結

mysql用count方法查全表資料，在不同的儲存引擎裡實現不同，myisam有專門欄位記錄全表的行數，直接讀這個欄位就好了。而innodb則需要一行行去算。

效能方面 count(*) ≈ count(1) > count(主鍵id) > count(普通索引列) > count(未加索引列)，但哪怕是效能最好的count(*)，由於實現上就需要一行行去算，所以資料量大的時候就是不給力。

如果確實需要獲取行數，且可以接受不那麼精確的行數（只需要判斷大概的量級）的話，那可以用explain裡的rows，這可以滿足大部分的監控場景，實現簡單。

如果要求行數準確，可以建個新表，裡面專門放錶行數的資訊。

如果對實時性要求比較高的話，可以將更新行數的sql放入到對應事務裡，這樣既能滿足事務隔離性，還能快速讀取到行數資訊。

如果對實時性要求不高，接受一小時或者一天的更新頻率，那既可以自己寫指令碼遍歷全表後更新行數資訊。也可以將通過監聽binlog將資料匯入hive，需要資料時直接通過hive計算得出。

到此這篇關於一文解答為什麼MySQL的count()方法這麼慢的文章就介紹到這了,更多相關MySQL count()方法內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com！

一文解答為什麼MySQL的count()方法這麼慢

目錄

前言

count()的原理

各種count()方法的原理

允許粗略估計行數的場景

必須精確估計行數的場景

總結

熱門文章