<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
優化思路:
0、為每個表執行 ANALYZE
然後分析 EXPLAIN (ANALYZE,BUFFERS) sql。
1、對於多表查詢,檢視每張表資料,然後改進連線順序。
2、先查詢那部分是重點語句,比如上面SQL,外面的巢狀層對於優化來說沒有意義,可以去掉。
3、檢視語句中,where等條件子句,每個欄位能過濾的效率。找出可優化處。
比如oc.order_id = oo.order_id是關聯條件,需要加索引
這兩個是優化的重點,也就是實現確保op_type與event_type已經加了索引,其次確保索參照到了。
(至於具體什麼資料量能在記憶體中完成排序,不同資料庫有不同的設定:oracle是sort_area_size;postgresql是work_mem (integer),單位是KB,預設值是4MB。mysql是sort_buffer_size 注意:該引數對應的分配記憶體是每連線獨佔!)
1、hash join
2、nest loop
在多表聯查時,需要考慮連線順序問題。
1、當postgresql中進行查詢時,如果多表是通過逗號,而不是join連線,那麼連線順序是多表的笛卡爾積中取最優的。如果有太多輸入的表, PostgreSQL規劃器將從窮舉搜尋切換為基因概率搜尋,以減少可能性數目(樣本空間)。基因搜尋花的時間少, 但是並不一定能找到最好的規劃。
2、對於JOIN
如果要強制規劃器遵循準確的JOIN連線順序,我們可以把執行時引數join_collapse_limit設定為 1
主要有如下幾個方面。
EXPLAIN命令可以檢視執行計劃,這個方法是我們最主要的偵錯工具。
由於統計資訊不是每次運算元據庫都進行更新的,一般是在 VACUUM 、 ANALYZE 、 CREATE INDEX等DDL執行的時候會更新統計資訊,
因此執行計劃所用的統計資訊很有可能比較舊。 這樣執行計劃的分析結果可能誤差會變大。
以下是表tenk1的相關的一部分統計資訊。
SELECT relname, relkind, reltuples, relpages FROM pg_class WHERE relname LIKE 'tenk1%';
relname | relkind | reltuples | relpages |
---|---|---|---|
tenk1 | r | 10000 | 358 |
tenk1_hundred | i | 10000 | 30 |
tenk1_thous_tenthous | i | 10000 | 30 |
tenk1_unique1 | i | 10000 | 30 |
tenk1_unique2 | i | 10000 | 30 |
(5 rows)
其中 relkind是型別,r是自身表,i是索引index;reltuples是專案數;relpages是所佔硬碟的塊數。
一般寫法:
SELECT * FROM a, b, c WHERE a.id = b.id AND b.ref = c.id;
如果明確用join的話,執行時候執行計劃相對容易控制一些。
例子:
SELECT * FROM a CROSS JOIN b CROSS JOIN c WHERE a.id = b.id AND b.ref = c.id; SELECT * FROM a JOIN (b JOIN c ON (b.ref = c.id)) ON (a.id = b.id);
(autocommit=false)
我們有的處理中要對同一張表執行很多次insert操作。這個時候我們用copy命令更有效率。因為insert一次,其相關的index都要做一次,比較花費時間。
有時候我們在備份和重新匯入資料的時候,如果資料量很大的話,要很幾個小時才能完成。這個時候可以先把index刪除掉。匯入在建index。
如果表的有外來鍵的話,每次操作都沒去check外來鍵整合性。因此比較慢。資料匯入後在建立外來鍵也是一種選擇。
增加這個引數可以提升CREATE INDEX和ALTER TABLE ADD FOREIGN KEY的執行效率。
增加這個引數可以提升大量資料匯入時候的速度。
這個引數設定為無效的時候,能夠提升以下的操作的速度
CREATE TABLE AS SELECT
CREATE INDEX
ALTER TABLE SET TABLESPACE
CLUSTER
等。表中資料大量變化的時候建議執行VACUUM ANALYZE。
對生產執行的資料庫要用定時任務crontb執行如下操作:
psql -U username -d databasename -c "vacuum verbose analyze tablename;"
autovacuum: 預設為on,表示是否開起autovacuum。預設開起。特別的,當需要凍結xid時,儘管此值為off,PG也會進行vacuum。 autovacuum_naptime: 下一次vacuum的時間,預設1min。 這個naptime會被vacuum launcher分配到每個DB上。autovacuum_naptime/num of db。 log_autovacuum_min_duration: 記錄autovacuum動作到紀錄檔檔案,當vacuum動作超過此值時。 「-1」表示不記錄。「0」表示每次都記錄。 autovacuum_max_workers: 最大同時執行的worker數量,不包含launcher本身。 autovacuum_work_mem: 每個worker可使用的最大記憶體數。 autovacuum_vacuum_threshold: 預設50。與autovacuum_vacuum_scale_factor配合使用,autovacuum_vacuum_scale_factor預設值為20%。當update,delete的tuples數量超過autovacuum_vacuum_scale_factor*table_size+autovacuum_vacuum_threshold時,進行vacuum。如果要使vacuum工作勤奮點,則將此值改小。 autovacuum_analyze_threshold: 預設50。與autovacuum_analyze_scale_factor配合使用。 autovacuum_analyze_scale_factor: 預設10%。當update,insert,delete的tuples數量超過autovacuum_analyze_scale_factor*table_size+autovacuum_analyze_threshold時,進行analyze。 autovacuum_freeze_max_age:200 million。離下一次進行xid凍結的最大事務數。 autovacuum_multixact_freeze_max_age: 400 million。離下一次進行xid凍結的最大事務數。 autovacuum_vacuum_cost_delay: 如果為-1,取vacuum_cost_delay值。 autovacuum_vacuum_cost_limit: 如果為-1,到vacuum_cost_limit的值,這個值是所有worker的累加值。
選項 | 預設值 | 說明 | 是否優化 | 原因 |
---|---|---|---|---|
max_connections | 100 | 允許使用者端連線的最大數目 | 否 | 因為在測試的過程中,100個連線已經足夠 |
fsync | on | 強制把資料同步更新到磁碟 | 是 | 因為系統的IO壓力很大,為了更好的測試其他設定的影響,把改引數改為off |
shared_buffers | 24MB | 決定有多少記憶體可以被PostgreSQL用於快取資料(推薦記憶體的1/4) | 是 | 在IO壓力很大的情況下,提高該值可以減少IO |
work_mem | 1MB | 使內部排序和一些複雜的查詢都在這個buffer中完成 | 是 | 有助提高排序等操作的速度,並且減低IO |
effective_cache_size | 128MB | 優化器假設一個查詢可以用的最大記憶體,和shared_buffers無關(推薦記憶體的1/2) | 是 | 設定稍大,優化器更傾向使用索引掃描而不是順序掃描 |
maintenance_work_mem | 16MB | 這裡定義的記憶體只是被VACUUM等耗費資源較多的命令呼叫時使用 | 是 | 把該值調大,能加快命令的執行 |
wal_buffer | 768kB | 紀錄檔快取區的大小 | 是 | 可以降低IO,如果遇上比較多的並行短事務,應該和commit_delay一起用 |
checkpoint_segments | 3 | 設定wal log的最大數量數(一個log的大小為16M) | 是 | 預設的48M的快取是一個嚴重的瓶頸,基本上都要設定為10以上 |
checkpoint_completion_target | 0.5 | 表示checkpoint的完成時間要在兩個checkpoint間隔時間的N%內完成 | 是 | 能降低平均寫入的開銷 |
commit_delay | 0 | 事務提交後,紀錄檔寫到wal log上到wal_buffer寫入到磁碟的時間間隔。需要配合commit_sibling | 是 | 能夠一次寫入多個事務,減少IO,提高效能 |
commit_siblings | 5 | 設定觸發commit_delay的並行事務數,根據並行事務多少來設定 | 是 | 減少IO,提高效能 |
autovacuum_naptime | 1min | 下一次vacuum任務的時間 | 是 | 提高這個間隔時間,使他不是太頻繁 |
autovacuum_analyze_threshold | 50 | 與autovacuum_analyze_scale_factor配合使用,來決定是否analyze | 是 | 使analyze的頻率符合實際 |
autovacuum_analyze_scale_factor | 0.1 | 當update,insert,delete的tuples數量超過autovacuum_analyze_scale_factor*table_size+autovacuum_analyze_threshold時,進行analyze。 | 是 | 使analyze的頻率符合實際 |
引數名稱 | 引數意義 | 優化思路 |
---|---|---|
shared_buffers | 資料庫伺服器將使用的共用記憶體緩衝區大小,該緩衝區為所有連線共用。從磁碟讀入的資料(主要包括表和索引)都快取在這裡。 | 提高該值可以減少資料庫的磁碟IO。 |
work_mem | 宣告內部排序和雜湊操作可使用的工作記憶體大小。該記憶體是在開始使用臨時磁碟檔案之前使用的記憶體數目。數值以kB為單位的,預設是 1024 (1MB)。請注意對於複雜的查詢,可能會同時並行執行好幾個排序或者雜湊操作,每個都會使用這個引數宣告的這麼多記憶體,然後才會開始求助於臨時檔案。同樣,好幾個正在執行的對談可能會同時進行排序操作。因此使用的總記憶體可能是 work_mem 的好幾倍。ORDER BY, DISTINCT 和mergejoin都要用到排序操作,而雜湊操作在雜湊連線、雜湊聚集和以雜湊為基礎的 IN 子查詢處理中都會用到。該引數是對談級引數。 | 執行排序操作時,會根據work_mem的大小決定是否將一個大的結果集拆分為幾個小的和 work_mem差不多大小的臨時檔案寫入外存。顯然拆分的結果是導致了IO,降低了排序的速度。因此增加work_mem有助於提高排序的速度。通常設定時可以逐漸調大,知道資料庫在排序的操作時不會有大量的寫檔案操作即可。該記憶體每個連線一份,當並行連線較多時候,該值不宜過大。 |
effective_cache_size | 優化器假設一個查詢可以使用的最大記憶體(包括pg使用的和作業系統快取),和shared_buffer等記憶體無關,只是給優化器生成計劃使用的一個假設值。 | 設定稍大,優化器更傾向使用索引掃描而不是順序掃描,建議的設定為可用空閒記憶體的25%,這裡的可用空閒記憶體指的是主機實體記憶體在執行pg時得空閒值。 |
maintenance_work_mem | 這裡定義的記憶體只是在CREATE INDEX, VACUUM等時用到,因此用到的頻率不高,但是往往這些指令消耗比較多的資源,因此應該儘快讓這些指令快速執行完畢。 | 在資料庫匯入資料後,執行建索引等操作時,可以調大,比如512M。 |
wal_buffers | 紀錄檔緩衝區,紀錄檔緩衝區的大小。 | 兩種情況下要酌情調大:1.單事務的資料修改量很大,產生的紀錄檔大於wal_buffers,為了避免多次IO,調大該值。 |
2.系統中並行小資料量修改的短事務較多,並且設定了commit_delay,此時wal_buffers需要容納多個事務(commit_siblings個)的紀錄檔,調大該值避免多次IO。 | ||
commit_delay | 事務提交後,紀錄檔寫到wal_buffer上到wal_buffer寫到磁碟的時間間隔。 | 如果並行的非唯讀事務數目較多,可以適當增加該值,使紀錄檔緩衝區一次刷盤可以刷出較多的事務,減少IO次數,提高效能。需要和commit_sibling配合使用。 |
commit_siblings | 觸發commit_delay等待的並行事務數,也就是系統的並行活躍事務數達到了該值事務才會等待commit_delay的時間才將紀錄檔刷盤,如果系統中並行活躍事務達不到該值,commit_delay將不起作用,防止在系統並行壓力較小的情況下事務提交後空等其他事務。 | 應根據系統並行寫的負載設定。例如統計出系統並行執行增刪改操作的平均連線數,設定該值為該平均連線數。 |
fsync | 設定為on時,紀錄檔緩衝區刷盤時,需要確認已經將其寫入了磁碟,設定為off時,由作業系統排程磁碟寫的操作,能更好利用快取機制,提高IO效能。 | 該效能的提高是伴隨了資料丟失的風險,當作業系統或主機崩潰時,不保證刷出的紀錄檔是否真正寫入了磁碟。應依據作業系統和主機的穩定性來設定。 |
autovacuum | 是否開啟自動清理程序(如開啟需要同時設定引數stats_start_collector = on,stats_row_level = on,),整理資料檔案碎片,更新統計資訊。 | 如果系統中有大量的增刪改操作,建議開啟自動清理程序,這樣一方面可以增加資料檔案的物理連續性,減少磁碟的隨機IO,一方面可以隨時更新資料庫的統計資訊,使優化器可以選擇最優的查詢計劃得到最好的查詢效能。如果系統中只有唯讀的事務,那麼關閉自動清理程序。 |
autovacuum_naptime | 自動清理程序執行清理分析的時間間隔 | 應該根據資料庫的單位時間更新量來決定該值,一般來說單位時間的更新量越大該時間間隔應該設定越短。由於自動清理對系統的開銷較大,該值應該謹慎設定(不要過小)。 |
bgwriter_delay | 後臺寫程序的自動執行時間 | 後臺寫程序的作用是將shared_buffer裡的髒頁面寫回到磁碟,減少checkpoint的壓力,如果系統資料修改的壓力一直很大,建議將該時間間隔設定小一些,以免積累的大量的髒頁面到checkpoint,使checkpoint時間過長(checkpoint期間系統響應速度較慢)。 |
bgwriter_lru_maxpages | 後臺寫程序一次寫出的髒頁面數 | 依據系統單位時間資料的增刪改量來修改 |
bgwriter_lru_multiplier | 後臺寫程序根據最近服務程序需要的buffer數量乘上這個比率估算出下次服務程序需要的buffer數量,在使用後臺寫程序寫回髒頁面,使緩衝區能使用的乾淨頁面達到這個估計值。 | 依據系統單位時間資料的增刪改量來修改。 |
以上為個人經驗,希望能給大家一個參考,也希望大家多多支援it145.com。
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45