您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么理解PostgreSQL中的參數autovacuum_max_workers”,在日常操作中,相信很多人在怎么理解PostgreSQL中的參數autovacuum_max_workers問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么理解PostgreSQL中的參數autovacuum_max_workers”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
PG的MVCC要求“過期”的數據不能馬上被物理清除,而是標記為dead rows,這些dead rows后續會通過vacuuming過程清理。
vacuuming通過以下方式讓數據庫保持“健康”:
1.標記dead rows可用于存儲新數據,這樣可以避免不必要的磁盤浪費以及可以跳過dead rows以提升順序掃描的性能;
2.更新vm(用于跟蹤過期或已廢棄的數據,反應在pages上)。這可以提升index-only scans的性能;
3.避免出現事務ID回卷而導致的數據庫宕機。
PG提供了autovacuum機制,通過周期性的運行ANALYZE來收集最近頻繁更新的數據表統計信息,基于這些統計信息autovacuum進行調度清理dead rows。
PG提供了配置參數autovacuum_max_workers用于配置autovacuum worker的個數,從直觀的感覺來看,提升該參數意味著有更多的worker進程,可以有效的提升autovacuum的吞吐,但實際上由于autovacuum_vacuum_cost_limit參數的限制,單純的提升autovacuum_max_workers并沒有什么效果。
由于autovacuum_vacuum_cost_limit對成本的限制是全局的,也就是說該參數控制了全局的worker可達到的成本上限,就算提高了autovacuum_vacuum_cost_limit,吞吐量也不會有提升。打個比方,啟用多線程往文件系統中寫文件,但總的吞吐限制為10MB/s,每個線程的吞吐最多只能是(10MB/線程數)/s也就意味著不管你啟用多少個線程,最高的吞吐也只能是10MB/s,除了增加線程數(autovacuum_max_workers)還需要增加總的吞吐限制(autovacuum_vacuum_cost_limit)。
PG提供了面向單個表的個性化autovacuum解決方案,可以在表級上設置autovacuum_vacuum_cost_limit、autovacuum_vacuum_cost_delay等參數。表上的autovacuum_vacuum_cost_limit參數不納入到全局的統計數字中。
[local:/data/run/pg12]:5120 pg12@testdb=# create table t(id int); CREATE TABLE [local:/data/run/pg12]:5120 pg12@testdb=# ALTER TABLE t SET (autovacuum_vacuum_cost_limit = 1000); ALTER TABLE [local:/data/run/pg12]:5120 pg12@testdb=# ALTER TABLE t SET (autovacuum_vacuum_cost_delay = 10); ALTER TABLE [local:/data/run/pg12]:5120 pg12@testdb=#
到此,關于“怎么理解PostgreSQL中的參數autovacuum_max_workers”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。