您好,登錄后才能下訂單哦!
本篇文章為大家展示了PostgreSQL邏輯復制中的pglogical模塊有什么作用,代碼簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
一、pglogical介紹
pglogical 是 PostgreSQL 的拓展模塊, 為 PostgreSQL 數據庫提供了邏輯流復制發布和訂閱的功能。 pglogical 重用了 BDR 項目中的一部分相關技術。pglogical 是一個完全作為PostgreSQL 擴展實現的邏輯復制系統。完全集成,它不需要觸發器或外部程序。這種物理復制的替代方法是使用發布/訂閱模型復制數據以進行選擇性復制的一種高效方法。支持 PG10、9.6、9.5、9.4 ,提供比 Slony、Bucardo 或 Londiste 更快的復制速度,以及跨版本升級。
我們使用的下列術語來描述節點和數據流之間的關系,重用了一些早期的 Slony 技術中的術語:
·節點 - PostgreSQL 數據庫實例
·發布者和訂閱者 - 節點的角色名稱
·復制集 - 關系表的集合
pglogical 是新技術組件,使用了最新的 PostgreSQL 數據庫中的一些核心功能,所以存在一些數據庫版本限制:
·數據源發布和訂閱節點需要運行 PostgreSQL 9.4 +
·復制源過濾和沖突檢測需要 PostgreSQL 9.5 +
支持的使用場景:
·主版本數據庫之間的升級(存在上述的版本限制)
·完整的數據庫復制
·利用復制集,選擇性的篩選的關系表
·可從多個上游服務器,做數據的聚集和合并
二、安裝操作
本節介紹了pglogical 擴展模塊復制的基本用法。
下載地址,安裝步驟
tar -zxvf pglogical-REL2_2_0.tar.gz cd pglogical-REL2_2_0 . /home/postgres/.bash_profile pg_config USE_PGXS=1 make clean USE_PGXS=1 make USE_PGXS=1 make install
首先 PostgreSQL服務器必須正確配置才能夠支持邏輯解碼︰
wal_level = 'logical' # one per database needed on (provider/subscriber)provider node max_worker_processes = 10 # one per node needed on provider node max_replication_slots = 10 # one per node needed on provider node max_wal_senders = 10 shared_preload_libraries = 'pglogical'
如果你想要處理解決與上一次/第一次更新之間的沖突 wins(參閱沖突章節), 你的數據庫版本需要為PostgreSQL 9.5+ (在9.4中無效) 您可以向 PostgreSQL.conf 添加此額外的選項:
# needed for last/first update wins conflict resolution property available in Postgre track_commit_timestamp = on
pg_hba.conf 需要配置成允許從本地主機復制,用戶擁有有復制權限,連接權限;并重啟數據庫服務
host replication postgres 網段ip/24 trust
在所有節點上所對應數據庫安裝pglogical拓展模塊:
CREATE EXTENSION pglogical;
三、pglogical復制配置
現有實驗環境
3.1、時間同步
服務器時間同步(主備庫都需操作)
echo "*/20 * * * * /usr/sbin/ntpdate -u ntp.api.bz >/dev/null" >> /var/spool/cron/root
3.2、提供者節點配置
1、創建節點
在一個數據庫里創建提供者節點
# 創建節點 SELECT pglogical.create_node( node_name := 'provider1', dsn := 'host=192.168.1.221 port=5432 dbname=lottu' );
2、創建復制集
將public架構中的所有表添加到default復制集中
SELECT pglogical.replication_set_add_all_tables('default', ARRAY['public']);
復制集default的表都必需要primary key
3.3、訂閱者節點配置
1、創建節點
在另一個數據庫創建訂閱者節點
SELECT pglogical.create_node( node_name := 'subscriber1', dsn := 'host=192.168.1.235 port=5432 dbname=lottu' );
2、創建訂閱
訂閱提供者節點,該訂閱將在后臺啟動同步和復制過程
SELECT pglogical.create_subscription( subscription_name := 'subscription1', provider_dsn := 'host=192.168.1.221 port=5432 dbname=lottu' );
3.4、驗證復制
前面我們已經完成安裝/配置 pglogical 操作。
1、創建測試表
create table tbl_lottu01(id int primary key, name text, reg_time timestamp);
由于需要驗證insert/update/delete/truncate操作是否同步;所以創建的表要有主鍵。當然只對發布者必須要主鍵約束。
2、添加測試數據
lottu=# insert into tbl_lottu01 select generate_series(1,10000),'lottu',now(); INSERT 0 10000
3、將表添加對應的復制集
對新建的表;并沒有為其分配對應的復制集;需要手動添加。當然可以利用觸發器自動添加;后續補充。
lottu=# select * from pglogical.replication_set_table ; set_id | set_reloid | set_att_list | set_row_filter --------+------------+--------------+---------------- (0 rows)
方法1:
前面講解創建復制集中;3.2.2中“將public架構中的所有表添加到default復制集中”
SELECT pglogical.replication_set_add_all_tables('default', ARRAY['public']);
方法二:
將表添加到對應的復制集中;詳細介紹可以查看前面文檔。
pglogical.replication_set_add_table(set_name name, relation regclass, synchronize_data boolean, columns text [], row_filter text)
兩種方法都可以;我們采用第二種方法。
lottu=# select pglogical.replication_set_add_table( set_name := 'default', relation := 'tbl_lottu01',synchronize_data := true); replication_set_add_table --------------------------- t (1 row)
我們查看復制集
lottu=# select * from pglogical.replication_set_table ; set_id | set_reloid | set_att_list | set_row_filter -----------+-------------+--------------+---------------- 290045701 | tbl_lottu01 | | (1 row)
同時,數據也同步到 subscriber 節點。因為在第二種方法有 同步 的操作。若使用第一種方法;還需要在subscriber 節點同步表的操作。
#重新同步一個表 pglogical.alter_subscription_resynchronize_table(subscription_name name, relation regclass) #將所有的表都同步 pglogical.alter_subscription_synchronize(subscription_name name, truncate bool)
4、查看subscriber 節點
查看表 tbl_lottu01 信息
lottu=# select * from pglogical.show_subscription_table('subscription1','tbl_lottu01'); nspname | relname | status ---------+-------------+-------------- public | tbl_lottu01 | synchronized (1 row) lottu=# select count(1) from tbl_lottu01; count ------- 10000 (1 row)
在復制集default中: update/delete/truncate 操作也是同步復制。不作演示
四、復制特性擴展
4.1、延遲復制
pglogical.create_subscription(subscription_name name, provider_dsn text, replication_sets text[], synchronize_structure boolean, synchronize_data boolean, forward_origins text[], apply_delay interval)
參數:
·subscription_name - 訂閱的名稱,必須是唯一的
·provider_dsn - 提供者的連接字符串
·replication_sets - 要訂閱的復制集數組,這些必須已存在,默認為“{default,default_insert_only,ddl_sql}”
·synchronize_structure - 指定是否將提供者與訂閱者之間的結構同步,默認為false
·synchronize_data - 指定是否將數據從提供者同步到訂閱者,默認為true
·forward_origins - 要轉發的原始名稱數組,當前只支持的值是空數組,意味著不轉發任何不是源自提供者節點的更改,或“{all}”這意味著復制所有更改,無論它們的來源是什么,默認是全部}”
·apply_delay - 延遲復制多少,默認為0秒
示例:數據表結構同步;且延遲復制1分鐘
SELECT pglogical.create_subscription( subscription_name := 'subscription1', provider_dsn := 'host=192.168.1.221 port=5432 dbname=lottu', synchronize_structure := true, apply_delay := '00:01:00'::interval );
4.2、對源端進行 行/列 過濾
過濾機制需要 PostgreSQL 9.5 +
pglogical.replication_set_add_table(set_name name, relation regclass, synchronize_data boolean, columns text [], row_filter text)
參數:
·set_name - 現有復制集的名稱
·relation - 要添加到集合中的表的名稱或OID
·synchronize_data - 如果為true,則表數據將在訂閱給定復制集的所有訂戶上同步,默認為false
·columns - 要復制的列的列表。通常,當應復制所有列時,這將設置為NULL,這是默認值
·row_filter - 行過濾表達式,默認為NULL(無過濾),有關詳細信息,請參閱(行過濾)。警告:在使用有效行篩選器同步數據時要小心。使用synchronize_data=true有效row_filter就像對表的一次性操作。使用修改后再次執行它將row_filter不會將數據同步到訂戶。訂閱者可能需要pglogical.alter_subscription_resynchronize_table()來修復它。
**示例:對表tbl_lottu02中字段{id, name, job} 字段列過濾;且對條件 ‘id > 10’ 進行行過濾 **
# provider 節點 創建表并插入測試數據 create table tbl_lottu02 (id int primary key, name text, job text, reg_time timestamp ); insert into tbl_lottu02 select generate_series(1,20) id,'lottu'||generate_series(1,20),'pg', now(); # subscriber節點創建表; 可以只創建復制的列的數據表 create table tbl_lottu02 (id int primary key, name text, job text, reg_time timestamp ); # or create table tbl_lottu02 (id int primary key, name text, job text); #provider 節點 將表加入復制集中;并同步記錄 lottu=# select pglogical.replication_set_add_table(set_name := 'default', relation := 'tbl_lottu02', synchronize_data := true, columns := '{id, name, job}',row_filter := 'id < 10'); replication_set_add_table --------------------------- t (1 row) # subscriber節點查看表tbl_lottu02記錄 lottu=# select * from tbl_lottu02; id | name | job ----+--------+----- 1 | lottu1 | pg 2 | lottu2 | pg 3 | lottu3 | pg 4 | lottu4 | pg 5 | lottu5 | pg 6 | lottu6 | pg 7 | lottu7 | pg 8 | lottu8 | pg 9 | lottu9 | pg (9 rows)
4.3、為新表自動分配復制集
事件觸發器工具可用于描述為新創建的表定義復制集的規則。
CREATE OR REPLACE FUNCTION pglogical_assign_repset() RETURNS event_trigger AS $$ DECLARE obj record; BEGIN FOR obj IN SELECT * FROM pg_event_trigger_ddl_commands() LOOP IF obj.object_type = 'table' THEN IF obj.schema_name = 'config' THEN PERFORM pglogical.replication_set_add_table('configuration', obj.objid); ELSIF NOT obj.in_extension THEN PERFORM pglogical.replication_set_add_table('default', obj.objid); END IF; END IF; END LOOP; END; $$ LANGUAGE plpgsql; CREATE EVENT TRIGGER pglogical_assign_repset_trg ON ddl_command_end WHEN TAG IN ('CREATE TABLE', 'CREATE TABLE AS') EXECUTE PROCEDURE pglogical_assign_repset();
4.4、沖突檢測
沖突檢測需要 PostgreSQL 9.5 +
如果節點訂閱多個提供程序,或當本地寫入在訂閱服務器上發生,可能會發生沖突,尤其是對傳入的變化。這些都自動檢測,并可以就此采取行動取決于配置。
解決沖突的辦法是通過配置 pglogical.conflict_resolution 參數。
pglogical.conflict_resolution 支持的配置參數選項為︰
·error - 復制將停止上錯誤如果檢測到沖突和手動操作需要解決
·apply_remote - 總是應用與本地數據有沖突的更改,這是默認值
·keep_local - 保留數據的本地版本,并忽略來自遠程節點相互沖突的更改
·last_update_wins - 時間戳為提交最新的版本(newest commit timestamp)的數據將會被保存(這可以是本地或遠程版本)
·first_update_wins - 時間戳為最舊的版本(oldest timestamp)的數據將會被保存(這可以是本地或遠程版本)
當參數track_commit_timestamp被禁用時,唯一允許的配置值是 apply_remote。 PostgreSQL 9.4 不支持 track_commit_timestamp 配置參數只能配置參數apply_remote(該參數是默認值)。
# 在 訂閱者 節點配置;我們保留最新的數據 track_commit_timestamp = on pglogical.conflict_resolution = 'last_update_wins' # 在 訂閱者 節點創建測試表tbl_lottu03 lottu=# create table tbl_lottu03(id int primary key, name text); CREATE TABLE lottu=# insert into tbl_lottu03 values (1001,'subscriber'); INSERT 0 1 # 在 發布者 節點 創建測試表 create table tbl_lottu03(id int primary key, name text); select pglogical.replication_set_add_table( set_name := 'default',relation := 'tbl_lottu03',synchronize_data := true); insert into tbl_lottu03 values (1001,'provider'); # 在 訂閱者 節點 查看數據 lottu=# select * from tbl_lottu03; id | name ------+---------- 1001 | provider
后記: 在訂閱者的表需要主鍵約束;不然檢測不到沖突;是否需要主鍵約束當然這個也是根據需求而定。
五、場景介紹
5.1、可從多個上游服務器,做數據的聚集和合并
發布者跟訂閱者的關系;一個發布者可以被多個訂閱者訂閱。多個發布者可以被同一個訂閱者訂閱。
為了加以區分;我們定制SQL提示符;例如:
lottu=# \set PROMPT1 '%`echo provider1=`' provider1=
5.1.1、創建測試表
# 每個節點創建測試表; 訂閱者創建的表可以無主鍵;若訂閱者有主鍵,可利用序列自增來解決沖突。(例如:本例是兩個發布者, 則發布者1可取奇數;發布者二可取偶數)。若無主鍵;數據不受影響。 provider1=create table tbl_lottu05(id int primary key,name text); CREATE TABLE provider1=CREATE SEQUENCE seq_lottu05_id INCREMENT BY 2 START WITH 1; CREATE SEQUENCE provider2=create table tbl_lottu05(id int primary key,name text); CREATE TABLE provider2=CREATE SEQUENCE seq_lottu05_id INCREMENT BY 2 START WITH 2; CREATE SEQUENCE subscriber=create table tbl_lottu05(id int primary key,name text); CREATE TABLE
5.1.2、搭建模擬場景
更多介紹查看第三節;或者查考《PostgreSQL 邏輯復制文檔 (pglogical 文檔 )》
# provider 節點1 provider1=SELECT pglogical.create_node(node_name := 'provider1', dsn := 'host=192.168.1.221 port=5432 dbname=lottu'); create_node ------------- 2976894835 provider1=select pglogical.replication_set_add_table( set_name := 'default', relation := 'tbl_lottu05', synchronize_data := true); replication_set_add_table --------------------------- t # provider 節點2 provider2=SELECT pglogical.create_node(node_name := 'provider2', dsn := 'host=192.168.1.221 port=5432 dbname=lottu02'); create_node ------------- 1828187473 provider2=select pglogical.replication_set_add_table( set_name := 'default', relation := 'tbl_lottu05', synchronize_data := true); replication_set_add_table --------------------------- t # subscriber 節點 subscriber=SELECT pglogical.create_node(node_name := 'subscriber', dsn := 'host=192.168.1.235 port=5432 dbname=lottu'); create_node ------------- 2941155235 subscriber=SELECT pglogical.create_subscription(subscription_name := 'subscription1', provider_dsn := 'host=192.168.1.221 port=5432 dbname=lottu'); create_subscription --------------------- 1763399739 subscriber=SELECT pglogical.create_subscription(subscription_name := 'subscription2', provider_dsn := 'host=192.168.1.221 port=5432 dbname=lottu02'); create_subscription --------------------- 1871150101
5.1.3、插入數據驗證
provider1=insert into tbl_lottu05 select nextval('seq_lottu05_id'),'lottu' || generate_series(1,10,2); INSERT 0 5 provider2=insert into tbl_lottu05 select nextval('seq_lottu05_id'),'lottu' || generate_series(1,10,2); INSERT 0 5 subscriber=select * from tbl_lottu05; id | name ----+-------- 1 | lottu1 3 | lottu3 5 | lottu5 7 | lottu7 9 | lottu9 2 | lottu1 4 | lottu3 6 | lottu5 8 | lottu7 10 | lottu9 (10 rows)
5.2、數據庫版本升級
pglogical 對 PostgreSQL 版本升級是一個很實用的工具。能實現以幾乎為零的停機時間遷移和升級PostgreSQL。局限性在于pglogical支持的 PostgreSQL 版本。
本例簡單模擬下pglogical 對 PostgreSQL 版本升級;忽略插件、存儲空間、表空間、以及業務SQL和自定義函數創建。
5.2.1、新建升級數據庫
以一個全新的數據庫進行操作
PG10-235=drop database if exists lottu; NOTICE: database "lottu" does not exist, skipping DROP DATABASE PG10-235=create database lottu owner lottu; CREATE DATABASE
5.2.2、pglogical 插件安裝
本環境已經安裝pglogical;只要到對應數據庫創建pglogical插件即可
PG10-235=CREATE EXTENSION pglogical; CREATE EXTENSION PG10-235=\dx List of installed extensions Name | Version | Schema | Description -----------+---------+------------+-------------------------------- pglogical | 2.2.0 | pglogical | PostgreSQL Logical Replication plpgsql | 1.0 | pg_catalog | PL/pgSQL procedural language (2 rows)
5.2.3、配置pglogical
·發布者節點
這個要根據真實環境來設置;考慮到真實環境數據庫中表不一定都有主鍵約束,可將表放到復制集 "default_insert_only"。
PG96-221=SELECT pglogical.create_node(node_name := 'provider', dsn := 'host=192.168.1.221 port=5432 dbname=lottu'); create_node ------------- 3171898924 (1 row) PG96-221=SELECT pglogical.replication_set_add_all_tables('default_insert_only', ARRAY['public']); replication_set_add_all_tables -------------------------------- t (1 row)
該函數可實現主鍵和非主鍵分別放到'default'和'default_insert_only'復制集
CREATE OR REPLACE FUNCTION "public"."pglogical_relhaspkey_repset"() RETURNS "pg_catalog"."void" AS $BODY$ DECLARE obj record; BEGIN FOR obj IN (SELECT n.nspname, c.relname, c.relhaspkey FROM pg_catalog.pg_class c LEFT JOIN pg_catalog.pg_namespace n ON n.oid = c.relnamespace WHERE c.relkind = 'r' AND n.nspname <> 'pg_catalog' AND n.nspname <> 'information_schema' AND n.nspname !~ '^pg_toast' AND pg_catalog.pg_table_is_visible(c.oid) ORDER BY 1, 2) LOOP IF obj.relhaspkey THEN PERFORM pglogical.replication_set_add_table(set_name := 'default', relation := obj.relname :: regclass); ELSE PERFORM pglogical.replication_set_add_table(set_name := 'default_insert_only', relation := obj.relname :: regclass); END IF; END LOOP; END; $BODY$ LANGUAGE plpgsql VOLATILE COST 100
·訂閱者節點
PG10-235=SELECT pglogical.create_node(node_name := 'subscriber', dsn := 'host=192.168.1.235 port=5432 dbname=lottu'); create_node ------------- 2941155235
5.2.4、遷移DDL
pglogical 可以同步表/序列結構;在創建訂閱者 'pglogical.create_subscription' ; 里面參數synchronize_structure - 指定是否將提供者與訂閱者之間的結構同步,默認為false。可以同步表/序列/索引。
PG10-235=SELECT pglogical.create_subscription(subscription_name := 'subscription', provider_dsn := 'host=192.168.1.221 port=5432 dbname=lottu', synchronize_structure := true, synchronize_data := false); create_subscription --------------------- 2875150205 (1 row)
5.2.5、業務代碼改寫優化
上一步我們沒同步數據。所以參數synchronize_data我們選擇false。雖然把表/序列/索引結構同步過來;但是業務代碼(函數/插件)沒同步過來;還要考慮這些業務代碼是否需要改寫優化。因為新的版本往往有新特性。
5.2.6、全量復制
pglogical有將所有未同步表都在單個操作中同步
語法:
pglogical.alter_subscription_synchronize(subscription_name name, truncate bool)
參數:
·subscription_name - 現有訂閱的名稱
·truncate - 如果為true,表將在復制前被截斷,默認為false
PG10-235=SELECT pglogical.alter_subscription_synchronize(subscription_name := 'subscription', truncate := false); alter_subscription_synchronize -------------------------------- t (1 row)
5.2.7、比對數據一致
經過上一步,兩個數據庫數據達到一致。
·查看表同步狀態
PG10-235=select * from pglogical.show_subscription_table(subscription_name := 'subscription', relation := 'tbl_lottu01'::regclass); nspname | relname | status ---------+-------------+-------------- public | tbl_lottu01 | synchronized (1 row)
·比對兩個數據庫表的數據
PG96-221=select count(1) from tbl_lottu01; count ------- 10000 (1 row) PG10-235=select count(1) from tbl_lottu01; count ------- 10000 (1 row)
5.2.8、業務切換
比對數據一致;可以將業務切換到升級后的數據庫。
5.2.9、刪除pglogical配置
這步是可選的;保證升級后的數據庫正常支持業務。不存在數據丟失的情況下。可以刪除pglogical配置。
刪除步驟:
·刪除訂閱信息
·刪除兩個數據庫pglogical節點
PG10-235=select pglogical.drop_subscription(subscription_name := 'subscription',ifexists := true); drop_subscription ------------------- 1 (1 row) PG10-235=select pglogical.drop_node(node_name := 'subscriber', ifexists := true); drop_node ----------- t (1 row) PG96-221=select pglogical.drop_node(node_name := 'provider', ifexists := true); drop_node ----------- t (1 row)
上述內容就是PostgreSQL邏輯復制中的pglogical模塊有什么作用,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。