挽救DG中主庫的nologging操作的塊
眾所周知我們的Data Guard數據同步是基于日志流的。所以在主庫執行nologging操作是不被允許的。這也就是為什么我們需要在配置Data Guard階段需要使用Force Logging。但是這也會帶來很多問題(SQL執行效率),例如:當我們使用數據泵進行遷移時我們希望最少停機時間完成,這時候我們就可能會考慮到以最小日志導入的方式以加快導入速度,然后重新同步備庫。
在一些場景中,我們會去使用nologging操作去節省大量數據插入的時間,而這種操作所帶來的問題就是,如果該庫在有備庫的情況下,因為主庫的nologging插入操作不會生成redo,所以不會在備庫上傳輸和應用,這會導致備庫的數據出現問題。
在Oracle 11g,如果遇到這樣的問題,可以通過在備庫恢復有問題的數據文件來解決問題,示例如下:
在一個具有主備關系的主庫上將force_logging設置為nologging模式,隨后創建一張表,設置為nologging模式
-
SQL> alter database no force logging;
-
SQL> create table DEMO tablespace users pctfree 99 as select rownum n from xmltable('1 to 1000');
-
SQL> alter table DEMO nologging;
之后使用/* +append*/插入數據并提交
-
SQL> insert /*+ append */ into DEMO select rownum n from xmltable('1 to 100000');
-
SQL> commit
這時候在備庫對該表進行查詢會看到如下報錯信息
-
SQL>select count(1) from demo;
-
select count(1) from demo
-
*
-
ERROR at line 1:
-
ORA-01578: ORACLE data block corrupted (file # 4, block # 819)
-
ORA-01110: data file 4: '/data/data1/ORCL2/datafile/o1_mf_users_3ft1e9qb_.dbf'
-
ORA-26040: Data block was loaded using the NOLOGGING option
而要修復這個問題,需要將包含缺少的數據的數據文件從主庫復制到物理備庫。
步驟一
1、查詢主庫
-
SQL> SELECT NAME, UNRECOVERABLE_CHANGE# FROM V$DATAFILE;
-
NAME UNRECOVERABLE_CHANGE#
-
--------------------------------------------------------------------------- ---------------------
-
+DATADG/orcl/datafile/system.270.972381717 0
-
+DATADG/orcl/datafile/sysaux.265.972381717 0
-
+DATADG/orcl/datafile/undotbs1.261.972381717 0
-
+DATADG/orcl/datafile/users.259.972381717 6252054
-
+DATADG/orcl/datafile/example.264.972381807 0
-
+DATADG/orcl/datafile/undotbs2.258.972381927 0
-
+DATADG/orcl/datafile/example.266.972400297 0
-
+DATADG/orcl/datafile/ax.268.973612569 0
2、查詢備庫
-
sys@ORCL>SELECT NAME, UNRECOVERABLE_CHANGE# FROM V$DATAFILE;
-
NAME UNRECOVERABLE_CHANGE#
-
--------------------------------------------------------------------------- ---------------------
-
/data/data1/ORCL2/datafile/o1_mf_system_3dt1e9op_.dbf 0
-
/data/data1/ORCL2/datafile/o1_mf_sysaux_3ct1e9nb_.dbf 0
-
/data/data1/ORCL2/datafile/o1_mf_undotbs1_3gt1e9qq_.dbf 0
-
/data/data1/ORCL2/datafile/o1_mf_users_3ft1e9qb_.dbf 5383754
-
/data/data1/ORCL2/datafile/o1_mf_example_3et1e9ps_.dbf 0
-
/data/data1/ORCL2/datafile/o1_mf_undotbs2_3ht1e9r1_.dbf 0
-
/data/data1/ORCL2/datafile/o1_mf_example_3at1e9nb_.dbf 0
-
/data/data1/ORCL2/datafile/o1_mf_ax_3bt1e9nb_.dbf 0
3、比較主數據庫和備用數據庫的查詢結果
在兩個查詢結果中比較UNRECOVERABLE_CHANGE#列的值。如果主庫中UNRECOVERABLE_CHANGE#列的值大于備庫中的同一列,則需要將這些數據文件在備庫恢復。
步驟二
將主庫對應的數據文件拷貝至備庫
-
SQL> alter tablespace users begin backup
-
SQL> exit
-
ASMCMD>cp +DATADG/orcl/datafile/users.259.972381717 /tmp
-
$ scp /tmp/users.259.972381717 10.10.60.123:/data/data1/ORCL2/datafile/
-
SQL> alter tablespace users end backup
步驟三
備庫將舊的數據文件rename至新的數據文件
-
SQL> alter database recover managed standby database cancel;
-
SQL> alter system set standby_file_management=manual; #在備庫執行rename操作時,需要此參數為manual
-
SQL> alter database rename file '/data/data1/ORCL2/datafile/o1_mf_users_3ft1e9qb_.dbf' to '/data/data1/ORCL2/datafile/users.259.972381717';
-
SQL> alter system set standby_file_management=auto;
-
SQL> alter database recover managed standby database using current logfile disconnect from session;
之后就可以在備庫查詢到實例表DEMO
-
SQL> select count(1) from demo;
-
COUNT(1)
-
----------
-
101000
對于這種情況,在12.1版本中,RMAN提供了一種便捷的方式讓我們不需要在主庫上進行數據文件的備份傳輸而可以在備庫使用 restore database (or datafile ) from service去從主庫進行恢復。
當然,Oracle的RMAN是足夠聰明的:如果數據文件是正常的狀態,RMAN可以根據它們的數據文件頭進行跳躍恢復。如果,由于nologging操作導致某些塊被標記為損壞的,那么這部分數據文件就是需要恢復的,然后怎么辦?在恢復命令中有FORCE選項。但我們可能并不需要它。因為有些時候數據文件是同步的,實時日志應用進程還是在運行的。這個時候,為了恢復,我們需要停止應用。
一旦我們停止了應用,那么我們就不需要執行RESOTORE DATABASE FORCE操作,因為現在數據文件的狀態是過舊的,就算你不加FORCE選項RMAN也是不會跳過這些數據文件的。
步驟一
備庫關掉實時日志應用,并開啟至mount狀態。
-
SQL> alter database recover managed standby database cancel;
-
SQL> shutdown immediate
-
Database closed.
-
Database dismounted.
-
ORACLE instance shut down.
-
SQL> startup mount
-
ORACLE instance started
步驟二
備庫登陸RMAN,使用restore database (or datafile ) from service進行恢復
-
RMAN> restore database from service 'primary_db'; #這里的primary_db,為備庫至主庫的tns連接串的別名
-
Starting restore at 2018-05-03 17:00:35
-
using target database control file instead of recovery catalog
-
allocated channel: ORA_DISK_1
-
channel ORA_DISK_1: SID=29 device type=DISK
-
channel ORA_DISK_1: starting datafile backup set restore
-
channel ORA_DISK_1: using network backup set from service primary_db
-
channel ORA_DISK_1: specifying datafile(s) to restore from backup set
-
channel ORA_DISK_1: restoring datafile 00001 to /data/data1/ORCL2/datafile/o1_mf_system_02t1t9ck_.dbf
-
channel ORA_DISK_1: restore complete, elapsed time: 00:00:25
-
channel ORA_DISK_1: starting datafile backup set restore
-
channel ORA_DISK_1: using network backup set from service primary_db
-
channel ORA_DISK_1: specifying datafile(s) to restore from backup set
-
channel ORA_DISK_1: restoring datafile 00003 to /data/data1/ORCL2/datafile/o1_mf_sysaux_03t1t9d3_.dbf
-
channel ORA_DISK_1: restore complete, elapsed time: 00:00:15
-
channel ORA_DISK_1: starting datafile backup set restore
-
channel ORA_DISK_1: using network backup set from service primary_db
-
channel ORA_DISK_1: specifying datafile(s) to restore from backup set
-
channel ORA_DISK_1: restoring datafile 00004 to /data/data1/ORCL2/datafile/o1_mf_undotbs1_04t1t9di_.dbf
-
channel ORA_DISK_1: restore complete, elapsed time: 00:00:02
-
channel ORA_DISK_1: starting datafile backup set restore
-
channel ORA_DISK_1: using network backup set from service primary_db
-
channel ORA_DISK_1: specifying datafile(s) to restore from backup set
-
channel ORA_DISK_1: restoring datafile 00006 to /data/data1/ORCL2/datafile/o1_mf_users_05t1t9dm_.dbf
-
channel ORA_DISK_1: restore complete, elapsed time: 00:00:15
-
Finished restore at 2018-05-03 17:01:34
當然要記得去起庫并開啟實時日志應用進程!
而在12.2中,Oracle提供了一種更方便的方式去進行恢復主庫會將未記錄的塊的列表發送至備庫,并記錄在備庫控制文件中,我們可以從備庫的v$nonlogged_block這個視圖查看到相關信息。不需要發送主庫的整個數據文件,而是在RMAN執行一個簡單的命令來恢復它們:
RECOVER DATABASE NONLOGGED BLOCK
步驟一
停止備庫實時日志應用
-
SQL> alter database recover managed standby database cancel;
步驟二
備庫登陸RMAN執行
RECOVER DATABASE NONLOGGED BLOCK
注意:執行此步驟前請確認主備庫的log_archive_config參數已經設置
-
RMAN> recover database nonlogged block;
-
Starting recover at 2018-05-03 14:54:22
-
using target database control file instead of recovery catalog
-
allocated channel: ORA_DISK_1
-
channel ORA_DISK_1: SID=56 device type=DISK
-
starting recovery of nonlogged blocks
-
List of Datafiles
-
=================
-
File Status Nonlogged Blocks Blocks Examined Blocks Skipped
-
---- ------ ---------------- --------------- --------------
-
1 OK 0 0 107519
-
3 OK 0 0 262399
-
4 OK 0 0 149759
-
5 OK 0 0 31999
-
6 OK 0 0 42239
-
7 OK 0 16707 21532
-
8 OK 0 0 12799
-
9 OK 0 0 76799
-
18 OK 0 0 33279
-
19 OK 0 0 57599
-
20 OK 0 0 24959
-
21 OK 0 0 33279
-
22 OK 0 0 51199
-
23 OK 0 0 12799
-
29 OK 0 0 1310719
-
30 OK 0 0 12799
-
31 OK 0 0 33279
-
32 OK 0 0 52479
-
33 OK 0 0 923519
-
34 OK 0 16822 8777
-
35 OK 0 0 12799
-
37 OK 0 0 24959
-
Details of nonlogged blocks can be queried from v$nonlogged_block view
-
recovery of nonlogged blocks complete, elapsed time: 00:00:08
-
Finished recover at 2018-05-03 14:54:32
最后別忘了開啟實時日志應用進程。
綜上來看,12.2中這個特性在數據倉庫等一些場景是可以嘗試的。以往我們開啟force logging造成大量的redo日志并且影響一部分dml語句的執行效率。在12.2我們可以嘗試使用nonlogging操作去節省大量數據插入的時間,然后在系統空閑時間進行備庫恢復操作。但是注意這種操作也存在弊端,這樣你的備庫的可用性就大大降低了。凡事總有取舍!
| 作者簡介
陳康,沃趣科技數據庫技術專家
主要參與公司產品實施、測試、維護以及優化。