CRS-0184 Cannot communicate with the CRS daemon

發布時間：2020-08-11 04:39:46 來源：ITPUB博客閱讀：255 作者：賀子_DBA時代欄目：關系型數據庫

oracle rac遇到了問題：報錯：

CRS-4535: Cannot communicate with Cluster Ready Services

CRS-4534: Cannot communicate with Event Manager‘

問題分析：由于網站上云，oracle有一套rac從idc機房撤回到了公司本地，，按著步驟關閉了數據庫，領導關閉的，只是su - oracle 然后shu immediate,關閉了oracle實例，asm實例則沒有關閉，然后搬到公司按著原來的位置插好了網線并嘗試啟動，我只嘗試著把ora010的實例起來了，然后就不管了，后來要用這套庫的時候，我才看ora102的狀態，才意識到數據庫實例和asm實例都沒有啟動，于是嘗試啟動，但是報錯如下：

首先先說下oracle rac服務器需要重啟的時候，oracle相關資源關閉的的流程：

方法一：

1）關閉oracle實例

[grid@ora102 ~]$ srvctl stop database -d ORCL

2）關閉asm實例

[grid@ora102 ~]$ srvctl stop asm -n ora102

[grid@ora102 ~]$ srvctl stop asm -n ora101

如果報錯就強制關閉，如下

[root@ora101 bin]# ./srvctl stop asm

PRCR-1065 : Failed to stop resource ora.asm

CRS-2529: Unable to act on 'ora.asm' because that would require stopping or relocating 'ora.DATA.dg', but the force option was not specified

加上強制關閉即可：

[grid@ora101 ~]$ srvctl stop asm -f

[grid@ora101 ~]$ srvctl status asm

ASM is not running.

3)最后還需要關閉crs

[root@ora101 bin]# ./crsctl stop cluster -all

方法二：

1)關閉oracle實例,兩個節點都執行

su - oracle

sqlplus / as sysdba

shu immediate

2）關閉asm實例，兩個節點都執行

su - grid

sqlplus / as sysasm

shu immediate

sqlplu abort強制關閉

[grid@ora101 ~]$ sqlplus / as sysasm

SQL> shu abort

ASM instance shutdown

3)最后還需要關閉crs

[root@ora101 bin]# ./crsctl stop cluster -all

檢查數據庫和asm實例的狀態，以及crs的狀態

[grid@ora101 ~]$ srvctl status asm

ASM is running on ora101,ora102

[grid@ora101 ~]$ srvctl status database -d ORCL

Instance orcl1 is not running on node ora101

Instance orcl2 is not running on node ora102

好了言歸正傳，繼續說遇到的問題。

[root@ora102 ~]# su - grid

[grid@ora102 ~]$ sqlplus / as sysasm

SQL*Plus: Release 11.2.0.4.0 Production on Wed Nov 29 22:28:20 2017

Connected to:

Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production

With the Real Application Clusters and Automatic Storage Management options

SQL> startup

報錯。。。

在ora102節點上檢查集群服務的狀態，報錯

[root@ora102 ~]# /u01/app/11.2.0/grid/bin/crs_stat -t

CRS-0184: Cannot communicate with the CRS daemon.

根據上面報錯，可以判斷出crs是有問題。

嘗試啟動也報錯：注意需要使用root

[root@ora102 ~]# /u01/app/11.2.0/grid/bin/crsctl start crs

CRS-4640: Oracle High Availability Services is already active

CRS-4000: Command Start failed, or completed with errors.

正常情況是：

[root@ora102 bin]# /u01/app/11.2.0/grid/bin/crsctl start crs

CRS-4123: Oracle High Availability Services has been started.

檢查crs服務，發現有問題：

[grid@ora102 ~]$ crsctl check crs

CRS-4638: Oracle High Availability Services is online

CRS-4535: Cannot communicate with Cluster Ready Services

CRS-4530: Communications failure contacting Cluster Synchronization Services demon

CRS-4534: Cannot communicate with Event Manager‘

然后節點ora102查看ip情況，發現vip和scan ip都已經不在，vip在節點ora101上了，可以判斷出節點ora102已經脫離了集群。

查看ip配置。。。

[root@ora102 ~]# cat /etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.0.44 ora101

192.168.0.45 ora102

192.168.0.46 ora101-vip

192.168.0.47 ora102-vip

192.168.0.48 ora-cluster-scan

172.168.56.101 ora101-priv

172.168.56.102 ora102-priv

查看節點的ip情況，發現只有物理ip（192.168.0.45 ）了。

[root@ora102 ~]# ip a

1: lo: mtu 65536 qdisc noqueue state UNKNOWN qlen 1

link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

inet 127.0.0.1/8 scope host lo