1. 程式人生 > >安裝12.1.0.2 叢集GRID/GI, 執行root.sh 指令碼失敗的案例

安裝12.1.0.2 叢集GRID/GI, 執行root.sh 指令碼失敗的案例

在Linux系統上安裝12.1.0.2 叢集GRID/GI軟體,節點2執行root.sh失敗,螢幕的錯誤資訊: OLR initialization - successful 2015/12/15 13:16:55 CLSRSC-507: The root script cannot proceed on this node rac2 because either the first-node operations have not completed on node rac1 or there was an error in obtaining the status of the first-node operations. 以上錯誤說明節點2無法確認節點1安裝狀態是否完成。Root.sh是如果來確認節點1安裝是否完成呢?需要檢查日誌: $GRID_HOME>/cfgtoollogs/crsconfig/rootcrs_rac2_2015-12-18_09-41-53PM.log 2015-12-18 21:42:39: Trying to get the value of key: SYSTEM.rootcrs.checkpoints.firstnode in OCR. 2015-12-18 21:42:39: setting ORAASM_UPGRADE to 1 2015-12-18 21:42:39: Check the existence of key pair with key name: SYSTEM.rootcrs.checkpoints.firstnode in OCR. 2015-12-18 21:42:39: setting ORAASM_UPGRADE to 1 2015-12-18 21:42:39: Invoking "/u01/gridsoft/12.1.0/bin/cluutil -exec -keyexists -key checkpoints.firstnode" 2015-12-18 21:42:39: trace file=/u01/gridbase/crsdata/rac2/crsconfig/cluutil9.log 2015-12-18 21:42:39: Running as user grid: /u01/gridsoft/12.1.0/bin/cluutil -exec -keyexists -key checkpoints.firstnode 2015-12-18 21:42:39: s_run_as_user2: Running /bin/su grid -c ' echo CLSRSC_START; /u01/gridsoft/12.1.0/bin/cluutil -exec -keyexists -key checkpoints.firstnode ' 2015-12-18 21:42:39: Removing file /tmp/filexr1WwO 2015-12-18 21:42:39: Successfully removed file: /tmp/filexr1WwO 2015-12-18 21:42:39: pipe exit code: 256
2015-12-18 21:42:39: /bin/su exited with rc=1 2015-12-18 21:42:39: oracle.ops.mgmt.rawdevice.OCRException: PROC-32: Cluster Ready Services on the local node is not running Messaging error [gipcretConnectionRefused] [29] 2015-12-18 21:42:39: Cannot get OCR key with CLUUTIL, try using OCRDUMP. 2015-12-18 21:42:39: Check OCR key using ocrdump
2015-12-18 21:42:54: ocrdump output: PROT-302: Failed to initialize ocrdump 2015-12-18 21:42:54: The key pair with keyname: SYSTEM.rootcrs.checkpoints.firstnode does not exist in OCR. 以上資訊說明節點2首先執行cluutil -exec -keyexists -key checkpoints.firstnode命令來檢視OCR中的key: SYSTEM.rootcrs.checkpoints.firstnode,失敗後又嘗試執行OCRDUMP命令,但是OCRDUMP命令也失敗。接下來分析OCRDUMP命令也失敗的原因: $GRID_BASE/diag/crs/<node>/crs/trace/ocrdump_13146.trc 2015-12-18 21:42:48.098879 :  OCRASM: ASM Error Stack : ORA-29701: unable to connect to Cluster Synchronization Service 2015-12-18 21:42:48.098885 :  OCRASM: proprasmo: ASM instance is down. Proceed to open the file in dirty mode.   CLWAL: clsw_Initialize: Error [32] from procr_init_ext   CLWAL: clsw_Initialize: Error [PROCL-32: Oracle High Availability Services on the local node is not running Messaging error [gipcretConnectionRefused] [29]] from procr_init_ext 2015-12-18 21:42:48.101773 :    GPNP: clsgpnpkww_initclswcx: [at clsgpnpkww.c:351] Result: (56) CLSGPNP_OCR_INIT. (:GPNP01201: )Failed to init CLSW-OLR context. CLSW Error (3): CLSW-3: Error in the cluster registry (OCR) layer. [32] [PROCL-32: Oracle High Availability Services on the local node is not running Messaging error [gipcretConnectionRefused] [29]] 2015-12-18 21:42:48.112746 :  OCRASM: proprasmo: Error [13] in opening the GPNP profile. Try to get offline profile 2015-12-18 21:42:48.220769 :  OCRRAW: kgfo_kge2slos error stack at kgfolclcpi1: AMDU-00210: No disks found in diskgroup OCR_VOTING
以上資訊提示無法連線ORA-29701 CSS和PROCL-32 OHASD這些都是正常的,因為節點2叢集沒有啟動,這些錯誤可能會干擾我們分析問題。關鍵的錯誤資訊是AMDU-00210: No disks found in diskgroup OCR_VOTING,也就是說節點2沒有找到ASM disk導致OCRDUMP失敗,因此無法確認節點1安裝的狀態是否完成。接下來我們執行kfed確認ASM disk是否有問題: 節點1檢視disk /dev/raw/raw1 $ /u01/gridsoft/12.1.0/bin/kfed read /dev/raw/raw1 kfbh.endian:                          1 ; 0x000: 0x01 kfbh.hard:                          130 ; 0x001: 0x82 kfbh.type:                            1 ; 0x002: KFBTYP_DISKHEAD <=========disk raw1型別是KFBTYP_DISKHEAD,是正常的asm disk kfbh.datfmt:                          1 ; 0x003: 0x01 kfbh.block.blk:                       0 ; 0x004: blk=0 kfbh.block.obj:              2147483648 ; 0x008: disk=0 kfbh.check:                   420965027 ; 0x00c: 0x19176aa3 kfbh.fcn.base:                        0 ; 0x010: 0x00000000 kfbh.fcn.wrap:                        0 ; 0x014: 0x00000000 ... kfdhdb.vfstart:                     128 ; 0x0ec: 0x00000080  <=========vfstart 值說明這個disk是vote file  kfdhdb.vfend:                       160 ; 0x0f0: 0x000000a0  <=========vfend 值說明這個disk是vote file 節點2檢視disk /dev/raw/raw1 $ /u01/gridsoft/12.1.0/bin/kfed read /dev/raw/raw1 kfbh.endian:                          0 ; 0x000: 0x00 kfbh.hard:                            0 ; 0x001: 0x00 kfbh.type:                            0 ; 0x002: KFBTYP_INVALID<=========節點2上檢視raw1型別是無效的KFBTYP_INVALID kfbh.datfmt:                          0 ; 0x003: 0x00 kfbh.block.blk:                       0 ; 0x004: blk=0 kfbh.block.obj:                       0 ; 0x008: file=0 kfbh.check:                           0 ; 0x00c: 0x00000000 kfbh.fcn.base:                        0 ; 0x010: 0x00000000 kfbh.fcn.wrap:                        0 ; 0x014: 0x00000000 kfbh.spare1:                          0 ; 0x018: 0x00000000 kfbh.spare2:                          0 ; 0x01c: 0x00000000 000000000 00000000 00000000 00000000 00000000  [................]  Repeat 255 times KFED-00322: Invalid content encountered during block traversal: [kfbtTraverseBlock][Invalid OSM block type][][0] 在節點1檢視/dev/raw/raw1顯示disk 型別是KFBTYP_DISKHEAD,並且kfdhdb.vfstart有值,說明raw1在節點1是正常的asm disk,並且是vote disk。但是節點2檢視相同的disk,顯示完全不同的資訊。正常情況下,配置的共享裝置raw1在節點1和節點2看到的資訊應該是一致的,但是這個case中節點1和節點2看到的是不同的資訊,說明共享disk配置是不正確的。 同時,在節點1手動執行OCRDUMP確認key SYSTEM.rootcrs.checkpoints.firstnode是存在的,並且狀態是” SUCCESS” su – root ocrdump /tmp/ocrdump1.out more /tmp/ocrdump1.out [SYSTEM.rootcrs.checkpoints.firstnode] ORATEXT : SUCCESS  最後,修改UDEV配置檔案(/etc/udev/rules.d/99-oracle-asmdevices.rules)後問題解決。

之所以轉載該文件,是因為遇到相同的問題,不過我的問題是共享儲存有問題

先用kfed讀取2個節點的相同共享磁碟,發現內容不一致。

之後使用dd命令清除ASM資訊,再在一個節點上使用fdisk命令對共享儲存進行分割槽,發現另一個節點無法識別到分割槽的資訊。

最終判定共享儲存有問題,刪除共享儲存,再次新增共享儲存,節點A新建分割槽,節點B掃描新的分割槽,可以認為共享儲存功能正常。

相關推薦

安裝12.1.0.2 叢集GRID/GI, 執行root.sh 指令碼失敗案例

在Linux系統上安裝12.1.0.2 叢集GRID/GI軟體,節點2執行root.sh失敗,螢幕的錯誤資訊: OLR initialization - successful 2015/12/15 13:16:55 CLSRSC-507: The root script c

grid軟體,執行root.sh指令碼失敗,解決辦法

原帖地址:http://www.vydbs.com/failed-executing-root-sh-ohasd-start-the-solution/ 在Red Hat 6.2上安裝Oracle grid 11.2.0.1,執行root.sh指令碼的時候出現一些問題,無法啟動ohasd。 由於Redhat

12.1.0.2.0 RAC GI PSU 12.1.0.2.180116

12.1.0.2.180116rac12c01:/home/grid&$ORACLE_HOME/OPatch/opatch lsinv Oracle Interim Patch Installer version 12.2.0.1.12Copyright (c) 2018, Oracle Corpor

【翻譯自mos文章】在RHEL7/OL7上安裝Oracle 12.1.0.2的伺服器端或者客戶端時,報需要"compat-libstdc++"包

在RHEL7/OL7上安裝Oracle 12.1.0.2的伺服器端或者客戶端時,報需要"compat-libstdc++"包 來源於: Installation of 12.1.0.2 Oracle Database Server/Client on RHEL 7/OEL7

Oracle 12.1.0.2 對JSON的支持

使用 lin 1.5 text lob mysq 索引 acl var Oracle 12.1.0.2版本有一個新功能就是可以存儲、查詢、索引JSON數據格式,而且也實現了使用SQL語句來解析JSON,非常方便。JSON數據在數據庫中以VARCHAR2, CLOB或者BLO

aix下oracle 12.1.0.2 asmca不能打開的故障

chown clas srv 無法 password scope acl div 之前 因為要添加一個新的13T磁盤組,所以決定通過asmca處理。 結果輸入asmca之後,沒有反應,前後兩天都是如此。 第三天,IBM的存儲工程師已經把心的MPIO掛上,如果還無法操作,只能

oracle 12c 12.1.0.2.0 BUG 22562145

erro can action fail may seq arc cti -- Wed May 23 17:46:14 2018TT01: Standby redo logfile selected for thread 1 sequence 42251 for desti

oracle 12C ORA-07445 12.1.0.2.0

idt dba summary left col 12c TE fff feedback Mon Jun 11 14:06:23 2018 Exception [type: SIGSEGV, SI_KERNEL(general_protection)] [ADDR:0x0]

Oracle 12.1.0.2 卸載數據庫

ssi his listener sep directory odi ani ted pre 本案例數據庫(12.1.0.2)安裝在文件系統上,因此只需要deinstall 數據庫即可。 前提: (1)關閉數據庫,shutdown immediate; (2)關閉監聽,ls

ArcSDE for Oracle 12.1.0.2 In-Memory元件測試

如今,記憶體資料庫被大家廣泛認可,懂得技術的人都明白,資料從磁碟讀寫肯定比在記憶體中讀寫要慢很多,而且目前也有很多記憶體資料已經有非常成熟的實施經驗,當然,當今資料庫的老大Oracle更加不會無視這個市場,很早就渲染他們Oracle12c的記憶體元件多麼的牛叉,快到不行更是他們經常使用的詞彙。

Oracle 12.1.0.2 對JSON的支援

Oracle 12.1.0.2版本有一個新功能就是可以儲存、查詢、索引JSON資料格式,而且也實現了使用SQL語句來解析JSON,非常方便。JSON資料在資料庫中以VARCHAR2, CLOB或者BLOB進行儲存。Oracle建議使用者在插入JSON資料之前,使用is_json來驗證輸入JSO

12.1.0.2的PDB升級到12.2.0.1的實驗

1. 實驗環境 [[email protected] ~]$ sqlplus / as sysdba SQL*Plus: Release 12.1.0.2.0 Production on Sat Jun 17 10:18:00 2017 Copyright (

Oracle 資料庫和補丁下載地址 12.1.0.2 11.2.0.4 11.2.0.1

Oracle 資料庫軟體和補丁下載地址 12.1.0.2 11.2.0.4 11.2.0.1  AIX Linux Windows平臺 Oracle 資料庫軟體和補丁下載地址、百度雲盤共享  12.1.0.2 11.2.0.4 11.2.0.1  AIX Linux W

aix6.1安裝12.1.0.2rac無法識別共享磁碟的問題

AIX6.1安裝RAC12.1.0.2遇到在GRID安裝圖形介面選擇OCR磁碟處無法識別共享磁碟問題; 排查許可權屬組PVID/no_reserve設定需要檢查等均正常;使用silent模式安裝時,報錯 [INS-30508] Invalid ASM disks.,根據此報

ORACLE RAC升級(12.1.0.1升級至12.1.0.2

檢視當前版本 Crs [[email protected] ~]$ crsctl query crs activeversion Oracle Clusterware active version on the cluster is [12.1.0.1.0] [[email prot

安裝 Bzip2-1.0.2

Bzip2的內容 Bzip2 是塊排序檔案壓縮器,比傳統的gzip生成更高壓縮比的檔案。 安裝下列程式: bunzip2 (link to bzip2), bzcat (link to bzip2), bzcmp, bzdiff, bzegrep, bzfgrep, bzgrep, bzip2, bzip

【RAC】安裝cluster軟體 在節點2執行root.sh指令碼

安裝cluster軟體  在節點2執行root.sh指令碼 報錯如下: Running vipca(silent) for configuring nodeapps /db/oracle/product/10.2.0/crs/jdk/jre//bin/java: error

安裝Oozie4.1.0-cdh5.5.2

hadoop oozie安裝oozie經歷了好長的時間,先是源碼包,但是放棄了。。。然後就是安裝的這個CDH版本的,弄了好久,經常報各種錯誤。最後整理出來這篇。先對文件進行下載:這裏使用的是CDH版本的,免編譯,看著編譯的過程就夠了。下載地址:http://archive.cloudera.com/cdh5/

Oracle 12c(12.1.0.5)OEM server agent 安裝配置

stat oem www 忽略 符號 cin .com 至少 打開 註意: 此文檔為生產上操作文檔,省略了IP,oracle用戶server,agent 端至少需要sudo,ping,ssh,創建目錄權限。 一、安裝要求 1.1. 系統情況一覽 IP 數據庫

CentOS7.2 安裝redis 3.0.6叢集

1.環境確認 a.系統版本檢視 [[email protected] ~]$ cat /etc/redhat-release CentOS Li