1. 程式人生 > >AIX報錯0506-342 無法掛載分區問題解決

AIX報錯0506-342 無法掛載分區問題解決

故障現象: 一臺p550 aix系統主機

故障現象:

一臺P550 AIX系統主機,啟動後發現數據分區沒有掛載上,手動掛載提示如下錯誤

#mount /data

Replaying log for /dev/lv_tdprd_bak.mount:
0506-324 Cannot mount /dev/lv_tdprd_bak on /data: The media is not formatted or the format is not correct.
0506-342 The superblock on /dev/datavg is dirty. Run a full fsck to fix.

查看系統日誌如下:

# errpt
A6DF45AA 0215180108 I O RMCdaemon The daemon is started.


B38E3397 0215175908 U S SYSDUMP 先前的系統轉儲信息
C0AA5338 0215175808 U S SYSDUMP 系統轉儲
9D035E4D 0215175108 P S SYSVMM 數據存儲中斷,處理器
9DBCFDEE 0215175908 T O errdemon 記錄錯誤日誌打開
B6DB68E0 0215043408 I O SYSJ2 FILE SYSTEM RECOVERY REQUIRED
49A83216 0215030208 T H hdisk2 磁盤操作錯誤
6926ECA8 0215030108 I O SYSJ2 META-DATA I/O ERROR

613E5F38 0215030108 P H LVDD LVM 檢測到 I/O 錯誤
425BDD47 0215030108 P H hdisk2 磁盤操作錯誤

故障原因:

由於AIX重啟時無法正常重啟,強制重啟後出現如上錯誤。這是因為強制關機造成了系統分區的損壞,顯示“The media is not formatted or the format is not correct”錯誤,導致分區無法正常掛載。

解決辦法:

執行fsck對磁盤分區進行修復

#fsck -p /data

** Phase 1 - Check Blocks and Sizes
....
** Phase 6b - Salvage Block Map


-1 blocks missing
-1 blocks missing
Superblock is marked dirty (FIXED)
1922574 files 375776584 blocks 46344568 free
***** Filesystem was modified *****

修復成功後重新掛載分區,問題解決。

文件系統無法mount的問題

故障現象

# oslevel -r
5200-04

# lsvg
rootvg
datavg

#lspv
hdisk0 0054338ee0b6f496 rootvg active
hdisk1 0054338efa398c64 datavg active
# lsvg -l datavg
web:
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
web jfs 100 100 1 open/syncd /ws
loglv00 jfslog 1 1 1 open/syncd N/A
data jfs2 284 284 1 closed/syncd /data
loglv01 jfs2log 1 1 1 closed/syncd N/A

# mount /data
重新播放 /dev/data 的日誌。
mount: 0506-324 不能將 /dev/data2 安裝到 /data2:媒體未格式化或格式不正確。
0506-342 /dev/data2 的超級塊有錯誤,運行完整的 fsck 以修訂。

查看錯誤日誌表明hdisk1損壞.

# errpt

A6DF45AA 0215180108 I O RMCdaemon The daemon is started.
B38E3397 0215175908 U S SYSDUMP 先前的系統轉儲信息
C0AA5338 0215175808 U S SYSDUMP 系統轉儲
9D035E4D 0215175108 P S SYSVMM 數據存儲中斷,處理器
9DBCFDEE 0215175908 T O errdemon 記錄錯誤日誌打開
B6DB68E0 0215043408 I O SYSJ2 FILE SYSTEM RECOVERY REQUIRED
49A83216 0215030208 T H hdisk2 磁盤操作錯誤
6926ECA8 0215030108 I O SYSJ2 META-DATA I/O ERROR
613E5F38 0215030108 P H LVDD LVM 檢測到 I/O 錯誤
425BDD47 0215030108 P H hdisk2 磁盤操作錯誤

解決步驟

由於datavg裏有2個文件系統,/ws文件系統可以mount,因此先備份此文件系統數據至安全處,然後按如下步驟進行:

1 運行fsck修復

# fsck /data

****************
當前卷是:/dev/data
**階段 1 — 檢查塊、文件/目錄和目錄條目
fsck0507-089 /dev/rdata 時發生不可恢復的錯誤。無法繼續。
fsck0507-039 在訪問文件系統(11736010956816384-1)時發生嚴重錯誤(-10015-1)。
fsck0506-042 執行模塊“/sbin/helpers/jfs2/fsck”失敗。

# mount /data
重新播放 /dev/data 的日誌。
mount: 0506-324 不能將 /dev/data2 安裝到 /data2:媒體未格式化或格式不正確。
0506-342 /dev/data2 的超級塊有錯誤,運行完整的 fsck 以修訂。

2 超級塊修復

Recovering superblock errors

If you receive one of the following errors from the fsck or mount commands, the problem may be a corrupted superblock.

fsck: Not an AIX4 file system

fsck: Not an AIXV4 file system

fsck: Not a recognized file system type

0506-342 The superblock is dirty. Run a full fsck to fix.

mount: invalid argument

The backup superblock can be copied over the primary superblock via one of these commands:

dd count=1 bs=4k skip=31 seek=1 if=/dev/lv00 of=/dev/lv00 (JFS)

dd count=1 bs=4k skip=15 seek=8 if=/dev/lv00 of=/dev/lv00 (JFS2) (Version

5 only)

fsck -p /dev/lv00 (works for both JFS and JFS2)

Once the copying over is completed, check the integrity of the file system by issuing:

fsck /dev/lv00

In many cases, copying the backup superblock to the primary superblock will recover the file system. If this does not work, you will have to recreate the file system and restore the data from a backup.

3 Formats a logical volume

# logform /dev/loglv01
logform: destroy /dev/rloglv01 (y)?y

# fsck /data

****************
當前卷是:/dev/data
**階段 1 — 檢查塊、文件/目錄和目錄條目
fsck0507-089 /dev/rdata 時發生不可恢復的錯誤。無法繼續。
fsck0507-039 在訪問文件系統(11736010956816384-1)時發生嚴重錯誤(-10015-1)。
fsck0506-042 執行模塊“/sbin/helpers/jfs2/fsck”失敗。

# mount /data
重新播放 /dev/data 的日誌。
mount: 0506-324 不能將 /dev/data2 安裝到 /data2:媒體未格式化或格式不正確。
0506-342 /dev/data2 的超級塊有錯誤,運行完整的 fsck 以修訂。

4 恢復備份的數據

客戶的系統日誌裏已經表明此datavg的硬盤已經壞了,由以上幾步都無法解決問題,因此只能換新盤並重新建立/data文件系統,恢復備份的數據.客戶50G的數據大約有3G的無法恢復,只能客戶自己再手工恢復了(重新輸入數據).如果平時沒有做好數據備份那只能哭了,因此一定要做好平時的數據備份.

#lspv
hdisk0 000af70d4d50358c rootvg active
hdisk1 000af70dca7aea4d datavg active
hdisk2 000af70dca7ae679 sunvg active
#lsvg -l datavg
datavg:
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
raw1 raw 5 5 1 closed/syncd N/A
loglv00 jfs2log 1 1 1 closed/syncd N/A
fslv00 jfs2 192 192 1 closed/syncd /solaris
lv00 raw 4 4 1 closed/syncd N/A
#mount /solaris
mount: 0506-324 Cannot mount /dev/fslv00 on /solaris: There is a request to a device or address that does not exist.
比較奇怪,以前沒遇到過
errpt,沒有得到有效的信息
/etc/filesystems文件也正常
fsck /solaris的時候發現問題所在了
#fsck /solaris

The current volume is: /dev/fslv00
Open volume exclusive read or write returned, rc = 6
fsck: 0507-289 Device unavailable or locked by another process.
Cannot continue.
原因是被鎖定了,這時才回想起來,昨天同事問了一個varyonvg -s的問題,
從新varyoffvg ,再次varyonvg
#varyoffvg datavg
#varyonvg datavg
#mount /solaris
#df -k
Filesystem 1024-blocks Free %Used Iused %Iused Mounted on
/dev/hd4 180224 110672 39% 2753 4% /
/dev/hd2 2867200 134992 96% 39835 6% /usr
/dev/hd9var 16384 4996 70% 441 11% /var
/dev/hd3 65536 28484 57% 283 2% /tmp
/dev/hd1 16384 15756 4% 87 3% /home
/proc - - - - - /proc
/dev/hd10opt 114688 4668 96% 2629 10% /opt
/dev/test 327680 326048 1% 5 1% /tst
/dev/fslv00 3145728 1113040 65% 638 1% /solaris
問題解決,
再仔細察看了一下-s參數的作用

-s 使卷組只在系統管理方式中可用。邏輯卷命令能對卷組執行操作,但是不能為輸入或輸出打開邏輯卷。
註:邏輯卷命令也不能讀取或寫入用 -s 標誌聯機的卷組中的邏輯卷。如果邏輯卷命令試圖寫入用 -s 標誌聯機的卷組內的某個邏輯卷(如 chvg mklvcopy),那麽可能顯示錯誤消息,表明它們不能寫入和/或讀取邏輯卷。
在使用-s參數激活卷組的情況下,卷組的lv是出於closed狀態,lvm命令對其操作也是無效的。

For jfs2 , Check and recover file system
The fsck utility was enhanced to also handle JFS2-type file systems. This utility checks the file system for consistency and repairs problems found.

# fsck -V jfs2 /myfs
****************
The current volume is: /dev/lv01
File system is clean.

All observed inconsistencies have been repaired.
If the -V flag is not specified, fsck will figure out the JFS type by the VFS type specified for this file system and work in the assumed way:

# fsck /myfs
****************
The current volume is: /dev/lv01
File system is clean.
All observed inconsistencies have been repaired.


AIX報錯0506-342 無法掛載分區問題解決