利用kfed的repair命令修复asm头块,碰到这个错误。
错误信息如下:
$kfed repair /dev/rhdisk3 KFED-00320: Invalid block num1 = [3], num2 = [1], error = [type_kfbh] |
导致这个错误的原因是由于当前磁盘组的AUSIZE不是默认值1M,而是4M。
对于磁盘组的头块损坏,不知道具体AUSIZE的值的情况,有两个方法,一是通过ASM的告警日志文件,找磁盘组创建时的参数信息:
SUCCESS: CREATE diskgroup oradata external redundancy disk '/dev/rhdisk3', '/dev/rhdisk4', '/dev/rhdisk5', '/dev/rhdisk6', . . . '/dev/rhdisk31', '/dev/rhdisk32' attribute 'au_size'='4M', 'compatible.asm'='11.2', 'compatible.rdbms'='11.2' NOTE: diskgroup resource ora.ORADATA.dg IS online |
另一个方法是直接查看备份块信息。由于不同AUSIZE的值,备份块位置不同,不过通过几次尝试就肯定可以找到,备份块的位置是POWER(2, N) – 2,对于4M的AUSIZE,则备份块的位置2046:
$kfed READ /dev/rhdisk3 blkn=2046|more kfbh.endian: 0 ; 0x000: 0x00 kfbh.hard: 130 ; 0x001: 0x82 kfbh.type: 1 ; 0x002: KFBTYP_DISKHEAD kfbh.datfmt: 1 ; 0x003: 0x01 kfbh.block.blk: 1022 ; 0x004: blk=1022 kfbh.block.obj: 2147483648 ; 0x008: disk=0 kfbh.check: 2398806058 ; 0x00c: 0x8efae02a kfbh.fcn.base: 0 ; 0x010: 0x00000000 kfbh.fcn.wrap: 0 ; 0x014: 0x00000000 kfbh.spare1: 0 ; 0x018: 0x00000000 kfbh.spare2: 0 ; 0x01c: 0x00000000 kfdhdb.driver.provstr: ORCLDISK ; 0x000: LENGTH=8 kfdhdb.driver.reserved[0]: 0 ; 0x008: 0x00000000 kfdhdb.driver.reserved[1]: 0 ; 0x00c: 0x00000000 kfdhdb.driver.reserved[2]: 0 ; 0x010: 0x00000000 kfdhdb.driver.reserved[3]: 0 ; 0x014: 0x00000000 kfdhdb.driver.reserved[4]: 0 ; 0x018: 0x00000000 kfdhdb.driver.reserved[5]: 0 ; 0x01c: 0x00000000 kfdhdb.compat: 186646528 ; 0x020: 0x0b200000 kfdhdb.dsknum: 0 ; 0x024: 0x0000 kfdhdb.grptyp: 1 ; 0x026: KFDGTP_EXTERNAL kfdhdb.hdrsts: 3 ; 0x027: KFDHDR_MEMBER kfdhdb.dskname: ORADATA_0000 ; 0x028: LENGTH=12 kfdhdb.grpname: ORADATA ; 0x048: LENGTH=7 kfdhdb.fgname: ORADATA_0000 ; 0x068: LENGTH=12 kfdhdb.capname: ; 0x088: LENGTH=0 kfdhdb.crestmp.hi: 32970512 ; 0x0a8: HOUR=0x10 DAYS=0x18 MNTH=0x5 YEAR=0x7dc kfdhdb.crestmp.lo: 941082624 ; 0x0ac: USEC=0x0 MSEC=0x1f2 SECS=0x1 MINS=0xe kfdhdb.mntstmp.hi: 32971030 ; 0x0b0: HOUR=0x16 DAYS=0x8 MNTH=0x6 YEAR=0x7dc kfdhdb.mntstmp.lo: 97022976 ; 0x0b4: USEC=0x0 MSEC=0x21d SECS=0x1c MINS=0x1 kfdhdb.secsize: 512 ; 0x0b8: 0x0200 kfdhdb.blksize: 4096 ; 0x0ba: 0x1000 kfdhdb.ausize: 4194304 ; 0x0bc: 0x00400000 kfdhdb.mfact: 454272 ; 0x0c0: 0x0006ee80 kfdhdb.dsksize: 51200 ; 0x0c4: 0x0000c800 kfdhdb.pmcnt: 2 ; 0x0c8: 0x00000002 kfdhdb.fstlocn: 1 ; 0x0cc: 0x00000001 kfdhdb.altlocn: 2 ; 0x0d0: 0x00000002 kfdhdb.f1b1locn: 2 ; 0x0d4: 0x00000002 kfdhdb.redomirrors[0]: 0 ; 0x0d8: 0x0000 kfdhdb.redomirrors[1]: 0 ; 0x0da: 0x0000 |
如果找遍ASM都无法找到备份头块,那么你的版本是10.2.0.4及以下版本,Oracle没有在ASM保存头块的备份。KFED的REPAIR功能是11g才提供的,因此你根本不会碰到文章里面提到的错误,不过坏消息是没有一个简单的办法来恢复ASM磁盘头了。
确定ASM的AUSIZE后,通过下面的命令修复ASM:
$kfed repair /dev/rhdisk3 aus=4194304 |