Tag Archives: reboot

RAC节点频繁重启出现ORA-29702

数据库的Oracle 10204 RAC for Windows出现频繁节点重启的问题。 从告警日志看,当前节点的重启一般发生在节点刚启动或关闭时: Thu May 03 17:22:45 2012 cluster interconnect IPC version:Oracle 9i Winsock2 TCP/IP IPC IPC Vendor 0 proto 0 Version 0.0 PMON started WITH pid=2, OS id=1616 DIAG started WITH pid=3, OS id=120 PSP0 started … Continue reading

Posted in BUG | Tagged , , , , , | Leave a comment

AIX系统谨慎使用reboot命令

在客户一次停机维护中,发现了这个问题。 环境是ORACLE 10G RAC for AIX6,使用了HACMP管理共享磁盘。 在停机维护时间段内需要重启主机,当关闭了数据库和CLUSTER后,节点1使用reboot命令重启操作系统,等了很长时间,系统仍然没有启动的迹象,不得以到机房中检查,发现服务器处于关机状态。 手工启动服务器后,发现HACMP启动报错,原因是/etc/snmpdv3.conf文件被清空。将另外节点的文件拷贝到当前节点上,HACMP和RAC环境顺利启动。 而节点2同样采用reboot操作,同样服务器没有自动重启而只是关机,手工启动后发现ORACLE_HOME所在盘出现错误,必须要执行fsck命令,结果检查出几个不一致的块,并且丢失了一些文件,好在出问题的都是Oracle产生的trace文件,fsck结束后该盘顺利挂载。 特意检查了一下reboot命令,发现这个命令在单用户模式下是重启服务器,而多用户模式下,该命令只是关机,而且可能会导致文件系统的损坏。 正确的重启方式是shutdown –Fr,随后又进行了两次重启,都采用了shutdown –Fr方式,没有碰到任何问题。

Posted in OPERATING SYSTEM | Tagged , , | Leave a comment