Tag Archives: ASM

ORA-600(ksxp_rm_check0)错误

客户11.2.0.3 RAC的ASM实例出现ORA-600[ksxp_rm_check0]错误。 错误信息如下: Tue Jul 02 19:22:59 2013 Errors IN file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_6488960.trc (incident=165804): ORA-04031: unable TO allocate 3000 bytes OF shared memory ("shared pool","select INSTANCE_NUMBER , IN…","sga heap(1,0)","call") USE ADRCI OR Support Workbench TO package the incident. See Note 411.1 … Continue reading

Posted in BUG | Tagged , , , , , , , , | Leave a comment

11.2.0.3 ASM实例出现ORA-4031导致数据库归档失败

客户的11.2.0.3 RAC数据库出现了归档失败的情况,导致单个实例出现HANG死的状况。 检查错误信息发现: Tue Jul 02 16:49:13 2013 ARC1: Error 19504 Creating archive log file TO ‘+DATA02’ ARCH: Archival stopped, error occurred. Will continue retrying ORACLE Instance orcl1 – Archival Error ORA-16038: log 14 SEQUENCE# 68244 cannot be archived ORA-19504: … Continue reading

Posted in BUG | Tagged , , , , , , , , | Leave a comment

ORA-7445(kgskhighthreshold)错误

10.2.0.4 RAC环境的ASM实例出现这个ORA-7445错误。 错误信息为: Fri DEC 3 19:49:49 2010 Errors IN file /opt/app/oracle/admin/+ASM/bdump/+asm2_lck0_19876.trc: Fri DEC 3 19:50:44 2010 Errors IN file /opt/app/oracle/admin/+ASM/bdump/+asm2_ckpt_19863.trc: ORA-07445: exception encountered: core dump [kgskhighthreshold()+32] [SIGSEGV] [Address NOT mapped TO object] [0x0000001F6] [] [] Fri DEC 3 19:51:00 … Continue reading

Posted in BUG | Tagged , , , , , , | Leave a comment

ORA-600(kfgFinalize_2)错误

11.2.0.1的ASM出现ORA-600[kfgFinalize_2]错误。 错误信息为: Fri Jun 17 09:59:51 2011 NOTE: No asm libraries found IN the system * instance_number obtained FROM CSS = 2, checking FOR the existence OF node 0… * node 0 does NOT exist. instance_number = 2 Starting ORACLE … Continue reading

Posted in BUG | Tagged , , , , , | Leave a comment

ORA-600(KSFD_DECAIOPC)和ORA-600(kfioReapIO00)错误

由于共享磁盘问题导致的两个ORA-600错误。 客户的10.2.0.4 RAC for Linux X86-64,在告警日志中出现了大量的错误信息: Tue Apr 24 16:15:04 2012 Errors IN file /u01/admin/orcl/udump/orcl1_ora_10437.trc: ORA-00600: internal error code, arguments: [KSFD_DECAIOPC], [0xFC213CBF0], [], [], [], [], [], [] ORA-07445: exception encountered: core dump [<0x9293a0>] [SIGSEGV] [Address NOT mapped TO object] … Continue reading

Posted in BUG | Tagged , , , , , , , , , | Leave a comment

ODA之测试体验

测试了将近一周的ODA,关于ODA的技术文章也写了几篇,简单总结一下使用ODA的一点心得。 以前接触的一体机并不多,EXADATA虽然有过几次接触,但是与这次可以全方位的测试ODA相比就完全不值得一提了。 总的来说ODA给我的最大感触就是简便:把ODA插上电源和网线之后,唯一需要的配置就是通过ILOM配置一下ODA的网络,只需要把安装程序上传到服务器,通过ODA提供的命令进行解压,然后就是一键式安装。整个安装过程在一个小时左右。加上配置网络和上传软件的时间,整个RAC环境的部署也不会超过半天。而一般情况下,安装一套RAC,即使是熟手也没有十足把握在一天之内搞定,毕竟网络配置、存储设置、系统包的缺失甚至是BUG都可能会导致RAC环境的总体安装时间延迟,而ODA则完全避免了上面的问题。 此外无论是一键式卸载还是一键式升级,都已经将DBA烦琐的工作简化到了极致,在加上ILOM实现的无人值守功能,更是将ODA的简单、方便的特点发挥的淋漓尽致。 ODA的性能虽然不可能像EXADATA那样把执行效率以数量级的方式提高,但是无论是ORION还是SWINGBENCH的测试来看,ODA对于大部分中小型应用应该是足够支撑的。 说了半天的优点,最后说一下ODA的不足之处。首先不灵活性不够,虽然安装配置的简化和配置的灵活性存在一定的冲突,但是这并不妨碍ODA给高级DBA多一些定制的空间。其他的方面到还可以接受,就是ODA的ASM的3重镜像配置这一点是最让人头痛的。对于ODA来说,几乎没有可能改变这一点。除非是不使用ODA的一键式安装,而安全自己安装CLUSTER和RAC,而如此一来,ODA提供的简便性又荡然无存了。此外ODA另外一个致命的缺点,扩展性不足。虽然ODA目前支持外接存储,但是默认的安装配置是不支持将RAC部署到外部存储上的。当然通过将存储添加到ASM磁盘组中应该也可以实现ODA使用外部存储的功能,但是这是ODA策略所不允许的。除了磁盘空间外,CPU、内存资源也都是无法扩展的,更重要的是,ODA没有办法扩展第三个节点,也就是说ODA所能承载的最大压力是固定的。随着业务量的增长和历史数据的增加,ODA没有能力通过添加硬件资源来进行扩展。 因此,个人认为无法扩展是ODA的致命伤,但不是Oracle,因为根据Oracle的定义,总数据量小于3T的使用ODA,而大于3T的则应该使用EXADATA。那么根据这个观点,利用ODA作为EXADATA的热身产品,熟悉一下Oracle的一体机也是一个靠谱的选择。

Posted in ORACLE | Tagged , , , , , , | Leave a comment

ODA的高可用冗余

ODA作为一个一体机,在很多硬件和软件上进行了冗余,避免单点故障对系统的可用性造成影响。 ODA的硬件包括2个Sun Fire X 4370M2,通过RAC或RAC ONE NODE架构实现服务器的冗余; 每个服务器上包含两个冗余热切换的风扇,任何一个风扇异常不会导致系统故障; 服务器包含两组电源,任意一个电源损坏或任意一个电源无法供电都不会对系统造成影响; 每个服务器上集成了10个网络接口,其中两个网络接口用来绑定冗余进行内部连接(PRIVATE IP),两个网络接口绑定用来提供外部客户端访问(PUBLIC IP),两个10G网络接口绑定对外提供网络访问;另外4个接口绑定为两个网络接口提供访问; 两个服务器上按照了20块600G硬盘和4块73G SSD固体硬盘。这两部分磁盘通过ASM的三种镜像进行保护; 共享磁盘和服务器之间存在2个缓冲芯片,每个芯片单独连接到每个服务器上,从而避免单点问题。 可以看到,通过硬件上对所有的组件进行冗余,避免了单点问题;利用RAC和ASM的特性对服务器和磁盘进行保护,从而彻底避免了单点故障对于系统可用性的影响。 对于ODA的硬件和软件冗余进行了简单的测试: 无论是PRIVATE IP和PUBLIC IP都使用两个网卡进行了绑定,手工关闭任意一个网卡,都不会影响RAC环境的正常运行; 将其中一个电源的插头拔下,ODA运行正常; 由于ASM部署了3重镜像,因此通过DD命令将任意两块盘清0,并没有造成数据库的崩溃,只是从ASM中看到,这两块盘的状态异常。通过简单的ASM磁盘组操作,将这两块盘删除并重新添加到磁盘组中,磁盘组的状态恢复正常。在磁盘的选择上,有一块盘是包含VOTING仲裁盘,整个过程ODA正常运行。 简单总结一下,ODA通过硬件和软件实现了冗余和高可用性,避免了任何一个环境上的单点故障,系统可用性很高。

Posted in ORACLE | Tagged , , , , , , | Leave a comment

ASM实例出现ORA-4031错误导致实例崩溃

数据库的ASM实例出现了ORA-4031错误,导致了数据库实例的崩溃。 详细的错误信息为: Wed Jul 25 08:03:45 2012 Errors IN file /u01/app/oracle/diag/rdbms/orcl/ORCL1/trace/ORCL1_asmb_34668994.trc (incident=808023): ORA-04031: unable TO allocate 3432 bytes OF shared memory ("shared pool","unknown object","sga heap(1,0)","ASM file") Incident details IN: /u01/app/oracle/diag/rdbms/orcl/ORCL1/incident/incdir_808023/ORCL1_asmb_34668994_i808023.trc Wed Jul 25 08:03:47 2012 Trace dumping IS performing id=[cdmp_20120725080347] … Continue reading

Posted in BUG | Tagged , , , , , , , , | Leave a comment

ODA一键式清除

测试了一下ODA的一键式清除,果然是“破坏”比建设更容易,整个操作比本来已经非常简单的ODA安装还要简化得多。 很多DBA都有RAC的安装经验,但是真正进行过RAC环境清除的恐怕并不是很多。虽然Oracle提供了脚本来删除节点或清除RAC环境,但是真正做起来还是有些烦琐的,而且如果不小心,很容易造成部分信息没有彻底清除,从而给RAC的再次安装留下隐患。 而ODA提供的一键式清除功能极大的简化了RAC环境清除的过程,全程只需要执行一个命令,在任意一个节点上执行: # cd /opt/oracle/oak/onecmd # ./cleanupDeploy.pl Please enter the root password FOR performing cleanup: Re-enter root password: About TO clear up OAK deployment,public network connectivity will be lost,root password will be SET TO DEFAULT AND BOTH nodes will … Continue reading

Posted in ORACLE | Tagged , , , , , | Leave a comment

ORA-600(KSSRMP1)错误

10.2.0.4 RAC的ASM实例出现这个错误。 错误信息为: Mon Mar 14 11:45:00 2011 Errors IN file /home/oracle/admin/+ASM/udump/+asm2_ora_717148.trc: ORA-00600: internal error code, arguments: [KSSRMP1], [], [], [], [], [], [], [] Mon Mar 14 11:45:01 2011 Trace dumping IS performing id=[cdmp_20110314114501] Mon Mar 14 11:45:06 2011 … Continue reading

Posted in BUG | Tagged , , , | Leave a comment