Tag Archives: RAC

删除归档出现ORA-15028错误

在10.2.0.4 RAC环境中使用RMAN删除归档报错ORA-15028。 错误信息如下: RMAN> DELETE archivelog ALL completed BEFORE ‘sysdate-3’; Do you really want TO DELETE the above objects (enter YES OR NO)? YES RMAN-00571: =========================================================== RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS =============== RMAN-00571: =========================================================== RMAN-03009: failure OF DELETE command … Continue reading

Posted in BUG | Tagged , , , , , , | Leave a comment

ORA-600(kffmXpGet)错误

第一次碰到Exadata上的bug。 数据库环境Exadata V2-2,数据库版本为11.2.0.2,错误信息为: Wed Apr 25 11:32:35 2012 Errors IN file /u01/app/oracle/diag/rdbms/ods/orcl2/trace/orcl2_ora_9495.trc (incident=304808): ORA-00600: internal error code, arguments: [kffmXpGet], [145], [69784], [], [], [], [], [], [], [], [], [] ORA-03135: connection lost contact Incident details IN: /u01/app/oracle/diag/rdbms/orcl/orcl2/incident/incdir_304808/orcl2_ora_9495_i304808.trc USE ADRCI … Continue reading

Posted in BUG | Tagged , , , , , , , , , , | Leave a comment

9iRAC环境遭遇library cache lock和library cache load lock等待

客户数据库版本为9208 RAC FOR AIX,客户反应系统缓慢,检查告警日志,发现大量Library cache lock和Library cache load lock等待。 由于客户的原因,这个问题只是远程协助的方式帮忙检查了一下,因此没有留下任何的操作记录,这里只是简单描述一下问题。 客户反应数据库操作响应变慢,平时一个执行很快的基于主键的UPDATE操作也变得异常缓慢,且执行计划本身并未发生改变。 登录数据库后检查两个节点上的告警日志,并未发现任何异常报错。分别检查两个实例的等待信息,发现除了上面提到的大量Library cache lock和Library cache load lock以外,还有明显的gc等待。 但是随后发现,查询V$SESSION和GV$SESSION的结果居然没有区别,接着查询GV$INSTANCE视图,发现只有当前的实例存在,而此时恰好连接另一个节点的工具出现了断连,以至于我一度以为另外一个节点上的实例已经DOWN掉,但是随后重新登录到该节点上,发现数据库实例仍然存在,而且登录到数据库实例中也可以进行任何正常的操作。不过发现在当前节点所有的GV$视图都只会返回当前实例的信息,这与另外一个节点的情况完全一样。显然两个节点间的通信出现了问题,当前节点已经不清楚另外一个节点的状态的。 现在再去分析那些等待信息已经没有太多的意义了,因为整个数据库已经处于不正常的状态。不难推断,当前数据库的异常是由于节点间的通信异常导致。由于9i使用的操作系统的CLUSTER,还没有Oracle的clusterware,剩下只能由操作系统或硬件维护人员去进一步跟踪了。 最终数据库和系统在夜间闲时进行了重启操作,重启后数据库恢复正常,GV$视图的结果也恢复了正常。

Posted in ORACLE | Tagged , , , , , | Leave a comment

设置全局死锁优先级

测试控制全局死锁的隐含参数_lm_dd_interval时,突然想到这个问题。 RAC全局死锁检测时间:https://yangtingkun.net/?p=955 Oracle的死锁判断是没有优先级的,也就是说,当两个或多个会话发生死锁的时候,无法指定牺牲哪个会话,而是由Oracle随机决定。 不过对于RAC环境而言,死锁的检查不在是内部的随机实现,Oracle通过隐含参数_lm_dd_interval来控制死锁的检测时间。更重要的是,对于RAC环境而言,Oracle允许不同实例设置不同的值。而不同实例的检测死锁间隔不同,就意味着优先级的出现。 如果实例1上设置该值为默认值60秒,而实例2设置为30秒,那么当发生死锁后,永远是实例2上先检测到死锁,也就是说,实例2上会话会被牺牲掉。 这是两个实例上设置该参数相同的情况,两个会话分别连接到两个实例,产生死锁。实例1上的会话1: SQL> SELECT name FROM v$database; NAME ——— ORCL SQL> SELECT instance_number, instance_name FROM v$instance; INSTANCE_NUMBER INSTANCE_NAME ————— —————- 1 orcl1 SQL> SET sqlp ‘I1S1> ‘ I1S1> SHOW parameter _lm NAME TYPE VALUE ———————————— ———– … Continue reading

Posted in ORACLE | Tagged , , , | Leave a comment

RAC全局死锁检测时间

对于单实例数据库而言,死锁的检测在秒级完成,而RAC环境则死锁的检测时间默认达到了1分钟。 对于单实例环境如果出现了死锁,那么马上其中一个进程就被中止,用户可以快速的得到错误返回。而对于RAC而言,死锁的检测并不是实时完成,而是需要60秒左右的时间。 会话1执行: SQL> CREATE TABLE t_deadlock (id NUMBER PRIMARY KEY, name varchar2(30)); TABLE created. Elapsed: 00:00:00.12 SQL> INSERT INTO t_deadlock VALUES (1, ‘a’); 1 ROW created. Elapsed: 00:00:00.00 SQL> INSERT INTO t_deadlock VALUES (2, ‘b’); 1 ROW created. Elapsed: … Continue reading

Posted in ORACLE | Tagged , , , , | 1 Comment

ORA-7445(kfcbCloseCIC10)错误

10.2.0.3 RAC的ASM实例,出现ORA-7445错误导致实例崩溃。 详细错误信息为: Tue Nov 9 10:47:59 2010 NOTE: reconfiguration OF GROUP 4/0x654fe2a9 (DATA), FULL=1 NOTE: disk validation pending FOR GROUP 4/0x654fe2a9 (DATA) ERROR: GROUP 4/0x654fe2a9 (DATA): could NOT validate disk 25 SUCCESS: validated disks FOR 4/0x654fe2a9 (DATA) NOTE: PST … Continue reading

Posted in BUG | Tagged , , , , , , , | Leave a comment

ORA-600(1403)和ORA-7445($cold_kslgetsl)错误

10.2.0.2 RAC的ASM实例,出现这两个错误并导致实例的崩溃。 错误信息为: Thu Apr 12 18:55:42 2007 Starting ORACLE instance (normal) LICENSE_MAX_SESSION = 0 LICENSE_SESSIONS_WARNING = 0 Interface TYPE 1 lan901 192.168.0.0 configured FROM OCR FOR USE AS a cluster interconnect Interface TYPE 1 lan900 198.5.1.0 configured FROM OCR … Continue reading

Posted in BUG | Tagged , , , , , , , , , , , | Leave a comment

ORA-600(16480)错误

告警日志出现ORA-600 [16480]错误。 数据库版本为10.2.0.4 RAC,详细错误信息为: Mon Mar 12 23:41:27 2012 PMON failed TO acquire latch, see PMON dump Mon Mar 12 23:41:54 2012 Errors IN file /home/oracle/admin/orcl/bdump/orcl2_s004_942128.trc: ORA-00600: internal error code, arguments: [16480], [111], [0x70000080A1A5248], [], [], [], [], [] Mon … Continue reading

Posted in BUG | Tagged , , , , , | Leave a comment

ORA-600(kfioUnidentify01)错误

Oracle 10.2.0.4 RAC环境的ASM出现这个错误。 错误信息为: Mon Sep 19 18:06:01 2011 Shutting down instance: further logons disabled Mon Sep 19 18:06:01 2011 Shutting down instance (immediate) License high water mark = 10 Mon Sep 19 18:06:01 2011 ERROR: diskgroup DATA was NOT … Continue reading

Posted in BUG | Tagged , , , , , | Leave a comment

ORA-600(ksires_1)错误

Oracle RAC 10.2.0.4 for HP-UX环境出现ORA-600[ksires_1]错误。 错误信息为: Mon DEC 13 23:00:13 2010 Errors IN file /u01/app/oracle/admin/orcl/bdump/orcl2_m000_1861.trc: ORA-00600: internal error code, arguments: [ksires_1], [], [], [], [], [], [], [] Mon DEC 13 23:00:15 2010 Errors IN file /u01/app/oracle/admin/orcl/bdump/orcl2_m000_1861.trc: ORA-00600: internal error … Continue reading

Posted in BUG | Tagged , , , , , | Leave a comment