Tag Archives: m000

10.2出现reliable message信息导致进程hang死

已经在多个RAC环境碰到因为等待reliable message导致进程hang死的情况了。 这个问题在RAC环境比较常见,在很多客户中都碰到过这个问题,而数据库版本多集中在10.2.0.4,个别的版本为10.2.0.5。 而出现这个信息的进程也不太相同,最常见的的m000进程,这个进程的僵死会导致一个节点的AWR无法自动收集。 另外比较常见的就是导致高级队列机制异常,直接影响是数据泵导出无法正常运行,会导致进程挂起。 最近又碰到了类似的情况,在MOS文档中发现Bug 6148054 RAC hang waiting for “reliable message”文章描述的BUG与之前的情况非常类似,不过根据这个bug的描述,问题似乎不会在10.2.0.5上发生。其他方面现象都比较相符,而且之前碰到的大部分案例中,除了reliable message等待之外,还会有wait for unread message on broadcast channel等待。 这个bug确认的修复版本是11.1.0.6,从这个角度讲,10.2.0.5很可能也会有类似的问题。除了升级版本为,可以通过补丁7801939来解决这个问题。

Posted in BUG | Tagged , , | Leave a comment