400-920-0692
技术资源

    前一段时间给一个客户在公有云平台上搭建了一套Oracle11.2.0.4RAC,操作系统是RHEL6.5.由于公有云环境的复杂性,安装过程遇到很多问题,这里就不吐槽了,总之,克服一些困难后,RAC安装成功了,数据也帮客户完成了迁移,系统大概8月交付使用,1113号,客户打电话说由于硬件调整,重启了服务器,结果RAC死活起不来。通过vpn登陆客户系统,发现has都无法正常启动。于是直接检查/var/log/messages系统日志,发现一条告警信息:

logger: autorun file for ohasd is missing

    于是赶紧登陆MOS,查找相关文章,找到一篇非常匹配的文章Doc ID 1427234.1,官方未明确说明原因,给出了以下解决办法,我总结一下有三点:

  1. 由于oracle启动脚本先于主机名设置成功启动,导致的bug15869775,只需要修改init.ohasd文件,在######### Shell functions #########之前增加sleep 30,让oracle延迟启动;

  2. 确保autorun文件真的存在。

  3. 确保权限和内容正确。

    结合我们的实际情况,第23两点通过检查排除了,因此直接修改init.ohasd脚本,最终rac成功启动。

    这个案例应该非常少见,因为一般物理机环境操作系统启动后主机名的设置都可以快速完成。从另外一个角度说明,公有云环境还是比较复杂的,有很多不确定的因素。尽管我们的rac安装完成后,有多次重启,但是测试阶段一直未发现这个bug,个人觉得,公有云环境安装RAC数据库需要慎重考虑,仔细测试。