1.报错信息
在进行Oracle exadata巡检时,发现cell节点有一根内存报错,报错信息如下:
报错内存位置为:CPU1 P1/D2槽位
报错内存信息:
根据报错信息确认内存PN号、大小等息,并将信息反馈公司,及时邮寄对应的备件。
2.备件更换流程
(1)更换操作前,根据Oracle exadata官方手册,确认报错内存具体位置、内存大小、内存频率等信息,并核对收到的备件,备件确认无误后,在关机、断电源后进行具体更换操作。
(2)在更换操作前,提前和Oracle exadata支持二线确认好其他注意事项
3.更换过程中存在的问题
在更换完成后,数据库日志出现了如下报错信息:
CELL-01514: Connect Error. Verify that Management Server is running on the server
验证 Management Server 是否正在服务器上运行时出现报错。
根据报错信息查询后确认:
是由于cell节点服务未正常运行,同时查看asm磁盘情况出现了offline磁盘。于是登录cell节点进行服务手动启动:
cell节点服务重启完成后,日志告警信息消失:
同时,磁盘组reconfiguration成功完成。
磁盘组offline磁盘清零:
注意事项:
虽然根据官网流程以及二线确认情况下进行了正确流程操作,但更换完成后还是出现了服务未正常运行的报错,所以在进行硬件更换或其他原因cell节点关机后,机器启动完成后要先检查cell节点服务,如未正常运行,需要手动进行启动。