IDrac查看磁盘异常及热备盘操作

in 默认分类 with 0 comment

2024-08-13T01:38:26.png

本篇旨在模拟RAID 5出现单个硬盘故障。此状态下RAID 5中各硬盘状态,热备盘接替故障硬盘全过程及Zabbix对于此状态下的警报。全视角将在iDRAC中查看。此文由少爷庄-James提供理论及技术支持。

永久激活企业版iDrac

iDRAC企业版申请的临时授权到期可在网上查找永久激活方式。机器不同实现步骤不同,请自行斟酌.
1)具体做法可通过特殊方式得到有授权的机器序列号及永久授权的许可证。
2)关机断电后更改主板跳线位置。从2,4,3,5跳线为4,6,3,5。(如下图所示)
2024-08-13T01:50:36.png
2024-08-13T01:50:52.png
3)通电开机,按F2后进入系统设置,将出现【Service tag settings】,将有授权的机器序列号输入后点击【OK】保存。
4)关机断电后将跳线还原至2,4,3,5(如下图所示)。然后通电开机。
2024-08-13T01:55:07.png
5)导入永久授权的许可证,具体导入方式可查看本站中Dell服务器设置+Esxi 8.0部署的【设置iDRAC并打开iDRAC虚拟控制台预览】
2024-08-13T02:10:54.png

拔出硬盘模拟硬盘损坏情况

Dell服务器设置+Esxi 8.0部署中,此服务器已将1,2,3盘位硬盘设置RAID 5。4盘位硬盘设置位此RAID 5的专用热备盘。状态如下所示,此时第1盘位硬盘在此RAID 5编号为【Physical Disk 0:1:0】,第2盘位硬盘编号为【Physical Disk 0:1:1】,第3盘位硬盘编号为【Physical Disk 0:1:2】,第4盘位(热备盘)硬盘编号为【Physical Disk 0:1:3】。此次实验将RAID 5 中的2号盘位即【Physical Disk 0:1:1】拔出。模拟磁盘损坏情况。
2024-08-13T02:13:56.png
如在操作时无法区分硬盘编码或位置时,可使用【标识】功能,将需要找到的硬盘进行【闪烁】操作,点击【闪烁】后,服务器硬盘灯将有规律闪烁。从而可避免误操作。
2024-08-13T02:18:29.png
拔出硬盘后,此时【Physical Disk 0:1:1】状况为【已移除】。此时第4盘位(热备盘)硬盘【Physical Disk 0:1:3】状况为【联机】,操作状态为【正在重建】。热备盘将RAID 5其他正常硬盘的将奇偶校验数据通过异或运算重建到热备盘中。
2024-08-13T02:22:03.png
重建过程中,虚拟磁盘状况为【降级】。在进行重建时或完成后,由于RAID 5其他盘中的奇偶校验数据仍为可读取即写入状态,所以对于服务来说不会中断。关于RAID 5工作原理可查看RAID介绍
2024-08-13T03:03:21.png
重建完成后,热备用为【否】,此时该RAID 5无热备盘。处于单独RAID 状态。
2024-08-13T03:39:25.png
重建完成后,此时热备盘将替代损坏硬盘,成为RAID 5的成员硬盘,重建完成后状况从【降级】将恢复成正常。
2024-08-13T03:04:42.png
2024-08-13T03:04:54.png

此时如将【Physical Disk 0:1:1】重新插回,模拟更换新硬盘。(如热备盘重建时插入,则会先完成热备盘重建后在重新从热备盘中回写到新硬盘中)此时新硬盘状况为【外来】。如下图所示。
2024-08-13T02:59:21.png
此时【Physical Disk 0:1:1】状况为【联机】,操作状态为【回写】。
2024-08-13T03:34:24.png
当重建完成后,【Physical Disk 0:1:3】热备用将回归到【专用】。
2024-08-13T03:36:49.png
此时RAID 5出现【剩余冗余】数目【1】。说明热备盘重新启动。
2024-08-13T03:41:29.png
【运行状况和属性】中,RAID 5及对应硬盘将归回到一开始操作前状态。
2024-08-13T03:37:49.png

Zabbix中的状态

Zabbix监控iDRAC设置可参考zabbix 监控 IDrac Esxi
如物理磁盘及虚拟磁盘中出现变动,Zabbix中将出警报信息。如下图所示:
2024-08-13T03:49:17.png
如恢复正常后,如下图所示:
2024-08-13T05:28:42.png

番外篇-拔出RAID 中专用热备盘

如将RAID 5的专用热备盘拔出插回后,拔出时RIAD 5硬盘数为所设置硬盘。插回后热备盘状况为【外来】,热备用状态为【否】。代表这热备盘无法进行该有的热备操作。
2024-08-13T06:34:50.png
2024-08-13T06:18:08.png
2024-08-13T06:16:43.png
在iDrac->【存储】->【控制器】->【设置】中将识别为外部配置的第4盘位(热备盘)【Physical Disk 0:1:3】进行清除操作。在【应用操作模式】中选择【立即应用】并点击清除。直至【作业队列】中完成此次清除操作。
2024-08-13T06:27:12.png
2024-08-13T06:22:52.png
2024-08-13T06:23:06.png
2024-08-13T06:23:26.png

清除操作完成后,此时【Physical Disk 0:1:3】状况从开始的【外来】变为【就绪】。
2024-08-13T06:25:50.png

在iDrac->【存储】->【虚拟磁盘】->【管理】->【关于虚拟磁盘操作】->【选择管理专用热备盘】->选择【Physical Disk 0:1:3】->选择【操作】。在【应用操作模式】中选择【立即应用】并点击应用。直至【作业队列】中完成此次添加操作。
2024-08-13T06:28:24.png
2024-08-13T06:31:04.png
2024-08-13T06:36:48.png

完成专用热备盘后,最后效果如下图所示:
2024-08-13T06:37:49.png
2024-08-13T06:33:43.png

Responses