返回 Storage Management 目录页

快速访问存储状况和任务

Dell OpenManage™ Server Administrator Storage Management 用户指南

  存储控制台和存储运行状况

  存储运行状况

  存储组件严重性

  存储属性和当前活动

  警报或事件

  监测 RAID 控制器上的磁盘可靠性

  使用警报检测故障

  使用机柜温度探测器

  重新扫描以更新存储配置更改

  显示配置更改的时间延迟

  用于检测物理磁盘状况更改的输入/输出和重新引导要求

本节介绍了多种方法来确定系统存储组件的状况或运行状况以及如何快速启动可用控制器任务。

存储控制台和存储运行状况

对于每个控制器,“Storage Health”(存储运行状况)选项卡或“Storage Dashboard”(存储控制台)会显示控制器严重性(运行状况或状况)的摘要以及启动控制器任务的任务菜单。提供链接访问虚拟磁盘状况和任务。

存储运行状况

“Storage Dashboard”(存储控制台)显示各个控制器和低层存储组件的总状况。例如,如果存储系统由于一个降级的机柜受到了影响,机柜“Health”(运行状况)子选项卡和“Storage Dashboard”(存储控制台)上的控制器严重性都会显示一个黄色的感叹号 (!) 以表示警告严重性。如果“Storage Dashboard”(存储控制台)上的控制器显示警告或严重状况,应进行以下操作调查警告或严重状况的原因:

有关低层组件状况如何“汇总”到控制器显示状况的详情,请参阅“附录 B:确定存储组件的运行状况。”

存储组件严重性

组件状况由严重性来表示。具有“警告”或“严重/故障”状况的组件需要立即进行检查以防止可能的数据遗失。组件状况可能表示组件及其低层对象的总状况。请参阅“附录 B:确定存储组件的运行状况”了解详情。

查看事件警报日志有助于找出那些说明组件为什么出现“警告”或“严重”状况。有关故障排除的其它信息,请参阅“警报消息”“故障排除”

严重性

组件状况

“Normal/OK”(正常/良好)。组件正按预期运行。

“Warning/Non-critical”(警告/不严重)。探测器或其它监测设备检测到组件的读数超过或低于所允许的级别。组件可能仍在工作,但可能会造成故障。组件还可能会在不稳定的状态下工作。可能会出现数据遗失。

“Critical/Failure/Error”(严重/故障/错误)。组件要么已经发生故障,要么即将发生故障。组件需要立即进行检查并且可能需要更换。可能已经发生数据遗失。

存储属性和当前活动

“Configuration/Information”(配置/信息)子选项卡显示关于存储组件的信息。这些属性包括一些详情,比如控制器上的连接器(信道或端口)数或机柜管理模块 (EMM) 固件版本。

“State”(状态)和“Progress”(进度)属性表示组件的当前活动。例如,脱机物理磁盘显示“Offline”(脱机)状况,而“Progress”(进度)属性显示还有多久就可以完成操作(比如重建)。

以下部分介绍各个组件的属性:

警报或事件

存储活动会生成警报或事件,这些警报或事件将显示在“警报日志”中。有些警报表示正常的活动,只是为了提供信息而显示。其它的警报则表示异常的活动,需要立即进行处理。关于警报和其纠正操作的详情,请参阅“警报消息”

监测 RAID 控制器上的磁盘可靠性

Storage Management 在已启用 SMART 的物理磁盘上支持自我监测分析和报告技术 (SMART)。

SMART 会对每个磁盘执行预测性故障分析,并且在预计会发生磁盘故障时发出警报。RAID 控制器会检查物理磁盘以寻找预计的故障,如果找到,就会将此信息传递给 Storage Management。Storage Management 会立即在磁盘上显示一个警报图标。Storage Management 还会将警报发送到警报日志和 Microsoft® Windows® 应用程序日志。

注:如果控制器的输入/输出已暂停,将不会收到 SMART 警报。
注:PERC 3/SC、3/DC、3/QC、4/SC、4/DC、4e/DC、4/Di、4e/Si、4e/Di 和 CERC ATA100/4ch 控制器对于未分配的或热备份磁盘不会报告 SMART 警报。

相关信息:

使用警报检测故障

有些存储组件具有警报。启用后,这些警报会在组件失败时提醒用户。请参阅以下部分了解详情:

使用机柜温度探测器

物理磁盘机柜带有温度探测器,在机柜超过允许的温度范围时会警告用户。有关使用温度探测器的详情,请参阅以下内容:

重新扫描以更新存储配置更改

“Rescan”(重新扫描)任务扫描连接到控制器连接器(信道或端口)的存储,以验证当前连接的设备或识别连接器上已添加或删除的设备。对控制器对象进行重新扫描时,所有连接到控制器的存储都将重新扫描。执行重新扫描会使控制器识别出存储配置中的更改,比如虚拟磁盘添加或卸下了物理磁盘,或者更改了 RAID 级别。

可能想在以下情况进行重新扫描:

如果想重新扫描所有控制器,则执行“全局重新扫描”。如果只想重新扫描连接到某个控制器的组件,则执行“重新扫描控制器”

相关信息:

显示配置更改的时间延迟

更改存储配置时,Storage Management 会迅速生成 SNMP 陷阱以响应配置更改。Storage Management MIB(管理信息库)也会更新以反映存储配置更改。不过可能需要多达五分钟以使用最新的存储配置更新 MIB。因此,在接收 SNMP 陷阱和能够通过查询 Storage Management MIB 来识别配置更改的过程之间会有最多五分钟的时间延迟。在 RAID 1 连锁虚拟磁盘上创建新虚拟磁盘或执行取消镜像或分割镜像时,这种时间延迟尤其明显。可以通过执行控制器重新扫描来尽量缩短这种延时。请参阅“重新扫描控制器”了解详情。

用于检测物理磁盘状况更改的输入/输出和重新引导要求

此部分适用于 PERC 3/SC、3/DC、3/QC、4/SC、4/DC、4e/DC、4/Di、4e/Si、4e/Di 和 CERC ATA100/4ch 控制器

由于硬件限制,PERC 3/SC、3/DC、3/QC、4/SC、4/DC、4e/DC、4/Di、4e/Si、4e/Di 和 CERC ATA100/4ch 控制器在尝试输入/输出或系统重新引导之前不会检测到物理磁盘更改。

如果控制器具有到磁盘的打开的通信路径,则在控制器上执行 I/O 操作会更新磁盘状况。例如,如果未配置的磁盘已被卸下,则在手动扫描完成或尝试其它输入/输出操作之前,控制器不会检测到更改。与此类似,要显示虚拟磁盘或其中某个物理磁盘的状况更改,需要在虚拟磁盘所在的控制器上执行输入/输出。

但是,如果控制器已失去通信路径,则需要重新引导系统才能更新磁盘状况。如果在尝试访问数据时操作系统生成 I/O 错误则说明通信已失去,即使 Storage Management 显示磁盘状况为运行良好。通信路径一旦恢复,则重新引导系统以更新磁盘状况。如果通信路径没有恢复,则 Storage Management 在重新引导后不会显示存储对象。

相关信息:


返回 Storage Management 目录页