Aide d'OpenManage
Fermer
Définitions des types d'événements et intégrité des composants
Server Administrator classe les événements affectant certains composants critiques de votre système en fonction du type d'événement. Les trois types d'événements les plus courants affichés pour la condition d'un composant sont Normal, Avertissement et Critique.
Ce module d'aide définit les termes ayant trait aux types d'événements, à leurs états et à leurs gravités. Lisez ce module d'aide si vous voulez plus de détails sur les différents termes utilisés par Server Administrator pour classifier les événements et identifier l'intégrité des composants.
Types d'événements et gravités associées
Si Server Administrator rapporte l'intégrité d'un composant ou classifie un événement, les attributs distinctifs de l'événement sont les suivants : le composant ou la redondance qui sont surveillés et le type, l'état et la gravité de l'événement subi par le composant.
Retour au début
Composant ou redondance
Server Administrator classifie les composants et la redondance de certains composants selon le type, la gravité et l'état.
Retour au début
Composants
Tous les composants d'un système ont une importance. Les applications de gestion de systèmes, comme Server Administrator, isolent certains composants pour leur donner une attention spéciale. Les systèmes intègres comptent particulièrement sur une alimentation constante de courant électrique à une tension appropriée au fonctionnement de leurs composants système. Le courant électrique est fourni par le commutateur de courant alternatif (CA) du système aux blocs d'alimentation du système. Les composants des systèmes doivent également avoir une plage opérationnelle de températures à l'intérieur du châssis. Les applications qui s'exécutent et font des calculs sur des données nécessitent une mémoire vive qui fonctionne bien. De ce fait, le commutateur d'alimentation, les blocs d'alimentation, les ventilateurs et la mémoire système sont parmi les composants les plus importants contrôlés par Server Administrator.
Retour au début
Redondance
Server Administrator surveille l'intégrité des composants redondants et émet un rapport sur l'état de la redondance du système.
Selon l'importance d'un système par rapport à la mission de l'entreprise ou de l'organisation, certains composants de système sont installés dans le système avec une redondance calculée. En général, un système qui est essentiel à la mission d'une organisation a des composants redondants. Un composant redondant est conçu pour prendre la relève lorsque son composant compagnon devient défaillant. La redondance permet de protéger un système contre les temps d'arrêt causés par des échecs ou des composants endommagés.
Retour au début
Redondance totale
La redondance totale de tout le système signifie que tous les périphériques fonctionnent à l'intérieur des limites normales. Si un système doit avoir quatre ventilateurs pour une redondance totale et qu'ils fonctionnent tous, le système a une redondance totale de ventilation. Si un des deux ventilateurs principaux devient défaillant, chaque ventilateur en a un en réserve. La redondance totale n'exige aucune action autre que l'entretien préventif normal.
Retour au début
Dégradation de la redondance
La dégradation de la redondance indique que certains des composants nécessaires pour une redondance totale ne fonctionnent pas. Le système est opérationnel, mais trop peu de composants fonctionnent pour permettre à un composant opérationnel de prendre la relève en cas de défaillance. Par exemple, si quatre ventilateurs sont requis pour une redondance totale, trois ventilateurs fonctionnels représentent une redondance dégradée. Seul un des deux ventilateurs principaux en a un de secours s'il devient défaillant.
Retour au début
Perte de la redondance
La perte de la redondance indique que le système n'a qu'un nombre minimum de composants qui fonctionnent pour empêcher une défaillance système. Aucun composant redondant ne fonctionne. Si quatre ventilateurs sont requis pour une redondance totale et que seulement deux ventilateurs fonctionnent, aucun des ventilateurs principaux n'en a un en réserve si un des ventilateur devient défaillant.
Retour au début
Type
Un événement est classifié par type. Des exemples de types d'événements sont Normal, Avertissement et Critique.
Retour au début
Normal
Les événements de type normal indiquent qu'un composant fonctionne dans une plage de valeurs qui permet au composant de bien fonctionner dans le système. Un autre terme souvent appliqué aux composants dont l'état est normal est OK. Lorsqu'un composant est OK ou qu'un événement est normal, l'opérateur de système n'a aucune action correctrice à prendre.
Retour au début
Avertissement
Des événements d'avertissement se produisent lorsqu'un composant géré ne fonctionne pas de façon optimale, mais qu'il fonctionne tout de même. Les événements d'avertissement donnent le temps d'agir aux opérateurs de système. L'action appropriée pour un événement d'avertissement est souvent d'étudier davantage la situation et de planifier l'entretien du composant. Les avertissements indiquent également à l'opérateur du système qu'il devrait faire plus attention à un composant jusqu'à ce que le composant revienne à la normale. Les utilisateurs privilégiés et les administrateurs peuvent définir les valeurs minimale et maximale d'un événement d'avertissement. En définissant la plage d'avertissement, les utilisateurs privilégiés et les administrateurs peuvent incorporer le temps de réaction souhaité pour s'occuper d'un composant opérationnel qui commence à montrer des signes de performance dégradée.
Retour au début
Critique
Un événement critique indique qu'un composant fonctionne en dehors des limites de bon fonctionnement ou alors qu'il ne fonctionne pas du tout. Un composant qui ne fonctionne pas du tout est souvent appelé irrécupérable. Le fabricant du système définit la plage critique pour un composant car c'est le fabricant qui connaît le mieux la technicité du composant et son bon fonctionnement. Un événement critique a une connotation plus urgente qu'un avertissement et les opérateurs de système prennent ce type de dégradation des performances d'un composant plus au sérieux. Les actions appropriées pour un composant qui a un problème critique ou devient défaillant peuvent inclure un arrêt immédiat du système ou le remplacement d'un composant dans les délais les plus brefs.
Retour au début
État
L'état d'un composant ou d'un attribut du système est opérationnel, dégradé ou non opérationnel.
Retour au début
Opérationnel
Une température opérationnelle signifie que les capteurs de température à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage normale de fonctionnement.
Retour au début
Dégradé
Une température dégradée signifie que les capteurs de température à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage d'avertissement définie par les températures minimale et maximale de fonctionnement requises pour un avertissement. La température dans le châssis est soit en dessous des normes de la température minimale, soit au dessus de celles de la température maximale.
Une dégradation de la redondance signifie que trop peu de composants fonctionnent pour assurer que chaque composant crucial en a un autre qui peut prendre la relève en cas de défaillance.
Retour au début
Non opérationnel
Un composant ou un attribut de composant non opérationnel signifie que le composant fonctionne en dehors de la plage fonctionnelle ou est irrécupérable. En prenant la température comme exemple, si le système fonctionne encore, la température est si loin au dessus ou en dessous de la plage normale qu'elle peut déclencher un arrêt du système pour des raisons thermiques ou endommager ou détruire des composants système.
Retour au début
Gravité
Chaque type d'événement et état d'un composant a une gravité. Les gravités pour les événements sont Informatif, Secondaire, Majeur et Critique.
Retour au début
Informatif
La condition normale d'un événement ou d'un composant est un état opérationnel et la gravité associée à un événement normal est informative. La seule action que Server Administrator effectue pour un événement normal est informative. Server Administrator informe l'opérateur de système que le composant est normal.
Retour au début
Secondaire
Un événement d'avertissement peut être secondaire ou critique selon le composant. Par exemple, si vous enlevez un ventilateur dans un système de ventilation redondante, la gravité de cet événement est mineure.
Retour au début
Majeur
Certains événements d'avertissement peuvent indiquer des risques majeurs pour le système. Si un ventilateur n'est pas dans le système pour une période de temps prolongée, l'événement peut devenir majeur car la redondance devient compromise. L'absence prolongée d'un composant d'un système dont la mission au sein d'une organisation exige une redondance peut entraîner l'échec des composants sans dispositifs de réserve et pourrait mener à un échec système.
Retour au début
Critique
Les événements qui décèlent des composants dans la plage d'échec sont critiques. Les échecs de composants tels que les ventilateurs, les cordons d'alimentation en CA ou les modules de mémoire compromettent le fonctionnement du système et la préservation de ses données.
Retour au début
Relation entre les types d'événement, la gravité et l'état
REMARQUE : À cause des limitations du système d'exploitation VMware® ESXi, la définition d'actions d'alerte n'est pas disponible avec cette version d'OpenManage Server Administrator.
Le tableau suivant fournit un exemple d'événements pour des composants importants et montre les relations entre le type d'événement, la gravité et l'état.
Composant Type d'événement ou d'alerte Gravité État
Cordon de courant alternatif Normal Informative Opérationnel
Cordon de courant alternatif Défaillant Critique Dégradé
Bloc d'alimentation Défaillant Critique Dégradé
Redondance (système d'alimentation) Normal Informative Opérationnel
Redondance (système d'alimentation) Dégradé Secondaire Dégradé
Redondance (système d'alimentation) Perdu Majeure Dégradé
Température Normal Informative Opérationnel
Température Avertissement Secondaire Dégradé
Température Défaillant Critique Dégradé
Thermique Arrêt Critique Non opérationnel