Definiciones de tipos de suceso y condición de componentes

Server Administrator clasifica los sucesos que afectan a determinados componentes críticos de su sistema con un tipo de suceso. Normal, advertencia y crítico son los tres tipos de sucesos más comunes que se muestran para el estado de los componentes.

Este módulo de ayuda define términos para los tipos de sucesos, los estados y las gravedades. Lea este módulo de ayuda si desea obtener más detalles acerca de los distintos términos que usa Server Administrator para clasificar sucesos e indentificar la condición de los componentes.

Tipos de suceso y gravedades correspondientes

Ya sea que Server Administrator informe acerca del estado de un componente o que clasifique un suceso, los atributos del suceso que se pueden distinguir son: el componente o la redundancia que se supervisa y el tipo, estado y gravedad del suceso que el componente atraviesa.

Componente o redundancia

Server Administrator clasifica tanto a los componentes como a la redundancia de algunos componentes de acuerdo con el tipo, la gravedad y el estado.

Componentes

Todos los componentes de un sistema son importantes en algún punto. Las aplicaciones de Systems Management como Server Administrator identifican algunos componentes para supervisarlos especialmente. Los sistemas en condición satisfactoria se basan particularmente en un suministro estable de energía eléctrica en tesiones adecuadas para operar los componentes del sistema en forma apropiada. La energía eléctrica se entrega a través del interruptor de corriente alterna (CA) del sistema hacia los suministros de energía del sistema. Los componentes de los sistemas también requieren un rango funcional de temperaturas dentro del chasis. Para ejecutar programas y calcular datos se necesita una memoria de acceso aleatoria que funcione bien. Como resultado de estos requisitos, el interruptor de energía, los suministros de energía, los ventiladores y la memoria del sistema son algunos de los componentes más importantes que supervisa Server Administrator.

Redundancia

Server Administrator supervisa la condición de los componentes redundantes y notifica el estado de la redundancia del sistema.

Según cuán crítico sea un sistema para la misión de una entidad u organización comercial, algunos componentes del sistema se instalan en el sistema con redundancia planificada. Es más probable que un sistema crítico para la misión de una organización tenga componentes redundantes. Un componente redundante está diseñado para funcionar cuando su componente homónimo falla. La redundancia permite proteger un sistema de la inactividad producida por un apagado o por el daño de un componente.

Redundancia total La redundancia total de todo el sistema significa que los dispositivos funcionan dentro de los límites normales. Si un sistema necesita cuatro ventiladores para la redundancia total y los cuatro están funcionando, el sistema tiene redundancia total para el componente del ventilador. Si alguno de los dos ventiladores primarios falla, cada uno de ellos tiene uno de seguridad. La redundancia total no requiere ninguna acción a excepción del mantenimiento preventivo normal.
Redundancia degradada La redundancia degradada significa que algunos componentes necesarios para la redundancia total no funcionan. El sistema está operativo, pero no funcionan componentes suficientes como para permitir que un componente operativo empiece a funcionar en caso de falla. Por ejemplo, si se necesitan cuatro ventiladores para la redundancia total, tres ventiladores operativos representan la redundancia degradada. Solamente uno de los dos ventiladores primarios tiene una copia de seguridad si falla.
Redundancia perdida Redundancia perdida significa que el sistema tiene solamente el número mínimo de componentes en funcionamiento para evitar una falla del sistema. Si se necesitan cuatro ventiladores para la redundancia total y solamente dos están en funcionamiento, ninguno de los ventiladores primarios tiene una copia de seguridad si uno falla.

Tipo

Un suceso se clasifica por tipo. Ejemplos de tipos de sucesos son normal, aviso y crítico.

Normal Un suceso normal indica que un componente está funcionando dentro de un rango de valores que le permite desempeñar su función en el sistema correctamente. Otro término que generalmente se aplica a los componentes cuyo estado es normal es Correcto. Cuando un componente está correcto o un suceso es normal, el operador del sistema no tiene que tomar ninguna acción correctiva.
Aviso Los sucesos de aviso ocurren cuando un componente administrado no funciona en forma óptima pero aún así puede operar. La acción apropiada para un suceso de aviso suele consistir en investigar más y programar un mantenimiento en el componente. Los avisos también alertan al operador del sistema para que le preste más atención a un componente hasta que este vuelva a la normalidad. Los usuarios avanzados y los administradores pueden definir los valores mínimos y máximos para un suceso de aviso. El privilegio de definir el rango de aviso les permite a los usuarios avanzados y a los administradores crear el tiempo de reacción que desean para manejar un componente operativo que ha comenzado a mostrar signos de rendimiento degradado.
Crítico Un estado crítico indica que un componente opera fuera de los límites del funcionamiento apropiado o que directamente no funciona. Un componente no operativo generalmente se denomina irrecuperable. El fabricante del sistema define el rango crítico de un componente porque es quien conoce a la perfección la ingeniería de dicho componente y su funcionamiento apropiado. El estado crítico conlleva una connotación de urgencia en comparación con la de aviso. Los operadores del sistema toman más en serio este tipo de degradación en el rendimiento de los componentes. Las acciones apropiadas para un componente crítico o fallido pueden incluir apagar inmediatamente el sistema o coordinar el reemplazo de un componente muy pronto.

Estado

El estado de un atributo de un componente o del sistema puede ser operativo, degradado o no operativo. 

Operativo Una temperatura operativa significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas en el rango normal de operación. 
Degradado Temperatura degradada significa que las sondas de temperatura del chasis están leyendo temperaturas que se ubican dentro del rango de aviso definido por las temperaturas operativas mínimas y máximas necesarias para un aviso. La temperatura del chasis se ubica por debajo del nivel mínimo normal o por encima del nivel máximo normal.
No operativo Un componente o un atributo del componente no operativo significa que el componente opera en modo de falla o dentro de un rango irrecuperable. Tomemos como ejemplo la temperatura. Si el sistema aún funciona y la temperatura se ubica por encima o por debajo del rango normal, se puede disparar un apagado térmico del sistema o, de lo contrario, la temperatura puede dañar o destruir componentes del sistema.

Gravedad

Cada uno de los tipos y estados de los sucesos para un componente se clasifica según su gravedad. Las gravedades de los eventos son: informativo, leve, grave y crítica.

Informativo Un suceso o estado del componente normal está en estado operativo y la gravedad asociada con un suceso normal es informativo. La única acción que Server Administrator realiza para un suceso normal es informativo. Server Administrator le informa al operador del sistema que el componente está en estado normal.
Leve Un suceso de aviso puede ser leve o crítico según el componente. Por ejemplo, si quita un ventilador en un sistema de ventiladores redundantes, la gravedad de dicho suceso es leve.
Grave Algunos sucesos de aviso pueden indicar riesgos graves para el sistema. Si un ventilador permanece fuera del sistema durante un período de tiempo largo, el suceso podría convertirse en grave porque la redundancia podría verse afectada. La ausencia extendida de un componente en un sistema cuya misión dentro de la organización necesita redundancia podría provocar fallas en los componentes sin copia de seguridad disponible y también provocar una falla en el sistema.
Crítico Los sucesos que detectan componentes dentro del rango de falla son críticos. La falla de los componentes como ventiladores, cables de corriente alterna o módulos de memoria ponen en peligro la capacidad del sistema para funcionar y preservar datos.

Cómo están relacionados el tipo de suceso, la gravedad y el estado

La siguiente tabla proporciona ejemplos de sucesos para componentes importantes y muestra cómo se relacionan el tipo de suceso, la gravedad y el estado.

Componente Tipo de suceso o de alerta Gravedad Estado
Cable de corriente alterna NormalInformativo Operativo
Cable de corriente alterna Falla Crítico Degradado
Suministro de energía Falla Crítico Degradado
Redundancia (para el sistema de energía) Normal Informativo Operativo
Redundancia (para el sistema de energía) Degradado Leve Degradado
Redundancia (para el sistema de energía) Perdida Grave Degradado
Temperatura Normal Informativo Operativo
Temperatura Aviso Leve Degradado
Temperatura Falla Crítico Degradado
Térmico Apagado Crítico No operativo