Definiciones de tipos de suceso y condición de componentes

Server Administrator clasifica los sucesos que afectan a ciertos componentes fundamentales de su sistema usando un tipo de suceso. Normal, advertencia y crítico son los tres tipos de sucesos más comunes que se muestran como tipo de estado de los componentes.

Este módulo de ayuda define los términos para los tipos, los estados y las gravedades de los sucesos. Lea este módulo de ayuda si desea obtener más detalles acerca de los diferentes términos que Server Administrator usa para clasificar los sucesos y para identificar el estado de los componentes.

Tipos de suceso y gravedades correspondientes

Ya sea que Server Administrator informe acerca del estado de un componente o que clasifique un suceso, los atributos del suceso que se pueden distinguir son: el componente o la redundancia que se supervisa y el tipo, estado y gravedad del suceso que el componente atraviesa.

[Volver al principio]

Componente o redundancia

Server Administrator clasifica tanto a los componentes como a la redundancia de algunos componentes de acuerdo con el tipo, la gravedad y el estado.

Componente

Todos los componentes de un sistema son importantes de alguna manera. Las aplicaciones de Systems Management, como Server Administrator, destacan algunos componentes para darles atención especial. Los sistemas con condición satisfactoria dependen especialmente de un suministro estable de energía eléctrica en los voltajes adecuados para que los componentes del sistema funcionen correctamente. La energía eléctrica se suministra a través del interruptor de corriente alterna (CA) del sistema y hacia los suministros de energía del equipo. Los componentes de los sistemas también requieren un rango de temperaturas funcional dentro del chasis. La ejecución de programas y la elaboración de cálculos sobre los datos requiere que la memoria de acceso aleatorio funcione bien. Como resultado de estos requisitos, el interruptor de corriente, los suministros de energía, los ventiladores y la memoria del sistema son algunos de los componentes más importantes que Server Administrator supervisa.

Redundancia

Server Administrator supervisa la condición de los componentes redundantes y notifica el estado de la redundancia del sistema.

Dependiendo de la relevancia del sistema para la misión de una entidad u organización comercial, algunos componentes están instalados en el sistema con redundancia planificada. Es más probable que un sistema que es fundamental para la misión de una organización tenga componentes redundantes. Un componente redundante está diseñado para hacerse cargo de la operación cuando su componente acompañante falla. La redundancia ayuda a proteger a un sistema para que no experimente tiempo de inactividad debido a un apagado o a daños en los componentes.

Redundancia total

Redundancia total para todo el sistema significa que todos los dispositivos están funcionando dentro de los límites normales. Si un sistema requiere cuatro ventiladores para la redundancia total y los cuatro están funcionando, el sistema tiene redundancia total para el componente del ventilador. Si cualquiera de los dos ventiladores principales falla, cada uno tiene un respaldo. La redundancia total no requiere ninguna acción además del mantenimiento preventivo normal. 

Redundancia degradada

Redundancia degradada significa que algunos de los componentes que se necesitan para la redundancia total no están funcionando. El sistema es operativo, pero no hay suficientes componentes funcionando para permitir que un componente operativo se haga cargo de la operación en caso de que algún componente falle. Por ejemplo, se necesitan cuatro ventiladores para la redundancia total, tres ventiladores operativos representan redundancia degradada. Sólo uno de los dos ventiladores primarios tiene un respaldo si falla. 

Redundancia perdida

Redundancia perdida significa que el sistema tiene sólo el número mínimo de componentes funcionando para evitar una falla del sistema. No hay ningún componente redundante funcionando. Si se necesitan cuatro ventiladores para la redundancia total y sólo hay dos ventiladores funcionando, ninguno de los ventiladores principales tiene un respaldo si un ventilador falla.

[Volver al principio]

Tipo

Un suceso se clasifica por tipo. Normal, advertencia y crítico son ejemplos de tipo de sucesos. 

Normal 

Los sucesos normales indican que un componente está funcionando dentro de un rango de valores que habilita al componente para realizar bien su función en el sistema. Otro término que se aplica a menudo a los componentes cuyo estado es normal es En buen estado. Cuando un componente está en buen estado o un suceso es normal, el operador del sistema no tiene que realizar ninguna acción correctiva.

Advertencia 

Los sucesos de advertencia se producen cuando un componente administrado no está funcionando óptimamente, pero aún es capaz de funcionar. Los sucesos de advertencia proporcionan cierto tiempo de ventaja a los operadores del sistema. La acción adecuada para un suceso de advertencia es a menudo investigar más y programar el mantenimiento del componente. Las advertencias también alertan al operador del sistema para que ponga más atención a un componente hasta que regrese a su estado normal. Los usuarios avanzados y los administradores pueden definir los valores mínimo y máximo para un suceso de advertencia. El privilegio de definir el rango de advertencia permite a los usuarios avanzados y a los administradores incorporar el tiempo de reacción que desean cuando se maneja un componente operativo que está comenzando a mostrar signos de funcionamiento degradado.

Crítico

Un suceso crítico indica que un componente está operando fuera de los límites del funcionamiento adecuado o que no está funcionando en absoluto. Un componente que no está funcionando en absoluto a menudo se denomina no recuperable. El fabricante del sistema es quien define el rango crítico para un componente, ya que éste es quien conoce mejor tanto su diseño interno como su adecuado funcionamiento. El suceso crítico tiene una connotación más urgente comparado con el advertencia y los operadores del sistema toman más seriamente este tipo de degradación del funcionamiento de un componente. Las acciones adecuadas para un componente crítico o que está fallando pueden incluir el apagado inmediato del sistema o la programación del reemplazo del componente en muy poco tiempo.

[Volver al principio]

Estado

El estado de un atributo de un componente o del sistema puede ser operativo, degradado o no operativo. 

Operativo

Una temperatura operativa significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas en el rango normal de operación. 

Degradado

Una temperatura degradada significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas que están dentro del rango de advertencia definido por las temperaturas de operación mínima y máxima requeridas para una advertencia. La temperatura en el chasis está por debajo de la temperatura mínima normal o sobre la temperatura máxima normal.

Una redundancia degradada significa que no hay suficientes componentes funcionando para asegurar que cada componente fundamental tenga un respaldo que se haga cargo de la operación en caso de una falla.

No operativo

Un componente o un atributo de un componente no operativo significa que el componente está funcionando en un rango ya sea de falla o no recuperable. Usando el ejemplo de la temperatura, si el sistema aún está funcionando, la temperatura está tan por encima o por debajo del rango normal que podría desencadenar un apagado térmico del sistema o la temperatura podría dañar o destruir los componentes del mismo. 

[Volver al principio]

Gravedad

Cada tipo de suceso y estado de un componente se clasifica de acuerdo a su gravedad. Las gravedades para sucesos incluyen informativo, leve, grave y crítico.

Informativo

Un suceso normal o el estado de un componente está en un estado operativo y la gravedad asociada con un suceso normal es informativa. La única acción que Server Administrator realiza para un suceso normal es informativa. Server Administrator informa al operador del sistema que el componente está en estado normal.

Leve

Un suceso de advertencia puede ser leve o crítico, dependiendo del componente. Por ejemplo, si desmonta un ventilador en un sistema con redundancia de ventiladores, la gravedad de ese suceso es leve.

Grave

Algunos sucesos de advertencia pueden indicar riesgos graves para el sistema. Si un ventilador permanece fuera del sistema por un periodo largo, el suceso podría convertirse en grave porque se estaría comprometiendo la redundancia. La ausencia por un periodo largo de un componente en un sistema cuya misión en una organización requiere redundancia, podría ocasionar fallas de los componentes sin respaldos disponibles y podría conducir finalmente a una falla del sistema.

Crítico 

Los sucesos que detectan componentes dentro del rango de falla son críticos. La falla de componentes como los ventiladores, los cables de corriente alterna o los módulos de memoria ponen en peligro la capacidad del sistema para funcionar y preservar los datos.

[Volver al principio]

Cómo se relacionan el tipo de suceso, la gravedad y el estado

La siguiente tabla proporciona ejemplos de sucesos para componentes importantes y muestra cómo se relacionan el tipo de suceso, la gravedad y el estado.

Componente Tipo de suceso o de alerta Gravedad Estado
Cable de corriente alterna Normal Informativo Operativo
Cable de corriente alterna Falla Crítico Degradado
Suministro de energía Falla Crítico Degradado
Redundancia (para el sistema de energía) Normal Informativo Operativo
Redundancia (para el sistema de energía) Degradado Leve Degradado
Redundancia (para el sistema de energía) Perdido Grave Degradado
Temperatura Normal Informativo Operativo
Temperatura Advertencia Leve Degradado
Temperatura Falla Crítico Degradado
Térmico Apagado Crítico No operativo

[Volver al principio]