Server Administrator は、イベントの種類を使用して、システムの重要コンポーネントに影響するイベントを分類します。 コンポーネントの状態として表示される最も一般的なイベントの種類は、正常、警告、重大の 3 種類です。
このヘルプモジュールでは、イベントの種類、状態、重大度に関する用語を定義しています。 このヘルプモジュールを読むと、Server Administrator がモジュールを分類し、コンポーネントの正常性を識別するために使用されるさまざまな用語について詳しく知ることができます。
Server Administrator がコンポーネントの正常性を報告している場合もイベントを分類している場合も、区別できるイベントの属性は次のとおりです。監視しているコンポーネントまたは冗長性、種類、状態、およびコンポーネントが処理しているイベントの重大度。
[トップに戻る]
Server Administrator はコンポーネントとその冗長性との両方を種類、重大度そして状況に応じて分類します。
システムに存在するコンポーネントはすべてがそれぞれに重要な役割を持っています。Server Administrator などのシステム管理アプリケーションでは、一部のコンポーネントに特に注目します。システムの正常性を保つには、システムコンポーネントを正しく動作させるための適切な電圧の電力供給がとりわけ重要になります。 電力はシステムの交流電流(AC)スイッチを通じてシステムの電源装置に供給されます。 またシステムの各コンポーネントはシャーシ内の温度が機能範囲であることを必要とします。 プログラム実行とデータ計算には、よく機能するランダムアクセスメモリが必要です。 これらの要件から、モニタ電源スイッチ、電源装置、ファン、およびシステムメモリは、Server Administrator が監視するコンポーネントの中でも最重要と言えます。
Server Administrator は冗長コンポーネントの正常性を監視し、冗長性の状態をシステムにレポートします。
企業体や組織の業務に照らし合わせたシステムの重要性によって、冗長性を計画したシステムコンポーネントをシステムに導入します。組織の業務に重要なシステムほど、冗長コンポーネントが必要になります。冗長コンポーネントは、対になるコンポーネントにエラーが発生した場合に、その代替を果たすように設計されたものです。 冗長性があれば、システムシャットダウンやコンポーネントの損傷によるダウンタイムからシステムを保護できます。
システム全体に対する完全冗長とは、すべてのデバイスが正常な状態で稼動していることを意味します。あるシステムの完全冗長に必要なファンの数が 4 台で、その 4 台がすべて稼動している場合、そのシステムのファンコンポーネントは完全冗長状態にあるということができます。2 台のプライマリファンのどちらかにエラーが発生しても、バックアップが用意されています。完全冗長には通常のメンテナンス以外の対応は必要ありません。
低下冗長とは、完全冗長に必要なコンポーネントの一部が稼動していないことを意味します。 システムは運用可能でも、コンポーネントエラーが発生した場合に、それを代替できるコンポーネントが十分ありません。たとえば、完全冗長に必要なファンの数が 4 台で、実際に稼動しているファンが 3 台の場合、低下冗長とみなされます。 2 台のプライマリファンのうち 1 台のみにエラー時のバックアップがあります。
喪失冗長とは、システムエラーを防ぐための最低限の数のコンポーネントしか動作していないことを指します。冗長コンポーネントは作動していません。完全冗長のために 4 台のファンが必要で、実際には 2 台しか稼動していない場合、ファンにエラーが発生すると、どちらのプライマリファンにもバックアップがありません。
[トップに戻る]
イベントは種類によって分類されます。 例えば、正常、警告、重大などです。
正常イベントはコンポーネントがシステム内でその機能を適切に実行できる値の囲内で作動していることを示します。状態が正常のコンポーネントにしばしば適用される別の用語は、OK です。コンポーネントが OK またはイベントが正常である場合は、システムオペレータは対応処置を取る必要がありません。
警告イベントは、管理コンポーネントは最適に作動していなくても、まだ作動可能な場合に発生します。警告イベントはシステムオペレータにリードタイムを提供します。 警告イベントに対する適切な処理は、詳しく調査してコンポーネントメンテナンスを日程に入れることです。警告は、そのコンポーネントが正常に戻るまで、システムオペレータにより注意を払うように警告します。パワーユーザーとシステム管理者は、警告イベントに対する最小値と最大値を定義できます。パワーユーザーとシステム管理者の警告範囲を定義する特権では、パフォーマンスに低下の兆しを示し始めたコンポーネントへの対処に必要なリアクションタイムを組み入れることができます。
重大イベントは、コンポーネントが適切な機能範囲外で作動しているか、まったく作動していないことを示します。 まったく作動していないコンポーネントは回復不能とみなされることがあります。コンポーネントを開発し、その機能を最もよく理解しているシステムメーカーがコンポーネントの重大範囲を定義します。 重大イベントは緊急を要します。システムオペレータにとってこの種のパフォーマンス低下は深刻な問題となります。 コンポーネントに重要事項やエラーが発生した場合は、システムの速やかなシャットダウンや交換するコンポーネントの緊急手配などを行います。
[トップに戻る]
コンポーネントの状況またはシステムアトリビュートには、作動可能、低下、作動不能があります。
作動可能な温度とは、シャーシ内部にある温度プローブの読み取り値が正常な作動範囲内にあることを意味します。
低下温度とは、シャーシ内部にある温度プローブの読み取り値が作動温度の最低と最高とで定義された警告範囲内にあることを意味します。シャーシ内の温度が正常温度の最小値を下回るか、正常温度の最大値を超えています。
低下冗長とは、各重要コンポーネントにエラーが発生した場合に、代替可能なバックアップ用のコンポーネントが足りないことを意味します。
作動不能のコンポーネントまたはコンポーネント属性とは、そのコンポーネントがエラーまたは回復不能の範囲で動作していることを意味します。温度の例をとると、システムはまだ作動していますが、温度が正常範囲のはるか上または下なので、システムのサーマルシャットダウンをトリガするか、または温度がシステムコンポーネントを損傷または破壊する恐れがあります。
[トップに戻る]
コンポーネントの各イベント種類と状態は、その重大度にしたがって評価されます。 イベントの重大度には、情報、マイナー、メジャー、重要があります。
正常なイベントまたはコンポーネントの状態は作動状況にあり、正常イベントに関連する重大度は情報のみです。Server Administrator は正常なイベントに対しては情報提供のみを行います。Server Administrator はシステムオペレータにコンポーネントが正常であることを通知します。
警告イベントはコンポーネントによってマイナーか重要になります。例えば、ファン冗長システムからファンを 1 台取り外したときのイベントの重大度はマイナーとなります。
警告イベントはシステムのメジャーリスクを示す場合もあります。ファンがシステムから外されている期間が長期になると、冗長度が低下するためイベントがメジャーに変わる場合があります。組織の業務に応じて冗長性を要するコンポーネントが長期間システムにないと、バックアップの欠如によってコンポーネントエラーを引き起こし、それがシステム全体のエラーに進展する可能性があります。
エラー範囲にある重要状態のコンポーネントを検出したイベント。ファンや AC コード、メモリモジュールなどのコンポーネントにエラーがあると、システムの稼動状態やデータ保存機能を著しく損ないます。
[トップに戻る]
以下の表は重要コンポーネントに対するイベント例を提供し、イベントの種類、重大度そして状況がどう関連しているかを示します。
コンポーネント | イベントまたは警告の種類 | 重大度 | 状況 |
AC コード | 正常 | 情報 | 作動可能 |
AC コード | エラー | 重要 | 低下 |
電源装置 | エラー | 重要 | 低下 |
冗長性(電源システム) | 正常 | 情報 | 作動可能 |
冗長性(電源システム) | 低下 | マイナー | 低下 |
冗長性(電源システム) | 喪失 | メジャー | 低下 |
温度 | 正常 | 情報 | 作動可能 |
温度 | 警告 | マイナー | 低下 |
温度 | エラー | 重要 | 低下 |
サーマル | シャットダウン | 重要 | 作動不能 |
[トップに戻る]