NetSaintの基本的な用語


・NetSaintの基本的な用語

すぐにでも、設定ファイルを編集して稼動させたいところですが、その前にNetSaintの基本的な用語をいくつか説明しておきます。
NetSaintを運営・管理していく上で、最低限これらの用語を理解しておかなければなりません。

なお、ここでいう「ホスト」とはサーバーやルーターのような物理的なものを指し、「サービス」とはSMTPやPOP3、WWW、稼動中のプロセス等のソフト的なものを指します。




(1)プログラム・モード (Program Modes)
NetSaintのプログラムモードには「アクティブ・モード」と「スタンバイ・モード」の2種類のモードがあり、NetSaint本体を次のような条件で稼動させます。

アクティブ・モード 監視しているホストやサービスに問題が生じた場合、あらかじめ登録している通知先に連絡する。
デフォルトの設定。
スタンバイ・モード 監視しているホストやサービスに問題が生じても通知せずに、そのまま監視を続ける。
アクティブ・モードに戻るまで何も通知しない。             



(2)ステータス・レベル (Status Levels)
監視しているホストやサービスの「状態」(Status Levels)を表します。
次に説明する「(3)ステート・タイプ」(State Types)との違いに注意してください。
ホストとサービスでは異なる「ステータス・レベル」を使います。

 ・サービスのステータス・レベル
ステータス 説            明
PENDING そのサービスはまだチェックされていない。(NetSaintのスタート直後等)
OK そのサービスは正常に稼動している。
RECOVERED 前回チェックした時は「WARNING」、「UNKNOWN」又は「CRITICAL」の状態であったが、今回のチェックでは「OK」の状態に復活した。
WARNING 何らかの問題が発生しているが、致命的な状態とはなっていない。
UNKNOWN プラグインの内部的なエラーによる状態であり、NetSaint自体は「WARNING」と同じ状態と見做す。
CRITICAL 重大な問題が発生しているか、完全に利用できなくなってしまっている。。
UNREACHABLE そのサービスを提供するホスト本体にping等が届かないため、サービス自体のチェックができない状態。
HOST DOWN 最後にサービスをチェックした時点で、そのサービスを提供しているホスト自身がダウンしている。

 ・ホストのステータス・レベル
ステータス 説          明
PENDING そのホストに対するサービスのチェックが済んでいないため、ホスト自体の状態がわからない。(NetSaintのスタート直後等)
UP そのホストは正常に稼動している。
DOWN そのホストはダウンしている。
UNREACHABLE そのホストの上位のホストがダウンしているため、チェックできない。



(3)ステート・タイプ (State Types)
これもホストやサービスの「状態」(state)を表します。
statusstate のニュアンスの違いを日本語でうまく表現する方法が思いつきません。(~_~;)
NetSaintでは、「ソフト・ステート」(soft)と「ハード・ステート」(hard)の2つステート・タイプがあり、その状態によって通知を発したり、次に説明する「イベント・ハンドラー」を実行するタイミングを決定する重要な判断要素となります。
NetSaintでは監視しているホストやサービスが本当に問題が発生していると判断するまでの最大チェック回数を予め設定しておきます。(hosts.cfgという設定ファイルの<max_attempts> という項目で設定します。)
そして、ホストやサービスをチェックする時に、何回目かということでそのホストやサービスのステートを判断します。
各ステートの意味とその時にどういうことが起こるのか、を次に示します。

・ソフト・ステート
ホストやサービスが次のような状態になったことをいいます。
  ・チェックした結果はOK以外だが、最大チェック回数には達していない時。
   (これを「ソフト・エラー・ステート」といいます。)
  ・「ソフト・エラー・ステート」からリカバリーした時。

・ソフト・ステート・イベント
ソフト・エラー・ステートとなった時やリカバリーした時に、次のようなことを実行させることができます。
  ・ログの記録
  ・イベント・ハンドラーの実行
ソフト・ステート・エラーの場合、本当の問題が発生したわけではありませんので、メール等での通知は行われません。
ここで重要なのは、「イベント・ハンドラー」を実行するようにできるということです。
もちろん、「イベント・ハンドラー」を実行するためには、事前にいろいろと設定しておく必要がありますが、これは非常に面白い使い方ができます。
詳しい内容は、応用編で説明しますので、お楽しみに。(^_^)

・ハード・ステート
サービスが次の状態になったことをいいます。(ホストについては次に説明します。)
  ・チェックした結果はOK以外だが、最大チェック回数には達していない時。
   (これを「ハード・エラー・ステート」といいます。)
  ・「ハード・エラー・ステート」からリカバリーした時。
  ・チェックした結果はOK以外だが、ホスト自身が「DOWN」か「UNREACHABLE」である時。

また、ホストが次の状態になったことをいいます。
  ・チェックした結果はOK以外だが、最大チェック回数には達していない時。
   (これも「ハード・エラー・ステート」といいます。)
  ・「ハード・エラー・ステート」からリカバリーした時。

・ハード・ステート・チェンジ
「ハード・ステート・チェンジ」とは次のような状態を表します。
  ・OKの状態からOK以外の状態になった時。
  ・OK以外の状態からOKの状態になった時。
  ・あるOK以外の状態から別のOK以外の状態になった時。
   (たとえば、「WARNING」から「UNKNOWN」になった時などです。)

・ハード・ステート・イベント
ハード・ステート・イベントの内容は、ハード・ステートとハード・ステート・チェンジのパターンによって変わります。

  ・ハード・ステート・チェンジし、かつホストやサービスがOK以外の状態の時。
     ・ログの記録
     ・イベント・ハンドラーの実行
     ・問題が発生したという通知

  ・ハード・ステート・チェンジし、かつホストやサービスがOKの状態の時。
     ・ログの記録
     ・イベント・ハンドラーの実行
     ・リカバリーしたことの通知

  ・ハード・ステート・チェンジしていないが、ホストやサービスがOK以外の状態の時。
     ・問題が発生しているという再通知

  ・ハード・ステート・チェンジしていないが、ホストやサービスがOKの状態の時。
     ・何も起きません。(~_~;)



(4)イベント・ハンドラー
(Event Handlers)
イベント・ハンドラーについては、先にも書きましたように「応用編」で詳しく解説しますので、ここでは、言葉の意味を説明するだけとします。(今までの説明の中で、大体のニュアンスはお分かりかと思いますが。)

イベント・ハンドラーとは、文字通り「ホストやサービスの状態(state)が変化したときに実行されるコマンド」のことです。
一番多い使われ方は、問題が発生した初期の時点で、通知先に連絡する前にNetSaint自身がその問題を解決できるようにすることです。
その他には、ホストやサービスのログを外部のデータベースに記録させるという使い方もあります。



とりあえず、以上の4項目について理解いただけたでしょうか。
あまり得意ではない英語を読みながらの説明ですので、誤った解釈をしているところがあるかもしれません。
お気づきの点がありましたなら、BBSに書き込むか、Webmaster宛にメールで教えてください。

それでは、いよいよNetSaintの各種設定ファイルについて説明していきます。

back HOME