2012年10月30日火曜日

障害通知メール設定その2

前回からの続きになります。
■通知メール設定

通知メールの設定はメディアタイプとユーザーの設定を行うことで、
メールが送信されるようになります。

上部のメニューから「管理」→「メディアタイプ」をクリックした後に、
メディアタイプ一覧から「Email」をクリックする。

メディアタイプの設定を次のようにする
※sendmailが起動している場合。外部メールサーバーなどを利用する場合にそちらの環境にあわせる。
ただし、SMTP AuthやSMTPSなどには対応していないそうです
説明:Email
タイプ:メール
SMTPサーバー:localhost
SMTP helo:localhost
送信元メールアドレス:zabbix@localhost

■ユーザーの設定

インストール直後には、admin,guestユーザが作成されている。
上部のメニューから「管理」→「ユーザ」をクリックした後に、
右側にあるプルダウンから「ユーザ」を選ぶ。

そうすると、次のような画面が表示されます。

その中からアカウント名のAdminをクリックすると
Adminの設定画面が開きます。

メディアの項目にある、追加を押すと新規メディアの登録画面が開きます。
そこで、タイプをEmailを選択して、送信先に障害時などに受け取りたいメールアドレスを記述します。
有効な時間帯は、障害時発生時に通知を受け取る時間帯になります。
デフォルトで入ってるのは、「1-7,00:00-24:00;」で、カンマの前半が曜日の指定で、後半が時間指定になる。
デフォルトの設定は全ての曜日を24時間を対象とする設定になっている。
;セミコロンで一つの定義になるため、複数定義したい場合には;で区切ること。
前半の日付は、1:月曜日、2:火曜日...7:日曜日の値を利用する。
後半の時間は、MM/HHで指定する。2桁表記。
たとえば、「1-2,10:00-24:00;6-7,10:00-20:00;」の表記は
月曜日、火曜日の10時から24時までと、土曜日と、日曜日の10時から20時までを対象とする定義になります。

入力が終わったら、追加を押してメディアの登録が完了になります。
(※まだ設定は保存されていません。)
ユーザの設定画面に戻った時に、

メディアの欄に先程設定した内容が追加されていると思います。
この画面で保存を押すと、先程設定したメディアが保存されて反映されます。
※Adminユーザーのパスワードがデフォルトのままであればついでに、
任意のパスワードに変更しておきましょう

■障害通知メールの確認

次は、上記で設定した障害通知メールが正常に動作するか確認してみます。

zabbix-serverでは、/etc/passwordファイルのチェックサムを監視するアイテム設定と、
チェックサムの値が前回取得値と異なった場合に、障害と検知するトリガーが設定されているらしいです。
なのでユーザーの追加を行うと障害として検知されるので、それを利用して障害を発生させてみる。

useradd testuser

/etc/passwordのチェックサム監視は10分間隔で行うように設定されているため、
検知されるまで少し時間がかかるそうです。


イベント発生時に、アクションの欄が失敗になっている場合には、メール送信が失敗している。

失敗しているイベントの時間の項目にあるリンクをクリックすると、
そのイベントの詳細が見れるの確認してみる。
イベントの詳細画面でメッセージアクション内にエラー内容が表示されている。 今回は次のようなエラーが発生していました。
cannot connect to SMTP server [localhost]: *** Cannot connect to [[localhost]:25]: [111] Connection refused

とりあえず、このエラーを回避する為に、先程設定したメディアタイプの設定を変更します。
メニューの「管理」→「メディアタイプ」のEmailの設定を「localhost」から127.0.0.1に変更すれば解決しました。
根本的に解決するには、サーバーにIPv6用の設定をする、あIPv6を無効にする方法があるみたいです。

正常にメールが送信された時のイベント詳細画面はこちらのようになります。

■障害通知の流れ。

1.アイテム設定で各ホストからステータス情報を収集し、データベースに保存する。
2.収集したデータを元に、トリガーで設定されている条件を元に、状態が変更された場合にイベントを生成する。
3.イベントが生成された際に、設定されているアクションが実行される。

という流れなのかな・・・?

アイテム設定で収集されたデータの最新データは「監視データ」→「最新データ」で確認ができる。
トリガーでステータスが変わったものは「監視データ」→「トリガー」で確認できる。
トリガーによって発生したイベントは「監視データ」→「イベントで確認できる。

参考URL

0 件のコメント:

コメントを投稿