タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

monitoringとalertに関するmanabouのブックマーク (1)

  • 本当に必要なアラートだけを選別したい | IIJ Engineers Blog

    大量のアラートを、どうさばくか サーバやネットワークが正常に作動しているかどうか監視しつづけ、障害発生にすばやく対応するのは、運用担当者の大事な仕事です。IIJではネットワークだけでなく、アウトソーシングとしてお客様のシステムを多数運用していますが、それらの中にはオープンソースの統合監視ソフトウェア「Zabbix」を使っている案件もあります(もちろん、他の監視システムを使っている案件もあります)。Zabbixで対応しているアラート件数は、年間1000万件にのぼります。 これだけの数があると、ワーニングや単なるノーマルメッセージなど「対応不要」なアラートは最初から見たくありません。瞬間的にアラートが大量発生するときの「重複」も我慢できません。真に対応すべきものの選別すら、できれば人間の手を動かしたくはありません。 そこでIIJは、自分たちが使うための運用自動化ツールを開発しました。この自動化

    本当に必要なアラートだけを選別したい | IIJ Engineers Blog
  • 1