タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

nagiosに関するdbfireballのブックマーク (4)

  • Nagios と derived でMySQLのスロークエリの量を監視する - blog.nomadscafe.jp

    新しい機能をリリースした際に、MySQLに対して効率的ではないクエリが発行されてしまって、それが積もってサービス全体に影響が出てしまう前に発見してアラートをあげたい。 発見する手立てとしてはCPU使用率やInnoDBのROW OPERATIONSが考えられるところですが、今回はスロークエリが発生した回数を監視することにした。ちなみにいつものことながら対象とするMySQLは4.0系。long_query_timeがオンラインで変更できません。。。はい MySQLのスロークエリが発生した回数は、show status のSlow_queriesという項目でみることができて mysql> show status like 'Slow_queries'; +---------------+-------+ | Variable_name | Value | +---------------+---

  • Nagiosでシステム監視 その1 インストール

    インターネットシステムには障害がつきものです。人為的なミスもあれば、ハードウエアが自然に故障することもあります。これらを事前に想定して防止をすることも重要ですが、障害をなくすことはまず不可能です。 起きてしまった障害の被害を最小限にい止めるため、いかに早くシステム管理者がこれに気づき、正しい対処をすることが重要になります。しかし人力で監視するのは無理があります。 そのため、システムとネットワークを監視するアプリケーションがあります。指定されたホストやサービスを監視し、障害や復旧時に通知します。システムへの負荷は微々たるものですし多少制約があっても使っておいて損はないと考えます。 今回は、システムを監視する、Nagiosサーバをインストールして立ち上げるまでをやってみたいと思います。 オンラインで利用できる監視サービスもありますが、自前でNagiosサーバを立ち上げると、たくさんのホスト

    Nagiosでシステム監視 その1 インストール
  • Nagios × boundioを使った鬱陶しいアラートの作り方 β

    fujya.shです。はじめての人は、はじめまして!そうじゃない人はお久しぶりです。 最近暑いですね。サーバールームの温度も少し上がってきたので、あぁ当の夏がやってきたんだなと実感できる今日この頃です。 今回はboundioというKDDIウェブコミュニケーションズが提供している電話APIサービスを使って少しもにょもにょしてみたいと思います。 ■アラートメールがジャンジャン来るとむしろ気づかない。じゃあ電話じゃない? 運用しているサービスが増えてきたり、サーバーの台数が増えてくるとアラートメールがジャンジャンきたりしますよね?来ならばそういった場合にアラートの原因をすぐさま対策するか、しきい値の変更を実施すれば良いのですが時間的な制約で次週へ持ち越し・・・なんて事も稀にある話です。 そんな時にメールボックスがパンクしてしまい、ほんとうに大事なアラートに気付けない事もあるって話を聞いたり聞

  • fluentdでNagiosアラートの集約 « ボーダーレスライフ

    RRDなどにメトリクスを書き込んでグラフを生成している場合、標準的なサーバだとCPUかHDDがボトルネックになって、Nagiosサーバ1台あたり持てるクライアントは、300台〜700台くらいが限度といったところでしょう。 数万台のサーバを管理する様な環境では、Nagiosサーバ単位で情報が分断されてしまうので、関連するシステム(特に他部署が管理している様な)の状況が把握しづらいことがよくあります。 全サーバの状況を横断して検索、リスティングができると、障害時の対応時間を短縮できるし、統計情報の取得ができるとメトリクスdrivenな運用&開発もしやすくなり、プロダクトの質も向上するだろうということでfluentdでやってみました。とは言ってもまだ始まったばかりなのですが、下の図の様な構成で、Nagios上のイベントログをfluentdがtailし、必要なイベントログをfluentd serv

  • 1