タグ

監視に関するn314のブックマーク (16)

  • 監視について思うとこ - y-ohgi's blog

    TL;DR 監視はユーザーにサービスを提供できているかを観測するための行為 SLI/SLOを定めて、SLOを守れるようにモニタリングする ダッシュボードは定常的に表示しておくものと障害時に活用するものを作ると良い アラートはレベル分けして人間が対応しなければならないものだけ人間へ通知する 監視とは サービスを健全に動作させ続けるために監視を行います。 「健全に動作している」の定義はサービスによって異なり、ユーザーにWebページを見せることができることだったり、バッチが正常に終了することだったりします。 最終的にユーザーに正常にサービスを提供できていることを観測するために行うことに変わりはありません。 さてユーザーにサービスを提供するために何を監視しましょうか? クラウド前提であれば個人的にリソースベース(CPU/Memory)より、 SLI/SLOをベース に監視する事が望ましいと考えてい

    監視について思うとこ - y-ohgi's blog
    n314
    n314 2019/08/19
    いまいち自分なりの定番が決まらなくて毎回別のことやってる
  • バッチプログラムの運用と監視について検討しよう | メルカリエンジニアリング

    こんにちは。メルペイでバックエンドソフトウェアエンジニアをしている id:koemu です。 バッチプログラムのお話、今回は運用・監視についてお話したいと思います。当社はすべての業務が24時間行われていますので、システムがオンラインのときに動作するバッチプログラムについてのみ議論します。 過去の記事はこちらにあります。 運用に備えて バッチプログラムの運用について、「プリモーテム」「実行管理」そして「ログ管理」の3点について述べていきます。 プリモーテム ポストモーテムという言葉を聞いたことがある方はいらっしゃるかと思います。ポストモーテムとは、GoogleのSREの15章*1によれば、障害などの失敗を振り返り、今後に活かすプロセスの総称と捉えることができます。 さて、プリモーテム(プリモータム)とは何でしょうか。この言葉は、私が最近読んだThe Manager’s Path*2*3で使

    バッチプログラムの運用と監視について検討しよう | メルカリエンジニアリング
    n314
    n314 2019/04/18
    異常も正常もとりあえず通知にしてしまいがちだよなあ。とりあえず通知じゃなくて業務上毎日見る画面に最終起動日時を緑と赤で出し分けておくのが手間も少ないかなあとか考えてる。
  • 次世代監視の大本命! Prometheus を実運用してみた - Qiita

    こんにちは!freeeでインフラゾンビをやっている @sugitak です。ゲームではレベルを上げて物理で殴る派です。 freee ではたまにインフラエンジニアの数が減るのですが、その減ったインフラエンジニアはインフラゾンビへと進化し、社内を闊歩します。インフラゾンビは主に開発チームに所属して、アプリっぽいインフラの仕事をインフラからアプリ側へと持っていきます。デプロイとか、Dockerとか、Jenkinsとかの、いわゆる DevOps 系のところですね。こうすることで開発者は手を出せるものの自由度が増えるし、インフラはより来のインフラとして純度を上げていける、 so, win-win ってわけです。 さて、そんなわけで監視です。freee Engineers Advent Calendar 2016の9日目の記事として、 Prometheus による監視が最高なのでみんなもっと使おうと

    次世代監視の大本命! Prometheus を実運用してみた - Qiita
  • WEB系各社で使われている監視ツールまとめ - mikedaの日記

    次世代 Web カンファレンスで監視について話すことになったので、ネタとしてWEB系各社で使っている監視ツールを調査中。 うちはこれ使ってるよ!!!ってのがあったら@mikedaにメンションください! Cookpad Zabbix 昔はNagios+muninだけど台数増えて性能的に破綻した ビューはそのままじゃ辛いのでmunin風に表示するのを自作 StatusCake DataDog。サービス系、サーバに紐付かない系の監視に。DashBoard便利 waker。通知用。PagerDuty高い、と言ってryot_a_raiが秒で作ったらしい Kibana imon。独自のリアルタイムなサービス稼働状況表示ツール NewRelic 試し中なもの Real-User Monitoring : JSでbeacon飛ばしてfluentd -> BigQuery。Google SpreadShee

    WEB系各社で使われている監視ツールまとめ - mikedaの日記
  • Zabbix3.0注目機能「通信暗号化」、「管理画面の改善」、「監視結果予測機能」紹介 ~Zabbix Conference 2015参加レポート~ | Tech-Sketch

    Zabbix3.0注目機能「通信暗号化」、「管理画面の改善」、「監視結果予測機能」紹介 ~Zabbix Conference 2015参加レポート~ OSSの統合監視ソフトウェア「Zabbix」の国際カンファレンス「Zabbix Conference 2015」が北欧の国ラトビアの首都リガで9/11,12の2日間開催されました。このカンファレンスに参加し、Zabbix3.0の最新情報など聞いてきたのでその模様をお届けします。TISからは、TIS独自のZabbixに対する取り組みである"HyClops"に関して発表してきたので、その内容についても紹介します。 Zabbix Conferenceとは? こちらの記事でも紹介されているように、Zabbixの開発元企業であるラトビアの首都リガにあるZabbix社主催で年次開催されている国際カンファレンスです。世界各国のZabbixユーザ、コミュニテ

    Zabbix3.0注目機能「通信暗号化」、「管理画面の改善」、「監視結果予測機能」紹介 ~Zabbix Conference 2015参加レポート~ | Tech-Sketch
  • Cacti/JavaのVMを監視 - ピノキヲ IT Wiki

    ピノキヲ IT WikiJVMのSNMP出力設定 † 簡単にSNMP参照するにはJavaのオプションとして下記3つを付け加えます。 -Dcom.sun.management.snmp.port=1161 -Dcom.sun.management.snmp.acl=false -Dcom.sun.management.snmp.interface=0.0.0.0 ポート番号1161でACLファイルは参照せず、community名がpublic、任意のIPからSNMPで参照できる設定となります。 セキュアな社内ネットワークでのみ設定できるオプションなので注意してください。 この設定でJVMを起動したのち、snmpwalkで参照すると下記のようになります。 [root@pinoki ~]# snmpwalk -c public -v2c 192.168.1.1:1161 .1.3 SNMPv2

  • PHP製監視ツール Cacti (URL監視編) | DevelopersIO

    日の課題 こんにちは植木和樹です。日はサーバの監視について取り上げたいと思います。Webサーバーを立てたらサービスが正常に稼働しているかチェックしておきたいものです。さらに異常を検知してメールで通知を受けることができれば、なるべく早く原因調査と対応に着手することができ、機会損失を最小限に抑えることができます。 さて監視となると「監視ツール」を利用するのが機能も豊富で設定も簡単です。そんな監視ツールが世にはたくさん溢れています。オープンソース・ソフトウェアだとZabbix、Nagios、Muninなどが代表的なところでしょうか。日は「Cacti(カクタイ)」という監視ツールを使ったURL監視をご紹介したいと思います。 2013年8月24日にCactiでURLの監視ができるプラグインがリリースされました。日はこのプラグインを使った監視を試してみたいと思います。それでは設定していきましょ

    PHP製監視ツール Cacti (URL監視編) | DevelopersIO
  • Webインタフェースでマシンを監視する4つの方法 | OSDN Magazine

    システム管理者は、サーバの状態にたえず目を光らせ、順調に稼働しているかどうかを確かめる必要がある。問題が見つかった場合には、その発端がいつだったのか、そこで何が起こったのかを詳しく調べることになる。そのためには、定期的にログをとり、そのデータをすばやく分析できる手段が必要だ。この記事では、Webインタフェースから1台または複数のサーバを監視できるツールをいくつか紹介する。 それぞれのツールは、ねらいどころが少しずつ違っている。以降ではすべてを順に説明していくので、自分の環境に合ったものを見つけてほしい。どんな言語と方法でデータのロギングを行っているかによって、システムの処理効率は大きく変わってくる。たとえばcollectdは、C言語で書かれたデーモンなので、システム情報を収集するために新しいプロセスを生成する必要がない。一方、Perlで記述され、cronによって定期的に生成されるものもある

    Webインタフェースでマシンを監視する4つの方法 | OSDN Magazine
  • cactiを使ったサーバ監視

    view行最後の番号はMIBのオブジェクトIDで、この番号で機器の情報を指定できるようになっています。 http://www.atmarkit.co.jp/fnetwork/rensai/snmp03/01.html に分かりやすい説明があります。 snmpdを起動したら、ちゃんと動くか確認します。監視対象サーバで /usr/bin/snmpwalk -v 1 -c local localhost .1.3.6.1.2.1 のようなコマンドを実行して、いろんな情報が出てくれば成功です。 -vはsnmpのバージョンで1なら1、2なら2c、3なら3を、-cはコミュニティ名を指定します。 cactiサーバからも監視対象サーバを指定して実行しておくといいと思います。 2.cactiで監視対象サーバを追加 consoleメニューのDevicesで、右上のAddから追加します。 Host Templa

    cactiを使ったサーバ監視
  • 大規模インフラの監視システム | GREE Engineers' Blog

    こんにちは。インフラチームの ebisawa です。 今回はグリーのインフラにおける各種機器の監視がどのように行われているのかご紹介させていただきたいと思います。一般にサーバの監視というと、システムダウンを検出するための死活監視を意味する場合と、ネットワークトラフィック等のモニタリングのことを意味する場合とがあります。今回の監視は特に後者についてのお話です。大規模なインフラの監視には、やはり特有の課題があります。 どんなツールを使っているのか グリーではサーバの各種リソース使用状況をモニタリングしてグラフ化するためのツールとして、Cacti を利用しています。Cacti は、大変有名なツールなので皆様ご存知かと思いますが、バックエンドの RRDtool で作成したグラフを閲覧するための使いやすいユーザーインターフェイスを備えています。 http://www.cacti.net/ ツールの使

    大規模インフラの監視システム | GREE Engineers' Blog
  • スケーラブルWebシステム工房 第3回 / 監視にまつわるエトセトラ

    スケーラブルWebシステム工房 第3回 監視にまつわるエトセトラ 更新日: 2023-11-07 19:20:41 +0900 公開日: 2011/05/25 発売日: 2007/8/24 この文書は2007/8/24に書かれたもので、ソフトウエアの名称、バージョン、設定項目、社名などの固有名詞などなどは当時のまま掲載しています。 ですので、インストール手順や設定内容は最新版のドキュメントを参照していただき、この文書からは理論や考え方、構成のヒントなどを読み取っていただければと思います。

  • dstat + fluentd + Elasticsearch + kibana でサーバモニタリングする - blog.nomadscafe.jp

    普段はサーバのメトリクス可視化のためにcloudforecastを使っていますが、某案件用に数秒単位で数十台のサーバのメトリクスを表示したいので、記事タイトルのような構成を作ってみた。 dstatでとった各種値の他に、nginxとmemcachedの情報も合わせて表示させています。 セットアップ もろもろのセットアップのメモ 監視サーバ まず、監視サーバにElasticsearchとkibanaをいれる。環境はCentOS6 $ sudo yum install java-1.7.0-openjdk $ sudo rpm -Uvh https://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-1.x.x.noarch.rpm Elasticsearchは特に設定なく起動 $ sudo service

    n314
    n314 2014/03/28
    かっこいいは正義
  • 監視ソフトをNagiosからSensuに切り替えて2ヶ月経ったのでまとめた - Glide Note

    新規サービス用の監視をNagiosからsensuに切り替えて2ヶ月経ったので、 導入時の調査で社内で公開してたissueと、投入して2ヶ月間運用した記録を公開しておこうと思う。 というか以前Sensuの事を書くと公言していたのに、すっかりサボっていて 昨日@ma0eさんのブログを見て下記のやり取りを思い出して急いで書いた… @ma0e We started using it. @glidenote will report the detail soon, I think. — kentaro (@kentaro) 2013, 10月 30 @kentaro @glidenote that would be nice — Mitsutoshi Aoe/maoe (@ma0e) 2013, 10月 30 導入環境はCentOS 6.4で、利用しているsensuのバージョンは0.12.1-1にな

  • 完璧な監視システムの作り方 in cybozu.com - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちは、Hazama チームの萩原(@hagifoo)です。 ハードウェアは故障し、ソフトウェアにはバグがあり、運用ではミスがおきるもの。もちろん、障害が発生しないのが理想ですが人間が作ったものに完璧はありません。そこで、障害の前兆や発生を捉え、その詳細を運用チームに知らせるための監視システムが必要となります。cybozu.com でも以下のようにありとあらゆるものを監視するシステムを構築し日夜監視を行なっています。 今回は、そんな cybozu.com の監視(モニタリング)システムについてお話しします。 cybozu.com と障害 監視システムの設計 3つの監視 外形監視 症状監視・リソース監視 ログ監視 その他の監視 モニタリングフレームワーク 誰が監視者を監視するのか? まとめ cybozu.com と障害 まずは、監視対象である cybzou.com について説明します。

    完璧な監視システムの作り方 in cybozu.com - Cybozu Inside Out | サイボウズエンジニアのブログ
  • サーバ運用の現場でひたすら監視し続けるエンジニアの手の内のすべて

    2013年3月19日 Tokyo Linux Study #5 #tlstudy の発表スライドです。 ZABBIX(赤) × Munin(緑) 。どうして両方を使う事になったのか?という話しがメイン。 サブタイトル「@zembutsuがホスティングサービスの監視パワーを強化しようとするけどとんでもないことになる話」

    サーバ運用の現場でひたすら監視し続けるエンジニアの手の内のすべて
  • 【linuxログ】 messages や secure 、maillog などを、毎日テキストエディタで開いて目視でチェックしているのですが チェックしづらくて面倒です。…

    linuxログ】 messages や secure 、maillog などを、毎日テキストエディタで開いて目視でチェックしているのですが チェックしづらくて面倒です。 (のべチェック行数は一日300~1000行程度、チェックは エラーや不正アクセスの確認など一般的な保守が目的です) 何か良い方法の提案をお願いします。 ログビューアがあればそれでもいいです。 その場合はlinuxのモノでもwinのモノでも構いません。 自分で加工スクリプトを作ってcronで動かそうと思ったんですが、何が最善なのかわからないので、 いろんな方法を募集させていただきます。

  • 1