[B! 監視] ombranのブックマーク

冴えないAWS環境の育てかた α | DevelopersIO

中山ですソリューションアーキテクトとして、AWS環境の利活用をお手伝いするお仕事をしています。まれによく見るAWS環境とりあえずこれを見てほしい。これが絶対にだめと言いたいわけではないです。一時的な検証環境だったり、とにかくスピード重視でサービスをデリバリーさせる必要があったり、サービスの提供者側が何ら責任を負わない・障害時のビジネスインパクトが無い（そんな状況あるのか？）という前提があったり、状況次第ではこれで十分な時もあると思います。しかし、一般的な業務システムやサービスの場合にはいろんな意味で不十分でしょう。では、このような環境をどのように育てていくとよいでしょうか。この記事では、そんな育てかたの一例を紹介していきたいと思います。なお、本記事はくっそ長いです。ちなみに、最終的にはこうなります。文字が小さすぎて読めない！ちょっとそこのハ○キルーペ貸してくれーｗ

ombran 2020/09/18

リンク

3〜4時間でAWSの監視系のサービス一気に学べたらコスパ良いと思いませんか | DevelopersIO

突然ですが、以下の機能がそれぞれどういうものかすべてご存知でしょうか？ CloudWatch ServiceLens X-Ray CloudWatch Contributor Insights CloudWatch Synthetics CloudWatch Container Insights CloudWatch Logs Insights CloudWatch メトリクス Metric Math 検索式カスタムメトリクス CloudWatch ダッシュボード CloudWatch 異常検出（Anomaly Detection） CloudWatch 埋め込みメトリックフォーマット CloudWatch アラーム異常検出に基づいたアラーム複合アラーム私はわからなかったですね。ここ 1〜2年のCloudWatch系のアップデート量は凄まじいなと個人的には思っていて、Cloud

ombran 2020/09/18

aws
監視

リンク

書籍「Webエンジニアのための監視システム実装ガイド」発売！

システム監視の入門書籍を書きましたわたしが執筆したWebエンジニアのための監視システム実装ガイドが2020/3/24に発売されますました。予約受付中です。物理書籍・Kindle共に販売中です。 PDF版なら検索もできちゃいます。 ※このエントリを書いている時点でまだ表紙がfixしていませんが、黒バックにウミガメ写真になる予定です運用監視の会社でCTOとして勤続12年の知見を詰め込んだ、システム監視について幅広く取り扱った実践的な入門書です。読者の方に体系的な知識と価値基準を獲得してもらえるよう努めました。監視テクノロジの歴史や特徴、監視システムの基本動作と動作方式ごとの特徴、時系列データベース、DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、Availability、Observability、自己修復システム、Chaos Engineering、監視方式の

ombran 2020/03/04

リンク

書評「入門　監視」雰囲気で監視をやっているすべての人にオススメ | DevelopersIO

監視という一種マニアックな領域を真正面から解説した貴重な本です。監視で悩む人のみならずシステム開発に携わるすべての人にオススメ。「全然わからない。俺たちは雰囲気で監視をやっている」自分はAWS事業本部コンサルティング部所属ということもあって、いろんなお客様にAWSインフラのコンサルティングしてます。最初のインフラ構成設計時に監視の話をすることも非常に多いんですが、「どうしましょう。CloudWatchでいけますかね？」「MackerelとかDatadogとかもありますが、どうしましょ。マネージドとの違いは〜」「とりあえず、ディスク使用率80%でしきい値設定しておきましょうか。みんなそうしてますよ」とか言っていた昔の自分に見せつけたい本、それが今回紹介する「入門　監視」。監視設計の原則がよくわかんないメトリクスのしきい値決めるところから監視を考えてしまいがちよく考えずに、い

ombran 2019/01/22

リンク

AWSのコストを監視する仕組みを実装したお話 | Basicinc Enjoy Hacking!

こんにちは、ベーシックのDevOpsエンジニア奥山です。普段は主に弊社が運営しているサービス ferret One の開発・保守の他、インフラ周りの保守運用をやっています。今回は私がDevOps業務の一つとして行っているAWSのコスト監視についてご紹介します。コストを監視する仕組みを導入した背景 AWSのコストは何らかの要因で急激に増加することがあります。それはサービスのインフラ周りの変更や、急激なアクセス増加が要因だったりします。その時にできるだけ早く異変に気づける仕組みが必要だったのと、コストの無駄を詳細に分析できる体制が必要だったため、ベーシックではコストを監視する仕組みを導入しました。コストを監視する流れ AWSにはもともと請求アラート機能やコストを分析できるコストエクスプローラーという機能がありますが、通知や分析を柔軟に行えるようにするためベーシックでは独自にコスト監

ombran 2018/10/20

aws
監視

リンク

Application Performance Monitoring & Error Tracking Software

Code breaks, fix it fasterApplication monitoring software tolerated by 4 million developers.

ombran 2018/05/28

リンク

PagerDuty | Real-Time Operations | Incident Response | On-Call

PagerDuty Operations Cloud The platform for mission-critical work in the modern enterprise.

ombran 2018/04/24

リンク

「Prometheus 2.0」正式版リリース。クラウドやコンテナなど動的な分散環境に対応した統合監視ツール

Prometheusはクラウド上のシステムに代表される、監視対象となるサーバが増減するような動的な分散環境システムに適した監視ツールとして開発された。2.0では時系列データベースが改善され、性能向上などを実現している。 Prometheusはアプリケーションやコンテナ、Kubernetesのようなオーケストレーションツール、OS、サーバ、ネットワークなど、システムを構成するさまざまな要素を監視対象とすることができ、メトリクスとしてCPUの負荷やメモリ、ストレージの利用率、HTTPのレイテンシなど任意の値を取得、監視できる統合監視ツールです。状況をグラフで表示しつつ、異常を検知するとアラートを発するなど、システム監視を統合的に行うことができます。さらにリッチなビジュアライズについては「Grafana」などの外部ツールと連携可能。 Prometheusは、Dockerコンテナのオーケストレー

ombran 2017/11/14

リンク

Webサイト監視サービス Pingdom できることまとめ - Qiita

お手軽にWebサイトなどの死活監視ができる外部監視サービスのPingdomを少し調べたのでモニタリングとアラートの部分をさらっとまとめておきます。 Pingdomとは Webサイトの監視サービスです。 Pingdomのサーバから登録したWebサイトに対してヘルスチェックを行い、レスポンスタイムのレポートや障害時のアラート通知をやってくれます。 Webサイト以外にも、メールサーバやTCPの監視ができます。通知はメールやSMS、Twitterなどに送れます。 Standard以上のプランだとステータスページを公開することもできます。 Standard以上でなくても、StatusPage.ioなんかと組み合わせると簡単にこんなステータスページを作れます。特徴として、Pingdomサーバからのアクセスのみで監視をするため、Webサイトのサーバにエージェントなどを仕込む必要がありません。また、

ombran 2017/05/18

リンク

次世代監視の大本命！ Prometheus を実運用してみた - Qiita

こんにちは！freeeでインフラゾンビをやっている @sugitak です。ゲームではレベルを上げて物理で殴る派です。 freee ではたまにインフラエンジニアの数が減るのですが、その減ったインフラエンジニアはインフラゾンビへと進化し、社内を闊歩します。インフラゾンビは主に開発チームに所属して、アプリっぽいインフラの仕事をインフラからアプリ側へと持っていきます。デプロイとか、Dockerとか、Jenkinsとかの、いわゆる DevOps 系のところですね。こうすることで開発者は手を出せるものの自由度が増えるし、インフラはより本来のインフラとして純度を上げていける、 so, win-win ってわけです。さて、そんなわけで監視です。freee Engineers Advent Calendar 2016の9日目の記事として、 Prometheus による監視が最高なのでみんなもっと使おうと

ombran 2017/05/10

監視

リンク

Prometheus - Monitoring system & time series database

«Even though Borgmon rem ains internal to Google, the idea of treating time-series data as a data source for generating alerts is now accessible to everyone through those open source tools like Prometheus [...]» — Site Reliability Engineering: How Google Runs Production Systems (O'Reilly Media) Open Source Prometheus is 100% open source and community-driven. All components are available under the A

ombran 2017/05/10

監視

リンク

WEB系各社で使われている監視ツールまとめ - mikedaの日記

次世代 Web カンファレンスで監視について話すことになったので、ネタとしてWEB系各社で使っている監視ツールを調査中。うちはこれ使ってるよ！！！ってのがあったら@mikedaにメンションください！ Cookpad Zabbix 昔はNagios+muninだけど台数増えて性能的に破綻したビューはそのままじゃ辛いのでmunin風に表示するのを自作 StatusCake DataDog。サービス系、サーバに紐付かない系の監視に。DashBoard便利 waker。通知用。PagerDuty高い、と言ってryot_a_raiが秒で作ったらしい Kibana imon。独自のリアルタイムなサービス稼働状況表示ツール NewRelic 試し中なもの Real-User Monitoring : JSでbeacon飛ばしてfluentd -> BigQuery。Google SpreadShee

ombran 2017/05/10

監視

リンク

Cloud Monitoring as a Service | Datadog

Looking for Datadog logos? You can find the logo assets on our press page.

ombran 2017/05/10

リンク

負荷低すぎはもはや障害じゃないのか - mikedaの日記

前のブログの続きで、もにかじ7で話した小ネタその2。実際にサービスでなんかやったというのじゃなく、こういうこと考えてるんだけどみんなどうしてます？って話です。まずオンプレ時代はサーバのスペックダウンはけっこう大変だったし、頑張ってメモリやCPU引っこ抜いてもそんなに節約にならなかった。 ※CPUやメモリはサーバ価格の一部でしかないし、ラック費用(消費電力)もあるし。でもクラウド前提だとスペックダウンはとても簡単で、スペック半分にすると価格も半分になる。そうすると、『イベントで一時的にc4.4xlarge(8万/月)にして、そのまま最大CPU使用率10%とかで数ヶ月放置されている』みたいなのはビジネス的な損失という意味で明らかに障害で、監視すべきじゃないだろうか？みんななんかやってますか？というようなことを参加者に聞いてみました。参加者の中では、AutoScalingしてい

ombran 2015/02/02

リンク

はてなブックマーク

タグ

関連タグで絞り込む (12)

監視に関するombranのブックマーク (14)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス