タグ

監視に関するhigedのブックマーク (15)

  • AWSからオンプレミスに移行したWebRTC配信サーバのその後 - DMM inside

    |DMM inside

    AWSからオンプレミスに移行したWebRTC配信サーバのその後 - DMM inside
  • 次世代の監視技術 - Telemetry技術のご紹介 - NTT Communications Engineers' Blog

    こんにちは、イノベーションセンターの三島です。 記事では、次世代の監視技術として期待されるTelemetry技術についてご紹介します。 この記事について 記事では下記の3点を共有します。 従来の監視技術が抱える課題とTelemetryの可能性 Telemetryの技術概要と、各社の実装状況 NTT Comのネットワーク上で検証し得られた知見と、期待されるユースケース 従来の監視技術が抱える課題 ネットワーク運用においては、障害検知やパフォーマンス分析のため監視技術が重要となります。 従来のネットワークでは、SNMP(Simple Network Management Protocol)と呼ばれる技術が広く利用されています。 SNMPの仕組みを図1に示します。SNMPはUDPベースなネットワーク監視技術です。データモデルはMIB(Management Information Base)と

    次世代の監視技術 - Telemetry技術のご紹介 - NTT Communications Engineers' Blog
  • Observabilityをはじめよう!(前編) 〜Observabilityの背景と構成要素〜 | さくらのナレッジ

    はじめに 仲亀と申します。さくらインターネットでエバンジェリストやインフラエンジニアをしています。エンジニアとしてはシステムの監視まわりの仕事をしています。最近は、今回もご紹介するPrometheusとかGrafana Lokiとか、あの辺が結構好きで触っています。 この記事では、監視について興味をお持ちの皆さんに向けて「Observabilityをはじめよう!」ということで、Observabilityの概念や、それが必要となる背景を少し説明した上で、Observabilityを実現するための要素となる、MetricsやLogsやTracesなどをどこから始めていけばいいんだろう、といったところをご紹介していこうと思います。 この記事のゴールとしては、皆さんに「Observability完全に理解した」と言っていただけたらいいかなと思っています。しかし、この記事を読んだだけですぐに皆さんの

    Observabilityをはじめよう!(前編) 〜Observabilityの背景と構成要素〜 | さくらのナレッジ
  • 冴えないAWS環境の育てかた α | DevelopersIO

    中山です ソリューションアーキテクトとして、AWS環境の利活用をお手伝いするお仕事をしています。 まれによく見るAWS環境 とりあえずこれを見てほしい。 これが絶対にだめと言いたいわけではないです。 一時的な検証環境だったり、とにかくスピード重視でサービスをデリバリーさせる必要があったり、サービスの提供者側が何ら責任を負わない・障害時のビジネスインパクトが無い(そんな状況あるのか?)という前提があったり、状況次第ではこれで十分な時もあると思います。 しかし、一般的な業務システムやサービスの場合にはいろんな意味で不十分でしょう。 では、このような環境をどのように育てていくとよいでしょうか。 この記事では、そんな育てかたの一例を紹介していきたいと思います。 なお、記事はくっそ長いです。 ちなみに、最終的にはこうなります。 文字が小さすぎて読めない! ちょっとそこのハ○キルーペ貸してくれーw

    冴えないAWS環境の育てかた α | DevelopersIO
    higed
    higed 2020/09/18
    “る”
  • 【翻訳記事】デプロイ戦略の定義 - そこに仁義はあるのか(仮)

    この記事は2017/11の以下のブログ記事の翻訳です。 blog.itaysk.com まずはじめに、翻訳を快く許可していただいた@itayskさんに感謝いたします。 3年前の記事ですが、デプロイ戦略についてここまで網羅的にまとめられた記事が日語で見つけられなかったので翻訳してみようと思いました。 初めての翻訳記事であり、かつ翻訳時に多少の意訳を含んでいます。私の翻訳ミスがある可能性も十分にご了承ください。 何か間違いやわかりにくいところがあれば、コメントいただけますと幸いです。 無謀なデプロイ (Reckless Deployment) ローリングアップグレード (Rolling Upgrade) ヘルスチェックと監視 ロールバック 後方互換性 ちなみに ブルーグリーンデプロイ (Blue/Green Deployment) ドレイン スイッチバック ステージ ちなみに カナリアデプロ

    【翻訳記事】デプロイ戦略の定義 - そこに仁義はあるのか(仮)
  • 実践的インフラ監視&運用 - 4000万人以上のユーザーに快適なサービスを提供するピクシブの裏側 - エンジニアHub|Webエンジニアのキャリアを考える!

    実践的インフラ監視&運用 - 4000万人以上のユーザーに快適なサービスを提供するピクシブの裏側 大規模サービスを安定運用するコツってなに?実運用に基づく知見をピクシブ株式会社のインフラエンジニア、末吉さんと小出さんに聞きました。 ピクシブのサービスを支えるサーバーは大部分がオンプレミス 監視はNagiosとMuninでシンプルに 多数のリリースを支える独自のデプロイ手法 運用上のスペックは開発者との綿密なやりとりで決める 開発者と“温度感”を共有したい システム運用は、生き物です。 人気が出ればリクエスト数は急上昇。経年劣化でサーバーが壊れることもある一方で、次々と新しいサービスも展開しなければなりません。規模が大きくなると、システムを障害なく運用することは至難のワザです。 大規模サービスを安定運用するコツは何か──その秘訣を探るべく、ピクシブ株式会社のインフラチームで活躍する2人に疑問

    実践的インフラ監視&運用 - 4000万人以上のユーザーに快適なサービスを提供するピクシブの裏側 - エンジニアHub|Webエンジニアのキャリアを考える!
  • バッチプログラムの運用と監視について検討しよう | メルカリエンジニアリング

    こんにちは。メルペイでバックエンドソフトウェアエンジニアをしている id:koemu です。 バッチプログラムのお話、今回は運用・監視についてお話したいと思います。当社はすべての業務が24時間行われていますので、システムがオンラインのときに動作するバッチプログラムについてのみ議論します。 過去の記事はこちらにあります。 運用に備えて バッチプログラムの運用について、「プリモーテム」「実行管理」そして「ログ管理」の3点について述べていきます。 プリモーテム ポストモーテムという言葉を聞いたことがある方はいらっしゃるかと思います。ポストモーテムとは、GoogleのSREの15章*1によれば、障害などの失敗を振り返り、今後に活かすプロセスの総称と捉えることができます。 さて、プリモーテム(プリモータム)とは何でしょうか。この言葉は、私が最近読んだThe Manager’s Path*2*3で使

    バッチプログラムの運用と監視について検討しよう | メルカリエンジニアリング
  • 長時間快適に作業できる監視環境をつくる - miyalog

    イケてる監視ツールとかではなく、パソコン体のおはなしをします。 こんにちは。とある通信会社の委託でネットワークの監視・保守をやっている作業員です(エンジニアじゃないよ)。24時間365日休むこと無く業務を行っていますが、16時間にもなる夜勤をこなすには、快適な作業環境が必要不可欠です。このエントリでは、2015年に行った監視業務用PC・ディスプレイの更改の実体験を通して得られた知見をご紹介したいと思います。 〜忙しい人向けサマリ〜 PCは遅くとも5年で買い替えた方がいい でも同時期に買った機械は同時期に壊れるので分散して買い替えたほうがいい 最近のミニPCは普通に使えるのでおすすめ 高効率電源ユニット(80 PLUS)にすると消費電力・発熱が大幅ダウン 液体電解コンデンサは低寿命なので、固体コンデンサを使ったPCを選ぼう システムドライブは絶対にSSDにしよう。マジ別世界 液晶は VA

    長時間快適に作業できる監視環境をつくる - miyalog
    higed
    higed 2019/01/12
  • O'Reilly Japan - 入門 監視

    あなたのシステムはきちんと動いていると言えますか? 書は、システムのどの部分をどのように監視すべきか、また監視をどのように改善していくべきかについて解説する書籍です。 前半で監視のベストプラクティス、デザインパターン/アンチパターンを示して、監視の基原則を詳しく説明し、後半でフロントエンド、アプリケーション、サーバ、ネットワーク、セキュリティの各テーマで強力な監視の基盤を設計して実装するための方法を示します。 監視対象が変化し、システムアーキテクチャが進化する中で、従来から変わらない監視の基を示しながら、時代に合った監視の実践を解説する書は、監視についての理解を深めたいエンジニア必携の一冊です。日語版では、松木雅幸(@songmu)氏による監視SaaSの導入や活用方法を付録として収録しています。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載して

    O'Reilly Japan - 入門 監視
  • 「実習生が逃げていく島」町民があえて監視を置かない「深い理由」 - withnews(ウィズニュース)

    花農家から失踪したベトナム人実習生が乗ったと思われる沖縄行きのフェリー。7時間で那覇に着く=鹿児島県和泊町の和泊港 出典: 前利潔さん撮影 「お母さん、あの子、おかしい」 「SIMカードを買ったらおしまい」 「逃げられる島」監視置かないワケ 鹿児島市から飛行機で南に1時間ほどの沖永良部島は、花の島だ。年間平均は気温22度。距離も風土も、沖縄に近い。私は今秋、別の取材でこの島を訪れたとき、主要産業の花栽培農家から外国人実習生にまつわる思いがけない話を聞いた。「SIMカードを買ったらおしまい」。実習生が次々と失踪するのに、空港や港には監視を置かない理由。そこには全国の過疎地に共通する苦悩が、くっきりと映し出されていた。(朝日新聞記者・堀内京子) 「島には戻らない」マスクの意味は 青い空にハイビスカスの赤が映える沖永良部島。サトウキビ畑の中にある何軒かの花農家を、私がレンタカーで訪ねたのは、9月

    「実習生が逃げていく島」町民があえて監視を置かない「深い理由」 - withnews(ウィズニュース)
  • Webサービスの品質とは何か?アラート地獄と監視の失敗、サービスレベル目標設計
から学んだ3つの答え - Speaker Deck

    Webサービスの品質とは何か?アラート地獄と監視の失敗、サービスレベル目標設計
から学んだ3つの答え

    Webサービスの品質とは何か?アラート地獄と監視の失敗、サービスレベル目標設計
から学んだ3つの答え - Speaker Deck
  • 自律分散監視システムとそれを利用したネットワークグラフ可視化への挑戦 - Hatena Developer Blog

    はじめに はてなサマーインターン2017の大規模システムコースの成果報告をします。 今年の大規模システムコースではメンターのid:masayoshiさんとid:y_uukiさんの下、自律分散監視システムとそれを利用したネットワークグラフの可視化に取り組みました。自律分散監視システムでは単純なクラスタリングによる死活状況の確認だけではなくアプリケーションレベルの疎通確認を行えるものを実現しました。またどのようにしてクラスタを形成するかという問題に取り組む内に、サービス間のネットワーク上のつながりを取得できるようになり、その情報でサーバー間の関係性の可視化を行いました。この記事では、それらの詳細を説明します。 はじめに 自律監視システムの実現 中央サーバー型の監視システム 自律分散監視システム アプリケーションレベルの相互監視 どうやってクラスタを形成するか? 実験 ネットワークグラフの可視化

    自律分散監視システムとそれを利用したネットワークグラフ可視化への挑戦 - Hatena Developer Blog
  • PagerDutyを使ってみた - サーバーワークスエンジニアブログ

    みなさんこんにちは。 技術研究課の山田です。 さて、私が所属している技術研究課ではR&Dを継続的に実施することで、業務フローの改善や他課をサポートする活動を日々行っています。 今回はその一環で PagerDuty を触る機会があったのでレポートします。 PagerDuty とは logo-image PagerDuty - https://www.pagerduty.com/ アプリ、サーバ等からの通知をきっかけに、予め定義していたエスカレーションポリシーとスケジューリングに基いて様々なアクションを実行することができるSaaSです。 SaaSなので利用者側でサーバを用意する必要がなく、すべての操作/設定はWeb上のインターフェースから行います。 ※ APIも用意されています PagerDuty の主な機能 様々な監視ツール(Datadog, Mackerel, Zabbix 等) からのア

    PagerDutyを使ってみた - サーバーワークスエンジニアブログ
  • [Homekit]部屋の灯りが消えたら自動でGet Wildを再生してGet Wild退勤する - Qiita

    http://qiita.com/oubakiou/items/b9b78b00906415d056b2 リスペクト HomekitではIFTTTのようにとある条件をトリガーに、Homekit対応製品をON/OFFしたり、設定を変更できたりします。 今回はPhilips Hueの電球を監視して、電球の灯りが消えたらGet Wildが流れるようにします。 Homekit対応電球を買う Philips Hue v2を買ってください。 https://www.amazon.co.jp/gp/product/B01C6S7DDU Homekit対応 Get Wild再生機器を作る getwild.mp3が入ったMacを用意します。 node.js環境をインストールします Homekitオープンソース実装の1つ homebridge と、プラグイン homebridge-cmd をインストールします

    [Homekit]部屋の灯りが消えたら自動でGet Wildを再生してGet Wild退勤する - Qiita
    higed
    higed 2016/08/10
    Get Wild
  • Re: ゼロから始める監視設計

    世間では、情報システムの運用・監視の「自動化」というキーワードがもてはやされがちで、各種のツール・プロダクト等が出てくる昨今です。しかし、「自動化」の実態は深い霧のベールに包まれていると感じていませんか。今回は、以下の現場視点でこのベールを脱がしてみたいと思います。 July Tech Festa 2016 発表資料 #jtf2016 平成28年7月24日(日)

    Re: ゼロから始める監視設計
  • 1