タグ

karteとメモリに関するtakehiko20のブックマーク (1)

  • 大規模解析サービスを支える監視サービスと監視構成のポイント

    大規模解析サービスであるKARTEでは、できるだけ「データの抜けがないこと」「リアルタイムに解析を行い、それを利用したアクションが提供できること」というシビアな要件が求められます。この要件を満たし続けるためには、素早く問題に気づき対応する仕組みがとても重要になります。KARTEでは複数のサービスを組み合わせて監視の仕組みを構築しており、稿ではその監視構成とポイントについて紹介します。 何を監視するのか? サービスを提供する際にはSLO(Service Level Objective)を設けることが一般的です。 KARTEではサービス利用者に向けたSLO(外部SLO)の他に、よりシビアに設定した内部向けのSLO(内部SLO)も定義しており、後者の内部SLOを基準に監視を行っています。 監視は以下の情報などを利用して、さまざまな角度から行っています。 OSから見えるサーバのメトリクス CPU

    大規模解析サービスを支える監視サービスと監視構成のポイント
  • 1