タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

SREに関するrosylillyのブックマーク (2)

  • たった2ヶ月半でSLOを導入して事業判断に影響を与えた話 - Adwaysエンジニアブログ

    こんにちは、広告サービスを担当している飛田です。 今回は "SLO導入で悩んでいる方" に向けて、弊社リワード広告サービスでのSLO策定の取り組みについてお話したいと思います。 そもそもSLOを策定するに至った経緯は二つあります。 ユーザへの影響度合いが分かりづらいパフォーマンス問題などの対応が後回しにされがちで、品質改善がなかなか進まない アラート通知があってもユーザに影響があるか即座に判断できず、静観や一部アラートを無視する状況もあり、モニタリングが形骸化しつつある 両方とも共通してユーザに与える影響を正しく把握できていないことが課題のようです。 そこでSLOを策定する過程でオブザーバビリティを高め、モニタリングの最適化とエラーバジェット運用で開発リソース配分の状況改善を図りました。 一挙両得作戦です。 細かな取り組みは順を追って紹介します。 プロジェクト初期 ワークメトリクスからSL

    たった2ヶ月半でSLOを導入して事業判断に影響を与えた話 - Adwaysエンジニアブログ
    rosylilly
    rosylilly 2022/01/15
    めちゃくちゃいい
  • SRE として3年半働いてみて - ymyzk’s blog

    この記事は CAMPHOR- Advent Calendar 2021 23日目の記事です.22日目の記事は @sanposhiho の「Pod Topology Spread Constraintsのすべて」でした. この記事では,CAMPHOR- 卒業後に Site Reliability Engineer (サイト信頼性エンジニア・SRE) として働いてきた経験をもとに,SRE とはどういう仕事をしているのか,どのようなスキルを利用しているかなどを紹介します.これまで対外的に SRE について文章を書いたことはあまりなかったのですが,SRE の役割はまだまだ広く知られておらず「SRE って結局なに?」と思っている人も多くいるように感じるので,せっかくの機会を生かして自分の経験を書いてみようと思います. 対象読者 主に SRE について興味のある学生やジュニアなエンジニアの方を想定して

    SRE として3年半働いてみて - ymyzk’s blog
  • 1