並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1608件

新着順 人気順

SREの検索結果321 - 360 件 / 1608件

  • 監視からオブザーバビリティへ〜オブザーバビリティの成熟度/From Monitoring to Observability - Maturity of Observability

    2023/5/23開催「オブザーバビリティ最前線 〜 事例LTから学ぶ、オブザーバビリティの成熟度〜」

      監視からオブザーバビリティへ〜オブザーバビリティの成熟度/From Monitoring to Observability - Maturity of Observability
    • Protocol Buffers

      Protocol Buffers are language-neutral, platform-neutral extensible mechanisms for serializing structured data. message Person { optional string name = 1; optional int32 id = 2; optional string email = 3; } // Java code Person john = Person.newBuilder() .setId(1234) .setName("John Doe") .setEmail("jdoe@example.com") .build(); output = new FileOutputStream(args[0]); john.writeTo(output);

      • 「hbstudy#75 SRE大全:メルカリ編」で登壇しました | メルカリエンジニアリング

        こんにちは。SREの @kazeburo です。8月17日に株式会社ハートビーツ様が主催する「hbstudy#75」において、メルカリSREの取り組みについての発表をしてきましたので、資料を公開します。 hbstudyでは、SRE大全というテーマで、#74において先日発売となりました「SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム」の翻訳者の発表があり、また#76にてXFLAG スタジオのSREによる発表が予定されています。 発表内容 トークの時間が2時間ありましたので、前半、後半にわけて資料を作成しました。内容も多く盛り込んでおります。 メルカリがSREを採用した理由 メルカリSREチームの紹介 OnCall/運用当番について 先日のCDN変更での個人情報漏洩について PHPアプリケーションの最適化 セキュリティの取り組み(パスワード

          「hbstudy#75 SRE大全:メルカリ編」で登壇しました | メルカリエンジニアリング
        • SRE サイトリライアビリティエンジニアリング

          サイトリライアビリティエンジニアリング(SRE)とは、Googleで培われたシステム管理とサービス運用の方法論です。GoogleのSREチームの主要メンバーによって書かれた本書は、ソフトウェアのライフサイクル全体にコミットすることで世界最大規模のソフトウェアシステムがどのように構築、導入、監視、維持されているのかを解説します。 はじめにリスク管理やサービスレベル目標、リリースエンジニアリングなどSREの行動の基礎となる原則について解説し、次にインシデント管理や障害の根本原因分析、SRE内でのソフトウェア開発など大規模分散コンピューティングシステムを構築し運用するSREの実践について詳述します。さらにSREのトレーニングやコミュニケーションなどの管理について紹介します。 急速にスケールするサービスを高い信頼性で運用する方法を解説する本書はエンジニア必携の一冊です。 本書への推薦の言葉 監訳者

            SRE サイトリライアビリティエンジニアリング
          • 「信頼性」を保ちつつ大規模サービスをリニューアルする / cookpad-tech-kitchen-service-embedded-sres

            Cookpad Tech Kitchen #24 5800万人が使うサービスのリニューアルとその技術 ( https://cookpad.connpass.com/event/183385/ ) で、"「信頼性」を保ちつつ大規模サービスをリニューアルする" というタイトルで発表した際の資料です。 スライド内のリンクは次のとおりです。 - How SRE teams are organized, and how to get started: https://cloud.google.com/blog/products/devops-sre/how-sre-teams-are-organized-and-how-to-get-started - Design Docs at Google: https://www.industrialempathy.com/posts/design-docs

              「信頼性」を保ちつつ大規模サービスをリニューアルする / cookpad-tech-kitchen-service-embedded-sres
            • ヤフー塚穣×及川卓也対談 アジャイル/DevOpsと日本のITエンジニアの未来

              デジタルビジネスの競争が本格化する中、ニーズの変化に迅速に応える上で、アジャイル/DevOpsはもはや不可欠なアプローチとなっている。だが、新しいことに取り組みやすいスタートアップや新興企業とは異なり、既存事業、既存システムの上に立脚してきた一般的な企業がアジャイル/DevOpsに取り組む上では、さまざまなハードルがあるのが現実だ。 このような時代に開発現場はどうあるべきなのか。組織、体制はどうあるべきか。ITエンジニアに必要なマインドセット、技術などについて、アジャイル/DevOpsを実践し続けるヤフーの塚穣氏とプロダクト・エンジニアリングアドバイザーの及川卓也氏が対談を行った。 ――あらためて、ご自身の直近の活動について教えてください。 塚氏 SRE部の部長として、ここ2年は“エンジニアがつらい仕事をなくす”仕事に取り組んでいます。例えば、社内のエンジニアがもっと簡単にモノづくりができ

                ヤフー塚穣×及川卓也対談 アジャイル/DevOpsと日本のITエンジニアの未来
              • スクラムを導入してチーム状態を可視化し持続可能なチームを目指す - ZOZO TECH BLOG

                こんにちは、計測プラットフォーム開発本部システム部SREブロックの市橋です。2021年4月に新たに発足したチームで未経験ながらリーダーを任され、気づけば約2年が経過していました。これまでを振り返ってみると、まっさらな状態から安定したチームができてきたと感じています。今回は新米リーダーとして試行錯誤する中で、チーム状態を可視化して健全なチーム運営を目指した話を紹介します。 チーム状態の可視化を考えたきっかけ リーダーを任された当初、チーム運営上の課題が色々あるのは認識していましたが、どこから手をつけるべきかが自分の中で判然としませんでした。メンバーの時に一個人として感じていた課題も、チーム全体を俯瞰して見た時にどれから優先的に取り組むべきか自信を持って判断できませんでした。まるで大海原のど真ん中にいきなり放り出された感覚でした。 そんな悩みを抱えていた時、全社に導入されているWevoxのアン

                  スクラムを導入してチーム状態を可視化し持続可能なチームを目指す - ZOZO TECH BLOG
                • ZOZOTOWNを支えるリアルタイムデータ連携基盤 - ZOZO TECH BLOG

                  こんにちは、SRE部MA基盤チームの谷口(case-k)です。私達のチームでは、データ連携基盤の開発・運用をしています。 データ基盤には大きく分けて2種類あり、日次でデータ連携してるものとリアルタイムにデータ連携しているものがあります。本記事ではリアルタイムデータ連携基盤についてご紹介します。 既存のデータ連携基盤の紹介 リアルタイムデータ連携基盤の紹介 なぜ必要なのか 活用事例の紹介 データ連携の仕組みと課題 リプレイス後のリアルタイムデータ連携基盤 SQL Serverの差分データの取り方を検討 アーキテクチャ概要と処理の流れ Fluentdのプラグインを使った差分データの取得 Dataflowでメッセージの重複を排除 Dataflowで動的にBigQueryの各テーブルに出力 Pub/Subのメッセージ管理 イベントログ収集基盤 個人情報の取り扱い ビルド・デプロイ戦略 監視 データ

                    ZOZOTOWNを支えるリアルタイムデータ連携基盤 - ZOZO TECH BLOG
                  • Practical Tips for Using MySQL as a Scalable Key-Value Store

                    Learn from our experts, hear from your peers at Percona.connect Learn more

                    • サービスレベル:設計と運用のプラクティス - 下町柚子黄昏記 by @yuzutas0

                      概要 サービスレベルをいかに設計し、いかに運用するか。自分なりの考えの整理です。 尋常ではない長さになりました。随時アップデートします。たぶん。 ウェブオペレーション ―サイト運用管理の実践テクニック (THEORY/IN/PRACTICE) 作者: John Allspaw,Jesse Robbins,角征典出版社/メーカー: オライリージャパン発売日: 2011/05/14メディア: 大型本購入: 10人 クリック: 923回この商品を含むブログ (50件) を見る もくじ 概要 もくじ SLAとは何か 関係者が同じ目線を持つためのもの 火の一ヶ月間を経て…… SLAは契約ではなく、目標の合意に過ぎない SLA:設計のプラクティス サービスのレベルを設計する 機能観点でのレベル分け コア機能を定義する 非機能観点でのレベル分け オペレーションのレベルを設計する 対応速度のレベル分け 3

                        サービスレベル:設計と運用のプラクティス - 下町柚子黄昏記 by @yuzutas0
                      • Mercari Day 2017 Tech Track 発表資料まとめ | メルカリエンジニアリング

                        iOS チームの @jarinosuke です。 2017年1月20日に Mercari Day 2017 というイベントを開催しました。 当日はあまり天気も良くない中、とてもたくさんの方々に足を運んで頂き大盛況の中イベントを終えることができました。 ご参加いただいた皆様、ありがとうございました! この記事では、そのイベント内で行われた全ての技術系の発表資料をまとめて紹介させていただきます。 スライド一覧 以下、登壇者スライドの一覧になります。 Mercari – Moving Beyond Borders 柄沢 聡太郎 This is mercari, This is an SRE. 佐々木 健一 品質向上の取り組み 鈴木 祥真 グローバル展開を支える量子的なサービス設計 中野 拓 アプリファーストの影で頑張るWebの話 坂本 結衣 メルカリiOSアプリ開発の現状とこれから 石川 直樹

                          Mercari Day 2017 Tech Track 発表資料まとめ | メルカリエンジニアリング
                        • SRE Practices in Organizations

                          Infra Study 2nd #7「SREと組織」の登壇資料です。 https://forkwell.connpass.com/event/228038/

                            SRE Practices in Organizations
                          • モダンなシステムにSLI/SLOを設定するときのベストプラクティス

                            New RelicではどのようにSLI/SLOを定義し、SREを実践しているか。その経験から、SLI/SLOについて解説した記事 Best Practices for Setting SLOs and SLIs For Modern, Complex Systems の翻訳です。 -- New Relicのサイト信頼性VPであるMatthew Flamingも、この記事に貢献しています。この記事はサンフランシスコその他で行ったFutreStack18での講演「SLOs and SLIs In The Real World: A Deep Dive.」をもとに作られています。 New Relicでは、サービスレベル指標(Service Level Indicator: SLI)とサービスレベル目標(Service Level Objective: SLO)を定義したり設定したりことが、サイト

                              モダンなシステムにSLI/SLOを設定するときのベストプラクティス
                            • メドピアのECSデプロイ方法の変遷 - メドピア開発者ブログ

                              CTO室SREの侘美です。好きなLinuxディストリビューションはLinux Mintです。 メドピアでは現在多数のサービスを運用しており、そのほとんどがAmazon ECSを構成の中核として利用しています。 ECSに対してデプロイを行う方法としては、CodeDeploy、CodePipeline、Copilot(ecs-cli)等があり、CloudFormationやTerraform等のIaCツールで何をどこまで管理するかも合わせて検討する必要があります。 どの方法にもメリット・デメリットがあり、Twitterや技術ブログを観測している範囲ではデファクトスタンダードと呼べる方法は未だに無いように思われます。 メドピアで最初にECSを利用し始めたのは2018年ころであり、これまで試行錯誤しながらECSのデプロイ方法とタスク定義の管理方法を模索してきました。 今回はメドピア社内で試してきた

                                メドピアのECSデプロイ方法の変遷 - メドピア開発者ブログ
                              • ヘルスケアデータをGrafanaで見たくない…?〜健康 Reliability Engineering〜

                                Blueskyのフォローお願いします! はじめに まずはこちらをご覧ください。 これは私のApple Watchで計測されたヘルスケアデータです。Apple Watchをつけていると、心拍数や歩数、睡眠時間などのデータが自動的にiPhone内に記録されます。 SREなら健康を維持するためにもSLIとSLOを設定して可視化するべきですよね? SREなら健康エラーバジェットが無くなりそうだったら「今すぐ寝ましょう!」と架電が来て欲しいですよね? 普通にやるとiOSアプリを用いて直接ヘルスケアデータを確認することになりますが、Web系のSRE的なエンジニアとしてはやはり業界標準の技術で可視化したいところです。 また、iOSアプリを開発するのは専門知識が必要となり非常に骨が折れる作業です。そもそもMacがないとできないですし。 そこで、今回は Apple Watchのヘルスケアデータを 全自動で良

                                  ヘルスケアデータをGrafanaで見たくない…?〜健康 Reliability Engineering〜
                                • SRE座談会 - 株式会社はてな

                                  はてなでは、さまざまなチームのSRE(Site Reliability Engineer)が横断的に集まり、技術的な標準化を通じて社内の各チームのSREを支える活動を行っています。チームごとの具体的な取り組みについて、CTOのid:motemenと、SREのid:masayosu、id:taxintt、id:cohalzの3人に語ってもらいました。 はてなのSREが取り組む社内技術の標準化とはまずはみなさんの自己紹介、チームでの役割を教えてください。

                                    SRE座談会 - 株式会社はてな
                                  • Web サービスの信頼性を守るための取り組み / jtf-2017-site-reliability-engineering

                                    #jtf2017 ( http://2017.techfesta.jp/ ) にて『Web サービスの信頼性を守るための取り組み』というタイトルで発表しました。

                                      Web サービスの信頼性を守るための取り組み / jtf-2017-site-reliability-engineering
                                    • Data Management Guide - 事業成長を支えるデータ基盤のDev&Ops #TechMar / 20211210

                                      ---------------------------------------------------------------------------------------- 【PR】一緒に働きましょう! https://kazaneya.com/kdec ---------------------------------------------------------------------------------------- 「Tech × Marketing Conference 2021 #データマネジメント」基調講演の登壇資料です。 https://techxmarketing.connpass.com/event/229173/ データ活用やDXが注目されている一方で、実際にプロジェクトを進めようとすると「必要なデータが入力されていない」「用途を実現できるほどデータ品質が高

                                        Data Management Guide - 事業成長を支えるデータ基盤のDev&Ops #TechMar / 20211210
                                      • SRE Lounge #9 エムスリーはどのようにしてSREを始めたか

                                        https://sre-lounge.connpass.com/event/129214/

                                          SRE Lounge #9 エムスリーはどのようにしてSREを始めたか
                                        • メルペイにおけるマイクロサービス運用の苦労と改善 / CloudNative Days Tokyo2020

                                          2020.09.08 に CloudNative Days Tokyo2020 で発表した内容です。 メルペイの1年半におけるマイクロサービス運用の経験と苦労した事例について紹介しました。

                                            メルペイにおけるマイクロサービス運用の苦労と改善 / CloudNative Days Tokyo2020
                                          • スクラムを1年回して SREと開発組織がどう変わったのか

                                            How to Create Impact in a Changing Tech Landscape [PerfNow 2023]

                                              スクラムを1年回して SREと開発組織がどう変わったのか
                                            • 東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか?(後編) ソフトウェア品質シンポジウム2022

                                              東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか?(後編) ソフトウェア品質シンポジウム2022 9月22日と23日の2日間、一般財団法人日本科学技術連盟主催のイベント「ソフトウェア品質シンポジウム2022」がオンラインで開催され、その特別講演として株式会社日本取引所グループ 専務執行役 横山隆介氏による「日本取引所グループシステム部門の取組み ~システムトラブルからの学びと今後の挑戦~」が行われました。 現在、日本取引所グループ傘下の東京証券取引所(以下、東証)は、過去に何度か大きなシステムトラブルを経験し、それを教訓として組織とシステムの改善を続けています。 そこで今回、シンポジウム企画委員会からの要望を受けて行われた特別講演で、東証がこれまでのシステム障害から何を学び、そこから何を変化あるいは進化させてきたのか。わずか2年前のNASのハードウェア障害

                                                東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか?(後編) ソフトウェア品質シンポジウム2022
                                              • 効率的なGo

                                                本書は、Goアプリケーションの効率やスケーリングに関する疑問に対して、実用的な答えを与えてくれる書籍です。 レイテンシー、CPU、メモリ資源についての知識、またOSやGoがそれらを抽象化している方法について、またソフトウェアの効率に関わるデータ駆動な意思決定を行う事の意味や、計算量解析の手法、最適化状況の例など、実用的なソフトウェアを開発する中での「効率」に関する知識を紹介します。 Goやその他のモダンな言語で書かれたプログラムを設計、作成、変更するソフトウェア開発者、また誰かが書いたソフトウェアを主に運用するDevOpsエンジニア、SRE、シスアド、プラットフォームチームなどの読者が、いつ、どのように効率最適化を適用するかという問いに答えるための知識を身に付けることができるでしょう。 関連ファイル 原著者による本書のサンプルリポジトリ 正誤表 ここで紹介する正誤表には、書籍発行後に気づい

                                                  効率的なGo
                                                • SRE Lounge #5 にて Backlog における SRE の事例について講演しました - 無印吉澤

                                                  僕は去年の8月にヌーラボに入社して、そこから Backlog の SRE として働いています。 SRE としての経験は約1年なのですが、ちょうどサービスが成長し、会社もエンジニアを積極的に採用して拡大している時期だったこともあり、色々な経験ができました。そのなかで、SRE の難しさ、SRE の組織の問題にも直面してきました。 このあたりの経緯を整理して話すだけでも SRE にとって面白い話になるのではないか、と思い、今回の SRE Lounge #5 では「Backlog における SRE の事例 〜プロダクトの成長のために SRE はなにをすべきか〜」というタイトルで発表させていただきました。 sre-lounge.connpass.com 発表スライドはこちらです。 発表のときは冒頭で説明したのですが、これがベストプラクティスと言うつもりは全然ありません。僕らもまだ悩んでいる最中の問題

                                                    SRE Lounge #5 にて Backlog における SRE の事例について講演しました - 無印吉澤
                                                  • クエリログを使ったPostgreSQLの負荷テスト - カンムテックブログ

                                                    SREの菅原です。 この記事はカンム Advent Calendar 2022の4日目の記事になります。 少し前にサービスで使っているPostgreSQLをRDSからAuroraに移行しました。 Auroraに移行するため色々と作業を行ったのですが、その中でAuroraの性能を測るために行った負荷テストについて書きます。 pgbench まず最初にpgbenchを使って、単純なワークロードでのRDSをAuroraの性能差を測ってみました。*1 以下がその結果です。 MySQLで同様のテストをmysqlslapを使って行ったことがあって、そのときは概ねAuroraのほうが性能が高かったので、同様の結果になると考えていたのですが、RDSのほうが性能が高い結果になったのは予想外でした。 ただAuroraのアーキテクチャを考えると、pgbenchのような細かすぎるトランザクションの場合はRDSのほ

                                                      クエリログを使ったPostgreSQLの負荷テスト - カンムテックブログ
                                                    • SREチームがNew Relicを使って AWSコスト最適化に貢献した話 | ドクセル

                                                      SREチームがNew Relicを使って AWSコスト最適化に貢献した話 株式会社ニューズピックス 安藤 裕紀 NRUG (New Relic User Group) SRE支部 Vol.3 - 2023.6.27(Tue)

                                                        SREチームがNew Relicを使って AWSコスト最適化に貢献した話 | ドクセル
                                                      • k6による負荷試験 入門から実践まで

                                                        https://techfeed.io/events/techfeed-experts-night-20 TechFeed Experts Night#20 〜 Webパフォーマンス・チューニング最前線 : 前編(概要、モニタリング、負荷テスト編)

                                                          k6による負荷試験 入門から実践まで
                                                        • SRE Technology Map

                                                          サイバーエージェントは創業来、インターネット産業の拡大とともに事業成長を続けてきました。またそれと同時に、SRE領域へも注力してきました。SRE Technology Mapは、サイバーエージェントのSREチームの取り組みを知ってもらうことを期待して製作しています。 Developer Experts of SRE 柘植 翔太 Shota Tsuge サイバーエージェントが提供する幅広い事業サービスの信頼性向上に、私達SREsは日々取り組んでいます。事業領域や事業フェーズ、組織規模が異なれば、SREsのアプローチも違ってきます。それぞれのSRE組織が、様々な課題解決に取り組んだことによって得られた知見や考え方などを多くの人に知ってもらいたいと考え、「SRE Technology Map」を作成しました。 「SRE Technology Map」を通して、少しでもサイバーエージェントに興味を

                                                            SRE Technology Map
                                                          • DevOpsトポロジー

                                                            みなさんこんにちは。@ryuzeeです。 2021年12月1日に発売した『チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計』ですが、おかげさまで多くの方に読んでいただき感謝しています。 チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計著者/訳者:マシュー・スケルトン、 マニュエル・パイス、 原田 騎郎、 永瀬 美穂、 吉羽 龍太郎出版社:日本能率協会マネジメントセンター発売日:2021-12-01単行本:280ページISBN-13:9784820729631ASIN:4820729632 今日はこの「チームトポロジー」の元となったDevOpsトポロジーについて紹介します。 このアイデアは2013年に著者の1人であるマシュー・スケルトンが自身のブログに書いた記事をまとめたものです。 2013年頃といえばDevOpsが流行しはじめた時期だと思いますが、こ

                                                              DevOpsトポロジー
                                                            • リモートアジャイル開発ノウハウ集 | Agile Studio

                                                              私たちはこれまで、様々なお客さまと一緒にリモートアジャイル開発を実施してきました。 リモートワークの時代に私たちの実践知が少しでも役に立つならという思いで、 ​ノウハウ集という形で公開させていただきます。是非ダウンロードしてお読みください。

                                                                リモートアジャイル開発ノウハウ集 | Agile Studio
                                                              • ISUCON入門以前_ISUNARABE_LT#1

                                                                Babylon.jsと色々なものを組み合わせる:ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3

                                                                  ISUCON入門以前_ISUNARABE_LT#1
                                                                • SREグループができてこの半年間やってきたこと

                                                                  SRE Tech Talks #2 XFLAG スタジオにおけるSREの紹介、MySQL, InnoDB, THPのチューニングなど

                                                                    SREグループができてこの半年間やってきたこと
                                                                  • ソフトウェア開発における人的リソースの理想的な配分

                                                                    背景SRE という概念が生まれてから数多くの開発チームで「ソフトウェアエンジニアリングの手法で運用を改善する営み」が行われてきた。 同時に、技術的負債が経営レベルで認知されるようになり、日常の会話の中でも長期・短期のトレードオフを念頭に置いたプロジェクト推進がやりやすくなったのは言うまでもない。 しかし、スタートアップでは Dev と Ops が別れていることは稀で、「全員が全てに対応する」ような状況になってしまうことがしばしばある。これは小さい組織だけの問題ではなく、例えば大企業の中の新しいプロダクト開発チームでも同じことが言える。 SRE を念頭に置き、技術的負債の主導権を握るために必要なチーム体制とはどういうものなのだろうか? タスクの分解小さな組織のソフトウェアエンジニアは日々数多くのタスクを与えられている。場合によっては数名のメンバーで新規機能開発から日々の不具合修正、そして S

                                                                      ソフトウェア開発における人的リソースの理想的な配分
                                                                    • SRE/DevOps/Kubernetesを追いかけてきた2020年をふりかえる - 運び屋 (A carrier(forwarder) changed his career to an engineer)

                                                                      ここで話すこと ここで話さないこと SRE/DevOps/Kubernetesをテーマにブログを書き始めた理由 気をつけていること オススメWebページ7選 The Blameless Blog Netflix Technology Blog Facebook Engineering Datadog blog The GitHub Blog Julia Evans The Kubernetes Podcast from Google ブログによる変化 反響 やってみて思ったこと 異動による変化(2020年4月) コミュニティー活動による変化 今後の目標&告知 これは エーピーコミュニケーションズ Advent Calendar 2020 の20日目の記事です。 自身の中で多くの変化があった2020年をふりかえりつつ、タイトルにあるテーマ(SRE/DevOps/Kubernetes)を追いか

                                                                        SRE/DevOps/Kubernetesを追いかけてきた2020年をふりかえる - 運び屋 (A carrier(forwarder) changed his career to an engineer)
                                                                      • これでよいのか: SRE チームの成熟度評価について考える | Google Cloud 公式ブログ

                                                                        ※この投稿は米国時間 2021 年 6 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。 Google の顧客信頼性エンジニアは、Google Cloud のお客様の組織で実践を支援するよう選任された、Google サイト信頼性エンジニア(SRE)です。その仕事の一つに、運用の成熟度を高めるために行う経営陣や SRE チームへのアドバイスがあります。Google はそのディスカッションの多くで、「今やっていることは『SRE の仕事』でしょうか?」あるいは、もう少し実存的不安の響きがする「自分たちを SRE と呼んでもいいでしょうか?」という質問を何度も受けています。 この質問には、すでに、SRE ワークブックの実践リストで答えています。しかし、このリストは「SRE とは何か」については詳しいですが、その理由について詳しく述べていないため、SRE とは何かとい

                                                                          これでよいのか: SRE チームの成熟度評価について考える | Google Cloud 公式ブログ
                                                                        • 生産性改善のためのトイル計測 - maru source

                                                                          Ubie Discoveryというヘルステックスタートアップでプロダクト開発エンジニアをしている丸山@h13i32maruです。 最近、チームの生産性改善をするためにトイル計測をはじめました。今日はこのトイル計測について簡単に紹介します。 「生産性」ではなく「伸びしろ」の計測 手作業、繰り返される作業、自動化が可能、etc 改善可能な作業を計測する トイル40%超え トイルの撲滅は...これからだ! 「生産性」ではなく「伸びしろ」の計測 生産性を改善するにはまずは生産性の計測から始めることが重要です。 計測指標として有名なものにFour Keysがあります。Four Keysは「変更のリードタイム」「デプロイ頻度」「変更失敗率」「平均修復時間」を計測してチームのパフォーマンスを評価するものです。このFour Keysは組織全体としての生産性の結果指標だと理解しています。例えば僕のチームでは

                                                                            生産性改善のためのトイル計測 - maru source
                                                                          • エンジニアと立ち話。Vol.8 @deeeet(SRE) ちょっとお話いいですか? | mercan (メルカン)

                                                                            ソフトウェアエンジニアの@kajikenがメルカリで働くエンジニアたちを捕まえて、ちょこっとお話を聞いていく本シリーズ。第8回はメルカリ SRE(Site Reliability Engineering)チームメンバーの中島大一さん(@deeeet)です。 @kajiken:@deeeetさん、ちょっといいですか。 @deeeet:ちょっと待ってください今goroutineをcancelします。はい。どうぞ。 @kajiken:入社日と職種を教えてください。 @deeeet:2017年の1月に入社しました。SRE(Site Reliability Engineering)チームメンバーとして働いています。 @kajiken:これまでの経歴を教えてください。 @deeeet:大学の研究室ではNLPを、大学院に入ってからはロボットや音声対話の研究をしていました。新卒で楽天に入社して、最初はko

                                                                            • NewRelic / Elasticsearch ではじめるSREに必要な性能監視入門

                                                                              NewRelic / Elasticsearch ではじめるSREに必要な性能監視入門 https://supporterzcolab.com/event/177/ にて話した資料です!

                                                                                NewRelic / Elasticsearch ではじめるSREに必要な性能監視入門
                                                                              • インフラエンジニア勉強会 - hbstudy

                                                                                第89回:『クラウドエンジニアの教科書』著者によるクラウドのお話(2022年11月30日(水)18:30~20:00) ■開催日時 2022/11/30(水) 18:30 〜 20:00 ■イベント概要 『クラウドエンジニアの教科書』著者によるクラウドのお話と題しまして、クラウドの初学者から中級者向けのクラウド勉強会を開催します。当日は以下のようなお話をします。 パネルディスカッション 司会者からスピーカーへの質問コーナーです! イベント参加登録時に皆様からいただく質問にも回答予定です。 質問例) 3大クラウドについて分かりやすく比較・解説するために気を付けたポイントは? 初学者が一番ハマりそうなポイントは? 初心者向けの情報だけでなく、IaCやコンテナ、マルチクラウド構成、監視など応用的な部分まで解説した狙いは? 本当は書籍に含めたかったけど、今回は省くしかなかった項目や話題は? 参加者

                                                                                • なぜ Four Keys を改善するのか?/productivity-con-link-and-motivation

                                                                                  【開発生産性Conference】 リンクアンドモチベーション登壇資料(2023/07/13) 『なぜ Four Keys を改善するのか? 〜How ではなく Why を重視したメトリクス改善活動〜』 #開発生産性con_findy #リンクアンドモチベーション #リンモチ ============================================= 【イベント情報】 ■イベントページ https://findy.connpass.com/event/283417/ ■特設サイト https://dev-productivity-con.findy-code.io/ 【株式会社リンクアンドモチベーション】 ■お問い合わせ engineer_pr@lmi.ne.jp ■Entrancebook https://note.com/lmi/n/n179505e048f4 ■テック

                                                                                    なぜ Four Keys を改善するのか?/productivity-con-link-and-motivation