並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 1079件

新着順 人気順

SREの検索結果361 - 400 件 / 1079件

  • Developers Summit 2021 summer

    Developers Summit 2021 summerの発表資料です https://event.shoeisha.jp/devsumi/20210730/session/3228/

      Developers Summit 2021 summer
    • SRE Team のオンボーディングのいま - スタディサプリ Product Team Blog

      こんにちは。SRE の @chaspy です。 Quipper の SRE Team ではじめて「オンボーディング」と呼ばれるものを行って約2年経ちました。 quipper.hatenablog.com その後、3人の仲間が入社し、そのたびにオンボーディングプロセスを改善してきました。 本記事では、SRE Team のオンボーディングプロセスの"いま"を振り返るとともに、その効果や意義を、オンボーディングを受けたメンバーからのコメントを交えて紹介したいと思います。 オンボーディングの目的 あらためてオンボーディングの目的について言語化しておきます。これは今も昔も変わっておらず、「New Joiner の早期の戦力化」だと思っています。 早期の戦力化のためには何が必要か、ということを考えると、現在のチームのミッションから普段の業務へブレークダウンし、それらをスムーズに遂行するために何が必要か

        SRE Team のオンボーディングのいま - スタディサプリ Product Team Blog
      • Google - Training Site Reliability Engineers

        Training Site Reliability Engineers: What Your Organization Needs to Create a Learning Program Written by: Jennifer Petoff, JC van Winkel & Preston Yoshioka with Jessie Yang, Jesus Climent Collado & Myk Taylor Providing training and education for Site Reliability Engineers is universally important to set them up for success in your organization. However, the specific training needs of each enginee

        • オンコールアラートアンチパターン - ださろぐ@はてな

          オンコールアラートを設定しようと考えた際に考慮すべき点を自分なりにアンチパターンとしてまとめたなにかです。 ホワイトボックスモニタリングにより得られたメトリクス、ログなどからアラーティングを行う、または併用する環境を想定しています、ブラックボックスモニタリングによるアラート、SLOベースのアラートのみでうまく運用されているサービスにはあてはまらないと考えてます。 参考書籍は色々あり、最後に記載していますが提示されてるプラクティス通りではないものもあります 。自組織、システムにあった設計をしましょう。 システムの監視がまったくありませんみたいな状況であればまずはサービスのURLに対する外形監視からはじめましょう。 言葉の定義 アンチパターン サービスに対する外形監視が設定されていない アラートを受け取って直ちに何かアクションを行う必要がない アラートに対応するrunbookが存在しない 自動

            オンコールアラートアンチパターン - ださろぐ@はてな
          • サイト信頼性エンジニアリングのドキュメント

            このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。

              サイト信頼性エンジニアリングのドキュメント
            • 「インフラ開発エンジニアが活躍できる領域は無限」。インフラエンジニアやソフトウェアエンジニアにとって次のキャリアとなりえる - さくマガ

              さくらインターネットは、国産パブリッククラウドを開発・提供し、インターネットを活用したい多くの方々の活動を支えています。 今後、さらにパブリッククラウドの開発を進めていくうえで欠かせないのが「インフラ”開発”エンジニア」です。 日本最大級のサーバーホスティングサービスやIaaSサービスを通して、自分の開発したインフラ基盤を数十万規模のお客さまに使っていただけます。  お客さまがとても近く感じられる環境で、ご意見や反響が直接手応えとなるやりがいのある仕事です。 インフラ開発エンジニアの仕事内容、さくらインターネットにおけるエンジニアのキャリア、評価制度などについて、クラウド事業本部 副本部長の大久保 修一とSRE室 室長の長野 雅広に話を聞きました。 さくらインターネット初の新卒社員 ――長野さんには、以前のインタビューでこれまでのキャリアについてうかがいました。大久保さんのキャリアについて

                「インフラ開発エンジニアが活躍できる領域は無限」。インフラエンジニアやソフトウェアエンジニアにとって次のキャリアとなりえる - さくマガ
              • 想定外の負荷を乗り切ったオンライン教育サービスの裏側 / How We Overcame the COVID-19 Crisis

                Developers Summit 2021 https://event.shoeisha.jp/devsumi/20210218/session/3084/

                  想定外の負荷を乗り切ったオンライン教育サービスの裏側 / How We Overcame the COVID-19 Crisis
                • インシデント管理で得られた教訓

                  0 0 57 0 ジョーイ・ベイダ、ロス・デリンジャー共同執筆 Dropbox では、インシデント管理は信頼性への取り組みにおける重要な要素だと考えています。実際の障害発生に備えるために、カオス エンジニアリング(Chaos Engineering)などのプロアクティブな手法も採用していますが、インシデントへの対応の仕方がユーザー エクスペリエンスを大きく左右します。サイトの停止や製品の問題が発生する可能性がある場合、ユーザーにとって、それは一刻を争う事態です。 導入されて数年になるインシデント管理プロセスの主要コンポーネントですが、この領域には常に進歩する要素がありました。時間をかけて、技術的にも組織的にも、さらには手続き的にも細かな調整を加えてきました。 この投稿で触れているのは、 Dropbox がインシデント管理で得た教訓の一部について、深く掘り下げて説明します。インシデントにおけ

                    インシデント管理で得られた教訓
                  • イオンの長い歴史と複雑なシステムに挑むSREチームがつくった「信頼」を勝ち取るための4つの行動指針|イオン・エンジニアインタビュー |AEON TECH HUB

                    イオンスマートテクノロジー・SREチームでリーダーを務める香西のインタビューです。来期にむけたSREチームのミッションや行動指針に込められた想い、入社時のエピソード、行動力の源泉などを伺いました。

                      イオンの長い歴史と複雑なシステムに挑むSREチームがつくった「信頼」を勝ち取るための4つの行動指針|イオン・エンジニアインタビュー |AEON TECH HUB
                    • クラウドインフラにおける脆弱性およびメンテナンス情報等の管理・自動化について - Gunosy Tech Blog

                      はじめに これまでのインフラ課題の管理方法およびその課題点 それぞれのチームの要件 現在の管理方法 AWS Health Eventを用いたJIRAチケットの自動起票 Slack通知の自動化 JIRAチケットの関連付け JIRAチケットでの期限管理 現在の運用フロー SREの作業 開発チームの作業 移行してみて感じたメリット 今後の課題 さいごに はじめに こんにちは。テクノロジー本部 プロダクト開発部 SREのkoizumiです。 最近、すっかり暑くなってしまいましたね。 さて、今回はAWS Security HubやSnykで検知された脆弱性の課題項目や、AWS Healthで通知されるメンテナンス情報の管理方法ならびにその自動化について取り上げます。 弊社では、週一でプロダクトチームとのふりかえり会というものを開催しており、SLO達成状況やアラート発生状況、セキュリティ指摘項目

                        クラウドインフラにおける脆弱性およびメンテナンス情報等の管理・自動化について - Gunosy Tech Blog
                      • 5分で学ぶ: カオスエンジニアリングの説明書

                        この記事はNew RelicのチーフエディタFredric Paulによる記事「Breaking to Learn: Chaos Engineering Explained」の翻訳です。 Netfilxは、ただのインターネット越しのお茶の間TVショーというわけではありません。カオスエンジニアリングという分野の産みの親となったのは、まさに必然といえるでしょう。 この概念は矛盾しているように見えます。もしくはB級SF映画の物語か。しかしそれは、複雑な現代的アーキテクチャにおけるレジリエンス(回復力)の改善を実現するために、必要とされてきています。 この記事では、カオスエンジニアは何か、どのように役に立つかについて述べていきます。まずは、カオスエンジニアリングをざっくり理解するために、少し歴史を紐解いていきましょう。 「カオス」を受け入れる Netflixは何年にも渡ってインフラストラクチャを進

                          5分で学ぶ: カオスエンジニアリングの説明書
                        • GitHub Actionsに「強い」AWSの権限を渡したい ~作戦3 - AssumeRole with Google ID Token ~ - KAYAC engineers' blog

                          こんにちは。技術部の池田です。 この記事では、Github Actions上に「強い」AWSの権限を渡すために以下のことを行います。 App Runnerでお手軽にGoogle ID Token 取得するためのWeb Applicationを動かす。 Web Applicationから取得できるGoogle ID Tokenを信頼するIAM RoleにAssumeRoleする。 AssumeRoleによって得られた一時的な強い権限で、強い権限を要求する作業(Deploy, Terraform Apply)をGithub Actionsで行う。 これにより、Github Actions上にAWSのアクセスキーを置かずに、ある程度安全な方法でAWS上での強い権限を要求する操作を実行できます。 そのため、例えばGithub Repositoryに不正アクセスされてしまったとしても、AWSの本番環

                            GitHub Actionsに「強い」AWSの権限を渡したい ~作戦3 - AssumeRole with Google ID Token ~ - KAYAC engineers' blog
                          • メルペイのシステム運用とPlaybookの共通管理への挑戦 | メルカリエンジニアリング

                            こんにちは、メルペイでSREとして従事している @myoshida です。この記事は Merpay Tech Openness Month 2021 の8日目の記事です。 SREチームはお客さまへよりよいサービス利用体験を提供するため、日々様々な改善活動に取り組んでいます。その活動の一環としてPlaybookの概念を導入し、運用者の運用負担を減らす取り組みを始めました。今回はそのことについて説明してみたいと思います。 概要 メルペイではアプリケーションエンジニアとSREの双方がオンコール制度のもと運用に携わっています。 運用の悩みは様々ですが、そのうちの1つに手順書の取り扱いがあります。 どこに置くべきか、更新はされているのか、何を書けばいいのか、どの場面でどの手順書を利用すればよいのかというような悩みはどこの現場でも少なからず存在すると思います。 そこで、Playbookと呼ばれる体系的

                              メルペイのシステム運用とPlaybookの共通管理への挑戦 | メルカリエンジニアリング
                            • 「SLO サービスレベル目標」という本が出版されました #slobook - YAMAGUCHI::weblog

                              はじめに こんにちは、Google Cloudのオブザーバビリティ担当者です。このたび私が翻訳ならびに監修として関わった「SLO サービスレベル目標」という本がオライリー・ジャパン社より出版されました。本日より書店ならびに各社オンラインストアでご購入いただけます。 SLO サービスレベル目標 ―SLI、SLO、エラーバジェット導入の実践ガイド 作者:Alex HidalgoオライリージャパンAmazon 電子書籍版についてはオライリー・ジャパンのサイトよりePub、PDFの各種フォーマットにてご購入いただけます。 www.oreilly.co.jp SLOがなぜ重要なのか まず本書の意義について解説する前に、サービスレベル目標(Service Level Objective; SLO)がなぜ重要なのかについて改めてお伝えしたいと思います。 サイトリライアビリティエンジニアリング(SRE)に

                                「SLO サービスレベル目標」という本が出版されました #slobook - YAMAGUCHI::weblog
                              • LINEのインフラ基盤「Verda」のビジョンとSREが果たすべき役割とは | gihyo.jp

                                インタビュイー Verda SREチーム マネージャー 萬治渉 昨今、ソフトウェアエンジニアリングを活用し、サービスの運用効率化や信頼性向上に取り組む考え方や方法論である「SRE」(⁠Site Reliability Engineering)が広まりつつあります。LINEでも2019年にSREに取り組む専門チームが発足しており、同社のプラットフォームである「Verda」で提供するサービスの運用業務の効率化などに取り組んでいます。そのSREチームを率いるマネージャーである 萬治渉氏に、SREチームが発足した背景や現状の取り組みなどについてお話を伺いました。 LINEの多数のサービスを支える「Verda」 ――まずVerdaの概要について教えてください。 萬治:LINEでは一般的なパブリッククラウドを使う方針は基本的には採らず、大部分のインフラを自社で保有し運用しています。このインフラのプラッ

                                  LINEのインフラ基盤「Verda」のビジョンとSREが果たすべき役割とは | gihyo.jp
                                • 過去最大トラフィックを完走。W杯配信キャパシティ確保の裏側【ABEMA DEVELOPER CONFERENCE 2023#1】

                                  TOPコラムテック最前線レポート過去最大トラフィックを完走。W杯配信キャパシティ確保の裏側【ABEMA DEVELOPER CONFERENCE 2023#1】 過去最大トラフィックを完走。W杯配信キャパシティ確保の裏側【ABEMA DEVELOPER CONFERENCE 2023#1】 2023年5月22日 株式会社AbemaTV Site Reliability Engeneer 岩永 勇祐 2017年サイバーエージェントに中途入社、2018年に株式会社AbemaTVのSREチームに移動。現在は信頼性の維持・向上のためのツール開発を行っている。 Webサービスを展開するにあたって、十分なシステムリソースを確保しておくことは非常に重要だ。特に大型のイベントやキャンペーンなどトラフィック増大が予想される際には、バーストトラフィックなどによる不具合を起こさないためにも、キャパシティプランニ

                                    過去最大トラフィックを完走。W杯配信キャパシティ確保の裏側【ABEMA DEVELOPER CONFERENCE 2023#1】
                                  • abseil / Software Engineering at Google

                                    Software Engineering at Google In March, 2020, we published a book titled “Software Engineering at Google” curated by Titus Winters, Tom Manshreck and Hyrum Wright. The Software Engineering at Google book (“SWE Book”) is not about programming, per se, but about the engineering practices utilized at Google to make their codebase sustainable and healthy. (These practices are paramount for common inf

                                    • インフラエンジニアになるのは簡単か - orangeitems’s diary

                                      Q. インフラエンジニアになるのは簡単か? A. 簡単です。 インフラエンジニアでベテランの私でもこう答える。 ただし、なることと、上を目指すのは全く別のお話だ。インフラエンジニアを名乗ること自体は簡単でも、何を仕事にするかは恐ろしく幅が広い。 幅が広いから、スキルの表現が標準化されていない。何でもできるをフルスタックというのは簡単だけど、何がフルなのかを表現できる人は誰もいない。 自分はフルスタックだ、と言う人がいれば、それはあなたが働く現場の全ての業務、という意味でのフルであって、世の中の全ては捉えきれてはいない。 もはや、全てを知っているというよりは、未知なことがきてもなんとかできる、という意味合いの方がインフラエンジニアについては当てはまる。どんな要件が来ても基盤となる知識があるので、資料を読み解けば何とかできる、ぐらいの胆力が求められる。 未経験からのインフラエンジニア、という意

                                        インフラエンジニアになるのは簡単か - orangeitems’s diary
                                      • ニーリーのSREによるリリースサイクルの改善〜「隔週深夜1回→1日2回」にリリース頻度を向上させた道のり〜|株式会社ニーリー公式note

                                        プロダクト開発グループSREチームの大木(おおぎ)と菊地です。 突然ですが、皆さんのプロダクトではリリースはどのように行われていますか? 実は、ニーリーのメインプロダクトであるPark Direct(パークダイレクト)はわずか1年前まで隔週に一度、深夜0時からしかリリースを行うことができていませんでした。開発組織の健全性の指標として使われる d/d/d (deploys / a day / a developer) という指標で、1年前の我々は d/d/d=0.015ぐらいのスコアでした。この指標は d/d/d >= 0.1 が健全な組織としての目安となるそうです(※1)。かなりの開きがありますね・・・。 この記事では、SREチームのリリースエンジニアリングと開発チームのプロセス改善により、リリースの頻度が大幅に向上したというお話をしたいと思います。 ※1 『エンジニアリング組織論への招待

                                          ニーリーのSREによるリリースサイクルの改善〜「隔週深夜1回→1日2回」にリリース頻度を向上させた道のり〜|株式会社ニーリー公式note
                                        • メルカリにおけるマイクロサービスマイグレーションの理想と現実 | メルカリエンジニアリング

                                          はじめに こんにちは、 @stanaka です。メルカリではいまビジネス基盤強化を進めるプロジェクト「Robust Foundation for Speed」を立ちあげていますが、このプロジェクトの前段となっているマイクロサービスマイグレーションについて、その理想と現実について紹介します。 モダンな開発チームのあるべき姿 まず理想を語る上で、ここ数年のエンジニア組織の改善や生産性向上の議論をいくつか見てみます。開発チームとアーキテクチャについては、以下の2点がよく重視されています。 開発のイテレーションを加速するために、チームがオーナーシップを持つサービス/システムについて設計から開発、運用までの責任を開発チームが負う 認知的負荷(cognitive load)を許容範囲に抑えるために、システムを疎結合化し他チームへの依存を減らす設計を行う 設計から開発、運用までの責任を開発チームが負う

                                            メルカリにおけるマイクロサービスマイグレーションの理想と現実 | メルカリエンジニアリング
                                          • Terraform Cloud から GitHub Actions に移行したお話

                                            スタディスト開発ブログ Advent Calendar 2021の13日目の記事です。 こんにちは、SRE Unit の wind-up-bird です。以前、 Serverless Framework を移行しているお話を書きましたが、今回は移行シリーズ第2弾ということで、 Terraform Cloud を Terraform on GitHub Actions に移行したお話をお届けしたいと思います。 # 移行前の運用スタディストではこれまで Terraform Cloud の Team & Governance プランを契約していました。移行前の Terraform による開発の流れは、以下のとおりです。 Terraform Cloud 上で Workspace を作成し、Version control workflow を利用する。Workspace には環境変数として、 AWS

                                              Terraform Cloud から GitHub Actions に移行したお話
                                            • 「入門 監視」社内輪読会から1年経過して 〜参加メンバーの意識の変化と今後〜 - BASEプロダクトチームブログ

                                              はじめまして。 BASE株式会社 SRE Groupに所属している富塚(@tomy103rider)です。 先日、弊社CTOが 「もうさばき切れない」アクセスが激増したECプラットフォームにおける負荷対策 https://devblog.thebase.in/entry/bsucon という記事を公開しました。 社内ではこのアクセス激増をきっかけに「サービスの監視をどうしていくか」「サービス/システムのアラートに対してのアクションはどうあるべきか」といったような監視に関する話題も改めて盛り上がっています。 そんな中でふと1年くらい前にBASE BANK 株式会社の東口 (@hgsgtk)が社内で主催した「入門 監視」輪読会に参加したことを思い出し、その輪読会がどういう会だったかなど、改めて輪読会を振り返ってみようと思います。 「入門 監視」輪読会の目的は何だった? この輪読会を開催するにあ

                                                「入門 監視」社内輪読会から1年経過して 〜参加メンバーの意識の変化と今後〜 - BASEプロダクトチームブログ
                                              • SREの探求

                                                組織の大小を問わず、システムやアプリケーションの信頼性がビジネスにとって重要なこと、また市場が求めるスピードでイテレーション(反復)しながら、信頼性を維持するのは難しいことが認識されています。サイトリライアビリティエンジニアリング(SRE)は、この課題に対する取り組みです。 本書は、大規模なプロダクションシステムの運用において、様々な企業や組織がSREをどのように実践しているかについて紹介します。Microsoft、Dropbox、Google、SoundCloud、Spotify、Amazon、Facebook、LinkedIn、Netflix、Lyftなど、規模や業種、提供するプロダクトやサービスが異なる様々な企業でのSREの導入と発展、そこから得た課題について解説します。 全33章で約40名の著者陣が「SREの導入」「SREの周辺領域」「SREのベストプラクティスと技術」「SREの人

                                                  SREの探求
                                                • 変更障害率0%よりも「継続的な学習と実験」を価値とする 〜障害を「起こってはならないもの」としていた組織がDirtの実施に至るまで〜 / DevOps Transformation in NAVITIME JAPAN

                                                  2023.04.18 DevOpsDays Tokyo 2023 https://www.devopsdaystokyo.org/

                                                    変更障害率0%よりも「継続的な学習と実験」を価値とする 〜障害を「起こってはならないもの」としていた組織がDirtの実施に至るまで〜 / DevOps Transformation in NAVITIME JAPAN
                                                  • フロントエンド未経験のSREエンジニアが挑んだ技術選定のリアル体験 - RAKUS Developers Blog | ラクス エンジニアブログ

                                                    こんにちは!株式会社ラクスの@kzak_24と申します。 インフラ開発部 SRE課に所属しております。 さて今回は、現在アサインされている新規システムの開発プロジェクトにて、フロントエンドの技術選定を担当した時の経験をまとめようと思います。 フロントエンドは未経験だった為、色々と試行錯誤を行いました。 未経験なりにどのような基準を設けて技術選定を行なったか、皆さまの意思決定の参考になれば幸いです。 目次 SREチームの紹介 前提 チームの背景 検討内容と採用理由 言語 / FW 状態管理 スタイル テスト まとめ 最後に SREチームの紹介 まず始めに、少しだけSREチームについて紹介させてください。 ラクスのSREチームは2021年に発足した比較的新しい組織であり、下記の2つのチームに分かれています。 BP(Business Platform)チーム 社内業務システムの開発/保守/運用を

                                                      フロントエンド未経験のSREエンジニアが挑んだ技術選定のリアル体験 - RAKUS Developers Blog | ラクス エンジニアブログ
                                                    • How to become a platform engineer | Google Cloud 公式ブログ

                                                      ※この投稿は米国時間 2024 年 1 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。 あなたは Acme Corp という架空の会社のエンジニアで、CI / CD と自動化を用いたソフトウェアの統合と配信、データ主導型の指標およびオブザーバビリティ ツールの実装を行う大型プロジェクトに関わっているとします。しかし仲間のエンジニアの多くは、認知負荷が高すぎることで苦戦しています。Kubernetes クラスタのデプロイと自動化、CI / CD パイプラインの構成、セキュリティに関する懸念事項など、検討すべきことはさまざまです。会社の拡大と成長を支援するには、そのような課題の解決方法に関する考え方を改める必要があるとあなたは気付きます。そこで役立つ可能性があるのが、プラットフォーム エンジニアリングです。 プラットフォーム エンジニアリングは「コンピューティ

                                                        How to become a platform engineer | Google Cloud 公式ブログ
                                                      • モンスターストライクの信頼性を支えるSREの組織化について

                                                        モンスターストライクの信頼性 を⽀えるSREの組織化について 株式会社ミクシィ XFLAG スタジオ ゲーム開発室 SREグループ 清⽔ 勲 Internet Week 2017 S15 ⾼信頼性運⽤を実現するSREという新潮流 2 ⾃⼰紹介 清⽔ 勲 / Isao SHIMIZU @isaoshimizu 株式会社ミクシィ XFLAG 事業本部 ゲーム開発室 SREグループ 所属 経歴 • SIerで受託開発、⾃社プロダクト開発、運⽤を約8年 • 株式会社ミクシィ • 2011.8〜 運⽤部 アプリ運⽤グループ所属、SNSの運⽤ • 2014.4〜 モンスターストライクの運⽤にジョイン • 2015.8〜 XFLAG スタジオが創設される • 2016.7〜 XFLAG スタジオにSRE グループ創設 3 ミクシィグループ 2017年11⽉8⽇ 2018年3⽉期 第2四半期 決算説明会資

                                                        • 脆弱性診断の内製化と外注

                                                          2023/09/07 Cyber-sec+ MeetUp vol.1 で発表した内容です。

                                                            脆弱性診断の内製化と外注
                                                          • 【デスクツアー】リンクアンドモチベーションで働くエンジニアのおすすめギア - Link and Motivation Developers' Blog

                                                            はじめに こんにちは!EMをしている河野です。 リンクアンドモチベーションではリモート中心の働き方になり、2年半が経ちました。本日はリンクアンドモチベーションで働くエンジニアが自宅でどんな環境で働いているか。本人からのおすすめギアと一言とともにデスク周りを紹介します。 エンジニアリングマネージャー Iさん デスク おすすめギア 木製の袖机。サイズを緻密に計算して、100均素材を組み合わせて制作したもの。 本人から一言 チープな印象にならないよう、徹底的にクオリティとコストを追求した一品です。 仕事の後にはデスクを一式きれいに収納できるところもポイントです。 コミュニケーションクラウド エンジニア Tさん デスク おすすめギア 見た目も機能性も気に入っているSTANLEYの水筒 一年前の購入時から成長が見えないエアプランツ 本人から一言 バランスボール枠です。 プラットフォームチーム エンジ

                                                              【デスクツアー】リンクアンドモチベーションで働くエンジニアのおすすめギア - Link and Motivation Developers' Blog
                                                            • LINEの「あけおめLINE」過負荷対策(1) ― リスクマネジメントの全体像と「発生可能性の低減」 | gihyo.jp

                                                              「SREの現場から」と題した本連載では、さまざまな企業におけるSREの実践事例を不定期に紹介していきます。 こんにちは、LINE株式会社の加藤(maru)です。SREチームに所属し、主にLINEスタンプや着せかえ、ホームタブ、ウォレットタブでEmbedded SREとして信頼性の改善に従事しています。 LINE株式会社は、コミュニケーションアプリ「LINE」を機軸として、コミュニケーション・コンテンツ・エンターテイメントなどモバイルに特化した各種サービスの開発・運営と広告事業に加え、Fintech事業、コマース事業などを展開しています。基軸となる「LINE」アプリは2023年現在、世界で約2億人が利用しており、LINEスタンプと呼ばれる画像を用いたコミュニケーションがユーザー同士で活発に行われている点が大きな特徴のひとつです。 これから数回にわたり、SREの私が主に担当しているLINEスタ

                                                                LINEの「あけおめLINE」過負荷対策(1) ― リスクマネジメントの全体像と「発生可能性の低減」 | gihyo.jp
                                                              • SRE NEXT 2022 ONLINEの発表資料まとめ - Qiita

                                                                Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

                                                                  SRE NEXT 2022 ONLINEの発表資料まとめ - Qiita
                                                                • 「なんでも屋」は避けたいですか?なんでもできたら最強じゃないですか?:No SRE , No life|教科書には載っていない!俺たちが考えたSRE推進の道しるべ #SHIFT TECH TALKS#1 後記とQA補足 #SHIFT_SRE - 株式会社X-Tech5

                                                                  Blog X-Tech5エンジニアがお送りするテックブログ SREやDevOpsをはじめ、インフラエンジニアリングの実践情報を届けします。 「なんでも屋」は避けたいですか?なんでもできたら最強じゃないですか?:No SRE , No life|教科書には載っていない!俺たちが考えたSRE推進の道しるべ #SHIFT TECH TALKS#1 後記とQA補足 #SHIFT_SRE 2024年4月2日 こんにちは。CTOの馬場(@netmarkjp)です。 2024年3月26日に TECH PLAY にて No SRE,No life|教科書には載っていない!俺たちが考えたSRE推進の道しるべ| #SHIFT TECH TALKS#1 が開催されました。 わたしはトップバッターとして『SREsのためのSRE定着ガイド』をお話しました。 ご質問を多数いただきまして、時間内にはすべては扱えず残念で

                                                                    「なんでも屋」は避けたいですか?なんでもできたら最強じゃないですか?:No SRE , No life|教科書には載っていない!俺たちが考えたSRE推進の道しるべ #SHIFT TECH TALKS#1 後記とQA補足 #SHIFT_SRE - 株式会社X-Tech5
                                                                  • [資料公開] DevOpsとSREのために知るべき3つの原則 〜忙しすぎるエンジニアのための開発環境リファクタリングガイド〜 #devio2023 | DevelopersIO

                                                                    盛況のうちに閉幕しましたオフラインイベント。お暑い中多数のご来場をいただき、ほんとうにありがとうございました! 2日目 7/8 の 15:10 より、標題の 長すぎる タイトルのセッションで登壇しました。その時に資料を公開します。 「開発環境」と銘打っていますが、運用がメイン担当であるエンジニアの方にとってもヒントになるものを盛り込めたのではないかなーと自負しています。 *1 内容 日々大切なアプリケーションを開発されている開発者の方々のなかには、開発基盤やパイプラインに何かしらの課題を感じている方も多いのではないでしょうか。 それらを一撃で吹き飛ばす特効薬「銀の弾丸」はもちろん存在しませんが、その一部は、ツールや手法・考え方の工夫次第で軽減できるものかもしれません。 状況の変化に合わせて武器や装備を整え直すRPG(ロールプレイングゲーム)のように、開発環境やパイプラインに改善の余地はない

                                                                      [資料公開] DevOpsとSREのために知るべき3つの原則 〜忙しすぎるエンジニアのための開発環境リファクタリングガイド〜 #devio2023 | DevelopersIO
                                                                    • クラウドが好きな大学生が読んで良さげだった本を紹介する - Qiita

                                                                      前提 大学1年の終わり頃にプログラミング学習を始めて、ちょうど3年弱くらい経ちました。 数え切れないほどの技術書を読んできましたが、その中でも「これはよかったような気がする!」という書籍を載せておきます。 選出の観点は「面白さ」「わかりやすさ」「その知識が役に立ったか」の3つの観点から総合的に評価しています。 また、原則翻訳されたものがあればそちらを掲載しています。 ところが、僕はO'Reillyのサブスクを契約しているため、ほとんどのO'Reillyの書籍を原文で読んでいます。 そのため、翻訳の精度などについて評価することはできない点をご了承ください。 ※ リンクはアフィリエイトリンクではないので、気にせずご覧ください。 ネットワーク 3分間ネットワーク ネットワークのプロトコルとか以前の最低限の仕組みをトーク形式でわかりやすく話してくれている書籍です。 大学の授業とかを受ける前にこの本

                                                                        クラウドが好きな大学生が読んで良さげだった本を紹介する - Qiita
                                                                      • 監視とオブザーバビリティ 〜 悩む前に確認しておくべきこと / 20230926-ssmjp-monitoring-and-observability

                                                                        2023年9月26日開催の「ssmonline #37」での発表「監視方法論」のうち、一部を抽出して公開しました。 当日ツッコミ枠でご参加いただいたみなさん、ご視聴いただいた皆様ありがとうございました。

                                                                          監視とオブザーバビリティ 〜 悩む前に確認しておくべきこと / 20230926-ssmjp-monitoring-and-observability
                                                                        • 未経験者が不明点を徹底的に潰し、SREとして急速成長した話 | BLOG - DeNA Engineering

                                                                          こんにちは。IT 基盤部の小池です。 2020年8月5日(水) に開催された、 bit valley 2020 プレイベント | bit valley 2020 プレイベント 20代で圧倒的成長を目指すエンジニア ~これが私のグロース戦略~ に登壇してきたので、その報告をします。 発表内容 上記が、当日の発表資料です。 以下で簡単に内容を紹介したいと思います。 開発経験なしからどのようにキャッチアップしてきたか 入社当時から “開発経験もない” “年齢も高い” と、自分にはネガティブな点が多いと思っていたので、 成果を出しつつ効率的にキャッチアップしていかなければならないと思っていました。 そこで、「積極的に手をあげる」-> 「わからないを徹底的に潰す」->「タスクの完成度を上げる」というサイクルでタスクを回していました。 こうすることで、成果を出すこととキャッチアップすることを並列でこな

                                                                            未経験者が不明点を徹底的に潰し、SREとして急速成長した話 | BLOG - DeNA Engineering
                                                                          • GitHub - mercari/production-readiness-checklist: Production readiness checklist used for Mercari and Merpay microservices

                                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                              GitHub - mercari/production-readiness-checklist: Production readiness checklist used for Mercari and Merpay microservices
                                                                            • 入社4日目のAWS専任者が挑むセキュリティの向上 “土地勘”がないからこそ選んだ「OODAループ」という考え方

                                                                              人・カネ・ものの足りないスタートアップにおいて、どのように工夫しているか発信する「スタートアップ事例祭り ~監視・モニタリング・セキュリティ編~」。ここで山原氏が「スタートアップ入社4日目までに考えたAWSのセキュリティ向上 」をテーマに登壇。まずは、株式会社スマートラウンドがおかれている状況と、ベストプラクティスの検討について紹介します。 自己紹介と会社紹介 山原崇史氏:山原です。タイトルは「スタートアップ入社4日目までに考えたAWSのセキュリティ向上」になります。自己紹介です。スマートラウンドという会社のSREをやっています。(スライドを示して)経歴は記載のとおりで、好きなAWSサービスはAWS SSO(AWS Single Sign-On)やOrganizationsです。 会社や事業の内容についても説明します。スマートラウンドは設立が2018年、4年前のスタートアップで、従業員数は

                                                                                入社4日目のAWS専任者が挑むセキュリティの向上 “土地勘”がないからこそ選んだ「OODAループ」という考え方
                                                                              • SRE チームをよりサステナブルにするために Vision/Mission/Values を作った話 - スタディサプリ Product Team Blog

                                                                                小中高 SRE チームで Engineering Manager をやっている @yuya-takeyama です。 Quipper にはスタディサプリ ENGLISH の SRE である ENGLISH SRE チームと合わせて 2 つの SRE チームがありますが、この記事では自分たち小中高 SRE チームについての話です。 少し前の話になるんですが、小中高 SRE チームの Vision, Mission, Values というものをチームで作りました。 Quipper には会社としての Vision, Mission そして Quipper Identities というものがあります。 これらは策定から数年以上経っていますが、Quipper の社員にとって今も変わらず大事なものです。 が、SRE チームにとっては教育や学習に対して直接的に貢献しているとは言いづらい状況です。 そこで

                                                                                  SRE チームをよりサステナブルにするために Vision/Mission/Values を作った話 - スタディサプリ Product Team Blog
                                                                                • エンジニアなら知っておきたい障害報告&再発防止策の考え方 - Qiita

                                                                                  システムには障害がつきものです。どんなにしっかりと作られたサービスであっても思わぬところで、バグやミスが発覚して、トラブルになるものです。大事なのはこういった障害を次への糧にしていくこと。失敗というのは大事な資産なので、管理できるようにしましょうという話。 あわせて読みたい あきらめるにはまだ早い!ソースコードの品質向上に効果的なアプローチ メンタリングの方法について基礎をまとめました。内心でなく行動を変えることが障害報告とも共通します。 新入社員が来てメンターになれって言われたけど、どうすればいいのかという対話テクニック 半年で40kg痩せた!ダイエットでわかるリーンなプロジェクトマネジメント手法 心理的安全性ガイドライン(あるいは権威勾配に関する一考察) 障害の種類と障害報告について 障害には、小さなもの、たとえば画面に表示されているテキストの乱れから、すべての画面で50xエラーが発生

                                                                                    エンジニアなら知っておきたい障害報告&再発防止策の考え方 - Qiita