[4ページ] SREの人気記事 1288件 - はてなブックマーク

121 - 160 件 / 1288件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

SREの検索結果121 - 160 件 / 1288件

エンジニアのためのSRE論文への招待 - SRE NEXT 2023 - ゆううきブログ
- 191 users
- blog.yuuk.io
- テクノロジー
- 2023/10/02
この記事では、2023年9月29日に開催されたSRE NEXT 2023 IN TOKYOでの講演の概要に加えて、講演では触れられなかった部分の補足と、発表を終えての後記、最後にSRE NEXT全体の感想を書きました。 SRE NEXT 2020の基調講演に招いていただいたところから始まり、昨年のSRE NEXT 2022の公募セッションでも発表し、今回で3回目の発表になりました。今回の講演は、SRE NEXTの「NEXT」と価値観の一つである「Diversity」を踏まえて、自身のエンジニアと研究者の両方の経験を活かして、SREを深く実践する上で、技術論文を探して読むアプローチを提示するものです。昨今の国内のSREコミュニティでは組織的実践に主な関心が移っている状況と対比させて、コンピュータサイエンスに基づく技術的挑戦の可能性を示唆する意欲的な講演を目指したつもりです。この講演での主要
- sre
- あとで読む
- エンジニア
- 論文
- paper
- techfeed
AWSからオンプレミスに移行したWebRTC配信サーバのその後 - DMM inside
- 191 users
- inside.dmm.com
- テクノロジー
- 2021/12/21
｜DMM inside
- aws
- あとで読む
- WebRTC
- サーバ
- オンプレ
- 運用
- dmm
- CPU
- コスト
- SRE
スケールアウトの落とし穴から学ぶ、SREチームでのダッシュボードのアップデート術 - MonotaRO Tech Blog
- 190 users
- tech-blog.monotaro.com
- テクノロジー
- 2021/05/20
どんなことが起こったのか？モノタロウのサイトの監視についてレイテンシ監視トラフィック監視エラー監視リソース監視ログトラブルシュートの進め方発生検知発生箇所の特定根本原因の調査強化課題おわりに SREチームの市原(@ichi_taro3) です。モノタロウでは、www.monotaro.com という大規模なECサイトを自社で開発、運用しています。 Webアプリケーションの運用ではトラブルはつきものです。今回は、とあるトラブルシュート事例を軸に、どのように運用を改善しているのかについて紹介します。どんなことが起こったのか？あるとき、モノタロウのWebサービス全体でレイテンシ悪化やバックエンドAPIへのタイムアウトの増加が頻発したことがありました。当然これらは歓迎される状況ではなく、すぐに開発者やSRE、インフラチームの担当者が集まり調査を開始しました。現象は
- sre
- あとで読む
- 監視
- 運用
- infrastructure
- サービス
- インフラ
- performance
- サーバ
- tech
Aurora MySQL でレコードが存在するのに SELECT すると Empty set が返ってくる事象を調査した話
- 189 users
- blog.kinto-technologies.com
- テクノロジー
- 2023/05/13
こんにちは。 KINTO テクノロジーズの DBRE チーム所属のp2skです。 DBRE（Database Reliability Engineering）チームでは、横断組織としてデータベースに関する課題解決や、組織のアジリティとガバナンスのバランスを取るためのプラットフォーム開発などを行なっております。DBRE は比較的新しい概念で、DBRE という組織がある会社も少なく、あったとしても取り組んでいる内容や考え方が異なるような、発展途上の非常に面白い領域です。弊社における DBRE の取り組み例としては、あわっち（@_awache）による DBRE ガードレール構想の実現に向けた取り組みについてというテックブログや、今年の AWS Summit の登壇内容を是非ご覧ください。今回の記事は、データベースに関する課題解決の事例として「Aurora MySQL でレコードが存在するのに
- mysql
- Aurora
- aws
- あとで読む
- DB
- データベース
- トラブル
「Datadog入れてみたらAWSの料金が爆発した話」@ゆるSRE勉強会 #1
- 188 users
- speakerdeck.com/rynsuke
- テクノロジー
- 2023/08/29
ゆるSRE勉強会 #1 でお話しさせて頂いたLTの資料です！ https://yuru-sre.connpass.com/event/292063/
- aws
- あとで読む
- Datadog
- 運用
- sre
- cost
秘密情報には出どころも書いてくれ！頼む！ - KAYAC engineers' blog
- 185 users
- techblog.kayac.com
- テクノロジー
- 2022/12/11
SREチームの長田です。 KAYAC Advent Calendar 2022の11日目の記事です。アプリケーションから何かしらの外部サービスを利用するとき、そのサービスを利用するためのAPI Keyなり秘密鍵なりの秘密情報を保持することになります。暗号化したものをファイルとしてアプリケーションに持たせたり、 Amazon Web Services(AWS)ならAWS Secrets Managerや AWS Systems ManagerのParameter Store(SSM Paramater Store)に保存したものを実行時に読み込んだりするでしょう。これらの秘密情報、どこから来たのかわかりますか？どこから来た秘密情報なのか秘密情報を使って出どころを調べられるのであれば問題はないでしょう。 # 例えばAWSのIAM User Credenntialsとか $ AWS_A
スタディサプリ最大のRailsアプリケーションにYJIT+pitchforkを導入してメモリ使用量を劇的に削減するまで - スタディサプリ Product Team Blog
- 185 users
- blog.studysapuri.jp
- テクノロジー
- 2024/04/02
こんにちは。SREのkyontanです。Rubyが大好きなのでRubyの話をします。ちなみにリクルートはRubyKaigi 2024へGold Sponsorとして協賛しています! *1。ぜひ沖縄でお会いしましょう。これはあるアプリケーションのメモリ消費量を示すグラフなのですが、まさかgemを入れ替えるだけでこんなに嬉しい変化が見られるとは思っていませんでした。今日はそんなgemの話をします。話は遡って2023年4月のある日、インターネットを眺めていたところ、ShopifyがpitchforkというOSSを公開したという情報が目に留まりました。調べてみると、どうやら著名なRackサーバー実装の1つであるunicornの派生版であり、メモリ使用量の削減に特化しているらしいのです。 github.com これはスタディサプリ小中高のあのリソースドカ食いマイクロサービス第一位である api
- rails
- あとで読む
- pitchfork
- rack
- performance
- ruby
- gem
- API
エンジニアリングマネージャーとしての開発力向上の取り組みついて - Qiita
- 184 users
- qiita.com/KUMAN
- テクノロジー
- 2021/12/16
スクワッド体制における留意点として、「Spotifyは "Spotifyモデル "を使っていない [3]」で以下のように述べられているように、単に方法論を真似るのではく、自分の組織と向き合い、学習して、進化し続けることが大切であると思います。READYFORにおいても日々、組織体制について議論し、改善を進めています。ビジネスユニット、部門、チーム、マネージャーは、Spotifyの失敗した方法論に固執してはいけません。彼らはSptifyのモノマネよりも効果的に組織構造の役割と責任を伝えることができるのです。あなたがSpotify Modelを見つけたのは、自分のチームをどのように構成するかをいつも考えていたからでしょう。でもここで止まってはいけません。学習を続けてください。 1-2. READYFORのスクワッド体制 READYFORの場合、どのようなスクワッド体制を敷いているか？ひと
EKSからECSに移行して開発運用コストの削減を図る - KAYAC engineers' blog
- 184 users
- techblog.kayac.com
- テクノロジー
- 2022/09/29
SREチームの長田です。今回はカヤックで運用している「まちのコイン」というプロダクトのアプリケーション基盤を Amazon EKS(以下EKS)からAmazon ECS(以下ECS)に移行したはなしをします。まちのコインとは coin.machino.co www.kayac.com まちのコインはカヤックが運営している、デジタル地域通貨を使ってその地域のコミュニティを活性化させるサービスです。 2019年11月から実証実験を開始し、翌年2月から正式リリースされました。 2022年9月現在、20の地域に導入されています。一般ユーザーが使用するクライアントアプリと、導入地域の運営団体が使用するブラウザ用の管理画面、それらにAPIを提供するRailsサーバーアプリがあります。データベースはAmazon Aurora PostgreSQL、その他AWSのマネージドサービスを組み合わせ
- ECS
- あとで読む
- kubernetes
- EKS
- 運用
- aws
- 開発
スクウェア・エニックスの"とあるシステム"のSite Reliability Engineering
- 184 users
- blog.jp.square-enix.com
- テクノロジー
- 2022/11/22
はじめにこんにちは、情報システム部 SRE 橋本です。普段はクラウドエンジニア(SRE)としてチームリードをしています。興味関心がインフラ、Observability、SRE、Security、Golangといった分野であり、 Japan Google Cloud Usergroup for Enterprise(Jagu’e’r ジャガーと読みます)でObservability/SRE分科会のオーナーを担当させていただいております。その縁もあって先日Innovators Hive at Cloud Next 2022でコミュニティ運営についてお話をさせていただきました。この記事では現在チームリードをしていてビルドアップ中でもあるSREチームについて考えていることをお話したいと思います。また、このSREチームについてのインタビュー記事も掲載いたしました。メンバーやチームの雰囲気を伝
- SRE
- あとで読む
- 運用
- インフラ
- サーバ
- システム
- 開発
- engineering
- 組織
新卒で入社した合同会社DMM.comを退職しました - y-ohgi's blog
- 184 users
- y-ohgi.blog
- 政治と経済
- 2020/01/23
from: 合同会社DMM.com CTO室 to: フリーランス DMMどうだった良かった。なにしてたの新卒で入社し、3年ぐらいクラウドをいい感じにするエンジニアしてました。新規サービス立ち上げたり、リプレイスしたり、リファレンスアーキテクチャ作ったり、スクラムマスターしたり、とかとか。あと80回ぐらい社内勉強会（勉強会・LT会・Podcast）主催したりもしました。新卒入社 > プラットフォーム部 > CTO室 > SRE立ち上げ > CTO室 > 退職詳しくは「転職先募集 - y-ohgi's blog」でいろいろ書きました。なんで辞めたの理由としては新しく入ってきた上司（x3人）と折り合いがつかなかったことと、折り合いがつかなかった結果やりたいこと（全社のクラウド活用をいい感じにすること）ができなくなったため辞めました。特に何かが嫌になったとかではないです。よ
- 退職
- あとで読む
- DMM
- 仕事
- 会社
NewsPicksはDX向上に徹底的に注力する - エンジニアを採用し、スケーラブルな開発組織をつくるために - はてなニュース
- 183 users
- hatenanews.com
- テクノロジー
- 2021/04/26
ソーシャル経済メディア「NewsPicks」の運営・開発を行う株式会社ニューズピックスは、近年、DX（Developer Experience：開発者体験）の向上に注力しています。CPO、CTO、VP of Eと、3名のエンジニアがボードメンバーに名を連ねる同社のDXへのこだわりは徹底しており、「DX向上」は経営における重要項目としても取り扱われています。背景にあるのは、エンジニア組織をスケールさせる、という強い意思。近年、同社の開発組織は著しく拡大していますが、今後、さらにエンジニアを迎え入れるためには、良質なDXが得られるシステム、組織であることが不可欠だと考えているといいます。では、肝心要のDX向上はどのようにデザインされ、実行されているのでしょうか。本稿の読者も含め、世のエンジニアの方々に向けて同社のDXをプレゼンテーションし、応募を促進するべく、CTOの高山温さん、そして最前
- エンジニア
- あとで読む
- DX
- 開発
- 組織
postfixによる大量メール送信にまつわる問題と対処 - エムスリーテックブログ
- 179 users
- www.m3tech.blog
- テクノロジー
- 2023/06/07
【SREチームブログリレー2回目】お疲れ様です。エンジニアリンググループ、コアSREの山本です。前回ブログリレー1回目の記事で大量メール送信のために基本設定について書かせていただきました。 www.m3tech.blog 今回はそれを受けて構築したサーバで実際に発生したいくつかの問題、その問題への対処といったものを書かせてください。エムスリーのメール送信で発生した問題とその対策特定のメールサーバからの突然のメール拒否メールの翌日までの滞留 TLS問題メールがどうしても迷惑メール扱いされるという苦情 postfixのメール処理とステータスメールログの監視まとめ We are Hiring! エムスリーのメール送信で発生した問題とその対策実際にここ一年あたりの間に発生した問題とその問題への対応を記述していきたいと思います。postfixを利用して送信していますので設定はpo
- postfix
- メール
- あとで読む
- mail
- サーバ
- インフラ
- SRE
- email
- ネットワーク
10倍に膨れたAWS運用費をどう減らす？　ユーザー急増のnoteが挑む「コスト削減作戦」の裏側
- 179 users
- www.itmedia.co.jp
- テクノロジー
- 2021/10/29
10倍に膨れたAWS運用費をどう減らす？　ユーザー急増のnoteが挑む「コスト削減作戦」の裏側（1/2 ページ）文章やイラストなどを投稿できるコンテンツ配信サービス「note」。コロナ禍以降は巣ごもり需要にも後押しされてユーザー数が急増しており、2020年には月間アクティブユーザー数が前年同期比で3倍以上に増えたという。しかし同時にトラフィック量も急増したため、運営元であるnote社のシステム部門ではその対応に追われた。特にクラウドサービスの利用コストの高騰は、大きな悩みの種だった。 noteのサービスを支えるシステムは、全てAWS（Amazon Web Services）のクラウドインフラ上で構築・運用しており、トラフィック急増でその利用コストは約10倍にまで膨れ上がった。このままトラフィックがさらに増えれば、コストが利益を食いつぶすことにもなりかねない。そこでシステムの運用や品質管
- aws
- あとで読む
- 運用
- コスト
- SRE
- Amazon Web Services
- note
- サービス
- 仕事
「入門監視」5年を経て変わったこと、変わらないこと / Fundamental principles in Practical Monitoring
- 179 users
- speakerdeck.com/doublemarket
- テクノロジー
- 2022/06/10
2022年6月2日に開催された、Observability Lounge 「『監視』の原則と変化」という勉強会での発表資料です https://forkwell.connpass.com/event/247721/
- 監視
- あとで読む
- monitoring
- SRE
- ネット
- programming
Terraformを使って学ぶーAWSにインフラを構築するIaCの基本と、SREが実務で役立つ機能とエコシステムを徹底解説｜ハイクラス転職・求人情報サイト AMBI（アンビ）
- 177 users
- en-ambi.com
- テクノロジー
- 2023/09/22
ハイクラス求人TOPIT記事一覧Terraformを使って学ぶーAWSにインフラを構築するIaCの基本と、SREが実務で役立つ機能とエコシステムを徹底解説 Terraformを使って学ぶーAWSにインフラを構築するIaCの基本と、SREが実務で役立つ機能とエコシステムを徹底解説 Terraformは、パブリッククラウドのインフラ構築と自動化のツールとして、IaCのデファクトスタンダードとなっています。この記事では、AWS（Amazon Web Services）を活用するハンズオンを通してTerraformの動作を理解し、実務にもとづいて役立つ機能や便利なエコシステム、さらにSRE視点の事例を紹介します。アソビュー株式会社でSREユニットリーダーを務める鈴木剛志さんを中心に6名のメンバーによる共同執筆です。アイキャッチ画像アソビューでは、インフラストラクチャーの変更管理にTerrafo
- terraform
- あとで読む
- Amazon Web Services
- DevOps
- IaC
- techfeed
- SRE
- aws
30分でわかるFour Keysの基礎と重要性
- 176 users
- speakerdeck.com/yigarashi
- テクノロジー
- 2022/10/28
ソフトウェアデリバリーのパフォーマンスを示す4つの指標であるFour Keysについて、指標の成り立ち、改善する意義、各指標への向き合い方、近年の動向などを網羅的に解説しました。
EC2とcronで動いていたバッチ基盤をマネージド化した - Uzabase for Engineers
- 176 users
- tech.uzabase.com
- テクノロジー
- 2023/12/21
概要ソーシャル経済メディア「NewsPicks」SREチームの中川です。皆さんはバッチ処理基盤はどうされていますでしょうか。 NewsPicks では少し前まではそれらをEC2、cronの組み合わせで動作させていました。何年も前からこの仕組みだったのですがSREとしてはEC2の面倒見るのも手間ですし、それ以上にcronを変更する際のオペレーションミスが目立ったのが懸念点でした。その為、まずはAWSマネージド化するための基盤を整備し、その後バッチアプリを載せ替えていくようにしました。対応前の基盤構成同じSREチームの安藤さんが CloudNative Days Tokyo 2023 で登壇されたときの資料をお借りします。ご覧の通り、大体のサービスはマネージド化していましたがバッチ基盤だけは旧来のままEC2インスタンスを利用していました。 10年モノのサービスのインフラを漸進的
- aws
- あとで読む
- ECS
- cron
- バッチ
- batch
- architecture
オブザーバビリティにはお金がかかる - 株式会社ヘンリーエンジニアブログ
- 173 users
- dev.henry.jp
- テクノロジー
- 2023/08/22
tl;dr オブザーバビリティにはあなたの直感よりもお金がかかるかもしれない。でもそれはアジリティを上げるために必要なコストである。同時にオブザーバビリティ関連ベンダーには、それらをリーズナブルに提供してもらうことを期待します。オブザーバビリティ・エンジニアリング輪読会 8月からVPoEになりました。id:Songmuです。社内の勉強会で輪読形式でオブザーバービリティ・エンジニアリングを読んでいます。毎週30分、参加者の中から発表者を割り当て、1~2章を読み進めるスタイルです。ちなみに、ヘンリーではActive Book Dialogue(ADB)というフォーマットも取り入れて輪読会が運営されています。社内で同時並行で数本走っており、先日、CEOの逆瀬川が書いたソフトウェア見積もりに関する輪読会も同様の形式で実施しています。発表者は、事前に社内のNotionにその章のアウトラインや
メルカリのマイクロサービス/Kubernetes運用事例はバイブルだ - orangeitems’s diary
- 172 users
- www.orangeitems.com
- テクノロジー
- 2019/11/29
多くの人に見てほしいスライドメルカリのマイクロサービス/Kubernetes運用事例を拝見しました。 speakerdeck.com こちら、中身はメルカリにおけるマイクロサービス・Kubernetesの実際の運用状況をまとめた内容になっています。この内容が欲しかった。この世の中で、会社のITサービス基盤をKubernetesにてマイクロサービス化できている企業はほとんどいません。言い切ります。まだ仮想マシンのWEB+AP+DBの3層構成のままです。もしくは、AWS Lambraなどサーバレスでマイクロサービス化した事例は多数出てきていますがこれは基盤にKubernetesが使われている可能性はあるにしろ、ユーザーは意識していません。 Kubernetesをエンタープライズに適用する。このケースではGCEですが企業としてどのようなオペレーションになるのか、どういう思考錯誤があるのかが
技術の洪水に立ち向かう: 開発者の心を軽くするプラットフォームエンジニアリングの話
- 170 users
- speakerdeck.com/jacopen
- テクノロジー
- 2023/10/31
Findy主催のイベント「なぜ話題？Platform Engineering最前線〜いま注目を浴びている理由とは〜」 https://findy.connpass.com/event/298961/ でお話しした資料です
- devops
- あとで読む
- エンジニアリング
- 開発
- SRE
- インフラ
- 技術
- Team
- Engineer
「SREの探求」という本が出版されました #seekingsre - YAMAGUCHI::weblog
- 170 users
- ymotongpoo.hatenablog.com
- テクノロジー
- 2021/09/03
はじめにこんにちは、Cloud Operations担当者です。このたび私が監訳者として関わった「SREの探求―様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践」という本がオライリー・ジャパン社より出版されました。本日より書店ならびに各社オンラインストアでご購入いただけます。 SREの探求 ―様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践オライリージャパンAmazon 電子書籍版についてはオライリー・ジャパンのサイトよりePub、PDFの各種フォーマットにてご購入いただけます。 www.oreilly.co.jp TL;DR 「SREの探求」はGoogle以外の企業でSREの導入がどのように行われているのかを記したエッセイ集です。スタートアップからエンタープライズまで、多くの事例を楽しみながら読める一冊だと思います。ボリュームに圧倒されるかもし
- SRE
- あとで読む
- book
- 202109
- DevOps
- 本
- 組織
- 書籍
- google
ログ調査基盤を構築してみた
- 169 users
- zenn.dev/coconala
- テクノロジー
- 2024/03/28
こんにちは。株式会社ココナラのインフラ・SREチーム所属のかずです。システム運用において、有事の際に迅速かつ適切なシステム稼働状況の確認は欠かせません。その手段の1つとして、ログの調査や分析の効率化は切っても切れない関係です。システムが成長するにあわせ、ログの種類や量が多くなり、結果としてログの調査や分析が難しくなるのはよくある話かと思います。弊社でもサービスのグロースに伴って、ログの種類や量が多くなり、結果としてログの調査や分析で課題を抱えていました。具体的には以下の2点です。ログから原因調査を行うには、複数ログを横断・突き合わせが必要ログの追跡に必要な情報がログに出力されない場合があるそこで、課題への対応としてログ調査基盤の構築を行いました。本記事では背景や苦労したこと、効果についてご紹介します。複数ログの横断調査実現に向けてログ調査基盤の構築苦労したこと
- ログ
- あとで読む
- log
- 分析
- システム
- 統計
- aws
- 開発
- インフラ
Kubernetesに対応した継続的デリバリツール「Razee」、オープンソースでIBMが公開。1万以上のクラスタを25人以下のスタッフで運用した経験を元に
- 167 users
- www.publickey1.jp
- テクノロジー
- 2019/06/10
IBMは、同社が1万以上のKubernetesクラスタを25人以下のスタッフで運用してきた経験を元に開発した継続的デリバリツール「Razee」をオープンソースで公開しました。 1万以上のKubernetesクラスタを効率よく運用するには同社はIBM Cloud上でKubernetesのマネージドサービスを提供しており、これまでに10万以上のKubernetesクラスタを作成し、現在でも6つのリージョンにある35以上のデータセンターで、1万以上のKubernetesクラスタを運用中だとしています。 IBMの説明によると、これだけ大規模になると、Kubernetesを運用管理するためのコントロールプレーンもKubernetesクラスタ上で稼働させており、Kubernetesを運用するためにKubernetesを運用しているという状態。この規模で、しかも急速に成長中のサービス運用を25人以下
- kubernetes
- あとで読む
- IBM
- 運用
- k8s
- sre
AWS導入～スケールまでの変遷を事例に学ぶ - コンテナ化のために「みてね」が選んだ構築戦略 - エンジニアHub｜Webエンジニアのキャリアを考える！
- 167 users
- eh-career.com
- テクノロジー
- 2019/12/12
AWS導入～スケールまでの変遷を事例に学ぶ - コンテナ化のために「みてね」が選んだ構築戦略これからAWSを導入する、AWSに入門するといった方に向け、AWSの導入のための基本的な戦略や考え方を事例で紹介します。多岐にわたるAWSの機能をいかに活用するか。サービス立ち上げから、その後のスケールまで、実際の現場でどのようにAWSを活用しているかを、株式会社ミクシィで「みてね」のインフラをリードする清水勲さんが語ります。今や全世界のWebを支えるクラウドとして欠かせない存在となったAWS（Amazon Web Services）。さまざまな規模、目的のWebで活用されている中、持続的・永続的なサービス設計・開発・運用をするには、日々の情報収集と、時代に合わせたアップデートが求められます。今回、株式会社ミクシィが提供する「家族アルバムみてね」でのAWS活用事例をもとに、AWS活用のヒント
サーバーレスアーキテクチャーも大胆に導入！自律・自走できる組織作りを進めるカオナビのインフラチーム - はてなニュース
- 167 users
- hatenanews.com
- テクノロジー
- 2022/09/13
タレントマネジメントシステムを提供する株式会社カオナビでは、サービスをSaaS型にシフトするにあたってAWS（Amazon Web Services）を全面的に採用し、サーバレスの基盤開発でもAWSのマネージドサービスを積極的に活用しています。そのベースにある「運用しない運用」という言葉の意図や、計測・監視の取り組み、アプリケーション開発の経験も活用できる「自走するインフラ組織」について、インフラグループの大久保智之さんと新井健さんに聞きました。 ※この記事は株式会社カオナビによるSponsoredContentです。 AWSへの移行から技術的な挑戦を進めるサーバレスを推進して温かみある手順から脱出開発の経験も生かしたアプリケーション監視と指標自動化の原則は自走と自律カオナビではエンジニアを積極募集しています！ AWSへの移行から技術的な挑戦を進める ── プロフィール（後掲）を
- インフラ
- あとで読む
- AWS
- 監視
- 技術
- Note
SRE_Culture_Organization
- 167 users
- speakerdeck.com/masayoshi
- テクノロジー
- 2020/06/16
Infra Study Meetup #3 「SREのこれまでとこれから」の発表資料です https://forkwell.connpass.com/event/176885/
- SRE
- あとで読む
- infrastructure
- masayoshi
- slide
- slides
- organization
- team
Zero Touch Productionとは何か
- 163 users
- deeeet.com
- テクノロジー
- 2020/10/15
GoogleのSREとSecurityによるBuilding Secure Reliable Systems という本の中で「Zero Touch Production (ZTP) 」という考え方が紹介されていた．これはインフラの権限管理やインフラの構築そのものの指針となる概念であり，自分がそうあるべきだとずっと思ってきた考え方でもある．これはどのような考え方なのか?をこれまでの歴史を踏まえて具体的なツールや事例とともにまとめておく． Zero Touch Production Building Secure Reliable Systems においてZero Touch Production (ZTP) は以下のように定義されている． The SRE organization at Google is working to build upon the concept of least
- sre
- インフラ
- あとで読む
- infrastructure
- security
- google
- development
- devops
- 運用
- ツール
Platform Engineeringへの招待
- 163 users
- speakerdeck.com/jacopen
- テクノロジー
- 2023/03/10
第1回 Platform Engineering Meetupで発表した資料です。 #PFEM
デプロイ再考2024/reconsidering-deploy-in-2024
- 162 users
- speakerdeck.com/sugitak
- テクノロジー
- 2024/02/24
現在 estie では、デプロイの改善・統一に取り組んでいます。複数プロダクトのそれぞれの技術スタックが大きく違う中、どう考えたら効率的なデプロイを組めるのか。2024年のデプロイの原則について、あらためて考えてみました。
- デプロイ
- あとで読む
- deploy
- SRE
- devops
- 技術
システム監視、何からはじめる？ / What is the first step for system monitoring?
- 162 users
- speakerdeck.com/takumanakagame
- テクノロジー
- 2020/08/31
2020/08/31開催の、Infra Study Meetup #5「企業に必要とされているインフラ技術とこれから」のLTでお話した内容です。 https://forkwell.connpass.com/event/183909/
100人規模のエンジニア組織で DevOps Four Keys を導入し、アジリティー向上を目指した取り組み - MonotaRO Tech Blog
- 162 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/12/13
※この記事は開発生産性 Advent Calendar 2022 のカレンダー2の13日目の記事になります。前回は1日目は hiroshinishio さんの『より筋肉質なチームにするために、開発者が見るべき21のDevOpsアウトプット指標』で、個人的には指標それぞれの分析や改善の方法が書かれていて勉強になりました。こんにちは。モノタロウで主に DevOps エンジニアとして活動している伊藤です。休日はジムに節制した食事、サウナと健康を意識するおじさんとしても活動しています。（最近だと渋谷の改良湯さんのサウナと外気浴スペースの具合が最高でととのいました）今回は DevOps Four Keys*1 （以降 4keys と呼称）というソフトウェア開発チームのパフォーマンスを示す4つの指標を導入し、部門の目標として掲げたここ1年の取り組みを紹介できればと思います。背景
- devops
- あとで読む
- 組織
- SRE
- development
- エンジニア
CI/CD方針、テスト・QA方針と連動する三分類ブランチ管理方針で、開発での高品質と高スピードの両立を支える - 千里霧中
- 162 users
- goyoki.hatenablog.com
- テクノロジー
- 2023/06/18
最近の開発では、CI/CD、自動テスト、継続的テストが当たり前となっていますが、その影響で、それらのCI/CD方針、テスト方針と、Git等のバージョン管理のブランチ方針をどう連携させるかが、定番の課題になっていると感じています。今回は、このブランチ方針、CI/CD方針、テスト方針を連携させて、開発の品質とスピードを向上させるアプローチについて解説します。結論から言うと、要点は以下の二つとなります。バージョン管理のブランチ方針は、CI/CD方針、テスト・QA方針と不可分であり、連携を考えながら方針立てする必要があるブランチ方針の工夫で、CI/CD、テスト・QAの開発インフラリソース消費を削減でき、本当に重要なポイントに開発インフラリソースを投入できる。これにより、限られたリソースでの高品質・高スピードの両立を支えられる背景：開発インフラの進化が全てを解決すると楽観視していた発展期
- テスト
- あとで読む
- CI
- 開発
- CD
- インフラ
新規事業を加速させるリサーチ術/ Research tips for new biz creation
- 161 users
- speakerdeck.com/nozomi
- テクノロジー
- 2020/07/29
ビザスクさんにお誘いいただき、企業内新規事業担当者の方などに向けて、リサーチに関するお話をしました。 https://visasq.co.jp/seminar/research0728 調査、正しく使うと楽しいし、ためになるよ、というお話をしています。 30分くらいでお話したので、同じような講演ニーズがあればぜひまたお知らせください :-) info@cobe.work
- 新規事業
- あとで読む
- slide
- 調査
- research
- tips
- 統計
- startup
- マネジメント
AWS IAM セキュア化の取り組み
- 160 users
- medium.com
- テクノロジー
- 2021/12/13
鍵がいっぱいあるよこの記事は Eureka Advent Calendar 2021 の 13日目の記事です。はじめにこんにちは、エウレカ SREチームのハラダです！ 2020年頃から今年にかけて、エウレカのSREチームとSecurityチームではAWS IAMのセキュア化を注力ポイントのひとつとして、継続的に取り組んできました。本記事では、その実践から学んできたIAM管理で守るべき大原則および、具体的にどうやってセキュアな理想像に近づけてきたか、今後の方向性などを話したいと思います。 Why “IAM” so important ?そもそもなんでIAMが注力ポイントなの？と疑問に思われる方もいるでしょう。クラウドの大きな強みである「すべてをAPI経由で操作できる」という性質ゆえに、IAMは大きなAttack Surfaceでもあります。 Gartner社の予測によると、2023
- aws
- あとで読む
- iam
- security
- セキュリティ
- 認証
- SRE
- 仕事
- web
信頼性目標とシステムアーキテクチャー / Reliability Objective and System Architecture
- 160 users
- speakerdeck.com/ymotongpoo
- テクノロジー
- 2023/10/02
SRE NEXT 2023で発表した内容です。 https://www.youtube.com/live/c_oMpshssRg?si=LfArG3rX4VXPJ30H&t=27643
Amazon ECSで好きなだけ検証環境を起動できるOSSの設計・実装・運用 / YAPC::Hiroshima 2024
- 159 users
- speakerdeck.com/fujiwara3
- テクノロジー
- 2024/02/10
https://fortee.jp/yapc-hiroshima-2024/proposal/1e9fbacd-5a50-43ef-87f1-490e85448f17
- aws
- あとで読む
- oss
- ECS
- AWS
- 運用
- 設計
- 環境構築
- 環境
- 開発環境
継続的なソフトウェア・アップデートのためのDevOpsベストプラクティス・アンチパターン / DevOps Patterns and Antipatterns for Continuous Software Updates
- 158 users
- speakerdeck.com/ihcomega56
- テクノロジー
- 2020/09/08
Cloud Native Days Tokyo 2020
Renovate の大量の Pull Request を処理する技術 - スタディサプリ Product Team Blog
- 155 users
- blog.studysapuri.jp
- テクノロジー
- 2022/02/18
こんにちは。 SRE の @suzuki-shunsuke です。 Terraform Monorepo に対する Renovate の大量の Pull Request を処理するための技術について紹介します。背景過去ブログで何度か紹介しているように、弊プロダクトでは Terraform の Monorepo を管理しています。先日、 CI を AWS CodeBuild から GitHub Actions + tfaction に移行しました。 blog.studysapuri.jp working directory (state) の数は 400 近くあり、 working directory ごとに以下のような tool のバージョンを管理しています。 Terraform Terraform Provider tflint tflint plugin tfsec etc これ
- renovate
- Terraform
- ci
- GitHub
- あとで読む
- GitHub Actions
- SRE
- 技術
開発者の開発ペースを落とさずに強固なインフラストラクチャ・セキュリティを実現するためには - ITnews
- 153 users
- itnews.org
- テクノロジー
- 2020/05/24
Gravitational 「teleport」「teleconsole」など、クラウドネイティブのアプリケーションとインフラストラクチャを提供するオープンソースソフトウェアベンダーこの記事は、著者の許可を得て配信しています。 https://gravitational.com/blog/solid-infrastructure-security-without-slowing-down-developers/ この記事では、SaaS企業が強固なクラウド・インフラストラクチャ・セキュリティを持つことと、やりすぎて自社のエンジニアを怒らせてしまうことのトレードオフにどのようにアプローチしているかについて、私の見解を共有したいと思います。セキュリティというものはイライラの原因になります。セキュリティがイライラの原因にならなければ、日々の暮らしがもっと楽になるかもしれません。もしあなたがSR