[B! SRE] zex5yoのブックマーク

zex5yo id:zex5yo

SREに関するzex5yoのブックマーク (26)

https://x.com/yuuk1t/status/1708787131651616988?s=12&t=suYC6B2IhN7jv0qU5zDxmQ
- 1 user
- x.com
- 世の中
zex5yo 2023/10/02
SRE

あとで読む
リンク
https://twitter.com/aokitenzen/status/1663837146481053696?s=12&t=suYC6B2IhN7jv0qU5zDxmQ
zex5yo 2023/05/31
インフラ

あとで読む

SRE

Kubernetes

k8s
リンク
SRE不在のチームに入って2ヶ月でやったこと - 負荷試験ツールからはじめるSREプラクティスの導入
TechFeed Experts Night#17 〜事例で学ぶSRE 〜ツール、プラクティスから組織づくりまで https://techfeed.io/events/techfeed-experts-night-17
zex5yo 2023/05/08
SRE

ツール

あとで読む

テスト

パフォーマンス

ISUCON
リンク
SRE 研修
SRE 研修共有ログインお使いのブラウザのバージョンはサポートが終了しました。サポートされているブラウザにアップグレードしてください。閉じるファイル編集表示ツールヘルプユーザー補助機能デバッグ
zex5yo 2023/04/17
あとで読む

SRE

資料

DevOps
リンク
https://twitter.com/nwiizo/status/1622912186543935490?s=12&t=89UN6VxGo4meCGfwBGB4HQ
zex5yo 2023/02/08
あとで読む

SRE

転職
リンク
Prometheusでアプリケーションを監視してみよう | IIJ Bootcamp
# Prometheusでアプリケーションを監視してみよう # 0. まえがき # 0-1. 想定している受講者本講義では以下の受講者を対象としています。監視って言われても何を監視すればいいのか分からない監視が必要なのはわかるけど、なんで必要なのか分からない Prometheusを触ったことがないので触ってみたい # 0-2. 前提知識基本的に前提知識は無しでも問題ないですが、以下の点を押さえておくと講義がスムーズに聞けます。 Linuxの基礎的なコマンド dockerの基礎 # 0-3. 事前準備 Dockerのインストール docker image lsで"hello-world"が存在しない状態で、docker run hello-worldが実行できていればOK Docker Composeのインストール docker-compose --versionでバージョン情報が出
zex5yo 2023/02/01
あとで読む

監視

SRE

勉強

Prometheus
リンク
SREとインフラエンジニアの違いを3つのポイントで理解する | sreake.com | 株式会社スリーシェイク
この記事では、SREとインフラエンジニアの違いについて3つのポイントで解説します。 SREとインフラエンジニアの違いを3つのポイントで理解する SREとインフラエンジニアの3つの違い1.業務範囲2.スキルセット3.方法論インフラエンジニアのキャリアパスとしてのSRE希少なSRE人材が提供する高品質なSREサービス = Sreake ここ数年、国内外問わずSREという職種が注目されてきており、実際にSREチームを作ってサービスを開発している企業も増えてきました。しかし、実情を見ると、従来のインフラエンジニアチームと大きな違いはなく、SREとしての力が十分に発揮されていないことが多いように感じます。そこで今回はSREとインフラエンジニアの違いについて解説していきます。SREとインフラエンジニアの作業領域や、根本となる考え方の違いについても触れていきます。関連記事：「SREとDevOpsの違
zex5yo 2023/02/01
SRE

インフラ

あとで読む

キャリア

転職
リンク
"Enterprise Roadmap to SRE"の日本語訳が出ました - YAMAGUCHI::weblog
はじめにこんにちは、Google CloudでオブザーバビリティとSREの担当をしているものです。今日は去年仕事でやってたものがようやっと表にでたのでその紹介をします。「SREエンタープライズロードマップ」がでました Enterprise Roadmap to SREの日本語訳が公開されました。本レポートはSREに関して、その技術的立ち位置、導入する理由、必要なプロセス、文化、事例など、幅広く大局観を与えるコンパクトなレポートとなっています。ぜひご一読ください。#SRE #DevOps #GoogleCloudhttps://t.co/Lo1yY40CF4— Google Site Reliability Engineering (@googlesre) 2023年1月25日「SREエンタープライズロードマップ」はかねてより "Enterprise Roadmap to SRE" と
zex5yo 2023/01/29
本

SRE

あとで読む

転職
リンク
Enterprise Roadmap to SRE - Google - Site Reliability Engineering
Google が過去に出版した 2 冊の書籍「Site Reliability Engineering」と「The Site Reliability Workbook」は、サービスライフサイクル全体への取り組みによって、組織がソフトウェアシステムの構築、展開、監視、保守を成功させる方法と理由を示しています。本レポートでは、Google Cloud Reliability Advocate の Steve McGhee と Google Cloud Solutions Architect の James Brookbank が、組織で SRE を導入する際にエンジニアが直面する特定の課題について深く掘り下げています。 SRE の普及にもかかわらず、多くの企業では SRE に対する当初の熱意と、その採用の度合いの間に大きな隔たりが生じています。本レポートは、プロダクトオーナーや信頼性の高いサー
zex5yo 2023/01/26
SRE

あとで読む

本
リンク
待望の日本語版発売！『詳解システムパフォーマンス第2版』Linuxが深く学べる名著を全力で推したい - LIVESENSE ENGINEER BLOG
こんにちは、かたいなかです。『詳解システムパフォーマンス第2版』の日本語版が2023/01/24についに発売されました！ www.oreilly.co.jp 私個人は原著で読んだのですが、他の人に強くおすすめしたくなるような内容でした。そこで、日本語版の発売に合わせてどのあたりが良かったのかなど、内容をご紹介します。 TL;DR パフォーマンス改善タスクの課題感どんな本？この本のどこがいい？ Linuxの仕組みを広く深く学べるパフォーマンスの観点での情報が豊富どんなひとにおすすめできるか？クラウドやコンテナが当たり前になってからSREになった人 Linuxの知識をアップデートしたいエンジニア最後まで読み切るには？あせらずゆっくり読んでいく Linuxの前提知識を仕入れてから読む終わりに TL;DR 『詳解システムパフォーマンス第2版』は、Linuxを深く学んで仕事に活
zex5yo 2023/01/24
パフォーマンス

SRE

Linux

本

あとで読む
リンク
クエリログを使ったPostgreSQLの負荷テスト - カンムテックブログ
SREの菅原です。この記事はカンム Advent Calendar 2022の４日目の記事になります。少し前にサービスで使っているPostgreSQLをRDSからAuroraに移行しました。 Auroraに移行するため色々と作業を行ったのですが、その中でAuroraの性能を測るために行った負荷テストについて書きます。 pgbench まず最初にpgbenchを使って、単純なワークロードでのRDSをAuroraの性能差を測ってみました。*1 以下がその結果です。 MySQLで同様のテストをmysqlslapを使って行ったことがあって、そのときは概ねAuroraのほうが性能が高かったので、同様の結果になると考えていたのですが、RDSのほうが性能が高い結果になったのは予想外でした。ただAuroraのアーキテクチャを考えると、pgbenchのような細かすぎるトランザクションの場合はRDSのほ
zex5yo 2022/12/04
sre

SRE

あとで読む

ログ
リンク
サーバーレスアーキテクチャーも大胆に導入！自律・自走できる組織作りを進めるカオナビのインフラチーム - はてなニュース
タレントマネジメントシステムを提供する株式会社カオナビでは、サービスをSaaS型にシフトするにあたってAWS（Amazon Web Services）を全面的に採用し、サーバレスの基盤開発でもAWSのマネージドサービスを積極的に活用しています。そのベースにある「運用しない運用」という言葉の意図や、計測・監視の取り組み、アプリケーション開発の経験も活用できる「自走するインフラ組織」について、インフラグループの大久保智之さんと新井健さんに聞きました。 ※この記事は株式会社カオナビによるSponsoredContentです。 AWSへの移行から技術的な挑戦を進めるサーバレスを推進して温かみある手順から脱出開発の経験も生かしたアプリケーション監視と指標自動化の原則は自走と自律カオナビではエンジニアを積極募集しています！ AWSへの移行から技術的な挑戦を進める ── プロフィール（後掲）を
zex5yo 2022/09/14
インフラ

監視

あとで読む

転職

SRE
リンク
SRE導入: システムを安定させる4000万円の魔法の壺 - MonotaRO Tech Blog
こんにちは。鈴木です。ここにシステムを安定させる4000万円の魔法の壺があるとします。あなたなら買いますか。はじめに SREやればいいのに 4000万円の魔法の壺なぜモノタロウはSREに取り組むのか 10分落ちると数百万円、数千万円の影響が出る不安定なシステムを札束でしばいたことがある大規模化・複雑化が旧来の運用方法を無効化する SREの導入による効果会話の中に「SLO」が登場するようになったシステムの状態を深く理解できるようになったオンコールの初動対応が早く精緻になった SREの難しさ組織横断的な活動の難しさ安定的に時間を使うことの難しさ利用するツールやサービスの難しさどのようにSREを導入したのか Googleの最新SREを学んだ CUJを定義した SLIとSLOを定義した Cloud Monitoringでダッシュボードを作成した役に立つかもしれない話可
zex5yo 2022/09/13
あとで読む

転職

SRE
リンク
SRE Classroom: The Art of SLOs - Google
The Art of SLOsは、GoogleのCustomer Reliability Engineeringチームによって開発されたワークショップです。このワークショップの目的は、Googleがサービスの信頼性を計測する方法サービスレベル指標(SLI) とサービスレベル目標 (SLO)を参加者に紹介し、実際にこれらの計測方法を作成することを体験してもらうことです。これらは重要で土台となる概念です。サービスの信頼性を客観的に測定する方法があれば、サービスの信頼性について有意義な会話をすることがはるかに簡単になります。ワークショップの理論編では、開発チームと運用チームの間でしばしば生じる組織的な緊張を、サービスの望ましい信頼性を表す目標値を設定することで解決する方法を学びます。また、SLOとエラーバジェットを使って、データ駆動で、客観的、かつユーザー重視の方法でサービスの信頼性を測定・
zex5yo 2022/07/09
SRE

あとで読む
リンク
https://twitter.com/NIFTYDevelopers/status/1536898749741826048
zex5yo 2022/06/24
SRE
リンク
「入門監視」5年を経て変わったこと、変わらないこと / Fundamental principles in Practical Monitoring
2022年6月2日に開催された、Observability Lounge 「『監視』の原則と変化」という勉強会での発表資料です https://forkwell.connpass.com/event/247721/
zex5yo 2022/06/10
監視

あとで読む

SRE
リンク
「インフラで私が一番面白いと考えている世界」GMOペパボ株式会社近藤宇智朗（うづら） | Forkwell Press | フォークウェルプレス
Forkwell が主催する技術イベント「Infra Study」。今回のテーマは「インフラの面白い技術とこれから」です。（開催日：2020年 7月29日）。本記事は登壇者の近藤さんの基調講演から mruby や C言語を使い、コンテナを自作している様子をお伝えします。最後には、登壇者の近藤さんとまつもとりーさんが視聴者からの質問に回答しているので、ぜひご覧ください。この回ではインフラで一番面白い世界について考えていきます。皆さん、子どもの頃、中身が気になって時計を分解するようなことがありましたか？　私はありませんでした。にも関わらず今私が一番面白いと考えている世界はインフラの「中身」です。インフラエンジニアは、ともすれば与えられたOS、ミドルウェア、マネージドサービスを上手に組み合わせることを求められますし、実際それらの要素を適材適所位配置できることは良いインフラエンジニア、アー
zex5yo 2022/05/10
インフラ

SRE

あとで読む

キャリア

転職
リンク
https://twitter.com/t_yoshinaga0106/status/1507658903311773697
zex5yo 2022/03/26
SRE

本
リンク
開発メンバーの保守運用スキルを上げるため実施している朝当番制度の紹介 - Classi開発者ブログ
こんにちは、開発支援部基盤インフラチームの kenryooo です。 Classiでは過去の高負荷によるアクセス障害での反省を踏まえ、エンジニア向けに保守運用スキルを高める施策として、朝当番という制度を運用しています。今回はその紹介をします。目的朝当番制度は、下記を目的に運用しています。 Classiのピークタイム(毎朝8:00 - 9:30)に問題が起きた場合、社内向けにスムーズな情報連携を行うサービス品質の継続的な改善パフォーマンスや監視内容に異常があった場合や、依存している外部接続システムやSaaSのメンテナンス情報などを担当チームへ共有する担当エンジニアの育成 Classiシステムの全体像の理解担当外のアプリケーション(リポジトリ)の理解システム監視の入門(Datadog) インシデントハンドリングの入門背景と課題朝当番制度は、下記の背景と課題感からスタートしてい
zex5yo 2022/03/03
監視

SRE

インフラ

保守

運用

あとで読む
リンク
Odashi on Twitter: "心理的安全性が低い →みんなDMやprivateチャンネルで会話する →心理的安全性が低いのはオープンじゃないからだ →禁止しましたほんと分からない"
心理的安全性が低い →みんなDMやprivateチャンネルで会話する →心理的安全性が低いのはオープンじゃないからだ →禁止しましたほんと分からない
zex5yo 2022/01/17
SRE

組織
リンク
1 2 次のページ