本文「Observability」を検索 - はてなブックマーク

1 - 40 件 / 1002件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Observabilityの検索結果1 - 40 件 / 1002件

3〜4時間でAWSの監視系のサービス一気に学べたらコスパ良いと思いませんか | DevelopersIO
- 1092 users
- dev.classmethod.jp
- テクノロジー
- 2020/09/17
突然ですが、以下の機能がそれぞれどういうものかすべてご存知でしょうか？ CloudWatch ServiceLens X-Ray CloudWatch Contributor Insights CloudWatch Synthetics CloudWatch Container Insights CloudWatch Logs Insights CloudWatch メトリクス Metric Math 検索式カスタムメトリクス CloudWatch ダッシュボード CloudWatch 異常検出（Anomaly Detection） CloudWatch 埋め込みメトリックフォーマット CloudWatch アラーム異常検出に基づいたアラーム複合アラーム私はわからなかったですね。ここ 1〜2年のCloudWatch系のアップデート量は凄まじいなと個人的には思っていて、Cloud
- aws
- あとで読む
- 監視
- 学習
- マネジメント
- 勉強
- サービス
- tutorial
- monitoring
- IT
新メンバーが多い大型プロジェクトでの不確実性との戦い方 - スタディサプリ Product Team Blog
- 834 users
- blog.studysapuri.jp
- テクノロジー
- 2019/06/27
ペアプロ・モブプロ、スキルマップ、1-on-1等々… チーム開発にまつわる各論・方法論・話題をよく見る昨今、関心の高まりは歓迎さるべきことながらつまるところそれらが現実のどのような問題を解決していくのか？どのように相互作用するのか？これらが有機的に結びつくことで現実のどのような問題を解決していくか？こうした疑問に答えたり、具体例とともに記した記事はさほど多くないのではと思います。本記事では昨年度に筆者のチームが約7ヶ月携わったプロジェクトにて、プロジェクト特性に起因する不確実性と我々がいかに戦ったかを記します。チーム開発を行う方にとってこの記事が実りあるケーススタディとなれば幸いです。*1 なお、本記事では以下のことは本旨とは逸れるため割愛させていただきます。プロジェクトの機能的側面技術的不確実性各取り組み単体の詳細はじめに / プロジェクトの雰囲気を伝える図この記事で
ソースコードを公開したソフトウェアで収益を得ている会社
- 660 users
- zenn.dev/username
- テクノロジー
- 2021/11/29
ソースコードを公開したソフトウェアで収益を得ている会社をまとめる。いわゆる「オープンソースソフトウェア（OSS）」という有名な言葉を使わなかったのは、OSS の定義に当てはまらない、またはその可能性があるものが含まれているため。この記事では "OSS" の定義に当てはまらないものも含め、主要な事業を構成するソフトウェアを一定のライセンスの下で公開している会社をまとめていく。このようにソースコードを公開して利用者やフィードバックを集めるビジネスモデルは open core とか COSS: Commercial Open Source Software と呼ばれているようだ。企業が「ソースコードが公開されているソフトウェア」を利用するメリットとしては、主に以下の2つがあると考えられる。コア機能の開発に集中できる自社のビジネスの核となるソフトウェアの開発に集中し、それ以外の機能的・非機
- OSS
- あとで読む
- ソフトウェア
- ビジネス
- コード
- 会社
- ライセンス
- 企業
- redis
- business
Design Docs at Google
- 515 users
- www.industrialempathy.com
- テクノロジー
- 2020/07/22
One of the key elements of Google's software engineering culture is the use of design docs for defining software designs. These are relatively informal documents that the primary author or authors of a software system or application create before they embark on the coding project. The design doc documents the high level implementation strategy and key design decisions with emphasis on the trade-of
- google
- あとで読む
- design
- document
- ドキュメント
- 設計
- 開発
- デザイン
- architecture
- DesignDoc
GitHub、1200台以上のMySQL 5.7を8.0へアップグレード。サービス無停止のまま成功させる
- 464 users
- www.publickey1.jp
- テクノロジー
- 2023/12/12
GitHub、1200台以上のMySQL 5.7を8.0へアップグレード。サービス無停止のまま成功させる GitHubが提供するGitHub.comは、世界最大のソースコード管理システムを始めとするソフトウェア開発者向け支援サービスを提供しています。そのGitHub.comはRuby on Railsで構築されており、同社はつねにRubyとRuby on Railsをアップデートし続けていることを今年（2023年）4月に明らかにしています。参考：GitHubは200万行規模のRailsアプリケーションであり、毎週RailsとRubyを最新版にアップデートし続けているそして同社はこのGitHub.comを支える1200台以上のMySQL 5.7を、GitHub.comのサービスレベルを維持したまま1年以上かけてMySQL 8.0にアップグレードしたことをブログで明らかにしました。 Up
- mysql
- github
- あとで読む
- 運用
- db
- webサービス
- サービス
- rails
- データベース
- テスト
JP Contents Hub
- 432 users
- aws-samples.github.io
- テクノロジー
- 2022/09/18
AWS 日本語ハンズオン Amazon Web Services(AWS) の日本語ハンズオンやワークショップを、カテゴリごとにまとめています。右側の目次や、ヘッダー部分の検索ボックスから、各コンテンツにたどり着けます。また、Ctrl + F や command + F を使ったページ内検索もご活用いただけます。料金についてハンズオンで作成した AWS リソースは通常の料金が発生します。作成したリソースの削除を忘れずにお願いします。もし忘れてしまうと、想定外の料金が発生する可能性があります。画面の差異についてハンズオンで紹介されている手順と、実際の操作方法に差異がある場合があります。 AWS は随時アップデートされており、タイミングによってはハンズオンコンテンツが追いついていない事もあります。差異がある場合、AWS Document などを活用しながら進めて頂けますと幸い
- aws
- 学習
- あとで読む
- ハンズオン
- amazon
- study
- tutorial
- dynamodb
- ecs
- 教材
AWSハンズオンの探し方 | DevelopersIO
- 407 users
- dev.classmethod.jp
- テクノロジー
- 2022/07/07
お客様にAWSを学習するためのハンズオンの探し方を教えて欲しいと依頼されることがあったので、その際に調べた内容をまとめました。AWSのハンズオンを探す際にご利用ください。それぞれのハンズオンの個数は 2022-07-07 時点のものです。 2022-09-27 にAWSの日本語ハンズオンまとめページである JP Contents Hub がリリースされました。このブログで紹介している各種ハンズオンへのリンクも含まれているようですので、まずはJP Contents Hubを参照いただくのがよいかもしれません。JP Contents Hubの解説は AWS 日本語ハンズオンまとめ　JP Contents Hub のご紹介 | Amazon Web Services ブログを参照してください。 AWS ハンズオン資料ハンズオン資料 | AWS クラウドサービス活用資料集 22 個のハンズオン
書籍「Webエンジニアのための監視システム実装ガイド」発売！
- 388 users
- netmark.jp
- テクノロジー
- 2020/03/03
システム監視の入門書籍を書きましたわたしが執筆したWebエンジニアのための監視システム実装ガイドが2020/3/24に発売されますました。予約受付中です。物理書籍・Kindle共に販売中です。 PDF版なら検索もできちゃいます。 ※このエントリを書いている時点でまだ表紙がfixしていませんが、黒バックにウミガメ写真になる予定です運用監視の会社でCTOとして勤続12年の知見を詰め込んだ、システム監視について幅広く取り扱った実践的な入門書です。読者の方に体系的な知識と価値基準を獲得してもらえるよう努めました。監視テクノロジの歴史や特徴、監視システムの基本動作と動作方式ごとの特徴、時系列データベース、DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、Availability、Observability、自己修復システム、Chaos Engineering、監視方式の
- 監視
- あとで読む
- 運用
- 書籍
- エンジニア
- web
- 技術
- システム
- monitoring
- book
t_wadaさんと「単体テストの使い方/考え方」の疑問点についてディスカッションしました - DeNA Testing Blog
- 377 users
- swet.dena.com
- テクノロジー
- 2023/11/13
こんにちは、SWETグループの田熊です。現在SWETグループでは書籍「単体テストの使い方/考え方」の輪読会を実施しています。輪読会ではメンバー同士で活発に意見が交わされていますが、著者の主張に疑問を感じる箇所もあり、一度グループ外の方とも意見を交換したいと考えていました。そこで、t_wadaさんをお招きし「単体テストの使い方/考え方」についてディスカッションする機会を設けました。本記事では、SWETメンバーとt_wadaさんとのやりとりを紹介したいと思います。ディスカッションの流れディスカッションは事前にSWETグループのメンバーが書籍を読んで疑問に感じたテーマを挙げてもらい、t_wadaさんの意見を聞くという流れで行いました。今回は次のテーマについて話をしました。「退行に対する保護」があるテストとはなにか「リファクタリングへの耐性」のトレードオフはあるのか統合テストの
監視について思うとこ - y-ohgi's blog
- 366 users
- y-ohgi.blog
- テクノロジー
- 2019/08/19
TL;DR 監視はユーザーにサービスを提供できているかを観測するための行為 SLI/SLOを定めて、SLOを守れるようにモニタリングするダッシュボードは定常的に表示しておくものと障害時に活用するものを作ると良いアラートはレベル分けして人間が対応しなければならないものだけ人間へ通知する監視とはサービスを健全に動作させ続けるために監視を行います。「健全に動作している」の定義はサービスによって異なり、ユーザーにWebページを見せることができることだったり、バッチが正常に終了することだったりします。最終的にユーザーに正常にサービスを提供できていることを観測するために行うことに変わりはありません。さてユーザーにサービスを提供するために何を監視しましょうか？クラウド前提であれば個人的にリソースベース（CPU/Memory）より、 SLI/SLOをベースに監視する事が望ましいと考えてい
- 監視
- あとで読む
- monitoring
- datadog
- モニタリング
- 運用
- SRE
- サービス
- 情報システム
- ログ
「入門監視」を読んでからの取り組みを紹介します - WILLGATE TECH BLOG
- 351 users
- tech.willgate.co.jp
- テクノロジー
- 2019/09/26
「入門監視」を読んだフロントエンド監視なぜフロントエンド監視が必要なのかどうやってフロントエンド監視をしているのか Runbookを作ろうなぜRunbookが必要なのか Runbookをどう使っていくか監視の民主化勉強会開催今後こんにちは！インフラチームの小林です。今回はインフラチームが現在取り組んでいる、運用環境の改善施策を紹介します。「入門監視」を読んだ 2019年01月に「入門監視」という本が O'Reilly Japanから出版されました。 www.oreilly.co.jp 『システムをどう監視したらよいのか』『監視の仕組みをどう作ったらよいのか』について紹介している本です。実践したい事、反省する事だらけですが、フロントエンド監視とRunbook作成から始めています。フロントエンド監視なぜフロントエンド監視が必要なのか Webサイトの表示スピード
5年後には標準になっている可観測性のこと - Learning Opentelemetry の読書感想文 - じゃあ、おうちで学べる
- 326 users
- syu-m-5151.hatenablog.com
- テクノロジー
- 2024/04/16
はじめに本稿は、オープンソースの可観測性(Observability)プロジェクトである OpenTelemetry を取り上げた書籍「Learning Opentelemetry」の読書感想文です。従来の可観測性の課題であったデータの分断を解消し、トレース、メトリクス、ログなどの様々なテレメトリデータを統合的に扱うことができる OpenTelemetry は、可観測性の分野における革命的な存在と言えます。過去10年間で、可観測性はニッチな分野から、クラウドネイティブの世界のあらゆる部分に影響を与える数十億ドル規模の産業へと発展しました。しかし、効果的な可観測性の鍵は、高品質のテレメトリデータにあります。OpenTelemetryは、このデータを提供し、次世代の可観測性ツールと実践を開始することを目的としたプロジェクトです。 learning.oreilly.com 本書の想定読者は、
- OpenTelemetry
- あとで読む
- observability
- 監視
- 運用
- 開発
- book
- development
BPF Performance Toolsを読んだ感想 - go_vargoのブログ
- 321 users
- go-vargo.hatenablog.com
- テクノロジー
- 2020/03/29
BPF Performance Toolsを読んだので、感想ブログです。先に感想を言っておくと「最高」でした。 BPF Performance Toolsとは？ NetflixでKernel・パフォーマンスにかかわるチューニング・アーキテクチャを専門にしているBrendan Greggさんが書いた本です。BPFのiovisorというTracing分野の第一人者でもあります。 www.brendangregg.com 2019年12月に発売したばかりなので、BPFの分野では最新の本でしょう。他の著書に有名な本として(日本語版の)「詳解システム・パフォーマンス」があります。 BPF Performance Toolsは「詳解システム・パフォーマンス」第二弾と言えるかもしれません。ちなみにページ数は880Pあり、Kindleで表示される読み終わるための平均的な時間は「27時間30分」で、大作R
- performance
- BPF
- linux
- あとで読む
- ツール
- CPU
- eBPF
- book
- コマンド
- go
Modern Data Stack / モダンデータスタックというトレンドについて - satoshihirose.log
- 302 users
- satoshihirose.hateblo.jp
- テクノロジー
- 2021/11/20
はじめに Modern Data Stack ? Modern Data Stack の特徴やメリット、関連するトレンドデータインフラのクラウドサービス化 / Data infrastructure as a service データ連携サービスの発展 ELT! ELT! ELT! Reverse ETL テンプレート化された SQL and YAML などによるデータの管理セマンティックレイヤーの凋落と Headless BI 計算フレームワーク (Computation Frameworks) 分析プロセスの民主化、データガバナンスとデータメッシュの試みプロダクト組み込み用データサービスリアルタイム Analytics Engineer の登場各社ファウンダーが考える Modern Data Stack さいごに Further Readings はじめに Modern Dat
- data
- あとで読む
- データ
- SQL
- architecture
- データ基盤
- 統計
- dataManagement
- ツール
- DWH
監視の考え方〜あるいは可観測性とはなんなのか〜 - estie inside blog
- 269 users
- www.estie.jp
- テクノロジー
- 2023/02/15
みなさん、監視作ってますか？システムを作ったら、そのシステムを監視していく必要がありますよね。どうやったら「いい監視」が作れるのでしょうか。「いい監視」とそうでない監視との違いとは、いったいなんでしょうか。今の時代、「監視」ではなくて「可観測性」、 Observability (o11y) の時代になっていて、良いプラクティスや考え方が色々とあります。この記事は、監視や o11y についての考え方を社内に共有するため書いたものを、社外共有用に調整し直したものです。新しい Observability の時代を、一緒に生きていきましょう。監視を作ろうあなたはシステムを作りました。そのシステムに「監視」をつけようと思ったとき、最初にすることはなんでしょうか？まずは、システムを何らかのツールで監視するところから始めましょう。やらなきゃはじまらない。 Nagios, Cacti, Mun
- 監視
- monitoring
- あとで読む
- SRE
- observability
- 運用
- 考え方
- CPU
- サービス
- 設計
Four Keysがなぜ重要なのか - 開発チームのパフォーマンスを改善する方法について - yigarashiのブログ
- 253 users
- yigarashi.hatenablog.com
- テクノロジー
- 2022/05/30
ソフトウェアエンジニアとして働き始めて以来、ずっとソフトウェアデリバリーのパフォーマンスに興味を持って、さまざまな改善活動をしてきた。当初はスクラムを中心としたプロセスの改善に注力したが、最近はチームの成熟に伴って技術的なプラクティスに興味が移りつつある。より広い視点からデリバリーについて考えるのは非常に楽しい仕事だ。デリバリーのパフォーマンスを改善していくには、定量指標として確立されたFour Keysを計測し改善するのが業界標準となりつつある。恥ずかしながら、私はこれまでこのFour Keysが腹落ちせず、積極的に計測してこなかった。しかし、多方面に興味が向いて知識や経験が蓄積するにつれて、猛烈にFour Keysの重要性が腹落ちしてきた。この記事では、現時点における自分のFour Keysに関する理解と解釈を整理してみようと思う。 Four Keysとは Four Keysの妥当性
メルカリShops の技術スタック、その後 | メルカリエンジニアリング
- 249 users
- engineering.mercari.com
- テクノロジー
- 2022/02/08
こんにちは。ソウゾウのSoftware Engineer(CTO)の@suguruです。連載：メルカリShops 開発の裏側 Vol.2の1日目を担当させていただきます。去年、2021年に開始したメルカリShopsの技術スタックについての記事を書きましたが、今回はリリースまでに採用した技術スタックが、半年通してどのようにアップデートしてきたかを共有したいと思います。ローンチ時に採用した技術が、実際の運用でどのように変遷したのかを共有することで、技術スタックを考える際の何らかの参考になれば幸いです。 monorepo メルカリShops ではサービスに必要なコードを1つに集約する monorepo を採用しています。リリース後半年たってコード量はかなり増えてきましたが、monorepo に対する満足度は非常に高く、うまく機能しています。サービス全体の見通しが良くなることと、すべての
- microservices
- あとで読む
- 開発
- mercari
- typescript
- development
- monorepo
- bazel
- cloud
- メルカリ
オブザーバビリティ入門
- 235 users
- speakerdeck.com/cybozuinsideout
- テクノロジー
- 2023/07/15
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
Linux eBPFトレーシング技術の概論とツール実装 - ゆううきブログ
- 228 users
- blog.yuuk.io
- テクノロジー
- 2021/12/28
eBPF（extended Berkley Packet Filter）という用語を著者が初めてみかけたのは、2015年ごろだった。最初は、eBPFをその字面のとおり、パケットキャプチャやパケットフィルタリングを担うだけの、Linuxの新しいサブシステムであろうと認識していた。しかし、実際にはそうではなかった。システム性能の分析のための方法論をまとめた書籍Systems Performance 1 の著者で有名なBrendan Greggが、Linuxのネットワークサブシステムとは特に関係ない文脈で、古典的なシステム性能計測ツールでは計測できないことを計測するツールを作っていた。その計測ツールがeBPFという技術によって実装されていることを知ったときに、eBPFに興味をもったのだった。また、eBPFは、システム性能を調べる用途以外にXDP（eXpress Data Path）と呼ばれるプ
- eBPF
- linux
- あとで読む
- bpf
- kernel
- カーネル
- Rust
- 技術
- 開発
- ツール
このSRE本がすごい！2024年版 - じゃあ、おうちで学べる
- 222 users
- syu-m-5151.hatenablog.com
- テクノロジー
- 2024/01/26
はじめに有用な知識の特性 Google SRE リソース Site Reliability Engineering: How Google Runs Production Systems The Site Reliability Workbook: Practical Ways to Implement SRE Building Secure and Reliable Systems: Best Practices for Designing, Implementing, and Maintaining Systems SLO Adoption and Usage in SRE Creating a Production Launch Plan Training Site Reliability Engineers: What Your Organization Needs to Cre
- SRE
- あとで読む
- 書籍
- book
- 本
- engineering
- 監視
- 運用
- 設計
eBPFに3日で入門した話 - CADDi Tech Blog
- 216 users
- caddi.tech
- テクノロジー
- 2022/09/05
はじめに eBPF とはなにかざっくり概要「Packet Filter」なのに「Virtual Machine」? eBPFでなにができるか? カーネルイベントのフックユーザーランドアプリケーションとのやりとり eBPFの主な用途 eBPFが注目される背景 eBPFの仕組みアーキテクチャと処理フローカーネルモジュールとeBPFの違い eBPFプログラムの作り方 eBPFプログラムを作ってみる環境の準備 Hello world もう少し複雑なサンプルその他のサンプル HTTPリクエストのダンプ TCP接続先の調査 tcplife dirtop filetop oomkill まとめ eBPFはなにに使えるか参考サイトはじめにこんにちは、Platformチームの小森です。 eBPF (extended Berkley Packet Filter) について、2022年8月2
- eBPF
- linux
- kernel
- あとで読む
- BPF
- kubernetes
- network
- c
- ネットワーク
“LLM for SRE“の世界探索 - ゆううきブログ
- 214 users
- blog.yuuk.io
- テクノロジー
- 2024/03/21
ChatGPTが登場した当初、対話や要約、翻訳、コード生成などの典型的な言語タスクができても、SREやAIOpsの研究開発にはあまり関係ないのではないかと正直思っていた。AIOpsでは典型的にはいわゆるObservabilityデータ（メトリクス、ログ、トレースなど）が入力となるため、自然言語ではなく数値のデータを解析することが求められる。自然言語のタスクを研究対象としていなかったため、AIOpsとChatGPTに強い関係性は見いだせなかった*1。しかし、自分で大規模言語モデル（Large Language Model: LLM）を日常的に使用したり、表題にあるようにSREのためのLLM（LLM for SRE, LLM4SRE）に関する論文を読むうちに、LLMのテキスト生成器としての性質よりもその優れた推論機械としての性質に注目するようになった。特にSREの障害診断は、人間の専門家が推
- LLM
- SRE
- あとで読む
- AI
- 機械学習
- 自然言語処理
- 論文
- IT
Linux Performance
- 210 users
- www.brendangregg.com
- テクノロジー
- 2021/09/02
static, benchmarking, tuning: sar, perf-tools, bcc/BPF: bpftrace, BPF book: Images license: creative commons Attribution-ShareAlike 4.0. This page links to various Linux performance material I've created, including the tools maps on the right. These use a large font size to suit slide decks. You can also print them out for your office wall. They show: Linux observability tools, Linux static perfor
Lambda の運用面でのベストプラクティスを学べる「AWS Lambda Operator Guide」を読んだ - kakakakakku blog
- 203 users
- kakakakakku.hatenablog.com
- テクノロジー
- 2023/05/08
AWS の公式ドキュメント「AWS Lambda Operator Guide」を読んだ❗️AWS Lambda を軸にサーバーレスアプリケーションを構築するときに意識しておくべき "運用面のポイント・ベストプラクティス" がまとまっていて，とても良いドキュメントだった👏 内容的には AWS Well-Architected Framework: Serverless Applications Lens と重複するところもあるけど，サーバーレスアプリケーションを開発・運用しているなら1度は読んでおくと良いのではないでしょうか❗️ ＼( 'ω')／多くの人に読みやすくなるように日本語翻訳もあるとイイなぁ〜 docs.aws.amazon.com 構成ドキュメントとしては全6章で構成されている．どれも重要で，理解を深めるために読むのはもちろん，開発中もしくは運用中のアプリケーションに対し
- aws
- lambda
- あとで読む
- serverless
- 開発
エンジニアのためのSRE論文への招待 - SRE NEXT 2023 - ゆううきブログ
- 191 users
- blog.yuuk.io
- テクノロジー
- 2023/10/02
この記事では、2023年9月29日に開催されたSRE NEXT 2023 IN TOKYOでの講演の概要に加えて、講演では触れられなかった部分の補足と、発表を終えての後記、最後にSRE NEXT全体の感想を書きました。 SRE NEXT 2020の基調講演に招いていただいたところから始まり、昨年のSRE NEXT 2022の公募セッションでも発表し、今回で3回目の発表になりました。今回の講演は、SRE NEXTの「NEXT」と価値観の一つである「Diversity」を踏まえて、自身のエンジニアと研究者の両方の経験を活かして、SREを深く実践する上で、技術論文を探して読むアプローチを提示するものです。昨今の国内のSREコミュニティでは組織的実践に主な関心が移っている状況と対比させて、コンピュータサイエンスに基づく技術的挑戦の可能性を示唆する意欲的な講演を目指したつもりです。この講演での主要
- sre
- あとで読む
- エンジニア
- 論文
- paper
- techfeed
【Team & Project】LINE全社のデータ基盤のミドルウェアやData ingestion pipelineの開発・運用を担当しているチームを紹介します
- 187 users
- engineering.linecorp.com
- テクノロジー
- 2020/10/22
―― 今のチーム課題と課題解決に向けた取り組みを教えてください。 Wang：私たちのチームでは、主に3つの課題について取り組みを進めています。まずは1つ目の課題は「マルチテナントのクラスターの運用」についてです。 Hadoopは一般的に、有数のユーザと予測可能なワークロードで運用されていますが、LINEのData OpenによってDAUが700人弱であり、且つワークロードも10万+/日となっています。Isolationがまだ完備されていないので、ユーザ間にリソースの競合が発生している状況です。 2つ目は「Data catalog」についてです。ユーザが自由にデータを生成したり利用したりする環境においては、データのカタログがとても重要です。そのため、Data Lineageを自動的に生成する仕組みが必要となってきます。そして「大規模のインフラを効率よく運用すること」も私たちの課題です。私
- データ
- あとで読む
- LINE
- 開発
- 運用
- 技術
- data
- チーム
- アーキテクチャ
- development
スタディサプリ最大のRailsアプリケーションにYJIT+pitchforkを導入してメモリ使用量を劇的に削減するまで - スタディサプリ Product Team Blog
- 185 users
- blog.studysapuri.jp
- テクノロジー
- 2024/04/02
こんにちは。SREのkyontanです。Rubyが大好きなのでRubyの話をします。ちなみにリクルートはRubyKaigi 2024へGold Sponsorとして協賛しています! *1。ぜひ沖縄でお会いしましょう。これはあるアプリケーションのメモリ消費量を示すグラフなのですが、まさかgemを入れ替えるだけでこんなに嬉しい変化が見られるとは思っていませんでした。今日はそんなgemの話をします。話は遡って2023年4月のある日、インターネットを眺めていたところ、ShopifyがpitchforkというOSSを公開したという情報が目に留まりました。調べてみると、どうやら著名なRackサーバー実装の1つであるunicornの派生版であり、メモリ使用量の削減に特化しているらしいのです。 github.com これはスタディサプリ小中高のあのリソースドカ食いマイクロサービス第一位である api
- rails
- あとで読む
- pitchfork
- rack
- performance
- ruby
- gem
- API
スクウェア・エニックスの"とあるシステム"のSite Reliability Engineering
- 184 users
- blog.jp.square-enix.com
- テクノロジー
- 2022/11/22
はじめにこんにちは、情報システム部 SRE 橋本です。普段はクラウドエンジニア(SRE)としてチームリードをしています。興味関心がインフラ、Observability、SRE、Security、Golangといった分野であり、 Japan Google Cloud Usergroup for Enterprise(Jagu’e’r ジャガーと読みます)でObservability/SRE分科会のオーナーを担当させていただいております。その縁もあって先日Innovators Hive at Cloud Next 2022でコミュニティ運営についてお話をさせていただきました。この記事では現在チームリードをしていてビルドアップ中でもあるSREチームについて考えていることをお話したいと思います。また、このSREチームについてのインタビュー記事も掲載いたしました。メンバーやチームの雰囲気を伝
- SRE
- あとで読む
- 運用
- インフラ
- サーバ
- システム
- 開発
- engineering
- 組織
「入門監視」5年を経て変わったこと、変わらないこと / Fundamental principles in Practical Monitoring
- 179 users
- speakerdeck.com/doublemarket
- テクノロジー
- 2022/06/10
2022年6月2日に開催された、Observability Lounge 「『監視』の原則と変化」という勉強会での発表資料です https://forkwell.connpass.com/event/247721/
- 監視
- あとで読む
- monitoring
- SRE
- ネット
- programming
AWS Observability Best Practices
- 178 users
- aws-observability.github.io
- テクノロジー
- 2024/01/15
Home Home Guides Data types Tools Curated recipes FAQ Contributors オブザーバビリティとは¶ 概要¶ オブザーバビリティとは、観測対象のシステムからのシグナルに基づいて、継続的にアクション可能な洞察を生成および発見する機能です。つまり、オブザーバビリティを使用すると、システムの状態を外部出力から理解し、(修正)アクションを実行できます。対処する問題¶ コンピュータシステムは、CPU 時間、メモリ、ディスク領域などの低レベルのシグナルや、API 応答時間、エラー、トランザクション毎秒などの高レベルかつビジネス上のシグナルを観測することで測定されます。システムの可観測性は、その運用と開発コストに大きな影響を与えます。観測可能なシステムは、操作者に意味のある実行可能なデータを提供し、(インシデント応答の高速化、開発者生産性の向
- aws
- observability
- あとで読む
- 開発
- 運用
- *あとで読む
- システム
- 本
オブザーバビリティにはお金がかかる - 株式会社ヘンリーエンジニアブログ
- 173 users
- dev.henry.jp
- テクノロジー
- 2023/08/22
tl;dr オブザーバビリティにはあなたの直感よりもお金がかかるかもしれない。でもそれはアジリティを上げるために必要なコストである。同時にオブザーバビリティ関連ベンダーには、それらをリーズナブルに提供してもらうことを期待します。オブザーバビリティ・エンジニアリング輪読会 8月からVPoEになりました。id:Songmuです。社内の勉強会で輪読形式でオブザーバービリティ・エンジニアリングを読んでいます。毎週30分、参加者の中から発表者を割り当て、1~2章を読み進めるスタイルです。ちなみに、ヘンリーではActive Book Dialogue(ADB)というフォーマットも取り入れて輪読会が運営されています。社内で同時並行で数本走っており、先日、CEOの逆瀬川が書いたソフトウェア見積もりに関する輪読会も同様の形式で実施しています。発表者は、事前に社内のNotionにその章のアウトラインや
App Engine VS Cloud Run
- 164 users
- zenn.dev/sinmetal
- テクノロジー
- 2020/12/03
Cloud Run CPU 0.08 ~ 8 Core (2nd gen は最小 0.5~) Memory 128 MiB ~ 32 GiB (2nd gen は最小 512MiB~) Deploy App Engine は Deploy (gcloud app deploy) を実行すると Cloud Build が暗黙的に動いて Deploy が行われるが、これがなかなか時間がかかる。開発環境だと CI でとりあえず main branch に merge されたら、Deploy したりするけど、Deploy を Skip してもよいような時でも CI 回してると Deploy を待つことになって、ちょっとめんどうに感じる。更にこの仕組みは成果物は Deploy しないと生まれないので、CI と CDを分離しづらい。 Cloud Run は Container Registry a
- gcp
- CloudRun
- gae
- あとで読む
- serverless
- GoogleAppEngine
- cloud
- cloud run
- google
- appengine
Zero Touch Productionとは何か
- 163 users
- deeeet.com
- テクノロジー
- 2020/10/15
GoogleのSREとSecurityによるBuilding Secure Reliable Systems という本の中で「Zero Touch Production (ZTP) 」という考え方が紹介されていた．これはインフラの権限管理やインフラの構築そのものの指針となる概念であり，自分がそうあるべきだとずっと思ってきた考え方でもある．これはどのような考え方なのか?をこれまでの歴史を踏まえて具体的なツールや事例とともにまとめておく． Zero Touch Production Building Secure Reliable Systems においてZero Touch Production (ZTP) は以下のように定義されている． The SRE organization at Google is working to build upon the concept of least
- sre
- インフラ
- あとで読む
- infrastructure
- security
- google
- development
- devops
- 運用
- ツール
Docker is Updating and Extending Our Product Subscriptions | Docker
- 155 users
- www.docker.com
- テクノロジー
- 2021/09/01
Editor’s Note: Be sure to check out the Pricing page for the latest Docker Desktop packages and features! Docker is used by millions of developers to build, share, and run any app, anywhere, and 55% of professional developers use Docker every day at work. In these work environments, the increase in outside attacks on software supply chains is accelerating developer demand for Docker’s trusted cont
エラーや非同期処理をより安全に扱うための TypeScript ライブラリ Effect-TS
- 141 users
- azukiazusa.dev
- テクノロジー
- 2024/04/29
TypeScript の型システムを活用して、本番のアプリケーションにおける実用的な問題を解決することを目指しています。Effect-TS は、以下のような特徴を備えています。並行性（concurrency）：Fiber ベースの並行モデルにより、高いスケーラビリティと低レイテンシを実現コンポーザビリティ（composability）：小さく再利用可能なパーツを組み合わせることで、メンテナンス性、可読性、柔軟性の高いソフトウェアを構築するリソースの安全な管理（resource-safety）：処理が失敗したとしても、安全にリソースを開放する型安全性（type-safety）：TypeScript の型システムを活用した型推論と型安全性に焦点を当てているエラー処理（error handling）：構造化された信頼性の高い方法でエラーを処理する非同期性（asynchronicity
- TypeScript
- あとで読む
- 関数型
- 非同期
- ts
- error
- ライブラリ
- JS
Linuxカーネル内部をフックするeBPFを用いてセキュリティの可観測性を実現する「Tetragon」がオープンソースで公開
- 141 users
- www.publickey1.jp
- テクノロジー
- 2022/05/19
Linuxカーネル内部をフックするeBPFを用いてセキュリティの可観測性を実現する「Tetragon」がオープンソースで公開 Linuxカーネルを書き換えることなくその内部の機能をフックし、フック先でサンドボックス化されたプログラムを実行することにより、カーネルをプログラマブルに機能拡張できる「eBPF」（Extended Berkeley Packet Filter）は、クラウドネイティブ関連で最も注目されている技術の1つです。 eBPFを用いたソフトウェアとしては、CNI（Container Networking Interface）を用いてコンテナ間のセキュアな接続やロードバランシングなどさまざまな機能拡張を実現する「Cilium」がCloud Native Computing Foundationのプロジェクトとしてよく知られています。今回、そのCiliumを開発するIsoval
- linux
- eBPF
- あとで読む
- kernel
- セキュリティ
- カーネル
- security
- kubernetes
[書籍レポート] 「オブザーバビリティ・エンジニアリング」はパワーワード満載の「『入門監視』の次に読むべき本」だった | DevelopersIO
- 133 users
- dev.classmethod.jp
- テクノロジー
- 2023/02/27
自分の関わるアプリケーションやインフラのモニタリングに困っている？　オーケイ、冒頭からアクセル全開の力強いワードにあふれたこの一冊を紹介するぜ！はじめに今年(2023年)の1月末に発売されたこちらの本、もう読まれたという方も多いのではないでしょうか！（挨拶本記事は、まだ読まれていない、買ってもいないという方に向けて、「紹介しなきゃ」という謎の強い使命感をもって書かれています。というのも、実は本記事の執筆者（ぼくです）は、300ページを越えるこの本のまだ半分ほどしか読むことが出来ていません。。！ *1 それでもこの本を紹介するモチベーションは十分です。なにしろ、この本は冒頭から、もっといえば「まえがき」の段階から、パワーワードにあふれた一冊だからです。引用してみましょう。 “（「オブザーバビリティ」という）用語が注目されるようになると、ある種の隣接性を共有する別の用語と互換的に使われ
- SRE
- 監視
- あとで読む
- 本
- 運用
- インフラ
- 書籍
- monitoring
- review
Spring Boot 3の新機能を使ってみよう！ 2からアップグレードする手順、Observability機能、ネイティブイメージ化｜ハイクラス転職・求人情報サイト AMBI（アンビ）
- 132 users
- en-ambi.com
- テクノロジー
- 2023/06/29
ハイクラス求人TOPIT記事一覧Spring Boot 3の新機能を使ってみよう！ 2からアップグレードする手順、Observability機能、ネイティブイメージ化 Spring Boot 3の新機能を使ってみよう！ 2からアップグレードする手順、Observability機能、ネイティブイメージ化 Javaの開発フレームワークであるSpringの最新バージョンとして、Spring Boot 3が2022年11月にリリースされました。この記事ではSpring Boot 2で書かれたサンプルコードをSpring Boot 3にアップグレードしながら、考慮点や新機能を体感していただきます。ヴイエムウェア株式会社の星野真知さんによる解説です。 Javaのエコシステム、その中でも世界で一番の人気を誇るのが（JetBrains社の調査によると）Spring FrameworkおよびSpring B
- spring
- java
- あとで読む
- フレームワーク
- Spring Boot
- docker
- エンジニア
- web
- コード
今日から分散トレーシングに対応しないといけなくなった人のための opentelemetry-go 入門 - Cybozu Inside Out | サイボウズエンジニアのブログ
- 130 users
- blog.cybozu.io
- テクノロジー
- 2023/04/12
こんにちは。SRE/データストアチームの飯塚です。私たちのチームではデータベースを代理で操作したり情報を取得したりするサービスをいくつか作り、それをプロダクトチームが利用できるように gRPC 経由で提供しています。ところで、ある日突然「分散トレーシングを活用していくことになったので、あなたのチームのサービスも対応させてください」とお願いされたらどうすればよいでしょうか？私はこれまでにいろいろなカンファレンスで分散トレーシングや OpenTelemetry についての講演を聞いていたので、理念は理解した、便利そうだ、導入してみたい、と思ったことは何度かありました。しかし実際に導入しようとして SDK のドキュメントを開いてみると、理解しなければいけない（ように見える）概念や、使い方をマスターしないといけない（ように見える）API の数に圧倒されてしまい、後回しにしてしまっていました。
- opentelemetry
- observability
- あとで読む
- SRE
- golang
- gRPC
- cybozu
- go
- logging
Kubernetes障害で泣かないための羅針盤、Observabilityを活用したトラブルシューティングフロー大公開
- 129 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2022/04/14
※岡本、正野、宇都宮はNTTデータ所属 Kubernetesやクラウドネイティブをより便利に利用する技術やツールの概要、使い方を凝縮して紹介する本連載「Cloud Nativeチートシート」。前回から複数回に分けて「Observability（オブザーバビリティ）」「可観測性」にフォーカスして解説しています。 Kubernetesを使っていてトラブルが発生したけど、原因究明をどう進めればいいか分からない……ということはありませんか？コンテナを利用したシステムでは、マイクロサービス化が容易なので、コンポーネントやサービスの数が従来のシステムに比べて非常に多くなります。そのため、障害が発生した場合の原因の究明も大変になります。そこで今回は、「Observabilityでいろいろとデータが取れるのは分かったけど、何からどう見ていけばいいのか分からない」という方向けに、Kubernetesで実
- kubernetes
- k8s
- Observability
- あとで読む
- cloud
- コンテナ技術
- container
- 障害