DataDogの人気記事 188件 - はてなブックマーク

1 - 40 件 / 188件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

DataDogの検索結果1 - 40 件 / 188件

DataDogに関するエントリは188件あります。 monitoring、監視、 Datadog などが関連タグです。人気エントリには『監視について思うとこ - y-ohgi's blog』などがあります。

監視について思うとこ - y-ohgi's blog
- 366 users
- y-ohgi.blog
- テクノロジー
- 2019/08/19
TL;DR 監視はユーザーにサービスを提供できているかを観測するための行為 SLI/SLOを定めて、SLOを守れるようにモニタリングするダッシュボードは定常的に表示しておくものと障害時に活用するものを作ると良いアラートはレベル分けして人間が対応しなければならないものだけ人間へ通知する監視とはサービスを健全に動作させ続けるために監視を行います。「健全に動作している」の定義はサービスによって異なり、ユーザーにWebページを見せることができることだったり、バッチが正常に終了することだったりします。最終的にユーザーに正常にサービスを提供できていることを観測するために行うことに変わりはありません。さてユーザーにサービスを提供するために何を監視しましょうか？クラウド前提であれば個人的にリソースベース（CPU/Memory）より、 SLI/SLOをベースに監視する事が望ましいと考えてい
- 監視
- あとで読む
- monitoring
- datadog
- モニタリング
- 運用
- SRE
- サービス
- 情報システム
- ログ
運用出来るWebアプリケーションの作り方
- 346 users
- zenn.dev/koduki
- テクノロジー
- 2023/07/12
はじめに先日、下記のようなツイートを見つけて、そういえば趣味で個人開発してたときには然程気にしてなかったけど、仕事で運用するようになって先輩たちから学んだり自分で身につけたチップスってちょこちょこあるよねー、とふと思ったので、Webアプリケーション開発に関わるものをいくつかまとめてみました。特に体系的/網羅的という程でもないですし、最近はFWや色々な仕組みでカバーされてるものも多いですが備忘録として。 Tips 機械が読めるログを作るこれは割と重要なのですが、ログは人間が読むものではなく機械が読むものです。それはZabbixだったりDatadogだったりSplunkだったりgrep/awkだったりツールは何でも良いのですが、古の時代はさておき現代ではログは機械が読めることが最重要です。まず大前提として構造化されている必要があります。言うまでもないですが「フリーフォーマット」のログの
- 運用
- あとで読む
- webサービス
- ログ
- 監視
- web
- 開発
- DevOps
- 設計
- logging
High Performance FastAPI
- 230 users
- speakerdeck.com/martin_lover
- テクノロジー
- 2021/10/16
PyCon JP 2021 発表資料です。
Rails appをRubyコードの改善だけで50%以上高速にした話 - Money Forward Developers Blog
- 207 users
- moneyforward-dev.jp
- テクノロジー
- 2022/12/18
この記事は Money Forward Engineering 2 Advent Calendar 2022 18日目の投稿です。こんにちは。マネーフォワード関西開発拠点でマネーフォワードクラウド会計Plus (以下会計Plus)のエンジニアをしているぽっけです。この記事では、私が行った高速化について紹介します。私は最近Railsアプリケーションの高速化を行っており、ある画面のレスポンスタイムを50%以上削減しました。そしてこの改善はRubyレベルの変更のみで達成しました。この記事での「Rubyレベルの変更のみ」は、MySQLやRedis、Web APIなどへのアクセスには全く手を入れず、Rubyのプロセスが消費する時間のみを変更した、ということを意図しています。 MySQLなどへのアクセスは通常ボトルネックになりがちな箇所です。今回そこに手を入れずに高速化を達成できたのは、1つ

猛烈に成長するSaaSのインフラを猛烈にカイゼンする技術 - ANDPAD Tech Blog
- 204 users
- tech.andpad.co.jp
- テクノロジー
- 2020/12/14
SREチーム鈴木心之介です。職歴の空白を経て参画しました。社名変更して co.jp ドメインを複数保有する技術の節は皆様ありがとうございました。たぶんそのうち書かれるだろう「Dockerコンテナ移行しました」記事の先史時代の記録として、また、事業の成長に併走してきたEC2でのアーキテクチャの御焚上として奏上するものです。問題意識アプリケーションはRuby on Railsで実装し、インフラはAWSにEC2, RDS, S3を中核に構成してます。運用状況はEC2に限らず大変きびしく、早くどうにかしないと事業の成長の足枷になりそうでした。入社前のカジュアル面談で伺っていた情報と、入社後の情報収集から、大枠の問題意識を以下4つに絞りました。デプロイメントセキュリティスケーラビリティディザスタリカバリどれも解決すべきで、優先順位にみなさま一家言あるかと思います。ただセキ
- インフラ
- あとで読む
- 監視
- aws
- CI
Software Design連載 2022年1月号運用監視の解像度アップとサービス横断的なログ基盤の整備 - MonotaRO Tech Blog
- 188 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/02/08
こんにちは。中山(id:yoichi22) です Software Designに連載させていただいております「Pythonモダン化計画」では、モノタロウの社内事例から読者の皆様のお役に立ちそうな取り組みを紹介させていただいています。のですが、社内でも隣のチームがやってた取り組みを記事で初めて知ることもあって、私も読者として楽しませてもらっています。隣の執筆者さんありがとうございます。今回は、運用にまつわる監視とログの話題です。本記事の初出は、Software Design2022年1月号「Pythonモダン化計画（第6回）」になります。過去の連載記事は以下を参照ください。第1回 Software Design連載 2021年8月号 Python製のレガシー＆大規模システムをどうリファクタリングするか第2回 Software Design連載 2021年9月号「テストが無い」からの
- 監視
- あとで読む
- ログ
- インフラ
- datadog
- 運用
- サーバ
- サービス
「Datadog入れてみたらAWSの料金が爆発した話」@ゆるSRE勉強会 #1
- 188 users
- speakerdeck.com/rynsuke
- テクノロジー
- 2023/08/29
ゆるSRE勉強会 #1 でお話しさせて頂いたLTの資料です！ https://yuru-sre.connpass.com/event/292063/
- aws
- あとで読む
- Datadog
- 運用
- sre
- cost
大量データの JSON serialize 処理を高速化し、レスポンスが倍速になった話 - freee Developers Hub
- 183 users
- developers.freee.co.jp
- テクノロジー
- 2022/04/27
こんにちは、freee会計でワークフロー機能の開発をしている @mitubaEX です。先日 freee会計のパフォーマンスチューニングに取り組みました。本記事では、調査の流れ、改善の事例を紹介します。問題発覚までの流れ freee では自社の経理業務に freee会計を利用しており、その中でも経費精算の機能はほぼすべての従業員が利用しています。そのため日々多くのフィードバックをもらえます。そのフィードバックの1つで、「経費精算の一覧を開くのが遅い」という報告をもらいました。幸い表示件数を指定できるので調整すれば遅くはならないのですが、一覧性が下がってしまうため有用な解決策ではありません。そこでワークフローを開発しているチームで、このパフォーマンスイシューの調査を始めました。調査するまず事前調査として Datadog*1 で一覧画面を表示するリクエストの処理を確認しました。一覧
Datadog メトリクスモニター作成入門
- 182 users
- abicky.net
- テクノロジー
- 2022/11/08
Datadog はモニタリング関連の SaaS ではおそらく最も利用されているサービスでしょうが、公式ドキュメントが豊富にある割には何から読み始めれば良いかわかりにくく、慣れるまでの道が険しい印象です。本エントリーでは、Datadog が既に導入されている組織で、Datadog モニターを使って監視をしたいけど、モニターの設定方法がよくわからないといった方を対象に、メトリクスモニターの作成に焦点を絞って解説していきます。なお、あくまで Datadog の使い方についての解説であり、どのようなモニターを設定すべきかについては触れません。メトリクスの収集についても触れたかったんですが、力尽きたので、メトリクスの収集については気が向いたら別エントリーを書きます。アジェンダメトリクスモニターの作成方法の基本クエリの定義についてクエリの評価期間・評価方法・アラート条件の指定クエリの結果
- datadog
- あとで読む
- monitoring
- 監視
- aws
- インフラ
- log
- 運用
- CPU
Datadogを使った不正ログインのモニタリングの実装
- 179 users
- tech.plaid.co.jp
- テクノロジー
- 2022/11/10
Datadogのセキュリティモニタリングを使った不正ログイン検知の実装方法について
次世代デジタル保険を支える監視・通知の技術
- 157 users
- techblog.finatext.com
- テクノロジー
- 2020/08/27
監視・通知の仕組みの全体像また、弊社では Terraform を用いて IaC ( Infrastructure as Code ) を実現して、各AWSアカウント環境の状態をコードで一元管理していますが、 Datadog の監視項目も Provider が用意されているため、Terraform で管理をすることが可能です。現状はすべての Datadog の監視項目がコード化されているわけではないですが、こちらは随時対応を行っていきたいと思っています。外形監視外形監視は、WebサイトやAPIエンドポイントが正常に動作していることを、定期的に特定のURLに対して問い合わせをして、期待されたステータスコードや要素を返すことを監視することを目的とします。弊社では Datadog の Synthetic Monitoring という機能を利用して監視を行っていますが、この機能の特徴としては W
- 監視
- あとで読む
- datadog
- 運用
- aws
- 技術
- docker
- 設定
- API
アプリチーム x SRE チームによるアプリケーションモニタリング運用改善 - freee Developers Hub
- 145 users
- developers.freee.co.jp
- テクノロジー
- 2022/02/15
freee人事労務の品質改善を専任で活動している keik です。 freeeではアプリケーションパフォーマンスモニタリング（APM）に Datadog を利用しています。 SRE チームが導入し、アプリケーション開発チームに利用提供する形で運用されています。導入のきっかけについては以下の記事でも触れられています。 developers.freee.co.jp Datadog APM の画面は多機能かつ柔軟で、例えばウェブサーバーが受けたリクエスト処理の内訳を視覚的にドリルダウンできたり、リクエストや SQL クエリごとのレイテンシやエラー率を計測してダッシュボード化してくれたり、また全画面で共通的に「タグ」や日時を用いたフィルタリングができたりします。直感的なだけなく、見た目もオシャレで、適当に眺めているだけでもワクワクします。しかし、私達は「ここに映っているもの」が何なのか、正直分
- SRE
- あとで読む
- Datadog
- APM
- freee
- monitoring
- 運用
- Rails
- チーム
- サーバ
PairsにおけるSLI/SLO再定義
- 137 users
- speakerdeck.com/takumiogawa
- テクノロジー
- 2021/11/19
https://sre-lounge.connpass.com/event/227250/
- sre
- slo
- あとで読む
- datadog
- management
SLOをゼロからつくる
- 130 users
- speakerdeck.com/b4b4r07
- テクノロジー
- 2023/07/05
tfnotify - Show Terraform execution plan beautifully on GitHub
- SRE
- SLO
- あとで読む
- terraform
- 運用
- 監視
- 設計
- エンジニア
- github
フロントエンド監視の全体像と実現方法
- 120 users
- zenn.dev/kimitsu
- テクノロジー
- 2024/02/12
必要性フロントエンドの監視はバックエンドやインフラのそれらと比べ、優先度が低くなりがちです。バックエンドやインフラでの障害はサービス継続に直結するため、これは当然と言えば当然なのですが、別の理由もあると考えています。それは計算リソースをサービス提供側が管理していないことです。例えばアプリケーションがインフラとして AWS を利用しているなら、AWS のリソースを管理するのはサービス提供側です。これは AWS 以外のクラウドサービスプロバイダやオンプレであっても同様です。一方でフロントエンドはエンドユーザのブラウザ上で動作し、これを管理しているのはエンドユーザです。フロントエンドはその性質上、監視の「盲点」になりがちです。しかしフロントエンドはエンドユーザが直接触れるものであるため、そこで何が起きているかサービス提供側は正確に把握する必要があります。マイルストーンフロント
ECSとGoで構築したシステムにDatadogを導入する | おそらくはそれさえも平凡な日々
- 115 users
- songmu.jp
- テクノロジー
- 2020/05/17
追記: GoのアプリケーションをOpenMetricsを使ってObservableにする方法については別エントリを書きました。 → https://songmu.jp/riji/entry/2020-05-18-go-openmetrics.html ECSとGoで運用しているシステムに対するDatadogの日本語知見があまり無さそうだったので書いてみる。ちなみに以下の環境です。 ECS on EC2 (not Fargate) アプリケーションコンテナのネットワークモードはbridgeモード動的ポートマッピングも利用背景として3月にNature Remoのインフラアーキテクチャ改善をしていて、その前にもうちょっと監視を整えたほうが良いな、ということでDatadogを導入したのがある。テストがないとリファクタリングできないように、監視がないとアーキテクチャのアップデートもやりづらいとい
- datadog
- ecs
- monitoring
- go
- あとで読む
- 監視
- Docker
- aws
Webアプリケーションのパフォーマンス勉強会を開催しました！ - ANDPAD Tech Blog
- 111 users
- tech.andpad.co.jp
- テクノロジー
- 2021/02/10
はじめまして、サーバサイドエンジニアの立木です。特定業種向けポータルサイトやスマートフォンゲーム開発などを経て、昨年3月に入社し、現在はANDPADの開発に従事しています。アンドパッドでは、技術顧問をして頂いてる三谷(mita2)さんによる、データベースに関する勉強会が定期的に行われております。 tech.andpad.co.jp 先日もデータベースの観点から、Webアプリケーションのパフォーマンスをいかにして監視し、改善していくかという勉強会を開催していただきました。今回はその勉強会について気になったポイントをまとめてみたいと思います。当日の資料概要 ANDPADの現状について分析 Datadogによる分析手法よくある改善パターン質疑応答 ANDPADの現状について分析 Webサイトのパフォーマンスは大事当たり前ですが、Webサイトにとってパフォーマンスはとても重要です。
フロントエンドで収集するべきテレメトリは何か
- 111 users
- zenn.dev/kimitsu
- テクノロジー
- 2024/02/12
先日『フロントエンド監視の全体像と実現方法』という記事を投稿しましたが、その中でテレメトリについては触れませんでした（※本記事は上記記事の内容を知らなくても読み進められるようになっています）。というのは、テレメトリは可観測性を実現するための重要な概念ではあるものの、テレメトリを軸に監視を考えるのは手段の目的化になってしまうと考えているからです。重要なのはサービスにとって何を観測するべきかを考えることであり、テレメトリはそれを設計や実装に落とし込む際に現れるものです。一方で監視に対する理解を深める上では、テレメトリを軸に考えることも重要でしょう。そこで本記事ではフロントエンド監視においてどのようなテレメトリを収集するべきか述べていきます。監視 SaaS と OpenTelemetry (OTel) Datadog, New Relic, Sentry のいずれかを利用することを考え
なぜPrometheusを辞めてDatadogを採用したのか - ABEJA Tech Blog
- 102 users
- tech-blog.abeja.asia
- テクノロジー
- 2019/12/08
こんにちは。ABEJAのインフラ管理してる村主 @rwle1221 です。本ブログは Datadog Advent Calendar 2019 の8日目です。今日は ABEJA Platform というプロダクトで、なぜ Prometheus から Datadog に変えたのか。というお話したいと思います。一人の方でも採用基準の参考になればと思います。第一フェーズ：実は元々Datadogを使っていた実は Prometheus の前は Datadog を使っていました。なぜ Datadog を使っていたかというと、Za○bix や Na○ios などは古い思想なので使う気になれなかったという単純な理由です。ただ、 Datadog は $18/host という値段で当初は数十台だったので数万円ほど発生していました。やはり少し高いなという印象です。第二フェーズ：Promethe
- datadog
- prometheus
- monitoring
- 監視
- サーバ
- logging
- kubernetes
- あとで読む
急激に成長しててIPO間近のSaaS企業DatadogのS-1見てわかったこと - コホート毎のネット・リテンション率がいいからレイヤーケーキが綺麗 - Qiita
- 98 users
- qiita.com/IkuyaM
- テクノロジー
- 2019/09/17
急激に成長しててIPO間近のSaaS企業DatadogのS-1見てわかったこと - コホート毎のネット・リテンション率がいいからレイヤーケーキが綺麗KPISaaS どうも！ExploratoryのIkuyaです。今日はサーバなどのモニタリングサービスをSaaS形式で提供しているData DogのS-1（訳者注：アメリカ合衆国において、新規株式公開（IPO）を行うために提出が義務付けられている書類のこと）について面白い解説記事がありましたので、そちらを紹介します。 Datadog IPO | S-1 Breakdown - リンク以下、要約。企業概要クラウドシステムのインフラストラクチャのモニタリング業界でリーダーであるDatadogは1億ドルのIPOを申請しました。申請金額は1億ドルですが、1億ドル以上の値がつくのは確実です。同社の事業規模がどの程度かというと2018年に1億9,
- DataDog
- あとで読む
- SaaS
- IPO
- qiita
- ネット
- 企業
- データ
- ビジネス
Datadogの活用ノウハウを一挙に公開・それを支える全社管理者の工夫とは #datadog_japan_meetup - ZOZO TECH BLOG
- 98 users
- techblog.zozo.com
- テクノロジー
- 2022/07/29
こんにちは。ECプラットフォーム基盤SREブロックの高塚と巣立（@tmrekk_）です。 ZOZOTOWNはクラウド化・マイクロサービス化を進める中で、監視SaaSのDatadogを採用しました。この数年で多くの知見が蓄積され、今では様々なシーンでDatadogを活用しています。この記事ではそのノウハウを惜しみなく公開します。 ※本記事は、先日開催されたDatadog Japan Meetup 2022 Summerにて発表した内容を書き起こして再構成したものです。当日の発表資料 speakerdeck.com 目次当日の発表資料目次はじめにマイクロサービス基盤に必要な監視の要件第1部 ZOZOTOWNにおけるDatadogの活用 1. どこで障害が起こっているのか分からない → APM 2. アラートやダッシュボードや外形監視が欲しい → Monitors, Dashboar
- Datadog
- 監視
- ZOZO
- あとで読む
- monitoring
- api
- aws
- article
ZOZOTOWN マイクロサービスプロジェクトにおける継続的な改善を支えるCI/CD戦略 - ZOZO TECH BLOG
- 93 users
- techblog.zozo.com
- テクノロジー
- 2020/06/16
ZOZOテクノロジーズ SRE部の川崎（@yokawasa）です。ZOZOTOWNのアーキテクチャをマイクロサービスで再設計してリプレイス化を推進するチームに所属しております。本記事では、このZOZOTOWNのマイクロサービスプロジェクトで実践している継続的インテグレーション/継続的デリバリー（以下、CI/CD）についてご紹介します。はじめにまずはじめに、本記事に登場する中心的なキーワードであるCI/CDと、Infrastructure as Code（以下、IaC）について簡単に説明します。 IaCとは、インフラ構成をコード化して、そのプロビジョニングを自動化する手法です。コード化されたファイルはコードリポジトリで管理することが多く、また、IaCを実現するためのツールやサービスの利用が不可欠になります。 CI/CDは、その名の通り、CI（継続的インテグレーション）とCD（継続的デリ
社内で提供しているマイクロサービスの参考実装について - DMM inside
- 80 users
- inside.dmm.com
- テクノロジー
- 2021/12/17
｜DMM inside
何度も挫折してきたE2Eテストだけど、今後はDatadog Synthetics Testsが良さそうかも - LIVESENSE ENGINEER BLOG
- 79 users
- made.livesense.co.jp
- テクノロジー
- 2022/12/20
これは Livesense Advent Calendar 2022 DAY 20 の記事です。はじめに株式会社リブセンスの転職会議事業部Webエンジニアの @ishitan-liv です。今回は、過去に転職会議でも導入しようとして挫折してきたE2Eテストについて書きます。 E2Eテストを自作するか、SaaSを使うのかで比較した結果と、Datadog Synthetics Testsの使い方を軽く紹介したいと思います。なお、この導入については完全に個人プロジェクトとしてやっております。リブセンスではエンジニアの権利として毎月10%の技術投資枠確保というものがあり、Googleの20%ルールのようなもので、約20日勤務だと想定して2日間は興味のある技術的なことに使えます。 grow.google はじめにこのブログ記事を読むと得られる(と思われる)もの今回書かないこと導入検討
- Datadog
- テスト
- e2e
- selenium
- あとで読む
- 技術
- Testing
- エンジニア
Datadog と Lighthouse を利用した WebPerf の継続的計測
- 75 users
- ceblog.mediba.jp
- テクノロジー
- 2019/07/22
こんにちは。ものづくり推進部、フロントエンドエンジニアの武田です。今日は Datadog, Lighthouse を使ったクライアントパフォーマンス計測に取り組んでいる、というお話です。 mediba では webpagetest を使った定期実行と計測を以前から行っています。 DataStudioとGASでWebPagetestの計測結果をグラフ化するuknmr/gas-webpagetest紹介記事: gas-webpagetestでWebPagetestのパフォーマンス計測を自動化、可視化する1 での取り組みをベースにし、clasp で GAS のソースコード管理・デプロイを実現するための仕組みや webpagetest Lighthouse test と連携したメトリクスの取得まで網羅したものが 2 になります。今回は少し webpagetest とは趣向を変えて Lighth
たった2ヶ月半でSLOを導入して事業判断に影響を与えた話 - Adwaysエンジニアブログ
- 75 users
- blog.engineer.adways.net
- テクノロジー
- 2022/01/14
こんにちは、広告サービスを担当している飛田です。今回は "SLO導入で悩んでいる方" に向けて、弊社リワード広告サービスでのSLO策定の取り組みについてお話したいと思います。そもそもSLOを策定するに至った経緯は二つあります。ユーザへの影響度合いが分かりづらいパフォーマンス問題などの対応が後回しにされがちで、品質改善がなかなか進まないアラート通知があってもユーザに影響があるか即座に判断できず、静観や一部アラートを無視する状況もあり、モニタリングが形骸化しつつある両方とも共通してユーザに与える影響を正しく把握できていないことが課題のようです。そこでSLOを策定する過程でオブザーバビリティを高め、モニタリングの最適化とエラーバジェット運用で開発リソース配分の状況改善を図りました。一挙両得作戦です。細かな取り組みは順を追って紹介します。プロジェクト初期ワークメトリクスからSL
新サービス開発で右肩上がりになってしまったAWSコスト　“塵も積もれば山となる”インフラコスト削減策
- 74 users
- logmi.jp
- テクノロジー
- 2023/05/02
AWSを活用するAutify、ZOZO、dipが、AWSコスト削減についての事例を発表するオンラインイベント「AWSコスト削減事例祭り」。3社それぞれが事例を発表しました。オーティファイ株式会社からは松浦隼人氏が登壇。同社における、AWSのコストの削減の事例について発表しました。もともとはインフラを担当していた松浦隼人氏松浦隼人氏（以下、松浦）：オーティファイの松浦から、当社でのAWSのコストの削減の事例について発表したいと思います。よろしくお願いします。今日のトピックは、タイトルのとおりですが、オーティファイでAWSのコストを見直すきっかけになったことと、その時の見直しの手法、それから当社にとってインパクトのあったコストの削減策について紹介したいと思います。まず自己紹介からします。オーティファイの松浦と申します。今、機械学習とQAのチームのエンジニアリングマネージャーをしています
- aws
- コスト
- あとで読む
- インフラ
- 開発
Puppeteer +Lighthouse +GitHubActionsで認証付きWebアプリのWebperfを定期計測
- 71 users
- zenn.dev/ryo_kawamata
- テクノロジー
- 2021/04/06
Puppeteer + Lighthouse + GitHub Actions を使って Web アプリのフロントエンドパフォーマンスを定期計測するプロジェクトを作ってみたら良い感じだったので紹介です。何を作った？このように GitHub Actions 上で認証付きの Web アプリに対して Puppeteer 介し Lighthouse を定期実行し、結果を Datadog に送信するプロジェクトを作りました。実際にそのプロジェクトの計測値を使った Datadog のダッシュボードはこちらです。 Webperf の主要指標をページ別に時系列で表示しています。サンプルプロジェクトはこちらにあります。以降で実装について簡単に解説します。 Puppeteer + Lighthouse によるパフォーマンス計測 Puppeteer + Lighthouse によるパフォーマンス計測
- puppeteer
- lighthouse
- performance
- あとで読む
- chrome
- monitoring
- 認証
- browser
Datadogを使って感じた、問題調査/対応における変化とその要因 | メルカリエンジニアリング
- 67 users
- engineering.mercari.com
- テクノロジー
- 2019/05/23
はじめにこの記事はMERPAY TECH OPENNESS MONTHの4日目の記事です。こんにちは。株式会社メルペイで backendエンジニアをしている cowsys です。プロダクト/システムで発生した「問題」をいかにして解決するか。いかに素早く原因を特定/解消し、正常化させるか。上記のような「問題の調査と対応」は、backendエンジニアとして持ち続けている、大きなテーマの一つとしてあります。メルペイの開発で初めてDatadogを利用してみて、このテーマが、大きく前進したような手応えを感じました。ここでは最もインパクトのあった変化に絞り、どのような変化が起き、それは何によってもたらされたのか。 Datadogの導入事例として、また「問題の調査と対応」を考えるエンジニアとして、感じたこと、考えたことをお伝えできればと思います。目次はじめに目次利用しているData
自動運転を支えるWeb技術 - 信頼性への取り組み (SRE編) - TIER IV Tech Blog
- 64 users
- tech.tier4.jp
- テクノロジー
- 2021/01/20
こんにちは、ティアフォーでSREを担当している宇津井です。 2019年9月にSite Reliability Engineering(SRE)として入社して以来行ってきたことをざっと振り返った上で、自動運転の社会実装においてWeb系のエンジニアには何が求められるのかという答えを探っていきたいと思います。スタートアップ企業でどのようにSREの文化を作っていくのかという面でも何かの参考になるのではないかと考え筆を取っています。と言いつつも重要なことなので最初に書いておきますが、ティアフォーのSREは私が一人目で入社して以来専任としてはずーっと一人でその役割を担ってきました。ようやく一緒に働く方を募集できる状態になりました。そのような背景もあってこのエントリーを書いています。もしご興味がある方は以下のCareersページからご連絡をお待ちしております。 tier4.jp ※SRE編とタイトルに
Goエンジニアがk8sクラスタでノイジーネイバー問題に遭遇し、解決するまでの記録
- 60 users
- zenn.dev/aanrii
- テクノロジー
- 2022/10/04
これは、とある僕のチームが運用しているWebアプリケーション　(Go製) の、ヘルスチェック用エンドポイントの (リクエストハンドラーの) コードです。リクエストがきたら200 OKを返すだけの、シンプルな実装です。 func health(w http.ResponseWriter, _ *http.Request) { w.WriteHeader(http.StatusOK) } ところが、たったこれだけの処理しかしていないエンドポイントのレイテンシが、ある時からピーク時に著しく劣化するようになり、ひどい時には最大3.4秒もかかるようになってしまったのです。なぜこのようなことになってしまっていたのか、またそれをどのように調査し、解決したのかについて解説します。システム概要今回問題となったWebアプリケーションはGoで書かれています。実行環境は Kubernetes (GKE) で
- k8s
- kubernetes
- go
- あとで読む
- SRE
- golang
- performance
Fargate x Railsで考慮したassets配信・ログ・秘匿情報管理・モニタリングについて - ZOZO TECH BLOG
- 60 users
- techblog.zozo.com
- テクノロジー
- 2019/05/24
こんにちは。WEARリプレイスチームの id:takanamito です。先日、社内で初めてAWS Fargate上でRailsを動かす環境をつくったので、その事例報告をしようと思います。 Fargate導入のきっかけコンテナ環境で動かすにあたって考慮したこと assets配信ログ出力秘匿情報の注入リソース監視苦労した点まとめ Fargate導入のきっかけ WEARでは先日RubyKaigi 2019のスポンサーセッションでお話したように、Ruby on Railsへのシステムリプレイス作業を進めています。そんな中、手作業で行っている運用を管理画面上でツール化したいという要望が上がってきました。リプレイス作業中であるため、できれば新機能はRailsで実装をしたいところです。しかし管理画面に相当するアプリケーションをデプロイするインフラはまだありませんでした。 WEARリプレ
- Fargate
- rails
- aws
- あとで読む
- コンテナ
- ログ
Migrating to OpenTelemetry | Airplane
- 57 users
- www.airplane.dev
- テクノロジー
- 2023/11/17
At Airplane, we collect observability data from our own systems as well as remote “agents” that are running in our customers’ infrastructure. The associated outputs, which include the standard “three pillars of observability” (logs, metrics, and traces) are essential for us to monitor our infrastructure and also help customers debug problems in theirs. Over the last year, we’ve made a concerted ef
GitHub - openobserve/openobserve: 🚀 10x easier, 🚀 140x lower storage cost, 🚀 high performance, 🚀 petabyte scale - Elasticsearch/Splunk/Datadog alternative for 🚀 (logs, metrics, traces, RUM, Error tracking, Session replay).
- 55 users
- github.com/openobserve
- テクノロジー
- 2023/06/12
🚀 10x easier, 🚀 140x lower storage cost, 🚀 high performance, 🚀 petabyte scale - Elasticsearch/Splunk/Datadog alternative for 🚀 (logs, metrics, traces). OpenObserve (O2 for short) is a cloud-native observability platform built specifically for logs, metrics, traces, analytics, RUM (Real User Monitoring - Performance, Errors, Session Replay) designed to work at petabyte scale. It is straightfor
Istioによるサービスメッシュをどのようにプロダクションレディにするか - ZOZO TECH BLOG
- 55 users
- techblog.zozo.com
- テクノロジー
- 2021/05/28
はじめに SRE部 ECプラットフォームSREチームの小林 (@akitok_) です。 ZOZOTOWNでは、マイクロサービス間通信におけるトラフィック制御のために、Istioによるサービスメッシュを導入しています。本記事ではZOZOTOWNのマイクロサービスプラットフォーム基盤（以下、プラットフォーム基盤）において、Istioをいかにプロダクションレディな状態で本番に投入していったか、その取り組みを紹介します。なお、Istioによるサービスメッシュを導入した背景については、以下の記事で紹介しています。 techblog.zozo.com はじめに What is Istio? Istioをプロダクションレディにするまでに直面した3つの課題どのようにリソース消費量を見積もるか Data Planeサイジング Envoyプロキシのチューニング負荷試験 Istioベンチマーク試験サー
［速報］GitHub Copilotが外部ツールと統合可能に。DBのクエリ性能の状況もフィーチャーフラグの状態もCopilotが答えてくれる。GitHub Universe 2023
- 52 users
- www.publickey1.jp
- テクノロジー
- 2023/11/09
GitHubの年次イベント「GitHub Universe 2023」が米サンフランシスコで開幕。1日目の基調講演で、GitHub Copilotがサードパーティの開発者向けツールやオンラインサービスなどと統合可能になることが発表されました。例えば、Copilot Chatのチャットで、Datastax社が提供するNoSQLデータベース「Cassandra」の現在のクエリ性能に問題がないかを質問し、回答を得ることができます。また、Cassandraの性能を改善するにはどうすればいいか、といったサードパーティ製品が備えるナレッジもCopilotに提供され、回答できるようになります。 Copilotとサードパーティ製品との統合はパートナープログラムを通して行われ、第一段としてDatastax、LaunchDarkly、Postman、Hashicorp、Datadogなどを含む25社以上が
- github
- あとで読む
- 人工知能
- Git
- techfeed
OpenTelemetry
- 52 users
- opentelemetry.io
- テクノロジー
- 2019/05/22
OpenTelemetry is a collection of APIs, SDKs, and tools. Use it to instrument, generate, collect, and export telemetry data (metrics, logs, and traces) to help you analyze your software’s performance and behavior. OpenTelemetry is generally available across several languages and is suitable for use.
zx + Datadog + GitHub Actions でフロントエンドのコードベースの健全性を可視化する
- 51 users
- zenn.dev/ryo_kawamata
- テクノロジー
- 2022/06/23
フロントエンドのダッシュボードを作ってみたらいい感じだったので紹介です。作ったもの zx と Datadog、GitHub Actions を使って以下画像のように、フロントエンドのコードベースの各指標を可視化するダッシュボードを作りました。値はデモ用に書き換えています現在、計測している指標はこちらです。 Vue SFCファイルにしめるTypeScriptの割合 Vue SFCファイルにしめるComposition APIの割合 strict: trueにした場合のType Errorの数（tsc & vue-tsc） Jestの各種カバレッジ各指標は毎朝9時に更新していて、時系列での推移も確認できます。なぜ作った？技術的負債解消等コードベースのリファクタリングの活動は、機能追加に比べ進捗を把握しにくい、成果が伝わりにくいという問題があり、それを解消したいと考えたからです。こ
- Datadog
- CI
- github
- typescript
- あとで読む
- Git
- techfeed
- development
実践OpenTelemetry - Classi開発者ブログ
- 51 users
- tech.classi.jp
- テクノロジー
- 2023/09/12
こんにちは・こんばんは・おはようございます、エンジニアのid:aerealです。この記事では筆者が開発に参加しているサービスの監視フレームワークをOpenTelemetryへ移行した際の体験を紹介します。 OpenTelemetryとは OpenTelemetry is an Observability framework and toolkit designed to create and manage telemetry data such as traces, metrics, and logs. What is OpenTelemetry? サイトの説明にある通り分散トレースやメトリクス、ログなどの指標を扱う監視フレームワークです。 OpenTracingやOpenCensusなどを継承・統合したプロジェクトと言うと合点がいく方も多いのではないでしょうか。 OpenTelemet
- OpenTelemetry
- あとで読む
- observability
- Datadog
- monitoring
- aws
- 開発
Datadog のコスト最適化で月額費用を 30% 削減した - LayerX エンジニアブログ
- 48 users
- tech.layerx.co.jp
- テクノロジー
- 2023/07/05
バクラク事業部 Platform Engineering 部の uehara です。2023年4月に入社しました！この記事では、直近で取り組んだ Datadog のコスト最適化の取り組みを紹介します。概要大きく2つの施策によって、Datadog の月額料金を 30% ほど削減しました。毎月の利用量を事前コミットすることで単価を下げたログ運用を見直すことでコストを約半分にした利用量の事前コミット Datadog の一部機能では利用量を事前コミットすることで単価を下げることができ、価格表も公開されています。BILLED ANNUALLY が年契約、BILLED MONTH-TO-MONTH が月契約の単価です。 www.datadoghq.com オンデマンド料金と比較すると2割から3割ほど安くなっていることが分かります。直近の利用実績から毎月必ず利用する分を算出し、MONTH-