並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 834件

新着順 人気順

監視の検索結果1 - 40 件 / 834件

  • もう一度読むObservability Engineering - じゃあ、おうちで学べる

    はじめに 本書『Observability Engineering』は、複雑化の一途をたどる現代のソフトウェアシステムに立ち向かうための、強力な武器となる一冊であり本稿はその読書感想文です。Observability Engineering を今から知りたい方はもちろん、Observability Engineering の基礎を改めて学びたい方もぜひお読みください。この記事もかなりの長さになるので普通に書籍を読んだほうがいいかもです learning.oreilly.com 「Observability:可観測性」という言葉は、近年ソフトウェアエンジニアリングの世界で大きな注目を集めています。しかし、その概念の本質を理解し、実践に移すことは容易ではありません。 本書は、そのオブザーバビリティについて、その基本的な考え方から、具体的な実装方法、そして組織への適用まで、幅広くかつ深く解説して

      もう一度読むObservability Engineering - じゃあ、おうちで学べる
    • 太陽光発電 監視機器約800台へのサイバー攻撃について調べてみた - piyolog

      2024年5月1日、太陽光発電施設の遠隔監視機器 約800台がサイバー攻撃を受けていたと報じられました。ここでは関連する情報を調べた内容についてまとめます。 監視機器を経由し不正送金 太陽光発電施設の遠隔監視機器がサイバー攻撃を受けているとして、報じたのは産経新聞の次の記事。コンテック社の遠隔監視機器が乗っ取られ、インターネットバンキングの不正送金に悪用されていたというもの。 www.sankei.com 攻撃を受けた機器には脆弱性(記事では「サイバー攻撃対策の欠陥」と表記)が存在。これを悪用されたことで機器上にバックドアが設置され、機器を経由(攻撃者が身元を隠すために踏み台にしたとみられる)して不正送金にかかる操作が行われていた。当該事案については既に静岡県警も不正アクセス禁止法違反の容疑で捜査中とされている。 SolarView Compactの脆弱性を悪用 脆弱性が悪用された監視機器

        太陽光発電 監視機器約800台へのサイバー攻撃について調べてみた - piyolog
      • SSM Agent の Ping ステータスを監視する仕組みを EventBridge + Lambda 関数 + SNS を使って実装してみた | DevelopersIO

        はじめに テクニカルサポートの 片方 です。 前回のブログで執筆数が 200 本を越えました。199 本目、200 本目 のブログに引き続き Lambda 関数を利用した内容を紹介します。 こちらは、私の所属するテクニカルサポートチームへ「〇〇〇 を実現するサービスや機能はないか」と実際にお客様より頂いたお問い合わせを参考 (ヒント) にしてカスタムソリューションを作成してみました。 本ブログでは、マネージドノードに表示されている SSM Agent の Ping ステータスを監視する仕組みを EventBridge + Lambda 関数 + SNS を使って実装してみました。 構成と説明 SSM エージェントのステータスを毎分ポーリングする Lambda 関数を作成します。それをメトリクスとして取得して CloudWatch に送信します。 上記で作成した SSM エージェントのメトリ

          SSM Agent の Ping ステータスを監視する仕組みを EventBridge + Lambda 関数 + SNS を使って実装してみた | DevelopersIO
        • AWS Security HubとSlackを利用して、セキュリティ状況の監視運用を効率化したお話 - Uzabase for Engineers

          はじめに 初めまして!ソーシャル経済メディア「NewsPicks」SREチーム・新卒エンジニアの樋渡です。今回は「AWS Security Hub」と「Slack」を用いて、弊社で利用しているAWSリソースの監視運用を効率化したお話です。 お話の内容 年々増加するサイバー攻撃に対抗するため、セキュリティ対策は日々重要度が増してきています。 そこで弊社で利用しているAWSのリソースに対して、各種セキュリティイベントの収集ができるAWS Security Hubを利用することで、セキュリティ状態の可視化と迅速な対応がしやすい運用を行い、セキュリティ状態の現状把握から始めることにしました。特にNIST CSFの「検知」部分の運用について整備した内容となっています。 NIST Cyber Security Frameworkについて 皆さん、「NIST Cyber Security Framewo

            AWS Security HubとSlackを利用して、セキュリティ状況の監視運用を効率化したお話 - Uzabase for Engineers
          • サービスメッシュを活用して、クラウドアプリケーションのオブザーバビリティを高める | gihyo.jp

            Google Cloudで実践! クラウドネイティブな開発 サービスメッシュを活用して⁠⁠、クラウドアプリケーションのオブザーバビリティを高める 本連載は、Google Cloudのアプリ開発とDBプロダクトにおけるスペシャリスト達が、Google Cloudプロダクトを利用した、クラウドネイティブな開発を実践する方法を解説しています。 第6回では、サービスメッシュについて紹介します。 主に対象となる読者は、クラウドを利用してアプリケーションを開発するエンジニア、またはその基盤を構築するエンジニア、サービス開発に携わるプロダクトマネージャーを想定しています。 マイクロサービスアーキテクチャの課題 これまでの連載ではクラウドネイティブなアプリケーションの開発について紹介しました。小さい独立して動作するサービスが連携するマイクロサービスアーキテクチャは、スケーラビリティ、独立した開発の容易さ、

              サービスメッシュを活用して、クラウドアプリケーションのオブザーバビリティを高める | gihyo.jp
            • ゼロトラストを誤解してほしくない--提唱者が説く正しい定義

              印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 近年のサイバーセキュリティトレンドに「ゼロトラスト」がある。その提唱者で知られるJohn Kindervag氏は、「誤解されている」と警鐘を鳴らす。同氏がゼロトラスト本来の定義を説明した。 ゼロトラストは、Kindervag氏が2010年に当時在籍したForrester Researchで提唱した。そのコンセプトは「信用せず常に検証する」というもので、同氏はゼロトラスト本来の定義を「守るべき資産(データや情報など)を脅威による侵害から守るための『戦略』である」と述べる。提唱から15年近くが経過し、「現在では米国大統領令で推進されるなど、各国の政府レベルでも重要な『戦略』として認知されるまでになった」とした。 現在のサイバーセキュリティ市

                ゼロトラストを誤解してほしくない--提唱者が説く正しい定義
              • 2024年11月、Mackerelのメトリックがオブザーバビリティ標準であるOpenTelemetryに正式対応し、あわせて価格体系を全面的に改定します - Mackerel お知らせ #mackerelio

                現在パブリックベータとして提供しているOpenTelemetry対応を2024年11月1日に正式リリースいたします。また、機能に合わせた価格体系の見直し(価格引き上げも含む)を行います。 OpenTelemetry対応と今後のMackerelの開発方針について クラウドネイティブな開発を進めていくと、システム内で何が起きるのかあらかじめ予測して監視・対応しておく、ということが困難になってきます。こういった環境ではシステム内部の状態を把握できるように多角的に観測可能にしておく、可観測性を上げておくことが重要となります。このような環境に対応していくため、Mackerelはメトリックを多次元的に扱うことができる「OpenTelemetry対応」を2024年11月1日に正式リリースします。 OpenTelemetry対応機能は、以下の特徴を持っています。 メタデータを付与した多次元的なメトリックの

                  2024年11月、Mackerelのメトリックがオブザーバビリティ標準であるOpenTelemetryに正式対応し、あわせて価格体系を全面的に改定します - Mackerel お知らせ #mackerelio
                • 監視にかかるコストを見直し半額にした話 - メドピア開発者ブログ

                  SRE の田中 @kenzo0107 です。 メドピアグループでは主に AWS をプラットフォームとし、監視は Datadog で実施しています。 監視対象や課金対象のサービスの増加で徐々にコストが増加していたので、 利用状況を分析し、削減できる項目を調査しまとめました。 Datadog 子組織・サービス毎の利用料金の確認の仕方 親組織にある Usage & Cost > Individual Organizations *1 の Cost タブで各 org 毎の利用料金を確認できます。*2 事前に利用する量をコミット www.datadoghq.com 事前に利用する量をコミットすることで 2~3割程、コスト削減できます。 ANNUALLY (年間でコミットを決定) の方がコスト削減率は高いですが、 MONTH-TO-MONTH (月毎にコミットを決定) を採用しています。 月毎に監視対

                    監視にかかるコストを見直し半額にした話 - メドピア開発者ブログ
                  • FireLensでログ転送するときは依存関係とHealthcheckを設定しないとログを取りこぼすことがある

                    三行で FireLens を使うことで ECS で稼働するアプリケーションのログ転送を簡単に実装できる しかし、ドキュメントに記載されている設定例をそのまま利用しただけでは実はログの取りこぼしがあった ログの取りこぼしを防ぐためにコンテナ間の依存関係とHealthcheckの設定を行った FireLens とは FireLens を簡単に言うと、「ECS のタスク定義の記述だけで Fluent Bit / Fluentd を使ったログ転送用のサイドカーコンテナが利用できる機能」でしょうか。 FireLens という個別のサービスやソフトウェアが存在するわけでは無いようです。 詳細は以下を参照ください。 症状 私が関わったとあるサービスでは ECS を使ってアプリケーションを稼働させていて、アプリケーションのログは FireLens により Fluent Bit を使ってログ転送を行っていま

                      FireLensでログ転送するときは依存関係とHealthcheckを設定しないとログを取りこぼすことがある
                    • 5年後には標準になっている可観測性のこと - Learning Opentelemetry の読書感想文 - じゃあ、おうちで学べる

                      はじめに 本稿は、オープンソースの可観測性(Observability)プロジェクトである OpenTelemetry を取り上げた書籍「Learning Opentelemetry」の読書感想文です。従来の可観測性の課題であったデータの分断を解消し、トレース、メトリクス、ログなどの様々なテレメトリデータを統合的に扱うことができる OpenTelemetry は、可観測性の分野における革命的な存在と言えます。 過去10年間で、可観測性はニッチな分野から、クラウドネイティブの世界のあらゆる部分に影響を与える数十億ドル規模の産業へと発展しました。しかし、効果的な可観測性の鍵は、高品質のテレメトリデータにあります。OpenTelemetryは、このデータを提供し、次世代の可観測性ツールと実践を開始することを目的としたプロジェクトです。 learning.oreilly.com 本書の想定読者は、

                        5年後には標準になっている可観測性のこと - Learning Opentelemetry の読書感想文 - じゃあ、おうちで学べる
                      • 自動生成を活用した、運用保守コストを抑える Error/Alert/Runbook の一元集約管理 / Centralized management of Error/Alert/Runbook to minimize operational costs using automated code generation

                        DevOpsDays TOKYO 2024 の登壇資料です。 https://confengine.com/conferences/devopsdays-tokyo-2024/proposal/19703/erroralertrunbook-centralized-management-of-erroralertrunbook-to-minimize-operational-costs-using-automated-code-generation

                          自動生成を活用した、運用保守コストを抑える Error/Alert/Runbook の一元集約管理 / Centralized management of Error/Alert/Runbook to minimize operational costs using automated code generation
                        • Why is observability so expensive?

                          It’s no secret that observability costs are top of mind for many organizations in the post-zero interest rate phenomenon (ZIRP) era (see here, here, and here for example discussions, though similar sentiments can be found far and wide). Organizations are frustrated with the percentage of infrastructure spend (sometimes > 25%!) allocated towards logging, metrics, and traces, and are struggling to u

                          • Fargate Spotを本番運用するための監視の実践 - KAYAC engineers' blog

                            SREチームの橋本です。SRE連載の3月号となります。 Amazon ECSのコスト最適化においてはFargate Spotが有効な手段となりますが、いつ中断されるか分からない性質上、その監視も併せて実施していく必要があります。今回はそのFargate Spotを本番環境で運用しているプロジェクトにおける取り組みを紹介します。 背景 Fargate (Amazon ECS on AWS Fargate) を用いると負荷に合わせた容易なスケーリングが可能になる一方、このときCPU使用率の安全マージンや予測のブレなどにより、リソースがやや過剰になってしまうこともあります。 Fargate Spotの代表的なユースケースと言えばユーザーに露出しない開発環境ではないかと思いますが、このような場合にコストを考えると、タスクの中断をある程度許容しての本番環境でのFargate Spot運用も可能な選択

                              Fargate Spotを本番運用するための監視の実践 - KAYAC engineers' blog
                            • Linuxでトラブルが発生したときの診断に役立つツール一覧、「事前のインストールを強く推奨」とリストの作者は語る

                              Linuxで動くシステムで何か問題が発生した際の原因分析に役立つツールの一覧をNetflixやIntelでクラウドコンピューティングのパフォーマンス改善に取り組んできたエンジニアのブレンダン・グレッグ氏がブログにまとめています。 Linux Crisis Tools https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html ◆procps このパッケージには「ps」「vmstat」「uptime」「top」という基本的なステータス表示に役立つツールが含まれています。 ◆util-linux このパッケージには「dmesg」「lsblk」「lscpu」というシステムのログを取得したりデバイスの情報を出力するツールが含まれています。 ◆sysstat このパッケージには「iostat」「mpstat」「pidsta

                                Linuxでトラブルが発生したときの診断に役立つツール一覧、「事前のインストールを強く推奨」とリストの作者は語る
                              • [SRE][Monitoring]イベントログの一元監視サービス「srest」を使ってみた!

                                良さそう ITインフラの“体調”を一元監視で早期に異常検知 https://t.co/TumixShIsb @PRTIMES_JPより — adachinSRE (@adachin0817) February 26, 2024 皆さんお久しぶりです!1ヶ月ぶりのブログとなってしまいましたが、本日はなかなか面白いモニタリングツールを発見しました。 きっかけはXでの呟きからなのですが、メタップスホールディングスさんがSaaS向けイベントログの一元監視サービス「srest(スレスト)」をリリースされました。非常に気になっていたので使ってみようかなと思っていたところ!開発メンバーが「お初ですが、飲みいきましょう!」と誘われたので、いざ新大久保へ! 今日は「srest」というイベントログの一元化ツールを開発しているメンバーと新大久保でポッサム会!みんな超面白い方でした!来週辺りに個人でsrest触っ

                                • OpenTelemetry 対応(パブリックベータ)提供開始 - Mackerel お知らせ #mackerelio

                                  Mackerel チーム エンジニアリングマネージャーの id:onk です。 Mackerel では既報の通り OpenTelemetry 対応を進めてきました。 OpenTelemetry とは OpenTelemetry とは、メトリック・ログ・トレースなどのテレメトリーデータを収集し、任意のバックエンドへエクスポートすることを目指して標準規格を定めたオープンソースのプロジェクトです。 ベンダーに依存しない標準規格であり、扱い方が規格化されているため、何らかのテレメトリーデータを出力したい場合は、まず OpenTelemetry の形式で出力されるようになりつつあります。Mackerel が plugin として未対応なミドルウェアでも簡単にテレメトリーを収集開始できること、メトリックがメタデータ (Attribute) を持つため Observability をより高められることか

                                    OpenTelemetry 対応(パブリックベータ)提供開始 - Mackerel お知らせ #mackerelio
                                  • 特定のページが更新されたら通知する仕組みを作ってみた - Qiita

                                    はじめに RSS対応のサイトだと、更新情報追いやすいけど、RSS非対応のページも追いたいよね。って人向けの記事です。 RSS対応しているサイトなら、RSSリーダーを使った方が早いです また、Discordのチャンネルにも通知がしたかったので、メールとDiscord両方に通知を行っています。 Discord側にWebhook用のURLが必要ですが、本記事では紹介しません 参考サイトのZennの記事が細かく書かれていますので、そちらをご覧ください なお、この仕組みは更新を検知したいサイトに確認リクエストを送ります。 高頻度で設定してしまうと、サーバーに負荷がかかる為、 高頻度での設定はしないようにお願いします 参考サイト 構成図 コードについて(Lambda) コードについては、基本的に、クラスメソッドさんの記事を参考にしています Discordの通知部分については、AmazonBedrock

                                      特定のページが更新されたら通知する仕組みを作ってみた - Qiita
                                    • OpenTelemetry Collector導入の実践編とその後 - Gaudiy Tech Blog

                                      はじめまして。Gaudiyでエンジニアをしているあんどう(@Andoobomber)です。 以前、「OpenTelemetry Collector導入のPoCと今後に向けて」という記事を弊エンジニアの sato(@yusukesatoo06)より公開しました。簡単に記事を要約すると、 OpenTelemetry及びOpenTelemetry Collectorの説明 実際にPoCを作ってみる 実導入を試みたがOpenTelemetry Collectorのホスティングに悩み、今後の課題として保留となった といった内容でした。 あれから1年経ち、GaudiyではOpenTelemetry Collectorを本番環境に組み込み、OpenTelemetryの仕様に準拠して計装し、データの分析や監視を行っています。この記事では、前回からの進捗を紹介すると共にOpenTelemetryの導入方法を

                                        OpenTelemetry Collector導入の実践編とその後 - Gaudiy Tech Blog
                                      • LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 - AITC - ISID | AI トランスフォーメンションセンター コラム

                                        こんにちは!AIソリューショングループの太田です。 このコラムでは、Azure Log Analyticsを使ったLLMOpsの実現方法について紹介します。 昨年から大規模言語モデル(LLM)を製品やサービスに組み込む企業が増えています。 しかし、LLMサービスの品質を維持するには、その運用にも注意を払う必要があります。 具体的には、LLMの出力の品質管理や、ユーザーからのフィードバックを元にしたプロンプトの最適化など、継続的な監視と改善が求められています。 これらの運用上の活動にAzure Log Analyticsが役立ちます。 LLMOps(LLM(Large Language Model)+ Ops(Operations))とは LLMOpsは製品に組み込まれたLLMの運用に必要なベストプラクティスの概念を指します。 例えば、LLMの運用ではLLMの出力の監視と評価とプロンプト管理

                                          LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 - AITC - ISID | AI トランスフォーメンションセンター コラム
                                        • 【OpenTelemetry】オブザーバビリティバックエンド8種食べ比べ

                                          sumirenです。 技術顧問やSREをしています。 背景 2024年現在、OpenTelemetryが盛り上がっており、ベンダへの依存度を下げてテレメトリを収集・送信することがトレンドになってきているように思います。多くの企業様で、OpenTelemetry対応のオブザーバビリティバックエンドを選定されているのではないでしょうか。 一方で、E2E自動テストツールなどもそうですが、デベロッパーツールは画面やUXの情報がパブリックな情報として出回ることが少ないように思います。オブザーバビリティバックエンドの場合、シグナル3種に関してOpenTelemetryベースでもフルに機能が活用できるのかという疑問もあります。 そうしたこともあり、オブザーバビリティバックエンドは実際にトライアルしてみないと選定しづらいです。監視など狭義のオブザーバビリティ外の機能や、OpenTelemetryの範囲外の

                                            【OpenTelemetry】オブザーバビリティバックエンド8種食べ比べ
                                          • ぼくのかんがえたさいきょうのDevOps実現構成

                                            はじめに 昨年、AWS のインフラを運用・監視する上で使いやすいと思ったサービスを組み合わせて構成図を紹介した記事、「【AWS】ぼくのかんがえたさいきょうの運用・監視構成」が投稿したその日の Qiita のトレンド 1 位になり、はてなブックマークのテクノロジー分野でトップを飾りました。(たくさんの方に見ていただき感謝してます!) 本記事では「ぼくのかんがえたさいきょうの運用・監視構成」の続編として「ぼくのかんがえたさいきょうの DevOps 実現構成」を紹介させていただきます。あくまでも「ぼくのかんがえた」なので私個人の意見として受け入れていただけると助かります。 前回の記事でもお伝えいたしましたが、各個人・企業によって環境は違うと思いますし、使いやすいサービスは人それぞれだと思うので、これが正解という訳ではありません。一個人の意見として参考にしてただければ幸いです。 また、こちらの記事

                                              ぼくのかんがえたさいきょうのDevOps実現構成
                                            • 理想は「SREチームをなくすこと」、一人目SREとしてたどり着いた真理|イオン・エンジニアインタビュー |AEON TECH HUB

                                              イオンスマートテクノロジー・SREチーム齋藤のインタビューです。2022年に1人目のSREエンジニアとして入社し、多くの課題を抱えていた組織を、地道な活動によって少しずつ変えていきました。Jiraの導入、100ページにわたるドキュメント作成、監視・モニタリング基盤の統一…齋藤はどんな想いで改革を進めていたのか、本音を伺いしました。

                                                理想は「SREチームをなくすこと」、一人目SREとしてたどり着いた真理|イオン・エンジニアインタビュー |AEON TECH HUB
                                              • Nature Remo+AWS+LINE Notifyで緩やかな自宅監視(1)

                                                家族がいると自宅の様子が気になる、けれども監視カメラを設置するのは家族のプライバシー的に行き過ぎた感あり、もう少し緩やかな監視ができないか?と考えた際、照度の変化に着目したソリューションを思いついた。 つまり、家族が帰宅して部屋の電気を付けた、外出のため消灯した、電気を消して寝静まったといった状態の遷移を「照度の変化」によって検知し、スマホに通知する、といった具合だ。 概要 Nature Remo 3は外出先からスマートフォンで家電を制御するためのスマートリモコン製品のひとつであるが、照度や温度センサーが取得した情報を Nature Remo Cloud API によりクラウドから取得できる、という大変素晴らしい特徴がある。 自宅に設置したNature Remoの照度を、AWSのLambda関数により一定時間毎に取得してDynamoDBに蓄積する。前回取得した照度と比べて急激な変化があった

                                                  Nature Remo+AWS+LINE Notifyで緩やかな自宅監視(1)
                                                • 監視SaaSが使えなくなった話 | ドクセル

                                                  ⾃⼰紹介 和田 雄樹(Yuki Wada) ウェルスナビ株式会社 / システム基盤チーム / インフラエンジニア > チーム規模: 5人(2024年1月時点) > 技術スタック: AWS/ECS/EKS/Terraform/Datadog/PagerDuty ウェルスナビでは ● SRE、FinOps、Containerization、Securityいろいろやってます ● ウェルスナビにおけるコンテナ化の取り組み という記事書きました ひとこと ● 最近、長野(松本)から上京してきました 2 @2024 WealthNavi Inc. https://tech.wealthnavi.com/entry/20240110/1704855600

                                                    監視SaaSが使えなくなった話 | ドクセル
                                                  • AMD Ryzen 8040シリーズ搭載の“Ryzen AI”、もうすぐタスクマネージャーに表示されるように

                                                    AMDは同社コミュニティページ上で、現行Ryzen 8040プロセッサシリーズが内蔵する「Ryzen AI」コアの動作率をタスクマネージャー上で監視できるよう取り組んでいると明らかにした。 AMD Ryzen 8040シリーズ搭載の“Ryzen AI”、もうすぐタスクマネージャーに表示されるように Intel Core Ultraシリーズが内蔵するNPUは投入直後からWindowsのタスクマネージャーに独自のカラムが設定されており、動作している様子をわかりやすく確認できる。一方、先行していたRyzen AIコアはタスクマネージャーでの動作状況の監視に対応しておらず、ちゃんと動作しているかがわかりにくい状況が続いていた。今回これを受けて、Ryzen AIの動作状況を確認できるよう取り組んでいることを明らかにした形だ。 ちなみに、Ryzen AIはMCDM(Microsoft Compute

                                                      AMD Ryzen 8040シリーズ搭載の“Ryzen AI”、もうすぐタスクマネージャーに表示されるように
                                                    • Amazon倉庫のコーヒー自販機のカメラが職場の休憩室を盗撮していたことが発覚

                                                      Amazonは配送ドライバーを監視するための車載カメラを車両に取り付けたり、従業員のキーボードとマウスカーソルの動きを追跡したりと、あの手この手で従業員を監視しようとしていることが知られています。新しく、Amazon倉庫のコーヒーマシンのカメラが休憩室を撮影していたことが判明しました。Amazonは、カメラの誤作動であると説明しています。 Coffee machine camera at Amazon warehouse raises concerns https://sahanjournal.com/business-work/amazon-coffee-machine-camera-surveillance/ ミネソタ州のニュースを扱う非営利サイト・Sahan Journalは2024年2月20日に、Amazonの倉庫にあるコーヒー自動販売機のカメラが休憩室を撮影しているのが偶然見つか

                                                        Amazon倉庫のコーヒー自販機のカメラが職場の休憩室を盗撮していたことが発覚
                                                      • ソニーにおける App Runner 導入事例と生の体験談の紹介 / Case study and real experience of using App Runner in Sony products

                                                        3年ほど前に登場した比較的新しいサービスであるApp Runnerを商用環境で導入した事例を紹介します。 インフラの運用の手間を軽量化できる一方で、利用して初めて気づく課題もありました。 本日は実際の導入事例に基づいて、ECS Fargateとの比較、CI/CD・監視の工夫から障害発生時の運用方法といった生の体験を紹介することで、これから導入を考えている方へ向けて、技術選定のポイントとなる"肌感"を共有できればと思います。 登壇アーカイブ:https://www.youtube.com/watch?v=YiE3n06tfCA

                                                          ソニーにおける App Runner 導入事例と生の体験談の紹介 / Case study and real experience of using App Runner in Sony products
                                                        • Sentry Replayでアラート対応をお手軽に - SmartHR Tech Blog

                                                          こんにちは。人事評価機能のプロダクトエンジニアをしているotaniです。 私達のチームでは起こったエラーの検知・対応を監視ツールであるSentryで行っていますが、表示されるエラーメッセージやスタックトレースだけでは原因の特定が困難で、対応の優先度を決めかねることがありました。ひと目見て原因や再現方法が分かる場合は良いのですが、例えばユーザー側で入れたブラウザの拡張に起因したエラーや、特定のタイミングで操作すると起こるエラーなどには調査に時間がかかってしまい、結果として判断しきれずに優先度が下がってしまう問題などが起こっていました。 そんな状況の中、Sentry Replayによって上記のような課題を部分的に解決し、エラー調査の負担を減らすことができたので紹介したいと思います。 Sentry Replayとは Sentry Replayとは、Sentryのアドオン機能の1つで、アラートが上

                                                            Sentry Replayでアラート対応をお手軽に - SmartHR Tech Blog
                                                          • ゼロから始めるシステム障害対応フロー - Qiita

                                                            初めに 本記事 『ゼロから始めるシステム障害対応フロー』 の内容について タイトルの「ゼロから始める」には二つの意味があります。プロダクトのリリースを間近に迎える中、チーム内での障害対応体制の枠組みがなかったこと。そして体制づくりを担当することとなった私の知識・知見が(ほぼ)ゼロだったこと。この二つです。 この状態から、リリース前〜リリース後の約2月間でなんとか形にすることができました。本記事ではその過程でぶつかった問題とそれに対する課題、それらにどう対応したのか、何を学んだのか、の紹介。 そして、障害対応体制の策定・構築や改善の流れの中で私が起こした失敗から、人としてリーダーとして何を心がけなければいけなかったのかの反省を共有させてもらいたいと思います。 本記事は以下の構成です。 0. 始まり ※ スクラムチームでの話。スクラムチームの登場人物は以下の三つ PO:プロダクトオーナー(Pd

                                                              ゼロから始めるシステム障害対応フロー - Qiita
                                                            • 非インフラエンジニアがPrometheusとGrafanaで簡単サーバモニタリング - RAKUS Developers Blog | ラクス エンジニアブログ

                                                              概要 Prometheus未経験の非インフラエンジニアが、Grafanaでサーバモニタリングができるようになるまでの 軌跡を記録します。 とりあえず、モニタリングができることが目標なので運用面の考慮等はしていませんが、参考になれば幸 いです。 概要 きっかけ Prometheusとは Grafanaとは 今回構築する環境の構成 ①prometheus server ②exporter ③Grafana インストール 前提条件 ②exporterのインストール (1)ソースをダウンロード (2)ダウンロードしたソースを解凍する (3)node_exporterを起動する (4)node_exporterの起動確認 ①prometheus serverのインストール (1)ソースをダウンロード (2)ダウンロードしたソースを解凍する (3)Prometheusの設定ファイルを編集する (4)p

                                                                非インフラエンジニアがPrometheusとGrafanaで簡単サーバモニタリング - RAKUS Developers Blog | ラクス エンジニアブログ
                                                              • SentryでRailアプリケーションのエラー監視を始めました - stmn tech blog

                                                                はじめに 初期設定 詳細設定 Slack連携とアラートの整備 CircleCIとの連携によるRelease Managementの活用 運用 今後について まとめ はじめに プラットフォーム部 SREチームのショウゴ(@shogo_452)です。 最近、TUNAGの新たなエラー監視ツールとして「Sentry」を導入しました。 本記事では、Railsアプリケーションに対するSentryの導入事例について紹介します。 初期設定 まずは、sentry-ruby とsentry-railsというGemをインストールします。 Sidekiqを使用している場合は、sentry-sidekiq も必要です。 gem 'sentry-ruby' gem 'sentry-rails' gem 'sentry-sidekiq' docs.sentry.io docs.sentry.io 次に設定ファイルです。

                                                                  SentryでRailアプリケーションのエラー監視を始めました - stmn tech blog
                                                                • フロントエンド監視の全体像と実現方法

                                                                  必要性 フロントエンドの監視はバックエンドやインフラのそれらと比べ、優先度が低くなりがちです。 バックエンドやインフラでの障害はサービス継続に直結するため、これは当然と言えば当然なのですが、別の理由もあると考えています。 それは計算リソースをサービス提供側が管理していないことです。 例えばアプリケーションがインフラとして AWS を利用しているなら、AWS のリソースを管理するのはサービス提供側です。 これは AWS 以外のクラウドサービスプロバイダやオンプレであっても同様です。 一方でフロントエンドはエンドユーザのブラウザ上で動作し、これを管理しているのはエンドユーザです。 フロントエンドはその性質上、監視の「盲点」になりがちです。 しかしフロントエンドはエンドユーザが直接触れるものであるため、そこで何が起きているかサービス提供側は正確に把握する必要があります。 マイルストーン フロント

                                                                    フロントエンド監視の全体像と実現方法
                                                                  • フロントエンドで収集するべきテレメトリは何か

                                                                    先日『フロントエンド監視の全体像と実現方法』という記事を投稿しましたが、その中でテレメトリについては触れませんでした(※本記事は上記記事の内容を知らなくても読み進められるようになっています)。 というのは、テレメトリは可観測性を実現するための重要な概念ではあるものの、テレメトリを軸に監視を考えるのは手段の目的化になってしまうと考えているからです。 重要なのはサービスにとって何を観測するべきかを考えることであり、テレメトリはそれを設計や実装に落とし込む際に現れるものです。 一方で監視に対する理解を深める上では、テレメトリを軸に考えることも重要でしょう。 そこで本記事ではフロントエンド監視においてどのようなテレメトリを収集するべきか述べていきます。 監視 SaaS と OpenTelemetry (OTel) Datadog, New Relic, Sentry のいずれかを利用することを考え

                                                                      フロントエンドで収集するべきテレメトリは何か
                                                                    • アプリケーションエンジニアこそ「監視」だよね!と私が考える訳 #phpkansai

                                                                      PHPカンファレンス関西2024での発表資料です https://fortee.jp/phpcon-kansai2024/proposal/42712995-5f3e-4c68-a951-39584eac95a1

                                                                        アプリケーションエンジニアこそ「監視」だよね!と私が考える訳 #phpkansai
                                                                      • 中国のネット監視・検閲「グレートファイアウォール」を個人で再現 オープンソース「OpenGFW」公開中

                                                                        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米国の研究機関であるAperture Internet Laboratoryは、Linuxで動作する中国のインターネット検閲システム「グレートファイアウォール」(Great Firewall、GFW、金盾)をオープンソースで実装したシステム「OpenGFW」を発表した。このシステムは家庭用ルーターで使用可能なほど柔軟で使いやすく、GFWを個人レベルで実現することを目指している。 OpenGFWは、IPとTCPのデータを完全に再構築する能力を持ち、HTTP、TLS、DNS、SSHなどのネットワークプロトコルを解析できる。特に、Shadowso

                                                                          中国のネット監視・検閲「グレートファイアウォール」を個人で再現 オープンソース「OpenGFW」公開中
                                                                        • マウスポインタを自動移動、“離席バレ”を防ぐUSBマウスジグラーがアイネックスから - エルミタージュ秋葉原

                                                                          マウスポインタを自動移動、“離席バレ”を防ぐUSBマウスジグラーがアイネックスから 2024.02.05 14:25 更新 2024.02.05 配信 USBポートに挿すだけでマウスを自動移動。3種類の動作モードを搭載 株式会社アイネックス(本社:東京都西東京市)は2024年2月2日、マウスポインタを自動的に動かすことができるUSBマウスジグラー「U20A-MMJGR」を発表した。2月7日に出荷が開始される予定。 マウスポインタを自動的に動かすことができる、小型USBドングルのような形状のUSB機器。ポインタが自動で動き続けるため、スクリーンセーバーやスリープが動作するのを防ぐことができるほか、テレワーク時の“離席バレ”防止にも使える。 本体にはON/OFFスイッチとモード切替スイッチを搭載。動作モードは、極めて小さい範囲で左右に移動させる「モード1」(初期設定)、左右に一定距離移動させる

                                                                            マウスポインタを自動移動、“離席バレ”を防ぐUSBマウスジグラーがアイネックスから - エルミタージュ秋葉原
                                                                          • 【サイバーセキュリティ】SOCによる24時間365日監視は本当に必要なのか再考してみる - Qiita

                                                                            はじめに 近年、サイバーセキュリティに対する意識の高まりを感じている。 国会では「セキュリティ・クリアランス制度」なるものの検討が進んでおり、誰もが知っているような上場企業であれば当たり前のようにサイバーセキュリティ対策を専門で行う部門が設置されるようになってきた。 筆者が実際にクライアントと会話していても、以前のように「サイバーセキュリティ対策の必要性がわからない」というケースは減ってきており、「サイバーセキュリティ対策をとりあえずやりたい」という経営層が増えているようにも感じる。 そして、需要が高まれば供給側の企業も増えるのが資本主義の性(さが)である。 大手SIerやコンサルティング会社はこぞってサイバーセキュリティ分野への増員に力を入れている。 サイバーセキュリティ分野を得意としたベンチャー企業の上場事例も多数見受けられる。 そんな中、近年急速に拡大しているビジネスが24時間365

                                                                              【サイバーセキュリティ】SOCによる24時間365日監視は本当に必要なのか再考してみる - Qiita
                                                                            • ChatGPTを駆使して、Raspberry PiとTensorflowを使ってドア監視をできるようにした - Qiita

                                                                              ChatGPTを駆使して、Raspberry PiとTensorflowを使ってドア監視をできるようにしたPythonOpenCVRaspberryPiTensorFlowChatGPT chatGPTを駆使して、玄関の鍵が閉まっているかどうかを監視するプログラムを作りました。 はじめに 今回の要約 自分はとにかく玄関の鍵を閉め忘れることが多く、家族にも怒られていた Raspberry Piとwebカメラが家にあった 色々調べたところ、機械学習の部分はGoogle Cloud Visionで無料実装できる すでに先駆者のブログは存在する:https://r-kurain.hatenablog.com/entry/2019/10/17/211134 ある程度ライブラリが古い部分や、多少わかるOpenCVへのリライトについては、ChatGPTにすべて任せれば実装できるのではないか ある程度構想

                                                                                ChatGPTを駆使して、Raspberry PiとTensorflowを使ってドア監視をできるようにした - Qiita
                                                                              • このSRE本がすごい!2024年版 - じゃあ、おうちで学べる

                                                                                はじめに 有用な知識の特性 Google SRE リソース Site Reliability Engineering: How Google Runs Production Systems The Site Reliability Workbook: Practical Ways to Implement SRE Building Secure and Reliable Systems: Best Practices for Designing, Implementing, and Maintaining Systems SLO Adoption and Usage in SRE Creating a Production Launch Plan Training Site Reliability Engineers: What Your Organization Needs to Cre

                                                                                  このSRE本がすごい!2024年版 - じゃあ、おうちで学べる
                                                                                • ぷらっとホーム、大規模システム向けSyslogサーバーアプライアンス「EasyBlocks Syslog ProLine」を発表

                                                                                    ぷらっとホーム、大規模システム向けSyslogサーバーアプライアンス「EasyBlocks Syslog ProLine」を発表