並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 47件

新着順 人気順

モニタリングの検索結果1 - 40 件 / 47件

モニタリングに関するエントリは47件あります。 監視運用aws などが関連タグです。 人気エントリには 『ネイチャー誌が糾弾~日本発最悪の研究不正が暴く日本の大学の「不備」(榎木英介) - エキスパート - Yahoo!ニュース』などがあります。
  • ネイチャー誌が糾弾~日本発最悪の研究不正が暴く日本の大学の「不備」(榎木英介) - エキスパート - Yahoo!ニュース

    サイエンス誌に続きネイチャー誌が… 世界中の科学者が読む雑誌が二つある。アメリカのサイエンス誌と、イギリスのネイチャー誌だ。どちらも様々な分野の科学論文を掲載すると同時に、世界中の科学に関するニュースを取り上げるという特徴がある。 その二大巨頭が、日本の研究者が起こした同じ研究不正の事例を大きく取り上げた。 What universities can learn from one of science’s biggest frauds その事例は史上最悪の一つとも言われる。 それってあのSTAP細胞事件?と思ったあなた。まったく間違っている。 STAP細胞事件など比べ物にならないほど大きな事件を、日本人研究者が起こしていたのだ。それが、元弘前大学の教授だった故S氏がおこした事件だ。 サイエンス誌があぶり出す「医学研究不正大国」ニッポンなぜ最悪なのか その事件が最悪と呼ばれるには理由がある。

      ネイチャー誌が糾弾~日本発最悪の研究不正が暴く日本の大学の「不備」(榎木英介) - エキスパート - Yahoo!ニュース
    • ~スタートアップの人たちに捧ぐ~ 監視再入門 in AWS

      https://aws-startup-community.connpass.com/event/241721/ 2022/05/10(火) 19:30 〜 21:30 「スタートアップ事例祭り 〜監視・モニタリング・セキュリティ編〜」

        ~スタートアップの人たちに捧ぐ~ 監視再入門 in AWS
      • 監視について思うとこ - y-ohgi's blog

        TL;DR 監視はユーザーにサービスを提供できているかを観測するための行為 SLI/SLOを定めて、SLOを守れるようにモニタリングする ダッシュボードは定常的に表示しておくものと障害時に活用するものを作ると良い アラートはレベル分けして人間が対応しなければならないものだけ人間へ通知する 監視とは サービスを健全に動作させ続けるために監視を行います。 「健全に動作している」の定義はサービスによって異なり、ユーザーにWebページを見せることができることだったり、バッチが正常に終了することだったりします。 最終的にユーザーに正常にサービスを提供できていることを観測するために行うことに変わりはありません。 さてユーザーにサービスを提供するために何を監視しましょうか? クラウド前提であれば個人的にリソースベース(CPU/Memory)より、 SLI/SLOをベース に監視する事が望ましいと考えてい

          監視について思うとこ - y-ohgi's blog
        • 「入門 監視」を読んでからの取り組みを紹介します - WILLGATE TECH BLOG

          「入門 監視」を読んだ フロントエンド監視 なぜフロントエンド監視が必要なのか どうやってフロントエンド監視をしているのか Runbookを作ろう なぜRunbookが必要なのか Runbookをどう使っていくか 監視の民主化 勉強会開催 今後 こんにちは!インフラチームの小林です。 今回はインフラチームが現在取り組んでいる、運用環境の改善施策を紹介します。 「入門 監視」を読んだ 2019年01月 に「入門 監視」という本が O'Reilly Japanから出版されました。 www.oreilly.co.jp 『システムをどう監視したらよいのか』『監視の仕組みをどう作ったらよいのか』について紹介している本です。 実践したい事、反省する事だらけですが、フロントエンド監視とRunbook作成から始めています。 フロントエンド監視 なぜフロントエンド監視が必要なのか Webサイトの表示スピード

            「入門 監視」を読んでからの取り組みを紹介します - WILLGATE TECH BLOG
          • Amazon SES でメール送信するときのベストプラクティスまとめ(2020年10月) | DevelopersIO

            Amazon SES API についての補足の説明です。 From, To, Subject, Body のみ指定すれば、残りはすべて AmazonSES が適切にフォーマットした Eメールメッセージで簡単にメール送信できるのが SendEmail API です。 添付ファイルを使うなど、独自に細かく制御したフォーマットにカスタマイズしてメール送信をしたい場合は SendRawEmail API を利用します。 基本となるテンプレートメールを作成して、テンプレート内の変数に対してパーソナライズされた値に置換した内容で Eメールメッセージを送信できるのが SendTemplatedEmail および SendBulkTemplatedEmail のAPIです。 詳細については、AmazonSESのEメール送信方法 を確認下さい。 SESのSMTPエンドポイントを使ったメール送信例は下記ブログ

              Amazon SES でメール送信するときのベストプラクティスまとめ(2020年10月) | DevelopersIO
            • 「隠れ陽性」市中で増加 ワクチン2回接種後に感染も - 日本経済新聞

              新型コロナウイルスの感染に気づかず、社会生活を送る「隠れ陽性」が増えている。東京都が繁華街などで行う無料検査で直近の数値が7月上旬の12倍まで上昇した。行政検査が追いつかず、民間検査の活用も進んでいないことが背景にある。ワクチン接種完了後に感染する「ブレークスルー感染」もあり、無症状者の把握は不可欠。経済の正常化に向け、検査体制の拡充とワクチン接種を両輪で進めることが求められる。「検査を迅速に

                「隠れ陽性」市中で増加 ワクチン2回接種後に感染も - 日本経済新聞
              • コンテナ運用のベスト プラクティス  |  Cloud アーキテクチャ センター  |  Google Cloud

                デジタル トランスフォーメーションを加速 お客様がデジタル トランスフォーメーションに乗り出したばかりでも、あるいはすでに進めている場合でも、Google Cloud は困難な課題の解決を支援します。

                  コンテナ運用のベスト プラクティス  |  Cloud アーキテクチャ センター  |  Google Cloud
                • 東京都のモニタリング検査、コロナ陽性率が2ヶ月で18倍に…感染気付かず出歩く人が急増:東京新聞 TOKYO Web

                  東京都が繁華街などで実施する新型コロナウイルスのモニタリング検査で、陽性率が右肩上がりになっている。7月初旬と比べ陽性率は約18倍になり、街を出歩く無症状者が急増。都内の新規感染者は横ばいだが、実際にはもっと多いとみられる。都内の感染状況について専門家は「制御不能な状況は続いている。全体の数を追えていない可能性を考えなければいけない」と指摘している。(デジタル編集部)

                    東京都のモニタリング検査、コロナ陽性率が2ヶ月で18倍に…感染気付かず出歩く人が急増:東京新聞 TOKYO Web
                  • AWSのコストモニタリングの知見をシェアしたい - Uzabase for Engineers

                    NewsPicksの高山です。 今回は、AWSのコストを我々がどのように定点観測しているかを書いていきます。 あわよくば他社さんも事例を広く共有してもらえて業界全体の共有知が増えることに繋がってほしい狙いがあります。 NewsPicksでは過去2年ぐらいかけて地道にコストモニタリングのオペレーションを作ってきました。手法としては、毎週コストモニタリング担当のメンバーで定例ミーティングをして、以下の手順をやりながら議事録にまとめていきます。 毎週のオペレーション コスト異常検出 Savings Plansの購入 DynamoDBのReserved Capacityの購入 毎月のオペレーション 請求書CSVの取り込み Cost & Usage ReportとQuickSight たまにやるオペレーション Reserved Instanceの購入 規模の適正化に関する推奨事項 Trusted A

                      AWSのコストモニタリングの知見をシェアしたい - Uzabase for Engineers
                    • 「AWS Lambda Extensions」発表。AWS Lambdaにモニタリング用エージェントなどが組み込めるように

                      「AWS Lambda Extensions」発表。AWS Lambdaにモニタリング用エージェントなどが組み込めるように Amazon Web Services(AWS)は、サーバレスコンピューティング基盤を提供する「AWS Lambda」の新機能「AWS Lambda Extensions」を発表しました。 New #AWSLaunches! Amazon Inspector has expanded operating system support for Red Hat Enterprise Linux (RHEL) 8, Ubuntu 20.04 LTS, Debian 10 & Windows Server 2019 AWS Lambda Extensions: a new way to integrate Lambda with operational tools (in p

                        「AWS Lambda Extensions」発表。AWS Lambdaにモニタリング用エージェントなどが組み込めるように
                      • ざっくり理解するSRE - Qiita

                        昨今では自社のプロダクトやシステムのエンゲージメント向上のために、「DevOps」や「アジャイル」といったキーワードのもと、大小さまざまな企業がシステムやアプリの開発手法の改善を試みています。その中において、最近だと「SRE」というキーワードを聞く頻度も多くなってきたかと思います。 しかしアジャイルやCICDなどと比べ、SREについては「言葉は知ってるけど具体的になんなのかはよくわからない」という方もいるのではないでしょうか?ここではそんな方々向けに、SREの最初の一歩となる概要について、独自の解釈を交えつつまとめていきます。 ここで話すこと SREって何? なぜSREが必要? SREってどんなことするの? ここで話さないこと SREの技術の具体的なところ(k8sやAPMの導入手順、設定方法など) プラクティスの実践例・具体例(アーキテクチャ、各種設定値、モニタリング指標など) TL;DR

                          ざっくり理解するSRE - Qiita
                        • 【書評】「AWS を使って学ぶ 監視設計」 #技術書典 | DevelopersIO

                          技術書典 にて頒布予定だった 「AWS を使って学ぶ 監視設計」 をご紹介します! とても良い内容でした!! 園部です。 残念ながら現地開催はされなかった 技術書典8 で頒布予定だった 「AWS を使って学ぶ 監視設計」 を電子版で購入し読みました! とても良かったので、紹介させていただきたいと思います。 概要 (上記販売ページより引用) この本について 主に監視の設計手法を紹介する本です。 この本では、「モニタリング(監視)」 というテーマについて、CloudWatchを中心にAWSの各サービスを見ながら、どのように監視を設計していくかを著者の経験を基に説明していきます。 私自身、ここ数年で開発メンバー、リーダー、テックリードといくつかの立場を経験しましたが、どの立場にいてもシステム開発に携わる以上、監視というのは重要な要素になってきます。特にここ数年はSLI/SLOを導入するなど、監視

                            【書評】「AWS を使って学ぶ 監視設計」 #技術書典 | DevelopersIO
                          • 処理水のモニタリング、実態は? 分析強化で異常をいち早く検知 | 毎日新聞

                            東京電力福島第1原発からの処理水の海洋放出を巡っては、SNS上で「トリチウム以外の放射性物質を測定していない」との投稿もみられる。実際はどうなのだろうか。 東京電力や環境省、水産庁が実施している従来のモニタリングは、福島第1原発の周辺で採取した海水や魚から、トリチウム以外の放射性物質も測っている。対象はセシウムやストロンチウムなど数種類だ。ただし、試料に含まれるごくわずかな放射性物質の量を正確に測るため、結果が出るのに1カ月前後かかる。 このため放出開始を見越し、各機関は2022年度から、トリチウムのみを対象にしたモニタリングを新たに加え、地点や頻度を増やした。迅速な分析を優先し、水質に異常がないかいち早く検知するためだ。

                              処理水のモニタリング、実態は? 分析強化で異常をいち早く検知 | 毎日新聞
                            • 「ダッシュボード」は「設計」「構築」などと同じくらい重要である Amazonのダッシュボード活用のポイント2つ

                              技術記事『Amazon Builders' Library』にフォーカスを当てた勉強会「AWS Tech talk Night#5 クラウドネイティブ時代のエンジニアが押さえておきたい ソフトウェアの構築・運用で考慮すべき5つのポイント 〜AWSプリンシパルエンジニアの技術記事をソリューションアーキテクトが解説〜」。ここで、ソリューションアーキテクトの吉澤氏が登壇。まずはAmazonがダッシュボードを重要視している理由と、実際の活用のポイントについて話します。 吉澤氏の自己紹介 吉澤巧氏(以下、吉澤):それでは「Amazonにおけるダッシュボードのベストプラクティス」というタイトルで、アマゾンウェブサービスジャパン、ソリューションアーキテクトの吉澤からお話しします。 まずは簡単に自己紹介です。私は2022年に新卒で入社した吉澤といいます。現在はソリューションアーキテクトというポジションで働

                                「ダッシュボード」は「設計」「構築」などと同じくらい重要である Amazonのダッシュボード活用のポイント2つ
                              • Observabilityをはじめよう!(前編) 〜Observabilityの背景と構成要素〜 | さくらのナレッジ

                                はじめに 仲亀と申します。さくらインターネットでエバンジェリストやインフラエンジニアをしています。エンジニアとしてはシステムの監視まわりの仕事をしています。最近は、今回もご紹介するPrometheusとかGrafana Lokiとか、あの辺が結構好きで触っています。 この記事では、監視について興味をお持ちの皆さんに向けて「Observabilityをはじめよう!」ということで、Observabilityの概念や、それが必要となる背景を少し説明した上で、Observabilityを実現するための要素となる、MetricsやLogsやTracesなどをどこから始めていけばいいんだろう、といったところをご紹介していこうと思います。 この記事のゴールとしては、皆さんに「Observability完全に理解した」と言っていただけたらいいかなと思っています。しかし、この記事を読んだだけですぐに皆さんの

                                  Observabilityをはじめよう!(前編) 〜Observabilityの背景と構成要素〜 | さくらのナレッジ
                                • レガシーなアプリケーションの監視を改善するため最初にやったこと - DMM inside

                                  Dagger Go SDK vs Shell in GitHub Actions ~ モノレポのCIの実装をGoで実装するまでの道のり ~

                                    レガシーなアプリケーションの監視を改善するため最初にやったこと - DMM inside
                                  • あのサービスの監視・オブザーバビリティ アーキテクチャ選定【前編】 - Findy Tools

                                    公開日 2024/01/23更新日 2024/02/15あのサービスの監視・オブザーバビリティ アーキテクチャ選定【前編】 ユーザーや顧客へ信頼性を担保した価値提供をしていく中で、監視・オブザーバビリティの取り組みは非常に重要です。 今回の特集記事では、合同会社DMM.com、株式会社MIXI、株式会社マネーフォワード、パイオニア株式会社、Sansan株式会社、株式会社ZOZOの6社の各サービスを支える監視・オブザーバビリティの仕組みとして各社がどのようなアーキテクチャを組んでいるのか、またそのアーキテクチャにしている背景や意図についてお伺いしました。 自社に近いアーキテクチャやどのようにツールを活用しているかについて、実際の事例を元に参考になれば幸いです。 なお、後編も近いうちに公開させていただきますのでお楽しみに。 合同会社DMM.com(DMMブックス) アーキテクチャ設計の背景・意

                                      あのサービスの監視・オブザーバビリティ アーキテクチャ選定【前編】 - Findy Tools
                                    • 都の街中PCR、予兆つかめず コロナ「第5波」

                                      新型コロナウイルスの感染拡大の予兆をつかむため、東京都が実施するモニタリング検査で「第5波」の爆発的な感染拡大を捕捉できなかったことが明らかになり、検査の在り方が問われている。6、7月の1週間ごとの検査数は約2万4千~6千件で、陽性者の確認も最大20人程度にとどまる。専門家は「東京の人口規模を考えると検査数が少なく、予兆の把握という目的は現実的ではない」と指摘し、感染対策としての有効性に疑問を投げかける。 都は4月以降、有症状者らの感染を確認する行政検査とは別に、国と連携して繁華街などで無症状者のPCR検査を続けている。都の公表データによると、週ごとの検査件数と陽性者数から算出した陽性率は、7月第1週が0・05%で、その後0・10%、0・14%、0・27%と上昇。ただ、行政検査の新規感染者数や陽性率も同様に増加し、都の担当者は「モニタリング検査に、顕著な傾向は確認できなかった」と分析する。

                                        都の街中PCR、予兆つかめず コロナ「第5波」
                                      • お客さま影響に基づく実践的なアラート方法 | メルカリエンジニアリング

                                        この記事は、Merpay Advent Calendar 2021の16日目の記事です。 こんにちは、メルペイSREチームのfoostanです。普段はキーボードのことばかり話していますが、本業ではSREチームの一員としてソフトウェアエンジニアリングをしたりEM(Engineering Manager)をしています。 SREチームの重要な役割の一つはサービスの信頼性を高め、当たり前のようにメルペイを使えるようにすることです。信頼性を高めるためにはサービスが止まらないようなシステム構成にすることが重要ですが、サービスが異常な状態になったとき、関係者に状況を知らせるためのアラートを適切に上げることも重要です。そこで本記事ではお客さま影響に基づく実践的なアラート方法についてご紹介します。 適切なアラートとはなにか まずはどのようにアラートを上げるのが適切か考えてみます。アラートを上げる目的のひとつ

                                          お客さま影響に基づく実践的なアラート方法 | メルカリエンジニアリング
                                        • システムの価値を維持・向上させるために必要な“監視” 5つのありがちなアンチパターンとベストプラクティス

                                          人・カネ・ものの足りないスタートアップにおいて、どのように工夫しているか発信する「スタートアップ事例祭り ~監視・モニタリング・セキュリティ編~」。ここではまーん氏が「スタートアップの人たちに捧ぐ監視再入門 in AWS」をテーマに登壇。まずは、そもそも監視をする意味から、監視のアンチパターンを紹介します。 自己紹介 はまーん氏(以下、はまーん):監視ってまぁ面倒くさいですよね。「メトリクスとログ集めてるだけです」「無視してるアラートが実はいっぱいあるんです」「なんで監視してるんだっけ」。こんなことを思ったことないでしょうか。僕は昔、思ったことがあります。 僕のほうからは、今日の事例祭り始めるに当たってのイントロダクションというか。「システム監視ってなんだっけ」を考えて、AWS上で小さく、そして的確に監視を始めるためのスタートラインに立てるようなお話をします。 はじめましての方ははじめまし

                                            システムの価値を維持・向上させるために必要な“監視” 5つのありがちなアンチパターンとベストプラクティス
                                          • Monitoring as Code for Kubernetes

                                            この記事は? この記事は、リクルートライフスタイル Advent Calendar 2019 の16日目の記事です! 自分が所属している CETチーム で、Kubernetes を中心としたアーキテクチャにおける Monitoring as Code を実現した監視基盤の紹介をしたいと思います。 自分の所属するチームでは、バッチ基盤や API 基盤を GKE 上に構築しています。 この記事では、Terraform・Grafana・Prometheus・Jsonnet を利用して、Kubernetes のリソース監視・Job の実行状態・API レイテンシのモニタリング・外形監視などを改善したアーキテクチャやフローを紹介したいと思います。 Who am I ? @ko-da-k (Twitter: @ko_da_k) です。新卒2年目で、1年目は主にデータ解析やモデリング等を行っており、現在

                                              Monitoring as Code for Kubernetes
                                            • 第605回 Samplerでターミナルをダッシュボードにする | gihyo.jp

                                              Samplerとは 最近のWebアプリの多くには、「⁠ダッシュボード」と呼ばれるUIが用意されています。ダッシュボードとは本来、車の計器盤を指す言葉です。車のダッシュボードにはスピードメーターやタコメーター、燃料計、水温計などが配置されており、ドライバーが車の状態を瞬時に把握できるようになっています。 Webアプリにおけるダッシュボードも車のそれと同じで、現状のデータを可視化するためのツールです。ダッシュボードには様々なウィジェットやメトリクスが配置されており、サービスの状態を俯瞰できるように構成されています。また本当に必要とする情報だけを集約できるよう、ダッシュボードはユーザーが自由にカスタマイズできるのが一般的です。 図1 サーバーモニタリングサービス「Datadog」のKubernetes Dashboardの例。クラスターを構成するノードや稼働中のコンテナ、CPUやメモリの負荷など

                                                第605回 Samplerでターミナルをダッシュボードにする | gihyo.jp
                                              • Observabilityをはじめよう!(後編) 〜Metrics/Logs/Tracesチュートリアル〜 | さくらのナレッジ

                                                  Observabilityをはじめよう!(後編) 〜Metrics/Logs/Tracesチュートリアル〜 | さくらのナレッジ
                                                • 過去事例から見るモニタリングの大切さ #techfeed_live

                                                  どんなに著名なOSSであっても、利用法によってはパフォーマンスチューニングが必要になる場面が存在します。 今回は過去に体験した事例から、モニタリングの大切さについてご紹介します。 Talked by TechFeed Experts Night#20 〜 Webパフォーマンス・チューニング最前線 : 前編(概要、モニタリング、負荷テスト編)

                                                    過去事例から見るモニタリングの大切さ #techfeed_live
                                                  • 入門 継続的プロファイリング 〜Kubernetesにおけるオブザーバビリティの最前線〜 | gihyo.jp

                                                    こんにちは。サイバーエージェントの杉浦です。 連載「5分でわかる!Kubernetes/CloudNative Topics」の第6回は、オブザーバビリティに注目して、Kubernetesにおける継続的プロファイリングについて取り上げます。 オブザーバビリティとプロファイル 安定してサービスを提供するためには、デプロイしたアプリケーションの状態を継続的に観測し、不具合やその予兆を察知・対処していく必要があります。 アプリケーションの状態を観測する能力をオブザーバビリティ(Observability[1])といいます。このオブザーバビリティを確保するにあたってどのようなデータを用意すべきか、従来ではメトリクス・トレース・ログの3つを柱とすべきだとされていました。 それぞれメトリクスはCPU使用率やメモリ使用量といった時系列の数値データ、トレースは個々のアプリケーションを伝播する特定のリクエス

                                                      入門 継続的プロファイリング 〜Kubernetesにおけるオブザーバビリティの最前線〜 | gihyo.jp
                                                    • VictoriaMetrics と Grafana による Kubernetes クラスタのモニタリング - Cybozu Inside Out | サイボウズエンジニアのブログ

                                                      こんにちは。 Necoチームの梅澤です。 従前、Neco ではクラスタのモニタリングに Prometheus を利用していましたが、最近これを VictoriaMetrics + VictoriaMetrics operator に変更しました。 本記事では、Prometheus で感じていた問題点と、それをどのように解決したかを紹介します。 感じていた問題点 我々が(オペレーターを利用しない) Prometheus で問題を感じていたのは以下の点になります。 メトリクスの長期保存 Neco では元々14日間ぶんを保存していました。しかし、過去のメトリクスは障害の継続的な調査にも有用であり、14日間では物足りなく感じていました。一方、 Prometheus はストレージの構造として長期保存をあまり想定していません。 https://prometheus.io/docs/prometheus

                                                        VictoriaMetrics と Grafana による Kubernetes クラスタのモニタリング - Cybozu Inside Out | サイボウズエンジニアのブログ
                                                      • [Prometheus Meetup#3] Victoria Metricsで作りあげる大規模・超負荷システムモニタリング基盤 / Monitoring Platform With Victoria Metrics

                                                        [Prometheus Meetup#3] Victoria Metricsで作りあげる大規模・超負荷システムモニタリング基盤 / Monitoring Platform With Victoria Metrics

                                                          [Prometheus Meetup#3] Victoria Metricsで作りあげる大規模・超負荷システムモニタリング基盤 / Monitoring Platform With Victoria Metrics
                                                        • CloudWatch Logs を文字列検知してログ内容をメールを送信してみた サブスクリプションフィルター版 | DevelopersIO

                                                          こんにちは。 ご機嫌いかがでしょうか。 "No human labor is no human error" が大好きな吉井 亮です。 アプリケーションや OS のログファイルから特定の文字列をマッチし メール等で担当者へ通知する運用はクラウドにおいても必要です。 今回は CloudWatch Logs に出力しているログファイルから サブスクリプションを使用して特定文字列マッチを行い、SNS で通知する方法を試してみます。 2021年4月13日 更新 Lambda 関数の Python コードを修正しました。 以前のコードですと複数回イベントが発生した際に初回イベントしか通知されないと問題がありました。 ループ処理を加えることより複数回のイベントを取得できるように修正しました。 以前のコードをご利用頂いている方は大変お手数ですがコード修正をお願いします。 構成 ログの流れは以下の通りです

                                                            CloudWatch Logs を文字列検知してログ内容をメールを送信してみた サブスクリプションフィルター版 | DevelopersIO
                                                          • AWS 監視のための主要なメトリクス

                                                            DiskReadBytes と DiskWriteBytes このメトリクスの組み合わせは、EC2 インスタンスに接続されているインスタンスストア(「エフェメラル」)のボリュームに対して読み書きされるバイト数を計測します。これらのメトリクスには、C5 および M5 インスタンスタイプに接続されているすべての EBS ボリュームの I / O データも含まれます。他のインスタンスタイプの場合は、EBS から直接ディスク I / O メトリクスにアクセスする必要があります。このメトリクスを監視すると、アプリケーションレベルの問題を特定できるようになります。たとえば、大量のデータが常にディスクから読み取られていることがわかった場合、キャッシュレイヤーを追加してアプリケーションのパフォーマンスを向上できます。 StatusCheck Failed CloudWatch は、1 分間に 2 回ステー

                                                              AWS 監視のための主要なメトリクス
                                                            • [アップデート] IAM ユーザー不要!Amazon CloudWatch ダッシュボードが共有可能になりました! | DevelopersIO

                                                              本日のアップデートで Amazon CloudWatch のダッシュボードが共有可能になりました。 Amazon CloudWatch Dashboards now supports sharing Cloudwatch ダッシュボードを共有できるメリット ちょっと使いの IAM ユーザー管理からの開放 CloudWatch ダッシュボードは頻繁に確認するメトリクスや、関連性のあるメトリクスをまとめて表示させておくことで安定運用の確認、および障害時の問題切り分け調査を効率化することが出来ます。 従来、このダッシュボードは CloudWatch コンソールへのアクセス権限がなければ確認することが出来ませんでした。つまり CloudWatch にモニタリングを集約するということは、参照するメンバーすべてに IAM ユーザーまたは IAM ロールなどを払い出し管理する必要がありました。 利用する

                                                                [アップデート] IAM ユーザー不要!Amazon CloudWatch ダッシュボードが共有可能になりました! | DevelopersIO
                                                              • AWSを使って学ぶ 監視設計 - tenbo07 - BOOTH

                                                                2020年2月29日(土)の技術書典8で頒布予定だった「AWSを使って学ぶ 監視設計」になります。 ■サークル「チームになったササキです」 https://techbookfest.org/event/tbf08/circle/5768511573983232 残念ながら技術書典8は中止となってしまいましたが、こちらで販売します。 もう少し詳細な内容について、こちらのブログに記載しています。 お時間あればご確認ください http://tenbo07.hatenablog.com/entry/2020/03/07/004743 ■サンプルコードについて 以下で公開しています https://github.com/tenbo07/monitoring-design-book-samples この本について主に監視の設計手法を紹介する本です。 この本では、「モニタリング(監視)」 というテーマに

                                                                  AWSを使って学ぶ 監視設計 - tenbo07 - BOOTH
                                                                • 負荷制限を使用して過負荷を回避する

                                                                  私は、数年間 Amazon のサービスフレームワークチームで働いた経験があります。私たちのチームは、Amazon Route 53 や Elastic Load Balancing などの AWS のサービスの所有者がより迅速にサービスを構築するのに役立つツールを作成し、サービスクライアントはそれらのサービスをより簡単に呼び出せるようになりました。他の Amazon チームは、測定、認証、モニタリング、クライアントライブラリ生成、ドキュメント生成などの機能をサービス所有者に提供しました。各サービスチームがそれらの機能をサービスに手動で統合する代わりに、サービスフレームワークチームは 1 回統合を行い、設定を通じて各サービスに機能を公開しました。 私たちが直面した課題の 1 つは、特にパフォーマンスまたは可用性に関連する機能に対して、適切なデフォルトを提供する方法を決めることでした。たとえば

                                                                    負荷制限を使用して過負荷を回避する
                                                                  • Serverless時代のシステム監視、ノイズ通知だらけな日々を経験しての反省点 - ZOZO TECH BLOG

                                                                    はじめに こんにちは。ZOZOテクノロジーズBtoB開発部の三好です。 今回はServerlessなシステムの監視、保守、運用を行う中で、これまでやってきたことや、その反省点などを紹介します。マネージドサービスでの開発・運用で同じ苦悩をされている、もしくはこれからマネージドサービスを利用して構築する方々の参考になれば幸いです。 サービス紹介 私の所属するBtoB開発部は、Fulfillment by ZOZO(以下FBZ)を提供しています。FBZはZOZOBASEと自社EC、店舗の在庫を一元化し、在庫切れの無い世界を実現するためのサービスです。 その中で、ZOZOBASEと自社ECをつなげるためのデータ連携API開発を担っています。 なぜ監視をするのか 私たちは、日々APIが正常に稼働しているか、不正なデータが発生していないかを監視してます。マネージドなサービスを使って、Serverles

                                                                      Serverless時代のシステム監視、ノイズ通知だらけな日々を経験しての反省点 - ZOZO TECH BLOG
                                                                    • 【開催報告 & 資料公開】AWS 秋の Observability 祭り | Amazon Web Services

                                                                      Amazon Web Services ブログ 【開催報告 & 資料公開】AWS 秋の Observability 祭り こんにちは。ソリューションアーキテクト (以下 SA) の高野です。 2023 年 9 月 22 日に「AWS 秋の Observability 祭り」と題したイベントを開催しました。昨今システムを運用する上で重要となってきている Observability をテーマにしたイベントです。ご参加いただきました皆様には、改めて御礼申し上げます。 当日の様子と実施内容 AWS から Amazon CloudWatch をはじめとする Observability 関連サービスの最新アップデートやベストプラクティス、Observability のコード化のメリットをお伝えするとともに、実際に AWS 上のシステムを運用されているお客様 (株式会社 NTTドコモ様、株式会社デイトナ

                                                                        【開催報告 & 資料公開】AWS 秋の Observability 祭り | Amazon Web Services
                                                                      • 【書評】オブザーバビリティ・エンジニアリング | DevelopersIO

                                                                        (吉井)従来のモニタリングを否定するものではなく、システムの複雑さや規模が増していくことでモニタリングの限界が現れ始め、オブザーバビリティという新しいアプローチが誕生したものと理解しました。 クラウドネイティブによってもたらされる新しい運用コストが、従来の運用作業習慣では処理できないと気付いた結果が、オブザーバビリティだとも言えます。 第Ⅱ部 オブザーバビリティの基礎 第Ⅱ部は、技術的な側面からオブザーバビリティの必要性を解説しています。 構造化イベントを使う システムがどのような状態にあっても、あらゆる質問に答え、データを任意かつ詳細に繰り返し分析でき、完全な抽象度で収集するため 構成要素としてのメトリクスの限界 メトリクスは事前に集計された測定値 あるサービスへの1つのリクエストは、複数のメトリクスで表現される可能性がある 構成要素としての従来のログの限界 非構造化ログは人間には読みや

                                                                          【書評】オブザーバビリティ・エンジニアリング | DevelopersIO
                                                                        • でかすぎる制限速度標識 - ねこブリアンの日常

                                                                          今回の記事は、 超短い(^_^;) 道路走行中のこと。 んん? 標識でかくないか(=゚ω゚=;)? でかいよねΣ(゚Д゚;)? いったい何があったのか・・?! 注:道路交通法では「最高速度」と呼ぶみたいです。 car-me.jp

                                                                            でかすぎる制限速度標識 - ねこブリアンの日常
                                                                          • MLOpsを支えるヤフー独自のモデルモニタリングサービス

                                                                            ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーのAIプラットフォームの開発と運用を担当している黒松です。 ヤフーではオンプレミスにあるKubernetesの上に全社で利用可能なAIプラットフォームを構築しています。昨年8月に公開した「ヤフーのAIプラットフォーム紹介 〜 AI開発をより手軽に」ではヤフーのAIプラットフォームの全体概要をご紹介しました。ここではその続編として、ブログの最後に触れたモデルモニタリングツールであるDronachをご紹介します。 Dronachはヤフーで内製したモデルモニタリングツールです。YAMLフォーマットで特徴量のデータセットを指定するだけで定期的なデータドリフトの検知と統計情報の集計、結果を確認するダッシュボードの構築、アラ

                                                                              MLOpsを支えるヤフー独自のモデルモニタリングサービス
                                                                            • 中部電力のカテエネ、サービスの改悪 - You Tubeをもっと活用しよう

                                                                              前日の発電量を見ることができた カテエネですが 4月からは検針日更新になったので 台風が来た次の日など発電量が極端な変化の有無 パネル異常の簡易的なオンラインでのチェックができなくなりました エコメガネなど導入してまで監視するメリットはない 運転0円でも10万円弱かけるなら www.hawksystem.jp 定期的な現地の確認と 一ヶ月単位のオンライン監視でもよいかな

                                                                                中部電力のカテエネ、サービスの改悪 - You Tubeをもっと活用しよう
                                                                              • [レポート] 冗長化、永続化、ログ… Prometheus を拡張するエコシステムについて Meetup で聞いてきた #prometheustokyo | DevelopersIO

                                                                                はじめに 1/15、今回で 3 回目となる Prometheus Meetup Tokyo が開催されたため参加してきました。 今回のテーマは「Prometheus を取り巻くエコシステム達」ということで、Thanos や Victoria Metrics、Grafana Loki など、Prometheus の機能を拡張するソリューションやその事例について熱いプレゼンテーションが行われました。 会場は東京・田町駅から徒歩圏内にある、 NTT ソフトウェアイノベーションセンタさまのイベントスペースでした。こちらの会場は OSS に関する非営利イベントであれば貸し出せるとのことです。 「Prometheus Meetup Tokyo」の会場準備完了!あとはみなさんが来るのを待つだけ!今日は、Prometheus のエコシステム回なので楽しみ?https://t.co/M8WOgemcRO #

                                                                                  [レポート] 冗長化、永続化、ログ… Prometheus を拡張するエコシステムについて Meetup で聞いてきた #prometheustokyo | DevelopersIO
                                                                                • EKS環境をsysdigでモニタリングしてみた(モニタリング編) | DevelopersIO

                                                                                  また、Sysdig Spotlightを使うと、特定領域ミドルウェアのサマリーを自動的に抽出できます。左下にあるメニューの[Sysdig Spotlight]をクリック。 すると、[Sysdig Monitor Spotlight]画面が表示されます。 すでにインテグレートされているものもありますが、[Manage Your Integrations]をクリックすると、追加できるインテグレーションが複数表示されるので、アプリ特性に合わせて選択すると、それようのビューを取得することができます。 Explore(インフラ全体のメトリクスの表示) Exploreはメトリクス収集のメイン画面です。かなりいろんな角度から分析、収集ができるっぽいのですが、機能がかなり豊富なため最初はちょっととっつきにくいかもしれません。順を追って説明していきます。 Data Sourceの選択 左上のここをクリックす

                                                                                    EKS環境をsysdigでモニタリングしてみた(モニタリング編) | DevelopersIO

                                                                                  新着記事