タグ

システム運用に関するmedihenのブックマーク (5)

  • Googleでもやっている障害対応訓練の「Wheel of Misfortune」をやってみた。 - MonotaRO Tech Blog

    序文 こんにちは。MonotaROの伊藤です。 弊社では障害対応訓練の実施手法の一つであるWheel of Misfortune(略称:WoM)を実践しています。WoMの導入で、障害対応体制の強化を行うことができましたので、実施までの経緯や得られた学びなどを中心に紹介したいと思います 序文 運用担当者の負荷が高まり続ける問題 運用担当者=社歴が長いベテランエンジニア 運用のスケールアウト 障害対応訓練をやってみよう 訓練環境の準備の問題 訓練シナリオの問題 外部からの助け Wheel of Misfortuneとは 実施時の様子 シナリオ開始時の様子 モニタリング画面の表示 WoMとDiRT(Disaster in Recovery Training) 障害対応訓練をやってみた結果 準備時点で感じたメリット 手順書の不備を発見できたこと 障害が起こりかねない場所を考えるきっかけになったこと

    Googleでもやっている障害対応訓練の「Wheel of Misfortune」をやってみた。 - MonotaRO Tech Blog
    medihen
    medihen 2022/09/06
    "過去の障害事例を元にシナリオを作成し、テーブルトークロールプレイングゲームのようにゲームマスターとプレイヤーが紙やドキュメントベースで会話をしながら、発生した障害の解決を目指すロールプレイを行う"
  • 闇のDevOps DevOpsと業績評価 – ところてん – Medium

    ここから、DevとOpsが協力すればより効率的になる=DevOps、という言葉が生まれました。 当時は大企業においてはDevとOpsが分かれていることが当たり前だったのです。そして、大企業における当たり前が、当たり前ではないことに気付き始め、DevOpsを実現するためのツールができ始めたころでもあります。 ではなぜ、大企業ではDevとOpsが分かれているのが当たり前だったのでしょうか? ハードウェアの時代その昔、産業の主役はハードウェアでした。 そのため、多くの企業はハードウェアを作ることに対して最適化が行われました。 ハードウェアには研究開発、製造、運用サポートといった大きな区分けが存在します。そして、それぞれの仕事において要求する人材レベルは異なります。 加えて、大量生産された製品の運用サポート(設置作業員、サポートセンタ)には、大量の人員が必要になってきます。 したがって、組織を研究

    闇のDevOps DevOpsと業績評価 – ところてん – Medium
    medihen
    medihen 2019/12/18
    "Devがプログラミングによって手作業を行っているOpsの仕事を奪えば、より効率的になる"ということなので、"DevOpsとは情報産業の垂直統合"となる。
  • NECが「3分先までの通信速度変化」を見積もれる技術を開発、約8割の精度で予測

    NECは2012年11月26日、インターネットやモバイル通信網など他のユーザーの通信状態や電波状況などによって通信速度(スループット)が時々刻々と変動するネットワークにおいて、現在時刻より先の未来におけるスループットを高い精度で予測できるソフトウエア技術を開発したと発表した。「3分後までのスループットを約80%の高精度で予測可能なことを実証できた」(同社)としている。 同社によれば、通信スループットには「安定的に変動する状態」(定常状態)と「不安定に乱高下する状態」(非定常状態)が複雑に混在することを研究によって解明したという。そこで、時系列データの分析手法の一つである「単位根検定」を用いて、現在のスループット状態が「定常か非定常か」を判別。判別した状態に応じて両モデルを混合し、現在から3分先までのスループットの予測モデル(混合モデル)を作成して利用することで、スループットのリアルタイム高

    NECが「3分先までの通信速度変化」を見積もれる技術を開発、約8割の精度で予測
  • 仮想化されたネットワークの運用は難しい──JANOG25で感じたクラウドの“実際”

    2010年1月21日、22日とJANOG25が開催されました。今回の開催地は新潟です。冬の新潟ということで「雪」を楽しみにいざ出発。前日夜まで予定が入っていたので、夜9時ごろ東京発の新幹線で新潟に向かいました。到着したのは深夜でしたが、地元新潟の方々は温かく迎えてくれました。その日、夜更けまでお供させてもらったのはいうまでもありません。 初日の21日。しんしんと積もった雪を期待して外に出ると、とても温かく、雪なんてどこにもありません。雪ではなく雨が降っていました。しかし、JANOG25の会場では「巨大小林幸子」が歓迎してくれ、私の中でのJANOGの盛り上がりはこの時点で早くも最高潮を迎えました(写真1)。 JANOG25の三つのポイント 2日間にわたるプログラムを全体的に見てみると、いくつかの傾向が見えてきます。 1. IPv4枯渇/IPv6の話題が二つしかなかった IPv4アドレスの残量

    仮想化されたネットワークの運用は難しい──JANOG25で感じたクラウドの“実際”
  • NTTコムのVPN経由でウイルス感染:ITpro

    2009年4月9日,NTTコミュニケーションズ(NTTコム)の「Arcstar IP-VPN」を監視するシステムがウイルスに感染していたことが明らかになった。感染範囲はNTTコムの内部にとどまらず,Arcstar IP-VPNを利用する企業のパソコンまで被害が拡大した。NTTコムのシステム運用の甘さが露呈した格好だ。 Arcstar IP-VPNには,ユーザー企業のルーターを監視する「ルーター監視オプション・サービス」がある。ウイルスに最初に感染したのは,同サービス向けの監視端末である(図1)。 NTTコムが監視端末の感染を知ったのは,2009年4月9日の午前中。Arcstar IP-VPNのユーザー企業から「NTTコム側から不正なパケットが断続的に届いている」との報告があった。この申告に基づきシステムを調査したところ,監視端末のウイルス感染が見付かった。同日13時ごろに全監視端末をネット

    NTTコムのVPN経由でウイルス感染:ITpro
  • 1