タグ

監視に関するatsuizoのブックマーク (4)

  • あと2時間でElastiCacheのメモリが枯渇!そのときあなたは何をしますか?

    突然ですが... あなたは、あるゲームプロジェクト番リリース2日前にサーバエンジニアとしてJOINしました。いざリリースを迎えたとき、ElastiCacheのメモリが突然危険域を超え、さらにあと2時間で枯渇しそうな状況になりました。 さて、この状況におかれたあなたは何をしますか? はじめに モバイルゲームのシステムは新しいイベントをopenするとトラフィックが2倍、3倍、時には普段の10倍以上来ることがあり、トラフィックの変動が非常に大きい特性があります。 新しいゲームのリリース時はより顕著で、想定以上のトラフィックが来ることもしばしばあります。 この記事は、あるゲームプロジェクト番リリース時に大規模トラフィックが来た際のサーバトラブルを題材に、 どのような観点で問題を切り分けていったのか、トラブルシュートのプロセス どのような準備(負荷テスト)をしていれば防げるのか という話をし

    あと2時間でElastiCacheのメモリが枯渇!そのときあなたは何をしますか?
  • Well-Architected を目指した改善と組織文化への影響 | CyberAgent Developers Blog

    (弊社デザイナーが作ってくれた私の LGTM 画像です) Developers Blog に初登場!クラウドファンディングプラットフォーム Makuake の吉田慶章 ( @kakakakakku ) です.Makuake には約1年前に JOIN しました.JOIN した直後はサーバサイド開発をメインに新機能の開発を担当していましたが,2016年3月頃からウェブオペレーションエンジニアも兼務し,インフラ構成やアーキテクチャの改善をしたり,DevOps 文化の推進をしています. どんなサービスにも「技術的負債(もしくは何かしらの課題)」はあると思います.特に成長期のスタートアップでは,新機能をリリースすることを最優先に開発をする場面も多いですし,またサービスの急激な成長に伴って,今までは問題なく稼働していたアーキテクチャが,突如運用に耐えなくなってしまうこともあります.ある意味で「技術的負

    Well-Architected を目指した改善と組織文化への影響 | CyberAgent Developers Blog
  • Re: ゼロから始める監視設計

    世間では、情報システムの運用・監視の「自動化」というキーワードがもてはやされがちで、各種のツール・プロダクト等が出てくる昨今です。しかし、「自動化」の実態は深い霧のベールに包まれていると感じていませんか。今回は、以下の現場視点でこのベールを脱がしてみたいと思います。 July Tech Festa 2016 発表資料 #jtf2016 平成28年7月24日(日)

    Re: ゼロから始める監視設計
  • OSS運用監視ソフト 注目の10製品徹底比較 2016年版

    OSS運用監視ソフト 注目の10製品徹底比較 2016年版:実際に検証済み!OSS徹底比較(1)運用監視編(1/8 ページ) 運用監視をはじめ、多くの企業が取り入れているOSS(オープンソースソフトウェア)。目的に応じて最適なものを選択し、うまく使いこなせば強力な武器となるが、それができなければかえって手間や混乱の原因にもなりかねない。連載では注目のOSSをピックアップして実際に検証し、基的な優位性、劣位性を明確化した。ぜひOSSを選ぶ際の参考にしてほしい。 2014年9月、「徹底比較! 運用監視を自動化するオープンソースソフトウェア10製品の特徴、メリット・デメリットをひとまとめ」を公開してから1年半が経過している。その間にもシステムの利用規模は拡大を続けており、それとともに肥大化する運用業務の効率化は急務となっている。 「OpenStack」や「Docker」などIaaS/PaaS

    OSS運用監視ソフト 注目の10製品徹底比較 2016年版
  • 1