タグ

インフラに関するbulldraのブックマーク (2)

  • とある大規模インフラの基幹システムなんだけど

    とある大規模インフラの基幹システムなんだけど、納品して以来、誰にも原因が分からない不具合が続いていたのでした。よく品質保証部を通ったなと不思議に思ってるんですがね。 現地で動かしてみないと分からない、って奴かな? 所詮は外注が格安で作ったシステムだからこんなもんなんだろう。しかし、数年もほったらかしにしておく神経がよく分からない。 で、今回、そのシステムの改修で俺が担当プログラマーになったわけだが、組み合わせ試験をしていると、出るんだわ、この現象が。現象を見ていて再現条件を想像。結果、ある条件をそろえると100%再現。復旧させるには、リブートさせるか、ある条件を1秒以内に整えれば復旧する。 なんで「誰にも分からない」のかよく分からない。見てて動作が変だったから、LANアナライザ突っ込んでハンドシェーク見てたら仕様書通りになってねーでやんの。試験したのか?これ。 そこからスタートして、2つの

    とある大規模インフラの基幹システムなんだけど
  • ウェブアプリケーションサーバを複数台構成とか2010年代には流行らない - kazuhoのメモ置き場

    タイトルは煽り入ってますが。 仮に動的ページを生成するのにかかる時間が1秒、そのうちデータベースやmemcached等リモートサーバへの問い合わせ時間を除くいたCPUの処理時間が0.1秒とする。また、ピークのリクエスト処理量は、平均の2倍とする。 そうすると、クアッドコアのアプリケーションサーバで処理できるリクエストは、 4 core * 10 reqs/sec * 86,400 sec/day * 30 day/mon / 2 = 51,840,000 reqs/mon と、約5,000万PV/月を1台で捌けることになる。 CPUが動いている時間は全処理時間の10倍と仮定したわけだから、アプリケーションサーバの最大同時接続数は 4 core * 10 = 40 程度あればいいことになる。実際には、安全係数を2倍かけて 80 とか。リクエストの処理に必要なメモリ量を 100MB とすると、

    ウェブアプリケーションサーバを複数台構成とか2010年代には流行らない - kazuhoのメモ置き場
  • 1