先週のある夜のこと。突然NagiosさんからWebサーバのCPU使用率が急増しているとのメールが届きました。 どういうことかと思い、サーバの状態を確認してみるとRailsを動かしているunicornがCPU使用率が100%で張り付いていました。 まあそういうこともあるかなあと最初は軽く考えていて、問題のサーバをリバースプロキシから外して、ログを探してみることに。 ところが、rackのログをみても何も出力されていない。はて?と思いつつstraceでプロセスにアタッチすると、すごい勢いでopen, read, closeを繰り返していました。 と、そうこうしているとまたNagiosからアラートが。同じくCPU使用率が急増しているとの警告。 どうやら問題は一つのサーバでだけ起きていたわけではなくて、たまたま1つのサーバで問題がまとまって起こっていただけのよう。 とりあえず、暴走した子プロセスにS