こんにちは。SREの@_skuwaです。 kurashiru(クラシル)を支えるインフラ作りや、ミドルウェアの開発等をやっています。 今日はdely SREチームが行っている障害対応訓練、APOLLO計画をご紹介します。 SREチームの課題 クラシルは他に類を見ないスピードで成長しているサービスのため、一般的には半年から数年ごとに行わなければいけないような負荷対策を数週間でどんどん行っていく必要があります。 SREとしては非常に高いスキルや経験を要求されますが、それを持ち合わせているSREが市場的にはあまりいないというのが課題でした。 私はdelyに入社した時点ではSREとしてのスキルは持っていませんでしたが、入社して半年程度でSRE業務を行えるまでになりました。 私がSREとして戦えるまでに培ってきたノウハウを元に作った、最速でSREを育てる教育体制がAPOLLO計画です。 APOLLO