タグ

トラブルに関するy-mat2006のブックマーク (69)

  • ファーストサーバーに不足していたもの、僕に不足していたもの - Takasの日記

    ※とても長いので注意。 2012年6月20日17時に発生したファーストサーバーの障害。レンタルサーバーとして貸し出しをされていたネット上の世界は、瞬時に文字通り無に帰しました。被害にあった5,000余ユーザの頼みの綱だったバックアップも含め、すべて。 実は、この記事を書く事を少し躊躇っています。なぜなら、僕自身がこの5,000余ユーザの一人であり、そして障害はまるで復旧していないので。 でも、今の時点でこれをまとめておく事が、少しでも今後のヒントになればと思い、備忘録としてまとめておくことにしました。 そのファーストなんとかって何? レンタルサーバの会社です。それなりに有名な会社だったと思う。出資の事で言えば、Yahoo!100%出資の子会社だったりします。 で、何が起きたの? ある日突然、運営を委託されているホームページにアクセスしたら、こんなメッセージが出ました。 で、しばらく経って、

    ファーストサーバーに不足していたもの、僕に不足していたもの - Takasの日記
    y-mat2006
    y-mat2006 2012/06/26
    「なにせ、今回は「SLA100%保証」を謳っていた会社がこの失態ですから。」セールストークだけじゃ、なかなか見抜けないよなあ。交通事故に遭う前提で車買う人ってそうそういないだろうし。
  • 社内のバックアップ座談会に参加してきた - HsbtDiary(2012-06-25)

    弊社もホスティングサービスをやっていることから、今日出てきた中間報告書 をベースにして社内で問題と原因を考えたり、非技術部門と情報共有をする座談会が開催されることになったので、パインアメとどんぐりガムを持ち込んで参加してきた。 原因1については、変更スクリプトであってもバージョン管理やITSに入れるとか、実行前のレビューとか、手で打ち込むようなオペレーションを実行する時にペア作業しようというあたり。 原因2については、ほぼ対策するのは無理だろうという見解で一致。今だから他のサーバーに影響がないことを検証しようと思えば出来るけど、それでも検知システムを入れても対症療法になってしまうし、そもそも作業者が意図しない領域が変更されてないということを検証するのは極めて困難だしね。 原因3については、バックアップと呼ばれているものが実は待機系だよねーというあたりでスタートして、バックアップを何世代取る

    社内のバックアップ座談会に参加してきた - HsbtDiary(2012-06-25)
    y-mat2006
    y-mat2006 2012/06/26
    「障害発生から5日目に公開した内容としては良く出来ていて」前々から懸念事項として、内部で認識されてたんじゃないかなあ。
  • ファーストサーバ、データが消えた理由を説明 削除コマンドの停止・範囲記述漏れ

    ファーストサーバの大規模障害でなぜデータは消えたのか。更新プログラムの不具合を検証環境で確認できず、番環境とバックアップデータに同時に適用してしまったためという。 ヤフー子会社でレンタルサーバを手がけるファーストサーバの大規模障害で、同社は6月25日、原因について説明した。更新プログラムにファイル削除コマンドを停止させるための記述と、対象サーバ群を指定するための記述が漏れていたという不具合を検証環境で確認できず、番環境とバックアップデータに適用してしまったためという。 障害についてのFAQも公開。損害賠償は利用契約約款に基づき、契約者が「サービスの対価としてお支払いただいた総額を限度額」として支払うとしている。Webサイトのダウンによる機会損失については損害賠償の対象外としている。 不具合のある更新プログラムをバックアップにも適用 同社によると、6月20日午後5時ごろ、特定のサーバ群に

    ファーストサーバ、データが消えた理由を説明 削除コマンドの停止・範囲記述漏れ
    y-mat2006
    y-mat2006 2012/06/25
    でも、お客はそう言う品質だと納得したんだよね?奇跡も魔法もないんだから、安い値段にはどこかに理由があるはずなんだから。
  • データ消失障害のファーストサーバが中間報告、「データは復旧不可能」

    ヤフー子会社でレンタルサーバー事業を営むファーストサーバ(大阪市)で、2012年6月20日にデータ消失を伴う大規模障害が発生した。同社は6月25日午前、ウェブサイトで「大規模障害の概要と原因について(中間報告)」と「大規模障害に関するFAQ」という文書を公開した。 これらの発表文書によると、障害が発生したのはファーストサーバのサービスのうち、「ビズ/ビズ2/エントリービズ/エンタープライズ3/EC-CUBEクラウドサーバ マネージドクラウド」を利用していた顧客の一部である。障害が発生した顧客のデータは、システム領域のサーバー設定情報やデータベースの情報なども含めたデータが消失した。ファーストサーバは専門業者にデータ復旧を依頼したものの、復旧不可能と判断したという。 これにより、サーバーを復旧する顧客は、サーバーを最初から再設定して、顧客がローカルパソコンに保存しているバックアップデータから

    データ消失障害のファーストサーバが中間報告、「データは復旧不可能」
    y-mat2006
    y-mat2006 2012/06/25
    予算があればミッションクリティカルにもできるとは思うけど、要はお金が足りないのが原因だよな。
  • ファーストサーバの事故から考えること

    つい先日、ファーストサーバというホスティング企業が多数の顧客の全データを喪失するという前代未聞の事故が起こりました。 twitterやfacebookでは技術者や弁護士など、様々な方々が色んな観点からの議論を始めています。 私としても、今回の事故から得られた教訓と、弊社でのデータ保全の取り組みについてお話ししたいと思います。 大規模障害の概要と原因について(中間報告) ファーストサーバ サポートWEB こちらに中間報告があがっていますが、オペレーションミスによりサーバの削除タスクをバックアップ環境を含めた全サーバに対して適応してしまったという前代未聞の事故です。 動的にサーバのプロビジョニング(構成管理)を行う場合には、バグやオペミスによりデータを誤って消してしまうということは考えられますので、その点では作業手順やプログラムの安全品質については厳重な管理が必要と考えられます。 質的な原因

    y-mat2006
    y-mat2006 2012/06/25
    値段の安いのにはワケがあるってことだよな。エンドユーザが納得してるんだったら良いけど。
  • 株式会社IDCフロンティア

    IDCフロンティアのクラウドサービスが政府情報システムのためのセキュリティ評価制度(ISMAP... データセンター 2024年01月10日 【接続先追加】「バーチャルブリッジ」に主要IX事業者などの他事業者接続が追加 データセンター 2024年01月10日 令和6年能登半島地震の影響により、被災された地域のお客さまがご利用中のサービスについて支援措置を実施します。 サービス 2024年01月05日 新年のご挨拶 代表取締役社長 鈴木 勝久 その他 2024年01月04日 1月17日~19日に福岡で開催される「JANOG53 in Hakata」にブース出展します その他 2023年12月20日 ZDNET Japan Business&IT ClassWork supported by ... その他 2023年12月15日 IDCフロンティア、「AIサービスのためのデジタルインフラ」を

    株式会社IDCフロンティア
    y-mat2006
    y-mat2006 2012/06/25
    待機系をバックアップと呼ぶのは、ものすごく気持ち悪い。遠隔地DRとまでは言わないけど、せめて筐体外にデータ退避しとこうよ。
  • これは大惨事…MSが提供したコマンドを実行→大学の全アカウント消失 | ガジェット速報

    これは大惨事…MSが提供したコマンドを実行→大学の全アカウント消失 | ガジェット速報
    y-mat2006
    y-mat2006 2012/04/10
    クラウドってこわいよね。/検証環境作って、リハーサルしてから本番作業すべきだけど、工数が足りないとぶっつけ本番になって余計工数かけちゃうんだよな。
  • 業務・システム最適化計画

    特許庁業務・システム最適化計画 平成16年10月 5日策定 平成17年 8月23日改訂 経済産業省(電子経済産業省(e−METI)推進部)決定 特許庁業務・システム最適化計画(目次) 第一章 特許庁業務・システムの概要 第二章 特許庁業務・システム最適化計画の基的考え方 2.1 特許庁業務・システム最適化計画の「3つの目標」 2.2 特許庁業務・システム最適化計画を実施していくための新システムの特徴 (1)特許庁システムの現状 (2)新システムの特徴 第三章 特許庁業務・システム最適化計画の具体的内容 <早急に実施していく項目> 3.1 知的創造サイクルの活性化(外部ユーザーの利便性向上) 3.1.1 各種手続 3.1.2 産業財産権情報の対外提供 (1)24時間365日のインターネット出願 (2)インタラクティブ申請(申請書作成支援システム)の導入 (3)インターネット公報の

    y-mat2006
    y-mat2006 2012/01/27
    例の特許庁システムの最適化計画。
  • 電源を誤って遮断、共用プール冷却一時中断 : 社会 : YOMIURI ONLINE(読売新聞)

    東京電力は17日、福島第一原子力発電所で使用済み燃料を保管する共用プールへの電源供給が誤って遮断され、午後2時半ごろから約3時間にわたってプールの冷却が中断したと発表した。

    y-mat2006
    y-mat2006 2011/04/18
    原発にドジっ子属性は不要/マジレスすると、ケアレスミスが相次ぐ場合、人的要素以外にシステム的な問題も考えるべきでは?(わかっちゃいるんだろうけど)