タグ

障害に関するnekotankのブックマーク (2)

  • 【速報】ANAがシステム障害の原因を発表、引き金はスイッチと断定

    全日空輸(ANA)が、5月27日に起こしたシステムトラブルの原因について発表した。誌既報通り、トラブルの引き金はスイッチの故障。その後“ドミノ倒し”のように、その他のシステムにトラブルが波及した。 ANAが発表した障害の発生原因は三つだ。一つは、2系統あったスイッチの一つ「A系」スイッチ内の制御回路にあるメモリーが故障したこと。 もう一つはスイッチのメモリー故障により、A系とB系のスイッチ間における通信断と再接続を15回繰り返し、端末接続系システムである「ATCP」が高負荷状態に陥り、ホスト接続系システムである「ICS」が通信不可能となった。これにより、国内線旅客の予約・発券から搭乗手続きまでを担う基幹システム「able-D」と空港のカウンター端末の間の通信全体が滞留した。 三つ目の原因として挙げたのが、ICSのプログラム設定ミス。今年5月中旬にICSを動かすUNIXサーバーを更新した

    【速報】ANAがシステム障害の原因を発表、引き金はスイッチと断定
  • 東証ダウン、運用体制の不備が根本原因

    図2●東証とシステム関連ベンダーの関係<BR>東証は2002年2月、東証コンピュータシステムの株式65%を譲渡。これを2004年9月に、富士ソフトABCが取得している 東京証券取引所で11月1日に発生したシステムダウンの根的な原因は、運用体制の不備にあった。来はシステムの番機に触れない開発ベンダーである富士通が、東証が許可したとはいえ番機上でバグを修整するなど、「あってはならない」運用がまかり通っていた。 東証におけるシステム障害の直接原因は、富士通が作成した手順書の記載ミスによるロード・モジュールの登録漏れ、つまり人的ミスである。だが、問題の質は「手順書の記載ミス」で片付けられるものではなかった。誌がトラブルに至る経緯を洗い出した結果、基幹システム運用の基ルールを守っておらず、人的ミスが起きやすい状態で運用していたことが明らかになった(図1[拡大表示])。 東証は株取引の増

    東証ダウン、運用体制の不備が根本原因
    nekotank
    nekotank 2005/12/07
    そもそも本番機でいきなり修正なんて考えられない。根本的なところに問題があったわけですか…
  • 1