タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

networkと情報システムに関するardarimのブックマーク (2)

  • ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン

    同期処理が失敗した原因は、4台をつなぐスイッチの不具合。具体的には、スイッチが故障状態であるにもかからず、故障を知らせる「故障シグナル」を発信しなかった。国内線システムは故障シグナルを検知するとスイッチを予備機に切り替えるが、今回はその機能そのものを作動できなかった。 スイッチは完全に停止したわけではなく、「不安定ながらも動作していたようだ」(同)。そのため、DBサーバー間の同期は順次失敗し、停止していったと見られる。 ANA広報によると、スイッチは米シスコシステムズ製「Catalyst 4948E」という。「2010年6月の発売開始以降、世界で4万3000台、うち日で8700台を販売しているが、今回の不具合は初めての事象と聞いている」(ANA広報)。なぜ「故障シグナル」が発信できなかったかは分かっていない。 1台での縮退運転を決断 4台の完全停止から37分後、ANAは1台のDBサーバー

    ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン
    ardarim
    ardarim 2016/03/31
    運用を止めないための冗長構成なのにフェイルオーバーするための機能がバグっててフェイルオーバーできなかったってことか。これはつらい。というかシスコのレアな不具合に2回も遭遇するとはANA不遇すぎる…
  • 「スマホ時代の考え方に変わり切れていなかった」 続発したKDDIのLTE通信障害、原因と対策は

    「スマホ時代の考え方に変わり切れていなかった」 続発したKDDIのLTE通信障害、原因と対策は(1/2 ページ) KDDIで相次いだLTE通信障害は、LTE基地局制御装置(MME)のバグが起因。同社は300億円の追加設備投資でMMEの増設などを進め、再発防止に努める。 「ご迷惑、ご心配おかけし、改めてお詫び申し上げます」――KDDIの田中孝司社長は6月10日、4G LTEの通信障害が相次いだ問題について謝罪会見を開いた。障害は、「MME」(Mobility Management Entity)と呼ばれるLTE基地局制御装置のバグが起因となって発生。同社は総額300億円の設備投資を追加で行うなどしてバグやミスが起きても障害につながらない体制を整え、再発防止に努める。 障害の起因となった2つのバグ 障害が発生したのは、4月27日、5月29日、30日。東京都、神奈川県、山梨県の一部のユーザー(そ

    「スマホ時代の考え方に変わり切れていなかった」 続発したKDDIのLTE通信障害、原因と対策は
    ardarim
    ardarim 2013/06/11
    構成上はサーバ二系統あるけど、単なる負荷分散用の構成で障害時の片系のみのでの運用は考慮されてなかったのに、そういう風な使い方して落ちた、ということじゃないの?
  • 1