タグ

トラブルとエンジニアに関するkei_0000のブックマーク (2)

  • システム過負荷でなぜATMにトラブルが? みずほ銀システム障害、運用面の課題あらわに

    2月28日に発生したみずほ銀行のシステム障害。同行の藤原弘治頭取は3月1日に記者会見を開き、システムの過負荷が原因だったとして謝罪した。この障害の影響で、同行が持つATM約5900台のうち4318台が一時取引できない状態に。ATMに挿入したまま戻ってこなくなった通帳やキャッシュカードは5244枚あったという。 障害の原因となったシステムの過負荷はなぜ起きたのか。そして、なぜATMにトラブルが波及したのか。藤原頭取は、「今回の障害は想定の甘さに起因するもの」と説明する。会見の質疑応答から、システム障害の全貌が垣間見えた。 データ更新と月末処理がバッティング みずほ銀は27日、1年以上動いていない定期預金口座のステータスを「不稼働」に変更するデータ更新作業を行っていた。処理したデータは45万件。この作業を行うにはシステムに十分なデータの空き容量が必要だという。 同行は事前のテスト環境でシステム

    システム過負荷でなぜATMにトラブルが? みずほ銀システム障害、運用面の課題あらわに
    kei_0000
    kei_0000 2021/03/02
    リニューアルして、こんな早くから負荷に起因する問題か。スケールアウト出来ないシステム設計なら、この先もやばいのでは。運用でやりくりするのも限界があるし、現場はストレスで疲弊しそう。
  • プロジェクトマネージャーは神経質であれ 大学教授が教えるプロジェクトに重要なリスクマネジメント

    年に一度のプロジェクトマネジメントに関するイベント「Backlog World 2020 re:Union」。今回「プロジェクトリスク&クライシスマネジメント」のテーマで登壇するのは、数多くのシステム開発の現場でプロジェクトマネジャーに従事し、現在は広島修道大学で教壇に立つ佐藤達男氏。後半は佐藤氏の今までの経験から培ったリスクの危機管理方法やトラブルの対処方法、またマネジメント全体から現場レベルの関わり方について話します。 リスクの底を知る 私は、プロジェクトマネージャーは現場で現状を知るべきだと思っています。 ここから実際の経験の話を少ししていきたいんですが。私がシステム開発のプロジェクトマネージャーをやっていたときに開発の仕事がたくさんある。しかし、依頼を引き受けてくれるソフト開発の会社が見つかりませんでした。 そんなときに「100台のパソコンと100人のエンジニアがいて、御社の仕事

    プロジェクトマネージャーは神経質であれ 大学教授が教えるプロジェクトに重要なリスクマネジメント
    kei_0000
    kei_0000 2020/09/01
    「「リスクマネジメントは重要なので、十分に洗い出しました」と言う人がいたら、私は基本的には信用しません」これは同意。ただ信用してないことが態度に出ない様に注意。内容を調べて後で具体的かつスマイルで指摘
  • 1