タグ

障害に関するsirobuのブックマーク (11)

  • モバイルSuica障害、電源工事ミスが原因 マニュアルに誤り、システムサーバへの電源供給切れる JR東

    JR東日は6月26日、24日に発生した、モバイルSuicaでのチャージなどができなくなった障害について、電源工事のミスが原因だったと発表した。工事マニュアルに間違いがあり、計画と異なるブレーカーを切ってしまったことで、システムサーバへの電源供給が止まってしまったという。 原因は、屋内の電源工事。マニュアルには来「盤NO6(CV6)内のブレーカーを『切』にする」と記載されるべきところ、「盤NO6(CV4)内のブレーカーを『切』にする」と書かれていた。 作業スタッフがこの誤りに気づかず、「盤NO4(CV4)」のブレーカーを切ったため、夜間処理中のシステムへの電源供給が止まり、ハード故障やデータ不整合が発生した。 障害発生から完全復旧まで約12時間かかった。サーバ電源を再投入し、ハードウェアの健全性を確認した後、電源供給停止時に実行されていた処理の再実行やデータの整合性を確認した上でサービス

    モバイルSuica障害、電源工事ミスが原因 マニュアルに誤り、システムサーバへの電源供給切れる JR東
    sirobu
    sirobu 2023/06/27
    試験環境で電源や分電盤まで再現してるとは思えないから、机上確認でヨシ!ってなりそうだしなぁ
  • モバイルSuica障害…原因は操作手順書に誤り JR東日本(日テレNEWS) - Yahoo!ニュース

    JR東日は、「モバイルSuica」のアプリなどで24日に不具合が発生したことについて、電源工事の操作の手順書に誤った記載があり、計画と異なるブレーカーを切ったことが原因だと明らかにしました。 JR東日によりますと24日、「モバイルSuica」のアプリ上でチャージができなくなったりインターネットで新幹線などのチケットを購入できる「えきねっと」でも予約や変更ができないなどのシステム障害が発生しました。 その原因について26日、JR東日はシステム強化の一環で行っていた電源工事の際に計画と異なるブレーカーを切断したことが原因だと明らかにしました。 操作の手順書に誤った記載があったうえ、手順書を作った社員と現地で作業にあたった社員が同じだったことから操作時にもその誤りに気づかなかったということです。 対策として、データシステムにつながるブレーカーが設置してある電源盤に取り扱い注意と明示したほか

    モバイルSuica障害…原因は操作手順書に誤り JR東日本(日テレNEWS) - Yahoo!ニュース
    sirobu
    sirobu 2023/06/26
    “手順書を作った社員と現地で作業にあたった社員が同じだったことから操作時にもその誤りに気づかなかった”これは本質じゃないだろー。試験環境は電源の多重化されてなくて「やったこと」にして手順確認してない?
  • 【1月23日追記】12月23日、24日に発生しました障害に関するご報告

    いつもSkebをご利用いただき、誠にありがとうございます。 12月23日12時よりskeb.jpにアクセスできない大規模な障害が発生しておりましたが、12月24日07時に復旧いたしました。 12月23日、および12月24日が納品期限のリクエストは納品期限を12月25日23時59分までに延長させていただきます。 みなさまには多大なご迷惑をお掛けしましたことをお詫び申し上げます。 障害につきまして詳細をご報告させていただきます。 概要日時: 12月23日12時22分〜12月24日7時00分 (JST) ダウンタイム: 18時間38分 内容: skeb.jpにアクセスできない不具合 原因: SkebはすべてのサーバとシステムをHerokuに設置していたが、障害発生時刻より同サービスのアカウントが理由の通知なく利用できなくなった。 解決: Herokuの一切の利用を中止し、すべてのサーバとシステ

    sirobu
    sirobu 2022/12/24
    Skebの障害報告。突如Herokuのアカウントが停止され、代理店であるセールスフォース・ジャパンからの連絡にも応答しないとのこと。Herokuはクリスマス休暇でも取ってんのか?
  • 「悪い報告を上にあげると罰せられる組織はダメ」→今回のauの件は深夜2時に社長までエスカレーションされていて素晴らしいという話

    MAEDA Katsuyuki @keikuma 「悪い報告を上にあげると罰せられる組織はダメ」と何度も言っているのですけれど、今回のKDDIの通信障害。時系列でみると、深夜1:35にアラーム発生。2:00には社長にまで報告が届いていて、事故対策部を立ち上げ。深夜にトップを起こしても大丈夫という心理的安全性の確保はすばらしいと思います。 2022-07-04 14:48:01 Googleは2012年から約4年間をかけて、成功し続けるチームに必要な条件を探る「プロジェクト・アリストテレス」を実施。社内の数百に及ぶチームを分析対象とし、より生産性の高い働き方をしているのはどのようなチームなのか調査しました。 その結果、「心理的安全性の高いチームのメンバーは、離職率が低く、他のチームメンバーが発案した多様なアイディアをうまく利用でき、収益性が高く、マネジャーから評価される機会が2倍多い」とい

    「悪い報告を上にあげると罰せられる組織はダメ」→今回のauの件は深夜2時に社長までエスカレーションされていて素晴らしいという話
    sirobu
    sirobu 2022/07/05
    現場としては1時間に1回進んでもいない調査の進捗状況を上げないといけなくて、そのための資料も作る必要あるから心理的安全性とか全然ないんじゃないかな
  • 「謝って済む話じゃない」怒る客 通常の4倍来店も au通信障害 | 毎日新聞

    通信大手KDDI(au)の携帯電話サービスで2日未明に発生した大規模な通信障害を受け、状況説明やWi―Fiの電波を求める客がauショップに詰めかける場面もあった。 東京都心部にあるauショップの副店長によると、通信障害関連で訪れた客が午後2時時点で40~50人に上り、通常の4~5倍にあたるという。「お客様にはいつ改善するか分からないとお伝えするしかなく、心苦しいです」と話した。 別のショップでは午後3時半ごろ、若い男性客が「通信障害はいつ終わるの? 謝って済むレベルじゃねえだろ」と怒りながら店員に詰め寄る姿もあった。Wi―Fiを求めて来店した中野区の会社員女性(26)は「この後友人と待ち合わせをしているが、電話もできず連絡が取れないので困っている。美容室にも行く予定だったが予約の電話もできなかった。当に早く復旧してほしい」と嘆いた。

    「謝って済む話じゃない」怒る客 通常の4倍来店も au通信障害 | 毎日新聞
    sirobu
    sirobu 2022/07/03
    キャリア1つ、スマホ1つだと単一障害点になるから複数キャリア複数デバイス持つのが正解だね!(白目
  • みずほ銀行 他行宛て振り込み 一時できなくなる不具合 | NHKニュース

    みずほ銀行で30日午後、ATM=現金自動預け払い機などでほかの銀行宛ての振り込みが一時、利用できなくなる不具合が発生しました。現在は、復旧しているということです。 発表によりますと、30日午後3時半ごろから午後4時半ごろにかけて、みずほ銀行のATMとインターネットバンキングでほかの銀行宛ての振り込みの一部が利用できない状態になったということです。 銀行によりますと、夜間や休日の時間帯の入金処理に関わるシステムの設定に、人為的なミスがあったことが原因だとみられています。 影響が出た取り引きの件数は分かっていませんが、不具合はすでに復旧し、順次、振込先への入金の手続きを進めているということです。 みずほ銀行は「お客様に多大な迷惑をおかけしたことを深くおわびします」とコメントしています。 みずほ銀行はことし8回のシステム障害が相次いだため金融庁から業務改善命令を出され、1月17日までに改善計画を

    みずほ銀行 他行宛て振り込み 一時できなくなる不具合 | NHKニュース
    sirobu
    sirobu 2021/12/30
    年跨ぎがトラブルなく出来るのかワクワクしてきたな
  • スマートロック「Qrio」で障害、発生から4日たつも直らず 遠隔操作できない状態

    スマートロック「Qrio」を遠隔操作するためのデバイス「Qrio Hub」でネットワーク障害が発生している。Qrio社(東京都渋谷区)によると、11月26日に障害の発生を告知して以来、30日午後9時の時点でも復旧できていないという。 Qrioは、Bluetoothで接続することでスマートフォンから鍵の施錠/解錠ができるスマートロック。Qrio Hubを導入すればインターネット越しの操作も可能。例えば、出先からの鍵の施錠/解錠や、スマートスピーカーをつなげば声による操作にも対応する。

    スマートロック「Qrio」で障害、発生から4日たつも直らず 遠隔操作できない状態
    sirobu
    sirobu 2021/12/01
    Hub使う利点がいまいち思い浮かばなかったんだけど、ブコメにある身体に障害ある場合の音声で解除は目から鱗
  • 「両手タッチしていない」失格の片腕スイマー 共生遠いスポーツ界 | 毎日新聞

    ある片腕のスイマーはレース後、「失格」を告げられた。理由は「両手で壁にタッチする」という健常者の競技ルールに外れたからだ。東京オリンピックとパラリンピックの開催にあたって、多様性や共生社会といった理念が盛んに唱えられた。だが、私たちの社会はその理念をどこまで実現できているのだろうか。 健常者のルール強いられ「失格」 2018年9月、札幌市で開かれた「日スポーツマスターズ」の水泳競技会。平泳ぎのレースを終えた選手が失格になった。その選手には片腕の肘から先がないにもかかわらず、審判からは「プールの壁を両手でタッチしていない」と伝えられたという。 日スポーツマスターズはスポーツ庁や日オリンピック委員会(JOC)も後援するシニア向けの総合スポーツ大会だ。18年は水泳競技だけで800人以上が参加した。 主催するのは公益財団法人・日スポーツ協会。国民体育大会(国体)も手がけるこの団体は、策定し

    「両手タッチしていない」失格の片腕スイマー 共生遠いスポーツ界 | 毎日新聞
    sirobu
    sirobu 2021/10/22
    片腕の人は片手でタッチすればオーケーとなると同タイミングでゴールに着いた時に両手でタッチが必須な分、両手の人の方が不利になる……とか?
  • 「難聴を知的障害と誤診」 中2女子、北九州市福祉事業団を提訴 | 毎日新聞

    北九州市の難聴の中学2年女子生徒(13)が、幼少期に市立総合療育センターで適切な検査を受けないまま知的障害と誤って診断され、実際は難聴と判明するまで約7年半にわたって適切な治療や教育が受けられなかったとして、センターを運営する市福祉事業団に約2000万円の損害賠償を求め、福岡地裁小倉支部に提訴した。6日に第1回口頭弁論があり、センター側は請求棄却を求めた。 訴状などによると、2歳のころから言葉の遅れが見られていた女子生徒は、3歳だった2011年にセンターで知的障害・広汎(こうはん)性発達障害と診断された。だが、知的障害児向けの特別支援学校で小学5年生になった18年、担任教諭から「唇の動きを読んでいるので、耳が聞こえていないのでは」と指摘され、他の病院の検査で難聴と判明。一部の音は聞こえるが不明瞭で、言葉として聞き取ることができない「オーディトリー・…

    「難聴を知的障害と誤診」 中2女子、北九州市福祉事業団を提訴 | 毎日新聞
    sirobu
    sirobu 2021/07/07
    難聴の状態から唇の動きを読み取って言葉を覚えたんだとすると凄いな
  • データ移行で発生したみずほ銀行のシステム障害についてまとめてみた - piyolog

    2021年2月28日、みずほ銀行でシステム障害が発生し、全国で同行のATMが利用できなくなる、キャッシュカードが取り込まれたまま戻ってこないなどのトラブルが発生しました。ここでは関連する情報をまとめます。 取り込まれ戻ってこないキャッシュカード みずほ銀行サイト上に掲載されたシステム障害発生の案内障害が発生したのは2021年2月28日11時頃。障害により各地で生じた影響は以下が報じられるなどしている。なお、法人向けに提供されるサービスでは今回のシステム障害による不具合は確認されていない。*1 障害発生から30時間後に全面復旧をした。 みずほ銀行の自行ATM5,395台の内、54%にあたる2,956台が停止し(2月28日19時40分頃時点)、預金引き落とし等が出来なくなった。*2 台数はその後訂正され、最大4,318台が停止していたことが明らかにされた。 *3 障害発生中は、ATMよりキャッ

    データ移行で発生したみずほ銀行のシステム障害についてまとめてみた - piyolog
    sirobu
    sirobu 2021/03/01
    ATMが参照してるフラグをデータ移行で上書いたとかかねぇ。テストしたのかって、影響範囲に含まれてなければ、おそらくATMまで絡めたテストは想定してないんじゃないかなぁ
  • AWS障害、大部分の復旧完了 原因は「サーバの過熱」

    AWSは午後8時18分、クラウドサーバの復旧がほぼ完了したことを明らかにした。制御システムの障害により、サーバの温度が上がりすぎたことが原因だったという。 8月23日午後1時ごろに発生した、米Amazon Web Servicesのクラウドサービス「AWS」の東京リージョンでの障害について、同社は午後8時18分、クラウドサーバの復旧がほぼ完了したことを明らかにした。制御システムの障害により、サーバの温度が上がりすぎたことが原因だったという。 同社によると問題が起きたのは、「Amazon Elastic Compute Cloud」(EC2)の東京リージョンを構成する4つのデータセンター(アベイラビリティーゾーン、AZ)の内の1カ所。AZ内の制御システムに問題が発生し、複数の冗長化冷却システムに障害が起きたという。結果として、AZ内の少数のEC2サーバが過熱状態となり、障害として表面化した

    AWS障害、大部分の復旧完了 原因は「サーバの過熱」
    sirobu
    sirobu 2019/08/23
    やっぱりアマゾン炎上してたのか。温暖化に拍車が掛かるな(アマゾン違い
  • 1