この記事は本番環境などでやらかしちゃった人 Advent Calendar 2023の14日目です。 背景 かなり昔の話になります ぼかしが多々入っております ユーザはあまりサーバーや技術について詳しいわけではありませんでした 経緯 開始 とあるユーザーの依頼でCMSの機能開発を行っていた時の話です。 「本番サーバーがここで、開発用のサーバーとブログはここね。開発の方は好きに変更してもらって構わないから。」 と案内を受けた開発サーバーのCMSで作業を行っていました。 もちろん、このサイトの開発サーバーと本番サーバーは別です。当然ですよね。 少しして その時はディレクトリツリーのような構造を作成中、ツリーといえば再帰。 パーツを再帰的に呼び出せば実現できると判断しゴリゴリ書いておりました。 最初のミス CMS独特の記述などからなかなか思ったようにパーツが展開されません。 色々と試行錯誤を続け
mutapon @mutapon2 @yotchanchi うちにもそんな風にミスしてるのに口答えばっかりする派遣さんがいるけど、彼は発達障害だったのか🙄 私「あなたが勝手に変えていいルールではないので!!」 派遣「いや、でも!!どこどこはこうなんで!!」 私「ではそこにお戻りください……」 毎日の不毛な会話……🙄 2023-09-07 15:24:08 momo 𖡼.𖤣𖥧 無職 @tanoshii_hini @yotchanchi ミスした社員に「この順番の方がやりやすくて」って言われたら(だから順番を変えたのか…)って理解して改善しやすくなるし、 自分がその社員なら、言われた通りにやってみようとしても、やりづらくなって更にミスしそう😰 自分の都合ばかり要求するのは違うけど、ミスした人は主張したらダメなの? 2023-09-07 21:50:01 ポッチ・パパ @hogu_u
システム運用の世界にも、「ダブルチェックで防げなかったので、来月からはトリプルチェックでミスを撲滅します!」という禁断の運用改善があったとか、なかったとかささやかれております。 そんな悲しい運用改善は、我々の代で終わりにしなければなりません! 他の業界に学ぼうそもそも人間とはミスをする生き物です。 「人はミスをする」という前提に立ち、可能な限りミスを減らすというのが運用改善の正しい姿勢になります。 どんなサービスでも、稼働率100%のSLAを提示しているサービスはないでしょう。 ただし、盲目的に施策を実施しても作業ミスは減りません。 作業チェック方法やミスの発見率については、鉄道や原子力といった分野で研究が進んでいます。 ITシステム運用も、それら分野からノウハウを学んだ方が良いでしょう。 まずトリプルチェックの現場猫問題ですが、3人以上でチェックすると、2人でチェックする場合よりも全体的
れんさ球菌 @streptocoooccus 私、就職したときからこっち、ずっと興味があることが「人はなぜ事故を起こすのか」ということなんですが、そのうち心理的要因を占める大きな要素として「時間のプレッシャー」「複数のことを同時にしようとする(ので、記憶から吹っ飛ぶ)」などがあるんですよね。「確認を徹底する」は無意味です。 2022-09-29 09:41:26 れんさ球菌 @streptocoooccus 最早、インシデントを起こしてしまい落ち込んでしまった個人の心構えだけだとしても無意味だと思います。なぜならその心構えはさらにプレッシャーになって、次に起きてしまったインシデントの際に対人関係上の問題から報告の遅れや差し控えに繋がるからです。 2022-09-29 09:43:32 れんさ球菌 @streptocoooccus ちょうど昨日はふと思い起こして「JR福知山線脱線事故」の詳細
鹿角フェフ🎊異世界黙示録マイノグーラ発売中! @Fehu_apkgm ラノベ作家📖(既刊沢山冊+趣味お絵かき🎨|《異世界黙示録マイノグーラ》というダークファンタジー小説を書いてます。書籍版&コミカライズ版絶賛発売中!|アイコンは自分で描きました@w@ 【マイノグーラ関連】 公式垢→@myap_GCofficial 感想等→#マイノグーラ ファンアート→#マイノグーラFA linktr.ee/fehu_apkgm 鹿角フェフ🎊異世界黙示録マイノグーラ発売中! @Fehu_apkgm 現場猫案件死亡事例集を読んでいるんだが(なんでんなもん読んでるんだ) 結構な頻度で出てくる『勝手にスイッチを入れる同僚』の存在にめちゃくちゃヘイトがたまっている。 こいつ何巻で死ぬの? 2022-06-23 12:32:54
最速配信研究会山崎大輔 制約理論及び待ち行列理論による技術経営コンサルとエンジニア起業相談やってます @yamaz 今あちこちで説明しているノートラブルなシステムを作るための心構えの資料を清書してる。その中でも特に好きなスライドはこちらになります。 pic.twitter.com/PX4ChHRvyo 2022-07-15 12:24:46 最速配信研究会山崎大輔 制約理論及び待ち行列理論による技術経営コンサルとエンジニア起業相談やってます @yamaz ソフトウェアエンジニア、起業家、商売人、三児の父、広告システムチョットデキル、スモールビジネス大好き ヤフー→スケールアウト(ファウンダ)→M&A/PMI→現在起業準備中 モットー:流れ重視、差は儲けの元 大量配信(月数千億~)、エンジニア起業、テック組織、技術的負債の返し方、PMIなど、ご相談はDMで! https://t.co/eSo
2022年6月24日 2021年6月7日(月)23時05分頃、日比谷線八丁堀駅多機能トイレ内でお客様が倒れておられたのを発見し、その後に亡くなられたことが確認されました。そのお客様は16時10分頃にトイレに入室したことが確認できましたが、当該多機能トイレの設備の機能不備によりお客様の発見が遅れました。またこのことについて約8か月後の2022年2月25日(金)に週刊誌記者より事実確認の問い合わせを受けるまで、ご遺族へ早期のご説明が出来ず、社会への広報も行っておりませんでした。 お亡くなりになられたお客様ならびにご遺族に対しまして、心よりお悔やみ申し上げます。また、この間ご心配をおかけしましたご利用のお客様ならびに関係者の皆さまに対しまして、深くお詫び申し上げます。 多機能トイレの機能に不備があったこと、またそれによりお客様の発見が遅れたという本事案を重く受け止めた弊社では、同年2月25日(金
株式会社石井マーク @ishiimark_sign 標識・銘板の㈱石井マークです。 弊社は 表示という視覚的アプローチによって、防災や防犯、設備分野など様々な産業シーンに「安全」「効率」「伝達」の手段を提供します。 Twitter上からはご注文や納期照会等を受け付けておりません。 会員様向け見積専用サイトは ishiimark.jp をご利用下さい。 ishiimark.com 株式会社石井マーク @ishiimark_sign 機械操作のボタン類には「押し続けている間」のみ作動するものもあります。 それらは概ね、あえてそう設計されているのであり、手を離せば止まる事で重大事故を防いでいたりもします。 だのに、まるで便利なアイデアグッズの扱いで「ボタンを押しっぱなしにできる道具」等が存在するのはマズイですね… pic.twitter.com/9Xz4bkSPuu 2022-05-23 14:
クルー・リソース・マネジメント(英: Crew Resource Management)とは、航空分野で開発された概念で、安全な運航のために利用可能な全てのリソース(人的資源や情報など)を有効活用するという考え方である[1][2][3]。当初はコクピット・リソース・マネジメント(英: Cockpit Resource Management)と呼ばれていたが、概念の発展に合わせて現在の呼び方に改められた。略称の「CRM」が用いられることが多い。 主に航空会社のコックピット内コミュニケーションやリーダーシップ、意思決定に焦点が当てられる。その後、航空界だけでなく、ヒューマンエラーが安全に大きく関わる医療、海運、原子力発電などの分野にもCRMの考え方が広がっている。 発達の経緯[編集] CRMは、時代とともにその内容を変化させており、その発達の過程は、おおむね6つの世代に分けられる[4][5][
障害の再発防止策は、 1. メカニズム 2. ツール 3. ルール 4. チェックリスト の順番に検討せよ。 上記は、私が20年前に所属していたパッケージソフト開発会社の標語です。 ※転職したので現在の所属会社ではありません。 当時はまだインターネットが今ほど普及しておらず、修正パッチはCD-Rで配布していました。 特に、データ破損系の障害の場合は、 お客様にファックスで障害内容を報告し、 緊急ホットラインを開設し、 データ異常が見られる場合はバックアップを預かって修正後に返却し、 上記と同時並行でバグの原因調査と修正を行い、 パッチをCD-Rに焼いて配布する。 という障害対応を行っていました。 各パッケージの利用社数は数万〜10数万社に上りますので、大変な騒ぎでした。 そして事後に、障害の再発防止策を検討し報告する義務が課されるわけです。 メカニズム 仕組みとして、障害原因を封じ込める対
再発防止策を書くのは難しい。 良い再発防止策 良い再発防止策について、順位付けするとしたら、 その種類の問題について二度と意識することがなくなる解決策 その種類の問題を開発時に自動的に検知することができる解決策 その種類の問題が発生しても自動的に復旧することができる解決策 その種類の問題が発生しても影響が局所化される、フールプルーフ、フェールセーフになる解決策 と言うのは意識したいと思いつつ、やはり難しい。 再発防止はむずかしい 障害の再発防止策は、 メカニズム ツール ルール チェックリスト の順番に検討せよ。と言われても、急いで書けなんて言われると「次回からは複数人でチェックします。」とか「チェック項目を追加します。」とかいう徹底できなそうな「反省文」になってしまう。 まさにこの有名な猫...。 **「なぜミスを繰り返すのか」「どうすればミスを防げるのか」を真剣に考えていないことがミス
2階にて下降ボタンを押したが下降しなかったため、利用者がかご内で点検を実施したところ、かごが1階に落下した。
We mistakenly sent out an empty test email to a portion of our HBO Max mailing list this evening. We apologize for the inconvenience, and as the jokes pile in, yes, it was the intern. No, really. And we’re helping them through it. ❤️ — HBOMaxHelp (@HBOMaxHelp) June 18, 2021 今晩、HBO Maxのメーリングリストに誤って中身が空のメールを送ってしまいました。ご迷惑をお詫びします。たくさんジョークが届いてる通り、やったのはインターンです。ほんとにそうなんです。これからも彼らを助けてやっていきます❤️ サービスやブランドから
台風18号の影響で、国分川が氾濫し、隣接のトンネル工事内へ流入した。トンネルには仮締切が設置してあったが、濁流の水圧の為、仮締切は決壊し、トンネル内で作業していた作業員7名が水死した。 ・午後4時30分頃、台風18号の影響で、国分川が氾濫し、濁流が仮設道路を越えて仮締切前面にあった掘削地に流入しはじめる。 ・午後4時52分頃、S建設の工事担当者が、T県国分川建設課長に「仮設道路を越えて水が入ってきた。水の勢いが強くて簡単に停められない」という内容の電話連絡した。 ・午後4時55分頃、県の建設課長がT建設現場代理人に「上流の水門工事現場のほうで廻りに有る土手(仮設道路)が崩れて水門工事現場に水が流れ込んできている。S建設の方が土嚢を積んでせき止めている。」などと電話で伝える。 ・トンネル施工中のT建設の現場代理人は同社の従業員にトンネル内から作業員をあげるよう指示した。 ・午後5時頃、県の建
2008年6月18日、小学校3階屋上で行われていた授業中、男子児童が屋上にあるド天窓に乗ったところ、天窓が割れ、1階の床に転落し、全身を強打し死亡した。 2008年6月18日(水)午前9時23分頃、杉並区立杉並第十小学校の3階屋上で行われていた6年生の算数の授業中、男子児童が、屋上にあるドーム型の天窓に乗ったところ、アクリル樹脂製の覆いが割れ、約12メートル下の1階コモンスペースの床に転落し、全身を強打した。男子児童は救急車で病院に搬送され、救急医療を受けたが、同日午後1時17分、死亡した。 天窓は、 直径1メートル30センチメートルのドーム状で、ドーム状の部分は、公称厚さ4ミリメートルのアクリル樹脂製、その下部には、厚さ6.8ミリメートルの網入りガラスが設置されている(図2、図3)。 同男子児童は、屋上で授業を受け教室に戻る途中であった。児童がドーム型の天窓に乗り、飛び跳ねたため、天窓の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く