タグ

障害とawsに関するsds-pageのブックマーク (4)

  • AWS障害が起きたその日、人類は思い出した。ヤツらに支配されていた恐怖を…。

    リンク ITmedia NEWS AWSで障害、「Nature Remo」「SwitchBot」などに影響 「電気消せない」と嘆く声 AWSの米バージニア州北部のデータセンターで障害が発生。複数のサービスが正常に動作しない状況が続いている。日では「Nature Remo」「SwitchBot」などのスマート家電向けデバイスで不具合が発生。「電気を消せない」などの声がTwitterに投稿されている。 214 users 575 nasuuu @nasuvit_z AWS障害で us-east-1 の Kinesis Data Stream が赤ランプになった。「深刻な障害」と出ているけれど、Service Health Dashboard で赤ランプになったの、そう言えば見たことない気が。(あったのかもしれないけど…) pic.twitter.com/xKQFs7Jvyt 2020-11-

    AWS障害が起きたその日、人類は思い出した。ヤツらに支配されていた恐怖を…。
    sds-page
    sds-page 2020/11/26
    エアコンとかネットワークが無くても動かせるものはスタンドアロンでも動く事を保証すべきでは
  • Amazonのクラウドサービスで日本に続きアメリカで障害が発生し顧客データが全損する事態が発生

    by Bethany Drouin 日では2019年8月23日(金)、Amazonが提供するクラウドサービス「アマゾン・ウェブ・サービス(AWS)」に大規模な障害が発生し、多数のサービスやウェブサイトなどが影響を受けました。これに引き続き、アメリカでも8月31日(土)に同様の障害が発生し、顧客のデータが損失するという事態が発生していることが分かりました。 AWS celebrates Labor Day weekend by roasting customer data in US-East-1 BBQ • The Register https://www.theregister.co.uk/2019/09/04/aws_power_outage_data_loss/ 2019年8月23日にAWSの東京リージョンで発生した障害についてAmazonは、「空調設備の管理システム障害が原因」だ

    Amazonのクラウドサービスで日本に続きアメリカで障害が発生し顧客データが全損する事態が発生
    sds-page
    sds-page 2019/09/06
    ゆゆ式問題
  • AWS 東京リージョンで発生した大規模障害についてまとめてみた - piyolog

    2019年8月23日 13時頃からAmazon AWS 東京リージョン でシステム障害が発生し、EC2インスタンスに接続できない等の影響が発生しています。ここでは関連する情報をまとめます。 AWSの障害報告 aws.amazon.com AWS障害の状況 障害発生時間(EC2) 約6時間 2019年8月23日 12時36分頃~18時30分頃(大部分の復旧) 障害発生時間(RDS) 約9時間半 2019年8月23日 12時36分頃~22時5分頃 障害原因(EC2) 一部EC2サーバーのオーバーヒートによる停止 制御システム障害により冷却システムが故障したことに起因 影響範囲 東京リージョン(AP-NORTHEAST-1)の単一のAZに存在する一部EC2、EBS、およびRDS。 発生リージョンは東京。東京近郊4データセンター群の内、1つで発生。 日国内のAWSの契約先は数十万件とみられる。*

    AWS 東京リージョンで発生した大規模障害についてまとめてみた - piyolog
    sds-page
    sds-page 2019/08/24
    リアルアマゾン炎上に合わせてネットアマゾンも炎上
  • AWS S3の長時間サービス停止の原因はエンジニアの入力ミス

    Amazon.com傘下のAWSは3月2日(米太平洋時間)、2月28日にクラウドストレージサービス「S3」の北バージニアリージョン(US-EAST-1)で起きた大規模なサービス停止の原因と対策を発表した。 原因は、エンジニアの入力ミスだった。 同日の午前9時37分、S3の課金システムのデバッグ中、S3のサブシステム用の少数のサーバの接続を解除しようとした際、コマンドの入力を誤り、意図したよりも多数のサーバを解除してしまった。その中の2つのサーバが、同リージョン内のすべてのS3オブジェクトのメタデータと位置情報を管理するインデックスサブシステムと、運営にとって重要な配置用サブシステムだったため問題が大きくなった。 問題解決のためにはこれらのサーバを再起動する必要があり、再起動するまでの間、S3でサービスリクエストが受けられなくなっていた。S3 APIも利用できなかったため、EC2、EBS、

    AWS S3の長時間サービス停止の原因はエンジニアの入力ミス
    sds-page
    sds-page 2017/03/03
    この手のトラブルってだいたい人間のせいだよな
  • 1