タグ

AWSとRedshiftに関するyubessyのブックマーク (6)

  • AWS Glue 実践入門:Amazon RedshiftのテーブルをETLする | DevelopersIO

    先日に引き続き、クローラで作成したAWS Glue Data Catalog 上のRedshiftのテーブル定義を利用して、ETL Jobを作成します。ETL Jobの作成、そして実行時の挙動についても解説します。 このブログで利用するxxxx_ssbgz_customerテーブル定義の作成方法は以下のブログを御覧ください。 AWS Glue 実践入門:Amazon Redshiftのテーブルをクロールする ETL Job の作成 ジョブとは、抽出、変換、およびロード(ETL)作業を実行するために必要なビジネス・ロジックのことです。ジョブの実行は、イベントによってスケジュールまたは駆動されるトリガによって開始されます。 Job properties ジョブの名前やIAM Role等の基情報を設定します。 Redshiftに対するクエリ実行が主なので、画面下のScript librarie

    AWS Glue 実践入門:Amazon RedshiftのテーブルをETLする | DevelopersIO
  • Amazon Redshiftのデータ量監視とエンコードタイプ - LIVESENSE Data Analytics Blog

    データエンジニアリングチームのよしたけです。 弊社各サービスのデータ分析基盤であるLivesense Analyticsの開発、運用を行っています。 Livesense Analyticsのアーキテクチャ Livesense AnalyticsはAWS上でシステムが構築されています。S3上にあるデータやtd-agent、Kinesis Firehoseなどを経由して集めたデータをAmazon Redshiftに格納し、データウェアハウスとして運用しています。詳細は、弊社大政がデータ分析基盤Night #1 で発表した内容をご参照ください。 当時とは一部変更になっている部分もありますが、大枠は上記の図の構成になっています。 ディスク使用量 このLivesense Analyticsには、マッハバイトや転職会議をはじめ、リブセンスで運用している多くのメディアの各種ログやデータが集められています

    Amazon Redshiftのデータ量監視とエンコードタイプ - LIVESENSE Data Analytics Blog
    yubessy
    yubessy 2017/12/15
    便利情報です
  • Amazon Redshiftで起きたトラブル事例

  • Amazon Redshift の 可用性と耐久性について | DevelopersIO

    はじめに 先日お客様よりRedshiftの構成や可用性、耐久性、データの復元などのご質問をいただきましたので 想定される障害についてどのような復旧対応が行われるのかまとめました。 引用はAmazon Redshift のよくある質問の 可用性と耐久性 から引用しています。 ドライブ障害 Q: 1 つのノードのドライブに障害が発生した場合、データウェアハウスクラスターの可用性とデータ耐久性はどうなりますか? Amazon Redshift データウェアハウスクラスターはドライブに障害が発生した場合でも継続して利用できますが、特定のクエリに対するパフォーマンスがわずかに低下します。ドライブに障害が発生すると、ノード内の他のドライブに格納されている障害ドライブのデータの複製が、透過的に使用されます。さらに、データを正常なドライブに移動させるか、移動できない場合はノードの交換が行われます。 単一ノ

    Amazon Redshift の 可用性と耐久性について | DevelopersIO
  • ログ記録のための STL ビュー - Amazon Redshift

    STL システムビューは、システムの履歴を提供するために Amazon Redshift ログファイルから生成されます。 これらのファイルは、データウェアハウスクラスター内の各ノードに置かれます。STL ビューは、ログから取得した情報を、システム管理者が使用できる形式のビューにしたものです。 ログの保持 — STL システムビューは 7 日間のログ履歴を保持します。ログの保持は、すべてのクラスターサイズとノードタイプで保証されており、クラスターワークロードの変化による影響を受けません。また、ログの保持は、クラスターの一時停止などのクラスターの状態からも影響を受けません。クラスターが新しい場合のみ、ログ履歴が 7 日未満になります。ログの保持にお客様によるアクションは不要ですが、ログデータを 7 日以上保持する場合は、ログを定期的に他のテーブルにコピーするか、Amazon S3 にアンロード

  • how to find size of database, schema, table in redshift

  • 1