タグ

ブックマーク / www.task-notes.com (1)

  • 【AWS】Redshiftの分散キーとソートキー - TASK NOTES

    Redshiftのパフォーマンスで重要になる分散キーとソートキーについてまとめました。 分散キー(DISTKEY) テーブルにデータをロードすると、そのテーブルの分散スタイルに従って、テーブルの行が各ノードスライスに分散されます。Redshift では1ノードの中で実際に処理を行うプロセスが複数動いており、このプロセスをノードスライスといいます。並列処理の単位はノードではなくノードスライス単位です。スライスの数は、次のようにノード上のプロセッサコアの数と同じになります。 均等分散 均等分散はデフォルトの分散スタイルです。リーダーノードは、特定の列の値に含まれている値にかかわらず、ラウンドロビン方式によって複数のスライス間で行を分散させます。例えば 8スライスのテーブルに 8行 insert した場合、各ノードスライスへ順番に 1行ずつ配布されます。均等分散は、テーブルが結合に関与していない

    【AWS】Redshiftの分散キーとソートキー - TASK NOTES
  • 1