AWS GlueでApache Sparkジョブをスケーリングし、データをパーティション分割するためのベストプラクティス | Amazon Web Services

テクノロジーカテゴリーの変更を依頼記事元:

aws.amazon.com

18 usersがブックマークコメント

記事へのコメント3件

注目コメント
新着コメント

moomindani Glueでジョブをスケールさせるために参考になると思うのでGlueユーザーの皆様はぜひご一読を！

2019/10/29 リンク

sh19910711 groupFiles / "AWS Glue ファイルのグループ化を使用することで、小さいファイルを処理する毎に1 つの Apache Spark タスクを起動するような、過剰な並列処理を抑える"

2019/11/03 リンク

JHashimoto "AWS Glue上で実行するデータ処理のジョブを自動的にスケールするのに役に立つベストプラクティスについて説明します。"

AWS Glue

2019/10/31 リンク

moomindani Glueでジョブをスケールさせるために参考になると思うのでGlueユーザーの皆様はぜひご一読を！

2019/10/29 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

<iframe marginwidth="0" marginheight="0" src="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Faws.amazon.com%2Fjp%2Fblogs%2Fnews%2Fbest-practices-to-scale-apache-spark-jobs-and-partition-data-with-aws-glue%2F" scrolling="no" frameborder="0" height="230" width="500"><div class="hatena-bookmark-detail-info"><a href="https://aws.amazon.com/jp/blogs/news/best-practices-to-scale-apache-spark-jobs-and-partition-data-with-aws-glue/">AWS GlueでApache Sparkジョブをスケーリングし、データをパーティション分割するためのベストプラクティス | Amazon Web Services</a><a href="https://b.hatena.ne.jp/entry/s/aws.amazon.com/jp/blogs/news/best-practices-to-scale-apache-spark-jobs-and-partition-data-with-aws-glue/">はてなブックマーク - AWS GlueでApache Sparkジョブをスケーリングし、データをパーティション分割するためのベストプラクティス | Amazon Web Services</a></div></iframe>

プレビュー

規約違反を報告

AWS GlueでApache Sparkジョブをスケーリングし、データをパーティション分割するためのベストプラクティス | Amazon Web Services

Amazon Web Services ブログ AWS GlueでApache Sparkジョブをスケーリングし、データをパーティション分... Amazon Web Services ブログ AWS GlueでApache Sparkジョブをスケーリングし、データをパーティション分割するためのベストプラクティス AWS GlueはApache Spark ETLジョブでのデータ分析・データ処理を行うために、様々なデータソースから大量のデータセットを準備(抽出および変換)し、ロードするサーバーレスな環境を提供します。この投稿のシリーズでは、Apache SparkアプリケーションとGlueのETLジョブの開発者、ビッグデータアーキテクト、データエンジニア、およびビジネスアナリストが、AWS Glue上で実行するデータ処理のジョブを自動的にスケールするのに役に立つベストプラクティスについて説明します。まず最初の投稿では、データ処理を行うジョブのスケーリングを管理する上で重要な2つのAWS Glueの機能について説明します。1つ目は、