タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

yarnとSparkに関するs-woolのブックマーク (1)

  • YARN 上における分散処理基盤のリソース管理について - Qiita

    稿では,YARN 上における分散処理基盤のリソース管理の仕組みと,問題となる状況,および Spark の解決方法について,Spark の例をまじえて説明します. YARN の基礎 MapReduce v1 では,TaskTracker が MapSlot/ReduceSlot という単位でリソースを管理していましたが,YARN では,"コンテナ"という単位でリソースを確保し,その中で処理を行います. コンテナには,CPU/メモリ/ディスク帯域幅/ネットワーク帯域幅などを割り当てることが可能です.2014/12時点では,CPU/メモリのリソース管理サポートが入っています.ディスクIO/ネットワークIOの制御も来年には入るかもしれません. Spark on YARN におけるリソース管理の例 Apache Spark は,オンメモリ用上のデータ処理を容易に行うことができる分散処理フレームワー

    YARN 上における分散処理基盤のリソース管理について - Qiita
  • 1