[B! Docker][hadoop] yassan0627のブックマーク

yassan0627 id:yassan0627

Dockerとhadoopに関するyassan0627のブックマーク (10)

GitHub - apache/hadoop at docker-hadoop-2
yassan0627 2023/11/13
Hadoop v2系の検証環境をDocker Composeで実行する

hadoop

Docker
リンク
Introducing Apache Spark on Docker on top of Apache YARN with CDP DataCenter release - Cloudera Blog
yassan0627 2021/11/25
spark

docker

hadoop
リンク
https://events.static.linuxfound.org/sites/events/files/slides/DockerOnHadoop.pdf
yassan0627 2021/08/06
hadoop

Docker
リンク
Containerizing Apache Hadoop Infrastructure at Uber
You’re seeing information for Japan . To see local features and services for another location, select a different city. Show more Introduction As Uber’s business grew, we scaled our Apache Hadoop (referred to as ‘Hadoop’ in this article) deployment to 21000+ hosts in 5 years, to support the various analytical and machine learning use cases. We built a team with varied expertise to address the chal
yassan0627 2021/07/23
hadoop

YARN

docker

HDFS

apache
リンク
Bigtop の provisioner を使って仮想マシンやコンテナ上に Hadoop/Spark クラスタを構築する
yassan0627 2020/12/22
Dockerでプロビジョニング出来るんだ。確かにPoCとかに便利そう。

bigtop

hadoop

docker
リンク
DockerでHadoop - Qiita
内容 1. マスタノード（ResourceManager+NameNode）を構築マスタノード用の Apache Hadoop Docker image を起動する。 $ docker run -itd -p 8088:8088 -p 9000:9000 -p 19888:19888 -p 50070:50070 -h hadoop-00 --name hadoop-00 sequenceiq/hadoop-docker /bin/bash $ docker exec hadoop-00 service sshd start
yassan0627 2019/02/25
hadoop

docker
リンク
C/C++拡張されたPythonライブラリをCloudera Data Science WorkbenchとSparkクラスタで分散実行する
サンプルによるMeCabを使ったword cloudCloudera Data Science Workbench(CDSW)は、データサイエンティストに、Python、R、およびScalaを使用してエンタープライズデータにセキュアにアクセスできるようにします。前回の記事(日本語)では、お気に入りのPythonライブラリをPySparkでApache Sparkクラスタで使用する方法を紹介しました。 Pythonの世界では、データサイエンティストはC/C ++などのネイティブ拡張を含むXGBoostなどのPythonライブラリを使用したいことがよくあります。この記事では、この問題を解決してC拡張を使ってcondaレシピを作成する方法を示します。レシピ作成のサンプルリポジトリはこちら、MeCabの分散実行のサンプルはこちら。 condaパッケージの詳細については、公式ドキュメントを参照
yassan0627 2019/02/15
hadoop

cadeda

データ

docker
リンク
Sparkクラスタ上で好きなPythonライブラリをCloudera Data Science Workbenchから使う
Cloudera Data Science Workbenchはデータサイエンティストに自由を与えます。プロジェクトごとにコンテナを立ち上げることで、他のプロジェクトと独立した環境を使うことができ、root権限なしに好きなライブラリを自由に使うことが出来ます。 Sparkクラスタ上で好みのパッケージを使うのは、JavaやScalaなどのJVMの世界では簡単です。アプリケーションがパッケージを管理するため、fat JARやuber JARと呼ばれる必要なパッケージを一つにまとめたJARファイルを作ることで、アプリケーション毎に異なるパッケージをSparkクラスタに配布し利用することができます。一方で、多くのデータサイエンティストはScalaよりPythonを使うことが多いです。しかし、PythonのライブラリをSparkクラスタに配布して実行するのは、root権限を持ってクラスタの設定変更
yassan0627 2019/02/15
hadoop

cadeda

データ

docker
リンク
Hadoop + Yarn Docker on SoftLayer by Rancher - Qiita
HADOOP SUMMIT 2016 SAN JOSEに合わせて、RancherというDockerコンテナ管理ツールを使って、SoftLayer上にHadoop、Yarnのクラスタ環境を簡単に構築してみた記録です。まずは、それぞれの概要を記します。 Rancherは、Dockerイメージとして配布されているコンテナやクラスタの管理をWebUIで簡単に行えるオープンソースのツールです。 SoftLayer、GCP、AWS、Azure、DigtalOcean、rackspaceといった、各種クラウドとのコンテナ連携が可能です。 2016年3月にバージョン1.0になり、Kubernetes、DockerSwarm、Mesos等のクラスタ環境管理機能が追加されました。公式サイト：http://rancher.com/ Hadoop and Yarn
yassan0627 2017/01/25
hadoop

rancher

YARN

Docker
リンク
https://github.com/sequenceiq/docker-spark/blob/master/README.md
yassan0627 2016/03/07
docker とspark組み合わせたら、スケール楽じゃね？とか考えたら、もうあったヽ(´ー｀)ノしかも新しい。 #docker #spark

spark

hadoop

Docker
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx