はじめまして山縣です。 私のチームでは弊社のサービスやコンサルティングなどで必要となる特許やその他さまざまなデータを収集・解析しています。特許情報などのデータはデータサイズとして大規模であったり複雑だったりすることもあり Hadoop なども含めたいろいろなミドルウェア・ツールを使っています。 そこで私の記事ではそういった業務に活用しているツールについて書いていきたいと思います。 今回は Spark についてです。(なお Spark が何かなどの解説はいたるところにあると思うので省略します。) 弊社でのSparkの導入は去年の春くらいからはじまりました。はじめは試験的に使っていましたが徐々に利用範囲を広げ、今ではデータの処理には欠かせないものとなっています。 弊社には Cloudera社のCDHを使った Hadoopクラスタがあり、Spark はそのクラスタのYARN上で稼働しています。Y
spark-als Another, hopefully better, implementation of ALS on Spark (already merged into MLlib) @mengxr / Latest release: 0.1.0 (2014-11-27) / BSD 3-Clause / (1) 3|ml 2|mllib 2|recommendation mllib-grid-search An example project for doing grid search in MLlib @spark-ml / Latest release: 0.0.1 (2014-11-27) / BSD 3-Clause / (2) 1|ml 1|example 1|examples spark-avro Integration utilities for using Spa
I'd like to stop various messages that are coming on spark shell. I tried to edit the log4j.properties file in order to stop these message. Here are the contents of log4j.properties # Define the root logger with appender file log4j.rootCategory=WARN, console log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target=System.err log4j.appender.console.layout=org.apache.log
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く