米Facebookは11月6日、大規模データに向けたJavaベースのSQLクエリエンジン「Presto」をオープンソースソフトウェアとして公開した。Hadoopと組み合わせて利用するもので、拡張性と速度を特徴とする。 Prestoは、Hadoopクラスタ上で管理している大規模なデータセットに対するクエリを実行するためのクエリエンジン。Facebook社内におけるインタラクティブなデータ分析のために作られたもので、Facebookのように急速に拡大する組織に合わせてスケールするように設計されているという。すでに300PBのデータウェアハウスを含む社内の複数のデータストアで利用されており、1000人以上の社員が毎日3万件以上のクエリをかけているという。一日にスキャンする量は合計で1PB以上とのこと。Facebook以外にも、米Dropbox、米Airbnbなどが利用している。 クエリはクライア