タグ

データとhadoopに関するkoemuのブックマーク (2)

  • ドリコムを支えるデータ分析基盤 - かにぱんのなく頃に

    はじめに これは ドリコムAdventCalendar の4日目です 3日目は、@arihh さんによる 3年くらいお菓子神社運営してきた です 自己紹介 @ka_nipan ドリコムに新卒で入社し、Android開発、BtoBtoC のwebサービス開発を経て、現在は弊社アプリのログ収集から集計、可視化、その他周辺ツールといった分析基盤の面倒を見ています 日はそのデータ基盤の話を書きます データ分析基盤全体図 弊社では Hadoop をオンプレで運用していて、そこにログや分析用のデータを置いています メリット 運用コストが安い Treasure Data、Big Query、Amazon Redshift 等の外部サービスを使うよりは安く済みます 自由度が高い 各サービスには容量をはじめ色々と制限があったり、こちらの要求仕様にマッチしない部分が少なからずありますが、自前の場合その辺は融

    ドリコムを支えるデータ分析基盤 - かにぱんのなく頃に
    koemu
    koemu 2014/12/04
    「基本的に HDFS には gzip 圧縮した tsv ファイル等を置いていて、SequenceFile は置いていません」オンプレで設置するほうが良いと判断できるほどの状況なのだな…
  • Presto: Free, Open-Source SQL Query Engine for any Data

    Calling our Presto community speakers – we want to hear from you! Fill out out community call for papers to speak at upcoming meetups and conferences. What is Presto?Presto is an open source SQL query engine that’s fast, reliable, and efficient at scale. Use Presto to run interactive/ad hoc queries at sub-second performance for your high volume apps.

    Presto: Free, Open-Source SQL Query Engine for any Data
  • 1