タグ

hadoopに関するilyaletreのブックマーク (5)

  • Treasure Dateが語る、大規模分散システムをスケーラブルに運用するためにやったこと

    2018年5月22日、トレジャーデータ株式会社が主催するイベント「PLAZMA Data Platform Day: TD Tech Talk」が開催されました。2日間に渡って、TreasureDataを活用する各企業が、運用上の知見やヒントを共有するイベント。1日目のData Platform Dayでは、分散処理システムの構築やエコシステム開発、運用に対する取り組みや技術について、各社が知見を語ります。プレゼンテーション「Infrastructure for autoscaling distributed」に登場したのは、トレジャーデータ株式会社の佐々木海氏。講演資料はこちら。 分散システムをどうスケーラビリティ高く運用していくか 佐々木海氏(以下、佐々木):よろしくお願いします。Treasure Dataの佐々木といいます。 今日のTech Talkのテーマはデータ分析基盤というこ

    Treasure Dateが語る、大規模分散システムをスケーラブルに運用するためにやったこと
  • DeNAのデータ分析基盤 あらゆるサービスのログを蓄積・分析するインフラの仕組み

    DeNAにおける、データ活用の重要性 松木秀憲氏(以下、松木):よろしくお願いします。「2020年代に向けたDeNAの分析基盤」というタイトルでお話をさせていただきます。松木と申します。株式会社ディー・エヌ・エーのAIシステム部でAIと分析の基盤を担当しております。 なぜ「AI&分析基盤」という担当になってるかなどを含め、お話させていただきたいと思います。 まずDeNAとAIシステム部という部署について、紹介させていただきます。 DeNAという会社はいろいろなサービスを提供している会社です。そして、自社独自であるいはパートナーさまと一緒に日々多くの価値あるサービスを創出するべく取り組んでいます。それでいて、大規模のインターネットサービスのプラットフォームの構築・運用力も持った会社です。 そのDeNAでのデータ活用ですが、やはりサービスを提供している会社なので、スライド右下の部分ですが、サー

    DeNAのデータ分析基盤 あらゆるサービスのログを蓄積・分析するインフラの仕組み
  • NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮

    業界トップ のエンタープライズ Hadoop 企業 Cloudera に入社しました http://www.cloudera.co.jp/ 今年の6月に、「平成21年度 産学連携ソフトウェア工学実践事業報告書」というドキュメント群が経産省から公表されました。 そのうちの一つに、NTTデータに委託されたHadoopに関する実証実験の報告書がありましたので、今更ながら読んでみることにしました。 Hadoop界隈の人はもうみんなとっくに読んでるのかもしれませんけど。 http://www.meti.go.jp/policy/mono_info_service/joho/downloadfiles/2010software_research/clou_dist_software.pdf 「高信頼クラウド実現用ソフトウェア開発(分散制御処理技術等に係るデータセンター高信頼化に向けた実証事業)」という

    NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮
    ilyaletre
    ilyaletre 2019/10/11
    くー、リンク先は既に404だった。どこへ。。
  • Open Source & Open Standards | Cloudera

    Cloudera Data Platform The only hybrid data platform for modern data architectures with data anywhere.

    Open Source & Open Standards | Cloudera
  • Hadoop環境のクラウド移行 | BLOG - DeNA Engineering

    IT基盤部の nodoka です。 私の業務はWebサービスの運用が中心でしたが、数年前からHadoopを中心とした分散基盤環境のインフラも見るようになりました。 当初は巨大なHadoop環境の管理を体系化して引き継ぐことと、運用における属人性を排除することが喫緊の課題でした。 それが落ち着くと、ご多分に漏れずクラウド化を検討・推進するようになったので、その流れをまとめてみようと思います。 DeNAのHadoop環境と改善策 Hadoopが抱える課題 GCPへの移行 embulk利用におけるTips DeNAのHadoop環境と改善策 DeNAにおけるHadoop環境の歴史は古く、DeNAのほとんどのサービスが利用しています。 各サービスでは分析したいログやDBのスナップショットをHadoopのファイルシステムであるHDFSに一旦置きます。 そのHDFSに置かれたファイル群をHadoopを

    Hadoop環境のクラウド移行 | BLOG - DeNA Engineering
  • 1