タグ

ブックマーク / treasure-data.hateblo.jp (10)

  • トレジャーデータブログ コンテンツマップ - トレジャーデータ(Treasure Data)ブログ

    *トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 ブログはデータアナリティクスを中心に多様な記事を展開しております。(コンテンツマップは新規記事が更新される度に追記されていきます。) The blog is authored by Takahiro Inoue Chief Data Scientist at Treasure Data Twitter: @doryokujin Facebook: Takahiro Inoue Slideshare: doryokujin トレジャーデータ紹介 トレジャーデータ株式会社について アップデート情報 Treasure Data Service はどのようなケースに向いているか? トレジャーデータ流データ分析プロセス トレジャーデータ流 データ分析の始め方〜データサイエンティストがもたらす新

    トレジャーデータブログ コンテンツマップ - トレジャーデータ(Treasure Data)ブログ
    somemo
    somemo 2016/04/03
  • Treasure Data Platform で始めるデータ分析入門 〜8. Data Visualization Patterns 〜 Part.1 - トレジャーデータ(Treasure Data)ブログ

    *トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 Treasure Data Intro for Data Enthusiast!! from Takahiro Inoue シリーズではデータ分析を以下の7つのレイヤーに分解し,各々について解説していくものとします。(Slide Shareの資料は常時更新されます。) Introduction Data Collection Data Storage Data Management Data Processing Data Processing Design Part.1 Part.2 Part.3 Part.4 Part.5 Part.6 Data Visualization Treasure Viewer, MetricInsights, Tableau Data Visuali

    Treasure Data Platform で始めるデータ分析入門 〜8. Data Visualization Patterns 〜 Part.1 - トレジャーデータ(Treasure Data)ブログ
    somemo
    somemo 2015/08/29
  • 「横断」で極めるユーザー行動分析シリーズ①〜ゲーム・小売両業界に共通する「横断分析」のエッセンスとは?〜 - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 『「横断」で極めるユーザー行動分析シリーズ』は,様々な業界におけるユーザーの行動分析を、複数のデータをユーザーIDなどで紐付けて横串に(横断的に)見ていく方法・事例をご紹介するものです。 シリーズ①となる今回は,ゲームと小売業界にフォーカスを当てていきます。 はじめに オンラインゲーム業界で日々行われている分析手法と小売業界におけるそれを比較してみると、意外にも共通するポイントが多いことに驚きます。背景には、従来の「面」を中心とした大略的な分析のみならず、「点」である個別のユーザーに焦点を当てたより詳細な分析の重要性が増している状況があります。 資料では、各々の業界で行われている代表的な分析手法とその特徴を例示し、共通項として浮かび上がるデータ分析のエッセンスについてご紹介していきます。 オンラインゲーム業界にお

    「横断」で極めるユーザー行動分析シリーズ①〜ゲーム・小売両業界に共通する「横断分析」のエッセンスとは?〜 - トレジャーデータ(Treasure Data)ブログ
    somemo
    somemo 2015/08/21
  • トレジャーデータで実践:Basket 分析(実行編) - トレジャーデータ(Treasure Data)ブログ

    はじめに トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 バスケット分析シリーズの第3回目です。実際に実行するところまで見ていきましょう。 EC購買サンプルログ 前回の最後にも記載しましたが,今回使用する購買ログの項目とサンプルを抜粋しておきます。 項目名(抜粋) サンプル1 サンプル2 time 1379880709 1337749470 member_id 2026429 1931260 goods_id 583266 109601 category Automotive and Industrial Automotive and Industrial sub_category Industrial Supplies Lab and Scientific ship_date 2013-09-27 2021-01-03 amount 1 1 price 277

    トレジャーデータで実践:Basket 分析(実行編) - トレジャーデータ(Treasure Data)ブログ
    somemo
    somemo 2015/05/06
  • トレジャーデータで実践:Basket 分析(頭の体操編) - トレジャーデータ(Treasure Data)ブログ

    始めに トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 バスケット分析(併売分析)は,アウトプットイメージやその分析の有用性についてはマーケティング業界の誰もが周知しているのに反して,実際にそれを実践できている所はそれ程多くはありません。 マーケット バスケット分析の使用 - Tableau また、実践できているにしても上の Tableau のようなソフトウェアを入れなければならなかったり、実装のためのコストやリソースがかかっている所も少なくありません。さらに、そういったツールに頼っているところは、少し条件を変えただけの分析やより踏み込んだ分析に対応する柔軟性を兼ね備えるのは難しいところです。 シリーズで紹介するトレジャーデータで実戦可能なバスケット分析コンテンツは,誰もがロジック・仕組みの理解から実践まで行えるように、できるだけわかりやすく具体的に紹介してい

    トレジャーデータで実践:Basket 分析(頭の体操編) - トレジャーデータ(Treasure Data)ブログ
    somemo
    somemo 2015/04/24
  • トレジャーデータで実践:Path 分析(応用編,後編)実店舗における買い物回遊パス分析 - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 お問い合わせはこちらのフォームをご活用下さい。 前回に引き続きで、具体的な分析を行って行きます。 コンバージョンパス 遷移分析 まずはパスを構成する「辺」についての分析を行ってみましょう。買い物パスにおける「辺」とはポイント(=受信機)間の推移を意味します。まずはこの推移の数を集計することによってどのポイント間への動きが活発かを明確にしていきます。 推移は方向をもったものですので「A→B」と「B→A」は別に扱われます。 (クエリ実行後の結果) receiver_id1receiver_id2cnt 6 5 180 9 8 179 2 9 179 5 1 174 8 7 169 3 8 168 10 8 167 10 1 166 ... ... ... どうやらそこまで顕著な推移は現れていないようですが、この集計結果

    トレジャーデータで実践:Path 分析(応用編,後編)実店舗における買い物回遊パス分析 - トレジャーデータ(Treasure Data)ブログ
    somemo
    somemo 2015/04/08
  • トレジャーデータで実践:Path 分析(前編) - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 はじめに トレジャーデータで実戦可能なパス分析ソリューションは,主にWebや広告業界向けのコンバージョン分析の応用(コンバージョン「パス」に主眼をおいた分析を行うもの)と位置付けられます。 パス分析のアイデアは新しいものではなく,むしろはるか前から多くのマーケットのニーズとして捉えられていたものです。 しかしながら現在行われているパス分析は,Google Analytics や SiteCatalyst などのUIを通じて見れるもので,より業界にピンポイントな,または詳細なパスを見るといったかゆいところまでには手が届きませんでした。 ここではトレジャーデータで実践可能なパス分析に関して,Treasure Data Web Site のアクセスログを材料として具体的に解説していきます。 パス分析とは 1. 点分析 ま

    トレジャーデータで実践:Path 分析(前編) - トレジャーデータ(Treasure Data)ブログ
  • データ分析で大切な4つのこと:3. 一人で全部背負わない事の大切さ - トレジャーデータ(Treasure Data)ブログ

    データ分析で大切な4つのこと トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 3. 一人で全部背負わない事の大切さ このブログで何度も何度もお話してきましたことですが,一口に分析といっても,それはログ収集から可視化までの様々なレイヤーを下から積み上げていかないといけません。 もしも分析者がそれを一人で全て担うとしたら,これは大変なことです。 分析者がデータを集めて、解析して結果を出す、その仕事を全て1人で背負う事は非常に大変なことであり、あまり良くないことだと感じています。私も現在のポジションとは違う,特定のサービス専任の分析者であった時には「全てを自分でやってどんどん良い結果を提示していかないといけない」と気負いがありましたが,だんだんとその困難さに気付くようになってきました。 日々増え続け・変わり続けるサービスの全てを把握するのは困難 周囲に助けを求められな

    データ分析で大切な4つのこと:3. 一人で全部背負わない事の大切さ - トレジャーデータ(Treasure Data)ブログ
  • 『Prestoとは何か,Prestoで何ができるか』 - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 Hadoop Conference Japan 2014 以前に告知したHadoop Conference Japan 2014で,弊社Software Architectの古橋が発表しました。 テーマは,Facebookが公開した新しい分散処理基盤,Presto。実はFacebookが彼らの超大規模なデータセットに対してインタラクティブに結果を返せるようにと開発されたものです。開発が始まってまだ2年も経っておりませんが,今ではトレジャーデータを初めとして多くのハッカー達がコミッターとして参加する活発的なプロジェクトに成長しています。 PrestoはHiveやImpalaと同じ「SQL Query Engine」であり,特に数百GBを超える大規模データに対してもインタラクティブなレスポンスを(コンマ0秒以下,遅くて

    『Prestoとは何か,Prestoで何ができるか』 - トレジャーデータ(Treasure Data)ブログ
  • 「まずチャートを決めてから集計を決める」という視点の重要性について - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 ブログでは,可視化についてその手法やツールの紹介に関する記事をたくさん出しておりますが,今回は従来と異なった可視化手法を紹介することで多くの分析者に新たな考え方を提供できればと思っています。 従来の可視化方法について すごく当たり前の話ですが,可視化ツールというのは分析・集計された結果テーブルをインプットとして読み込むことで手続きが進んでいきます。可視化のためのチャートは非常に多く,ケースバイケースでその結果テーブルを最適に表現してくれるものを選ぶことになります。 しかしこの可視化というのはその表現方法があまりにも多いために,適切なチャートを選ぶのに苦労したり,意図したチャートで表そうとしても結果テーブルがそれにフィットしない項目で出されていたりと,それなりに苦労がありました。 そういった可視化の困難さに立ち向か

    「まずチャートを決めてから集計を決める」という視点の重要性について - トレジャーデータ(Treasure Data)ブログ
  • 1