タグ

データと分析に関するyassan0627のブックマーク (8)

  • データマネジメントなき経営は、破綻する。by @yuzutas0 / 20200419

    データマネジメントなき経営は、破綻する。 〜2つのデータ分析プロジェクトに学ぶ「残酷な真実」〜 第1回 DLG Cross (データマネジメントとデータパイプライン) の発表資料です。 https://data-learning-guild.connpass.com/event/170177/ データマネジメントの Why(なぜ必要か) What(どんな活動なのか) How(どうやるのか)について、 データ分析プロジェクトの成功例と失敗例を比べながら紹介します。 参考文献『データマネジメントが30分でわかる』 https://amazon.co.jp/dp/B085W4YSZJ/ [2020-04-21] 一部表現を修正しました。

    データマネジメントなき経営は、破綻する。by @yuzutas0 / 20200419
    yassan0627
    yassan0627 2020/04/20
    同意しか無い。そしてこれを0から実行するのはとてつもなく難しい…。色んな人の理解が必要なので。
  • Twitter の広告エンゲージメント分析プラットフォームをモダナイズ | Google Cloud 公式ブログ

    ※この投稿は米国時間 2020 年 3 月 18 日に、Google Cloud blog に投稿されたものの抄訳です。 Twitter の広告プラットフォームでは、日常業務の一環として数十億もの広告エンゲージメント イベントが日々発生しています。そしてこれらのイベントのひとつひとつが、ダウンストリームの数百もの集約指標に影響を及ぼす可能性があります。広告主がユーザー エンゲージメントを測定し、広告キャンペーンを効率よく追跡できるように、Twitter はさまざまな分析ツール、API、ダッシュボードを提供しています。これらは 1 秒あたりに数百万もの指標をほぼリアルタイムで集約することが可能です。 投稿では、Steve Niemitz がリードを務めるTwitter の収益データプラットフォームエンジニアチームが、Twitter の広告分析プラットフォームの収益正確性と信頼性を向上させる

    Twitter の広告エンゲージメント分析プラットフォームをモダナイズ | Google Cloud 公式ブログ
  • 750 TB のデータを使用して Amazon Redshift で Amazon Payments 分析を実行する | Amazon Web Services

    Amazon Web Services ブログ 750 TB のデータを使用して Amazon Redshift で Amazon Payments 分析を実行する  Amazon Payments データエンジニアリングチームは、データの取り込み、変換、計算と保管を担当しています。チームはこれらのサービスを世界で 300 社以上のビジネス顧客が利用できるようにしています。これらの顧客には、製品マネージャー、マーケティングマネージャー、プログラムマネージャー、データサイエンティスト、ビジネスアナリスト、およびソフトウェア開発エンジニアが含まれます。彼らは、ビジネス上の決定を適切に下すために、データをスケジュールされたクエリとワンタイムクエリに使用しています。このデータは、リーダーシップチームがレビューする、週次、月次、および四半期ごとのビジネスレビューメトリクスの構築にも使用されています

    750 TB のデータを使用して Amazon Redshift で Amazon Payments 分析を実行する | Amazon Web Services
  • カラムナフォーマットのきほん 〜データウェアハウスを支える技術〜 - Retty Tech Blog

    こんにちは、Retty.Inc ソフトウェアエンジニア兼データサイエンティストのchie(@chie8842)です。 好きなたべものは焼肉とみかんです。 現在Rettyでは、次世代分析基盤を構築しています。Rettyでは、サービス拡大に伴いログの急増や分析需要の拡大が見込まれるため、高いスループットとコストパフォーマンスを両立する、スケールするアーキテクチャ設計が求められています。 今回は、こうしたスケールするアーキテクチャ設計の実現のために理解しておくべきDWHのコア技術の一つである、カラムナフォーマットに焦点を当てて紹介します。 はじめに - カラムナフォーマットとは カラムナフォーマットとは、データベースの分析用途に利用されるファイルフォーマットの種類の一つです。大量のデータを扱う際に効率的に圧縮してストレージコストを下げたり、計算時に必要なデータだけを取り出して計算コストを小さくで

    カラムナフォーマットのきほん 〜データウェアハウスを支える技術〜 - Retty Tech Blog
  • 機械学習処理におけるカテゴリ変数の扱い方(Feature hashingについて) - MicroAd Developers Blog

    こんにちは!機械学習エンジニアの桶原です。 業務では主に機械学習処理を用いた広告効果予測と改善をテーマとしています。 今回は機械学習処理におけるカテゴリ変数の扱い方の中でもあまり触れられることのない、Feature hashingを利用した方法についてお話できればと思っています。 カテゴリ変数の取り扱い Feature hashingとは Feature hashingの種類 hashing functionの比較 概要 注意事項 実装 1. Shi's hash function 2. Weinberger's hash function 結果 次元圧縮手法としてのFeature hashing 1. Shi's hash function 2. Weinberger's hash function まとめ カテゴリ変数の取り扱い カテゴリ変数の扱う方法として多くの教科書ではOne ho

    機械学習処理におけるカテゴリ変数の扱い方(Feature hashingについて) - MicroAd Developers Blog
  • 大げさな分析資料はいらない。メルカリの「意思決定」を支えるデータアナリストの役割 | SELECK [セレック]

    〜そのデータで、意思決定は変わりますか? 戦略の策定、新機能の検証、さらに広報まで。組織を横断して最適なデータ活用を実現する、メルカリのBIチームとは〜 データを活用できる組織とできない組織、その違いはどこにあるのだろうか。 国内唯一の「ユニコーン企業」とも称される、株式会社メルカリ。同社の東京オフィスでは、2018年4月時点で7名のデータアナリストから成るBI(Business Intelligence)チームが、経営目標の達成をデータ分析で支える役割を担っている。 チームのマネージャーを務める樫田 光さんは、「『分析こんなに頑張りました』という大げさな資料は、意思決定をする側には必要ない」と語る。 その言葉通り、同社では分析の結果をあくまでもスピード重視で共有。また、できるだけ多くの人がデータを活用できるようにするため、組織を横断した仕組みづくりも強化している。 例えばその活動のひとつ

    大げさな分析資料はいらない。メルカリの「意思決定」を支えるデータアナリストの役割 | SELECK [セレック]
  • 整然データとは何か|Colorless Green Ideas

    整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。 はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。 それでは、どのようなものがデータ分析において扱いやすい形式のデータになるのだろうか。この問題に対する唯一の正しい解答というものは存在しない。しかし、表の形式で表すことができるデータを考える場合、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy d

    整然データとは何か|Colorless Green Ideas
  • 11月の現場会議~お客さま分類「ファン」「サポーター」の違いについて~

    先週、若手スタッフさん中心の「現場会議」をやってました たこ梅には、定例の月例会議には、店長会議とこの現場会議があるんです この日も、いくつかの議題について、意見を出し合って話しあいました 最近、世の中は「人手不足」のようです 飲業界は、その最たるもので「人がおらん!」「人が足らん!!」って、よく耳にします たこ梅も、ホールさんの増員と洗い場さんの退職に伴う補充採用をおこなっています 特に、洗い場さんなんですが、数年前までだと、ハローワークに求人を出すと1週間以内には数名の応募がある、、、のが普通でした ちなみに、なんで数年前まで、、、なのかというと、長く続く方が多いので、数年前から今まで洗い場さんの募集したことなかったから、、、^^;;; (今回退職の洗い場さんも、今年が13年目だったりします) ただ、数年ぶりに求人を出してみて、ほとんど反応がない、、、 それで、洗い場さんとしては、初

    11月の現場会議~お客さま分類「ファン」「サポーター」の違いについて~
  • 1