タグ

DWHに関するmichael-unltdのブックマーク (30)

  • DWH/SQL: データマートの作り方メモ - プログラマ38の日記

    DWHで使い勝手を向上するため、粒度の異なる複数のファクトを加工して1つのデータマートを作成する時があります。 例えば、次のようなデータマートを作成します。 インプットデータ 商品別、年月別の見込みデータがある。 商品別、年月日別で実績データがある。 アウトプットデータ 商品別、年月別で見込み・実績データマートを作る。 (見込み・実績データマートは、商品、年月に対して見込値、実績値を持つ) こういった時のデータマートを作るときは次のようなSQLになります。 select 商品          as 商品 ,年月          as 年月 ,sum(見込値)   as 見込値 ,sum(実績値)   as 実績値 ( select 商品                       as 商品 ,年月                       as 年月 ,見込値           

    DWH/SQL: データマートの作り方メモ - プログラマ38の日記
    michael-unltd
    michael-unltd 2022/08/22
    DM設計
  • DWH: データモデル(8.ナチュラルキーを基本とし、サロゲートキーはピンポイントで使う。) - プログラマ38の日記

    この記事は、前回書いたデータモデリングの9つのことの8つ目です。 crmprogrammer38.hatenablog.com DWHでは、サロゲートキーを使う場合があると思います。 個人的にサロゲートキーをポイントを絞ったほうがいいように感じています。 というのは以下のような場合に保守しずらいと思うからです。 ・金額がおかしいなどの調査の際に、ファクトはディメンションと結合しないとナチュラルキーが判断できない ・ディメンションの作成処理に誤りがあった。ファクトの作成処理に誤りがあった場合、データの復旧が難しい。 ・ディメンション作成後、ファクト作成という順番のため、ディメンション作成でエラーがでると、そのエラーを解決するまでファクトが作成できない。 もちろんメリットもあるので、ポイントを絞って使うものだと思います。 例えば、サロゲートキーを使うことで、来であれば10項目で結合するところ

    DWH: データモデル(8.ナチュラルキーを基本とし、サロゲートキーはピンポイントで使う。) - プログラマ38の日記
    michael-unltd
    michael-unltd 2022/08/22
    サロゲートキー設計
  • Data Warehouse

    Data Warehouse データウェアハウス 企業内の全データをひとつのDBに統合し一元管理する. 単に個々のDBのデータを統合しただけではなく,下記の特徴を備える[1][3]. 目的別編成(Purpse-oriented, サブジェクト指向とも). データを主題ごとに分解・整理して格納してある. 目的別に格納しない点がポイント. 統合(Integrated) データの論理的な統合ができている(コード統一や用語統一が完了した状態のデータになっている). delete/updateはしない. 時系列の編集情報も記録する. (いわゆる暦更新にして)取り消し,削除,変更などの履歴もわかるようにする. Data Mart データマート 目的別に構築された小型のデータウェアハウスのようなもの. 企業内に目的別に複数のマートを構築するため,データが重複されている状態になる. Fact ファクト デ

  • これを読めばあなたもプロフェッショナル!DWH入門 - Analyze IT.

    仕事柄、情報分析目的のRDBMSを触ることが多いのですが、こういった情報分析用途に用いるDBをDWH*1と言います。 以前、勉強会の懇親会でユーザーの立場でこういったシステムの構築に関わっているが、経験がなく、どのように構築していいかわからない。 またこの手の知識をどう勉強していいかわからない。と仰っていた方がいました。 別に大して難しい話でもないのですが、独自の単語が多い上、意外と資料がなくて困る分野だなとは思います。 そういうわけで、もしこの手の分野が難しいと感じている方は損をされています。 ぶっちゃけ、DWHは簡単な概念を少し覚えるだけで、もうプロフェッショナルになれます。 ベンダーやSIerともベシャリまくれることができます。 というわけで、自分なりにDWH関連の初歩の知識である上記の簡単な概念をまとめてみることにしました。 押さえておきたい単語は以下の6つ。 情報系システム、DW

    これを読めばあなたもプロフェッショナル!DWH入門 - Analyze IT.
  • データウェアハウス(DWH)の4つの要件について | DevelopersIO

    こんにちは、DI部の川崎です。 DI部内で、データウェアハウス(DWH)の勉強会を行いました。その中から、データウェアハウス(DWH)の4つの要件についてご紹介します。 テキストはいつものこちらのです。 「10年戦えるデータ分析入門」青木峰郎 著 http://www.sbcr.jp/products/4797376272.html DWHの4つの要件: サブジェクトごとに編成されていること(subject oriented) データが統合されていること(integrated) 時系列データを持つこと(time variant) データが永続すること(non-volatile) それぞれの項目について、詳しくみていきます。 1. サブジェクトごとに編成されていること(subject oriented) サブジェクト(subject)とは「顧客」とか「商品」のようにデータとしてまとまりのあ

    データウェアハウス(DWH)の4つの要件について | DevelopersIO
  • 唐突にデータウェアハウス(DWH)の設計をすることになったので、DWHの設計周りを調べた - Qiita

    前提 筆者のスペック SQLが書ける程度でデータベースに詳しいかと言われるとそうではない新卒1年目のエンジニア(の卵)。 DWHとかデータウェアハウスって聞いたことあるけど具体的に何かはわからない。 DWHに加えてデータマートとやらが必要らしいとは知っていたが、具体的にデータマートが何かわからない。 DWHの4特性を知らなかった。 もちろんDWHの3つのアーキテクチャを知らなかった。 データベースよりむしろフロントエンドの方が好き。 今回の取り組みの目的 DWHの設計方法を理解し、要件に沿った最適な設計が可能になること。(2日で) 以上。 要件 複数のデータソースを元にBIツールでの分析がしたい。そのために必要なDWH・データマートを設計すること。 分析自体の要件は決まっているため、データソースを元にDWH・データマートをどのような設計にするか決定することがゴール。 データウェアハウス(D

    唐突にデータウェアハウス(DWH)の設計をすることになったので、DWHの設計周りを調べた - Qiita
  • 気軽に始めてみよう!クラウド時代のデータウェアハウス超入門 | DevelopersIO

    始めに 私は8年ほど前に情報処理試験でデータウェアハウスというものがあるということを知りました。当時は4択問題で問題文に 意思決定支援 というキーワードが出てきたら何なのかよく分かんないけど選択してました。それからずっと興味がありながら実物に触ったことはなかったのですが、クラウド型のデータウェアハウスが登場し触る機会を得ることができました。以前に比べデータウェアハウスはかなり身近なものになってきたのではないでしょうか。弊社でもAmazon RedshiftというAWSのサービスを利用した案件が増えてきています。 クラスメソッド、POSデータ数十億件をリアルタイム分析する基盤を「Amazon Redshift」「Tableau」で開発 この記事ではデータウェアハウスの知識から分析ツールを使ってAmazon Redshiftに接続するところまで簡単にまとめています。実際にどんなものか、触ったこ

    気軽に始めてみよう!クラウド時代のデータウェアハウス超入門 | DevelopersIO
  • データモデルを活用した データ ウェアハウスの設計

    データ モデルを活用した データ ウェアハウスの設計 Joshua Jones, Eric Johnson 目次 はじめに.................................................................................................................................. 2 データ ウェアハウスの設計.................................................................................................... 2 データ ウェアハウスのモデリング..........................................................................

  • モダンデータスタックとかの話(データエンジニアのお仕事とは)

    datatech-jp Casual Talks #2で発表した内容 https://datatech-jp.connpass.com/event/244516/

    モダンデータスタックとかの話(データエンジニアのお仕事とは)
    michael-unltd
    michael-unltd 2022/08/01
    DataVault設計わかりやすい
  • DWH利用者アンケート2021 - 風音屋

    昨今の経済社会においてデジタル変革やデータ利活用の重要性が日々増しています。経済誌やビジネス書では華やかなデータ活用の事例が次々と紹介されています。そのような事例の裏には、大規模なデータを簡単に処理できるテクノロジーの存在があります。 特に「データウェアハウス製品」はデータ活用を支える中心的なソリューションです。2010年代にクラウドベンダーが次々と台頭したことで、多くの民間企業に普及しつつあります。2020年にはSnowflakeが米国にて上場しました。グローバルで最も注目されている分野の1つだと言えるでしょう。 ソリューション提供者が積極的に情報発信を行っている一方で、ソリューション利用者の意見は散在しています。世のソフトウェアエンジニアたちの技術ブログを読み漁らないと、利用者視点での情報を得ることは難しいのが実情です。 そこでソリューション利用者に対するアンケート調査を実施しました。

    DWH利用者アンケート2021 - 風音屋