タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

AWSとデータレイクに関するmisshikiのブックマーク (4)

  • 【S3】AWSのデータレイク機能まとめ - Qiita

    はじめに 記事では、AWSにおいてデータレイクを構築してデータ分析に活用するためのサービスを紹介します。AWSにおいては基的にS3がデータレイクにおける基盤となるため、以下の記事も併せて参照ください データレイクとは データレイクとは構造化、非構造化を問わず様々な形式のデータを大量に保管するための仕組みで、主にビッグデータ分析に用いられます。 ビッグデータ分析用のデータ保管方法には、他にもデータウェアハウス(DWH)が挙げられますが、DWHは構造化されたデータベース形式でデータを保持するのに対し、データレイクはCSVやテキストファイル、画像のような非構造化データも保存できる事が特徴です。 ビッグデータ分析の特徴として、数千万行(レコード)以上の大容量データを分析対象として扱う事が挙げられます。このような大容量データを扱うことで、以下のようなメリットとデメリットが生じます。 データレイク

    【S3】AWSのデータレイク機能まとめ - Qiita
    misshiki
    misshiki 2023/07/10
    “AWSにおいては基本的にS3がデータレイクの基盤の役割を果たします。” データレイクのメリットデメリットから、AWSのデータレイク向けサービスについて、Python SDKによる各サービスの使い方までを紹介。
  • Startup.fm: スタートアップのためのデータレイク構築の流れ / Startup.fm: Build a Data Lake in steps

    データウェアハウスやログ分析、機械学習といった進化する分析環境に柔軟に対応する 「データレイク」は今やデータ活用に欠かせないものとなりました。 一方で、現場では以下のような疑問や課題も多く出てきているのではないでしょうか? 「データレイク向けの関連サービスとか多くてなんかよくわからない」 「最初からデータレイクの構築は、ハードル高くて時間もコストもかかるでしょ?」 「手軽に始めたいけど、将来的にスケールできるようにもしておきたい・・・」 「とりあえず今はMySQLとかにデータ入れてるけど、次は何をすればいい?もっといいやり方ないの?」 この度そんなスタートアップのお客様向けに、データレイクセミナーの開催を決定いたしました! これからデータレイクを始めたい方にも、データレイクをさらに効果的に活用したい方にもおすすめです。

    Startup.fm: スタートアップのためのデータレイク構築の流れ / Startup.fm: Build a Data Lake in steps
    misshiki
    misshiki 2021/06/30
    64ページのスライド資料。
  • データレイク解説シリーズ 第 2 回: データレイクのアーキテクチャ - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS

    こんにちは。AWS でアナリティクス領域のソリューションアーキテクトをしている志村です。普段は AWS をご利用いただいているお客様に対して、特にデータ活用や分析に関わる技術的な支援をさせていただいております。私を含めた AWS 社員 4 名で出版準備中のデータレイクの書籍をベースに、全 4 回でそのエッセンスをお伝えする連載の第 2 回をお届けします。今回のテーマは、データレイクのアーキテクチャです。 前回はデータレイクがどういうものか、一般的なデータベースやデータウェアハウスとどう違うのかについて説明しました。その中で、データレイクは「多様なデータを一元的に、大量に保存しておける場所」と言い表しました。しかし実際問題、データレイクを作るとしてどのようなアーキテクチャにすれば良いでしょうか ? またその上でどのような形でデータを活用することができるでしょうか ? そこで今回は、データレイ

    データレイク解説シリーズ 第 2 回: データレイクのアーキテクチャ - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS
    misshiki
    misshiki 2020/04/01
    “今回は、データレイクの典型的な構成について説明した上で、どのようにデータ活用の仕組みを乗せていくことができるか、ざっと見ていきたいと思います。”
  • データレイク解説シリーズ 第 1 回 : データレイクってなに ? - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS

    こんにちは。今回から 4 回の予定でデータレイクについての連載をスタートします。現在データレイクの書籍を 4 名で執筆中なのですが、そこからエッセンスとなるポイントを抜き出し、builders.flash を読んでいただいている皆様にコンパクトにお届けします。第一回は「データレイクってなに?」です。 データレイクを一言で表すならば、多様なデータを一元的に、大量に保存して置ける場所です。データベースに入っているような構造化されたデータも、ソーシャルメディアのメッセージも、画像や音声ファイルも一箇所に集めたデータ置き場という意味です。 これを読んでいる皆様は「データベースでは駄目なの ?」と思われるかもしれませんね。巨大なデータを扱うという意味ではデータウェアハウスもありますが、これとはどう違うのでしょうか? 今回はデータレイク理解の最初の一歩として、データレイクは、データベースやデータウェア

    データレイク解説シリーズ 第 1 回 : データレイクってなに ? - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS
    misshiki
    misshiki 2020/04/01
    “多様なデータを一元的に、大量に保存して置ける場所です。データベース...構造化されたデータも、ソーシャルメディアのメッセージも、画像や音声ファイルも一箇所に集めたデータ置き場”
  • 1