タグ

datalakeと*devに関するsh19910711のブックマーク (4)

  • Glue + Athenaのローカル開発環境をOSSで構築(MinIO + Trino + HIVE) | moritalous blog

    この環境をDocker Composeを使い構築します。 環境構築​MinIO​まずはS3を置き換えるMinIOからです。 ポイントは path-styleではなくvirtual-hosted styleを使用するため、MINIO_DOMAIN環境変数をセット他のコンテナから[バケット名].minioで名前解決できるようにhostnameを指定path-styleとvirtual-hosted styleの違いはこちらを参照ください。 version: '3' services: minio: image: quay.io/minio/minio hostname: bucket001.minio restart: always volumes: - ./minio/data:/data environment: - MINIO_DOMAIN=minio command: ["server

    Glue + Athenaのローカル開発環境をOSSで構築(MinIO + Trino + HIVE) | moritalous blog
    sh19910711
    sh19910711 2024/05/28
    "MINIO_DOMAIN環境変数をセット + 他のコンテナから[バケット名].minioで名前解決できるようにhostnameを指定 / Trino: 公式イメージが用意 + 必要なのはMinIOをカタログとして使用するための設定ファイル" 2022
  • データ基盤 Knile のプロダクトマネジメントの取り組み

    こんにちは、データエンジニアの多田です。 私は現在、データ利活用基盤「Knile(発音は “ナイル")」の開発をしています。 今回は、私が Knile チームでスクラムマスターからプロダクトマネージャーへと役割が推移していく中で取り組んできた、チーム開発の課題とその対策について紹介いたします。 Knile とは Knile とは、以前 CET と呼ばれていたチームが開発するデータ利活用基盤です。 Knile のビジョンや設計思想については、最近行われた社外への登壇資料があるので、ご覧ください。 第14回MLOps勉強会 CloudNative Days Tokyo 2021 時間軸で取り組むチーム運営 この記事では以下の 4 つのサイクルに分けて取り組みを紹介します。 長期計画 半期 四半期 スプリント(2 週間) チーム運営のサイクル これは実際に業務の中で考える思考の順番でもあります。

    データ基盤 Knile のプロダクトマネジメントの取り組み
    sh19910711
    sh19910711 2023/08/18
    "昨今のデータプロダクト向けクラウドサービスや OSS は変遷が早い / 「いま採用するなら○○だと思うんだけど、なぜ✕✕が採用されたのだろうか」という疑問が尽きることはありません" / 2022
  • Data Platform構築プロジェクト推進の事例と学び

    Data Platform Meetup #1(https://data-platform-meetup.connpass.com/event/142822/)の発表資料です。 エウレカのData Platformとそれを支える組織構成の概要の紹介と 実際にData Platform構築プロジェクトの立ち上げ〜推進をどのように計画実行し、しくじりカバーしてきたかを実例と共に載せています。

    Data Platform構築プロジェクト推進の事例と学び
    sh19910711
    sh19910711 2022/09/10
    2019 / "長期の運用を見据えたフィードバック: 現実的なものを作れているか / 成果物へのフィードバック: 使えるものを作れているか / DataMart: スクラップ&ビルドを前提 + 負債を許容してでも触れるものを作ることに注力"
  • ブラックボックス化したデータ基盤を作りなおすことを決意した貴方へ

    ここ一年くらいデータパイプラインを基盤ごと作りなおしていました。毎時一億レコードくらいは捌くやつです。 わりと長く続いているプロダクトのため、いわゆる技術的負債が溜まっていたりブラックボックス化していたところも多く、当初はエンジニアを倍くらいに増やさないと対処できない見込みでしたが、みんなで奮闘した結果、チームサイズを変えず新規開発の手も止めずに、目立ったダウンタイムや障害なく移行することができました。 振り返って「こうしておいてよかった」「こうしておけばよかった」と思うところを書き残しておこうと思います。また同じようなことに直面した未来の私へ、もしくは貴方へ。 0. 不吉な匂いを嗅ぎわけよう とあるプロダクトにジョインした貴方は、なにかしら不吉な匂いを感じました。 そうです、みんなお馴染み「不吉な匂い」です。たとえば次のようなことがあったのでしょう。 使っているライブラリやフレームワーク

    ブラックボックス化したデータ基盤を作りなおすことを決意した貴方へ
    sh19910711
    sh19910711 2021/11/14
    "漸進的にする + スケジュールの見通しは小まめに共有 > 見積もりというものは恐ろしく難しく + 人間には無理 + 作りなおしは外部から成果が見えにくい + 遅れが目立ってくると、その意義が問いなおされてしまう"
  • 1