タグ

データサイエンティスに関するkingofmountainのブックマーク (4)

  • DATAFLUCT Tech Blog

    2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

    DATAFLUCT Tech Blog
  • Tableau Desktopで超高速DWH『Snowflake』に接続してみた

    この課金モデルだと、ウェアハウスサイズを大きくしても処理時間がその分短くなるので、1タスク当たりのコストは変わらないことが分かる。 例えば、X-Smallで128分掛かるタスクを4X-Largeで実行すると1分で終了するため、それぞれの時間単価を掛けた時のコストはどちらも128となる。 これをうまく利用すれば、大きいタスクが走る時間帯にサイズを上げ、逆にタスクが少ない時間帯はサイズを下げる等の運用ができるようになり、コストを抑えつつもハイパフォーマンスなDWH環境を常に提供することができるようになる。 そこで気になるのが、実際どのくらいの性能なのか。 Snowflakeのトライアルで確かめていく。 2.Snowflakeのトライアルを始める Snowflakeのトライアルでは、1ヶ月で400ドル分のリソースを無料で利用することができる。 試しに1.2TBのデータをスキャンし240億件のデー

    Tableau Desktopで超高速DWH『Snowflake』に接続してみた
    kingofmountain
    kingofmountain 2020/06/10
    Snowflake(スノーフレーク)は、クラウドベースで開発されたデータウェアハウスで、最大の特徴は『高性能なのに低価格』RedshiftやBigQuery等と性能を比較した結果によると、価格性能比でSnowflakeが最も優れているらしい。
  • 株式会社インテージリアルワールド

    healthier decisions 健やかな未来へ導く 我々は情報に命を与え、医療を享受する人、医療を提供する人、 健康を願うすべての人々が納得の選択をするための力となります インテージ リアルワールドについて

    株式会社インテージリアルワールド
  • Excelで基本統計量と度数分布表、ヒストグラムを作る方法 - ムラウェブドットネット

    gaccoといオンライン動画で無料にて学べるサービスを利用し、データサイエンスについて勉強しはじめました。受講している講座は「社会人のためのデータサイエンス演習」というものです。有名企業で勤めている方や大学の教授などが講師として動画でデータサイエンスについて解説していて、受講している感じではとてもわかりやすいなと思います。 講義配信スケジュールとしては以下な感じ。 スケジュール | 講座番号「ga063」を学習する | gacco https://lms.gacco.org/courses/course-v1:gacco+ga063+2016_04/courseware/022bd70ec1bd4cdd8f5090a7aa657814/2e301f733c77478cac30fce22652fcb7/ 主にデータサイエンスに関わることを動画で解説し、基的には週毎に課題の提出が求められてい

    Excelで基本統計量と度数分布表、ヒストグラムを作る方法 - ムラウェブドットネット
    kingofmountain
    kingofmountain 2019/12/23
    Excelのデータ分析メニュー → 基本統計量 で平均値、中央値、標準偏差等が一発で出せる
  • 1