Pipelineの人気記事 38件 - はてなブックマーク

1 - 38 件 / 38件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Pipelineの検索結果1 - 38 件 / 38件

パイプライン演算子の歴史 - まめめも
- 432 users
- mametter.hatenablog.com
- テクノロジー
- 2019/06/15
(You can read this article in English.) Ruby の開発版にパイプライン演算子（pipeline operator）が試験的に導入されましたが、いろいろあってプチ炎上になっています（チケット）。せっかくの機会なので、パイプライン演算子の歴史を調べてみました。付け焼き刃の調査なので、間違ってたら教えてください。パイプライン演算子とはこんな感じのものです。 x |> f |> g |> h # h(g(f(x))) と同じ意味 h(g(f(x))) という関数適用の式は、関数が呼ばれる順序（f→g→h）と、プログラムの字面上の順序（h→g→f）が逆でわかりにくいとされます。この問題は、特に、関数が大きくなったときに顕著になります。 wonderful_process_h( marvelous_process_g( fantastic_process
AWS Copilot のご紹介 | Amazon Web Services
- 173 users
- aws.amazon.com
- テクノロジー
- 2020/07/10
Amazon Web Services ブログ AWS Copilot のご紹介 Amazon Elastic Container Service (Amazon ECS) をご利用中、あるいはご利用を検討されている皆さまへ本記事でご紹介する AWS Copilot は Amazon ECS CLI の後継に当たるものです。日本はこの ECS CLI を多くのお客様にご利用いただいている地域の1つであることに加え、ECS でのコンテナ実行をもっと簡単に行えるようにしたい、シンプルなワークフローを実現したいというリクエストを多数いただいていることから、本記事を英語記事と同じタイミングで公開することにしました。 Amazon ECS でのコンテナ実行に新たな体験を提供する AWS Copilot の紹介記事です。お楽しみください！ −トリ (皆さまからの Copilot へのフィードバック、
- aws
- ecs
- あとで読む
- copilot
- Amazon ECS
- dockerfile
- docker
- コンテナ
- aws-copilot
- amazon
データオーケストレーションツールDagsterの紹介
- 172 users
- zenn.dev/datamarket
- テクノロジー
- 2023/05/13
データオーケストレーションとはデータオーケストレーションという言葉をご存知でしょうか？日本ではまだ耳慣れない言葉ですが、data orchestrationでgoogle検索すると実に3000万件以上ヒットし、世界的には十分に市民権を得ている言葉です。Databricksではデータオーケストレーションを以下のように説明しています。データオーケストレーションとはデータオーケストレーションとは、複数のストレージからサイロ化したデータを取り出し、組み合わせて整理し、分析に利用できるようにするための自動化されたプロセスです。このプロセスでは、レガシーシステム、クラウドベースのツール、データレイクといったあらゆるデータセンターが接続されます。データは標準形式に変換されるため、理解しやすく、容易に意思決定に利用できます。オーケストレーションとは、コンピュータシステム、アプリケーション、および
- データ分析
- あとで読む
- データ
- Workflow
- python
- ツール
- 分析
- 仕事
- data
第723回　複雑なコマンドパイプラインを簡単に組み立てる方法 | gihyo.jp
- 163 users
- gihyo.jp
- テクノロジー
- 2022/07/13
パイプライン処理とは GUIは非常に直感的です。はじめて使うアプリであっても、なんとなくそれなりに動かせてしまうという点で、優れたインターフェイスと言えます。しかし効率を突き詰めると、軍配が上がるのはGUIよりもCLIでしょう。本連載の読者であれば、UnixライクなOSのCLIが持つパワーについては当然ご存知かと思います。とはいえ、古典的なUnixコマンドの多くは、単体ではそれほど強力なものではありません。というのも、ひとつひとつのコマンドはシンプルに、特定の用途においてのみ上手く動作するよう設計されていることがほとんどだからです。こうしたコマンド群に無限のシナジーを与えるのが「パイプライン処理」です。標準入出力を通じて複数のコマンドを直列に繋げることで、複雑な処理をインスタントに組み立てることができるパイプラインは、まさにUnix哲学の体現であり、CLIの真髄はここにあると言ってもよい
- linux
- CLI
- コマンド
- shell
- docker
- terminal
- command
- あとで読む
- tool
データ活用基盤の今〜DWH外観図〜 - クックパッド開発者ブログ
- 122 users
- techlife.cookpad.com
- テクノロジー
- 2019/10/18
こんにちは、今年の1月に会員事業部から技術部データ基盤グループへ異動した佐藤です。先日、京まふ2019前夜祭イベントに参加するために人生で初めてピカピカ光る棒を買いました。新卒で入社してから2年ほど分析作業をしていた身から、データ活用基盤を作る側へ立場を変えました。今回は新たに身を移したデータ活用基盤の外観を説明したいと思います。 2017年にも同内容の記事が投稿されていますので、当時との違いを中心に説明していきます。外観図以下が2019年10月現在におけるクックパッドのデータ活用基盤の全体像です。クックパッドのDWH外観図 masterデータのインポートがMySQL以外にも複数種対応し始めたことと、PrismとSpectrum（S3＋Glue）周りと、Tableau Serverが大きな変更点となっています。2017年の図にDmemoはありませんでしたが、記事本文にある通り当時か
- dwh
- あとで読む
- データ基盤
- dataWareHouse
- cookpad
- database
- データ
- 分析
- AWS
GPTが単純に回答するだけでなく、動的に振る舞えるようになる　Groundingを使ったプロンプティング「ReAct」の流れ
- 90 users
- logmi.jp
- テクノロジー
- 2023/07/23
ユーザーの立場ではAIネイティブな働き方が身近に迫っており、データサイエンティストやMLエンジニアにとってはGPTを活用した開発を意識する必要が出てくる中、マイクロソフトの取り組みやML開発のパラダイムシフトをご紹介する「ChatGPTによって描かれる未来とAI開発の変遷」。ここで日本マイクロソフト株式会社の蒲生氏が登壇。次に、ReActについてと、ReActにおけるプロンプトの流れについて話します。前回はこちらから。外部情報を取得して文脈として与える考え方「Grounding」蒲生弘郷氏（以下、蒲生）：時間的にはあと5分しかないんですが、すみません、延びるのを前提でやらせてもらいます。外部情報を取得して文脈として与える考え方に「Grounding」というものがあります。いきなり出てきて何なのかという話になってくるんですが、いわゆるBing Chatに近いものです。 Bingは基本的
- ChatGPT
- AI
- あとで読む
- 人工知能
- pipeline
- 文章生成AI
- chat
- React
- techfeed
- 検索
PythonでApache beam 入門
- 87 users
- shunyaueta.com
- テクノロジー
- 2020/12/26
2020-12-26 TensorFlowの勉強をしていたら、Apache beam を前処理に採用していたケースがあり、興味を持ったので深堀りしてみます。興味が湧いたモチベーションとしては、データ量が増加しても前処理部分を難なくスケールできそう(前処理部分をスケールさせて高速に実験を回したい、並列化などはすべて良い感じにbeamに任せれそうバッチとストリーミングの両者に対応可能なので、柔軟な機械学習の推論サービスが提供できるのでは? (GCPの参考資料 Data preprocessing for machine learning: options and recommendations)Apache beam を触りつつ分散データ処理を学びたいhttps://github.com/jhuangtw/xg2xg#services を見てみるとGoogle 内部のFlume という並列
- beam
- apache
- あとで読む
- Dataflow
- Python
MLOps: 機械学習における継続的デリバリとパイプラインの自動化を翻訳してみた - Qiita
- 74 users
- qiita.com/arrowKato
- テクノロジー
- 2020/05/20
表1(翻訳者により追加) MLOpsにおいて、DevOpsから追加された項目以下では，予測サービスとして機能するMLモデルのトレーニングと評価の代表的な手順を説明します． MLのためのデータサイエンスの手順どのMLプロジェクトでも、ビジネスユースケースを定義して成功基準を確立した後、 MLモデルを本番環境にデリバリする過程には次の手順が含まれます。これらの手順は手動で完了することも、自動パイプラインで完了することもできます。データ抽出： MLタスクのさまざまなデータソースから関連データを選択して統合します。データ分析：探索的データ分析（EDA）を実行して、MLモデルの構築に使用可能なデータを把握します。このプロセスにより、次のことが起こります。モデルが期待するデータスキーマと特性を理解します。モデルに必要なデータの準備と特徴量エンジニアリングを特定します。データの
Kubeflow Pipelinesで日本語テキスト分類の実験管理 - やむやむもやむなし
- 63 users
- ymym3412.hatenablog.com
- テクノロジー
- 2020/01/07
機械学習ワークフロー管理ツールであるKubeflowのPipelines機能を使って日本語テキスト分類の実験管理を行います。この記事ではKubeflowのチュートリアルに従ってKubeflowのクラスタを構築してPipelinesを動かし、最後に日本語のデータセットをKubeflow Pipelinesに実際に乗せて機械学習のワークフロー管理を行うところまでまとめていきます。 Kubeflow Kubeflowとは Pipelinesとは GKEでKubeflowクラスタの構築クラスタ構築 Workload Identityの設定 Pipelinesの基本的な使い方 Pipeline/Experiment/Run PipelineとComponent PipelineとDSL 実験管理としてのKubeflow Pipelines 日本語テキスト分類 with Pipelines Pip
- kubeflow
- GCP
- 機械学習
- kubernetes
- あとで読む
- pipeline
- mecab
TypeScriptで関数型プログラミングしたい勢に推したいPipeline operatorの良さ - タオルケット体操
- 49 users
- hachibeechan.hateblo.jp
- テクノロジー
- 2019/12/19
前置き Rubyで一瞬だけ湧いて出てきて消えたPipeline風演算子については忘れてください。あれはメソッド呼び出しの演算子であって今回取り上げるPipeline operatorとは似て非なるものです。 JavaScripterでも、Ramda.jsやRxJSを普段から使っている人には既知の内容だと思うのでこの記事は読まなくて大丈夫です。ちなみに僕のステータスは関数型にわか勢なので認識に間違いがあったらなんらかの訂正もらえるとうれしいです。 Pipeline operatorとは古くはML系の言語で定義されてF#やElixirの流行で一般に有名になった演算子こと |> です。 f a を a |> f と書けるようになります。詳しくはこちらで: https://mametter.hatenablog.com/entry/2019/06/15/192311 覚えた方がいい理由 Ty
- TypeScript
- あとで読む
- js
- idea
PythonのPipelineパッケージ比較：Airflow, Luigi, Gokart, Metaflow, Kedro, PipelineX - Qiita
- 46 users
- qiita.com/Minyus86
- テクノロジー
- 2020/02/04
PythonのPipelineパッケージ比較：Airflow, Luigi, Gokart, Metaflow, Kedro, PipelineXPythonワークフローデータサイエンスPipelineETL この記事では、Open-sourceのPipeline/Workflow開発用PythonパッケージのAirflow, Luigi, Gokart, Metaflow, Kedro, PipelineXを比較します。この記事では、"Pipeline"、"Workflow"、"DAG"の単語はほぼ同じ意味で使用しています。要約 👍: 良い 👍👍: より良い 2015年にAirbnb社からリリースされました。 Airflowは、Pythonコード（独立したPythonモジュール）でDAGを定義します。（オプションとして、非公式の dag-factory 等を使用して、YAML
- workflow
- python
- Airflow
- MLOps
- あとで読む
機械学習プロジェクト向けPipelineライブラリgokartを用いた開発と運用 - エムスリーテックブログ
- 43 users
- www.m3tech.blog
- テクノロジー
- 2019/09/30
こんにちは。前回書いた突撃！隣のキーボード M3 2019という記事が、HHKBの公式Twitterアカウントにツイートされ、舞い上がっているエムスリーエンジニアリングGの河合 (@vaaaaanquish) です。今回はエムスリー AIチームが開発、運用している機械学習プロジェクト向けのPythonライブラリである「gokart」の説明と、その周辺ライブラリとなる「cookiecutter-gokart」「thunderbolt」「redshells」について紹介したいと思います。よろしくお願いします。はじめに Pipeline化のメリット・デメリット Pipeline化のメリット Pipeline化のデメリット gokart 共通化のための出力ファイル形式の制約と拡張強力かつ簡易な再現性のためのデータ保持クラウドサービスやSlack通知のサポート gokartのメリット、デメリ
Apache Airflowでエンドユーザーのための機械学習パイプラインを構築する Part5 (End)
- 37 users
- medium.com
- テクノロジー
- 2019/09/27
We organized Japanese financial reports to encourage applying NLP techniques to financial analytics. You can download… Part4からずいぶん間が空きましたが、その間にはデータ公開にまつわるもろもろの調整などがあったという。 Airflowを採用しなかった理由最終的にAirflowを採用しなかった理由は2つあります。運用コスト開発コスト運用コスト Part3でも触れましたが、Airflowのホスティングは結構高くつきます。ホスティングサービスを提供しているのはGCPのCloud ComposerとAstronomerの2つが主です。Astronomerの場合は月額$100まで抑えることが可能ですが、固定で毎月かかるとなるとそこそこの金額です。スケジューラーは、スケジュー
- pipeline
- aws
- あとで読む
- 機械学習
- AI
Attacking and Securing CI/CD Pipeline
- 32 users
- speakerdeck.com/rung
- テクノロジー
- 2021/10/20
ATT&CK-like Threat Matrix for CI/CD Pipeline on GitHub: https://github.com/rung/threat-matrix-cicd -------- Place: CODE BLUE 2021 OpenTalks at Tokyo Presenter: Hiroki SUEZAWA (https://www.suezawa.net) Abstract: With the popularization of Dev(Sec)Ops, the CI/CD (Continuous Integration and Delivery) environment is becoming more and more common in modern application development and infrastructure man
- security
- devops
- CI
- Mercari
- cd
レガシー化したData Pipelineの廃止 ― メルカリのData Architectのお仕事例｜Mercari Analytics Blog
- 30 users
- note.com/mercari_data
- テクノロジー
- 2021/08/31
Analytics Infra チームの@hizaです。この記事ではメルカリの分析環境を改善した事例を紹介します。今回は「運用に課題があってリプレースしたいが、業務への影響が大きすぎてリプレースできない」そんな板挟みな状況を解決した事例です。また、その紹介を通じてメルカリのData Architectがどんな仕事をしているのかその一部を感じてもらえる記事をめざしました。メルカリのデータ活用の現状メルカリには様々な職種でデータを活用する文化があります。 AnalystやML Engineerの他にも、PdMやCustomer Supportなども業務にデータを活用しています。結果として社内のBigQueryユーザー数は月間800名を超えるほどになりました。こういった環境ではデータが良く整備されている事が事業の成果に大きく影響しえます。例えば、使いやすいDWHがあれば多数の社員の業
- architecture
scikit-learnで機械学習パイプラインをインタラクティブに描画、HTML保存する方法 - Qiita
- 29 users
- qiita.com/sugulu_Ogawa_ISID
- テクノロジー
- 2020/09/11
本記事では、scikit-learnのv0.23から搭載された、インタラクティブなパイプライン確認の実装、そしてそれをHTML化して保存、活用する方法を解説します。環境 scikit-learn==0.23.2 Google Colaboratory 本記事の実装コードはこちらに置いています https://github.com/YutaroOgawa/Qiita/tree/master/sklearn 実装 [1] バージョン更新まず、Google Colaboratoryのscikit-learnのバージョンが2020年9月ではv0.22なので、v0.23へと更新します。 !pip install scikit-learn==0.23.2 pipで更新したあとは、Google Colaboratoryの「ランタイム」→「ランタイムを再起動」を実行し、ランタイムを再起動します。（
TFXとは何だったのか、現状どうなっているのか - Qiita
- 28 users
- qiita.com/Ryuichirou
- テクノロジー
- 2019/12/22
この記事では機械学習パイプラインを本番環境にデプロイするためのエンドツーエンドなプラットフォームの提供を目指す、TFXについて述べます。 TL;DR The TFX User Guide が一番詳しいのでこれを読みましょう。 TFX とは TensorFlow Extended (TFX) は次の3つのうちのいずれかを指します。機械学習パイプラインの設計思想設計思想に基づいて機械学習パイプラインを実装するためのフレームワークフレームワークの各コンポーネントで用いられるライブラリ以降ではまず、設計思想としての TFX に触れ概略を紹介します。次に、設計思想に基づき、コンポーネントを機械学習パイプラインとしてまとめ上げ、構築を行うライブラリについて紹介します。最後に、各コンポーネントで用いられるライブラリを見ることで、それぞれのライブラリが提供する機能について紹介します。設計思想とし
- tensorflow
- tfx
- 機械学習
- pipeline
- machinelearning
- あとで読む
- HotEntry
- qiita
AWS_ETL_services_tips_202107.pdf
- 25 users
- pages.awscloud.com
- テクノロジー
- 2021/11/15
SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム（後編） - コネヒト開発者ブログ
- 25 users
- tech.connehito.com
- テクノロジー
- 2022/03/28
皆さん，こんにちは！機械学習エンジニアの柏木（@asteriam）です．今回は前回のエントリーに続いてその後編になります． tech.connehito.com はじめに後編は前編でも紹介した通り以下の内容になります．後編：SageMakerのリソースを用いてモデルのデプロイ（サービングシステムの構築）をStep Functionsのフローに組み込んだ話モデル学習後の一連の流れで，推論を行うためにモデルのデプロイやエンドポイントの作成をStep Functionsで実装した内容になります．今回紹介するのは下図の青枠箇所の内容になります．検閲システムのアーキテクチャー概略図目次はじめに Step Functionsを使ってサービングシステムを構築する方法学習済みモデルを含んだ推論コンテナの設定（モデルの作成）エンドポイントの構成を設定エンドポイントの作成とデプロイ機械
- 機械学習
- aws
- 開発
- HotEntry
Airbyte | Open-Source Data Integration Platform | ELT tool
- 24 users
- airbyte.com
- テクノロジー
- 2021/01/28
15,000+(data) practitioners use Airbyte to sync from the largest catalog of structured and unstructured data sources to data warehouses and databases.
- ETL
- startup
- OSS
- API
- data
- GitHub
- あとで読む
- airbyte
CI/CDの巨大パイプライン、デプロイを高速化するには？〜インフラにおけるScrewdriver.cdカスタマイズ事例
- 16 users
- techblog.yahoo.co.jp
- テクノロジー
- 2020/03/30
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、ヤフーで社内向けCaaS（Kubernetes）環境を提供している岸本です。アプリケーションを継続的にリリースするためには、CI/CDは欠かせない物となっており、ヤフーでもCI/CDを用いたデプロイを行っております。社内ではCI/CDツールとして、ヤフーとVerizon Mediaが共同開発しているScrewdriver.cdを利用し、アプリケーションのビルドやテスト（Continuous Integration/継続的インテグレーション、Continuous Delivery/継続的デリバリー）に限らず、さまざまな環境へのリリース（Continuous Deployment/継続的デプロイ）も行っています。今回
GitHub - apptension/saas-boilerplate: SaaS Boilerplate - Open Source and free SaaS stack that lets you build SaaS products faster in React, Django and AWS. Focus on essential business logic instead of coding repeatable features!
- 16 users
- github.com/apptension
- テクノロジー
- 2020/09/01
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- aws
- boilerplate
- cdk
- django
monorepoのCI/CDで変更された部分だけをビルド/デプロイする - orangain flavor
- 9 users
- orangain.hatenablog.com
- テクノロジー
- 2020/05/06
2020-07-11: Cloud Buildでの記述が誤っていたので修正しました。はじめに今年のゴールデンウィークは暇があり、勤務先で複数のリポジトリを使っているのが辛く感じてきていたため、monorepoについて調べてみました。monorepoについての説明やメリットについては他の記事に譲ります。 www.graat.co.jp この参考記事でmonorepoの本当の課題として挙げられている以下の4点のうち、3点目に相当する「CIで変更によって影響を受けた部分だけをビルドする方法」を調査・検討しました。トランクベース開発は、より一段と重要になりますすべてのサービスがモノレポで上手く動くわけではありませんより精巧なCIセットアップが必要ですあなたは大規模な変更について考える必要がありますこの参考記事ではnxが挙げられていますが、nxは主にJavaScriptのプロジェクトを
- ci
- circleci
- git
- github
スタートアップでもバッチワークフローの使い分けはあり　Amazon MWAAからの一元管理で安心感のある運用を
- 8 users
- logmi.jp
- テクノロジー
- 2021/07/01
スタートアップのエンジニアの交流や知見の共有を目的とする、AWS Startup Community 主催の技術系オンラインイベント「AWS Startup Tech Meetup Online #5」。ここで、株式会社カケハシの福田氏が、「スタートアップにおけるデータ基礎バッチワークフローの変遷」をテーマに登壇。バッチワークフローの課題と、変更後の運用を紹介します。自己紹介福田貴之氏（以下、福田）：「スタートアップにおけるデータ基礎バッチワークフローの変遷」と題して、株式会社カケハシの福田が発表します。自己紹介です。株式会社カケハシで、データ基盤のプロダクトオーナー兼エンジニアやってます。経歴としては、2007年新卒で、某Yでモバイル向けサービス開発・運用などをやり、あとソーシャルゲームが流行っていたので、そのあたりでログ基盤を6年ぐらい見ていました。あとベンチャーをいくつかまわっ
Jenkinsfileの書き方 (Jenkins Pipeline) - Qiita
- 8 users
- qiita.com/zizu21105
- テクノロジー
- 2019/07/04
まずはじめについ先日、はじめてjenkins pipelineのためのJenkinsfileを作成し、PHPアプリケーションのワンクリックデプロイを実現しました。今回は振り返りの意味も込めて、その際に事前に知っておくと良かった点をまとめていきます。これから、Pipelineを構築したい方は参考にしてみてください。環境は以下の通りです。 CentOS: 7.3.1611 Jenkins Version: 2.73.2 私の場合は、Pipelineを作成する前にRubyで書かれたCapistranoというデプロイツールでリリース用のスクリプトをすでに構築・運用済みでした。慣れてしまえば十分な環境でしたが、毎回コマンドを叩く手間と増加するチームメンバーへの共有コストを考えるとよりシンプルな手順が必要だと感じてきたため、Jenkinsへの移行を決断しました。移行プロセスとして、ゼロからCap
- Jenkins
GitHub - dagger/dagger: Application Delivery as Code that Runs Anywhere
- 8 users
- github.com/dagger
- テクノロジー
- 2022/04/03
Dagger is a tool that lets you replace your software project's artisanal scripts with a modern API and cross-language scripting engine. Encapsulate all your project's tasks and workflows into simple functions, written in your programming language of choice Dagger packages your functions into a custom GraphQL API Run your functions from the CLI, your language interpreter, or a custom HTTP client Pa
- ci
- dagger
- Go
データ分析コンペで使っているワイの学習・推論パイプラインを晒します - ギークなエンジニアを目指す男
- 8 users
- www.takapy.work
- テクノロジー
- 2019/12/14
こんにちは！たかぱい（@takapy0210）です。本記事はKaggle Advent Calendar 2019の14日目の記事です。昨日はkaggle masterのアライさんのKaggleコード遺産の記事でした！とても参考になり、いくつか自分の遺産にも取り入れさせていただきました。さて本日は、以前から何回かLTさせていただいていたオレオレパイプラインを公開しましたので、簡単にご紹介できればと思います。はじめにパイプラインについて実行方法補足 config.yamlについて 15_show_all_features.pyについて作成される画像ファイルについて終わりにはじめに元々、パイプラインが良い感じにできたら公開したいな〜と思っていたのですが、何回かLTする中で、ありがたいことに以下のようなお声をいただき、あっ、Kaggleのアドベントカレンダーで公開すれば丁
GA → Airbyte → Snowflake(Snowpark for Python) のELT(EL)パイプラインを作ってみた - ABEJA Tech Blog
- 7 users
- tech-blog.abeja.asia
- テクノロジー
- 2022/12/20
この記事はABEJA Advent Calender20日目、及びSnowflake Advent Calender23日目の記事になります。はじめに各々の技術について大雑把に紹介 Snowflake Snowpark Airbyte 環境構築 Airbyte Google Analytics Google Search Console Snowflake Connection Snowpark 今回の処理結局Snowparkが使えると何がいいか最後にはじめにこんにちは@Takayoshi_maです。今日はGoogle Analytics(UA) → Airbyte → Snowflake (Snowpark for Python)という流れでデータの抽出、加工を行います。各々の技術について大雑把に紹介 Snowflake Snowflake社（ティッカーコード: SNOW）
- Snowflake
GitHub Actions / Azure Pipelines で Pull Request に特定のラベルが付けられた時だけ処理を行う - しばやん雑記
- 5 users
- blog.shibayan.jp
- テクノロジー
- 2021/01/13
個人的によく使っていて時々 Pull Request も投げている Durable Functions の開発リポジトリでは、全ての Pull Request に対しては基本的なテストのみ実行し、full-ci というラベルが付いた時のみ全てのテストを実行するようになっています。実際に以前投げた Pull Request は影響範囲の広い修正だったので、full-ci ラベルが付けられてテストを全て実行し、パスしたのを確認してマージされました。理想的には全ての Pull Request で全てのテストを実行するべきなのでしょうが、テストに関しては時間的な制限もあって難しいので、この運用は個人的にかなり良い感じだと思っていました。常に全てのテストを実行する必要がないことは開発中していて気が付きますし、テストに時間がかかってマージやリリースが遅れ始めるとテストが邪魔扱いされかねません。そ
Netflix開発のMLワークフローツール，Metaflowを試してみた【概要編】 - Qiita
- 5 users
- qiita.com/tatamiya
- テクノロジー
- 2019/12/10
Netflixから機械学習ワークフロー管理用のPythonライブラリ，Metaflowがリリースされました。これを使うと，データ処理・モデル構築プロセスを統一フォーマットで記述でき，全体のフローを追いやすいモデル・前処理工程のバージョン管理ができる AWS環境上での分散処理が可能といったメリットがあります。気になる人は，tutorialを動かしつつ公式ドキュメントに目を通してみましょう。 Tutorialについては，pip install metaflowでライブラリを入れた後，とするだけで一式揃いますので，気軽に試すことができます。本記事では，ざっくりとした機能概要と使い方をまとめていきたいと思います。ライブラリ概要 Metaflowでは，データ処理や機械学習モデル構築・予測のワークフローをPythonのクラスとして定義し，コマンドラインから実行します。その際実行の都度
- MLOps
- Netflix
- python
- qiita
- metaflow
Pixar社のUSDパイプライン – Visual Crossing
- 5 users
- indyzone.co.jp
- テクノロジー
- 2019/12/18
Written by Leif Pedersen Edited by Dylan Sisson, F. Sebastian Grassia, George ElKoura 日本語訳手島孝人 COMPLEXITY SIMPLIFIED トイ・ストーリー４は１兆ポリゴンを超える世界を描いた、ピクサー史上最も大規模な映画である。絶え間ないレンダリング技術とデータ管理の進化のおかげでピクサーのテクニカルアーティストたちはこのクリエイティブで複雑なビジョンを実現することができた。そのワークフローの最前線でピクサーの映画製作パイプラインを今の姿に変えたのが、USD（ユニバーサル・シーン・デスクリプション）である。パイプラインとはなんだろう？簡単に言えば、複雑で大規模なプロセスを予測可能で信頼性の高いものにするツールセットだ。従来のパイプラインの概要を図に示した。これは最終的なフレームにたどり着くま
- Pipeline
データパイプラインの管理～ワークフロー管理に利用できる、さまざまなAWSサービス | gihyo.jp
- 4 users
- gihyo.jp
- テクノロジー
- 2023/04/15
はじめに本連載の第2回では様々なデータソースからの収集について、第3回では収集されたデータの管理についてそれぞれ解説してきました。今回は、それぞれのデータの収集から分析するまでの処理の流れを管理するデータパイプライン管理に着目し、求められる要素や関連するサービスとその使い分けについて解説します。データパイプラインとETL 分析するためのデータを様々なデータソースから収集してデータレイクのような基盤で実際に分析できる状態にするまでには、一般的にいくつかのサービスや機能、処理を組み合わせて実現します。このようにデータの抽出（Extract⁠）⁠、変換（Transform⁠）⁠、ロード（Load）の一連のフロー（流れ）をETLと呼び、データソースやデータの種類ごとに異なるフロー（パイプライン）を構成する必要があります。さらにこの処理は当然ながら自動化することが一般的です。なお、データウェア
- article
- あとで読む
Build pipelines with Pandas using “pdpipe”
- 4 users
- towardsdatascience.com
- テクノロジー
- 2020/07/28
IntroductionPandas is an amazing library in the Python ecosystem for data analytics and machine learning. They form the perfect bridge between the data…
- Python
学習・推論パイプラインを構築する上で大切にしていること
- 4 users
- speakerdeck.com/takapy
- テクノロジー
- 2019/12/01
kaggleやSIGNATEなどの分析コンペで使用する学習・推論パイプラインを構築する上で大切にしていること
Pixar, Adobe, Apple, Autodesk, and NVIDIA Form Alliance for OpenUSD to Drive Open Standards for 3D Content
- 4 users
- www.linuxfoundation.org
- テクノロジー
- 2023/08/02
5 MIN READ Pixar, Adobe, Apple, Autodesk, and NVIDIA Form Alliance for OpenUSD to Drive Open Standards for 3D Content The Linux Foundation | 01 August 2023 Alliance to Foster Global Collaboration for Universal Scene Description (USD). SAN FRANCISCO – Aug. 1, 2023 – Pixar, Adobe, Apple, Autodesk, and NVIDIA, together with the Joint Development Foundation (JDF), a part of the Linux Foundation family
- コンピュータ
GitHub - rung/threat-matrix-cicd: Threat matrix for CI/CD Pipeline
- 4 users
- github.com/rung
- テクノロジー
- 2021/11/30
A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
- CI
- security
- CD
- framework
- github
GitHub - elkowar/pipr: A tool to interactively write shell pipelines.
- 4 users
- github.com/elkowar
- テクノロジー
- 2022/07/14
Pipr is a commandline pipe-building tool, written in Rust! Pipr can automatically evaluate the pipeline you're editing in the background, showing you the results as you go. This makes writing complex sed and awk chains a lot easier, as you'll immediately see what they do. Because this could be dangerous, (imagine typing rm ./*.txt to delete all text files, but it already being executed at rm ./*,
- github
Create and manage Azure Pipelines from the command line - Azure DevOps Blog
- 3 users
- devblogs.microsoft.com
- テクノロジー
- 2019/07/11
We recently introduced a unified YAML experience in Azure Pipelines where you can configure pipelines to do CI, CD or CI and CD together. Over the past few months we have been building capability to manage YAML backed pipelines from the command line to cater to developers who prefer working from the command line interface or require commands to automate set up and management. We are excited to ann
- 開発
- *あとで読む