タグ

ブックマーク / blog.studysapuri.jp (9)

  • Kubeflow Pipeline の魅力を最大限に引き出すにはやっぱりコンポーネント化スキルが必要 - スタディサプリ Product Team Blog

    こんにちは、データチームの@masaki925 です。 昨年末にMLOps に関する記事を書きました。 quipper.hatenablog.com 今回はその続編で、レコメンドシステムのJenkins 部分をAI Platform Pipeline (以下AIP Pipeline) に置き換えた話です。 昨今では国内でもKubeflow Pipeline (以下KFP) 系の導入事例がいくつか出ており、特にZOZOテクノロジーズさんの記事は大変参考にさせていただきました。 techblog.zozo.com 今回の話では、まだまだパイプラインを使いこなすところまでは至っていないですが、 最初に導入するにあたっての迷いどころや躓きどころ、反省点など、1事例として紹介できればと思います。 想定読者は、前回同様MLOps 初心者向けとなります。 これからMLOps をやっていきたい方 ML ワ

    Kubeflow Pipeline の魅力を最大限に引き出すにはやっぱりコンポーネント化スキルが必要 - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2023/01/06
    2021 / "DS でもないMLE でもない、TFX エンジニアというロールがあるのではないか / 最近筆者はTFX がMLOps 界のRails のように思えて / 噂によると、Fairing やKale というツールが自動でNotebook からコンポーネント化できる"
  • オンボーディングのはじめかた - スタディサプリ Product Team Blog

    オンボーディングのはじめかた こんにちは。SREの近藤(@chaspy)です。 今回、SREチームではじめてオンボーディングプロセスを実施しました。日はその内容について紹介します。 オンボーディングとは Onboardingとは、新しく入社した従業員が組織の中で効果的に成果を発揮するために、必要なナレッジ、スキル、行動を習得するメカニズムのことを言います。 これは単なる社内サービスへのアカウント登録作業ではありません。また、関連する技術的な研修を受けさせるだけでもなければ、OJTという名のもとに振ったタスクをやりながら覚えてもらうだけでも不足しているでしょう。なぜなら習得すべきことは技術的なスキルだけではないからです。確かに、実際の仕事を通じて学ぶことはできるはずですが、より短期間で、より効果的に必要なことを身に着けてもらうためには何らかの学習のための仕組み(Mechanism)が必要で

    オンボーディングのはじめかた - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2022/03/27
    "私たちは Wiki のようなドキュメントが陳腐化してしまうことをよく知っています / そもそも更新が頻繁に必要にならないように大局的なことだけを書き、手順などの詳細を書かないことが非常に重要"
  • Cloud Dataflow で実現する柔軟なデータパイプライン - スタディサプリ Product Team Blog

    はじめに こんにちは、@shase です。 スタディサプリでは、データパイプラインのツールとして、従来 AWS Kinesis Stream や、Embulk や、AWS Lambda などがよく使われてきました。 ただ、現在開発中のプロジェクトでは、システム間の連携の為、Cloud Pub/Sub が多用されているということもあり、データパイプライン Cloud Pub/Subとの親和性が高いCloud Dataflowを一部取り入れています。 記事では Cloud Dataflow 自体は詳述しませんが、簡単に説明させていただくと、Cloud Dataflowとは、GCP が提供するマネージドな Apache Beam の実行環境になります。 Cloud Dataflow のメリット Cloud Dataflow(Apache Beam)には、以下のようなメリットを感じています。 ス

    Cloud Dataflow で実現する柔軟なデータパイプライン - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2022/02/23
    "Dataflow の ドキュメントによると、現在は Java SDK と Python SDK が対応 / SDK で対応している GCP のコンポーネントが異なり、使う前に確認が必要 / Bigtable が Python SDK で Supported ではないので、Java SDK を使うことに"
  • Working Out Loud 大声作業(しなさい)、チームメンバー同士でのトレーニング文化の醸成 - スタディサプリ Product Team Blog

    ソフトウェアエンジニアリングと一見関わりはなさそうで、しかしチームで成果を出す過程においてとても重要だと筆者が考えているコンセプト、 "Working Out Loud" について書いてみます。 日語の記事がほとんど見当たらないのであまり知られている言葉ではないかもしれません。 対象読者 以下に興味や関心を持つ方を対象読者として想定しています。 チーム開発におけるコラボレーション手法 チーム開発者としての振る舞い方 テックリードやスペシャリストの育成 が、心ではチーム開発する全ての方に届いてほしいです。 まえがき ある夜に同僚の@ujihisaと近場ないし遠方のEngineering ManagerやVPofEの皆さんと話す機会があり、その折にふと筆者がこぼしたのが 「開発などの日常の業務において自分がやっている以下の思考様式が大変便利なので、この考え方を最近入社したメンバーにもインス

    Working Out Loud 大声作業(しなさい)、チームメンバー同士でのトレーニング文化の醸成 - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2021/10/10
    "作業が途中であってもチームメンバーの目の触れる場所にガンガンアウトプットする / 作業で詰まったらとにかく尋ねる / 手伝ってもらえるのに1人で行き詰まっているというのはプロの振る舞いではない"
  • Cloud Composer(Airflow)で分析者向けBigQuery SQL実行基盤をつくりました - スタディサプリ Product Team Blog

    はじめに こんにちは。Data Engineer の @shase です。 弊社ではいくつかのユースケースでCloud Composer(Airflow)を使っているのですが、今回はデータチームで開発している、分析者向けBigQuery SQL実行基盤(社内の通称はSaved Query Workflow)について紹介します。 このシステムは今年の春から動いているものです。 システム概要 今回紹介するシステムの概要です。 分析者はSQLYAMLGitHubにコミットしてPRを作成します。 エンジニアがレビューをします。 Cloud ComposerでSQLがスケジュール実行され、結果がGoogle Sheets などに出力されます。 背景 組織全体のKPI集計やレポーティングとは別に、分析者個人や特定のチームが使うテーブルやレポートを定期的に作成する場合を想定したユースケースとして、分

    Cloud Composer(Airflow)で分析者向けBigQuery SQL実行基盤をつくりました - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2021/06/16
    quipper/embulk-output-google_sheets / "Google Sheets 連携には、Embulkのoutput pluginを自作して利用しています。 (少し検索したのですが、良い既存のpluginがなかったというのもあります)"
  • AWS - GCP の ID 連携を使い、 AWS CodeBuild で Terraform を使って GCP を管理 - スタディサプリ Product Team Blog

    こんにちは。 SRE の @suzuki-shunsuke です。 Google Cloud Platform (以下 GCP) を Terraform で管理するように CI/CD を整備した話を紹介します。 背景 何度かブログで紹介したように、弊社では Terraform を使い AWS を始めとする様々なリソースを管理しています。 quipper.hatenablog.com しかし、 GCP はあまりちゃんと管理できていないという課題がありました。 弊社のサービスはほぼすべて AWS 上で動いており、 IaC が既に整備されています。 一方で GCP も以前から使っていますが IaC は整備されてなく、 SRE がたまに developer (以下 dev) から依頼を受けて、手で Project を作ったり IAM 周りを設定したりしていました。 IaC ができていないため、

    AWS - GCP の ID 連携を使い、 AWS CodeBuild で Terraform を使って GCP を管理 - スタディサプリ Product Team Blog
  • データの民主化に向けて Lookerbot を導入した話と課題と今後 - スタディサプリ Product Team Blog

    はじめまして、データエンジニアリングチームの @toohsk です。 今回は、データの民主化を推進するために導入した Looker 社の Lookerbot という Slack ボットをご紹介します。 Lookerbot ってなによ Quipper では、先の記事「エンジニアを魅了する次世代 BI ツール『Looker』を Quipper が導入した理由(わけ)」でご紹介したように、BI ツールとして Looker を導入しています。 BI を導入した後、Slack などでの会話上でグラフやモニタリングした数値を共有したいと思うシーンはよくあると思いますが、Looker ではそのような用途のために Lookerbot と呼ばれるボットを公開しています。 Lookerbot が提供する主な機能は Look (Looker におけるデータを可視化するコンポーネントの最小単位)に対する、下記の二

    データの民主化に向けて Lookerbot を導入した話と課題と今後 - スタディサプリ Product Team Blog
  • より良い面接を実現するために "Quipper採用面接ガイド" を公開しました - スタディサプリ Product Team Blog

    Engineering Manager の @ohbarye です。 このたび"Quipper Web Engineer 東京オフィス採用面接ガイド"を Quipper Handbook*1 の一部として公開しました。 Quipper Web Engineer 東京オフィス採用面接ガイド (2019-10-09 追記: Quipper iOS Engineer 東京オフィス採用面接ガイド も公開しました!) (2020-01-16 追記: Quipper Android Engineer 東京オフィス採用面接ガイド も公開しました!) 記事では同ガイドについてご紹介させてください。 採用面接ガイドとは? Quipper東京オフィスで行っている採用プロセスについてより多くの方に知っていただくためのドキュメントです。とりわけ面接に訪れる方を読者として想定しており、候補者には面接の日程調整時に

    より良い面接を実現するために "Quipper採用面接ガイド" を公開しました - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2020/09/13
    "採用面接について振り返る中で以下のような課題が挙げられました / こちらの期待することを説明するのに時間を使いすぎてしまう / 特定の説明を毎回機械的に繰り返している"
  • 異動のおともにスキルマップ - スタディサプリ Product Team Blog

    こんにちは、Web Engineer の @wozaki です。 今回は、スキルマップを私が所属する開発チーム*1に導入した事例をご紹介します。 スキルマップとは、業務で必要なスキル(技術力、業務知識)と、チームメンバーのスキルレベルを一覧にした表です。 スキルマップの例 引用 スキルマップ作成のすすめ | Ryuzee.com 目次 概要 スキルマップ導入の背景 他社の事例とカスタマイズした点 スキルマップ詳細と運用方針 運用結果 まとめ 概要 チームで必要なスキル、メンバーのスキルレベル、志向性が不明だった 個人の志向性を表現できるようにカスタマイズしたスキルマップを導入した 結果 新メンバーにとって、スキル全体が明確になり、チームの役割の理解にも役立った スキル喪失リスクがあるものが明確になり、勉強会などスキル伝承のアクションにつながった 個人の志向性は、スキル伝承時の期待値調整にも

    異動のおともにスキルマップ - スタディサプリ Product Team Blog
    sh19910711
    sh19910711 2020/07/04
    "スキルを属人化させることで、チームの学習効果、パフォーマンスを高めるトランザクティブ・メモリーという考え / 組織のメンバーが『ほかのメンバーの誰が何を知っているのか』を知っておく"
  • 1