タグ

ブックマーク / devblog.thebase.in (7)

  • 「Changelogを読んで自分のエンジニアキャリアを作る」というLTのこぼれ話 - BASEプロダクトチームブログ

    はじめまして!フロントエンドエンジニアのがっちゃん( @gatchan0807 )です。 9月7日にBASE主催で「BASE Engineer 座談会 〜BASEの若手エンジニアがそれぞれの今と未来を語る!〜」というイベントを実施したのですが、その中のLTパートで発表した「Changelogを読んで自分のエンジニアキャリアを作る」でお話しきれなかった部分があったので、そこも含めてお話した内容を記事にまとめなおしました! 当日ご参加いただいてLTを聞かれた方も、そうでない方も、ぜひご覧ください! 「Changelog」と「エンジニアキャリア」がどう繋がるのか 早速この記事でお伝えしたいことから書いてしまうのですが、 Changelogは最新機能だけでなく、未来のビジョンも含めたプロダクトの情報の宝庫で、それらをうまく使えばエンジニアキャリアづくりに活かせる! ということを記事を読んでいただい

    「Changelogを読んで自分のエンジニアキャリアを作る」というLTのこぼれ話 - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2024/05/07
    "dependabotの対応でライブラリのChangelogを読む / Changelog: アップデート対象そのものの知識をつけるのに効率が良い / ChromeのChangelogを読んだ際にDevToolsの知らなかった機能をいくつも発見" 2021
  • LLMを利用したテキストアノテーションのツール化 - BASEプロダクトチームブログ

    記事は BASE アドベントカレンダー 2023 の15日目の記事です。 はじめに こんにちは。BASEのデータ分析チーム(Data Strategy Team)で不正対策を行ったり、機械学習を触ったりしている竹内です。 ChatGPTGPT-3.5 Turbo)が2022年の11月に公開されてから、だいたい1年以上が経ったことになります。 そしてこの1年近くでChatGPTに匹敵する多数のLLMの公開や国産LLM作成の動き、拡散モデルを主軸とした画像生成AIの台頭など様々なムーブメントがあり、それを経て「生成AI」という単語は2023年の流行語大賞に選ばれるほど人口に膾炙する結果となりました。 生成AI、特にChatGPTをはじめとする対話用にチューニングされた大規模言語モデル(以下チャットLLMと表記します。)の実応用という面に関していうと、人の代わりに文章を作成させたり、知りたい

    LLMを利用したテキストアノテーションのツール化 - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2024/05/04
    "LLMにアノテーションさせる / 低コストで十分な量および質データセットを作成することが可能 / ChatGPT: 出力をOpenAIとの競合となるようなモデルの学習目的で利用することが規約で禁止" 2023
  • オフライン「リハビリ」勉強会をやってみたらだいぶ良かった! - BASEプロダクトチームブログ

    10点満点でつけてもらったアンケートの回答です。 ごあいさつ はじめましての人ははじめまして、こんにちは!フロントエンドエンジニアのがっちゃん( @gatchan0807 )です テックブログに出てくるのはお久しぶりです 今回の記事では、4月末に社内で実施したイベント 「あの頃のオフライン勉強会の感覚を取り戻そう! オフラインリハビリ勉強会」 という取り組みをご紹介します! どんなイベント? BASE には #iikanji-conference-toudan というワーキンググループがあり、外部カンファレンスやイベントでの登壇の支援をしていく活動をしています (詳しくは2022年のアドベントカレンダーの記事で振り返りを行っているのでそちらをご覧ください!) devblog.thebase.in 今回の「あの頃のオフライン勉強会の感覚を取り戻そう! オフラインリハビリ勉強会」(以下、オフラ

    オフライン「リハビリ」勉強会をやってみたらだいぶ良かった! - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2024/04/18
    "懇親会で人と話したことが話すネタになるきっかけになることもあった / 「カンファレンスの廊下」を何らかの形で社内に擬似的に作る / 資料なしのLTって慣れていないとすごく難しい" 2023
  • 分析基盤へのデータ連携処理をEmbulkからAmazon Aurora S3 Export機能に切り替えた話 - BASEプロダクトチームブログ

    はじめに こんにちは!Data Platformチームでデータエンジニアとして働いている @shota.imazeki です。 分析基盤の構築・運用などの側面から社内のデータ活用の促進を行っています。 BASEではAurora MySQLにあるデータをEmbulkを用いてBigQueryに連携しています。BigQueryへ連携されたデータは分析基盤としてLookerなどを通して社内利用されています。 このデータ連携処理にはいくつかの課題があり、それを解決するためにEmbulkからAurora S3 Export機能を用いた連携処理に切り替えることにしましたので、それについて紹介していきたいと思います。 ※この切り替えについては現状、試験的に一部のDBのみの切り替えとなっていますが、運用上の大きな課題が出てこなければ徐々に切り替えていく予定です。 切替前のデータ連携処理 先述した通り、BAS

    分析基盤へのデータ連携処理をEmbulkからAmazon Aurora S3 Export機能に切り替えた話 - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2024/04/14
    "Aurora MySQLにあるデータをEmbulkを用いてBigQueryに連携 + Lookerなどを通して社内利用 / Aurora S3 Export: 100GBで$1.2~1.3程度 / RdsStartExportTaskOperator: Airflowサーバーのバージョンが低くて利用ができなかった"
  • リモートワークで読書会を効果的にやるための工夫 - BASEプロダクトチームブログ

    この記事はBASE Advent Calendar 2020 19日目の記事です。 devblog.thebase.in BASE株式会社 Product Dev Division エンジニアの田中(@tenkoma)です。 10月から、ドメイン駆動設計入門 ボトムアップでわかる!ドメイン駆動設計の基の社内読書会をオンラインミーティングでやっています。 開発チーム内で設計や実装パターンについて議論できる知識を増やす目的で始めましたが、オンライン開催で、進行難しそうだな、と思いました。最初の4回くらいは、うまく進められてないと感じていましたが、最近はツールの活用法を理解したり、参加者の皆さんに助けられたりして、進められるようになったと思います。 社内読書会の進行役として何をやっているかや、改善したところを紹介します。 開催の形式 週1回 火曜日16:00〜17:00(現状) Slack

    リモートワークで読書会を効果的にやるための工夫 - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2022/12/21
    2020 / "読書タイムが終わった時点で、すでに GitHub Issue にコメントがたくさん書かれていたのでそれをZoomで映しながら議論したいところをみて行く / 議論する内容の出発点が画面に映っているので話の流れも掴みやすそう"
  • Lookerでショップのサービス活用カルテを作成した話 - BASEプロダクトチームブログ

    この記事は BASE アドベントカレンダーと Looker アドベントカレンダー 8 日目の記事です。 はじめに BASE BANK 株式会社にて事業開発を担当している猪瀬 (@Masahiro_Inose)です。 私達のチームでは、BASE ショップを運営しているショップオーナー様が簡単に資金調達をできる「YELL BANK」というサービスの開発・運営しています。 thebase.in 今回の記事は以下の二部構成となります。 前半部分は私からLookerという BI ツールを使って、サービス利用者の利用状況や関連情報を一元的に把握できる、「ショップカルテ」なるものを作成したことについて紹介します。 後半部分は Looker で扱いやすくするためのデータの加工を担当した永野(@glassmonekey)から、データ基盤周りやデータ加工の工夫した部分について解説します。 ちなみに過去の記事の

    Lookerでショップのサービス活用カルテを作成した話 - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2022/08/22
    2021 / "現代ならマシンパワーもあるので、個人的には設計コスト的や扱いやすさ的にもワイドテーブルが良いのでは / スタースキーマとワイドテーブルの比較は Fivetran 社の Michael Kaminski 氏の記事に詳しく載っています"
  • テキストによる商品のカテゴリ分類でCutMixを試してみた - BASEプロダクトチームブログ

    この記事はBASE Advent Calendar 2019 17日目の記事です。 devblog.thebase.in こんにちは、DataStrategyの杉です。 DataStrategyではデータを用いて問題解決を行なっていたり、より使いやすいサービスのための改善をしています。10日目の記事として類似商品APIについてがありましたが、このようにテキストや画像の特徴量からレコメンドの作成なども行なっています。今回は私がテキストの特徴量を用いて試してみたことについて書きたいと思います。 概要 Eコマースプラットフォーム「BASE」には様々なカテゴリが存在します。 例えばアパレルのショップであれば「トップス」「ボトムス」などショップごとに設定されているカテゴリもあれば、「アパレル」などといったショップ自身を表すカテゴリなど、多いものでは約1000種類の分類がされているカテゴリもあります。

    テキストによる商品のカテゴリ分類でCutMixを試してみた - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2020/12/19
    CutMix / "ふたつの画像を半分ずつ合成するMixupとある区間をカットしてしまうCutoutを組み合わせてある部分を違う画像で置き換えるという手法"
  • 1