サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
猫
data.gunosy.io
こんにちは GunosyTechLab AdsML チームで広告周りの開発をしている濱下(@m-hamashita) です。なかなか IDE に移行できずに Neovim で開発をし続けているのが最近の悩みのひとつです。 今回の記事は、6/14〜6/17 にかけて開催された人工知能学会の参加レポートになります。 現地会場の看板 今年の人工知能学会は、現地とオンラインのハイブリッド開催でした。 現地会場は国立京都国際会館で、京都駅から電車で 20 分ほどの位置にありました。 Gunosy からは濱下(m-hamashita) 、飯塚(koiizuka)が現地で参加し、大竹(totake)がオンライン聴講をおこないました。 Gunosy は人工知能学会に例年スポンサーとして参加しており、今年もゴールドスポンサーとして参加し、共著での研究発表 1 件と現地での企業展示をおこないました。 研究発表
こんにちは、データサイエンス部の大竹、R&D チームの森田、久保、新規事業開発室の鈴木、岡田です。 今回の記事は 3/11 ~ 3/15 の 5 日間にわたって開催された言語処理学会第 30 回年次大会 (NLP2024) の参加レポートになります。 NLP2024 について 企業ブースとポスター紹介 論文紹介 [C3-2] 長文生成の多面的評価:人手評価と自動評価の向上を目指して [A5-4] 文献理解のための人間の応答を利用したプロンプト最適化 [C6-4] 金融分野における言語モデル性能評価のための日本語金融ベンチマーク構築 まとめ NLP2024 について 言語処理学会は人工知能の一分野である(自然)言語処理を専門とする学会です。 記念すべき 30 回目である今年は、昨年に引き続きオフライン・オンラインのハイブリッド開催となり、神戸市の神戸国際会議場がオフラインの会場となりました。
こんにちは、 ML チームの k.oshiro です。 この記事は Gunosy Advent Calendar 2023 の 17 日目の記事です。 昨日の記事は yamayu さんの 「サードパーティ Cookie を使わない広告効果計測 〜Privacy Sandbox の Attribution Reporting API について〜」 でした。 本記事では、社内勉強会の1つであるアルゴリズム勉強会で発表した「MessagePack の仕様を読む」を紹介します。 アルゴリズム勉強会とは Gunosy では様々な社内勉強会が定期的に開催されており、アルゴリズム勉強会はそのうちの一つです。 その名の通りアルゴリズムを勉強する会で、最近では「フロイドの循環検出法」「レーティングアルゴリズム」などの発表がありました。 過去のブログでも社内勉強会について取り上げているので、そちらも読んでいた
はじめに 現状の実装と課題: 不整合データの混入による手戻り 対応方針: PR 時点でデータ不整合を検出する CI 環境で dbt が使えるようになった dbt seed とは 方針 実装 csv ファイルの配置 プロファイル設定 dbt_project に seeds の設定を追加する シードでロードするテーブルの設定を追加する GitHub Actions で dbt seed と test を行う GitHub Actions で各ステップを記述する 導入結果 さいごに 余談: ChatGPT にエラー解析と初心者解説を頼んだらかなり心理負荷が下がった 参考文献 はじめに こんにちは、BI チームの田辺です。この記事はGunosy Advent Calendar 2023の 12 日目の記事です。 前回の記事は UT さんのコスト削減できる箇所をひねり出すでした。 さて、今回は db
はじめに こんにちは。最近所属が変わり、新しく新規事業開発チームに配属された上村です。 本記事は、Gunosyアドベントカレンダー2023 13日目の記事です。 昨日の記事は、田辺さんの「A/Bテストの情報過多と戦う」でした。 今回は、新規事業開発チームで開発している「ウデキキ」という業務支援ツールについてご紹介します。 また、ウデキキのチャット機能の実装についてもご紹介します。 「ウデキキ」とは サービス紹介 ウデキキ ウデキキは、ChatGPTという強力な自然言語処理モデルを活用した業務支援特化の生成AIサービスです。 通常、ChatGPTから望ましい回答を引き出すためには、LLM(Language Model Learning)の特性を理解し、適切なプロンプトを設定する専門知識が必要です。 これには、研究論文の読解や英語のスキルが必要とされることもあります。 しかし、ウデキキを利用す
はじめに 背景: A/Bテスト作業者の増加による品質差が出てきた 課題: 情報過多がさまざまな課題を引き起こしている 原因: 膨大な情報をハンドリングするスキルが個人の経験値・地頭に依存してしまう では膨大な情報をどう扱えばよいのか? 改善1. 情報を削る 改善点2. 情報の抽象度を上げる (仮説ありきで考える) 対処: 見ないべき指標ガイドライン整備 さいごに こんにちは、BIチームの田辺です。 この記事はこの記事はGunosy Advent Calendar 2023の12日目の記事です。 前回の記事はtakujiさんのLLM を使って自分のおさいふ事情を把握してみるでした。 はじめに 今回の記事ではBIチームでA/Bテストの指標の見方を整理した話を紹介します。大きくまとめると、以下の内容になります。 背景:A/Bテストの実施に関わる人数が増えてきた一方、個人差も広がった A/Bテスト
こんにちは。R&D の森田です。牛スネ肉のブロックをまるごと炭火で焼いたら美味しかったので、最近のオススメです。 この記事は Gunosy Advent Calendar 2023 の 2 日目の記事です。前回の記事は nagayama さんの Android DataStore の段階導入 でした。 今日は、進歩が速すぎる LLM (Large Language Model) 界の論文をどう追いかけていくかについて紹介します。 一口に LLM の論文といっても LLM に関係する領域は広がり続けていて、それぞれが 1 分野といっても差し支えのない量の論文が日々出続けています。例えば、11/28 にプレプリントサーバーの arXiv に投稿された "LLM" が含まれる論文は、48 件あります(11/30 調査)。研究者でも毎日数十件の論文に目を通すのは無理があると言えるでしょう。 いくつ
はじめに はじめに dbt はそもそもツールとして何を行なうか ELT における Transform について dbt が担っている機能 dbt は技術的にどのようにして Transform を実現しているか Jinja テンプレートによる SQL の生成 各種データ基盤に向けたデータ変換の手続きの抽象化 生成された SQL に基づくデータ変換の手続きの実行 さいごに DRE&MLOps チームの hyamamoto です。 最近は涼しくなってきて、秋の気配が感じられるようになってきましたね。 秋は一番好きな季節なので嬉しいです。 さて、今回は dbt について少し変わった切り口で紹介します。 今回の紹介において主眼に置きたいことは以下の内容です。 dbt はそもそもツールとして何を行なうか dbt は技術的にどのようにしてその機能を実現しているか その機能の結果 dbt はアプリケーショ
2023年4月に新卒エンジニアとしてデータサイエンス部MediaMLチームに配属された大城(k.oshiro)です。 普段はauサービスTodayアプリの記事配信システムの開発を行っています。 本記事は、新卒エンジニアとして入社後にやってきたことを簡単にまとめたものです。 新卒研修 1日のスケジュール OJT auサービスTodayについて 実装 A/Bテスト 振り返り 終わりに 新卒研修 Gunosyの新卒研修は、新卒全体に対して実施される全体研修と、エンジニアのみを対象にしたエンジニア研修の2つがあります。 全体研修では、各事業部についてメンバーや業務内容の紹介、セキュリティやコンプライアンスといったGunosyで働く上で知っておくべきことを教わりました。 エンジニア研修では、指定されたUdemyの講座を受講し、AWS JumpStart 2023 for NewGrads 設計編*1
こんにちは、データサイエンス部の大竹、R&D チームの森田、久保、新規事業開発室の鈴木、岡田です。 今回の記事は 3/11 ~ 3/15 の 5 日間にわたって開催された言語処理学会第 30 回年次大会 (NLP2024) の参加レポートになります。 NLP2024 について 企業ブ…
はじめに こんにちは、Gunosy Tech Lab (GTL) MediaMLチームの上村です。今回のブログでは、先日プレスリリースがあった au 5Gチャンネル へのレコメンド機能の提供についてご紹介したいと思います。 gunosy.co.jp 「au 5Gチャンネル」とは*1 「au 5Gチャンネル」はドラマ・アニメ・映画、音楽などのエンタメ情報や生活に根差したお役立ち情報、かわいい動物達の癒し動画や話題のおもしろ動画など、様々なジャンルのトレンド動画をザッピング感覚でお楽しみいただけるアプリです。 また、5Gマップにて生活圏が5Gエリアかどうかを確認でき、5Gエリア化された際にお知らせする機能もご利用いただけます。 レコメンド動画リストの提供 プレスリリースにもある通り、Gunosyのニュース記事推薦で培った技術とノウハウを活かして、au 5Gチャンネル のユーザーの興味関心に沿っ
こんにちは、GunosyTechLab の上村、飯塚です。 今回の記事は、3/5〜3/9の5日間にかけて開催された第21回日本データベース学会年次大会(DEIM2023)の参加レポートになります。 DEIM2023 について DEIMはデータ工学と情報マネジメントに関するフォーラム という名で毎年3月上旬に開催される学会です。 検索や推薦、データベースシステムからビッグデータ、SNSなど幅広い分野のトピックにまつわる研究が発表されています。 今年は、前半がオンライン、後半がオフラインでの開催となりました。 オンラインの参加者数は800名程度、オフラインの参加者数は400名程度でした。 オフラインの会場は、岐阜県の長良川国際会議場でした。 Gunosyの発表内容 Gunosyからは技術報告1件、研究発表1件、スポンサー展示を行いました。 [3b-1] Gunosyにおける推薦システムの変遷と
はじめに 背景とモチベーション ニュースキュレーションサービスとしての自動要約技術の重要性 事前学習済み言語モデルの急速な発展 自動要約モデルの作成 タスク設定 モデル データセット T5 の fine-tune 評価 自動評価 人手評価 推論の高速化 ONNX とモデル量子化 CPU を使用した推論速度と要約精度の評価 API 実装と slack bot 化 API 化 slack bot化 ChatGPT の登場 今後に向けて・おわりに はじめに こんにちは、 Gunosy Tech Lab (GTL) MediaML チームの大竹です。今回のブログでは、社内で運用されているニュース記事の自動要約システムについてご紹介したいと思います。 ニュース記事の本文から簡潔な要約を生成するシステムを作るため、データセットの収集から自動要約モデルの学習、サービスとして利用するための API 実装ま
こんにちは、GunosyTechLab の濱下、森田、大竹、飯塚、久保です。 今回の記事は、3/13〜3/17 の 5 日間にかけて開催された言語処理学会第 29 回年次大会(NLP2023)の参加レポートになります。 NLP2023 について 言語処理学会は人工知能の一分野である(自然)言語処理を専門とする学会です。今年はコロナ禍以降初となる、大規模な対面でのセッションを含むオフライン・オンラインのハイブリット開催で、現地会場も大いに賑わっていました。参加者数は 1828 人、発表件数は 579 件、スポンサーは 80 団体となり、いずれも歴代最高となりました。 Gunosy からは、「P12-5 語彙制約を間接的に用いた平易な要約の生成」という内容でポスター発表をおこないました。 詳細は以下のブログを参照ください*1。 data.gunosy.io 発表での議論をまとめると以下のように
こんにちは。Gunosy Tech Labの飯塚、森田です。 今回の記事は3月の学会発表予定のお知らせです。 3月5日から3月9日にかけて開催される「第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023)」、および3月13日から3月17日にかけて開催される「言語処理学会第29回年次大会(NLP2023)」において、Gunosyから計3件の発表を行います。 DEIM2023 3/5 3b-1: 推薦モデル「[技術報告] Gunosyにおける推薦システムの変遷と深層学習モデルの応用事例の紹介」 この発表では、Gunosyにおける推薦システムの変遷と深層学習モデルの活用例を紹介します。 Gunosyでは、ビジネス環境の大きな変化が過去数回起き、そのたびにビジネスの目的に沿った推薦システムの開発を行ってきました。 また近年では、研究が盛んに行われている深層学習モデルを推薦システ
はじめに 背景 課題 解決策:Incremental Trainingの導入 1, 特徴モジュール 2, モデルの継承 実験結果 まとめ はじめに こんにちは。Gunosy TechLab Ads MLチームのしょうえいです。 この記事は Gunosy Advent Calendar 2022 の22日目の記事です。 Ads ML側はユーザに興味がありそうな広告を洗い出し、レコメンドすることを担当しています。 今回は、導入する予定の新広告レコメンドモデルのオフライン実験で実践したIncremental Trainingについて話します。 背景 Gunosyではグノシー・ニュースパス・LUCRA・auサービスTodayという4つのプロダクトを展開しています。各プロダクトにおいては、ユーザに最適なニュースと記事を配信して情報を届けています。 同時に、サービスを継続的に運営するために、ユーザに興
こんにちは、Gunosy Tech Lab DR&MLOps チームの楠です。 この記事は Gunosy Advent Calendar 2022 の 11 日目の記事です。 昨日の記事は UT@mocyuto さんの『RailsのフロントをReactへリファクタしたとき、スキーマをOpenAPIベースの自動生成にした話』でした。 この記事では、ELT パイプラインにおける Transformation ツールである dbt の snapshot という機能について紹介した後、snapshot の手法を一般化したディメンションモデリングにおける概念である Slowly Changing Dimension を包括的に紹介します。 はじめに dbt とは? dbt についての参考資料 dbt snapshot とは? どんなときに使える? dbt snapshot のまとめ dbt snap
こんにちは、GunosyTechLab MediaML 所属 の suchida です。 急激に冬が近づいて参りましたね。 寒がりなので、ヒーター付き手袋を買いました。 キーボードも打てます。 おすすめです。 こちらの記事は Gunosy Advent Calendar 2022 の 3 日目の記事です。 前回の記事は nagayama さんの「Android の Kotlin Coroutines 導入の第一歩」でした。 tech.gunosy.io はじめに 問題 M1 Mac に TensorFlow がインストールできない Docker 環境でも厳しい CPU アーキテクチャの違いに躓かない開発環境づくり 開発環境 番外編: arm64 環境で amd64 のための pyproject.toml を作る方法 おわりに はじめに 弊社では、社員が使っている PC が古くなってきたタイ
はじめに プッシュ通知とは パーソナライズシステムの導入 事前分析 パーソナライズシステム A. 候補記事選定(自動) NG 判定 多様性の確保 スコアリング B. 候補記事選定(手動) C. おすすめプッシュ記事の割り当て システムフロー A/B テスト 今後の課題 おわりに はじめに こんにちは、GunosyTechLab MediaML 所属の suchida です。 本記事では、2022 年春頃に auサービスToday のニュース記事プッシュ通知に導入したパーソナライズシステムについてご紹介いたします。 プッシュ通知とは 本記事におけるプッシュ通知とは、速報ニュースや話題となったニュースを各ユーザーのスマホに直接通知するサービスのことです。 auサービスToday では、毎日決まったタイミングに行うプッシュ通知(定時プッシュ)と不定期に行うプッシュ通知(速報プッシュ)を行っていま
はじめに 他ドメインと比較したニュース記事推薦の特徴 1. ライフサイクルの短さがもたらすコールドスタート問題 2. 深い言語理解の必要性 3. 明示的なフィードバックの利用の難しさ トピック別ニュース記事推薦手法 記事の人気度合い(popularity)の考慮 概要 既存研究 固有表現(Named Entity)の明示的な考慮 概要 知識グラフと知識グラフ埋め込み 既存研究 リッチな言語表現の利用 概要 既存研究 明示的なユーザーフィードバック・post click指標の利用 概要 既存研究 ユーザーの興味をより正確に捉えるアーキテクチャ 概要 既存研究 今後のチャレンジ おわりに はじめに こんにちは、Gunosy Tech Lab (GTL) Media ML チームの大竹です。Gunosyでは「情報を世界中の人に最適に届ける」というミッションのもと、グノシー・ニュースパス・LUCR
あいさつ 自己紹介 なんでGunosyに入ったの? 新卒研修 新卒研修 Udemy(動画による研修) OJT 概要 動画記事の利用状況を分析する(SQL) 「動画記事リスト」を作成する(Python) 動画記事の挿入を行う(Golang) ABテスト OJTを振り返って 終わりに あいさつ こんにちは!2022年4月、株式会社Gunosyに新卒エンジニアとして入社したhigetaと申します。本記事は私にとって初めてのブログ執筆となります。 例年より暑く、諸々の事情で外出が億劫になった8月を乗り越え、ようやく涼しくなってきた頃ですが、もう9月ということは私が4月に入社してから既に6ヶ月目ということになります(早い!)。 本記事では、この5ヶ月間で私がGunosyで体験したことをざっくりとお伝えしたいと思っています。新卒採用でGunosyを志望してくださる方はもちろん、中途での入社を検討されて
Stable Diffusion を Windows 10 で動かすイメージ画像 (作: Stable Diffusion) *1 こんにちは。初めまして、Gunosy Tech Lab R&D の 森田 (pnnc205j)です。最近好きな牛肉の部位はカメノコです。 今回は、テキストから画像を生成する Stable Diffusion を Windows 10 で動かしてみましたのでご紹介します。 Stable Diffusion はルートヴィヒ・マクシミリアン大学ミュンヘンと Stable.AI の発表した、一般的なPCで動かせるほど軽量でかつ高品質な画像を生成できる画像生成モデルです。 とりあえず試したい人向け 必要環境 まずは Stable Diffusion の Weight(学習済みモデル)をダウンロード CUDA 環境の構築 WSL2(Ubuntu)のインストール (Win
こんにちは。GunosyTechLab MediaML 所属の suchida です。普段の業務では、記事配信アルゴリズムの開発を行っています。ここ最近は A/B テストの荒波が収まり、穏やかに開発を進めています。本ブログでは社内勉強会の一つである、"学んだことLT会"についての紹介とそこで取り上げられた本・記事の紹介を行いたいと思います。 学んだことLT会とは? 概要 "学んだことLT会"とは、新卒を中心とした若手メンバーが集まって開催している「業務内外で学んだことをフランクに共有しよう」という会です(通称:20〜22卒LT、雑LT)。 隔週に一度のペースでオンライン開催しており、10名程度のメンバーが各回2名ずつ持ち回りで資料作成と発表を行っています。ただ、各自の業務との兼ね合いであったり、発表したいことが特にない場合はスキップも自由*1、といったゆるめな会となっております。 基本的に
こんにちは。Gunosy TechLab R&D チーム リサーチインターン の北田 (shunk031) です。今回はようやく皆様にお見せできる、可愛い我が子(もちろん研究のことです)について書きます。 今回採録された論文の全体像:広告クリエイティブを最適なタイミングで停止するよう支援する深層学習を元にした枠組みを提案しました。 この度、私と研究開発チームの 関さん で取り組んでいた研究が MDPI 社が発行する Applied Science 誌 という論文誌 (査読付き journal article) に掲載されました。 www.mdpi.com 今回の論文は "Ad Creative Discontinuation Prediction with Multi-ModalMulti-Task Neural Survival Networks" というタイトルで、 配信効果が悪くなっ
こんにちは、Gunosy Tech Labリサーチアルバイトの大畑です。 Gunosyデータ分析ブログへの投稿は初めてになります。 私は2021年9月よりリサーチアルバイトとして研究を行なっており、今回が初の外部発表になります。 2月27日~3月2日に開催された第20回日本データベース学会年次大会 (DEIM2022)に大畑、飯塚が参加し、発表を行いました。今回は私がGunosyで研究を始めた背景や問題意識を含めた学会の参加記録を書いてゆきます。 DEIMとは DEIMは第14回データ工学と情報マネジメントに関するフォーラム という名で毎年3月上旬に開催される学会です。検索や推薦、データベースシステムからビッグデータ、SNSなど幅広い分野のトピックにまつわる研究が発表されています。今年の会場は愛知県名古屋市で、当初は現地とオンラインのハイブリッド開催が予定されていたのですが、新型コロナウイ
こんにちは!GunosyTechLab MediaMLチームの大竹です。普段の業務ではグノシーアプリにおけるニュース記事配信ロジックの開発や記事推薦モデルの開発を行っています。今回の記事は、3月14日〜18日にかけて開催された言語処理学会第28回年次大会 (NLP2022)の参加レポートになります。今年はGunosyからの発表はありませんでしたが、スポンサーとして全5日の日程に参加しました。 NLP2022について 言語処理学会は人工知能の一分野である(自然)言語処理を専門とする学会です。今年は昨年、一昨年に引き続き、チュートリアル等一部のプログラムを除いてオンラインでの開催となりました。今年の参加者数は1700人を超え、歴代最高の参加者数となりました。 ニュースキュレーションアプリと自然言語処理の関わり ニュース記事推薦システムにおいては、ユーザーの興味のモデル化に加えて、ニュース記事そ
はじめに アンケートにおける注意点 「何のためにこの質問をするのか」を明確にする できる限りバイアスを排除する 質問文はわかりやすく、誤解のないように よく使う統計手法 母比率に関する検定 適合度の検定 独立性の検定 マン・ホイットニーのU検定(ウィルコクソンの順位和検定) おわりに はじめに おはようございます。BIチームの齊藤です。 サンタさんには善玉コレステロールと来年1月末の某ライブのチケットをお願いしようと思います。マジで頼む。 こちらの記事は Gunosy Advent Calendar 2021 の18日目の記事です。 昨日の記事は同じくBIチームの田辺さんの「オンラインホワイトボードを使った振り返りで数値意識が向上した話」でした。Good Article! さて、みなさんは仕事でアンケートをとったことはありますか? Webサービスでユーザー行動を分析する際には、各種の行動ロ
はじめに 可視化で何を改善したいか 目的 1. 指標や施策・開発の関係を俯瞰できる 目的 2. 新たな施策を始める際の仮説立てと整理が行いやすくなる 実際に作ってみた 作ってみて おわりに はじめに こんにちは!BI チーム新卒*1の田辺です。こちらの記事は Gunosy Advent Calendar 2021 の 17 日目の記事です。 昨日の記事はくらさわさんの『VS Code の拡張機能を作ったけどもっと便利なやつがあったどころか標準機能にあった話』でした。 本日は、週次振り返りの数値確認にオンラインホワイトボードツールのMiroを導入した話をご紹介します! 確認する数値や可視化は多くの社員が目にするものですが、弊社では「八百屋にサンマは注文しねえよ」の精神により新卒でもこのような仕事ができるチャンスがあります。 可視化で何を改善したいか Gunosyではエンジニア・非エンジニアに
こんにちは。 GunosyTechLab の Ads ML チームの村田 (id:marice0819) です。ELDEN RING を PS5 でプレイしたいので PS5 を求めてるこの頃です。 こちらの記事は Gunosy Advent Calendar 2021 の14日目の記事です。昨日の記事は ism-kit さんの「Athena view と Terraform による宣言的データモデリングとレイクハウスへの道標」でした。 今年の8月14日~8月18日にシンガポールで開催されていた KDD 2021 のワークショップである AdKDD に主に参加してきました。この記事では参加レポートとして KDD、AdKDD のアドテク関連の発表を中心にいくつかの研究と Keynote の紹介をしたいと思います。 AdKDD True Post-Click Conversion via Gro
次のページ
このページを最初にブックマークしてみませんか?
『Gunosyデータ分析ブログ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く