こんにちは。DS統括本部で画像処理エンジニアをしている上野です。LINEヤフー株式会社の企業ロゴやサービスロゴなどのブランドロゴには、ブランドガイドラインと呼ばれるロゴ使用時に守らなくてはならないルールが定められています。ロゴを使用する際にロゴが変形してしまったり、変色してしまったりすると問題となるため、細心の注意を払って使用しております。今まではロゴが使用されている画像を担当デザイナーがすべて目視確認でチェックすることで、ガイドラインを遵守してきました。ブランド価値を守るためにとても大切な作業です。これらの作業を画像処理で自動化できないかと考え、ブランドロゴチェックツールを作成しました。 ※載せている画像は、今回のブログ用に用意したテスト画像です。 この記事では、社内のデザイナーから寄せられた目視確認の作業に工数がかかってしまっているという課題を画像処理技術で解決した事例について、紹介し
Zホールディングスは、7月27日にOpenAIと「GPT-4」「Embeddings」「DALL・E」などすべてのAPIに関する利用契約を締結。グループ会社のLINEとその子会社、ヤフーでの利用を開始し、従業員約2万人へAPIを活用した対話チャット型の独自AIアシスタントサービスを提供開始した。 今回の契約により、利用者は全てのAPIを文書やメールのテンプレート作成、文案の修正、調査、文章の分類分け、外国語のテキスト翻訳、アイデア出しなどさまざまな業務シーンで活用可能になる。同社はあらゆる部門で生成AIの活用を推進し、業務生産性の向上、サービス品質向上や新サービスの創出を図るとしている。 またサービスの社内利用では社内認証やネットワーク制限を行い、各社の社内ネットワーク環境下でのみ利用できるセキュアな環境を整備。出入力情報はOpenAIモデルのトレーニングやOpenAIのサービス改善に活用
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
本記事は2022年11月に開催した「Tech-Verse 2022」で発表したセッションを要約したものです。アーカイブ動画を文末に掲載しています。質疑応答の様子も収録されていますのでぜひご覧ください。 ヤフーのData Solution事業(以下、DS事業)では、データの力で「日本全体を元気にしたい」という思いから、これまで自社サービス改善のために活用してきたビッグデータを使ったデータ分析サービスを展開しています。 (プライバシーポリシーの範囲内で取得したデータを個人が特定できない状態に加工しています) ビジネスの上流工程における商品企画のほか、物流の最適化など、さまざまな用途にご活用いただけるサービスです。具体的なプロダクトとしては、「DS.INSIGHT」「DS.API」「DS.DATASET」の三つのほか、アナリストが最適なソリューション提案を行う「DS.ANALYSIS」を合わせた
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。テックラボでYahoo!広告のR&Dを担当している水口です。 Yahoo!広告では、入稿時審査や広告配信などのあらゆるフェーズで機械学習モデルを導入しています。旧来は人間が「これは広告として掲載がOKかNGか」(ガイドラインに準拠しているか)を判断していましたが、システムがこの補助をするようになっています。本記事では、その中でもディスプレイ広告の画像審査にマルチモーダルモデルを活用した事例についてご紹介します。 今回構築したマルチモーダルモデルは以下のようになっています。特筆したいのは内部的にはマルチモーダルモデルでありながら、入力には画像のみを使用していることです。これにより他の情報を用意することなく、通常の画像モデ
みなさん、こんにちは。ヤフーのDeveloper Relations(以下DevRel)の中村と水田です。 11月17日と18日にLINEとヤフーが合同開催した「Tech-Verse 2022」、ご視聴いただけましたか。これまで各社で開催してきた技術カンファレンスを一緒に企画するということで、運営チームとしても学びや気づきがたくさんありました。本稿ではTech-Verseを通じたクリエイター活躍の場づくりとそこで得られた経験について、ヤフー視点で振り返ります。 Tech-Verse 2022とは まずはTech-Verse(テックバース)の概要をおさらいします。 開催日:2022年11月17日(木)・18日(金) 開催方式:オンライン 参画企業:LINE、ヤフー、dely、出前館、一休、バリューコマース、ゼットラボ、ZOZO WebサイトURL Tech-Verse 日本語版Webサイト
質問内容に対して、手動で実行しその結果をドキュメントに残していれば0.5、CIなどに組み込まれ自動実行されている場合には1.0、どちらにも該当しない場合には0をつけます。各領域においてスコアを合算し、そのスコアの最小値が最終的なML Test Scoreです。従いまして、特定の領域でスコアが高くても、別の領域のスコアが低ければその結果が採用されることになるため、高スコアを得るには全ての領域で高スコアを取る必要がある厳しいものです。 一方、ML Test Scoreを進めるにあたり、同じプロダクトへの継続的な計測であっても回答者が変わった際に回答基準にぶれが生じる課題が発生しました。対策として、設問一つずつに対して社内の状況なども加味した判断基準を作成し、そちらをもとに回答をしてもらうようにしました。具体的には下記のようなものです。 特徴量・データ領域 質問内容: 新しい特徴量は素早く追加可
大規模なデータセットを短期間で構築するために、データセット構築にはYahoo!クラウドソーシングを用いました。 以下に各データセットの概要を示します。 MARC-ja MARC-jaは商品レビューを入力として、ポジティブ(positive)かネガティブ(negative)かを推定するタスクです。多言語商品レビューコーパスMARC(Multilingual Amazon Reviews Corpus)[文献7]の日本語部分を用いて構築しています。検証・テストセットについては正解ラベルが妥当であるかをクラウドソーシングで判定し、ラベルをクリーニングしています(訓練セットは数が多いことからクリーニングはしておりません)。 JSTS/JNLI JSTS(Japanese Semantic Textual Similarity)とJNLI(Japanese Natural Language Infe
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo!広告のデータマーケティングソリューション(以下、DMS)を開発しているデータアナリストの薄田です。 みなさんは、中間テーブル同士が複雑に絡み合い変更しようにも影響範囲を推定できず、手がつけられない分析パイプラインの保守で苦労された経験はないでしょうか? 私のチームでは数千行におよぶ分析用SQLをリファクタリングして、保守性と生産性を両立する分析パイプラインに生まれ変わらせることができました。 この記事ではリファクタリングを通して確立した、分析用SQLを構造化するための4原則を紹介します。4原則を意識しながらSQLを書くことで、高凝集・疎結合な分析パイプラインを作ることができます。 この記事では凝集度と結合度
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、Yahoo! JAPAN研究所でHuman-Computer Interaction(HCI)の分野の研究をしている池松です。この記事では、Yahoo! JAPAN研究所と慶應義塾大学、東京工科大学と共同で進めている、スマートフォンの持ち方を推定する手法について解説します。(国際会議 ACM CHI 2022および ACM ISS 2022で発表した研究成果です [1,2]) 持ち方を推定できると何が嬉しい? 多くのユーザがスマートフォンを片手で持ち、持った手の親指でタッチする操作方法を好むことが知られています [3]。しかし、画面上の位置によっては親指でタッチしにくく、誤って意図しない箇所をタッチしたり、無理してタッ
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo! JAPAN研究所でインターンシップをしている立命館大学大学院修士2年の松根です。普段は、レコメンドシステムや機械学習アルゴリズムに関する研究をしています。 今回は、Yahoo! JAPAN内に多く存在するユーザの興味や属性を予測するモデルを活用することで、より多くの方々に対してレコメンドを行うシステムCERAMとその実証実験の結果について紹介いたします。今回お伝えする内容は、データサイエンスのトップカンファレンスの1つである「KDD2022」の本会議に採択された内容となっています。 予測モデルのリサイクル 突然ですが、皆さんはリサイクルと聞いてどのようなイメージを思い浮かべますか?リサイクルとは、必要なく
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo! JAPAN研究所の鍜治です。 みなさんはコンテンツにメタデータを付与したいとき、どのようにしていますか? もちろん手作業で付与することもできますが、コンテンツ量が膨大なときには、自動的にメタデータを付与できる仕組みがあると便利だと思いませんか? 私がリーダーを務めている研究開発チームでは、Yahoo!ショッピングの商品に属性というメタデータを自動付与するため、BERTを用いた商品属性推定モデルを開発しています。本記事では、そもそも商品の属性とはどういうものなのか、どのようにBERTを使っているのか、既存モデルと精度はどのくらい違うのか、などについてお話したいと思いますので、よろしくお願いします。 Yaho
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。CTO直下のR&D組織であるテックラボにて、コマース領域向けの研究開発に取り組んでいる脇山です。 本記事ではベクトル検索を製品への紐付け(いわゆる名寄せ)業務に利用した事例を紹介します。 商品を製品マスタに紐付けする みなさんはYahoo!ショッピングで商品を探したことがあるでしょうか? Yahoo!ショッピングにはいろんなストアが商品を出品しているため、同じ商品を異なるストアが販売しています。そのため、「コカ・コーラ 500ml 48本」といったクエリで検索すると、検索結果に異なるストアが出品した「コカ・コーラ 500ml 48本」の商品が複数並ぶことがあります。商品を購入する際は、同じ商品でも商品価格や送料などがス
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo!広告に関わる分析を行っているアナリストの菊池です。 Yahoo!広告の1つである検索広告において、表現の異なる広告を数多く入稿した(広告の多様性が高い)ほうが、ユーザーをひきつける可能性が高くなるということは、理論面や経験から認識されてはいました。が、それがデータで示されたことはありませんでした。 この記事では、本当に多様性が高いとユーザーをひきつけやすいかを、形態素解析という手法と生態学で利用されている指標を利用して分析した事例を紹介します。 検索広告と、良い広告 今回は、検索広告を例に分析します。検索広告とは、Yahoo! JAPANで検索をした際、検索キーワードに応じて、検索結果ページに表示されるテキ
「Yahoo! Japan」といったサービスを提供するメディア事業であると同時に、国内屈指の規模を持つWeb広告プラットフォーマーでもあるヤフー。2021年に扱ったWeb広告の数は数千万件に上るという。一方、同社は広告配信で課題も抱えていた。ガイドラインに沿わないコンテンツを除去する「広告審査」に手間がかかることだ。 同社が広告事業を始めた96年当初は人力で、途中からは自社開発した広告審査システムを使って不正な広告を除去していたが、件数が増えるにつれて作業が追い付かなくなった。そこで、AIを活用した審査システムを新たに開発。20年1月にこれまでのシステムと併用を始めたところ、工数の削減に成功したという。 プロジェクトを手掛けたのは、ヤフーのエンジニアである伊藤瞬さん(メディア統括本部トラスト&セーフティー本部プロダクト開発部長)。伊藤さんは当時、社内制度を活用して部署を移動したばかりで、A
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーの音声認識エンジン「YJVOICE」の研究開発を担当している前角です。 本稿ではヤフーにおける音声処理技術の研究開発の最新の取り組みを紹介します。今回は先日参加したThe Zero Resource Speech Challenge 2021(以下ZeroSpeech Challenge)で、ヤフーのチームが行ったモデルの性能改善手法を紹介します。 ZeroSpeech Challengeは、音声データのみ(話者ラベルも使用可)を用いた自己教師あり学習によって、言語理解がどの程度まで可能かどうかを競うコンペティションです。自己教師あり学習はデータ自身から自動的に生成された教師を用いて学習を行う手法で、自然言語処理
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、自然言語処理システムを開発している山城です。今回はYahoo!リアルタイム検索の一機能である感情分析機能の紹介と、そのシステム刷新作業の一環として行ったラベル偏り改善の取り組みについて解説します。 リアルタイム検索とは?ツイートから受ける印象を推定しよう! Yahoo!リアルタイム検索というサービスがあります。ユーザーはこちらを用いて、Twitterに投稿されたツイート(つぶやき)が検索できます。 たとえばユーザーが『月曜日』という単語を入力すると、直近数時間のうちにつぶやかれた『月曜日』という文字列を含むツイートが集められて、その単語に関するさまざまなコメントが閲覧できます。 ところで、リアルタイム検索ではその部分コ
2週間で公開を実現できた3つの要因 コロナ禍となってからは感染拡大を防ぐため、密集・密閉・密接の「三密」防止が盛んに呼び掛けられている。満員電車やイベントの混雑を避けたいというニーズはコロナ禍以前にもあったが、感染症の流行に直面したことでより重要性が増している。 Yahoo!検索の開発チームリーダーを務める廣川将成さんは「安心して移動するための不安や悩みごとの解決が急務だった」と開発の背景を明かす。機能の分かりやすさ、使いやすさとともに「できるだけ早く届けること」も重要だと考えていたという。 混雑予報の提供のため、ヤフーは全社組織としてタスクフォースを結成。2段階で開発する体制を整えた。同社はコロナ禍で全社リモートワークの体制を敷いているため、この開発のためのやりとりは全てオンラインで行われた。 5月18日の開発スタートから2週間を「フェーズ1」と設定した。混雑情報のデータセットを持つパー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く