サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
掃除・片付け
blog.recruit.co.jp
リクルートのデータ組織が発信する最新情報
はじめに はじめまして、2023年10月にシニアリサーチャーとして入社したアドバンスドテクノロジーラボ(ATL)の梅谷俊治です。2023年9月まで、大阪大学大学院情報科学研究科にて数理最適化寄附講座教授を務めていました。 本記事では、リクルートのデータ推進室における数理最適化を活用した問題解決の取り組みをご紹介します。 数理最適化は、与えられた制約条件の下で、目的関数を最小(もしくは最大)にする最適化問題を通じて、現代社会における意思決定や問題解決を実現する数理技術の一つです。 近年では、機械学習によるデータ分析や予測の技術開発が進み次々と実用化されています。数理最適化は、それらのデータ分析や予測の結果を踏まえた上で意思決定や計画策定を実現する問題解決における出口を担当する技術です。例えば、オンライン広告などカスタマーに商品を推薦するレコメンデーションでは、機械学習を活用してカスタマーの商
リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら そろそろ時差ボケにも慣れてきました、データ分析基盤チームのエンジニアの鳥井です。 こちらの記事に詳しいですが、 この記事を執筆している今、O’Reillyが主催している Strata Data Conference 2019 @ NY というカンファレンスに参加しています。 Strataについてと、Session Day 1の印象に残ったセッションについて、上記記事で紹介させていただきました。 この記事では、1本目の記事に引き続き、Session Day 2で聞いた中で印象に残った発表を1つ簡単に紹介したいと思います。 Session Day 2 Creating an extensible 100+ PB real-time big da
2023年10月23日 (月) から 12月8日 (金) にかけてRECRUIT Internship for Engineers, Data Specialists 2023に参加させていただいた櫛引淳之介です。インターン期間中は『スタディサプリENGLISH』のSREチームに配属され、社内ツール用インフラの構築や、インフラ開発環境のセキュリティに関するタスクに取り組みました。今回は、メインのタスクとして取り組んだインフラのセキュリティ検査ツールの導入について紹介します。 はじめに パブリッククラウドの設定不備は、セキュリティインシデントの原因となります。手作業による確認では見逃しが発生する可能性があるため、設定不備の検知自動化を進める動きがあります。 『スタディサプリENGLISH』ではインフラとしてAWSを使用しており、その設定にはソースコードによってインフラ構成を管理できるIaCツ
$$ \hat{V}(\pi_{\theta}) = \frac{1}{n} \sum_{i=1}^{n} \frac{\pi_\theta(a_{i,t}|x_i)} {\pi_0(a_{i,t}|x_i)} r_i $$ この式は元のデータであまり現れていない($\pi_0$の小さい)介入を大きく評価しており、データ取得時に発生したバイアスを除外することが出来ます。 (例えば、ある病気を予防するためのワクチンが高齢者を中心に接種されていたとして、そのまま集計すると高齢者に偏った効果が計測されてしまうので、データ量の少ない若者のデータを水増しして集計するイメージ) しかし、少ないデータを拡大推計しているので、推定量のバリアンス(分散)は大きくなってしまいます。 方策勾配法 上記の推定量を最大化する方策は方策勾配法によって求められます。 具体的には、方策のパラメータ$\theta$は、学習
はじめに こんにちは。新卒2年目の中間です。業務では主にレコメンドシステムの改善に取り組んでいます。 今回は、2022年12月に終了したNishika社主催の「ヘイトスピーチ検出」という自然言語データを扱うコンペで準優勝することができたので、取り組みなどを紹介しようと思います。 コンペURL: https://competition.nishika.com/hate/summary 解法URL: https://competition.nishika.com/hate/topics/416 コンペについて 参加しようと思ったきっかけ 私は、自然言語データを扱うコンペに何度か参加したことがありますが、その中でも日本語を扱うコンペにはあまり参加したことがありませんでした。そこで今回は、日本語を扱うコンペに参加することで、日本語に対する自然言語処理の知見を深めたいと思い、参加しました。 タスク
はじめに こんにちは、atmaCup#16 リクルート事務局の大磯・荒居・中間・羽鳥・阿内です。 2023年12月にatma株式会社さんと共同で atmaCup#16 in collaboration with RECRUIT を開催し、その表彰式&振り返りを翌月1月に実施しました。 今回の記事では、データコンペティション(以下「コンペ」)開催に至るまでの経緯や準備内容、当日の様子等を6つのセクションに分けてご紹介します。 どのようにコンペが開催されたのか、気になる方はぜひご一読ください! 1. 開催のきっかけ 当社では、データ推進室で一緒に働いていただけるメンバーを新卒・中途問わず積極採用中です。 昨今の採用競争激化の中、当社データサイエンス/機械学習エンジニアリングの魅力を外部に知ってもらうために採用ブランディングの重要性を認識しており、その一案として当社が保持している膨大なデータを使
はじめに はじめまして。『スタディサプリ』データエンジニアリンググループ(DEG)新卒1年目の後藤と申します。 本記事では、まなび組織のFinOps推進として取り組み始めたGCPコスト管理ダッシュボードの作成について話します。近年、注目が増しているFinOpsの具体イメージを少しでも掴んでいただけたらと思います。 背景 まなび組織ではデータ基盤やデータプロダクトとしてGCPの各サービスを利用しています。 GCPは従量課金であるため、急激なユーザーの利用増加により利用料が跳ね上がることがあります。 例えば、コロナ感染拡大による緊急事態宣言の際に、オンライン学習者の急増とともに学習者データも増え、クラウド料金が増加したことも過去にはありました。 他にも、クラウドベンターの料金体系の改定1や円安といった外部要因によりコストが増加することもありました。 まなびのプロダクト開発組織内でGCPを一番利
はじめに 基盤モデル がAIの新潮流となりました。基盤モデルというとやはり大規模言語モデルが人気ですが、リクルートでは、画像を扱えるモデルの開発にも注力しています。画像を扱える基盤モデルの中でも代表的なモデルのCLIPは実務や研究のさまざまな場面で利用されています。CLIPの中には日本語に対応したものも既に公開されていますが、その性能には向上の余地がある可能性があると私たちは考え、仮説検証を行ってきました。今回はその検証の過程で作成したモデルと評価用データセットの公開をしたいと思います。 公開はHugging Face上で行っていますが、それに合わせて本記事では公開されるモデルやデータセットの詳細や、公開用モデルの学習の工夫などについて紹介します。 本記事の前半では、今回公開するモデルの性能や評価用データセットの内訳、学習の設定について紹介します。記事の後半では大規模な学習を効率的に実施す
この記事は リクルート ICT統括室 Advent Calendar 2023 23日目の記事です。 はじめに はじめまして。ICT統括室のあーやです! 6/1に中途入社して、リクルート内の人材評価システム、発注管理システムなどのUIUXデザインを担当しています。 この記事で伝えたいこと 6つのサービスを使って生成した Next.js コードの比較生成したコードの精度ってどれくらい?コードを生成をしてみての気づき! なぜ調べようと思ったのか 私が関わっている発注管理システムでアーキテクチャを改善することになり、以下を実現する第一歩として「Figma から Next.js コード生成する方法」について調べてみました。 開発スピードを上げたい!React / Next.js や Tailwind CSS でフロントを実装するにあたり、デザインとフロントエンドの連携をスムーズにしたいマークアッ
この記事はリクルート ICT統括室 Advent Calendar 2023 24日目の記事です。 はじめに こんにちは、ICT統括室の金光 大貴です。 今年度のお仕事では、クラウドファイルサーバの構築及び移行を担当しておりました。 この記事では、「オンプレのファイルサーバから、SharePoint・Google Driveといったクラウドストレージへの移行PJ」「ローコードアプリによるオートメーション化で力技コミュニケーションからの脱却!~全社ファイルサーバのクラウド移行~」の裏でクラウドファイルサーバ構築/移行にあたって、どのような困り事があったのかお話ししたいと思います。 すでにAWS社にて修正された箇所もありますが、クラウド移行の参考としていただければ幸いです。 案件の経緯 オンプレファイルサーバが2024年2月にEOSLとなるにあたり、移行先として3つの選択肢がありました。 ①S
この記事はリクルート ICT統括室 Advent Calendar 2023 22日目の記事です。 はじめに こんにちは。リクルート ICT統括室 コミュニケーションプラットフォームグループの 政岡 裕士 です。普段は まっぴぃ というハンドルネームでコミュニティ活動をしています。 リクルートでは、リクルートグループ従業員数万人が利用する Microsoft 365 や Power Platform 環境の運用・管理、開発支援をはじめ、Microsoft Azure 環境の運用・管理などを担当しています。 今回は、私が普段よりリクルートの情シス担当として Microsoft Graph API 利用時に心がけていることや注意していること、実際に業務内で行っていることを参考に、企業内で Microsoft Graph API を利用する際に情シス担当が把握しておくと良い点をご紹介できればと思
この記事はリクルートICT統括室 Advent Calendar 2023 21日目の記事です。 はじめに 初めまして、リクルートの平尾です。 本記事では当社のゼロトラスト化への取り組みについて、Microsoft IntuneとEntra IDによる端末管理の統合とアクセス制御の導入(苦労)話をご紹介します。 現在Intuneの新規導入や他MDM基盤から移行を検討されている方向けの内容となります。 なお途中の挿絵につきましては作成時期の関係でHAADJなど旧名称が残存しておりますが、適宜読み替えて頂けますと幸いです。 取り組みの背景 いわゆるコロナ禍前から皆さんも散々取り組んでこられたであろう働き方改革の一環として、当社でも「場所やネットワークに依存しない執務環境の実現」というのが大きな目標でした。 一方で、社内データ資産の保護のためのセキュリティリスク低減も並行して課題となっていました
それからファイルに対する共有リンクを作成し、その裏側で何が起きているのかを探っていきます。 実験 ではここから、実際に挙動を見ながら確認していきます。 まず作成した時点では、それぞれ親から権限を継承しているため、サイトに対する権限がそのままファイルまで継承されています。 最初の権限の状態 サイトの権限 ドキュメントライブラリの権限 フォルダーの権限 ファイルの権限 共有リンクの作成 ファイルに対して共有リンクを作成します。 「共有」を開く 「リンクのコピー」ボタンをクリック リンクが生成されたことを確認 ここでは共有対象として「リンクを知っているあなたの組織のユーザー」を指定してリンクを作成しています。 権限の確認 では改めて権限の状態を確認してみましょう。 サイトの権限 サイトの権限自体は変わっていないように見えますが、配下に固有の権限が設定されたことが表示されています。「これらのアイテ
この記事は リクルート ICT統括室 Advent Calendar 2023 18日目の記事です。 こんにちは、ICT統括室の別府(@tky_bpp)です。この記事は、社内の情報流通を社内プロダクト起点で改善しようとしている取り組みの紹介です。 具体的には「社内・社外に分散している情報」を集約することで「各従業員がこれまでどのような仕事をしてきたのか」を可視化しようとしている取り組みです。その中でも、主にプロセス、工夫した点について書いています。そのため、特定の技術スタック、ツールの紹介といった技術的な内容にはあまり触れません。 同じような課題に取り組んでいる方にとって、少しでも参考になれば幸いです。 はじめに 私は現在、リクルートの社内で利用されている従業員検索システムのプロダクトマネージャーをしています。 このシステムには、従業員毎の個人ページがあり、連絡先や所属部署、使用しているパ
この記事はリクルート ICT統括室 Advent Calendar 2023 10日目の記事です。 みなさん、こんにちは。(株)リクルートICT統括室ICTの秋山 和隆と申します。 業務では今回紹介するITツールのガイドラインの作成や、社内IT環境の満足度調査・働く上で様々な要望を受けつける目安箱の運営、経費精算領域のデジタル化等に取り組んでいます。 プライベートの趣味は、夏は登山・冬はスキーで海よりは山派です。 社内にいろんなITツール/サービスがある? 所属するICT統括室は「いわゆる社内IT」の部署ですが、リクルートで働く人達がポテンシャルを最大限に発揮して気持ちよく働ける・価値を生み出せるICT環境を提供しています。 リクルートの事業領域は幅広く様々な業界で展開しており、職種も営業からエンジニアまで幅広い事から、我々ICT統括室への要望や課題も多岐にわたっています。 そのため社内で
はじめに 検索エンジニアリング1グループ(以下、検索1G)所属の安達です。 検索1Gは検索基盤を開発・運用するグループです。 今回、新たな検索基盤を開発し、本番リリースしたのでその事例について紹介します。 どんな検索基盤か アーキテクチャ図は以下です。 検索1Gが管理しているリソースは、図中のSolrデータ更新バッチとフロントアプリケーションを除くすべてのリソースです。 このシステムは大きく3つに分かれています。フロントアプリケーションとの接続を担う検索動線、検索に使われるデータの更新を担当するデータ更新導線、そして検索エンジンです。それぞれの構成について見ていきます。 検索導線 EKS上の検索APIへリクエストをルーティングする。通常時は何も処理をせず1つの検索APIにリクエストを流す。オンラインA/Bテスト実施時にはグループを振り分けし適切な検索APIにリクエストを振り分けできる。また
「久しぶり! 今、何してるの?」 「うわー、やっと会えたね。はじめまして」 ——2023年8月31日、「株式会社リクルート 社内ISUCON 2023」が開催されたリクルート本社の最上階の会場であるアカデミーホールでは、そんな会話が飛び交いました。 社内ISUCONは、Webサービスのチューニングバトル「ISUCON※」に触発され、リクルートグループ横断で行われているイベントです。1〜3名でチームを組み、コンテスト形式で、Webサービスの高速化に取り組みます。競うことでフロントエンドやデータベース、クラウドといったWebサービスを支える技術の学びを加速させるとともに、部署や世代の壁を越えて社内エンジニアの交流を図ることを目的にしています。 ※「ISUCON」は、LINEヤフー株式会社の商標または登録商標です 国内のエンジニアや学生が参加するISUCONは今年で13回目を数えますが、リクルー
【インターン参加記】GitHub Actions Self-Hosted Runnerによる負荷試験環境構築の自動化 Onoe Hiroya 2023.09.15 4 0013 こんにちは、尾上寛弥です。この1ヶ月間 RECRUIT Internship for Engineers, Data Specialists 2023 に参加し、『スタディサプリENGLISH』のSREチームで働いていました。 今回は自分が取り組んだ、GitHub Actions Self-Hosted Runnerによる負荷試験環境構築の自動化について、インターン中の体験も含めて紹介します。 背景 『スタディサプリENGLISH』では新機能を追加する際などに必要に応じて負荷試験を実施しています。想定されるアクセスを見積もった上で負荷試験を実施することによって、実際に大量のアクセスがあった際に不具合が生じるリスクを
はじめに こんにちは。Kagglerの 中間 と 若月 です。業務では主に人材領域でのレコメンドシステムの改善に取り組んでいます。 この記事では、レコメンドシステムにTwo-Towerモデルと近似最近傍探索による候補生成ロジックを導入することで、精度とコストを改善することに成功したので、その取り組みについて紹介します。 背景 導入したロジックについて説明する前に、まず既存のレコメンドシステムについて簡単に説明します。 既存のレコメンドシステムでは、ユーザとアイテムについてルールベースによる候補生成を行った後、機械学習モデルを用いてスコアを付与し、スコア順にユーザに推薦するアイテムを選択していました。 しかし、ルールベースによる候補生成はベースラインとしてはよいものの、性能改善には限界があり、ルールベースが複雑になればなるほど計算コストもかかるようになっていきます。 そこで、性能改善がしやす
はじめに データマイニング分野の国際会議KDD2023のワークショップである Causal Inference and Machine Learning in Practice にて、リクルートの翁と西村、 東京工業大学中田研究室 の成民濟さん、小林健先生、中田和秀先生との共同研究について発表しました。 KDD2023はカルフォルニア州ロングビーチにて、8月6日から10日にかけて開催され、初日の昼まで時点で2200名以上が参加登録されたそうです。 本記事では、ワークショップで発表した An IPW-based Unbiased Ranking Metric in Two-sided Markets(双方向の表示順バイアスを考慮したランキング指標)について概要を紹介します。 オープニングセッションにて共有された数値 An IPW-based Unbiased Ranking Metric i
「SP版サロンボード」へのGraphQL導入と考察 目次 はじめに 案件概要 導入背景 BFF GraphQLの導入 GraphQLライブラリの比較 考察 さいごに はじめに リクルートの美容領域でフロントエンドエンジニアをやっている、加納英樹と申します。 今年で新卒4年目になります。この記事では、自分が2022年4月から1年ほど関わっている スマホ版(以下、SP版)サロンボードリプレイス案件の裏側について話したいと思います。 今回は、GraphQLを導入した理由と、今後横展開する際に気をつけるべきポイントを述べたいと思います。 次回、もう少し技術に寄った話を書こうと思います。 案件概要 HOT PEPPER Beautyのサロン向け予約管理システムとして、サロンボード というものがあります。サロンボードはPC版とSP版がありますが、今回はSP版をリプレイスすることにしました。 実際のアプ
自己紹介 始めまして。今年度、株式会社リクルートにデータスペシャリストとして新卒入社しました澤邉裕紀、山根大輝と申します。 入社同期で複数本投稿予定の Recruit Data Blog の第3回目になります。 データスペシャリストとして入社すると、住まい、飲食などの事業領域ごとのチームに本配属される前に、同期全員でBootCampと呼ばれる研修を受けることになります。 入社してまずこのBootCampを走り切ることで、データ専門人材としての基礎を身につけることができます。 BootCampのコンテンツは様々ありますが、今回はそのなかでもGoogle Cloud Platform(以下、GCP)を題材としてクラウド、インフラ、CI/CDツールについて学ぶGCPハッカソンについてレポートします。 全体の流れ GCPハンズオン GCPハッカソン 負荷対策やってみた 開発環境を構築してみた まと
こんにちは! 2023年度エンジニア新卒の、吉田です。 株式会社リクルート 新卒エンジニアコースでは、部署への配属前に、BootCampと呼ばれる新人研修を行っています。 本日は2023年度の研修の内容を、実際に受講した新卒の立場から紹介させていただきます。 研修の内容については毎年反響をいただいていますが、今年度も一段と進化し、より充実した研修でした。 ページ下部に研修資料を公開していますので、ぜひ研修の雰囲気を感じ取っていただけると嬉しいです。 研修の概要 エンジニアコースの新人研修は、配属後にスピード感を持って成長できるようになることを見据え、 「さまざまな技術領域の講座を受け、興味関心を広げて、知らなかった好奇心に出会う」 「現場で求められる『仕事への取り組みスタンス』をつかむ」 「気軽に相談できる仲間(同期)をつくる」 の3点が目的とされています。 今年度は、入社前に行われたスキ
したがって、今回のハッカソンでは、ユーザの検索条件や、検索した結果表示されたアイテムの情報を特徴量として、目的変数であるクリックの有無を予測するモデルの構築を行い、その精度を競います。 今回使用するデータは、ユーザがある検索条件で検索を行なった結果表示されたアイテムのうち、ユーザが実際にクリックしたものを正例、クリックしなかったものを負例としてデータを作っています。 また、このデータの特徴として、リクエスト時間・ユーザID・検索条件が一致するログが必ず偶数個含まれており、半分が正例、半分が負例となっています。 この特徴により、ある検索条件で表示されたアイテムのうち、正例と負例になるアイテムがペアとして得られ、このペアのうち、ユーザはどちらのアイテムをクリックするかという二値分類をペアごとに予測するというモデリング方法も可能になります。 データ設計の背景についてはこちらの記事で詳しく説明され
本記事の内容 ドキュメント、書いてますか? こんにちは。データエンジニアの加藤です。社内データプロダクトである Knile1 と Crois2 の開発・運用や、社内に複数あるデータプロダクトの統合や連携などを見据えたリアーキテクチャを担当しています。 唐突ですが、チーム開発をしている皆様は、日常業務でドキュメントを書いていますか? 4 月の新卒社員の配属や組織再編・異動など、人や組織が大きく入れ替わる時期を終え、以下のような課題を再認識したチームも多いのではないでしょうか。 オンボーディングのドキュメントが整っていない 現状のアーキテクチャ図が整備されていない プロダクトのデバッグ対応が言語化されていない 自チームでもこういった問題は常に挙がっていましたが、ドキュメンテーション改善はなかなかされない状況が続いていました。 リモートワークが中心の業務では特に、暗黙知をきちんと言語化し、属人性
はじめに 2023年4月に入社した竹内博俊と池田柳之介と申します。 今年の3月にOpenAIはChatGPT APIを公開し、多くの注目を浴びました。 それから約1ヶ月後、当社リクルートでは、データ/エンジニアスペシャリストコースにて入社した新人を含む、データ推進室内で希望があった既存社員向けにこのAPIを利用した研修を実施しました。 研修から約3ヶ月が過ぎ、基礎的な部分の内容はだいぶ理解され、広まってきたように感じます。 このブログでは、我々新入社員が研修を通じて得た知見についてご紹介したいと思います。 なぜプロンプトデザイン研修を行うのか? この研修は「プロンプトデザイン研修」と名付けられており、当社のシニアサーチエンジニア、大杉直也が立案し講師を務めました。 研修立案の背景について、大杉はこう述べていました。 「研修対象は専門家だけではなく、非専門家のエンジニアも含むべきだと考えまし
はじめに こんにちは。人材領域でレコメンドシステムの機能開発をしている羽鳥です。 今日はみなさんが大好きな huggingface のライブラリを使って、自然言語処理を行う際に欠かせないトークナイザーを学習させる方法について書いていこうと思います。 huggingface 近年の自然言語処理においてはBERT1をベースにしたモデルは欠かせないものになってきました。 そしてその実装として市民権を得ているものの一つがhuggingfaceのライブラリでしょう。 huggingfaceのライブラリを使うと、いい感じに隠蔽されたインターフェイスを利用して多くのモデルを内部構造を気にすること無く使えるようになります。 Kaggleなどの分析プラットフォーム上で行われる自然言語を用いるコンペでもデファクトスタンダードとなっており、多くのユーザーに利用されています。 トークナイザー BERTに限らず自然
こんにちは、『スタディサプリENGLISH』 SREグループの木村です。 最近はコロナ禍で身体がなまりすぎて、ジムに通い始めたのですが体が硬くて筋トレをするための柔軟性がないのを日々嘆いています。 今回はSREグループの中でビジョン・ミッションを決めた話を書きたいと思います。 『スタディサプリENGLISH』 SREグループ 現在 『スタディサプリENGLISH』のSREグループには6名が在籍しています。 元々はプロダクト専任の組織ではなく、株式会社リクルートマーケティングパートナーズ1)現在は株式会社リクルートに統合済みのプロダクト内製開発組織全体のエンジニアの生産性や価値向上のための支援を行う組織として、開発支援グループという名前で2016 年 4 月に誕生しました。 2) https://www.wantedly.com/companies/recruit-mp/post_artic
次のページ
このページを最初にブックマークしてみませんか?
『blog.recruit.co.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く