This document summarizes the key aspects of winning the Kaggle/Yandex competition to re-rank search results according to personal user preferences. It describes the goal of predicting user pertinence for URLs to improve search rankings. It then outlines the team's approach, which involved constructing many features, using Dataiku Science Studio for modeling, and optimizing models like Random Fores
Slides from Large Scale Recommender System workshop at ACM RecSys, 13 October 2013.
主催 日本オペレーションズ・リサーチ学会 実践的データマイニング研究部会 協賛 経営情報学会関西支部 株式会社 玉屋 ビジネスマイニング研究センター有限責任事業組合 趣旨 ファッションは実に多くの要素を持つデータとして分解することが可能であり、それに基づいて行われる人間の選択は大変興味深いものがあります。一般のPOSデータでは、単に商品名(あるブランドのスーツなど)と売上高はわかるものの、その商品がなぜ選択され、どうして人気があるのかといったことは、なかなかそれだけではわかりません。実際には、商品の色の状態、模様、形などを表現している画像データ、商品の特性、そしてそれを選択した人の個人属性や嗜好などは、商品選択に大きな影響を与えることが予想されます。このようにできるだけ多くのファッション選択にかかわる要素に特化したデータは調べた限り利用できるものはないため、本研究部会では、でき
When it comes to recommendation systems, everybody's looking to increase accuracy: the Netflix Prize was awarded last July for an algorithm that improved the accuracy of the service's recommendation algorithm by 10 percent. However, computer scientists are finding a new metric to improve upon: recommendation diversity. In a paper that will be released by PNAS, a group of scientists are pushing the
レコメンダシステム(英: recommender system)は、情報フィルタリング (IF) 技法の一種で、特定ユーザーが興味を持つと思われる情報(映画、音楽、本、ニュース、画像、ウェブページなど)、すなわち「おすすめ」を提示するものである。通常のレコメンダシステムは、ユーザーのプロファイルを何らかのデータ収集基準と比較検討し、ユーザーが個々のアイテムにつけるであろう評価を予測する。基準は情報アイテム側から形成する場合(コンテンツベースの手法)とユーザーの社会環境から形成する場合(協調フィルタリングの手法)がある。 概要[編集] ユーザーのプロファイルを構築するとき、データ収集の明示的部分と暗黙的部分を区別する。 明示的データ収集には次のようなものがある。 ユーザーにあるアイテムの評価を付けてもらう(例えば5段階評価)。 ユーザーに一群のアイテムを好きか嫌いかランク付けしてもらう。 ユ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く