タグ

ベイズに関するfoaranのブックマーク (6)

  • ウノウラボ Unoh Labs: 自己学習で分類精度を向上させるベイジアンフィルタ

    20070201勉強会_ベイジアンフィルタ posted by (C)フォト蔵 ベイジアンフィルタを自己学習を行う事で文書を高精度にフィルタリングすることができるシステムです。 SpamassassinやPOPFileのようなspamメール振り分けソフトに使用されているのでご存知の方も多いと思います。 ベイジアンフィルタというとspamメールの処理で広く使われているイメージがありますが、 これをwebの世界でも応用してみれば面白いものができるんじゃないかと思っていろいろ開発してたのですが、 結局実現には至りませんでした。 このままではもったいないので、これまで勉強してわかってきたことを勉強会で発表しました。 勉強会の様子の動画と資料を公開します。 bayes.pdf 僕自身専門家ではないので、いろいろ間違ってる部分もあるかと思います。 その時はご指摘いただければ幸いです。

  • Kikkerっぽいの作ってみたよ

    はてなブックマークの中から個人の好みに合ったブックマークを オススメしてくれるKikkerというサイトがある。 ユーザーの嗜好ベクトルを元にオススメするブックマークを 選らんでくれるらしいけど、なかなかおもしろい。 というわけで、自分でもなんかやってみようというわけで作ってみた。 Greif 2匹目のどじょうなわけだけど、一応中のアルゴリズムは違うはずだから これもひとつの選択肢ということで。 中で何をやってるかというと、それぞれのユーザーごとに 各ブックマークのポイントを計算してるだけ。 これはたぶんKikkerと同じ。 Kikkerと違うのは、ブックマーク先のジャンルの判定に、 ページの内容じゃなくてタグを使ってることと、 ユーザーの好みに合うかどうかをナイーブベイズ使ってること。 タグを使った理由は、形態素解析だとどうしてもページの内容を正確に 把握できない気がして。 もっとも、付け

    Kikkerっぽいの作ってみたよ
  • Greif - Yet Another HateBu Suggestion

    Greifbeta guestさんにオススメのブックマーク 伊勢名物 赤福 | Official Web Site tags: webdesign design food cool website 7 users -19.2 0.660 伊勢名物 赤福 | Official Web Site tags: webdesign design food cool website 7 users -19.2 0.660 高橋メソッド - toStringで関数呼び出し tags: web javascript idea todo 2 5 users -32.0 0.765 高橋メソッド - toStringで関数呼び出し tags: web javascript idea todo 2 5 users -32.0 0.765 S5 Reloaded Welcome tags: web javasc

  • Greif - [・ _ゝ・]日記を書くはやみずさん

    Greif(http://tech.no.land.to/greif/index.php) はてブのお勧めエントリを教えてくれる。ちょっと使ってみたが 学習させるのに別のリンクを押すのは面倒 Suggestされた記事の精度があまりよくない 似たようなサービスKikker(http://ryogrid.myhome.cx:1234/)との比較 Kikker Greif 精度*1 それなりに良い 悪い デザイン どうみてもはt(ry 良い。スクリーンショットを使うというアイディアはいいと思う 学習方法 エントリを見る(エントリへのリンクをクリックする) エントリへのリンクとは別に、興味ある、興味ないというリンクがある RSS ある ない ページ表示までの時間 遅い 普通 SS UIと、ページ表示までの時間以外はKikkerのほうが使いやすい。しかし、KikkerはRSSでしか読まないので、この

    Greif - [・ _ゝ・]日記を書くはやみずさん
  • A Plan for Spam - スパムへの対策

    スパムへの対策 ---A Plan for Spam Paul Graham, August 2002 これは、Paul Graham:A Plan for Spam を、原著者の許可を得て翻訳・公開するものです。 <版権表示> 和訳テキストの複製、変更、再配布は、この版権表示を残す限り、自由に行って結構です。 (「この版権表示」には上の文も含まれます。すなわち、再配布を禁止してはいけません)。 Copyright 2002 by Paul Graham 原文: http://www.paulgraham.com/spam.html語訳:Shiro Kawai (shiro @ acm.org) <版権表示終り> Paul Graham氏のエッセイをまとめた『ハッカーと画家』の 邦訳版が出版されました。 出版社の案内ページ Amazon.co.jp サポートページ

  • ベイジアンフィルタ - Wikipedia

    ベイジアンフィルタ (英: Bayesian filter, naive Bayes spam filtering) は単純ベイズ分類器を応用し、対象となるデータを解析・学習し分類する為のフィルタ。学習量が増えるとフィルタの分類精度が上昇するという特徴をもつ。個々の判定を間違えた場合には、ユーザが正しい内容に判定し直すことで再学習を行う[1]。 現状ではスパムメール(いわゆる迷惑メール)を振り分ける機能を持つソフトウェア(フィルタリングソフト)で、スパムフィルターでのスパム判定に利用されることが多い[1]。最近ではWeblogのトラックバック用フィルタ(トラックバックスパム対策)にも利用されるようになるなど、その利用範囲は徐々に広がりつつある。 概要[編集] ベイジアンフィルタでは、初期状態である程度までの振り分けができるように設定されている。振り分け対象となるデータ(迷惑メールなど)の学

    ベイジアンフィルタ - Wikipedia
  • 1