タグ

naive bayesに関するteitei_tkのブックマーク (8)

  • Mahoutでnaive bayesしてみる | mwSoft

    概要 なんだかナイーブな気持ちになったので、Mahoutのnaive bayesを使って心を落ち着けようとしてみた。 バージョンは0.7。コマンドの引数はバージョンによってけっこう違うので注意。 テストデータを用意する Wikipediaから野球、サッカー、F1の記事を各10個ずつ、計30記事を取ってきて、3つのジャンルでclassifyできるよう教育してみる。 コマンドから実行する場合、ディレクトリ名 = ラベルとして扱われる。ので、下記のようにカテゴリごとにディレクトリを分けてファイルを配置しておく。 |-- baseball | |-- buffaloes | |-- dragons | (中略) | |-- swallows | `-- tigers |-- f1 | |-- cenna | |-- europeangp | (中略) | |-- spaingp | `-- wil

  • 404 Not Found

    404 Not Found We've been cleaning house on our website! Q. Looking for something that used to be on the old website? See https://spamassassin.apache.org/old/

  • jsai2012 Schedule

    時間 A会場 山口県教育会館/大ホール B会場 山口県教育会館/第一研修室 C会場 山口県教育会館/第二研修室+第三研修室 D会場 山口県教育会館/第二研修室+第三研修室 E会場 山口県教育会館/第四研修室 F会場 山口県教育会館/会議室I G会場 山口県教育会館/大ホールの外 H会場 ゆ~あいプラザ山口県社会福祉会館/入口のロビー I会場 ゆ~あいプラザ山口県社会福祉会館/大ホール J会場 ゆ~あいプラザ山口県社会福祉会館/大ホールの外 K会場 ゆ~あいプラザ山口県社会福祉会館/第1会議室 L会場 ゆ~あいプラザ山口県社会福祉会館/第2会議室 M会場 山口県自治会館/大会議室 N会場 クリエイティブ・スペース赤れんが/1F O会場 クリエイティブ・スペース赤れんが/2F P会場 ふるさと伝承センターみやび館/和室 09:00-09:05

  • 単純ベイズ分類器 - Wikipedia

    単純ベイズ分類器(たんじゅんベイズぶんるいき、英: Naive Bayes classifier)は、単純な確率的分類器である。 概要[編集] 単純ベイズ分類器の元となる確率モデルは強い(単純な)独立性仮定と共にベイズの定理を適用することに基づいており、より正確に言えば「独立特徴モデル; independent feature model」と呼ぶべきものである。 確率モデルの性質に基づいて、単純ベイズ分類器は教師あり学習の設定で効率的に訓練可能である。多くの実用例では、単純ベイズ分類器のパラメータ推定には最尤法が使われる。つまり、単純ベイズ分類器を使用するにあたって、ベイズ確率やその他のベイズ的手法を使う必要はない。 設計も仮定も非常に単純であるにもかかわらず、単純ベイズ分類器は複雑な実世界の状況において、期待よりもずっとうまく働く。近頃、ベイズ分類問題の注意深い解析によって、単純ベイズ分

  • ナイーブベイズを用いたテキスト分類 - 人工知能に関する断想録

    今までPRMLを読んで実装を続けてきましたが、10章からは難しくて歯が立たなくなってきたのでここらで少し具体的な応用に目を向けてみようと思います。機械学習の応用先としては画像の方が結果を見ていて面白いんですが、当面は自然言語処理を取り上げます。そんなわけで一番始めの応用は機械学習と自然言語処理の接点として非常に重要なテキスト分類(Text Classification, Text Categorization)の技法たちを試していきたいと思います。テキスト分類は文書分類(Document Classification)という呼び方もあります。テキストと文書は同じ意味です。最初なので自分の知識の整理と入門者への紹介のためにちょっと丁寧にまとめてみました。 テキスト分類とは テキスト分類とは、与えられた文書(Webページとか)をあらかじめ与えられたいくつかのカテゴリ(クラス)に自動分類するタス

    ナイーブベイズを用いたテキスト分類 - 人工知能に関する断想録
  • Algorithm::NaiveBayes - Bayesian prediction of categories - metacpan.org

    NAME Algorithm::NaiveBayes - Bayesian prediction of categories SYNOPSIS use Algorithm::NaiveBayes; my $nb = Algorithm::NaiveBayes->new; $nb->add_instance (attributes => {foo => 1, bar => 1, baz => 3}, label => 'sports'); $nb->add_instance (attributes => {foo => 2, blurp => 1}, label => ['sports', 'finance']); ... repeat for several more instances, then: $nb->train; # Find results for unseen instan

  • Transformed Weight-normalized Complement Naive Bayes(TWCNB)についての実験と結果 - rubyu's blog

    自作ソフトにテキストの多クラス分類機能を組み込みたくて、調べてみたら Complement Naive Bayes(CNB、補集合ナイーブベイズ)というアルゴリズムが最近の流行のようで、これを検証してみることにしました。 元論文 を一通り読んでから検証を進めていきました。実装される際は目を通すことをオススメします。 使用したコーパスは以下のようなもの 想定する用途に合わせて、それなりにクラス間でデータの量にばらつきがあります。 クラス ファイル数 サイズ A 832 121MB B 491 182MB C 449 59MB D 312 111MB E 298 26MB F 245 67MB G 234 73MB H 210 33MB I 123 33MB J 63 3MB K 62 14MB L 47 6MB M 47 5MB ひとまず、シンプルなナイーブベイズを 集合知プログラミング を

    Transformed Weight-normalized Complement Naive Bayes(TWCNB)についての実験と結果 - rubyu's blog
  • PHPでNaive Bayesを使ってみる - テノニッキ (@hideack 's diary)

    今月号のWEB+DB PRESS。 WEB+DB PRESS Vol.49 作者: arton,桑田誠,角田直行,和田卓人,伊藤直也,西田圭介,岡野原大輔,縣俊貴,大塚知洋,nanto_vi,徳永拓之,山陽平,田中洋一郎,下岡秀幸,ミック,武者晶紀,高林哲,小飼弾,はまちや2,WEB+DB PRESS編集部出版社/メーカー: 技術評論社発売日: 2009/02/23メディア: 大型購入: 8人 クリック: 326回この商品を含むブログ (47件) を見る はてなブックマークのリニューアルに際しての特集記事があったり、レコメンドエンジンの解説記事があったりと非常に読み応えがあっていつもの3割増でおすすめ。 で、ブックマークのカテゴリ自動判定システムで使われているアルゴリズムはComplement Naive Bayesで、このアルゴリズムの元となっているアルゴリズムはNaive Baye

    PHPでNaive Bayesを使ってみる - テノニッキ (@hideack 's diary)
  • 1