タグ

WEKAに関するurza358のブックマーク (11)

  • Wekaを起動する(ROC曲線とlift chart)補足1

    社会人MBA-技術者編:MBA技術者の視点 技術と経営の橋渡し: MBA技術者の視点から研究開発、品質管理、シックスシグマ、データマイニングを探求します。 今回は、「Wekaを起動するシリーズ」の補足である(が重要かも、これまでのシリーズはブログ記事の下「Labels」の「データマイニング」をクリックすると御覧になれます)。 「lift chartとROC曲線」・・・意味はわからなくとも、「習うより慣れろ」でとにかく上のグラフが描画できればいいのである。ファイルはwekaがインストールされた時にインストールされているweather.arffを使用し決定木分析(J48)を行う。 Classify:choose:trees:J48でとりあえずStart、分析を行なう。 下図の部分を右クリックして、Visualize threshold curve→yes(この分析の場合はゴルフplayする=

    Wekaを起動する(ROC曲線とlift chart)補足1
  • http://weka.sourceforge.net/doc/

  • はじめてのweka勉強会 −修正版− - sleeping vote

    ゼミ用資料です。 今回は、GUIで遊ぶ70%、プログラムを書いて理解する30%です。おきらくに、楽しんでやっていきましょう。 勉強会の資料 http://groups.google.com/group/cica25th/files 00.wekaを楽しむ前に wekaはJavaで作られています。それを動かすために、JRE(Java Runtime Environment)が必要となります。 (jre1.4以上必須) パスを通すなどの作業がいるので、詳しくは周りのJavaに強い方か、Google先生に聞いてみましょう。 0.wekaって何? Wekaとはオープンソースのデータマイニングツールで、世界中の研究者に愛用されているツールだ。 (中略) Wekaにはデータマイニングのために必要なアルゴリズムが多数収録されており、データに対する前処理、アルゴリズムの適用、結果の視覚化といった作業をGU

    はじめてのweka勉強会 −修正版− - sleeping vote
  • 社会人MBA-Wekaを起動する(記事一覧)

    ▼ 2024 (30) ▼ 3月 (9) 設計理論の考察(実践への応用):④公理的設計とは?失敗しない設計 設計理論の考察(実践への応用):③公理的設計とは?文献レビュー My GPTsを作るときに欲しかった解説 設計理論の考察(実践への応用):②設計の概念化(公理的設計) 設計理論の考察(実践への応用):①リサーチ開始 実務でのChatGPT(正規性の検定、*Python in Excel含みます) 実務でのChatGPT(業界動向を自動ブログ生成GPTsで確認する) 実務でのChatGPT(決定木分析) 実務でのChatGPT(工程能力の算出) ► 2月 (14) ► 1月 (7) ► 2023 (18) ► 12月 (1) ► 7月 (3) ► 6月 (3) ► 5月 (1) ► 4月 (6) ► 3月 (4) ► 2020 (1) ► 5月 (1) ► 2016 (1) ► 10月

  • Weka 3 - Data Mining with Open Source Machine Learning Software in Java

    Weka is a collection of machine learning algorithms for data mining tasks. It contains tools for data preparation, classification, regression, clustering, association rules mining, and visualization. Found only on the islands of New Zealand, the Weka is a flightless bird with an inquisitive nature. The name is pronounced like this, and the bird sounds like this. Weka is open source software issued

  • How to use Weka tool box

    WekaはニュージーランドWaikato大学で開発されたデータマイニングツール ボックスです.授業では,このWekaツールボックスの中に含まれる決定木生 成アルゴリズムJ48を用いて演習を行います.以下ではSFCの特別教室の環境を 想定し,必要なセットアップと使用方法について述べます. Wekaはインターネット上で無料で提供されています.利用に際してはヴァー ジョン1.2以上のJava開発環境が必要です.マニュアルでは,説明の都合上, Wekaを履修者各自がCNSの自分のディスク領域にインストールして使用するこ とを前提としていますが,知識のある人は,自分のノートPCなどにインストー ルしても構いません.Wekaに関する詳しい情報はすべて,WekaのWebページ を参照して下さい. UNIXの操作にある程度慣れている人は、以下で説明するweka-3-3-6.jar を解凍したものをt

  • http://www.harakawa-maebit.com/weka/index.html

  • ID3 - Wikipedia

    ID3[1]は汎用目的で設計された教師あり学習アルゴリズムの一種である。その学習効率の高さと出力が決定的であることなどから、エキスパートシステムの知識獲得部分にしばしば用いられる。 概要[編集] ID3(Iterative Dichotomiser 3)は1979年にジョン・ロス・キンラン(John Ross Quinlan)により提案された。その学習方法はオッカムの剃刀の原理に基づいている。すなわち最低限の仮説による事象の決定を行う。出力は決定木の形で表される。 この方法は各独立変数に対し変数の値を決定した場合における平均情報量の期待値を求め、その中で最大のものを選びそれを木のノードにする操作を再帰的に行うことで実装される。 学習効率が良く、多数の例題から学習することが出来るが、「例題を一括に処理する必要があり学習結果の逐次的な改善が行えない」、「入力変数が連続値を取る場合は利用できない

  • C4.5 - Wikipedia

    C4.5はロス・キンランが開発した決定木を生成するためのアルゴリズムである。C4.5はキンランのID3アルゴリズムの拡張である。C4.5が生成する決定木はクラス分けのために使うことができ、このため、C4.5はしばしば統計学的クラス分類器とみなされている。 アルゴリズム[編集] C4.5はID3と同じ方法で情報エントロピーの概念を用いて教師データのセットから決定木を生成する。教師データはすでにクラス分けがされているサンプルである。それぞれのサンプルは属性や特徴を表現するベクトルである。教師データはそれぞれのサンプルが属するクラスを表現しているベクトル で拡張される。 C4.5はそれぞれのデータの属性はデータを更に小さな部分集合に分割する決定に使用できるという事実を利用している。C4.5はデータを分割するための属性を選択した結果による正規化されたインフォメーション・ゲイン(エントロピーの違い)

  • Paper - 機械学習の「朱鷺の杜Wiki」

    その他の論文紹介一覧† Paper/AAAI-1998-p792 - Learning to Classify Text from Labeled and Unlabeled Documents Paper/ACL-2007-p256 - Frustratingly Easy Domain Adaptation Paper/bias-on-the-web - #author("2020-10-16T22:51:01+00:00","default:ibisforest","ibisforest") Paper/DataMiningAndKnowledgeDiscovery-6-p303 - Techniques of Cluster Algorithms in Data Mining Paper/ICDM-2003-p115 - Clustering of Time-Series Subs

  • テキスト処理にWekaを使う(その1:文書のトークン化とTFIDF重みづけ) - シリコンの谷のゾンビ

    テキスト分類課題などでは,文書をTF-IDF重み付けしたbag-of-wordsで表現することが多い.これをベースラインにするため,さくっとこの処理をしたい.卒論やM1のときは,この処理をわざわざ手で書いたのだが,バグが出たら大変だし,なにより面倒くさい. 論文では,最近流行りのLuceneを使っている人もいるけれど,WekaのStringToWordVectorもなかなか高性能.TFIDF重みづけまでの処理をやってみる.Luceneの方が汎用性があるから便利そうなんだけれど,とりあえずテキスト分類課題に使いたいので. 前提知識 かなり自分用メモ(+α)なので,説明不足な部分があります.あと,基的にCUIベースで話を進めます.最後の方に気がついたのですが,GUIとずれがありますね.そこらへんは,まぁ,適当に. Wekaについては,日語情報があるにはあるのですが最近更新されていないので,

    テキスト処理にWekaを使う(その1:文書のトークン化とTFIDF重みづけ) - シリコンの谷のゾンビ
  • 1