統計解析・データマイニングのR言語の入門編の講師をしてきました。途中、質問・議論をはさむ双方向形式で進行し、1時間30分の講義。講義資料も下記のSlideShareに公開してあります。 講義資料 [データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門 AGENDA Rとは データ構造 データ入出力 データ演算 基本統計量算出 統計データの視覚化 統計解析・データマイニングの種類 ソースコード 資料内で挙げているサンプルソースコードは一部、以下のエントリにも記載してあります。こちらもご覧下さい。 項目 エントリリンク 環境設定 R のインストール・環境設定 R を Eclipseで使う方法 Java R Interface (JRI) を用い 統計解析環境 R を Java から使用する データ構造 R言語プログラミング: データ型・操作
2017/10/28 "第60回 データマイニング+WEB @東京( #TokyoWebmining 60th ) ー 機械学習 活用 祭り ー" を開催しました。 第60回 データマイニング+WEB @東京( #TokyoWebmining 60th ) ー 機械学習 活用 祭り ーEventbrite Google グループ 会場提供して下さった FreakOut さん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者セキココ:第60回 データマイニング+WEB @東京 セキココ (作成してくれた [Twitter:@komiya_atsushi] さんに感謝) 以下、全講師資料、関連資料、ツイートまとめです。 AGENDA: ■Opening Talk: O1.「デー
データマイニング+WEB@東京 (TokyoWebmining) 主催者の濱田晃一 (id: hamadakoichi)です。 本日 2017/10/28(土) 、 「第60回 データマイニング+WEB
前回の書籍「ビジネス活用事例で学ぶデータサイエンス入門」の姉妹本つくりました。 今回のはライト層向けの啓蒙的書籍です。 コードは一切ないです。 統計処理の解説をつけました。 用語解説を充実させました。 データサイエンスってなにしているの?的なことを軽く読みたい方ぜひ! 以下、「はじめに」を抜粋します。 はじめに 人間の感覚はとても優れています。ときにはデータでわかること以上のことに実感を伴って理解していたりします。しかしながら一方で、ある部分ではいいかげんなため、ある一面においてデータ分析がビジネスで効果をあげているのではないかと。 そのある一面とは他人の気持ちを想像するという一面になると考えます。経験することで生まれた感覚がデータを超えた、とても優れている機能であることは間違えないのですが、どこまでいっても自分の感覚という域をでません。ビジネスでは他人の気持ち、みんなの気持ちを上手に理解
R - インストール R の入手 CRANで入手できます 日本のミラーサイトは ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN http://cran.md.tsukuba.ac.jp/ です. 環境に応じて以下のファイルを入手すれば良いでしょう. 通常の利用にはソースは必要ないと思います. (以下の説明は私の利用環境ですので, それ以外の環境の方ごめんなさい. 教えていただければ追加します. ) 日本語版が利用可能ですので使える環境の方は利用するとよいでしょう (Rwikiでのインストールの解説) Macintosh のインストールについては、群馬大学の青木先生がまとめたもの があるので、 そちらを御覧下さい。 Windows Xp, Me, 2000, NT, 98, 95の場合(ver.2.7.1の場合) (FTPの場合 /bin/windows/bas
R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.
R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基本統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK
多次元データをクラスタリングする際に、それらのデータを2次元データに落とし込んで可視化させたいことがあります。そんな時に便利なのが「多次元尺度法」という手法です。 個々のデータ間の距離/類似度が分かっている場合に、それらのデータの座標を求めて、データ構造を復元するようなものです。 詳しい説明は割愛します。知りたい人はwikipediaと金先生の連載を読んで下さい。 体で覚えるタイプなので、とにかく何かデータを処理してみます。 「山手線」の地図を再現 さっそく試してみます。 山手線の各駅同士の直線距離を測っておいて、そのデータから実際の位置関係を復元できるか実験してみます。 山手線全駅の距離を測るのはめんどいので、適当に抜粋してしらべました。 以下のような表になりました。単位はメートルです。 さてさて、この距離表からどのようなデータ構造が再現されるでしょうか? このデータを統計解析ソフトRで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く