タグ

Rに関するryozo18のブックマーク (17)

  • データの扱い方・読み方がわかる! 実践的なビジネスデータ分析の入門書『楽しいR』著者インタビュー

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    データの扱い方・読み方がわかる! 実践的なビジネスデータ分析の入門書『楽しいR』著者インタビュー
    ryozo18
    ryozo18 2015/02/02
  • Rのバージョン3.1.0がリリース|Colorless Green Ideas

    統計処理言語の R のバージョン3.1.0が、2014年4月10日に公開された。この新リリースでの主な変更点について解説する。 バージョン3.1.0のリリース 2014年4月10日、R のバージョン3.1.0がリリースされた。コードネームは Spring Dance(春の踊り)である。バージョン3.0.0がリリースされたのは、2013年4月3日なので、およそ1年を経てマイナーバージョンアップが行われたことになる [1] 。 Rのバージョン3.1.0のコードネームは Spring Dance(春の踊り)である。 [2] バージョン3.1.0での変更点の詳細は、Rアナウンスメーリングリストでのバージョン3.1.0リリースの通知(R 3.1.0 is released、英語)を参照されたい。 バージョン3.1.0での主な変更点 以下で、バージョン3.1.0での変更点のうち、重要だと思われる点をい

    Rのバージョン3.1.0がリリース|Colorless Green Ideas
    ryozo18
    ryozo18 2014/04/15
    メモ
  • 傾向スコア分析のRパッケージ(個人的メモ) - こにしき(言葉・日本社会・教育)

    最近、傾向スコア分析を再勉強している。 非常におおざっぱに言えば、無作為割り当てが不可能な調査観察データにおいて、擬似的に無作為割り当て状況を作り出す手法。 もう少し噛み砕いて言えば、「似たもの同士」を探してそのペアを比較する手法と言えばわかりやすいだろうか。このように、分析の中心的な考え方は「ペアの比較」なので分析レベルではかなりシンプルな手法だが、どのような基準で「似たもの同士」を定義するか(「マッチング」と呼ばれる)がけっこう複雑。 じじつ、数年前、『調査観察データの因果推論』(下記)を読んだときはほとんど理解できなかった。 調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学) 作者: 星野崇宏出版社/メーカー: 岩波書店発売日: 2009/07/29メディア: 単行購入: 29人 クリック: 285回この商品を含むブログ (26件) を見る

    傾向スコア分析のRパッケージ(個人的メモ) - こにしき(言葉・日本社会・教育)
    ryozo18
    ryozo18 2014/03/14
    傾向スコア分析。メモ
  • R でレポートを作成するのに knitr が超便利 - あらびき日記

    この記事は abicky.net の R でレポートを作成するのに knitr が超便利 に移行しました

    R でレポートを作成するのに knitr が超便利 - あらびき日記
    ryozo18
    ryozo18 2014/02/21
  • Rの初歩

    Rのインストール R(アール)は統計・データ解析・統計グラフ作成のためのオープンソースソフトです。CRAN(「シーラン」または「クラン」、Comprehensive R Archive Network)のミラーサイト(日では統数研 https://cran.ism.ac.jp/ など)からダウンロードし、インストールしてください。Windows用、Mac用、Linux用があります。 最近では下図のような RStudio(アール・スタジオ、英語の発音により忠実に書けばアール・ステューディオまたはアール・ストゥーディオ)という統合開発環境(IDE)を介してRを使う人が増えています。Download RStudio Desktop のページからダウンロードしてインストールします。 RStudio。左上ペインがソースエディタ(この図では隠れている)、左下がRコンソール、右上がグローバル環境のオブ

    ryozo18
    ryozo18 2013/10/23
    これほんとに初歩から説明されててわかりやすい
  • 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ

    (※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや

    今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ
    ryozo18
    ryozo18 2013/09/19
    早見表ありがたい
  • マルコフ状態転換モデルのRパッケージ{MSwM}の使い方(異常値検出・ステータス変化検出などに有用) - 渋谷駅前で働くデータサイエンティストのブログ

    CRANパッケージ{MSwM}の大体の使い方が分かったので簡単に共有します。 なお、しつこいようですがマルコフ状態転換モデルについてはこのブログではすっかりお馴染みの以下のテキストをご参照のこと*1。僕もまだ勉強中です。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者: 沖竜義出版社/メーカー: 朝倉書店発売日: 2010/02/01メディア: 単行購入: 4人 クリック: 101回この商品を含むブログ (4件) を見る Time Series Analysis 作者: James D. Hamilton出版社/メーカー: Princeton Univ Pr発売日: 1994/01/11メディア: ハードカバー購入: 1人 クリック: 5回この商品を含むブログ (7件) を見る なお、沖テキストでは簡単な説明のみに留められているので、Hamiltonテキストの方

    マルコフ状態転換モデルのRパッケージ{MSwM}の使い方(異常値検出・ステータス変化検出などに有用) - 渋谷駅前で働くデータサイエンティストのブログ
    ryozo18
    ryozo18 2013/06/21
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
    ryozo18
    ryozo18 2013/06/11
  • 統計解析ツール「R」、8年半ぶりのメジャーバージョンアップ版「R 3.0.0」リリース | OSDN Magazine

    4月3日、オープンソースの統計解析ツール「R」開発チームは最新版となる「R 3.0.0」(開発コード「Masked Marvel」)のリリースを発表した。2^31-1以上の要素を持つベクトル(Long Vector)のサポートなどが加わっている。 Rは統計や解析処理、グラフ化のための言語および実行環境。WindowsMac OS X、Linuxなどで利用できる。GNU Projectの1つで、動的型付け、オブジェクト指向などの特徴を持ち、データの操作、計算、グラフィック表示などの機能も統合されている。拡張性が高く、関連パッケージが豊富に用意されている点も特徴で、パッケージはCRAN(Comprehensive R Archive Network)から入手できる。ライセンスはGPL。 バージョン3.0.0は、2004年に公開されたR 2.0.0以来のメジャーバージョンとなる。大きな変更点と

    統計解析ツール「R」、8年半ぶりのメジャーバージョンアップ版「R 3.0.0」リリース | OSDN Magazine
    ryozo18
    ryozo18 2013/04/08
  • MacR のインストールから最初の起動

    4月10日追記。開発者の今尾さんご自身が MacR のダウンロードサイトを用意してくださったので、そちらのリンクを紹介します。インストール方法等の説明はありませんので当ブログエントリーは残しておきますが、ファイル自体はこちらからダウンロードしてください。 MacR ダウンロードサイト https://sites.google.com/site/casualmacr/ 2月23日のLET関西支部メソドロジー研究部会で正式に発表された MacR は、オープンソースの統計解析ソフト R に GUI を装備し、ドラッグ・アンド・ドロップなどを使いながら直感的に統計処理を行うことを目指した Mac OS X 専用のアプリケーションです。 製作者の今尾康裕さん(大阪大学)による正式なサイトが未完成で、マニュアルやチュートリアル的なものも未整備なため、とりあえずインストールをして使えるようになるまでの手

    MacR のインストールから最初の起動
    ryozo18
    ryozo18 2013/02/25
  • データサイエンティストを目指すなら知っておきたいRパッケージ10個+α - データサイエンティスト上がりのDX参謀・起業家

    元ネタのブログは「10 R packages every data scientist should know about」と「10 R packages I wish I knew about earlier」です。紹介されているパッケージはどれも良いのでメモしておきます。私が「取得した方がいいだろうなー」と思う順番に並べ替えてます。サンプルコードは後者の記事に載ってます。 randomForest:超強力な汎用予測モデル RPostgreSQL, RMYSQL, RMongo, RODBC, RSQLite:各種データベースへの接続 plyr:データ集約 reshape2:データ加工 forecast:時系列予測 stringr:文字列操作 lubridate:日付操作 sqldf:SQLライクなデータ操作 ggplot2:綺麗なプロットを描く qcc:品質管理 個人的には、下の3つは

    データサイエンティストを目指すなら知っておきたいRパッケージ10個+α - データサイエンティスト上がりのDX参謀・起業家
    ryozo18
    ryozo18 2013/02/20
  • R のデータ構造とメモリ管理 - あらびき日記

    この記事は abicky.net の R のデータ構造とメモリ管理 に移行しました

    R のデータ構造とメモリ管理 - あらびき日記
    ryozo18
    ryozo18 2012/11/27
    メモ
  • R言語で何ができる?

    昨今、ビッグデータというキーワード、およびその関連技術は非常に注目を集めており「R言語」というフレーズを耳にする機会も多くなってきたように感じます。 稿は利用例を通じてR言語の概要、イメージを掴んでいただくことに加え、R言語を取り巻く業界の動向についてご紹介することを目的としています。 利用例としては、私がとあるシステム運用において実施していた分析を簡略化した形でご紹介します。システム統計情報に対する分析事例なので、ITシステムの設計や運用に携わる方であれば目にすることの多い、なじみ深いデータ分析と言えるのではないでしょうか。 なお、稿では統計についての数学的な解説は極力行わず、R言語の利用者目線でのご紹介に重点を置きます。 対象読者としては、 などを想定しています。 また、Rは統計的なデータ処理を行うCUIベースのプラットフォームであり、CUI操作、スクリプト言語の経験、統計学に対す

    R言語で何ができる?
    ryozo18
    ryozo18 2012/07/23
  • RではじめるTwitter解析

    Functional Pe(a)rls - the Purely Functional Datastructures editionosfameron

    RではじめるTwitter解析
  • R を終了させる最短コードがおもしろい - ほくそ笑む

    R 環境を終了させたいときは、コマンドラインに q() と打てば終了できます。q() は quit() の省略形で、このままだと Save workspace image? [y/n/c]: などと聞かれるので、それがうっとおしい人は q("no") のように打てば確認されずに終了できます。 しかし、R を終了させるために 7 文字も打つのはめんどくさいと言う人たちがいます。 そういう人たちのために、 Q と打つだけで終了できるようにするテクニックがあります。 どういうテクニックかちょっとおさらいしておきましょう。*1 Q で R を終了させるテクニック まず、コマンドラインに x <- 3.14 x と打つと [1] 3.14 と表示されますね。 ここで、2行目の x は暗黙のうちに print(x) を呼び出していることを思い出してください。 print() は内部で UseMetho

    R を終了させる最短コードがおもしろい - ほくそ笑む
    ryozo18
    ryozo18 2011/10/26
  • R を用いた主成分分析

    この Web ページでは,R を用いた主成分分析のための操作手順の一例を図解で説明します ここでは,R の princomp() 関数を使います. 【補足】princomp() 関数では,特に指定しない限り, 不偏分散共分散行列 あるいは 不偏相関係数行列 が使われます (このことは R の princomp() 関数のマニュアルに書いてあります). あらかじめ決めておく事項 主成分分析を行う CSV ファイル名と属性名を決めておいてください. この Web ページでは,次のように書きます. 散布図を作成する CSV ファイル名: C:\R\Book1.csv 属性名:seq, date, USD, EUR, AUD 属性名は英語になっていること.CSV ファイルの第一行目に書いていること(そうなっているものとして,手順を書きます). 必要となるソフトウエア R のインストール が済んでい

    ryozo18
    ryozo18 2011/01/18
  • Rを用いた顕微鏡画像解析入門

    数値化できることは数値化したほうがよい。-ホグネス このページでは、フリーの統計ソフトR(アール)を使って共焦点顕微鏡の画像データ(Zeiss社のlsm形式)を解析する。 Rは、無料、高機能、プログラミングが容易、プラットフォームフリー、日語のドキュメントが豊富、などの利点をもつ(詳しくはここ)。 Rで画像解析を行うと、画像の読み込みから統計処理・グラフの出力までを自動化できて便利である。 FRAPデータの解析、分子の軸索内局在の解析、小胞輸送の解析、拡散障壁のシミュレーションについて記録する。 必要に迫られたプログラミング初心者の備忘録。 Image gallery 2.1 lsmはバイナリ 2.2 lsmの仕様書 2.3 image directoryとは 2.4 directory entryとは 2.5 画像のピクセルデータ 2.6 lsm特有

    ryozo18
    ryozo18 2009/03/17
  • 1