タグ

Rに関するgokichanのブックマーク (22)

  • R オフラインでのパッケージインストール - Qiita

    を使用すると、簡単にインストールできますが、 作業環境がインターネット接続下にない場合も多々あると思います。 その場合、CRANサイトにてパッケージファイルのダウンロードが可能ですが、 使用したいパッケージのダウンロードだけでは機能しないことが大半です。 一つのパッケージの中で、複数のパッケージを呼び出しているので、それに紐付いているパッケージ全てが必要なためです。 ですが、それを一つ一つ調べてダウンロードすることは大変なので、一括でしたいと思います。 今回は"ranger"というランダムフォレストモデルを作成するためのパッケージを例にやってみたいと思います。 (windows環境で行っています) ①紐付いているパッケージの調査 まずは、インターネット接続のあるPC上のRで、 使用したいパッケージに紐付いているパッケージを調べます。 Rコンソールに以下を入力してください。 #miniCRA

    R オフラインでのパッケージインストール - Qiita
    gokichan
    gokichan 2018/05/29
    オフラインインストール
  • プロキシ環境でRを使うときのメモ - でたぁっ 感動と失敗の備忘録

    職場でRを使っているとパッケージのインストールなどプロキシ環境に悩まされることがある。 企業に多そうなWin7 32bit/64bit環境の話。Macは持っていないので分かりません。 パッケージのインストール 一般的にはコンソールで下記コマンドを実行する。 Sys.setenv("http_proxy"="http://xxx.xxx.xxx.xxx:8080") options(repos=local({ r <- getOption("repos"); r["CRAN"] <- "http://cran.ism.ac.jp"; r })) install.packages("パッケージ名") 下記のようなプロキシの認証画面が出たらユーザーIDとパスワードを入力する。 2行目のミラーサイトのリポジトリは統計数理研究所、これは各自の任意。リポジトリはあらかじめファイルに記述しておけば起動時

    gokichan
    gokichan 2018/05/25
  • R言語で区切り文字による文字列の分割 - jnobuyukiのブログ

    今回は、区切り文字を指定して、文字列を分割してリスト化する方法を紹介します。 strsplit関数 strsplit関数を使うと任意の文字を区切り文字として、文字列を分割できます。例えば以下のように使います。 input <- "abc def ghi" res <- strsplit(input, " ") 区切り文字は正規表現 区切り文字はスペースやタブ(\t)などを指定しますが、実は、正規表現の扱いになっています。なので、+(1文字以上の繰り返し)のような表現を加えると、スペースやタブスペースが連続して入っている箇所を1回の区切りとして扱えます。 #abcの後にはスペースが一つ、defの後にはスペースが2つ入っています。 input2 <- "abc def ghi" res2 <- strsplit(input2, " ") #これだとabc, def,その後に空要素、そしてhgi

    R言語で区切り文字による文字列の分割 - jnobuyukiのブログ
  • グラフの保存 | R で描いたグラフを PNG や PDF に保存する方法

    ※ウェブサイトの CSS を更新しています。デザインが大きく崩れることがあります。 R で描いたグラフを保存する場合、png や pdf 関数などを利用する。次は、png 形式で画像を保存する例である。 x <- c(1, 2, 3, 4, 5) y <- c(2, 4, 6, 8, 10) png("plot1.png", width = 100, height = 100) # 描画デバイスを開く plot(x, y) # グラフを描く points(x, y) dev.off() # 描画デバイスを閉じる postscript 形式で画像を保存する例。 postscript("filename.eps") plot(x1, y1) par(new = TRUE) plot(x2,y2) dev.off() R で作成した EPS 形式の図を TeX に挿入する際に、図 90 度回転し

  • Rで解析:ダミー変数の作成に便利です。「fastDummies」パッケージ

    #パッケージの読み込み library("fastDummies") ###データ例の作成##### set.seed(1234) n <- 4 TestData <- data.frame(Number = 1:n, FactorNum = factor(1:n), ID = paste0("ID", 1:n), Group = sample(paste0("Group", 1:3), n, replace = TRUE)) ######## #数値以外の全変数の組み合わせでダミー変数を列側に作成:dummy_rowsコマンド #データを指定:.dataオプション #対象列を指定:select_columnsオプション,数値は対象外 #数値または対象列外に埋める値:dummy_valueオプション,初期値:NA dummy_rows(.data = TestData, select_co

    Rで解析:ダミー変数の作成に便利です。「fastDummies」パッケージ
  • Dummiesパッケージ

    2. 自己紹介  Twitter ID : @weda_654  勤務先: Google MapAWSの会社  お仕事: データ分析をやっています 2 (社会人1年目)  近況: 会社の自分の席が正式になくなる (デスクレス) 4. ダミー変数とは 4  ある1個の変数がm個のカテゴリーを持つとき,これ をm個の変数D1,D2,…,Dmで表したもの.  例: 血液型 A,B,O,ABの4つのカテゴリー ↓ 変数A,変数B,変数O,変数ABの4つの変数 (変数A,変数B,変数Oの3つの変数でも表現は可能)

    Dummiesパッケージ
  • R関連(1) requireとlibraryの違い -パッケージのインポート - とりあえずやってみた

    いろんなRの参考書を読んでいて疑問に思っていたのが、パッケージをインポートする際に、人によって「require」と「library」の異なる関数を利用していることです。 stackoverflowに同じ疑問点を質問している人がいたので紹介します。 結論から言って、「どっちもあんまり変わらない」そうです。 「require」は指定したパッケージが存在しない場合、警告文が出るが処理自体は止まらない。一方で、「library」は指定したパッケージが存在しない場合、エラーが起こり処理自体が止まるということでしょうか。 また、「require」を利用した場合、パッケージが存在しないと「logical」値を返すことから、以下のようにパッケージがない場合に自動的にパッケージをインストールしてくれるようにスクリプトを書くことができます。 ※stackoverflowに書いてあったスクリプトをそのまま転載し

    R関連(1) requireとlibraryの違い -パッケージのインポート - とりあえずやってみた
  • 【R】dummiesパッケージでダミー変数を生成する - Qiita

    CO2データは以下のように順序付き因子、因子、数値で構成されている $ Plant : Ord.factor w/ 12 levels "Qn1"<"Qn2"<"Qn3"<..: 1 1 1 1 1 1 1 2 2 2 ... $ Type : Factor w/ 2 levels "Quebec","Mississippi": 1 1 1 1 1 1 1 1 1 1 ... $ Treatment: Factor w/ 2 levels "nonchilled","chilled": 1 1 1 1 1 1 1 1 1 1 ... $ conc : num 95 175 250 350 500 675 1000 95 175 250 ... $ uptake : num 16 30.4 34.8 37.2 35.3 39.2 39.7 13.6 27.3 37.1 ... # そのままで

    【R】dummiesパッケージでダミー変数を生成する - Qiita
  • R -- 数量化 III 類

    数量化 III 類     Last modified: Sep 01, 2009 目的 数量化 III 類を行う。 カテゴリーデータ行列の場合には,R の MASS ライブラリに入っている corresp 関数,または ca ライブラリに入っている ca 関数で全く同じ結果が得られる。 アイテムデータ行列の場合には,カテゴリーデータ行列に変換した後 corresp 関数,ca 関数を適用すればよい。 使用法 gt3(x) 引数 x データ行列(行がケース,列が変数) 要素が 0 または 1 のみからなるときはカテゴリーデータ行列 要素が 1 以上の整数値の場合にはアイテムデータ行列とみなす ソース インストールは,以下の 1 行をコピーし,R コンソールにペーストする source("http://aoki2.si.gunma-u.ac.jp/R/src/qt3.R", encoding

    gokichan
    gokichan 2018/05/07
    カテゴリデータのダミー変数化など
  • R言語dplyr::distinctで簡単に重複行を削除できる。キー項目以外の項目も簡単に抽出。 - 一所懸命に手抜きする

    SQLの select distinct では指定した列をキーにして重複のないデータを取得できます。 重複する行を削除するSELECT DISTINCT - 一所懸命に手抜きする 重複行削除の際、重複判定に指定したキー列項目以外の列も取得するSQL - 一所懸命に手抜きする R言語でも同様のことができるのは既に書きました。 R言語のuniqueや!duplicated で重複のないデータを取り出す - 一所懸命に手抜きする dplyrパッケージを使うと、もっと簡単に実現できます。 Sampleデータ作成 当ブロクで使うサンプルデータを作成するコード保管庫|R|一所懸命に手抜きする[忍者] に掲載したサンプル作成コードを実行すると サンプルテーブル buyList 入荷日付 商品番号 商品名 当社原価 相手原価 20170102 12345 XA-55 3500 3500 20170103

    R言語dplyr::distinctで簡単に重複行を削除できる。キー項目以外の項目も簡単に抽出。 - 一所懸命に手抜きする
  • [R]ファイル(フォルダー)の存在を確認する - Golden State

    file.exists関数を使う。なお、3番目の例のとおり、ファイルでもフォルダーでもどちらの存在も確認することができる。 4番目の例のとおり、引数の文字列の最後に「/」(スラッシュ)を付けると、それがフォルダーを指定したことを明示することになる。3番目の例のとおりその逆は残念ながらできない(フォルダーの存在を確認することはできるが、フォルダーではないファイルの存在の確認はできない)。 > file.exists("C:/Windows/notepad.exe") [1] TRUE > file.exists("C:/Windows/notepadpad.exe") [1] FALSE > file.exists("C:/Windows") [1] TRUE > file.exists("C:/Windows/notepad.exe/") [1] FALSE

    [R]ファイル(フォルダー)の存在を確認する - Golden State
  • 例外処理 | R の try 関数あるいは tryCatch 関数で例外処理

    プログラムの実行中にエラーが発生すると、プログラムは中断され異常終了される。これに対して、エラーが生じても、処理を続けるように制御することができる(例外処理)。R で例外処理を行うには try 関数あるいは tryCatch 関数を利用する。 try 関数 ある関数 f を実行し、途中でエラーが発生しても処理を続けたい場合に例外処理を行う。try 関数に f 関数を与えることで、f 関数が実行され、その実行結果が返される。f 関数の処理が正常終了したとき、その結果が返される。一方、異常終了したときは、try-error クラスのオブジェクトが返される。 try 関数の silent 引数に TRUE を与えると、エラーが発生したときエラーメッセージが出力される。FALSE を与えると、エラーメッセージの出力は抑制される。 f <- function(x) { if (x >= 0) { r

  • 【R】テキストファイルを読み込む - Muni Bus

    データとして用意をしているテキストファイルを通常読み込む時はread.table関数を使うことが多いが、純粋にテキストファイルとしてデータを読み込みたいときがある。このような場合は、scan関数を使用すればよい。例えばdata.txtというテキストファイルを読み込んでvというベクトルにする場合は以下のとおりにする。 > v <- scan("data.txt", what = character(), sep = "\n", blank.lines.skip = F) scan関数の戻り値はベクトル。上記のようにすると、いわゆるコメント行(「#」で始まる文字列)、改行だけの行、空白だけの行も読み込む。また、各行の先頭や最後に1つ以上の空白が含まれていてもそのまま読み込んでくれる。 引数にwhatを上記のように指定することで文字列として読み込む。sepは行単位ということ。blank.line

    【R】テキストファイルを読み込む - Muni Bus
  • glmnetで正則化を試してみる - About connecting the dots.

    タイトルの通り,よく考えたら今までL1/L2正則化を知識としては知ってるけど,実際に試したことはなかったことに気がついたので試してみましたよという話.L1/L2正則化にの理屈については,TJOさんのエントリとか,unnounnoさんのエントリとかをみてもらえれば良いのではと思います.それより詳しいことが知りたければ,PRMLでも読めば良いのではないでしょうか(適当*1). まずはデータを眺める 使用したデータは,caretパッケージのcarsパッケージです*2.中古車販売のデータっぽくて,価格と,走行距離とか気筒とかドア数とかの車に関するカラムが並んでます.データを読み込んで,可視化して,とりあえず lm() してみます. > library(glmnet) > library(caret) > library(psych) > > # load data > data(cars) > t

    glmnetで正則化を試してみる - About connecting the dots.
  • Rを使って統計学をより快適なものに!!

    ■入門編 ☆初心者のためのRの超簡単な使い方 ☆データを用意する ― 外部データの読み込み・ベクトルと行列の操作を覚えましょう ☆自分で関数を作ってみる ― 簡単なプログラミングのルールを学びましょう ☆ExcelとRの間でデータのやり取りをするときに便利なテクニック ☆データフレームの作成と編集 ■推定・検定・多変量解析 Rについて データの標準化 カイ二乗検定 t検定 分散分析 相関係数 回帰分析 判別分析 正準相関分析 主成分分析 因子分析 クラスター分析 非階層的クラスター分析 数量化�T類 母分散の区間推定 ロジスティック回帰分析 ロジスティック回帰分析(説明変数が2個以上) 多項式モデルの回帰分析 対数線形モデルの回帰分析 2の回帰直線の比較(傾きの検定) ■グラフィックス関連 正規分布のグラフ カイ二乗分布のグラフ F分布のグラフ t分布のグラフ いろいろな棒グラフ 5 e

  • 便利。クリップボードからRへ読み込み - ryamadaのコンピュータ・数学メモ

    友人にこれを教えてもらった タブ区切りのNxM数値行列をクリップボードにコピーし(エクセルからのコピー。テキストエディタでも)、R上で関数に列数指定して、リターンするだけ。 こちら どうなっているか(Windowsの場合) 行列への読み込み matrix(scan("clipboard", quiet=TRUE), byrow=TRUE, ncol=nc) "clipboard"とある。 ふつう、ここには"file名(ファイルへのパス)"が書かれるわけであるが、"clipboard"というのは、「コンピュータがクリップボードというところにため込んでいるデータだよ」ということ quietというのはなぜ必要かは次を見ればわかる > scan("clipboard") Read 10 items [1] 350 750 100 100 150 80 400 0 0 0 > scan("clipb

    便利。クリップボードからRへ読み込み - ryamadaのコンピュータ・数学メモ
    gokichan
    gokichan 2013/04/29
  • Excel上でRを動かすRExcel - もうカツ丼でいいよな

    最近Office Professionalを買ったので,近頃はもっぱらOfficeで遊んでいる.Officeはちょっとバグとか多くて難しいから,よく勉強をして早く初心者を脱出したい. で,ここ2〜3日はExcelからRを呼ぶ方法をいろいろ調べていた.やっぱVBAちょっとくらい勉強しないと駄目かなとか思い始めた頃,RExcelというExcelのアドインを見つけた(statconn).これを使うと結構実用的なレベルでExcelとRを連携させられそう*1. RExcelのインストール まず,rscproxyとrcomの2つのパッケージをRから入れておく.下の二行はRExcelのインストール時にやれっていわれたからやった*2. install.packages("rscproxy") install.packages("rcom") library(rcom) comRegisterRegistr

    Excel上でRを動かすRExcel - もうカツ丼でいいよな
    gokichan
    gokichan 2013/04/18
  • R上でMySQLを使う RODBCパッケージの利用2

    R上でOracleを使う RODBCパッケージの利用 https://shiriuskunpsychostat.seesaa.net/article/201010article_10.html の続き: 今度はR上でMySQLを扱う方法を記録しておきます(←自分用に ^_^; )。 ■MySQLのインストール MySQLの日語webサイト(http://www-jp.mysql.com/)よりダウンロードできます。ダウンロードすべきものは2つあります。 ・MySQL Community Server (http://www-jp.mysql.com/downloads/mysql/) ・MySQL Connecter ODBC (http://www-jp.mysql.com/downloads/connector/odbc/) Windows環境ならばInstallerをダウンロードす

    R上でMySQLを使う RODBCパッケージの利用2
  • Comments on "Connecting R to MySQL through ODBC " : 世に潜む日々 (Tokyoに棲む)

    2009年07月30日16:42 カテゴリComputing Comments on "Connecting R to MySQL through ODBC " Connecting R to MySQL through ODBC つまり、RとMySQLの接続が目標であり、その方法としてODBCを通してMySQLに接続し、RではRODBCパッケージ内の関数を利用する。 手順は、ここ参考。 ODBCドライバのインストールはここ。 ODBCドライバをインストールした後、ODBCの設定を開始する。 コントロールパネル>管理ツール>データソース(ODBC)と進む。 ユーザーDSN又はシステムDSNタブのもと、追加ボタンをクリック。 "MySQL ODBC 3.51 Driver"を選択し、完了ボタン。 loginタブのもと、Data Source Name, Server, User, Passw

    Comments on "Connecting R to MySQL through ODBC " : 世に潜む日々 (Tokyoに棲む)
  • 三次元散布図をRで描くのに画期的な新機能がRGLパッケージに加わった - ほくそ笑む

    以前、三次元散布図をRで描いてみたという記事で紹介したRGLパッケージに画期的な新機能が加わったので紹介します。 (情報源:R: Interactive 3D WebGL plot of time-space cube with RGL | geolabs) RGLパッケージの良いところは、3次元プロットをマウスドラッグでグリグリ動かせるところなのですが、いざ、ファイル出力しようとすると、静止画か動画でしか保存できず、インタラクティブな3次元プロットをそのままファイルに保存することができないというのが欠点でした。 しかし今回、新機能として、WebGL で動く HTML ファイルとして保存できる機能が付加されたようです。 さっそく試してみましょう。 install.packages("rgl") library("rgl") data(trees) plot3d(trees) writeWe

    三次元散布図をRで描くのに画期的な新機能がRGLパッケージに加わった - ほくそ笑む