タグ

Rに関するgrattのブックマーク (35)

  • 卒業論文のためのR入門

    Chapter 1 はじめに この文書は、卒業論文を書くためのRの使い方をできるだけコンパクトにまとめたものです。 読者は立命館大学総合心理学部森ゼミの学生をピンポイントに想定しています。 Rを用いた演習として「心理学データ解析法」の履修を推奨していますが、履修していなくてもわかるように構成しています。 卒業論文自体はWordで作成する想定で、Rで得られた結果をWordに貼り付ける(簡便な)方法を説明します。 一般的なRの入門文書としても参照できます。 説明の都合上、厳密さよりわかりやすさを重視した記述が多々あります。ご了承ください。 1.1 この文書で学ぶこと 具体的には、以下の項目を学習します。 R, RStudioをインストールし、基的な操作ができるようになる データをRStudioにインポートする インポートしたデータを分析可能な形に前処理する 記述統計を整理する データを可視化

    gratt
    gratt 2020/11/20
  • Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita

    library(data.table) data.tableは簡単に言うとサイズの大きいデータフレーム。 確かに高速。慣れると大規模データはこれなくして扱えない。 データフレームと扱い方が大きく異なるが、これだけ抑えておけば十分ということをまとめた。 data.tableには行名がない dplyrとセットで使うことが多いので、同時に呼び出しておくといい ただしtidyr(集計用ライブラリ)までは使わなくていい

    Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita
    gratt
    gratt 2017/01/16
  • 【R】ふつうのスクリプト言語プログラマーのためのR言語入門 - 歩いたら休め

    「他のスクリプト言語ならそれなりに触れるけど、Rって変な機能が多いから難しい」と感じている人のために、Rの独特な点、ハマりどころ、そして特にデータの集計での強力な機能やパッケージをまとめてみました。 社内のデータリソース移行の作業の中で、前任者が(良い意味でも悪い意味でも)すごいRプログラマーだったのと、DBからのデータの取得からデータの整形・確認が一気に行えるという理由で久しぶりにRを触りました。 (先輩!僕が「%>%ってなんですか?」みたいな質問すると、チャットでgithubのリンクを貼られたり、AdvancedRを薦められたりするの、めっちゃ困りました!) 数年前Rを使っていたときは、 Rのプログラムってよくわからないなあ…、後から自分のコード見ても意味が読み取れないよ… Pythonでpandasとかmatplotlibってパッケージを使えばRっぽいことができるの?じゃあそっち使お

    【R】ふつうのスクリプト言語プログラマーのためのR言語入門 - 歩いたら休め
    gratt
    gratt 2016/05/23
  • 「Rの脆弱性と普及度について」 - Inleiding tot de R-statistiek

    先日,某県の農業試験場から「R」を “公的” に導入する際の問題点について問い合わせがあった.試験場のコンピューターに R をインストールしようとしたら,システム管理者からの以下の質問があったそうだ: Rのソフトウェアとしての「脆弱性」に問題はないか? 統計言語としてのRの「普及度」を示す証拠はないか? この二つの質問については,他の公的機関でも R インストールに際して同様の状況が起こりえると考えて,下記の回答を用意した: 【Rの脆弱性について】 フリー・ソフトウェアのRは国際的な開発チーム(The R Project for Statistical Computing)によってしっかりサポートされ,頻繁にバージョンアップされている.そのホームページ(CRAN: The Comprehensive R Archive Network)を通じて最新バージョンをいつでも入手することができる.

    「Rの脆弱性と普及度について」 - Inleiding tot de R-statistiek
    gratt
    gratt 2015/11/24
  • Rでデータ読み込みから前処理までのTips - Qiita

    Rでテキストファイルの読み込みからデータ加工の流れ(前処理)で覚えておくとかなり便利、あるいはよくハマるポイントを中心に。 細かい知識が多いのだがまとまったものがなかったのでまとめてみた。 ありがちなハマりを回避して作業効率を上げるために。 データの読み込み データファイルの読み込み プロジェクトごとにワーキングディレクトリをセットするといい CSVファイルの読み込み read.csv()はヘッダありが前提。 文字コード fileEncoding="文字コード名"で指定できる。Windowsで作ったCSVを読み込む際、BOMが付いていることがあるのでfileEncoding="UTF-8-BOM"とする 文字列の扱い 文字列が自動的にfactor型になるので、不都合な場合はstringsAsFactors=Fを指定する 欠損値の扱い 欠損値が空欄であったり、データベースからエクスポートした

    Rでデータ読み込みから前処理までのTips - Qiita
    gratt
    gratt 2015/09/10
  • SparkRをEC2上で動かして分散処理してみる

    こんにちは!美味しいコーヒーを飲むために、毎朝早くにデスクコーヒーミル回してます、アナリティクスチームの高柳です。 アナリティクスチームでは、じゃらんnetやホットペッパービューティーをはじめとしたリクルートライフスタイルのサービスに対して、基礎集計やレポーティング、また、データマイニング(データ分析)を活用し、高速にサービスを改善していくというミッションを担っています。 記事では、データ分析環境としてのApache Spark、特にver 1.4から利用可能になったSparkRを、当チームのAWS上の分析環境に導入検討していたので、その辺について書きたいと思います。 SparkRは、まだリリースから日が浅いことから、日語の記事が相当に少ないので、この記事がみなさんの"Happy SparkR ライフ"のお役に立つことを願っております。 Apache Spark導入の背景 サービスを

    SparkRをEC2上で動かして分散処理してみる
    gratt
    gratt 2015/08/22
  • Rでウェブ解析:Google Analyticsからデータを取得「RGA」パッケージの紹介

    Google Analyticsからデータを取得する「RGA」パッケージの新しいバージョンが登場したので、記事の内容を更新です。Google Analyticsからデータを取得するパッケージはいろいろありますが、使用方法が簡単な「RGA」パッケージはウェブ解析に必須だと思います。 RGAパッケージはデータを取得するコマンドだけでなく、DimensionとMetricsの一覧を取得するコマンドやShinyでインタラクティブ確認するコマンドも収録されています。 DimensionとMetricsの一覧をcsvに保存するコマンドを紹介します。ぜひ、活用ください。リアルタイムのアクセス状況を取得する「get_realtime」コマンドはかなり使い道があると思います。 RからSearch Consoleを操作できる「searchConsoleR」パッケージがあります。ぜひ、合わせて利用してください。

    Rでウェブ解析:Google Analyticsからデータを取得「RGA」パッケージの紹介
  • GitHub - gghatano/analyze_mlbdata_with_R: analyze MLB data with R

    gratt
    gratt 2015/07/14
  • 線形モデルによる文京区の賃貸物件価格の解釈(「最高の借家」は統計解析で見つかるか?)

    2. Copyright (C) Takimoto Seminar. All Rights Reserved.3/29/15 自己紹介 @windfall_j 某大学の学部4年生 みどりぼん読み中 統計見習い 今回Tokyo.R初参加です 発表内容に誤解などあれば指摘お願いします 上京 ➜ 東京の地理知識ゼロ 3月まで文京区に4年ほど住んでいた 2

    線形モデルによる文京区の賃貸物件価格の解釈(「最高の借家」は統計解析で見つかるか?)
    gratt
    gratt 2015/06/11
  • A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ

    こんにちは、買物情報事業部でサーバサイドの開発を担当している荒引 (@a_bicky) です。 今回のエントリでは R で A/B テストの結果検証を行う方法の一例について紹介します。 エンジニアでも自分の関わった施策の効果検証のために簡単な分析をすることがあるかと思いますが、そんな時にこのエントリが役立てば幸いです。 なお、次のような方は対象外です。 A/B テストや KPI の設計に興味のある方 この辺には全く触れません プログラミング初心者 わからない単語が大量に出てくるでしょう R で統計学や機械学習の手法をバリバリ使いたい方 世の中の “分析” の多くは集計処理がメインです Python, Julia など既に分析する上で使い慣れた言語・ツールがある方 今回のエントリ程度の内容であればわざわざ乗り換える必要もないでしょう OS は Mac を前提として説明するので、Windows

    A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ
    gratt
    gratt 2015/05/10
  • ABテストのための有意性検定 - Qiita

    こんにちは、awakiaです。今回のアドベントカレンダー、結構、機械学習ガチなメンツが揃ったみたいなので、俺も対抗してやる!!とも思ったのですが、研究を離れて2年が経とうとしているので、真っ向勝負とか今更無理なことに気づきました...w なので、開発者の皆も知っておくと便利なデータサイエンスの話をすることにします。 ABテストと検定の必要性 Webサービスを運営していると、見た目の問題だけでも結構悩みます。ボタンの色や文言などの小さなところから、トップページに盛り込む内容をどうするかまで、いろいろです。 今回、「ABテスト」と呼ぶものは、画面に占める大きさ等にかかわらず、パターンAとパターンBを作って、そのどちらがいいかを判断するための実験と定義することにします。 なお、ABテストの呼び名には結構流派があるので別の名前で聞いたことがあるかもしれません。例えば、Googleのマット・カッツ先

    ABテストのための有意性検定 - Qiita
    gratt
    gratt 2015/01/16
  • 二項検定でポケモントレーナーの強さを検定する - Qiita

    二項検定をする A 君と B 君がポケモンで対決をしました。 20 回ほど遊んだ結果として A 君が 17 回勝利し、 B 君が 3 回勝利をしました。 感覚的に A 君のほうが明らかにポケモントレーナーとして強そうですが、果たして統計学的にも同じことが言えるでしょうか。今回は統計解析用の言語である R を利用してこれを仮説検定します。 統計解析用言語 R R は自由なソフトウェアで、無料で使える統計解析用言語です。統計の分野では有償のソフトウェアも MATLAB など有名なものがたくさんありますが、いずれもなかなかに高価です。 その点 R は無料で使えますのでなかなか予算の確保できない貧乏な研究者にもやさしいですし、それでいて柔軟で強力な機能を備えていますから、この言語を習得して損することは無いと言っても差し支えないほどです。 さて一連の記事では Python を主に使ってきましたが、純

    二項検定でポケモントレーナーの強さを検定する - Qiita
    gratt
    gratt 2015/01/16
  • Google's R Style Guide

    R is a high-level programming language used primarily for statistical computing and graphics. The goal of the R Programming Style Guide is to make our R code easier to read, share, and verify. The rules below were designed in collaboration with the entire R user community at Google. Summary: R Style Rules File Names: end in .R Identifiers: variable.name (or variableName), FunctionName, kConstantNa

    gratt
    gratt 2014/12/07
  • R から MongoDB に格納されたデータを扱う - Qiita

    R では他の言語を用いて mongo に格納されたデータを扱うケースが多いと思われるが, 今回は mongo からデータを取得して, R のデータ構造に変換し, プロットを行うところまでを行う. 今回使うパッケージは rmongodb にした. RMongo というライブラリもある. インストール

    R から MongoDB に格納されたデータを扱う - Qiita
  • rmongodb: MongoDBをR言語で操作する事例

  • 「統計解析ソフトRのスクリプト集」公開のお知らせ - 心理発達科学専攻からのお知らせ

    石井准教授の作成した「統計解析ソフトRのスクリプト集」をオンラインで公開します。名古屋大学教育学部の「心理・教育の統計学」の授業で実際に使用されている教材です。学習・研究にご活用下さい。 2016.4.5 Ver. 4.0βを公開しました。棒グラフオプション、オメガ係数、効果量、標サイズの推定などの記述が加わりました。 2015.3.18 Ver. 3.0βを公開しました。記述統計量の算出の部分を統一的にしたのと、データ例を書籍にあわせて変えています。 2014.11.4 Ver. 2.2βを公開しました。 統計解析ソフトRのスクリプト集 (PDF) 下記のサイトでは、シラバスと講義資料が公開されています。あわせてご活用下さい。 「心理・教育の統計学」(名大の授業) 講義資料 (PDF) ーーー はじめに 石井秀宗 この冊子は,心理学や教育学の研究でよく用いられる統計手法に関して,統計解

    「統計解析ソフトRのスクリプト集」公開のお知らせ - 心理発達科学専攻からのお知らせ
    gratt
    gratt 2014/11/10
  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

    gratt
    gratt 2014/09/12
  • 第42回Tokyo.Rを開催しました。 - yokkunsの日記

    第42回Tokyo.Rを開催しました! https://atnd.org/events/54680 今回は、いつもと違って、Y!Jのでの開催で、 株式会社Qubital(キュービタル)データサイエンスさんの社員の方々がスタッフをやってくださいました。 ありがとうございます!! 前半セッション R入門(dplyrでデータ加工):@gepuro R入門(dplyrでデータ加工)-TokyoR42 from Atsushi Hayakawa ggplot2によるデータ可視化:@yokkuns Tokyor42 ggplot2 from Yohei Sato Rコードと実行結果:http://rpubs.com/yokkuns/27108 データ分析するときの4つの視点:@yokkuns Tokyor42_r_datamining_18 from Yohei Sato Rコードと実行結果:http

    第42回Tokyo.Rを開催しました。 - yokkunsの日記
    gratt
    gratt 2014/08/31
    可視化がよい
  • Rとブートストラップ

    統計学の主な目的の1つは、標データを用いて母集団の性質を推測することである。同じ母集団から抽出した標であっても、無作為であるため標を構成する要素、標のサイズが異なると、それらの統計量(比率、平均、分散など)は異なる。従って、標データを用いて母集団の性質を推測する際には常に誤差が伴う。 正規分布N(μ,σ2)の母集団から抽出した大きさnの無作為標の平均はN(μ,σ2/n)に従うことが知られている。σは一定の条件のもとでは標の不偏標準偏差を用いることも可能である。このように正規分布、t分布、x2分布などの確率分布を用いて母数やモデルの推定およびその推定の誤差を計算することができる。しかし、問題によっては確率分布を仮定できないケースも少なくない。そこで、1970年代にエフロン(Efron)は確率分布の性質に頼らないブートストラップ(bootstrap)という方法を提唱した。ブート

    gratt
    gratt 2014/08/18
  • Python と R で連携する - Qiita

    R と Python の連携を考える 最近 R による基的なデータプロッティングやファイル入出力の方法について説明しました。 データ分析の言語としては Python ですべてをやろうという傾向があるようですが、やはり過去の膨大な R による資産は魅力的でそう簡単に切り捨てられるものではありません。 よくあるケースとしては、部分的なデータ解析については R を流用したいが、全体的なプログラミングは Python で書きたいというシーンでしょう。また、プロッティングだけ R でおこないたいという場合もあるでしょう。こんなとき Python と R で連携できれば問題が一気に解決して便利です。 Python から R を利用するライブラリ PypeR かつては RPy2 というライブラリが使われていたようですが、最近使われており主流なのは PypeR です。 PypeR のインストール インス

    Python と R で連携する - Qiita
    gratt
    gratt 2014/07/12