タグ

Rに関するInoHiroのブックマーク (32)

  • ggplot2: きれいなグラフを簡単に合理的に

    “The Grammer of Graphics” という体系に基づいて設計されたパッケージ。 単にいろんなグラフを「描ける」だけじゃなく「一貫性のある文法で合理的に描ける」。 Rのグラフ描画システムにはgraphicsとgridの2つが存在しており、 R標準のboxplot()やhist()などは前者の上に、 項で扱うggplot2は後者の上に成り立っている。 使い方が全く異なるので、前者を知らずにいきなりggplot2から始めても大丈夫。 tidyverse に含まれているので、 install.packages("tidyverse") で一括インストール、 library(tidyverse) で一括ロード。 初学者向け講義資料2023 https://ggplot2.tidyverse.org https://r-graphics.org/ https://r4ds.hadle

    ggplot2: きれいなグラフを簡単に合理的に
    InoHiro
    InoHiro 2017/09/30
  • データ系列が多すぎるとき、いい感じに一部をハイライトするためのパッケージgghighlightをつくりました - Technically, technophobic.

    ggplot2で可視化しようとして、データ系列が多すぎてこんなもじゃもじゃになってしまう、みたいなことないでしょうか。 これを、一部だけを色付けしてこんな感じのプロットにしてくれるパッケージをつくりました。 インストール GitHub上からインストールできます。 devtools::install_github("yutannihilation/gghighlight") gghiglightがやっていること gghiglightの説明をする前に、まずは上のグラフが何をしているのか、まずはふつうのtidyverseでやってみます。 データはこんな感じのやつです。 library(dplyr, warn.conflicts = FALSE) set.seed(1) d <- tibble( idx = 1:10000, value = runif(idx, -1, 1), type = sa

    データ系列が多すぎるとき、いい感じに一部をハイライトするためのパッケージgghighlightをつくりました - Technically, technophobic.
  • Getting started with PostgreSQL in R | R-bloggers

  • Mac OSXでR言語(+RStudio)をhomebrewでインストール

    以下のコマンドで、R言語とRのIDEであるRStudioをインストールできます。 (brew-caskは ~/Application/ にアプリをインストールされます) 昔はrがそのままhomebrewに合ったようですが、Homebrew-scienceに移動してるようなので、 最初にそれを利用できるようにして、R言語はXQuartzに依存してるので別途インストールしています。 他の環境やMacports等を利用した方法は以下を参照するといいです。 R のインストール – RjpWiki Alfred 追記: brew cask alfred でちゃんとリンクを貼れるようになってます。 AlfredでRStudioが出てこないのはシンボリックリンクだからなようです。 以下のように方法でAlfredにも出せると思います。 Symbolic link to App not recognized

    Mac OSXでR言語(+RStudio)をhomebrewでインストール
    InoHiro
    InoHiro 2016/04/24
  • Rと時系列(1)

    時間とともに変動する現象に対して時間の順序で測定・観測した結果の記録を時系列データと言い、略して時系列(time series)と言う。時系列データは多くの分野で様々な目的で取り扱われる。日常の社会生活の中でよく見受けられるものには、心電図や脳波のような医療データ、気温や気圧のような気象データ、株価および為替レートのような金融・経済データなどがある。 時系列データは、常に変動を伴うものである。その振る舞いを統計的に分析し、データ変動の特徴を捉え、現象の解明と将来の変動を予測・制御しようとするのが時系列データ分析の主要な目的である。 ちなみに、2003年ノーベル経済学賞の受賞の対象となった内容は、経済時系列分析に関するものである。

  • 競馬の予測をガチでやってみた - stockedge.jpの技術メモ

    的に競馬なんてやるべきではないと私は思っている。胴元の取り分が多いからだ。宝くじに比べればまだましだが、それでも賭け金の20~30%は胴元に取られることになる。*1 しかし今回は、ちょっと思い立って競馬の予測をやってみることにした。 理由は馬券の安さだ。私は現在、資金量が少ない人間でも不利にならない投資先を探しているのだが、馬券の一枚100円という安さは魅力的に映る。株の場合にはどんな安い株であれ最低購入額は数万円以上*2なので、ある程度まとまった資金が必要になる。 また、競馬には技術介入の余地(努力次第で勝利できる可能性)がある。 例えばこんな例がある。 160億円ボロ儲け!英投資会社が日の競馬で荒稼ぎした驚きの手法 - NAVER まとめ 彼らは統計解析によって競馬で勝っており、その所得を隠していたらしい。こういうニュースが出るということは、解析者の腕次第では競馬で勝てる可能性が

    競馬の予測をガチでやってみた - stockedge.jpの技術メモ
  • R - 分散 - まさるな日記

    「入門はじめての多変量解析」の内容をもとに多変量解析をRでお勉強していこかと Section 1.8 次のデータを使って、平均、分散、標準偏差を求めてみる No. 身長 体重 1 151 48 2 164 53 3 146 45 4 158 61 Rで記述してみると... 身長 <- c(151, 164, 146, 158) 体重 <- c(48, 53, 45, 61) data <- data.frame(身長, 体重) result <- matrix(0, 2, 3) rownames(result) <- c("身長", "体重") colnames(result) <- c("平均", "分散", "標準偏差") result[,1] <- mean(data) # 平均 result[,2] <- diag(var(data)) # 分散 result[,3] <- sd(

    R - 分散 - まさるな日記
    InoHiro
    InoHiro 2015/07/22
  • Rグラフィックスクックブック

    いまや統計解析の標準ツールとなったオープンソースソフトウェアRの強力なグラフィックスパッケージであるggplot2を使ってグラフを作成するためのレシピ集です。棒グラフや折れ線グラフ、散布図といった基的なグラフから箱ひげ図、バイオリンプロット、ドットプロット、地図といったさまざまなグラフィックスの作成方法だけでなく、こうしたグラフのきめ細かいカスタマイズ方法、効果的な表示方法、色の使い方、さらには文書用データへの変換方法まで、およそグラフに関することはほとんど網羅しています。実際の「やりたいこと」に応じた解決法を提示。描きたいグラフがすぐに描ける、実用的な一冊です。 目次 訳者まえがき はじめに 1章 Rの基 レシピ 1.1 パッケージをインストールする レシピ 1.2 パッケージを読み込む レシピ 1.3 区切られたテキストデータファイルを読み込む レシピ 1.4 Excelファイルか

    Rグラフィックスクックブック
  • A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ

    こんにちは、買物情報事業部でサーバサイドの開発を担当している荒引 (@a_bicky) です。 今回のエントリでは R で A/B テストの結果検証を行う方法の一例について紹介します。 エンジニアでも自分の関わった施策の効果検証のために簡単な分析をすることがあるかと思いますが、そんな時にこのエントリが役立てば幸いです。 なお、次のような方は対象外です。 A/B テストや KPI の設計に興味のある方 この辺には全く触れません プログラミング初心者 わからない単語が大量に出てくるでしょう R で統計学や機械学習の手法をバリバリ使いたい方 世の中の “分析” の多くは集計処理がメインです Python, Julia など既に分析する上で使い慣れた言語・ツールがある方 今回のエントリ程度の内容であればわざわざ乗り換える必要もないでしょう OS は Mac を前提として説明するので、Windows

    A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ
    InoHiro
    InoHiro 2015/05/08
    すごいエントリだ。Tips / "ただ、筑波大学は休日に停電を行うことがあるので、その際は別のリポジトリを指定しないとパッケージをインストールできません"
  • RでJSONを読む

    はじめに ここではRの jsonlite というパッケージを使う(この中で curl というパッケージも呼び出される)。次のようにしてインストールしておく。 install.packages("jsonlite") install.packages("curl") 例:放射線モニタリング 例として,原子力規制委員会の東日大震災関連情報 放射線モニタリング測定結果等をとりあげる。 まずは http://radioactivity.nsr.go.jp/data/ja/master/prefectures.json にアクセスしてみる。三重県は http://radioactivity.nsr.go.jp/data/ja/master/prefecture_24.json であることがわかる。同様にして,http://radioactivity.nsr.go.jp/data/ja/master

    InoHiro
    InoHiro 2015/04/16
  • GitHub - twitter/AnomalyDetection: Anomaly Detection with R

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - twitter/AnomalyDetection: Anomaly Detection with R
  • RでGPU使ってみた

    自分の顔でやる気アップ? 〜 アイデンティティへの意識集中がモチベーションに及ぼす影響を探る RCTsKeisukeHattori1

    RでGPU使ってみた
  • HP Distributed R

    Gain actionable foresight from billions of observations and avoid downsampling Use out-of-the-box, standard R parallel algorithms with near-linear scalability Turbo charge data access performance by 5x and ingest and prepare data in seconds Enable a broader community of developers and DBAs to put predictive analytics into action with support for all BI and data visualization tools Access this new,

    HP Distributed R
  • ビジネス統計解析

    ビジネス統計解析 講義概要: 授業シラバス(pdfファイル) 【講義資料(データ)】 4月26日演習問題の解答(pdfフリーソフト「R」の導入手順の説明ファイル フリーソフト「R」の基操作の説明ファイル 1章のファイル 1章の演解答ファイル 2章のファイル 3章のファイル 3章の演解答ファイル 4章のファイル 4章のqccファイル 5章のファイル 5章の演解答ファイル 6章のファイル 6章の演解答ファイル 7章のファイル 7章の演解答ファイル 8章のファイル 8章の演解答ファイル 【ビジネスデータ解析講義資料】 目次のファイル 2章のファイル 3章のファイル 4章のファイル 5章のファイル txtファイル 【多変量解析法の関連情報】 行列の固有値固有ベクトルを求めるプログラム  【統計解析ソフト「R」のソース&関連情報】 RjpWiki (「R」情報交換Wikiサイト) R-2.2.

  • Google's R Style Guide

    R is a high-level programming language used primarily for statistical computing and graphics. The goal of the R Programming Style Guide is to make our R code easier to read, share, and verify. The rules below were designed in collaboration with the entire R user community at Google. Summary: R Style Rules File Names: end in .R Identifiers: variable.name (or variableName), FunctionName, kConstantNa

  • Shiny

    Here is a Shiny app Shiny apps are easy to write. Let users interact with your data and your analysis, all with R or Python: R Python library(shiny) library(bslib) library(dplyr) library(ggplot2) library(ggExtra) penguins_csv <- "https://raw.githubusercontent.com/jcheng5/simplepenguins.R/main/penguins.csv" df <- readr::read_csv(penguins_csv) # Find subset of columns that are suitable for scatter p

    Shiny
    InoHiro
    InoHiro 2013/09/15
  • Rから利用するオープンデータAPI

    Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発KnowledgeGraph

    Rから利用するオープンデータAPI
  • Rで計量時系列分析:はじめに覚えておきたいこと - 渋谷駅前で働くデータサイエンティストのブログ

    機械学習は全然専門ではない僕が知ったかぶりをするのも何なので*1、もっともっと以前からそこそこやっている*2計量時系列分析の話でもしてお茶を濁してみることにします(笑)。 もうしつこ過ぎて自分でも嫌になってきたんですが(笑)、このシリーズでベースにするテキストは以下の2冊。沖テキストとHamiltonテキストです*3。他にも良いテキストはあるんじゃないかと思いますが、ここではこの2冊をベースにしていきます。なお、ほとんど沖テキストからの抜粋なのでお持ちの方はそちらを読んでもらった方が圧倒的に早いです、悪しからず。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者: 沖竜義出版社/メーカー: 朝倉書店発売日: 2010/02/01メディア: 単行購入: 4人 クリック: 101回この商品を含むブログ (6件) を見る Time Series Analysis 作者

    Rで計量時系列分析:はじめに覚えておきたいこと - 渋谷駅前で働くデータサイエンティストのブログ
  • ゼロから始めるR言語勉強会: 第3回関西ゼロからはじめるR言語勉強会開催しました

    InoHiro
    InoHiro 2013/05/17
  • RとRubyによるデータ解析入門

    人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータ解析の基の理解を促します。基が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日語版ではさまざまな統計分析手法についての入門となる章を追加。こので使っている統計の基礎も学べる構成になっています。プログラマ視点で書かれた書は、ビッグデータを活用するためのスキルを身に付ける必要に迫られた多くの開発者にとっても貴重な情報源となるでしょう。 関連ファイル サンプルコード 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すで

    RとRubyによるデータ解析入門
    InoHiro
    InoHiro 2013/05/13
    超欲しい