本文「ggplot2」を検索 - はてなブックマーク

1 - 40 件 / 125件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ggplot2の検索結果1 - 40 件 / 125件

会社員辞めて入学した大学院修士課程がそろそろ終わろうとしているのでまとめておく - seri::diary
- 285 users
- serihiro.hatenablog.com
- テクノロジー
- 2019/12/07
これは何か筆者についてなぜ大学院に入ったのか日本の大学院という場所について大学院での研究内容について自分の発表実績大学院生活についておわりにこれは何か 2018年3月に仕事を辞めて，2018年4月に筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻博士前期課程（修士課程）に入学した．それから早くも２年弱が経ち，もうすぐ修了なので大学院生活を忘れないうちにまとめておくだけのエントリである．修了自体は2020年3月だが，あとは修論を仕上げて提出すれば終了なので研究自体はもう実質終わっている状態である*1．筆者について 2009年3月に岩手大学農学部を卒業．新卒で上流系SIerに就職して2年半ぐらい勤務した後に，コード書きたくてwebアプリエンジニアに転向．その後，6年半ぐらいweb受託，webサービス運営企業などでソフトウェアエンジニアとして勤務．2018年3月
- 大学院
- あとで読む
- 学習
- study
- 会社
- 勉強
- 研究
- 教育
- 仕事
Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary
- 266 users
- ill-identified.hatenablog.com
- テクノロジー
- 2021/08/07
概要 pysocviz が提供する機能 ggplot2 と同じようにできないところとその対策 aes() にクオートされてない変数を指定できない R のように改行できない ggplot2 で使えた色名が使えない ggplot2 で使えた linetype が使えない文字化けの回避 ggrepel パッケージの利用 scales::percent などの単位・スケール指定テーマや色パレットのプリセットを変更したい場合 subtitle/caption が表示されない複数のグラフを連結できない hjust/vjust が使えないグラフ内の図形やテキストの大きさのバランスがおかしい geom_smooth/stat_smooth で一般化加法モデル (GAM) による平滑化ができない geom_quantile の method 指定ができない geom_smooth/stat_smoo
おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diary
- 193 users
- ill-identified.hatenablog.com
- テクノロジー
- 2020/10/03
2021/9/10 追記: 改めて更新された話を統合して整理して書き直しました. 以降はこちらを参考にしてください: ill-identified.hatenablog.com 2021/1/15 追記: RStudio 1.4 がリリースされたのでなるべくアップデートしましょう 2020/12/06 追記: Japan.R で今回の話の要約+新情報を『Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck』として発表した. ハイライトは「近々出るRStudio 1.4 があれば fontregisterer はほぼいらなくなる」 2020/10/31 追記: geom
- R
- あとで読む
- ggplot2
- グラフ
- ggplot
- 統計
- フォント
- 文字コード
- 日本語
- 統計学
VSCode + Dockerでよりミニマルでポータブルな研究環境を
- 173 users
- zenn.dev/nicetak
- テクノロジー
- 2023/07/28
はじめにもっとミニマルで簡単なポータブルな環境を! 自分自身の研究のための環境構築についてこれまで二本の記事を書いてきました. これらの記事から二年ほどたち, いくつかの点において不満点が出てきました. 特に, GCPや自宅のサーバー上でリモートで作業することが多くなってきたので, よりミニマルでポータブルな環境が必要になりました. 以下では, 現時点で最小限の努力で環境を再現ができることを目標にしたDockerベースのGitHubレポジトリのテンプレートとその使い方を紹介します. このテンプレートを用いて作られた環境は, 新たなコンピュータ上で最短4ステップで環境を再現できるようになります. git clone VSCodeの"Open in Remote Containers" renv::restore() dvc pull この環境とセットアップはこのレポジトリにテンプレートとし
- docker
- vscode
- あとで読む
- visualStudioCode
- 環境
- Python
- プログラミング
- programming
- 研究
- 開発
Practical Data Science with R and Python: 実践的データサイエンス
- 107 users
- uribo.github.io
- テクノロジー
- 2019/07/16
実践的データサイエンスはじめにデータ分析のためにコンピュータを利用する際、RおよびPython言語のいずれかを使うことが多いと思います(Julia言語は高レベル・高パフォーマンスな技術計算のための言語で今後期待が膨らみます）。これらの2つの言語では、データ操作や可視化、データ分析、モデリングに使われるライブラリが豊富にあり、どれを使うのが良いのか迷うような状況が続いていました。しかしその状態は落ち着きを見せ、成熟期を迎えつつあります。 R言語ではパイプ演算子の登場によりデータフレームに対する操作に大きな変化が生じ、tidyverseによるデータ読み込みからデータ整形、可視化までが可能になりました。またtidyverseのような、機械や人間の双方が扱いやすいパッケージが増えてきました。特にR言語の強力な一面でもあったデータ分析の操作はtidymodelsに代表されるパッケージがユーザの
- R
- python
- あとで読む
- データ分析
- 分析
- 機械学習
- データ
- statistics
カルマンフィルターについて - Qiita
- 91 users
- qiita.com/s-yonekura
- テクノロジー
- 2021/07/16
はじめに千葉大学/Nospareの米倉です．今回はカルマンフィルターについて解説していきたいと思います．カルマンフィルターで何が出来るの？フィルターとあるように，カルマンフィルターが出来る基本的なことは線形ガウス状態空間モデルのフィルタリング密度を逐次的に求めることです．ここで２つのキーワード，「線形ガウス状態空間モデル」と「フィルタリング密度」という単語が出てきましたので，まずはそれらについて解説します．線形ガウス状態空間モデルとは状態空間モデルとは2つの確率過程からなります．1つは潜在変数・状態変数・隠れ変数といわれるもので，これは直接観測できないがマルコフ連鎖に従う変数だとモデリングされます．例えば景気の良し・悪し等，概念として存在するけれど直接は観測できないものを想像してください．2つめは観測値で，これは直接観測できるもの，つまりデータです．ただし変数に依存して観測される
『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング＋ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ
- 64 users
- tjo.hatenablog.com
- テクノロジー
- 2019/08/13
ここ2ヶ月ぐらいに渡って多くの方々からご著書をご恵贈たまわっているのですが、そのうちの一冊がこちら。かつて計量時系列分析を学んでいた頃に僕も大変お世話になった、Logics of Blueブログの馬場さんの手による『RとStanではじめるベイズ統計モデリングによるデータ分析入門』です。実践Data Scienceシリーズ RとStanではじめるベイズ統計モデリングによるデータ分析入門作者:馬場真哉出版社/メーカー: 講談社発売日: 2019/07/10メディア: 単行本以前はベイズ統計モデリングの入門書というと「みどりぼん」こと『データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)』一択でしたが、皆さんもご存知のように既にメンテされていないWinBUGSを使っているなどout-of-dateな要素が多く、近年はこれに替わる良書
Rを用いたデータ解析の基礎と応用2022
- 58 users
- comicalcommet.github.io
- テクノロジー
- 2022/07/14
Step 3：データを可視化しよう！データ可視化の重要性 ggplot2でデータを眺めよう geom_histogram ヒストグラム geom_density 密度分布 geom_point 散布図 aes(color) 色を表現する facet_wrap, facet_grid グラフを分ける geom_boxplot 箱ヒゲ theme_*** 全体の雰囲気を変える color（aesの外）線を特定の色にする fill（aesの外）特定の色で塗りつぶす color（aesの中）線を値に応じた色にする coord_cartesian 軸の範囲を変える labs タイトルや軸ラベルを書く／書き換える theme 文字の大きさなどを細かく設定 ggsave() 図をファイルとして保存その他のグラフの描き方を知りたい方は ggplot2公式サイト Jaehyun Songさんの解説
- R
- 統計
- rlang
- あとで読む
- 機械学習
- データ
2023年度早稲田大学「計量分析（政治）」補助教材
- 54 users
- www.asanoucla.com
- 学び
- 2022/08/09
最終更新日 RStudio と R Markdown R Markdown の使い方と文法 Sep. 21, 2022 R の「あるある」エラー Sep. 13, 2022 Rを使ったデータ操作 1. データ・ハンドリング（基礎） Sep. 13, 2022 2. データ・ハンドリング（応用） Nov. 17, 2023 3. データ・クリーニング Sep. 13, 2022 データの可視化 4. ggplot2（基礎） Sep. 26, 2022 5. ggplot2（棒グラフ） Oct. 20, 2022 ggplot2（ヒストグラム） Sep. 10, 2022 ggplot2（箱ひげ図） Oct. 20, 2022 ggplot2（散布図） Sep. 20, 2022 ggplot2（折れ線グラフ） Sep. 20, 2022 ggplot2（ロリポップ・チャー
- R
- あとで読む
- 統計
- blog
- *あとで読む
[書評]『データ分析のためのデータ可視化入門』と最近の R グラフィックスパッケージ事情 - ill-identified diary
- 48 users
- ill-identified.hatenablog.com
- 学び
- 2021/02/04
概要Healy (2018) “Data Visualization: A Practical Introduction” の邦訳『データ分析のためのデータ可視化入門』をもらったので, この本のレビューと本書ではあまり取り上げられていない, R グラフィックスをさらに活用するためのヒントを提示する. 2021/9/24 追記: 『Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary』に書いたように, Python でも matplotlib のような煩雑な構文に惑わされずにこの本で紹介されているような方法を実現するためのパッケージ/用例を作ってみた. 概要初めに本書の特徴どういう本なのかどういう人が読むとよいか邦訳に対する細かいツッコミどころ本書を読んだ人におすすめ
- R
- ggplot2
- あとで読む
- 書評
- programming
『効果検証入門』のすごいところベスト５ - Qiita
- 44 users
- qiita.com/Hiroyuki1993
- テクノロジー
- 2020/04/20
安井翔太著『効果検証入門』を読了しました。因果推論や統計の基礎を学ぶ上でとても良い本でしたが、同時に作者のRコードもかなり洗練されていてRの勉強にもなりました。そこで今回は書籍で紹介されているコードの中からとくにエレガントだと思った箇所を５か所ピックアップしました。コード全文はここにあります第５位：エラーバーのプロット ggplot2でエラーバーをプロットするのは地味に面倒だが、お手本のようなコードなので、このままコピペして使える using_voucher_results %>% ggplot(aes(y = estimate, x = model_index)) + geom_point() + geom_errorbar(aes(ymax = estimate + std.error*1.96, ymin = estimate - std.error*1.96, width =
- あとで読む
ロジスティック回帰の最尤推定量にはバイアスがある - ほくそ笑む
- 40 users
- hoxo-m.hatenablog.com
- テクノロジー
- 2024/01/23
ロジスティック回帰について調べている。ロジスティック回帰モデルのパラメータの最尤推定量は、不偏推定量ではなく、バイアスがある。例として、サンプルサイズ、入力変数の数のときを考える。パラメータ 300個の真の値を、最初の 100個は、次の 100個は、残りの 100個はに設定して推定してみよう。 n <- 1500 p <- 300 # データの生成 set.seed(314) x <- rnorm(n * p, mean = 0, sd = sqrt(1/n)) X <- matrix(x, nrow = n, ncol = p) beta <- matrix(c(rep(10, p/3), rep(-10, p/3), rep(0, p/3))) logistic <- function(t) 1 / (1 + exp(-t)) prob <- logistic(X %*
- ML
- 機械学習
- AI
- あとで読む
- モデル
- 統計
サイバーエージェントのデータマイニング本がデータサイエンティスト必読書だった件 - LABOT 機械学習ブログ
- 40 users
- blog.labot.jp
- テクノロジー
- 2019/08/28
堀田（@YoshiHotta）です。この記事はサイバーエージェントの秋葉原ラボの方が執筆された『データマイニングエンジニアの教科書』の書評です。企業でデータマイニングをする人に必要な知識を俯瞰できる、しっかりしたデータマイニングの本だと思いました。データマイニングの初心者にも中級者にもぜひオススメしたい一冊だったので書評を書くことにしました。また、データマイニングの独習に役に立つ書籍も多数紹介します。データマイニングエンジニアの教科書作者: 森下壮一郎,水上ひろき,高野雅典,數見拓朗,和田計也出版社/メーカー: シーアンドアール研究所発売日: 2019/06/27メディア: Kindle版この商品を含むブログを見るこの本は（特に Web 系の) データ分析の実務者に必要な事柄が網羅的に取り上げられています。300ページという厚さからすると扱っているテーマはとても幅広いです。一つ一
データ分割
- 32 users
- uribo.github.io
- テクノロジー
- 2019/06/30
class: center, middle, inverse, title-slide # データ分割 ## Part of 📖Data Preprocessing Cookbook 👨‍🍳 ### Uryu Shinya ### uribo u_ribo ### 2019-06-30 (updated: 2019-06-30) --- # 概要 - 予測モデルの性能を評価、過学習を防ぐためにデータ分割の処理が必要となる - データセットをモデル構築用と評価用のデータに分ける - データセットの大きさ、特性（クラスやグループが存在するか、時系列かどうか）に応じてリサンプリングの方法を変え
データ解析に役立つおすすめR本とサイトをまとめました。 - Open Box with STAT
- 31 users
- openbox-stat.net
- テクノロジー
- 2021/05/19
ぼくは医学統計学と疫学が専門です。これらのデータ解析には主にRを使います。かれこれ15年ほどRを使ってきました。当時、Rに関するまとまった情報は『The R Tips』しかありませんでした。時は流れ、今はたくさんR本やサイトがあります。しかし、たくさんありすぎて何を見れば良いのか迷いますよね？そこで、ぼくの経験に基づき、おすすめする有益なR本・サイトをまとめてみました！ RとRStudioの環境構築矢内先生の「RとRStudioのインストール方法の解説」サイト基礎（網羅的） Rではじめるデータサイエンス RユーザーのためのRStudio実践入門 The R Tips Rクックブック宋先生の「Rプログラミング入門の入門」サイトデータハンドリング特化宋先生の「dplyr入門 (dplyr 1.0.0対応)」Webページ宋先生の「tidyr入門」Webページ可視化特化 Rグラフ
- R
- 統計
- 本
- データ
- コンピュータ
- プログラミング
- programming
- あとで読む
- book
Rで機械学習モデルの解釈手法たちを試してみる - 渋谷駅前で働くデータサイエンティストのブログ
- 28 users
- tjo.hatenablog.com
- テクノロジー
- 2020/09/07
この記事の前段として、まず事前に昨年書いた機械学習モデルの解釈性についての記事をご覧ください。僕が知る限り、機械学習実践のデファクトスタンダードたるPython側ではLIMEやSHAPといった解釈手法については既に良く知られたOSS実装が出回っており、相応に実際に使ってみたというレポートも見かける状況です。一方、R側ではそこまでメインに機械学習を回す人が多くないせいか、あまりこれまで実践例を見かけないなぁと思っていました。そんなことを考えながら先日ふと思い立ってググってみたら、意外にも幾つかの解釈手法については既にOSS実装があり、中にはCRANに上がっているものもあるのだと今更ながら知ったのでした。ということで、二番煎じなのか何番煎じなのか分かりませんが、これらのRによる機械学習モデルの解釈法実装を今更ながら僕も試してみることにします。検証に使うデータセットは統一してUCI ML
- 機械学習
- R
- あとで読む
- データ
- techfeed
数式からいい感じに図表が生成できてしまう! Penroseを試す (SIGGRAPH 2020) - Qiita
- 27 users
- qiita.com/tomo_makes
- テクノロジー
- 2020/06/06
Penroseとはなにか Penroseは、数式に近い数学的表現から、細かなパラメータの指定なく、いい感じに図表を生成してくれる、カーネギーメロン大発、SIGGRAPH 2020に採択されたプロジェクトです。以下に、論文より、自動生成された図表を抜粋します。数式にとどまらず、コンピュータグラフィックスのメッシュ図示など、幅広い表現に使えます。 Penroseは、数式に近い数学的表現から、細かなパラメータの指定なく、いい感じに図表を生成してくれる、カーネギーメロン大発、SIGGRAPH 2020に採択されたプロジェクトです。数式にとどまらず、コンピュータグラフィックスのメッシュ図示などにも使えます。まずは筆頭著者のKatherine Ye氏のTweetにつけられた動画をご覧ください。今日現在(2020.6.7)、紹介動画のPenrose Web IDEは未公開 (今後公開予定とのこと
- 数学
- 可視化
- Haskell
- math
- HotEntry
- あとで読む
- プログラミング
- design
kuniezu: 日本の国土地理を扱いやすくするRパッケージをCRANに登録しました - cucumber flesh
- 26 users
- uribo.hatenablog.com
- 学び
- 2020/05/09
はじめに使い方 parse_*_dohunbyo(): DMS表記を十進数表記に変換日本測地系2011における平面直角座標系の特定 move_jpn_rs(): 南西諸島の一部・小笠原諸島を移動した日本地図の描画地理院タイルをleafletで簡単に利用できるように国土地理に関するデータセットはじめに kuniezuパッケージ (v0.1.0) をCRANにリリースしました。 github.com このパッケージは、私が業務や趣味で日本国内の地理空間データを扱う時に作っていた関数を一つのパッケージに整理したものです。空間的に世界規模のデータを扱うのではなく、日本国内に限った話であれば、日本に即した仕様や座標参照系を利用した方が良いことがあります。そうした日本の地理空間データを処理する際に利用することがある機能や、あると便利なデータセットを提供できるように努めています。ゆるゆる
- R
- gis
- あとで読む
- map
- 地図
「RとStanではじめる　ベイズ統計モデリングによるデータ分析入門」書評 - nora_goes_far
- 18 users
- das-kino.hatenablog.com
- 学び
- 2019/07/08
この記事について著者の馬場真哉様より、2019年7月10日に講談社より発売の、「RとStanではじめる　ベイズ統計モデリングによるデータ分析入門」をご恵投いただきました。ありがとうございます！！ www.kspub.co.jp 事前に献本をいただけるということを伺っていたので、その時から「ご恵投いただきました！」とTwitterで報告するだけでなく、簡単にでも読んでみた感想を書こうと決めていました。まだざっと読んだ段階で、コードを実際に走らせてもいないのですが（もちろん後でじっくり読みながら実行します）、感想や関連書籍との比較をしていきたいと思います。本記事の方針本書の「はじめに」の部分やサポートページには、以下のような方を対象読者としていると書かれています。本記事も、そのことを念頭に書いていこうと思います。統計学の基礎やベイズの定理などの基本事項を学んでみたものの、その有効性が
- R
- 本
- あとで読む
- 統計
そろそろRユーザーもApache ArrowでParquetを使ってみませんか？ - Technically, technophobic.
- 17 users
- notchained.hatenablog.com
- テクノロジー
- 2019/12/17
先日、Apache Arrow東京ミートアップ2019で「RとApache Arrow」というタイトルで発表してきました。あと、Japan.RでもApache ArrowについてLTしました。話したこととしては、 arrowパッケージを使うとParquetファイル（後述）の読み書きができる sparklyrパッケージが内部でApache Arrowを使うようになって、R↔Spark間のデータのやり取りが高速になった Arrow Flightがもっと一般的になれば、JDBCやODBCを使わなくてもデータベースからデータを取ってこれるようになるという感じで、個人的にいま強調したいのは1.です。とりあえずParquetファイルの読み書きというのがRユーザーにとって一番わかりやすいメリットなので、そこをきっかけにみんなApache Arrowにズブズブになって、もっと世の中のシステムがApac
- あとで読む
R初心者の館（RとRStudioのインストール、初期設定、基本的な記法など） - nora_goes_far
- 14 users
- das-kino.hatenablog.com
- テクノロジー
- 2019/12/03
本記事について R Advent Calendar 2019　2日目の記事です。本記事執筆のモチベーションゼミや講義でRを使いたいことがあります。しかし、インストールや初期設定、基本的な記法についての説明で時間を使ってしまうのはもったいないと思い、「これを事前に読んできて」と言えば済むような資料を用意したいと思いました（もちろんすでに、ネット上には有用な記事がたくさんあります）。もし同様の要望をお持ちの方がいらっしゃったら、本記事をご活用いただければ幸いです。そういうわけで、本記事では、Rをまったく触ったことがない初心者を読者に想定しています。また、筆者の環境がWindowsであるため、同環境を事例として説明しています。目次 RとRStudioのインストール RStudioの初期設定 RStudioの機能 Rの基本的な記法・使用方法四則演算代入演算子その他の演算子データの型
- R
- 統計学
- 統計
Pythonでデータの挙動を見やすくする可視化ツールを作成してみた　まとめ編 - Qiita
- 12 users
- qiita.com/c60evaporator
- テクノロジー
- 2021/08/02
コードはGitHubにもアップロードしておりますおすすめ機能個人的に使用頻度の高い機能を紹介しますおすすめ1：CustomPairPlot.pairanalyzer 相関係数と散布図行列を一括表示します。分析の初期段階でデータを一括で可視化したいときにオススメです。 Rのggplot2ではほぼ同様の図が出力可能ですが、なぜかPythonには同様のツールがなかったので、作成しました。散布図では表示が重なり見辛い離散変数は、自動で箱ひげ図とバブルチャートに変更する機能も追加しています。 from seaborn_analyzer import CustomPairPlot import seaborn as sns titanic = sns.load_dataset("titanic") cp = CustomPairPlot() cp.pairanalyzer(titanic,
- Python
- qiita
- 統計
「昔はこんなに暑くなかった」をR言語で可視化する - bob3’s blog
- 10 users
- bob3.hatenablog.com
- 世の中
- 2023/08/27
2023年の8月もそろそろ終わります。しかし、まだまだ暑くて秋の気配はまだまだ来ないようです。さてここ数年、7月に入ったころから「昔はこんなに暑くなかった」「いや、そんなことはない」といった話題がSNSをにぎわせています。私も数年前にこんなグラフを作って、周りではそこそこ評判良かったです。東京の8月の最低気温の分布の推移。いまさらだけど、ちゃんと書き直したのもあげておく。最低気温の上限が90年代以降上昇しているという結論は変わらないけど。boxplotもおまけで付けておいた。 pic.twitter.com/wfxgfr7I3O— ボブさん (@bob3bob3) 2018年7月18日今年もいろんな人が気温の可視化をしていて、非常に興味深かったです。いくつか挙げてみましょう。 1) 東京における夏（6月～9月）の気温、過去148年分のヒートマップ。東京における夏の気温を過去1
- あとで読む
はじめに
- 9 users
- morimotoosamu.github.io
- テクノロジー
- 2024/01/18
このドキュメントは『指標・特徴量の設計から始めるデータ可視化学入門』で提供されているPythonによる可視化コードをR言語で書き直したものです。ただし、Pythonのコードの直訳・逐語訳ではなくRらしい書き方・表現へ意訳しています。以下が各章ごとのドキュメントです。 2023年2月時点で第8章まで完成。第1章データ可視化の本質第2章数量を把握するデータ可視化第3章メカニズムをとらえるデータ可視化第4章多変数をとらえるデータ可視化第5章データの分布をとらえる指標化第6章関係性をとらえる指標化第7章パターンをとらえる指標化第8章データ指標化・可視化のプロセス MATLAB版も公開されています。以下の方針を取っています。書籍とPythonのコードで微妙に異なる箇所は、極力書籍に合わせる。配色の再現は目指さない。 jetカラーのグラデーションはviridi
Google ColaboratoryでRを使う – marketechlabo
- 9 users
- www.marketechlabo.com
- テクノロジー
- 2019/10/27
無料でPythonの実行環境を使わせてもらえるGoogle Colaboratory。しかもGPUと12GBのメモリ、350GBのディスクまで使える環境であり、手元のPCよりハイスペックな人も多いだろう。 RユーザにとってはPythonだけでなくRでも使えたらいいのにと思うところである。そこで、この記事ではこの環境でRを使う方法を解説する。 Rを使う4つの方法実はGoogle ColaboratoryのインスタンスにはRの環境（RのバイナリとJupyter Kernel）がインストールされており、わずかな手順で使えるようになるのである。参考までにインストールされているKernelの一覧はマジックコマンドから確認できる。 !jupyter kernelspec list Available kernels: ir /usr/local/share/jupyter/kernels/ir p
ベイズ統計でKaggleを解いてみる - Qiita
- 9 users
- qiita.com/Honoka-Nakano
- テクノロジー
- 2024/04/11
はじめに概要ベイズ統計を用いてKaggleの1タイタニック問題を解いてみる．分析は以下の手順で行う．データの可視化・理解データの加工・前処理ベイズ統計分析モデルの記述デザイン行列・データリストの作成 Stanファイルの記述 MCMC! 結果の評価実行環境 Mac OS Sonoma 14.1 R version 4.3.1 RStudio version 2023.12.1+402 > R.versions version.string R version 4.3.1 (2023-06-16) > sessionInfo() other attached packages: [1] posterior_1.5.0 cmdstanr_0.6.1 lubridate_1.9.3 forcats_1.0.0 [5] stringr_1.5.0 dplyr_1.1.3 purrr
- Kaggle
- 統計
- 機械学習
- qiita
- データ
おすすめのR packageをまとめました。 - Open Box with STAT
- 8 users
- openbox-stat.net
- テクノロジー
- 2021/05/21
Rを使うときパッケージ（以下、package）を利用すると思います。 packageとは、Rの機能を拡張する関数、データ、資料の集まりです。例えば、きれいな図を描きたいときは、ベースのR機能であるplotでは物足りないため、ggplot2 packageを使います。一般化推定方程式を使いたいときは、ベースのR機能だけでは、数式を読み解き、関数を自作する必要がありますが、gee packageを使えば関数の自作は不要です。このようにRを使う上でpackageは重要ですし、いろいろなpackageを知っていると楽ができます。ただし、packageの有無を自分の解析能力の限界にする必要はありません。自ら関数が組めると解析の幅が広がります。 packageは山ほどあります。しかし解析によく使うpackageはある程度限られます。この記事では、ぼくが使っている（使いたい）R packageを紹
- r
- github
- あとで読む
condaの代わりに高速なmambaを使う - macでインフォマティクス
- 8 users
- kazumaxneo.hatenablog.com
- テクノロジー
- 2021/02/11
2021 2/11 誤りを修正 2021 4/26 Rについて追記 2021 4/30 tips追記 2022 2/7 再インストール追記 Githubより Mamba は C++ での conda パッケージマネージャの再実装です。マルチスレッドを使ったリポジトリデータとパッケージファイルの並列ダウンロード、依存関係の解決をより高速にするための libsolv、Red Hat、Fedora、OpenSUSE の RPM パッケージマネージャで使用されている最先端のライブラリです。 mambaのコア部分はC++で実装されており、最大限の効率化が図られています。同時に、mamba は可能な限り互換性を保つために、codaと同じコマンドラインパーサ、パッケージのインストールとデインストール、トランザクション検証ルーチンを利用しています。開発の動機のブログ記事。condaの問題点についても
- Python
The R Graph Gallery – Help and inspiration for R charts
- 8 users
- r-graph-gallery.com
- 暮らし
- 2020/07/18
Welcome the R graph gallery, a collection of charts made with the R programming language. Hundreds of charts are displayed in several sections, always with their reproducible code available. The gallery makes a focus on the tidyverse and ggplot2. Feel free to suggest a chart or report a bug; any feedback is highly welcome! Stay in touch with the gallery by following it on Twitter. Oh and if you wa
一般線形モデルから一般化線形混合モデルにたどり着くまで - と。
- 7 users
- socinuit.hatenablog.com
- テクノロジー
- 2019/12/22
この記事こそが！ R Advent Calendar 22日目の記事です！このノリがわからない人は前の記事を読んでください。この前の記事が知る人ぞ知るRおじさんのAtsusyさんなのでこの記事では上がったハードルをくぐっていきます。皆さん読んできました？省略できちゃうんですよ……これでRとPythonでのギャップが埋まり、世界はデータドリブンに動きますね…… しかも明日はSendaiRの運営をされてる茶畑さん、あさってはがspoanaの運営をされてるtsuyuponさんの投稿です。誰？みなさんご存知きぬいとさんです。私は学生時代からRを使ってかれこれ8年になりますが、その人生の大半を線形回帰モデルに費やしてきました。例えば学部時代にはDobsonの一般化線形モデル入門を読んだり、ベイズモデリングに入門したり、 Stanの可能性に触れたりと、統計モデルの理論を学び、Rで実装
All Chart | the R Graph Gallery
- 7 users
- r-graph-gallery.com
- 世の中
- 2020/08/12
Most basic Most basic stacked area chart you can build with R and ggplot2, using the geom_area function. Small multiple Small multiple is probably the best alternative, making obvious the evolution of each gropup.
- R
- あとで読む
Alluvial PlotをPythonで描く｜nekoumei
- 7 users
- note.com/nekoumei
- テクノロジー
- 2020/04/20
TL;DR・Alluvial Plotはいいぞ・Pythonで良いかんじに描けるライブラリがなかったからつくった・https://github.com/nekoumei/pyalluvial はじめに皆さんはデータを分析するときに、ある状態の数量などの遷移を可視化したい（たとえばWebページのPVやサービス利用ユーザのクラスタの時系列変化など）とき、どんな可視化を検討しますか。いろいろあると思いますが、Sankey Diagramは代表的な手法のひとつだと思います。こういうやつですね引用: https://plotly.com/python/sankey-diagram/ 一方、知名度は低い（というより私が最近まで知らなかった）Alluvial Plotという可視化手法もあります。こんなかんじ。引用: https://cran.r-project.org/web/package
- python
- あとで読む
無料で学ぶRと統計解析：おすすめのウェブサイト - Qiita
- 7 users
- qiita.com/masato-terai
- テクノロジー
- 2023/10/11
Rに出会って、早5年（2023年現在）。これまでに出会った、無料で、RやRを使った統計解析を学ぶことができるウェブサイトのメモです。ブックマークしているもの、Xでツイート、リツイートしてきたものを公開します。随時更新して追加していきます。他にもあればコメント欄にお願いします。（英語の記事多い！） Rで統計解析 UCLA Statistical Methods and Data Analytics 【英語】コーディング方法など細かい事例が豊富です。 An Introduction to Bayesian Data Analysis for Cognitive Science 【英語】ベイズに特化しています。 New statistics for design researchers A Bayesian workflow in tidy R 【英語】ベイズに関する分析法がまとめてあります
- 統計
- あとで読む
DataExplorerパッケージで探索的データ解析を手助けする - Qiita
- 7 users
- qiita.com/yamano357
- テクノロジー
- 2019/06/12
概要 DataExplorerは探索的データ解析を手助けするR言語のパッケージ ggplot2パッケージをラップしており、関数ひとつでデータセットを可視化できる可視化結果をまとめたHTML形式の定型レポート生成も手軽前書き探索的データ解析(EDA: Exploratory Data Analysis)とは？ S-PLUS -トップ > 製品概要 > 探索的データ解析」より引用。探索的データ解析は、1960年ごろより有名な統計学者J.W.Tukeyによって提唱されたもので、データの解釈にあたっては「まずモデルありき」ではなく、モデルを仮定する前に現実的な立場で、データの示唆する情報を多面的に捉えるという、解析初期のフェーズを重視したアプローチです。それ以前は、あらかじめモデルを用意して、データをあてはめて確率計算を行っていました。しかし現実には、複雑な現実のデータ構造の中から、最適
- R
- あとで読む
非劣性検定（等価検定）をRで試してみる - 渋谷駅前で働くデータサイエンティストのブログ
- 7 users
- tjo.hatenablog.com
- テクノロジー
- 2021/06/14
この記事は、以前『統計学のセンス』を読んだ時から気になっていたことを思い出したので、単にRで試してみたという備忘録です。非劣性検定（等価検定）の話題は、本書の最後にある8.3節「非劣性の検証とは？」であくまでも付録扱いとして登場します。ここでは、統計学的検定は通常「有意差検定」といわれるが、 1) 標本数を大きくすることによって「医学的に有意でない差」を「統計学的に有意」とすることができる 2) 標本数を小さくすることによって「医学的に有意な差」を「統計学的に有意でない」とすることができるという欠点があることは意外と知られていない。（同書p.143）という有意差検定の問題点を指摘した上で、1980年代後半ごろから新薬審査に当たって「標準薬と同等程度の有効性」が検証できれば認可されるという流れが出てきたことで、積極的に同等性を検証するというニーズが出てきたという話題が紹介されています
- 統計
Forecasting: Principles and Practice (3rd ed)
- 7 users
- otexts.com
- テクノロジー
- 2020/04/22
Forecasting: Principles and Practice (3rd ed) Rob J Hyndman and George Athanasopoulos Monash University, Australia Buy a print version Welcome to our online textbook on forecasting. This textbook is intended to provide a comprehensive introduction to forecasting methods and to present enough information about each method for readers to be able to use them sensibly. We don’t attempt to give a thoro
ggplot2による可視化入門
- 7 users
- kazutan.github.io
- テクノロジー
- 2019/06/12
ggplot2 パッケージ “Grammer of Graphics”のコンセプトを実装したパッケージ現在Rにおけるグラフィックで非常に大きな支持を得ているグラフィックの構成要素を意識したレイヤー構造を持ついわゆる｢重ね書き｣をイメージするとわかりやすい拡張パッケージがたくさん (ちょっと勉強すれば)自分でいろいろ作れる tidyverseパッケージ群のひとつ tidyverseのグラフィック担当インストール CRANからインストールする場合: install.packages("ggplot2") 開発版(github)からインストールする場合: devtools::install_github("tidyverse/ggplot2") tidyverseパッケージ群なので、これでもインストールされる(推奨) install.packages("tidyverse") 読み込み
ggplot2 v3.3.0を使ってみた - Technically, technophobic.
- 6 users
- notchained.hatenablog.com
- 暮らし
- 2020/01/07
ggplot2 v3.3.0のリリースが近々予定されています。新機能がいろいろあるのでかいつまんで紹介します。詳しくはNEWS.mdをご参照ください。 after_stat(), after_scale(), stage() The evaluation time of aesthetics can now be controlled to a finer degree. after_stat() supersedes the use of stat() and ..var..-notation, ad is joined by after_scale() to allow for mapping to scaled aesthetic values. Remapping of the same aesthetic is now supported with stage(), so yo
- あとで読む
How the BBC Visual and Data Journalism team works with graphics in R
- 6 users
- medium.com
- テクノロジー
- 2022/08/23
Over the past year, data journalists on the BBC Visual and Data Journalism team have fundamentally changed how they produce graphics for publication on the BBC News website. In this post, we explain how and why we have used R’s ggplot2 package to create production-ready charts, document our process and code and share what we learned along the way. Data journalists on the BBC News’ Visual and Data
- R
- 統計
「大規模計算時代の統計推論」を全部Rでやってみる ~第1章~ - kur0cky
- 6 users
- kur0cky.hatenablog.com
- テクノロジー
- 2020/08/09
かの有名な「カステラ本」の姉妹編？「大規模計算時代の統計推論―原理と発展―」の和訳が発売されました大規模計算時代の統計推論: 原理と発展作者:エフロン,ブラッドレイ,ヘイスティ,トレバー発売日: 2020/07/30メディア: 単行本著者はブラッドリー・エフロン，トレヴァー・ヘイスティという超レジェンド研究者達ですが，訳者にもそうそうたる名前が並んでいます．せっかく新たなバイブルに出会えたので，この本で行われている解析を全てRでやってみる，ということをやっていきます．解析には随時適当なライブラリを使用し，作図・作表には基本的にggplot2, gtパッケージを使います．tidyverseも可能な限り活用していきます．今回の記事では第1章「アルゴリズムと推論」の再現をします．準備 1.1 回帰の例 fig 1.1 fig 1.2 tab 1.1 fig 1.3 1.2 仮説検定
- R
- 統計
- あとで読む