タグ

可視化とRに関するchess-newsのブックマーク (6)

  • ⭐️Rを使ったモデル構築の最善策を求めて: {dplyr} + {tidyr} + {broom} + {purrr}を使ったアプローチ - cucumber flesh

    RStudioのチーフサイエンティスト、Hadley Wickham(ハドリー)が2月に行った講演のビデオがYouTubeに上がっていたので観た。 "Making Data Analysis Easier"というタイトルでの発表(スライドでは"Managing many models"になっているけど)で、ハドリー自身が考えている、データサイエンスに必要な可視化やモデリングを効率的に行うための手法について、彼の開発してきたパッケージを中心に説明している。 www.youtube.com 分かりやすく、具体例を交えた内容なので、是非YouTubeの動画を観てもらうのが良いと思うが、自分の頭を整理するためにもここでまとめておく。なお、発表スライドはクリエイティブ・コモンズライセンス3.0のもと、表示・非営利のラインセンスで再利用可能となっている。 Hadley Wickham (Chief S

    ⭐️Rを使ったモデル構築の最善策を求めて: {dplyr} + {tidyr} + {broom} + {purrr}を使ったアプローチ - cucumber flesh
  • ggplot2の等高線にラベルをつける - Technically, technophobic.

    Tokyo.Rでの@berobero11さんの発表を見てて、この等高線どう描くんだろうなあ、とかつぶやいてたら、 こんなすてきなリプが飛んできました!!! @yutannihilation ユタ兄さん、懇親会で聞かれた等高線の描き方をアップしました。ご参考までに。 http://t.co/qsiwTvfUa0— berobero (@berobero11) 2015, 2月 23 そのお礼といってはおこがましいですが、等高線にラベルを付ける方法を模索してみました。 directlabelsを使う 意外と知られてない気がしますが、directlabelsというパッケージがあります。これを使うと、ggplot2のグラフに直接ラベルを書き入れることができます。 ちょっと使ってみます。 (beroberoさんのコードを、ggsave(p, file='demo_contour_diff.png',

    ggplot2の等高線にラベルをつける - Technically, technophobic.
  • Rデータ処理入門

    西南学院大学経済学部 演習1 講義ノート 講義ページ: http://courses.wshito.com/semi1/2020-datascience/index.html ***ビューワで文字化けするときはビューワ画面を最大化すると治ることがあります***

    Rデータ処理入門
  • 多変数の相関を可視化する方法メモ - 草薙の研究ログ

    自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつく。これは,研究報告の透明性というのにもつながる。 ただ論文には紙幅の都合があって,いつでも,というわけにはいかないけど。 とにかく多変数の相関行列に対応するようなデータの可視化について,Rを用いてメモしていく。自分ですぐ忘れてしまうから。 (スクリプトの中に不自然に半角スペースとか入っているのは,hatena記法と変に被るところを避けるため) 散布図行列(SPLOM) 一番てっとり早い方法。 まずRのデフォルト関数で「データフレーム形式」でデータを読み込む。 例えばエクセルからクリップボードにコピーした状態なら, dat<- read="" table

    多変数の相関を可視化する方法メモ - 草薙の研究ログ
  • Rによる多変量解析と可視化

    KH Coderの(サポートページへ) 実例 クラスター分析 ※当に分かりやすくて、それでいて大切なことがきちんと書いてある クラスター分析とその応用 ※もう一歩高度な内容へ パソコン多次元尺度構成法 ※Kruskalの非計量多次元尺度法について比較的読みやすい解説あり Applied Multidimensional Scaling ※「よくある間違い」だけでも読んでおけば役立つかも。 対応分析入門 原理から応用まで ※対応分析(コレスポンデンス分析)を主にあつかう数少ない和書 Correspondence Analysis in Practice 2nd Ed. ※対応分析を詳しく知りたい方へ ネットワーク分析 ※読みやすい入門書 ネットワーク分析 第2版 ※Rを使った実践なので、KH Coderの共起ネットワークのカスタマイズにも Self-Organizing Maps 3r

  • Rのspdepのパッケージを使って、コンビニのドミナント出店戦略を定量化する - Analyze IT.

    こんにちは、集計野郎マクガイバーです。 コンビニの出店戦略ではセブンイレブンのドミナント戦略が有名で公式ホームページにも記載してあるくらいです。 しかし、その実態に関してはどの程度そうであるのかといったような厳密な検証情報はなく、特定都市における出店数を比較したようなものや、単に四国にセブンイレブンが出店していないという情報を根拠にしたものが多数見られます。 関西ではローソンがドミナントしているのはいうまでもないし、特定の地域を抜き出して一般的な結論を持ち出すのは問題に思われます。 幸いなことに去年集めたものですが、データが手元にあるので、今日はこのドミナント出店戦略を数値化、可視化してみます。 (以後、ですます調ではなくなります。) ロウデータで見る各コンビニの出店戦略 ここでは、ロウデータを地図上にプロットして各コンビニチェーンの出店戦略がどのようになっているかを見てみる。 赤:セブン

    Rのspdepのパッケージを使って、コンビニのドミナント出店戦略を定量化する - Analyze IT.
  • 1