タグ

ブックマーク / kohske.github.io (2)

  • ESTRELA連載記事「Rとウェブの融合」

    2014年7月号より、公益財団法人統計情報研究開発センターが発行する統計と情報の専門誌「エストレーラ」で、「Rとウェブの融合」と題して記事を連載しています。ウェブ上での記事公開の許可を頂いたのでここに公開します。なおウェブ公開記事は校正前の原稿なので誌上記事とは文章表現等が多少異なりますが、内容には変わりはありません。 Rとウェブの融合(1)ーrChartsの基礎ー (2014年7月号) Rとウェブの融合(2)ーrChartsの利用例ー (2014年8月号) Rとウェブの融合(3)ーrChartsの応用例ー (2014年9月号) 大規模データの高速処理 ーdata.table、dplyrー (2014年10月号) Rとウェブの融合(4)ーrmarkdownー (2014年11月号) Rとウェブの融合(5)ーslidify、R Presentationー (2014年12月号) Rとウェブの

  • 大規模データの高速処理 ーdata.table、dplyrー

    Rは便利な統計解析ツールですが、処理の遅さや大規模データの扱いにくさが弱点と言われています。 このような状況に対処すべく、現在ではパフォーマンスの向上に役立つパッケージが数多く開発されています。 そこで今回は「Rとウェブの融合」をお休みして、data.tableとdplyrによる大規模データの高速処理について紹介します。 この記事では2014年7月現在の最新バージョン(data.table 1.9.2及びdplyr 0.2)を利用しています。 必要に応じてインストールして下さい。また紙面の都合で実行結果の掲載は省略しているので、手元の環境で試して実行結果を確認してみることをお勧めします。 > # パッケージのインストールと読み込み > install.packages(c("data.table", "dplyr")) > library(data.table) > library(dpl

  • 1