統計の学習をすると、難しい数式が出てきて躓くことも多々あると思います(経験談)。「入門」とつくタイトルの本であっても、数学当然知っているよ人間が書いていて、全然理解できないことが多いハズ。 筆者もそんな状態から2年間、試行錯誤をしながら学習し、「入門した!」ぐらいは自信を持って言えるようになりました。ただ、入門しただけなので、それより先は未知の分野です。 2年前の自分自身にアドバイスするつもりで、この記事を書きます。 関連する記事は以下のとおりです。 文系卒社会人が統計・機械学習を理解するための数学勉強方法 高校数学復習を終えると統計学の入門ができるのか? 文系卒社会人が統計入門でのモヤモヤを克服した話 時間と目的別学習方法 統計の裏には数学が密接に関連しています。しかし、数学はどうしても苦手な人もいますし、全ての統計を学習する人が数学のような時間がかかる基礎レベルから理解する必要はないと
効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。 ここに公開するのは、以下の論文の全訳である。 Wickham, H. (2014). Tidy data. Journal of Statistical Software, 59 (10). doi:10.18637/jss.v059.i10 この論文は、「整然データ」(tidy data) という概念を提唱したものである。これは、Rなどでデータ分析を容易にする有用な概念になっている。 なお、この概念についての簡単な解説として、「整然データとは何か」という文章を用意したので、先をそちらを読んでもよいだろう。また、“tidy” という英語をなぜ「整然」という日本語に訳したかについては「なぜ“tidy data”を「整然データ」と訳
本連載「フリーソフトによるデータ解析・マイニング」は今月号をもって終了となります。 2003年8月に連載第1回として金明哲氏による「データ解析・マイニングとR言語」という記事が掲載されて以来、 約12年半149回に渡り、6名の執筆陣がR言語とデータ解析について解説してきました。 最終回となる今回は、過去10年余りのR言語の国内での普及、 そしてR言語の最新の動向について紹介しながら、有用な情報をピックアップしてみます。 なお今回の記事には著者の主観が多分に反映されていることをご承知おき下さい。 R言語の10余年史 コンピュータのバックアップ履歴を漁ってみたところ、著者自身は大学院生だった2003年頃からRを触り始めて、 2004年夏頃に研究のための分析ツールとしてRを導入していたようです。 この頃のRのバージョンは1.7から1.8だったように記憶しています。 本連載の開始時期と著者のR利用
「統計を使わずに、Rを純粋にプログラミング言語として学ぼう」というコンセプトに基づいて書かれた本書は、統計学の難しい知識がなくてもプログラミングの経験があまりなくても、プログラミングを学んでみようという意欲さえあれば読める、画期的な書籍です。サイコロを作る、ゲームで遊べるトランプを作る、スロットマシンを作る、という3つの簡単なプロジェクトに取り組む過程で、Rのプログラミング統合環境、RStudioを活用して、楽しみながら効率的にRのプログラミングスキルを身に付けていきます。統計だけに使うのはもったいない、Rのプログラミング言語としての隠れた魅力と可能性と、さらにはデータサイエンスの基礎としてのデータ分析を紹介します。 序文 はじめに I部 プロジェクト1:ウェイトをかけたサイコロ 1章 基本中の基本 1.1 Rのユーザーインターフェイス 1.2 オブジェクト 1.3 関数 1.4 元に戻す
This is the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. The book is designed primarily for R users who want to improve their programming skills and understanding of the language. It should also be useful for programmers coming to R from other languages, as it explains some of R’s quirks and shows how some parts that seem horrible do have a positive side. Introduction F
統計解析用のプログラミング言語であるR言語について、基本的な使い方を見ていきます。
本書ではデータ解析環境R を使って「素早く、簡単に、間違いのない」レポートを作成する方法を紹介します。 結果を可視化したグラフや表、数値データ等に適切な注釈を加え、場合によってはそのデータ解析の背景や結論などを記述して、読む人が理解できる「レポート」を完成させることが不可欠です。データ解析という仕事の評価は、内容もさることながらレポートの出来栄えによって大きく左右されるといっても過言ではありません。 ビッグデータブームやデータサイエンティストブームの中、データ解析の需要が高まっていることには疑問の余地はないでしょう。そして現在ではR はデータ解析ツールの中心的な存在となっています。R では動的レポート生成を支援するツールが急速に整ってきているので、この手法を習得するのも利用するのも非常に簡単です。本書の後半では、派手なという意味ではなくレポートとして洗練されたという意味で「インパクトのある
Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!
この本の概要 企業や組織は「ビッグデータ」時代を迎え,成果へのプロセスをデータ分析から得られる判断に委ねようとしています。「データサイエンティスト」は,データ分析を中心とした意思決定に欠かせない役割を持ち,いまもっとも注目される職種のひとつです。データサイエンティストは,データ収集に関するエンジニアリングの技術だけでなく,統計を用いたデータ分析や問題解決能力などビジネス面にもわたる知識を必要とします。 本書ではデータサイエンスの基本となる考え方から,R言語による統計解析の基礎,マーケティングに応用できるデータ分析など「データサイエンティスト」がおさえておきたい記事が満載です。 こんな方におすすめ エンジニア,マーケター,学生
中心がずれた円グラフとか、胸に迫る3Dグラフなど素敵な可視化が巷に溢れている昨今、皆さん客観性を保つ可視化リテラシーとはなにかということについて頭を悩まされていると思いますがそんな現状に鉄槌を下す素敵なパッケージがあります。その名はxkcd。 もとは以下のstackoverflowに寄せられた質問から。 http://stackoverflow.com/questions/12675147/how-can-we-make-xkcd-style-graphs-in-r xkcdは主に棒人間が活躍するwebコミックで作者はNASAで働いてたとのこと。 http://xkcd.com/ xkcdパッケージはその味わい深いwebコミックのテイストをRのグラフ上で再現できます。素晴らしいですね。 ということで以下棒人間を描くまでの手順。 詳しい話はVignette参照のこと。 http://cran
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く