タグ

R言語に関するmasayoshinymのブックマーク (17)

  • お前Rは初めてか?力抜けよ - Qiita

    R の入門記事――というよりも詰まりやすいトピック、いや正確に言うと自分が理解するのに少し躓いた物事を連ねた、半ば恨み節といっても良いような記事です。 私は今ではRを毎日のように書いていますが、使い始めた当初は「何じゃこりゃ?」と思うことの嵐でした。……いや、正直に言って今でもそうなのですが。私は R の前には C、C++Python をそれなりに書いていて、申し訳程度に Haskell と Scheme に触ったことがあったのですが、どうも R は書いていて「あれ?」と思わされるポイントが多いように思います。もし私と同じような経験の元にRを書くことになって途方に暮れている人がいれば助けにならないかなあと思って書きました。 普通の入門であれば触れるようなこと(基的な構文、ブロードキャスティング、よくある操作など)には触れません。また、一つ一つのトピックを掘り下げることは重視していません

    お前Rは初めてか?力抜けよ - Qiita
  • RのフロントエンドExploratoryを使って、セクハラが世界中の「いつ、どの場所に」多いかを分析して、シリコンバレーのハッカソンで2位になってきた - Qiita

    RのフロントエンドExploratoryを使って、セクハラが世界中の「いつ、どの場所に」多いかを分析して、シリコンバレーのハッカソンで2位になってきたRデータ分析DataVisualizationデータ可視化Exploratory 今回のハッカソンには、テーマがいくつか用意されていた。例えば、教育、健康、金融、社会起業などがありました。中でも、ぼくの目を一際引いたのは、次のこの単語でした。 Safe City(安全な街) 以前、友人から、セクハラの相談を受けていたこともあり、セクハラの問題を解決するアプリによって「女性にとっての安全な街」を実装するを方針でぼくは動きました。チームは無事見つかり、ハッカソンに提供されていたセクハラのデータを集めたプラットフォームを運営しているSafe cityという非営利団体のAPIを利用したWebアプリケーションを作ろうということになりました。 セクハラは

    RのフロントエンドExploratoryを使って、セクハラが世界中の「いつ、どの場所に」多いかを分析して、シリコンバレーのハッカソンで2位になってきた - Qiita
  • データ分析にはどのようなツールが必要なのか--エンジニア編(前編)

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 前回はマーケティング部門側の視点から、日々の分析に役立つ技術について解説した。今回は前後編に分けて、おもに主に情シス部門に向けて、エンジニアの視点からデータ分析において役立つさまざまな技術を紹介する。情シス部門側は分析チームにおいて、下記のような業務を担う可能性が高い。 集計処理の自動化 分析レポートの継続化 データの収集 分析用データの蓄積 これらを実施する上で役立つ技術は、いったいどのようなものがあるのか。 集計処理の自動化・分析レポートの継続化 プログラミング言語「R」 プログラミング言語「R」は、集計処理の自動化や継続的にレポートを出力するための便利なツールだ。前回はマーケティング部門側の担当者がインタラクティブな分析に利用して

    データ分析にはどのようなツールが必要なのか--エンジニア編(前編)
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 【Python】R言語を勉強するために「言語処理100本ノック」をPythonで解いてみる - 歩いたら休め

    会社の先輩から「これ使ったらいい感じにデータ取ってこれるよ」と渡されたものが、 dplyrとかstringrとかよくわからないパッケージをガンガン導入した自由奔放なRのコードで困っています。 R言語自体にも慣れていないため、 「コードを使って何を表現したいのか」と「そのRのパッケージで何をできるのか(またどういう使いどころなのか)」を両方読み解かなければならず、けっこう大変です。 そのコードの中で「いくつか関数の入ったリストを高階関数に渡してfilterかける」ような操作をしていてしっかり読み解いてみたいのですが、 そのコードで取ってきたデータを使いたいだけなので、どうしても後回しにしてしまいます。 というわけで、Rの勉強は家でやることにしました。 「言語処理100ノック」として、ちょうど勉強したいライブラリ(dplyrなど)をいい感じに使ってるRのコードがあったので、 これを題材にしよ

    【Python】R言語を勉強するために「言語処理100本ノック」をPythonで解いてみる - 歩いたら休め
  • 「Rプログラミング入門」をPythonで書き直す - めもめも

    何の話かというと RStudioではじめるRプログラミング入門 作者: Garrett Grolemund,大橋真也,長尾高弘出版社/メーカー: オライリージャパン発売日: 2015/03/25メディア: 大型この商品を含むブログを見る 某編集長から上記の書籍が送られてきて、「これは、次はRのを書けという指示か????」と勘ぐってみたものの、筆者はPython派なので、「これと同じことは全部Pythonでもできるんだよー」と言いたくなって、このエントリーを書き始めた次第です。ちなみに、この、Rの入門書としてはよくできているので、これのPython版ができたら、それはそれで役に立つ気もします。 なお、このエントリーでは、あくまでコードの部分だけを書き直して、RとPythonの差異についての説明だけを行ないます。コードそのものの説明については、上記の書籍をご購入ください。 環境準備 IP

    「Rプログラミング入門」をPythonで書き直す - めもめも
  • 週間少年ジャンプの掲載順位データを作る(Rで) - Qiita

    はじめに ジャンプの掲載順位データを可視化するという素敵な記事がありました。 ジャンプの掲載順位データという大変素敵なHPから、pythonのbeautifulsoupでスクレイプしてデータを可視化する、といった内容でした。 同じことを、Rでやってみます。 作成されたデータはGistにあります。 データの取得 スクレイプはrvestで、文字列処理はstringiでゴリゴリやりましょう。 まずはパッケージの準備。 ## 結果を入れるデータテーブル jump_data = data.table(NULL) ## データがあるのは、1999年から2015年まででした。 for(year in 1999:2015) { ## リンクがまとまっているページのurl link_page = paste("http://hamada.tsukaeru.info/jump/", year, "/jump"

    週間少年ジャンプの掲載順位データを作る(Rで) - Qiita
  • 統計を始めたい人に僕がPythonよりRを勧める理由 - 蛍光ペンの交差点

    今回は「ほぼRしか使ったことがない」人間*1が、できる限り二者の優劣をくっきり述べる。 僕はほとんどRしか使ったことがない。Pythonはtfidfやクイックソートをライブラリ無しで実装した程度。 前半の主張は以下である。 「過去のRでの10回程度の解析において、Rで不十分さを感じてPythonを使った経験は1度だけ、しかも部分的にしかなかった。Rの使いにくさを感じることも最近はだいぶ無くなった。だから初学者には「事足りる」Rを勧める。」 前半の主張 今までにRでやった解析の内容は大体以下である。 (未発表)は途中で頓挫した、もしくは現在進行中/契約により詳細&解析結果の公開不可能のプロジェクトである。 [ビジネス・製造業] 米国新車価格の線形重回帰分析(授業の期末課題) [ビジネス・不動産不動産賃貸価格の線形重回帰分析(発表スライド) [ビジネス・IT] EコマースサイトのARIMA

    統計を始めたい人に僕がPythonよりRを勧める理由 - 蛍光ペンの交差点
  • 初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌

    Photo by Hermann Kaser こんにちは。谷口がお送りします。 ITエンジニアの方の中には「R言語を学習したい」という方も多くいらっしゃるかと思います。 R言語は、データ分析やデータ処理に特化したオープンソースのプログラミング言語です。システムを開発をする他のプログラムミング言語とは位置付けが異なり、統計解析機能が付いていて、解析処理やその結果をグラフィカルに表示することができます。 そのため、多量のデータ解析が求められるソーシャルゲームの解析や、リサーチ、データマイニング、アソシエーション分析が必要な業務の求人が増えています。 また近年データサイエンティストが注目されていることもあり、今後求人が増えることが予想されます。 そこで今回は、プログラミング未経験~初心者の方が、なるべくコストをかけずにR言語に触れられて、学習に役立てられるコンテンツを10件ご紹介していきます。

    初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌
  • R言語の過去と最新の動向

    連載「フリーソフトによるデータ解析・マイニング」は今月号をもって終了となります。 2003年8月に連載第1回として金明哲氏による「データ解析・マイニングとR言語」という記事が掲載されて以来、 約12年半149回に渡り、6名の執筆陣がR言語とデータ解析について解説してきました。 最終回となる今回は、過去10年余りのR言語の国内での普及、 そしてR言語の最新の動向について紹介しながら、有用な情報をピックアップしてみます。 なお今回の記事には著者の主観が多分に反映されていることをご承知おき下さい。 R言語の10余年史 コンピュータのバックアップ履歴を漁ってみたところ、著者自身は大学院生だった2003年頃からRを触り始めて、 2004年夏頃に研究のための分析ツールとしてRを導入していたようです。 この頃のRのバージョンは1.7から1.8だったように記憶しています。 連載の開始時期と著者のR利用

  • Shiny Dashboard – R言語用ダッシュボードを生成

    統計分析用の言語として知られるRでWebアプリケーションを開発できるようにするのがShinyです。分析結果をグラフに描画し、それをWebブラウザで確認するのが簡単になります。 そんなShiny用の整ったダッシュボードを作れるのがShiny Dashboardです。よりリッチで使いやすい管理画面を実現できるようになるでしょう。 Shiny Dashboardの使い方 Shiny Dashboardを使えばShinyをさらに格好良い画面にできます。Rでダッシュボードを作り、統計データを確認できる格好良いインタフェースが手軽に構築できそうです。 Shiny DashboardはR製、GPLのオープンソース・ソフトウェアです。 Shiny Dashboard rstudio/shinydashboard

    Shiny Dashboard – R言語用ダッシュボードを生成
  • RxAndroidをカジュアルに使ってみるとか - みんからきりまで

    RxAndroidは、RxJavaを内包しAndroidで利用するための機能を追加したものです。 RxJavaの概要と基的な使い方については過去の記事で紹介しています。 過去記事内で「実際のAndroidアプリでのユーケースに合わせた例も書いてみたいと思います」とか書いてそのまま3ヶ月以上放置してしまいました。 RxJavaは非常に多機能かつFRPという新しい概念に基いて設計されており、使いこなすには相当に学習コストが掛かるため、利用するにはハードルが高いイメージなのではないでしょうか。 しかし、そこまでRxJavaを深く理解し様々な関数を活用しなくても、RxAndroidは結構気軽に利用出来るのではないかなという気がしてきたので、RxAndroidの活用ケースを考えてみようと思います。 AsyncTaskなどの代わりに非同期コールバック処理に利用する RxAndroidを使えば、非同期

    RxAndroidをカジュアルに使ってみるとか - みんからきりまで
  • rvest すげえ。#rstatsj - Qiita

    Hadley 神の造りし rvest、ちょっとしたスクレイピングコードが一瞬で書けたので凄いなと思いました。 library(rvest) html <- html("http://tabelog.com/tokyo/A1307/A130701/13094275/") access <- html %>% html_nodes(xpath = '//*[@id="accesslog"]/div/ul/li/em') %>% html_text() print(access)

    rvest すげえ。#rstatsj - Qiita
  • Rでベイジアン動的線形モデルを学ぶ(4):季節要素のあるローカルレベル・モデル - 渋谷駅前で働くデータサイエンティストのブログ

    色々と興味が発散していて違う話題ばかりしてますが、これもまだ全然終わってないので粛々と進めようと思います。ということで今回は季節調整のお話。Commandeurの進行に合わせて、季節調整ありただしトレンドなしというモデルでいきます。もちろんテキストはこちらの2冊と、R実践例をまとめたPDF book。 状態空間時系列分析入門 作者: J.J.F.コマンダー,S.J.クープマン,Jacques J.F. Commandeur,Sime Jan Koopman,和合肇出版社/メーカー: シーエーピー出版発売日: 2008/09メディア: 単行購入: 2人 クリック: 4回この商品を含むブログを見る Rによるベイジアン動的線形モデル (統計ライブラリー) 作者: G.ペトリス,S.ペトローネ,P.カンパニョーリ,和合肇,萩原淳一郎出版社/メーカー: 朝倉書店発売日: 2013/05/08メデ

    Rでベイジアン動的線形モデルを学ぶ(4):季節要素のあるローカルレベル・モデル - 渋谷駅前で働くデータサイエンティストのブログ
  • Rの実践!エンジニア向けデータマイニング講座|freee 坂本登史文【機械学習・決定木理論の活用編】 | キャリアハック(CAREER HACK)

    山田、決定木勉強するってよ 「ふぅ。」 MySQLとRのデータ連携がうまく行き、山田は一息つきました。が、「俺って一息つきすぎでは?」という疑問を覚え、すぐに手元のデータマイニングのを読み進めました。 を読み進めていくとどうやら、今回のような分析には「決定木」という手法がうまく使えそうです。決定木は、エンジニアになじみのある木構造で情報を整理する方法です。 まずは、ある会社における従業員の遅刻要因を分析した決定木の例から学んでみましょう。 この木は下記のように解釈できます。 ・遅刻するかどうかを決定づける最も大きな要因は「前日に飲酒した?」であり、飲酒している場合の遅刻率は1.3%である。 ・次に大きな要因は「新入社員かどうか?」であり、新入社員であった場合、前日に飲酒していなくとも、遅刻率が0.8%となっています。 このように、決定木ではある事柄を決定づけた要因を木構造で説明すること

    Rの実践!エンジニア向けデータマイニング講座|freee 坂本登史文【機械学習・決定木理論の活用編】 | キャリアハック(CAREER HACK)
  • codeacademyでpythonを勉強してみたよという話 - Data Science by R and Python

    codeacademyとは? 今日はこれを紹介:Learn to code | Codecademy codeacademyはオンラインでプログラミング言語を学べるサービスです。昔、一度だけ使ったことがあったんですけど、そのときは、ありがたみがわかりませんでしたが、全力で勉強する気になるとなかなかいいサービスだなと思います。とりあえず僕はデータ解析で使うためにpythonをやってみました。 実際の勉強は? 勉強は実際に書きながら学んでいきます。一つ一つ解説すると、 一番左が今から何をするのかを解説+その下に問題が書かれています。 真ん中のグレー〜黒の画面に自分でプログラムを書くことで勉強します。 そして、右上の黒のところに「実行結果」がでるという風になっています。 ちなみに、問題を解いてわからないところは、大抵左下のQ&Aで誰かが質問をしてくれているのでそれを参照するだけで、理解も深まりま

    codeacademyでpythonを勉強してみたよという話 - Data Science by R and Python
  • ボケて(bokete)のネタを全自動で流し見できるサイト作った - ほくそ笑む

    ボケてというサイトをご存じでしょうか。 ボケて(bokete) - 写真で一言ボケて大喜利・面白ネタ 写真に気の利いたひとこと(ボケ)を添えるサービスなんですが、実際ネタを見てもらうとわかると思います。 このボケてのネタをだら見できるサイトを作りました。 Bokete Player - playing automatically bokete サイトを表示すると、ボケてのネタが表示され、8 秒ごとに自動的に切り替わります。 切り替わり間隔は自分で調節できます。 スマホからも見れますので、暇な時のお供にどうぞ。 以下、裏話 Bokete Player は全て R言語で実装されています。 R言語には Shiny という超お手軽 Web アプリケーションフレームワークがあり、この程度のサイトなら、1時間ぐらいあれば作成できます。 RStudio Shiny チュートリアル レッスン1 ようこそ

    ボケて(bokete)のネタを全自動で流し見できるサイト作った - ほくそ笑む
  • 1