日本アニメ初の快挙!海外アニメ賞を受賞した『スキップとローファー』海外ライセンス部長&プロデューサーが語る、奮闘の舞台裏
日本アニメ初の快挙!海外アニメ賞を受賞した『スキップとローファー』海外ライセンス部長&プロデューサーが語る、奮闘の舞台裏
Azure Machine Learningを用いることで、利用者は機械学習のための大量の仮想マシンやHadoopのようなソフトウェアを用意する必要がなくなり、容易に機械学習による推論や予測、分析といったサービスを実現できるようになります。クライアントとしてExcelを利用することも可能。 モデルの作成には、Webブラウザからグラフィカルな操作が可能な「Azure Machine Learning Studio」が用意され、プログラミング不要で分析モデルを作成可能。そのモデルの中で行う計算や学習のためのライブラリとしてPythonとRにも対応ました。 あらかじめ機械学習を利用して構築されたレコメンデーション、アノマリー検出、テキスト分析などのサービスも「Azure Store」で提供され、すぐに利用可能です。コミュニティによるギャラリーも用意されています。いま見たところ「飛行機のエンジンの
今週はまともなデータ分析やら統計学やら機械学習やらの記事を書くのが面倒になったので*1、しばらくやってなかったお薦め書籍リストでも書こうかと思います。 今回まとめるリストは、ズバリ「Rでデータサイエンス・統計学・機械学習を学ぶための10冊」。Rと言えばこのブログのメイン言語なので特に説明は要さないでしょう。去年1年間は拙著も含めてR絡みの本が大豊作で、以前のお薦め書籍リストに比べるとRの良書が増えたという部分もあり、そう言えばR本だけでリスト作れるなぁと思ったのでした。 というわけで、主に僕が持っているor読んだことがある本を中心にお薦めリストをまとめてみました。いつも通り独断と偏見まみれなので、他にも良いR本は沢山ありますよーという旨予めお断りしておきます。 そうそう、先に書いておきますがこのリストは中級者向けです。でも初学者向けに良いRの本ってあるのかなぁ。。。初学者はまずはExcel
ここ 1ヶ月にわたって 聖書 DeepLearning 0.1 Documentation を読み進め、ようやく 制約付きボルツマンマシン の手前まできた。 制約付きボルツマンマシン (RBM) の解説 には RBM = マルコフ確率場 ( Markov Random Field / MRF ) の一種だよっ、と しれっと書いてあるのだが マルコフ確率場とはいったい何なのかは説明がない。マルコフ確率場 <マルコフ・ランダム・フィールド> は用語もカッコイイし結構おもしろいので、 Python でサンプルを書いてみる。 補足 Python では PyStruct というパッケージがマルコフ確率場 / 条件付き確率場 ( Conditional Random Field ) を実装しているため、実用したい方はこちらを。このパッケージ、ノーマークだったがよさげだなあ。 マルコフ確率場とは グラフ
今、小生はいわゆるデータマイニングなるものの研究をしているが、レコメンデーションなるクソみたいな分野が本当にクソすぎてクソ。 アマゾンの「これを買った人は〜」みたいなものを思い浮かべてくれればいい。何がクソって、評価手法がクソ。 「他の手法より私たちの手法はこんなに優れているよ」というのを何かしらの方法で示すのが評価なわけだが、その方法の主流は ある購入者の過去の購入履歴を見て、ある商品を買った人が次に買った商品をあてて、その精度を競うというもの。 つまり、 「購入者の特性から、ある商品Aを買ったら次は商品Bを買いそうだな。よし、実際に商品Bを買ったという履歴があるので精度100%!」 みたいなことをやるわけだ。 はぁぁぁあぁぁぁぁぁぁっぁぅぅぅうぅぅううっっっ!????????それお前の推薦がなくても買ったってことちゃうんかい!!!!!?????お前の手法超いらねえええええええxじゃああ
「本書を読めば、学べてよかったと思うことが身につき、あなたの道具箱に必要不可欠なツールが加わるが、おそらくそれよりも重要なのは、あるストーリーが語られ、その過程がとても楽しいことだ。そのストーリーとは、ソーシャルウェブサイトをめぐるデータの科学であり、ソーシャルサイトに詰め込まれたデータは何なのか、それらのデータを使ってあなたが(あるいはほかの誰かが)できることとして、どのような可能性があるのかといったことだ。」(本書「はじめに」より) 本書では、Twitter、Facebook、LinkedIn、Google+、GitHubなどのソーシャルウェブサイトを取り上げて、データマイニングを行うために必要な技術知識や手法を解説しています。本書の前半では基礎概念を学び、後半ではソーシャルウェブサイトをマイニングするためのツールやテクニックを広く紹介しています。データサイエンティストやアナリスト、あ
みなさん、次のようなことができたらいいと思ったことはありませんか? 「顧客ごとに、適したタイミングと内容で、DMを送信できたら……」 「CGM系サイトへの誹謗中傷なんかのスパム投稿を自動識別できたら……」 「サーバの負荷が高まるタイミングを事前に予測できたら……」 一見するとこれらは実現していることがまったく異なりますが、じつはある共通点があります。それは「データを分析し、その結果を活用している」という点です。 Data is Kingの考えから得られるメリット かつてAmazonに在籍していたRonny Kohaviは「Data is King at Amazon」と言い、データの重要性を説きました。事実、Amazonはユーザの購買履歴から商品のレコメンデーションを行い、ユーザのサイト内の遷移履歴やクリック率からサイト構造の改善を行うなど、データを徹底的に活用していることで知られています
多項式回帰やロジスティック回帰など、最近ではデータマイニングや機械学習などでもごく普通の手法として使われる微分方程式について、生態系モデルのシミュレーションを通じて直観的に理解するための入門書。生物の発生モデル、クジラの回遊モデルなどの実例について、Mathematicaによるシミュレーションを通じて理解を促します。なお本書はEbookのみの販売となります。 本書のサンプル(PDF) ダウンロード まえがき 第1章 はじめに:微分方程式とは 1.1 常微分方程式と相図 1.2 微分方程式の数値解法 第2章 基礎編:生物モデルで理解する微分方程式 2.1 ロジスティックモデル 2.1.1 ロジスティックモデルが形成する美しい曲線 2.1.2 定性的な解の捉え方 2.2 2種生物の競合モデル 2.2.1 平衡点の解析 2.2.2 解軌跡 2.2.3 ヌルクラインによる解析 2.3 マグロは絶滅
TOPICS Data Science , Database 発行年月日 2013年09月 PRINT LENGTH 310 ISBN 978-4-87311-640-2 原書 Bad Data Handbook FORMAT PDF 値の欠落、形式から外れたレコード、エンコーディング形式が不明な文字列。「バッドデータ」と聞いた時に思い浮べる典型例です。しかし、これら以外にも「そもそもデータにアクセスできない」「消えてしまった」「昨日と違っている」「データはあるが形式が処理に適していない」など、データを収集・分析するエンジニアは、これらの「バッドデータ」と正面から向きあわなければならないことが多々あります。本書では、これらの問題のあるデータのパターンを紹介し、その対処法を解説しています。 19人のデータ分析の専門家が、自らの経験を通して得た、さまざまな教訓、実践的な方法論等を詳述した本書は
追記(2015/03/14) 第7章の決定木のところで取り上げた{mvpart}パッケージのサポートが切れ、CRANから削除されてしまったためinstall.packages関数ではインストールできなくなっています。現在のインストール方法を最後に追記しました。 追記(2014/09/18) 実はGoogleブックスで立ち読み可能です 拙著公式サポートページと相互リンクしています。サンプルデータと正誤表はこちらをご参照ください ということで、以下の通り拙著『手を動かしながら学ぶ ビジネスに活かすデータマイニング』(技術評論社)が本日発売と相成りました(都内の大型書店では先週半ばから先行販売している模様です)。 手を動かしながら学ぶ ビジネスに活かすデータマイニング 作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行本(ソフトカバー)この商品を含むブログ
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
本日、出版元の技術評論社(gihyo)様の公式サイトでオープンになりました。 手を動かしながら学ぶ ビジネスに活かすデータマイニング:書籍案内|技術評論社 そして書影はまだ反映されていないようですが、Amazonでも予約受付が始まった模様です*1。 手を動かしながら学ぶ ビジネスに活かすデータマイニング 作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見る ということで、僕が生まれて初めて執筆した書籍が恥ずかしながら8月22日(予定)に発売されることになりました。詳しくはgihyo様の公式サイトをご覧いただきたいのですが、このブログで唯一はてブ1000超えを達成したエントリ(Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くData Scientistのブ
アナタのデータ分析はただの「現状分析」かもしれない!?明日から使える「データ」への向き合い方と考え方をfreeeのデータマイニングエンジニア坂本さんに教えてもらいました。 データ分析→活用、ホントに出来てる? 昨年辺りから、ビックデータやデータサイエンティストがある種「バズワード化」して久しいですね。 ただ、データというものは決してプロフェッショナルだけが扱うものではありません。様々な業界・業種の人が日々、データと向き合っているもの。Excelが使えるからといって、「データ分析ができている」と勘違い…いや錯覚している人も多いのでは!?ここは基礎から、データの扱い方・考え方についてプロから学んでみましょう。 今回ご寄稿いただいたのは、10万以上の事業所が導入している「全自動のクラウド会計ソフト freee」でデータマイニングエンジニアを務める坂本さん。 明日から使える考え方が詰まっています。
これだけデータが注目される今日において、この問いに「No」と答えるわけにはいかない。しかし、必ずしも「Yes」と答えられるわけでもなく、「やり方次第でYesにもNoにもなる」としか答えようがないことがほとんどではないだろうか。 では、データはどのように活用すれば「儲かる」、つまりはビジネスとして成果を生み出すのか?クラウド型の統計分析ツールxica adelieを提供する株式会社サイカが、さまざまなビジネスの現場でデータを活用するプロフェッショナルへのインタビューを通じて、その「可能性」や「限界」はどこにあるのかを探って行く。 ――酒造りの中で、データをどのように活用していますか。 酒造りは、伝統的に杜氏という職人文化によって支えられてきました。獺祭では杜氏がいない体制で酒造りをしており、優秀な杜氏がやっていたことを集団でやろうとしています。その中で、さまざまな形で酒造りの中でデータによる
今日は、マーケティングや企画に携わる社会人なら知っておきたい、というよりは、知らないと恥ずかしい、無料で利用できる公的統計データのポータルサイト「e-Stat」の情報と、新しい統計データが自動的に飛んでくる「統計メールニュース」の情報をお届けします。 すでに6月も下旬。新入社員の方も配属部署が決まってバリバリ働いていることだと思います。 マーケティングや企画の仕事をする人にとって、調査データというのは大切なもの。 ネット上で発表される「○○のサービスのユーザー数が○○万人」なんて調査データ、みんな好きですよね。Googleトレンドのような検索ボリュームの情報や、どのブラウザがどれぐらい使われているかといった調査データも人気です。 どれも無料で入手できるデータですが、実は税金でちゃんとした手法でつくられている、質の高い調査データというのが、あるのです。 それが、政府の出している統計データ。
ある国際会議のkeynote Speechの中で紹介されていた話。非常に面白かった。 Wired: How a Math Genius Hacked OkCupid to Find True Love 「いまどきの若い男は、なんでもコンピュータか!」とか思われるかもしれないけど、何をしたのかを読んでみると「これって、単なるナンパの方が楽だったんじゃないか?」と思わされる。 登場人物のスペック この人の経歴がアメリカ的。 名前:Chris McKinlay (35歳) 経歴 2001年:Middlebury College を卒業。専攻は中国語 同年:世界貿易センターで中国語から英語への翻訳のアルバイト。アルバイトを辞めた5週間後に9・11。 〜2002年:その後、友達に誘われて、an offshoot of MIT’s famed professional blackjack team に
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く