タグ

統計学に関するTomosugiのブックマーク (4)

  • 生きたことばをモデル化する統計科学の研究:研究室訪問:統計数理研究所

    「いづれの御時にか、女御更衣あまたさぶらひける中にいとやむごとなき際にはあらぬが、すぐれてときめきたまふありけり」で始まる『源氏物語』。平安時代中期(11世紀)に成立した宮廷の恋愛物語は、世界最古の長編小説として有名だが、江戸時代の人々にすら極めて難解なことばの集合で、多くの注釈書が発刊されていた。 ことばは時代と共に変化し、それを正しく理解することは失われた意味を復元する作業にも似る。冒頭にかかげた源氏の一節も、教えてくれる人がいなければ、それぞれの単語がどこで切れるのかすら判然としない。 言語を確率論的にとらえ、計算式によって解析(処理)するなら現代語も古典も、未知の言語すらも容易に理解できるようになる――このように考えて「計算言語学」の旗をかかげる統計科学者がいる。 言語の差異構造を統計的に理解する 持橋の専門分野は、「統計的自然言語処理」と「統計的機械学習」。それは簡単に表現するな

  • 電子教科書

    電子教科書 (PDF形式) ネットで多少評価いただいた「基礎からの数学」や「基礎からの統計学」は、さらに学んでいくことにつながる教科書です。 基礎からの数学は、将来の読書の中でちょっとした数学的な記述にも耐えられるようにする教科書です。 基礎からの統計学は、Excel をベースにした統計の教科書で、ある程度理論にも触れています。 これに対して、ほんとに易しい遠隔授業用の教科書も作りました。 これは、C.Analysis を使った授業に完全に準拠したテキストです。 そのため、テキストの中に C.Analysis の Youtube 動画もリンクされています。 基礎数学A/Bは、数学アレルギーを少し取り除いて、数値を使った分析に臨む準備の授業です。 統計/統計分析は、卒業論文で統計学を使うことを想定して行われる授業です。(一番役に立ちます) 経営科学/意思決定論は、合理的に判断するとはどういう

  • 巨人の新人・菅野投手のすごさの秘密 セイバーメトリクスが示すもの

    統計学の考え方は、混沌とした複雑社会を読み解く強力な武器になる。身近なところでは、迷惑メール(スパム)の撃退に、主観的な確率を駆使したベイズ統計学が活用されている。送られたメール文の中に「交際」「援助」「恋愛」などのキーワードがどれくらい含まれるかを数え、スパムかどうかの確率をはじき出すのである。こうした過去のデータをもとに、将来を科学的に予測する統計学の手法は、今やビジネスの世界では不可欠な道具でもある。 新たなデータ野球「セイバーメトリクス」 スポーツの世界も例外ではない。その端的な例が、野球である。戦略、選手の潜在能力査定、活躍の予測などに広く統計学の手法が応用され始めている。「セイバーメトリクス」というデータ分析法である。 データを駆使した科学的な野球と言えば、野村克也前楽天監督がヤクルト時代に導入したID野球が有名だが、セイバーメトリクスは、これをはるかに上回る興味深い視点を提供

    巨人の新人・菅野投手のすごさの秘密 セイバーメトリクスが示すもの
  • Rが使えるフリをするための14の知識

    米国FDAで公認され、ハーバード大学やイェール大学の授業で利用されるようになり、世間での認知度が着実に上昇している統計用プログラミング環境のRだが、ユーザーなのか、ユーザーになりたいのか、ユーザーとして振舞いたいのか分からない人が増えてきた。 スノッブなユーザーとして振舞う場合は、Rの特性を語れる必要があるので、ユーザーになるよりもRへの知識や理解が必要で、実は難易度が高い行動である。それでもあえて意識の高いRユーザーとして振舞いたい人々のために、最低限求められる事のチェック・リストを用意してみた。 1. 参考文献や参考ページを押さえておく 一番大事な事だが、参考文献や参考ページを押さえておこう。公式サイトで配布されている、「R 入門」「R 言語定義」「R のデータ取り込み/出力」は持っておくべきだ。R-TipsやRjpWikiも参考になる。 2. 演算子や制御構文をマスターする 四則演算

    Rが使えるフリをするための14の知識
  • 1