ビッグデータに関するtoshitiruのブックマーク (1)

  • 全世界の本3000万冊を分析してわかったこと

    世界中に存在するの内容を読み取ってデータ化し、さまざまな形で利用できることを意図したグーグル・ブックス・プロジェクトが立ち上げられた時、そんなことができるのか(分量的な意味でも権利的な意味でも)と疑問に思ったものだ。それが今では、著作権侵害などさまざまな課題を残しつつも事業は継続し、検索した時にお世話になることも増えてきた。3000万冊以上のをすでにデジタル化しているようで、その是非はともかくとしてもかなり大規模な計画だ。 書『カルチャロミクス 文化をビッグデータで計測する』の著者らは、この壮大なデジタル図書館に目をつけた。著者らのグループとグーグルが共同で開発した、Nグラム・ビューワーと名づけられたツールは、単語を入力することでその単語の出現頻度が時代に伴ってどのように推移したかを図で示してくれる。ある単語が、ある時点でどれだけの人の関心を集めているのかを知りたいのであれば、グーグ

    全世界の本3000万冊を分析してわかったこと
    toshitiru
    toshitiru 2016/02/28
    Google Booksのことは知ってはいたけど、改めてこう見ると超面白そうじゃん!上手く使えば言語学的な研究に利用できる。やってみたい!
  • 1