タグ

自然言語処理に関するDursanのブックマーク (2)

  • いまさら聞けないHadoopとテキストマイニング入門

    ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1

    いまさら聞けないHadoopとテキストマイニング入門
  • 第3回さくさくテキストマイニング勉強会 #sakutextmining

    2011年6月4日(土)に開催された第3回 さくさくテキストマイニング勉強会に参加してきました。 過去2回は青山にあるオラクル社の超豪華な会場をお借りして開催されたのですが、今回からは数理システム社のご厚意により新宿にあるセミナールームをお借りしての開催となりました。 数理システム様に感謝。 内容についてはすでに参加報告されている方々の記事をご参照ください。 id:nokuno:20110604:1307178783 [twitter:@nokuno]さん id:showyou:20110604 [twitter:@showyou]さん 第3回さくさくテキストマイニング勉強会に参加してきた [twitter:@holidayworking]さん [id:ToMmY:20110605:1307276971] [twitter:@tomy_kaira]さん ← KH Coder について作者の

    第3回さくさくテキストマイニング勉強会 #sakutextmining
  • 1