タグ

機械学習とhadoopに関するfragarach_the_swordのブックマーク (1)

  • [4]機械学習におけるApache Mahoutの可能性と課題

    第2回、第3回では、音声データと、画像データに関するメディア認識技術について解説してきました。今回は、メディア認識技術に共通する課題である、機械学習の高速化について取り上げます。 まず、機械学習とは何かということから簡単に説明すると、ある程度大量のデータの中から規則性やパターンを見いだすことで、データの認識や判定などに役立てる取り組みのことを指します。例えば、皆さんが使用しているパソコンや情報システムの多くには、メールを受信したときに、ウイルスが含まれていないかどうか、スパムメールでないかどうか、判定するソフトウエアが入っていると思います。これも、過去の大量データに基づいて、ウイルスが入っていたり、スパムメールだったりする可能性が高いパターンを機械学習することで判定の仕組みを作り、そのロジックを活用しているのです。 そしてメディア処理システムには、音声、画像、テキストなどデータの種類を問わ

    [4]機械学習におけるApache Mahoutの可能性と課題
    fragarach_the_sword
    fragarach_the_sword 2012/11/02
    ITPro連載:非構造化ビッグデータの処理技術(4)機械学習におけるApache Mahoutの可能性と課題
  • 1