タグ

ブックマーク / kskbyt.hatenablog.jp (2)

  • 機械学習用の学習データをイチから自力で作るには愛がないと無理だと悟った - データの境界

    いつも面白いネタを書かれるすぎゃーん氏の機械学習ネタスライド コードや説明など細かく書いて公開されているのですごく勉強になる speakerdeck.com 上記のスライドのテキスト内容(ブログ記事)がこの辺になるらしい 機械学習の結果の精度はツール自体(アルゴリズム)の精度、というよりはインプットデータの量と綺麗さによる部分が大きい。そんなわけでこのスライドに紹介されている話も例によってインプットとする画像への正解ラベル付けが地獄なわけですが、 ということで、学習用のデータを用意するのは大変だけど、 ある程度(自力でラベル付を行い正解データが)集まったらとりあえず学習させる 学習させたモデルを使って推論させてみる 推論結果を検証することで学習データを増やし、再び学習させることで精度が上がる というサイクルを続けることで、なんだかんだで自力で13000点ほどの分類済みのアイドル顔データを作

    機械学習用の学習データをイチから自力で作るには愛がないと無理だと悟った - データの境界
    sh19910711
    sh19910711 2024/04/14
    "機械学習の結果の精度はツール自体(アルゴリズム)の精度、というよりはインプットデータの量と綺麗さによる / 全く興味ない対象の学習データを自力で作るの、これ見たらやっぱり無理だと悟った" 2016
  • データビジュアライゼーション事例メモ - データの境界

    こちらのイベントに参加してきました。 passmarket.yahoo.co.jp トークで紹介されたビジュアライゼーション事例のリンクをペタペタ貼っておきます リニアは日をどれだけ狭くするのか? ~到達所要時間ビジュアライゼーションマップに挑戦~ - ビッグデータレポート - ヤフー株式会社 www.youtube.com Yahooのビジュアライズといえばこの記事。東京駅を起点として日全国にあらゆる交通機関を使って移動するとどれくらい時間がかかるかを超美麗に可視化した動画。百聞は一見にしかず。 沖縄戦全記録|NHKオンライン 沖縄戦時、どこでどれだけの人が亡くなったかをビジュアライズ。当時の状況のインタビューや動画記録なども掲載 Gay rights in the US, state by state | World news | theguardian.com アメリカの各州にお

    データビジュアライゼーション事例メモ - データの境界
  • 1