タグ

NLPと東京大学に関するrokujyouhitomaのブックマーク (3)

  • 手書き数字98%認識−東大など、正解未知データを学習するAI開発

    東京大学大学院情報理工学系研究科の胡緯華(フウェイファ)大学院生と、プリファード・ネットワークス(東京都千代田区)の宮戸岳リサーチャーらは、手書き文字や数字のように、正解が事前に分からないデータを効率的に学習する人工知能(AI)技術を開発した。手書き数字認識の精度が98・4%と、別の研究グループの最高成績84・3%から誤差を10分の1に減らした。手書き文字認識の精度は70%だった。文字認識に限らず画像など幅広く活用できる。 一般にAIは正解が分かっている大量のデータを事前に用意して学習させる。学習後に未知のデータを与えると、そのデータと最も近い正解群を選び判定する。今回、事前にデータを用意しないで、未知データをそのまま学習する「教師なし学習」で高い識別精度を実現した。 開発したのは「IMSAT」というアルゴリズム。まずデータを種類(クラスター)に分類し、各データにノイズを加えても同じ種..

    手書き数字98%認識−東大など、正解未知データを学習するAI開発
  • Tsuruoka Laboratory

    単語アラインメントに関する論文が国際学会 ACL 2023 に採択されました。 言語処理学会の年次大会にて鶴岡研究室から6編発表がありました。

  • 統計的機械学習入門

    統計的機械学習入門(under construction) 機械学習歴史ppt pdf 歴史以前 人工知能の時代 実用化の時代 導入ppt pdf 情報の変換過程のモデル化 ベイズ統計の意義 識別モデルと生成モデル 次元の呪い 損失関数, bias, variance, noise データの性質 数学のおさらいppt pdf 線形代数学で役立つ公式 確率分布 情報理論の諸概念 (KL-divergenceなど) 線形回帰と識別ppt pdf 線形回帰 正規方程式 正規化項の導入 線形識別 パーセプトロン カーネル法ppt pdf 線形識別の一般化 カーネルの構築法 最大マージン分類器 ソフトマージンの分類器 SVMによる回帰モデル SVM実装上の工夫 クラスタリングppt pdf 距離の定義 階層型クラスタリング K-means モデル推定ppt pdf 潜在変数のあるモデル EMアル

  • 1