モデルにおいて汎化が起こる理由と、論文の検索キーワード生成

テクノロジーカテゴリーの変更を依頼記事元:

medium.com/@arxivtimes

3 usersがブックマークコメント

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

<iframe marginwidth="0" marginheight="0" src="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fmedium.com%2F%40arxivtimes%2F%25E3%2583%25A2%25E3%2583%2587%25E3%2583%25AB%25E3%2581%25AB%25E3%2581%258A%25E3%2581%2584%25E3%2581%25A6%25E6%25B1%258E%25E5%258C%2596%25E3%2581%258C%25E8%25B5%25B7%25E3%2581%2593%25E3%2582%258B%25E7%2590%2586%25E7%2594%25B1%25E3%2581%25A8-%25E8%25AB%2596%25E6%2596%2587%25E3%2581%25AE%25E6%25A4%259C%25E7%25B4%25A2%25E3%2582%25AD%25E3%2583%25BC%25E3%2583%25AF%25E3%2583%25BC%25E3%2583%2589%25E7%2594%259F%25E6%2588%2590-64231a42b7c5" scrolling="no" frameborder="0" height="230" width="500"><div class="hatena-bookmark-detail-info"><a href="https://medium.com/@arxivtimes/%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AB%E3%81%8A%E3%81%84%E3%81%A6%E6%B1%8E%E5%8C%96%E3%81%8C%E8%B5%B7%E3%81%93%E3%82%8B%E7%90%86%E7%94%B1%E3%81%A8-%E8%AB%96%E6%96%87%E3%81%AE%E6%A4%9C%E7%B4%A2%E3%82%AD%E3%83%BC%E3%83%AF%E3%83%BC%E3%83%89%E7%94%9F%E6%88%90-64231a42b7c5">モデルにおいて汎化が起こる理由と、論文の検索キーワード生成</a><a href="https://b.hatena.ne.jp/entry/s/medium.com/@arxivtimes/%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AB%E3%81%8A%E3%81%84%E3%81%A6%E6%B1%8E%E5%8C%96%E3%81%8C%E8%B5%B7%E3%81%93%E3%82%8B%E7%90%86%E7%94%B1%E3%81%A8-%E8%AB%96%E6%96%87%E3%81%AE%E6%A4%9C%E7%B4%A2%E3%82%AD%E3%83%BC%E3%83%AF%E3%83%BC%E3%83%89%E7%94%9F%E6%88%90-64231a42b7c5">はてなブックマーク - モデルにおいて汎化が起こる理由と、論文の検索キーワード生成</a></div></iframe>

プレビュー

規約違反を報告

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

モデルにおいて汎化が起こる理由と、論文の検索キーワード生成

1/23のarXivTimes輪講では、DNNのような学習データの全パターンを覚えきることが可能なモデルでも汎化が... 1/23のarXivTimes輪講では、DNNのような学習データの全パターンを覚えきることが可能なモデルでも汎化が起こる理由を調査した論文と、論文の検索キーワードを生成する論文を扱いました。 A Bayesian Perspective on Generalization and Stochastic Gradient Descent DNNは膨大なパラメーターを持ち、やろうと思えば学習データを覚えきることが可能です。ただ、それはあくまで「やろうと思えば」であり、自然なデータを学習すること(=汎化な解への到達/flat minima)に比べて無理をしているのでは(Krueger et al. (2017))？という観点から、その「無理しなければいけない度合い」を計測することで学習データのみから汎化性能を予測できるのでは、という点に挑戦した論文です。この論文では、モデルの想定する事前分布と