[B! Deep Learning] pattierのブックマーク

pattier id:pattier

Deep Learningに関するpattierのブックマーク (6)

大規模モデルを支える分散並列学習のしくみ Part1
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。自然言語処理分野における大規模深層学習の重要性は日に日に高まっていますが、GPT-3, GPT-4 などのモデルの学習には膨大な計算コストがかかり、容易に学習できなくなっています。実際、モデルサイズが近年急速に大きくなっていることにより、学習に必要な計算量(FLOPs)は以下のように年々膨大になっています。近年の大規模モデルでは、NVIDIA H100 80GB であっても 1 つの GPU では、モデルをのせることすらできません。 Compute Trends Across Three Eras of Machine Learning よりまたScaling Laws によると、大規模なモデルは小さいモデルと比較してより優れた性能を発揮するため、自動
pattier 2023/06/21
Deep Learning

プログラミング

GPT

分散並列学習
リンク
機械学習が独学できる日本語Youtube難易度別まとめ - Qiita
こんにちは。在宅の機会が増えて以来Youtubeを見る機会が増え、機械学習などが勉強できるチャンネルをいくつか探しては見ていました。探した中でよかったと思ったものをメモしていたのですが、せっかくなので公開したいと思います。日本語のソースがあるもののみ対象にしており、『これ無料でいいのか？』と思ったチャンネルを紹介したいと思います。主観で以下のレベルに分けましたがあくまで参考程度にお願いいたします。基本：Pythonを触ってみた人 Pythonの説明・動かし方などを解説していて、動画によっては踏み込んだ内容になる応用：アルゴリズムを使いこなしたい人「model.fit(X, y)して動かしてみた」よりも踏みこみ、Python自体の説明は少ない発展：研究開発もしたい人最新の手法の仕組みの理解などが主眼であり、Pythonの解説はほぼ無いもしおすすめのチャンネルございましたらぜひコ
pattier 2022/04/08
Deep Learning

python

AI
リンク
画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita
0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3つだよ画像パッチを単語のように扱うよアーキテクチャはTransf ormerのエンコーダー部分だよ巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transf ormerの解説 Vision Transf ormer(=ViT)の重要な部分は次の3つです。入力画像アーキテクチャ事前学習とファインチューニングそれぞれについて見ていきましょう。 1.1 入力画像まず入力画像についてです。ViTはTransf ormerをベースとしたモデル(というより一部を丸々使っている)ですが、
pattier 2020/10/13
AI

Deep Learning
リンク
ディープラーニングの応用のための具体的方針まとめ - HELLO CYBERNETICS
はじめに目標の設定と指標の決定目標の設定指標の決定評価指標に対する最低限の知識機械学習における知識（補足）ニューラルネットワークの学習最初に使うニューラルネットワーク時間的にも空間的にも独立である複数の特徴量を持つデータ空間の局所的な構造に意味のある多次元配列データ（例えば画像）時間的な変動に意味のあるデータ（例えば音声、自然言語）ニューラルネットワークの細かい設定ユニットの数と層の数正則化活性化関数ドロップアウトバッチ正規化学習の早期終了性能が出ない場合データの追加収集ニューラルネットの設定をいじる用いるニューラルネット自体を変更する新たなニューラルネットワークの考案コードを書くにあたってデータ成形結果を記録するコードフレームワークの利用フレームワークの選択 ChainerとPyTorch TensorFlow Keras 最後には
pattier 2017/09/22
プログラミング

Deep Learning
リンク
ディープラーニングの判断根拠を理解する手法 - Qiita
ディープラーニングは特定分野で非常に高い精度が出せることもあり、その応用範囲はどんどん広がっています。しかし、そんなディープラーニングにも弱点はあります。その中でも大きい問題点が、「何を根拠に判断しているかよくわからない」ということです。ディープラーニングは、学習の過程でデータ内の特徴それ自体を学習するのが得意という特性があります。これにより「人が特徴を抽出する必要がない」と言われたりもしますが、逆に言えばどんな特徴を抽出するかはネットワーク任せということです。抽出された特徴はその名の通りディープなネットワークの中の重みに潜在しており、そこから学習された「何か」を人間が理解可能な形で取り出すというのは至難の業です。例題：このネットワークが何を根拠に猫を猫として判断しているか、ネットワークの重みを可視化した上図から答えよ(制限時間:3分) image from CS231n Visua
pattier 2017/09/07
プログラミング

Deep Learning
リンク
Deep Learning
This domain may be for sale!
pattier 2017/09/06
プログラミング

Deep Learning
リンク
1