タグ

graphとcvに関するsh19910711のブックマーク (2)

  • 【論文読み】画像をグラフ構造として特徴抽出するVisionGNN - Qiita

    以下の論文の内容をまとめた。 Vision GNN: An Image is Worth Graph of Nodes 2022/06 https://arxiv.org/abs/2206.00272 Kai Han, Yunhe Wang, Jianyuan Guo, Yehui Tang, Enhua Wu パッチ化した画像でグラフを構築し、グラフニューラルネットワークで特徴抽出、画像分類や物体検出タスクに利用する。TransformerやMLPを使った画像処理の研究とコンセプトは似ている。 まとめ 前提/課題 CNN, transformer, MLP, 等を利用してコンピュータビジョンモデルが改善されている 画像中の物体は通常、形状が不規則で四角形ではないため、ResNetやViTなどの従来のネットワークで一般的に使われているグリッドやシーケンス構造は、冗長で柔軟性がなく、処理しに

    【論文読み】画像をグラフ構造として特徴抽出するVisionGNN - Qiita
    sh19910711
    sh19910711 2024/04/17
    "VisionGNN: 画像をノードと見なせるいくつかのパッチに分割し、近傍のパッチを連結してグラフを構成 + GNNで特徴抽出、画像分類や物体検出 / 深層部では中心ノードの近傍はより意味的" arXiv:2206.00272 2022
  • 画像データに対するGraph Neural Network(GNN)入門 - Qiita

    はじめに 最近、グラフニューラルネットワーク(Graph Neural Network; GNN)を用いた気象予測の論文が話題を呼んでいました。 Learning skillful medium-range global weather forecasting | Science https://www.science.org/doi/10.1126/science.adi2336 Google DeepMindの気象予測AI「GraphCast」、1分で前例ない精度の10日間予報を出力 https://www.techno-edge.net/article/2023/11/15/2259.html Learning skillful medium-range global weather forecasting (Lam et al. 2023) こちらの研究では空間スケールの異なる様々

    画像データに対するGraph Neural Network(GNN)入門 - Qiita
    sh19910711
    sh19910711 2024/02/29
    arXiv:2206.00272 / "Vision GNN (Han et al. 2022): GNNで画像認識することで、Vision Transformer等の最新モデルを超えるパフォーマンス + 画像をいくつかのパッチに分割し、それらをノードと見なす" / 2023
  • 1