2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第35回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 拡散モデルで“モデルパラメータ”を生成する手法「P-diff」、Metaなどが開発 過去最高精度のリアルタイム物体検出器「YOLOv9」、台湾の研究者らが開発 音声、テキスト、画像、音楽などを統合して理解できるマルチモーダルモデル「AnyGPT」 大規模言語モデルのコンテキストウィンドウを200万トークン以上に拡張できる「LongRoPE」、Microsoftが開発 1024×1024の高解像度画像を高速に生成するモデル「SDXL-Lightning」、ByteDanceが開発 拡散モデ