ディープラーニングの人気記事 6件

1 - 6 件 / 6件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ディープラーニングの検索結果1 - 6 件 / 6件

AIの新星ニューラルネットワーク「KAN」とは？　LLMが“カンニング”して評価を盛ってた？　など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 177 users
- www.techno-edge.net
- テクノロジー
- 2024/05/06
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた？　AIカンニング問題を指摘した研究一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」高精度なニューラ
1つの大きなLLM（大規模言語モデル）を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog
- 43 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2024/05/07
地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 LLM群雄割拠の時代昨今、ローカルGPUで駆動できるようなLLM（大規模言語モデル）もかなり増えてきて、キャッチコピー的に「ついに我が家にもGPT-4が！」とか言われるようになってまいりました。パラメータ規模で言えば70億～130億(7B-13B)パラメータ、700億(70B)パラメータ、1400億(140B)パラメータあたりのモデルが活発にリリースされているように見受けられます。大きなモデルをGPU寄せ集めしつつ遊びたい！しかしながら、コンシュマー向けのGPUにおいては、7B
- LLM
- GPU
- AI
- あとで読む
- techfeed
からあげさんってすごいなあポエム(松尾研LLMコミュニティ初心者セミナー)
- 38 users
- zenn.dev/yasuna
- テクノロジー
- 2024/05/04
はじめに今回始めて松尾研LLMコミュニティの初心者向け講座"Begginning LLM"の第一回に参加しました！１～２ヶ月に１回ほど開催される連続講座のようでChatGPTで遊んだことあるけど本格的にLLMのこと知りたい！けど何からはじめていいのか分からないという人にぴったりの講座だと感じました。この講座内容のすべては以下のYoutubeで公開されています。今回のセミナーの中では松尾研所属のからあげさんが２つのユニットのセミナーを行っていました。この記事ではからあげさんから学んだことを思ったままに書いていきます。からあげさんはここがすごいぞみなさんからあげさんのセミナーがとても気になって受講された方が多いんじゃないかな？と思いました。もちろん、わたしも松尾研LLMでのからあげさんのご活躍が見たくて申し込みました！！！約100枚の圧倒的スライド数まず、すごいボリュームの
- 学習
- AI
- あとで読む
- 転職
- 勉強
世界初、AIモデルの再学習コストを大幅に削減可能な過去の学習過程を再利用する「学習転移」を実現～NTT版LLM「tsuzumi」など基盤モデルの更新・差し替えを容易に～ | ニュースリリース | NTT
- 28 users
- group.ntt
- テクノロジー
- 2024/05/07
◆深層学習において、過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術を実現しました。 ◆本技術は、深層学習におけるパラメータ空間の高い対称性を活用し、実際に学習することなく低コストな変換により数秒～数分程度で一定の精度を実現できるため、モデルの再学習コストを抜本的に削減できることを示しました。 ◆これにより、NTTが研究開発を進める大規模言語モデル（LLM）「tsuzumi（*1）」をはじめとした多様な基盤モデル（*2）の運用コスト削減・消費電力の削減や、多数のAIで議論することで多様な解の創出をめざしたAIコンステレーション（*3）の構想具現化など、次世代のAI技術開発に貢献します。日本電信電話株式会社（本社：東京都千代田区、代表取締役社長：島田　明、以下「NTT」）は、深層学習において過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術
- AI
- あとで読む
- techfeed
- 研究
AlphaFold 3 predicts the structure and interactions of all of life’s molecules
- 9 users
- blog.google
- テクノロジー
- 2024/05/09
GitHub - Blealtan/efficient-kan: An efficient pure-PyTorch implementation of Kolmogorov-Arnold Network (KAN).
- 3 users
- github.com/Blealtan
- テクノロジー
- 2024/05/06
This repository contains an efficient implementation of Kolmogorov-Arnold Network (KAN). The original implementation of KAN is available here. The performance issue of the original implementation is mostly because it needs to expand all intermediate variables to perform the different activation functions. For a layer with in_features input and out_features output, the original implementation needs