ディープラーニングの人気記事 20件

1 - 20 件 / 20件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ディープラーニングの検索結果1 - 20 件 / 20件

Winnyの金子さんのED法について | やねうら王公式サイト
- 389 users
- yaneuraou.yaneu.com
- テクノロジー
- 2024/04/21
Winnyの金子勇さんが考案された機械学習アルゴリズムED法を再現して実装した人がいていま話題になっている。『Winny』の金子勇さんの失われたED法を求めて…いたら見つかりました https://qiita.com/kanekanekaneko/items/901ee2837401750dfdad いまから書くことは私の記憶頼りなので間違ってたらコメント欄で教えて欲しい。 1998年ごろだと思うのだが、私はWinnyの金子勇さんのホームページの熱心な読者だった。(ページも全部保存してたので私のHDDを漁れば出てくると思うが、すぐには出せない。) Winnyのβ版が発表されたのが2002年なのでそれよりはずいぶん前である。当時、金子さんはNekoFightという3D格闘ゲームを公開されていた。そのゲームには、自動的に対戦から学習するAIが搭載されていた。当時の金子さんのホームページの
- AI
- あとで読む
- algorithm
- 機械学習
- 人工知能
- winny
- 金子勇
- 技術
- 学習
- network
AIの新星ニューラルネットワーク「KAN」とは？　LLMが“カンニング”して評価を盛ってた？　など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 179 users
- www.techno-edge.net
- テクノロジー
- 2024/05/06
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた？　AIカンニング問題を指摘した研究一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」高精度なニューラ
グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
- 68 users
- k-tai.watch.impress.co.jp
- テクノロジー
- 2024/05/15
- google
- あとで読む
- AI
- 人工知能
- techfeed
1つの大きなLLM（大規模言語モデル）を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog
- 45 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2024/05/07
地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 LLM群雄割拠の時代昨今、ローカルGPUで駆動できるようなLLM（大規模言語モデル）もかなり増えてきて、キャッチコピー的に「ついに我が家にもGPT-4が！」とか言われるようになってまいりました。パラメータ規模で言えば70億～130億(7B-13B)パラメータ、700億(70B)パラメータ、1400億(140B)パラメータあたりのモデルが活発にリリースされているように見受けられます。大きなモデルをGPU寄せ集めしつつ遊びたい！しかしながら、コンシュマー向けのGPUにおいては、7B
- LLM
- GPU
- AI
- あとで読む
- techfeed
からあげさんってすごいなあポエム(松尾研LLMコミュニティ初心者セミナー)
- 39 users
- zenn.dev/yasuna
- テクノロジー
- 2024/05/04
はじめに今回始めて松尾研LLMコミュニティの初心者向け講座"Begginning LLM"の第一回に参加しました！１～２ヶ月に１回ほど開催される連続講座のようでChatGPTで遊んだことあるけど本格的にLLMのこと知りたい！けど何からはじめていいのか分からないという人にぴったりの講座だと感じました。この講座内容のすべては以下のYoutubeで公開されています。今回のセミナーの中では松尾研所属のからあげさんが２つのユニットのセミナーを行っていました。この記事ではからあげさんから学んだことを思ったままに書いていきます。からあげさんはここがすごいぞみなさんからあげさんのセミナーがとても気になって受講された方が多いんじゃないかな？と思いました。もちろん、わたしも松尾研LLMでのからあげさんのご活躍が見たくて申し込みました！！！約100枚の圧倒的スライド数まず、すごいボリュームの
- 学習
- あとで読む
- AI
- コミュニティ
- 転職
- 勉強
本家Examplesで知る、新たなニューラルネットワーク『KAN』の威力 - Qiita
- 29 users
- qiita.com/Cartelet
- テクノロジー
- 2024/05/09
文中の図は理がない限り、原論文あるいはドキュメントからの引用です。 KANってなに？ KAN（Kolmogorov-Arnold Network）は2024年4月30日にプレプリント公開サイトarXivに投稿された論文にて提案された従来のMLPとは異なる新たなニューラルネットワーク構造です。1 コルモゴロフ・アーノルド表現定理（Kolmogorov-Arnold representation theorem）に基づいて設計されており、非線形な活性化関数そのものを直接学習することから、パラメータ効率が良く、学習結果の解釈可能性が高いことが特徴です。上の画像は$x, y$を入力として$\exp(\sin(\pi x)+y^2)$を正解として学習させるケースを示した図ですが、元の関数の関係性がそのまま活性化関数の形状として学習され現れていることが読み取れます。コルモゴロフ・アーノルド表現
- 機械学習
世界初、AIモデルの再学習コストを大幅に削減可能な過去の学習過程を再利用する「学習転移」を実現～NTT版LLM「tsuzumi」など基盤モデルの更新・差し替えを容易に～ | ニュースリリース | NTT
- 28 users
- group.ntt
- テクノロジー
- 2024/05/07
◆深層学習において、過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術を実現しました。 ◆本技術は、深層学習におけるパラメータ空間の高い対称性を活用し、実際に学習することなく低コストな変換により数秒～数分程度で一定の精度を実現できるため、モデルの再学習コストを抜本的に削減できることを示しました。 ◆これにより、NTTが研究開発を進める大規模言語モデル（LLM）「tsuzumi（*1）」をはじめとした多様な基盤モデル（*2）の運用コスト削減・消費電力の削減や、多数のAIで議論することで多様な解の創出をめざしたAIコンステレーション（*3）の構想具現化など、次世代のAI技術開発に貢献します。日本電信電話株式会社（本社：東京都千代田区、代表取締役社長：島田　明、以下「NTT」）は、深層学習において過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術
- AI
- あとで読む
- techfeed
- 研究
自己対戦で強化学習する三目並べ AI をPyTorchで実装 - Qiita
- 25 users
- qiita.com/ydclab_P002
- テクノロジー
- 2024/04/25
PyTorch の社内勉強会の題材にしたいと思い立ち、畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）を用いた自己対戦型強化学習の三目並べ AI を実装したので公開します。見通しの良いシンプルな実装を目指しました。結局、それなりのコード量になってしまいましたが。動作環境 Google Colaboratory の CPUランタイムにて動作を確認しました。概略おおまかな処理フローは次図の通りです。盤面情報を受け取った先攻方策と後攻方策は、○×を書き込む場所を返します。この先攻方策と後攻方策に AI を実装し自己対戦させます。盤面情報は、空白マスをゼロ、先攻 ○ を+1、後攻 × を-1とした形状 (H,W)=(3,3) の二次元配列とします。盤面座標は、場合により二次元座標と1次元に展開したフラット座標を使い分けます。三目並べの
- AI
- PyTorch
- python
- qiita
- あとで読む
- 資料
RAGの評価：評価の必要性と問題点 - Beatrust techBlog
- 18 users
- tech.beatrust.com
- テクノロジー
- 2024/05/02
本ブログはこんな人におすすめ RAG (Retrieval Augmented Generation)を使ったアプリケーションを開発しているけど評価に関心のある人 LLM (Large Language Model)やRAGのハルシネーションをどう評価するのかに関心のある人 Ragas (RAGの評価ライブラリ：Retrieval augmented generation assessment)の挙動に興味がある人こんにちは。私はBeatrustのML周辺のお手伝いをしている鈴木宏和と申します。今回はこれから3つのパートに分けて紹介させていただきますが、LLMの応用として特に注目を集めているRAG (Retrieval Augmented Generation)について、RAGの評価の必要性とアプローチ方法について考察しつつ、RAGに特化した評価ライブラリであるRagasの有用性に関する
- 仕事
- あとで読む
GitHub - KindXiaoming/pykan: Kolmogorov Arnold Networks
- 13 users
- github.com/KindXiaoming
- テクノロジー
- 2024/05/01
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- github
KAN: Kolmogorov-Arnold Networks
- 11 users
- arxiv.org
- テクノロジー
- 2024/05/01
Inspired by the Kolmogorov-Arnold representation theorem, we propose Kolmogorov-Arnold Networks (KANs) as promising alternatives to Multi-Layer Perceptrons (MLPs). While MLPs have fixed activation functions on nodes ("neurons"), KANs have learnable activation functions on edges ("weights"). KANs have no linear weights at all -- every weight parameter is replaced by a univariate function parametriz
- 機械学習
EDLA
- 10 users
- web.archive.org
- テクノロジー
- 2024/04/21
誤差拡散学習法のサンプルプログラム 99/7/12 公開 99/7/16 詳細追加 99/8/6 一部修正 99/8/19 論文追加 99/10/27 経過報告 ED法サンプルプログラム（UNIX汎用、tgz、4KB）階層型神経回路網（ニューラルネットワーク）の教師あり学習アルゴリズムである誤差拡散学習法（ED法）のサンプルプログラムです。比較のために用いたバックプロパゲーション法（ＢＰ法）のサンプルプログラムも示しておきます。慣性項ありBP法のサンプルプログラム（UNIX汎用、tgz、4KB）なお、これらのプログラムでは、階層型構造をリカレント型の一種とみなして計算しています。また、パラメータ入力の際には、単にリターンを押すとデフォルト値（括弧の中の値）が用いられるようになっていますので、実行の際にはリターンを連打すればＯＫです。また、X-Windowを用いてトータルエラーのグラ
AI分野での活用も増加している「GPU」の種類と選び方を学ぼう
- 10 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/04/25
1　GPUとは GPU（Graphics Processing Unit）は、PC内で画像処理などの特定のタスクを高速に処理することを目的とした専用の装置です。主に画像処理やAI（人工知能）、科学計算などの分野で活用されています。CPU（Central Processing Unit）が一般的な演算や制御を担当するのに対し、GPUは大量のデータを並行して処理することが得意で、これにより高速な演算処理を実現しています。もともとは画像処理を目的に誕生しましたが、近年では機械学習などAI関連分野での活用が増加しており、生成AIのブームを追い風に、世界的に需要が高まっています。 2　GPUとCPUの違い GPUとCPUには以下のような違いがあります。 2.1　設計思想と役割 CPUは一般的な演算や制御を担当するために設計されていて、プログラムの実行やOS（オペレーティングシステム）の管理などPC
AlphaFold 3 predicts the structure and interactions of all of life’s molecules
- 10 users
- blog.google
- テクノロジー
- 2024/05/09
MLX で Llama 3 を試す｜npaka
- 8 users
- note.com/npaka
- テクノロジー
- 2024/04/21
「MLX」で「Llama 3」を試したので、まとめました。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 推論の実行「MLX」は、Appleが開発した新しい機械学習フレームワークで、「Apple Silicon」(M1/M2/M3など) を最大限に活用するように設計されています。推論の実行手順は、次のとおりです。 (1) Pythonの仮想環境の準備。今回は、「Python 3.10」の仮想環境を準備しました。 (2) パッケージのインストールと実行。今回は「mlx-community/Meta-Llama-3-8B-Instruct-4bit」のモデルを利用します。 pip install mlx-lm mlx_lm.generate --model mlx-community/Meta-Llama-3-8B-Instruct-4bit -
- Apple
- あとで読む
Google DeepMindがすべての生命分子の構造と相互作用をきわめて正確に予測できるAIモデル「AlphaFold 3」を発表
- 7 users
- gigazine.net
- テクノロジー
- 2024/05/09
Google DeepMindがAI系創薬企業のIsomorphic Labsと協力し、タンパク質やDNA、RNA、リガンドなど生命分子の構造と相互作用をきわめて正確に予測できるAIモデル「AlphaFold 3」をリリースしました。 Google DeepMind and Isomorphic Labs introduce AlphaFold 3 AI model https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/ Accurate structure prediction of biomolecular interactions with AlphaFold 3 | Nature https://www.nature.com/articles/s41586-024-0748
- 人工知能
- Google
- AI
【DL輪読会】KAN: Kolmogorov–Arnold Networks | ドクセル
- 6 users
- www.docswell.com
- テクノロジー
- 2024/05/09
【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化
- 機械学習
第288回人工知能時代には必須か？　最近、プロセッサに搭載されている「NPU」って何
- 4 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/05/20
最近、プロセッサに「NPU」と呼ばれる人工知能（AI）処理に特化したユニットが搭載されるのがちょっとしたブーム（？）になっている。このNPUって、GPUなどと何が違うのか、なぜプロセッサに搭載されるようになってきたのか解説しよう。プロセッサに搭載されている「NPU」って何？ Intelの最新プロセッサ「Core Ultra」には、人工知能（AI）処理に特化した「NPU」が搭載されている。NPUは、スマートフォン向けのプロセッサにも搭載が進んでいる。ところで、このNPUはCPUやGPUと何が違うのだろうか？　写真は、Intelのプレスリリース「AI PCの新時代の到来を告げるインテル Core Ultra プロセッサー」のCore Ultraプロセッサーの写真を使って、「CPU」「GPU」「NPU」の文字を載せたもの。今回のお題は「NPU」である。出だしから注釈になってしまうが、NPUと
- 人工知能
- コンピュータ
GitHub - Blealtan/efficient-kan: An efficient pure-PyTorch implementation of Kolmogorov-Arnold Network (KAN).
- 3 users
- github.com/Blealtan
- テクノロジー
- 2024/05/06
This repository contains an efficient implementation of Kolmogorov-Arnold Network (KAN). The original implementation of KAN is available here. The performance issue of the original implementation is mostly because it needs to expand all intermediate variables to perform the different activation functions. For a layer with in_features input and out_features output, the original implementation needs
x.com
- 2 users
- x.com
- 学び
- 2024/05/20