ディープラーニングの最新人気記事 2257件

1 - 40 件 / 2257件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ディープラーニングの検索結果1 - 40 件 / 2257件

AlphaFold 3 predicts the structure and interactions of all of life’s molecules
- 7 users
- blog.google
- テクノロジー
- 2024/05/09
世界初、AIモデルの再学習コストを大幅に削減可能な過去の学習過程を再利用する「学習転移」を実現～NTT版LLM「tsuzumi」など基盤モデルの更新・差し替えを容易に～ | ニュースリリース | NTT
- 28 users
- group.ntt
- テクノロジー
- 2024/05/07
◆深層学習において、過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術を実現しました。 ◆本技術は、深層学習におけるパラメータ空間の高い対称性を活用し、実際に学習することなく低コストな変換により数秒～数分程度で一定の精度を実現できるため、モデルの再学習コストを抜本的に削減できることを示しました。 ◆これにより、NTTが研究開発を進める大規模言語モデル（LLM）「tsuzumi（*1）」をはじめとした多様な基盤モデル（*2）の運用コスト削減・消費電力の削減や、多数のAIで議論することで多様な解の創出をめざしたAIコンステレーション（*3）の構想具現化など、次世代のAI技術開発に貢献します。日本電信電話株式会社（本社：東京都千代田区、代表取締役社長：島田　明、以下「NTT」）は、深層学習において過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術
- AI
- あとで読む
- techfeed
- 研究
1つの大きなLLM（大規模言語モデル）を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog
- 42 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2024/05/07
地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 LLM群雄割拠の時代昨今、ローカルGPUで駆動できるようなLLM（大規模言語モデル）もかなり増えてきて、キャッチコピー的に「ついに我が家にもGPT-4が！」とか言われるようになってまいりました。パラメータ規模で言えば70億～130億(7B-13B)パラメータ、700億(70B)パラメータ、1400億(140B)パラメータあたりのモデルが活発にリリースされているように見受けられます。大きなモデルをGPU寄せ集めしつつ遊びたい！しかしながら、コンシュマー向けのGPUにおいては、7B
- LLM
- GPU
- AI
- あとで読む
- techfeed
GitHub - Blealtan/efficient-kan: An efficient pure-PyTorch implementation of Kolmogorov-Arnold Network (KAN).
- 3 users
- github.com/Blealtan
- テクノロジー
- 2024/05/06
This repository contains an efficient implementation of Kolmogorov-Arnold Network (KAN). The original implementation of KAN is available here. The performance issue of the original implementation is mostly because it needs to expand all intermediate variables to perform the different activation functions. For a layer with in_features input and out_features output, the original implementation needs
AIの新星ニューラルネットワーク「KAN」とは？　LLMが“カンニング”して評価を盛ってた？　など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 177 users
- www.techno-edge.net
- テクノロジー
- 2024/05/06
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた？　AIカンニング問題を指摘した研究一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」高精度なニューラ
からあげさんってすごいなあポエム(松尾研LLMコミュニティ初心者セミナー)
- 38 users
- zenn.dev/yasuna
- テクノロジー
- 2024/05/04
はじめに今回始めて松尾研LLMコミュニティの初心者向け講座"Begginning LLM"の第一回に参加しました！１～２ヶ月に１回ほど開催される連続講座のようでChatGPTで遊んだことあるけど本格的にLLMのこと知りたい！けど何からはじめていいのか分からないという人にぴったりの講座だと感じました。この講座内容のすべては以下のYoutubeで公開されています。今回のセミナーの中では松尾研所属のからあげさんが２つのユニットのセミナーを行っていました。この記事ではからあげさんから学んだことを思ったままに書いていきます。からあげさんはここがすごいぞみなさんからあげさんのセミナーがとても気になって受講された方が多いんじゃないかな？と思いました。もちろん、わたしも松尾研LLMでのからあげさんのご活躍が見たくて申し込みました！！！約100枚の圧倒的スライド数まず、すごいボリュームの
- 学習
- AI
- あとで読む
- 転職
- 勉強
RAGの評価：評価の必要性と問題点 - Beatrust techBlog
- 18 users
- tech.beatrust.com
- テクノロジー
- 2024/05/02
本ブログはこんな人におすすめ RAG (Retrieval Augmented Generation)を使ったアプリケーションを開発しているけど評価に関心のある人 LLM (Large Language Model)やRAGのハルシネーションをどう評価するのかに関心のある人 Ragas (RAGの評価ライブラリ：Retrieval augmented generation assessment)の挙動に興味がある人こんにちは。私はBeatrustのML周辺のお手伝いをしている鈴木宏和と申します。今回はこれから3つのパートに分けて紹介させていただきますが、LLMの応用として特に注目を集めているRAG (Retrieval Augmented Generation)について、RAGの評価の必要性とアプローチ方法について考察しつつ、RAGに特化した評価ライブラリであるRagasの有用性に関する
- 仕事
- あとで読む
KAN: Kolmogorov-Arnold Networks
- 11 users
- arxiv.org
- テクノロジー
- 2024/05/01
Inspired by the Kolmogorov-Arnold representation theorem, we propose Kolmogorov-Arnold Networks (KANs) as promising alternatives to Multi-Layer Perceptrons (MLPs). While MLPs have fixed activation functions on nodes ("neurons"), KANs have learnable activation functions on edges ("weights"). KANs have no linear weights at all -- every weight parameter is replaced by a univariate function parametriz
- 機械学習
GitHub - KindXiaoming/pykan: Kolmogorov Arnold Networks
- 13 users
- github.com/KindXiaoming
- テクノロジー
- 2024/05/01
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- github
自己対戦で強化学習する三目並べ AI をPyTorchで実装 - Qiita
- 24 users
- qiita.com/ydclab_P002
- テクノロジー
- 2024/04/25
PyTorch の社内勉強会の題材にしたいと思い立ち、畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）を用いた自己対戦型強化学習の三目並べ AI を実装したので公開します。見通しの良いシンプルな実装を目指しました。結局、それなりのコード量になってしまいましたが。動作環境 Google Colaboratory の CPUランタイムにて動作を確認しました。概略おおまかな処理フローは次図の通りです。盤面情報を受け取った先攻方策と後攻方策は、○×を書き込む場所を返します。この先攻方策と後攻方策に AI を実装し自己対戦させます。盤面情報は、空白マスをゼロ、先攻 ○ を+1、後攻 × を-1とした形状 (H,W)=(3,3) の二次元配列とします。盤面座標は、場合により二次元座標と1次元に展開したフラット座標を使い分けます。三目並べの
- AI
- PyTorch
- python
- qiita
- あとで読む
AI分野での活用も増加している「GPU」の種類と選び方を学ぼう
- 10 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/04/25
1　GPUとは GPU（Graphics Processing Unit）は、PC内で画像処理などの特定のタスクを高速に処理することを目的とした専用の装置です。主に画像処理やAI（人工知能）、科学計算などの分野で活用されています。CPU（Central Processing Unit）が一般的な演算や制御を担当するのに対し、GPUは大量のデータを並行して処理することが得意で、これにより高速な演算処理を実現しています。もともとは画像処理を目的に誕生しましたが、近年では機械学習などAI関連分野での活用が増加しており、生成AIのブームを追い風に、世界的に需要が高まっています。 2　GPUとCPUの違い GPUとCPUには以下のような違いがあります。 2.1　設計思想と役割 CPUは一般的な演算や制御を担当するために設計されていて、プログラムの実行やOS（オペレーティングシステム）の管理などPC
Winnyの金子さんのED法について | やねうら王公式サイト
- 389 users
- yaneuraou.yaneu.com
- テクノロジー
- 2024/04/21
Winnyの金子勇さんが考案された機械学習アルゴリズムED法を再現して実装した人がいていま話題になっている。『Winny』の金子勇さんの失われたED法を求めて…いたら見つかりました https://qiita.com/kanekanekaneko/items/901ee2837401750dfdad いまから書くことは私の記憶頼りなので間違ってたらコメント欄で教えて欲しい。 1998年ごろだと思うのだが、私はWinnyの金子勇さんのホームページの熱心な読者だった。(ページも全部保存してたので私のHDDを漁れば出てくると思うが、すぐには出せない。) Winnyのβ版が発表されたのが2002年なのでそれよりはずいぶん前である。当時、金子さんはNekoFightという3D格闘ゲームを公開されていた。そのゲームには、自動的に対戦から学習するAIが搭載されていた。当時の金子さんのホームページの
- AI
- あとで読む
- algorithm
- 機械学習
- 人工知能
- winny
- 金子勇
- 技術
- 学習
- network
MLX で Llama 3 を試す｜npaka
- 8 users
- note.com/npaka
- テクノロジー
- 2024/04/21
「MLX」で「Llama 3」を試したので、まとめました。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 推論の実行「MLX」は、Appleが開発した新しい機械学習フレームワークで、「Apple Silicon」(M1/M2/M3など) を最大限に活用するように設計されています。推論の実行手順は、次のとおりです。 (1) Pythonの仮想環境の準備。今回は、「Python 3.10」の仮想環境を準備しました。 (2) パッケージのインストールと実行。今回は「mlx-community/Meta-Llama-3-8B-Instruct-4bit」のモデルを利用します。 pip install mlx-lm mlx_lm.generate --model mlx-community/Meta-Llama-3-8B-Instruct-4bit -
- Apple
- あとで読む
EDLA
- 10 users
- web.archive.org
- テクノロジー
- 2024/04/21
誤差拡散学習法のサンプルプログラム 99/7/12 公開 99/7/16 詳細追加 99/8/6 一部修正 99/8/19 論文追加 99/10/27 経過報告 ED法サンプルプログラム（UNIX汎用、tgz、4KB）階層型神経回路網（ニューラルネットワーク）の教師あり学習アルゴリズムである誤差拡散学習法（ED法）のサンプルプログラムです。比較のために用いたバックプロパゲーション法（ＢＰ法）のサンプルプログラムも示しておきます。慣性項ありBP法のサンプルプログラム（UNIX汎用、tgz、4KB）なお、これらのプログラムでは、階層型構造をリカレント型の一種とみなして計算しています。また、パラメータ入力の際には、単にリターンを押すとデフォルト値（括弧の中の値）が用いられるようになっていますので、実行の際にはリターンを連打すればＯＫです。また、X-Windowを用いてトータルエラーのグラ
GitHub - pytorch/torchtune: A Native-PyTorch Library for LLM Fine-tuning
- 4 users
- github.com/pytorch
- テクノロジー
- 2024/04/20
torchtune is a PyTorch-native library for easily authoring, fine-tuning and experimenting with LLMs. We're excited to announce our alpha release! torchtune provides: Native-PyTorch implementations of popular LLMs using composable and modular building blocks Easy-to-use and hackable training recipes for popular fine-tuning techniques (LoRA, QLoRA) - no trainers, no frameworks, just PyTorch! YAML co
- 機械学習
金子勇さんのED法を実装してMNISTを学習させてみた - Qiita
- 118 users
- qiita.com/pocokhc
- テクノロジー
- 2024/04/20
追記：続きを書きました。はじめに先日以下の記事が投稿され、その斬新な考え方に個人的ながら衝撃を受けました。内容をざっくり言うと、ニューラルネットワークの学習を現在の主流であるBP法（誤差逆伝播法）ではなく、ED法（誤差拡散法）という新しい学習手法を提案しているものです。もし記事の内容が本当ならニューラルネットワークの学習がO(1)でできてしまう事になり、まさしく革命が起きてしまいます。（結論からいうと速度面はそこまででもなかったです（それでも早くなる可能性あり））（ただこの新手法のポテンシャルは革命を起こす可能性は秘めているといっても過言ではありません） ED法に関してネットを探すとインターネットアーカイブに情報が少し残っていました。このページですがED法のサンプルプログラム（C言語）が残っており、このサンプルプログラムをベースにpythonで書き起こしたものが本記事となりま
継続事前学習による金融ドメイン特化LLMの構築の検証 - Preferred Networks Research & Development
- 34 users
- tech.preferred.jp
- テクノロジー
- 2024/04/17
この記事は、金融チームエンジニアの今城(@imos)と金融チームリサーチャーの平野(@_mhirano)による寄稿です。概要本稿では、ドメインに特化したLLMの構築の一環として、金融ドメイン特化のLLMの構築の検証を行いました。継続事前学習によるドメイン知識の獲得を模索し、特定のドメイン向けに専用のパラメータ数が多い高性能なLLMを提供を可能にすることを目指します。実験では、nekomata-14bとPFNで構築した金融に特化したデータセットを用いて、継続事前学習を実施しました。継続事前学習の結果として、金融ベンチマーク性能が向上することが確認できました。出力の差としては、Instruction Tuningを施していないため、大きな差は見られないものの、一定の差が見られるケースもありました。継続事前学習後のモデルは、https://huggingface.co/pfnet/n
torchtune: Easily fine-tune LLMs using PyTorch
- 4 users
- pytorch.org
- テクノロジー
- 2024/04/17
by Team PyTorch We’re pleased to announce the alpha release of torchtune, a PyTorch-native library for easily fine-tuning large language models. Staying true to PyTorch’s design principles, torchtune provides composable and modular building blocks along with easy-to-extend training recipes to fine-tune popular LLMs on a variety of consumer-grade and professional GPUs. torchtune supports the full f
- PyTorch
低価格FPGAでも文字認識AIの学習は可能なのか
- 1 user
- monoist.itmedia.co.jp
- テクノロジー
- 2024/04/16
コメントの1行目ですが、コメントアウトしたコードを削除しました。筆者は開発時に元のコードを残すためにコメントアウトします。ですが、記事を執筆する時点ではある程度ソースコードの行番号を確定したいので、このような措置をしました。コメントの2行目ですが学習済みデータを生成する際にノイズの混入を試みたのですが、執筆時までに想定した結果を得られなかったのでこのコードは取りあえずコメントアウトしています。コメントの3行目は、LEDマトリクスに5×5ドットの文字を映すための処理ですが、前回示したコードで5行を要していたのに対して、今回はそれを1行に書き換えました。また、これらのコメントでは触れてないのですが、推論結果に対して再度推論してみるモードを追加しました。これもコメントにはないのですが、入力文字をランダムに設定できるモードを用意しました。なお、リスト2に示す4行目以降のソースコード本文は、
3Blue1Brown - Visualizing Attention, a Transformer's Heart | Chapter 6, Deep Learning
- 6 users
- www.3blue1brown.com
- テクノロジー
- 2024/04/15
ThanksSpecial thanks to those below for supporting the original video behind this post, and to current patrons for funding ongoing projects. If you find these lessons valuable, consider joining. .chanceA ZookAaron BinnsAda CohenAdam CedroneAdam Dřínekaeroeng15Alan SteinAlbin EgasseAlex Alex HackmanAlexandru IrimieaAlexis OlsonAli YahyaAljoscha SchulzeAlon AmitAlvin KhaledAman KarunakaranAndrea Di
- Transformer
今こそはじめるJAX/Flax入門 Part 1
- 15 users
- zenn.dev/turing_motors
- テクノロジー
- 2024/04/15
1. はじめに 2012年から始まった深層学習の発展の過程で、さまざまな学習フレームワークが登場しました。中でもPyTorchとTensorflowは最も広く使われており、それぞれのフレームワークが支持されている背景には、柔軟性、拡張性、そして使いやすさがあります。一方で、これらのフレームワークはその機能を拡張し続けてきた結果として、全体として非常に巨大で複雑なライブラリになっています。そのため、独自に機能拡張を行いたいユーザーにとっては扱いづらく、性能的にもオーバーヘッドを感じさせることがあります。そこで新たに出てきたのが「JAX」とその関連ライブラリの組み合わせになります。2019年に登場して以降、特に海外の開発者に支持されてきました。近年注目されている大規模言語モデル（LLM）の分野においても、JAXによるモデルが公開されていることは珍しくなくなりつつあります。 PyTorch（
- 機械学習
- python
PyTorchやPythonなしの純粋なC言語を使用した大規模言語モデルトレーニングツール「llm.c」がリリースされる
- 31 users
- gigazine.net
- テクノロジー
- 2024/04/11
AIの本体と言える大規模言語モデル(LLM)のトレーニングはほとんどの場合PyTorchやPythonを使用して行われていますが、そうしたトレーニングを純粋なC言語のみで実装したツール「llm.c」が登場しました。まだ最適化が行われておらず従来の手法に速度面では敗北していますが、GPT-2のトレーニングを行う実装を約1000行のクリーンなコードで行えています。 GitHub - karpathy/llm.c: LLM training in simple, raw C/CUDA https://github.com/karpathy/llm.c 作者のアンドレイ・カルパシー氏はOpenAIの創設グループの一員で、テスラのAIディレクターだった事もある人物です。 llm.cを使用することで、245MBの容量を持つPyTorchや107MBの容量を持つcPythonを使用せずに大規模言語モデル
- LLM
- C
- AI
- 人工知能
- github
- Python
- programming
- あとで読む
Cloudflare、AI推論のデプロイプラットフォーム「Workers AI」の正式リリースなどを発表
- 1 user
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/04/08
Cloudflare、AI推論のデプロイプラットフォーム「Workers AI」の正式リリースなどを発表：AIモデルを「Hugging Face」からワンクリックでデプロイ可能に Cloudflareは、AI推論を大規模にデプロイするためのプラットフォームである「Workers AI」の一般提供開始や、Hugging Faceとの提携拡大によって、ワンクリックでAIモデルを「Hugging Face」プラットフォームからグローバルにデプロイできるようになったことなどを発表した。 CDN（Content Delivery Network）やインターネットセキュリティサービスなどを手掛けるCloudflareは2024年4月2日（米国時間）、AI（人工知能）推論を大規模にデプロイするためのプラットフォームである「Workers AI」の一般提供開始や、Hugging Faceとの提携拡大によっ
- 人工知能
- 機械学習
GitHub - facebookresearch/schedule_free: Schedule-Free Optimization in PyTorch
- 6 users
- github.com/facebookresearch
- テクノロジー
- 2024/04/06
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Introducing improvements to the fine-tuning API and expanding our custom models program
- 2 users
- openai.com
- テクノロジー
- 2024/04/05
BlogIntroducing improvements to the fine-tuning API and expanding our custom models program We’re adding new features to help developers have more control over fine-tuning and announcing new ways to build custom models with OpenAI. There are a variety of techniques that developers can use to increase model performance in an effort to reduce latency, improve accuracy, and reduce costs. Whether it’s
- OpenAI
クラスメソッドデータアナリティクス通信(機械学習編) – 2024年4月号 | DevelopersIO
- 2 users
- dev.classmethod.jp
- テクノロジー
- 2024/04/04
2024年3月分のAWSおよびGoogle Cloudの機械学習関連サービスのアップデート情報をお届けします。データアナリティクス事業本部インテグレーション部機械学習チームの鈴木です。クラスメソッドデータアナリティクス通信(機械学習編) の2024年4月号です。2024年3月分のアップデート情報をお届けできればと思います。はじめに AWSでは、Amazon SageMaker Canvasのホームページ刷新やテーブルデータに対する価格変更があり、さらに使いやすくなりました。Amazon BedrockではClaude 3 SonnetモデルおよびClaude 3 Haikuモデルが利用可能になったことも印象的でした。 Google Cloudでは、特にBigQueryでGeminiを利用した処理への対応が着々と進んでいました。それでは各々のアップデートを振り返って行ければと思
- 機械学習
- AWS
- Google
Goでゼロから始めるDeep Learning
- 1 user
- zenn.dev/hamao
- テクノロジー
- 2024/04/03
Goで"ゼロから作るDeep Leaning"を実装して, そのメモをまとめていきます学んだことや詰まった点, その解決法などを書いていこうと思います
- あとで読む
10bクラスの大規模言語モデルが､ファインチューニングを経てタスクを解けるようになるメカニズムを探るメモ｜Kan Hatakeyama
- 8 users
- note.com/kan_hatakeyama
- テクノロジー
- 2024/04/01
はじめに最近は大規模言語モデルのファインチューニングにハマっています｡ 10bクラスの言語モデルが､どのようなメカニズムを通してユーザーの質問に回答できるようになるかについて､調べています｡最近の検討で生じた仮説は､「10bクラスのモデルは､実は質問文を殆ど理解できていない」というものです｡本記事ではどのようなデータを学習したときに､llm-jp-evalという評価セットに含まれるJCommonsenseQAというタスクを解けるようになるか､果たして､10bクラスのモデルは何を「理解」している/いないのか､そして､指示を理解できるようになるための必要な訓練量について､調べて行きたいと思います｡コードはこちら ※ これは正確な学術的検証ではありませんので､ご了承ください｡きちっとやってくれる方や､良い参考文献をご存知の方がいたら､教えていただけると､大変助かります｡今回のタスクJCo
https://www.uber.com/en-DE/blog/scaling-ai-ml-infrastructure-at-uber/
- 5 users
- www.uber.com
- 暮らし
- 2024/04/01
- MLOps
LLMの現在 - Speaker Deck
- 1035 users
- speakerdeck.com/pfn
- テクノロジー
- 2024/03/29
今のLLMを取り巻く状況について紹介します。
- AI
- LLM
- あとで読む
- 機械学習
- 人工知能
- ChatGPT
- 資料
- 文化
- 生成AI
- IT
中学生でもわかる深層学習
- 561 users
- speakerdeck.com/e869120
- テクノロジー
- 2024/03/29
第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-)
- 機械学習
- あとで読む
- AI
- deeplearning
- 勉強
- 学習
- 人工知能
- 言語
- 深層学習
- study
新たに「Llama 2 70B」と「Stable Diffusion XL」が追加されたAIベンチマークテスト「MLPerf Inference v4.0」の結果が発表される
- 12 users
- gigazine.net
- テクノロジー
- 2024/03/28
ニューラルネットワークのパフォーマンス評価を実施する業界コンソーシアムのMLCommonsは、さまざまなシナリオでハードウェアのAI処理性能を測定できるベンチマークテスト「MLPerf Inference」を設計しています。最新の「MLPerf Inference v4.0」では、パフォーマンス指標として新たにMetaの大規模言語モデル「Llama 2 70B」と画像生成AIの「Stable Diffusion XL」が追加されました。 New MLPerf Inference Benchmark Results Highlight The Rapid Growth of Generative AI Models - MLCommons https://mlcommons.org/2024/03/mlperf-inference-v4/ Nvidia Tops Llama 2, Stabl
Sakana AI
- 568 users
- sakana.ai
- テクノロジー
- 2024/03/21
概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes （モデルマージの進化的最適化）」を公開しました。このリリースの要点は以下の通りです。進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合（マージ）して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既
- AI
- あとで読む
- LLM
- アルゴリズム
- 人工知能
- 開発
- 日本語
- 機械学習
- deeplearning
- 学び
Quanto: a pytorch quantization toolkit
- 5 users
- huggingface.co
- テクノロジー
- 2024/03/20
Quantization is a technique to reduce the computational and memory costs of evaluating Deep Learning Models by representing their weights and activations with low-precision data types like 8-bit integer (int8) instead of the usual 32-bit floating point (float32). Reducing the number of bits means the resulting model requires less memory storage, which is crucial for deploying Large Language Models
- pytorch
Announcing Optuna 3.6 - Preferred Networks Research & Development
- 3 users
- tech.preferred.jp
- テクノロジー
- 2024/03/19
はじめにブラックボックス最適化フレームワークOptunaの最新バージョンであるv3.6をリリースしました。今回のリリースには、様々な新機能やリファクタリング、バグ修正が含まれています。このブログではv3.6のハイライトと多くの機能改善についてお伝えします。 TL;DR Wilcoxon Pruner、軽量なガウス過程ベースのSampler、 PED-ANOVA重要度評価器等の様々な新しいアルゴリズムのサポート FrozenTrialの検証ロジックの厳密化、 Dashboardのリファクタリング、 Integrationの移行などOptunaの品質に関わる様々な改善を実施 Wilcoxon Pruner Optuna v3.5以前では、Prunerは典型的な機械学習のハイパーパラメータ最適化を想定して作られていました。そのような問題では、学習曲線を見て悪いパラメータを早期終了することができ
- Python
Apple・Google・Microsoft・Mozillaが協力して開発するベンチマークツール「Speedometer 3.0」が登場
- 26 users
- gigazine.net
- テクノロジー
- 2024/03/12
Apple、Google、Microsoft、Mozillaといったテクノロジー大手が協力して開発するベンチマークツール「Speedometer 3.0」が発表されました。 BrowserBench.org — Announcements https://browserbench.org/announcements/speedometer3/ Improving Performance in Firefox and Across the Web with Speedometer 3 - Mozilla Hacks - the Web developer blog https://hacks.mozilla.org/2024/03/improving-performance-in-firefox-and-across-the-web-with-speedometer-3/ Speedomet
- ツール
- アプリ
- development
- 開発
- neta
ドナルド・トランプが「TikTokを禁止すると国民の敵Facebookに力を与えてしまう」と発言
- 56 users
- gigazine.net
- テクノロジー
- 2024/03/12
共和党大統領予備候補のドナルド・トランプ氏が、中国系ソーシャルメディアアプリのTikTokをアメリカで全面的に禁止しようとする動きについて懸念を表明しました。これは、議会が可決すれば禁止法案に署名すると述べたジョー・バイデン大統領の見解とは対照的です。 Trump says TikTok ban would empower Meta, slams Facebook https://www.cnbc.com/2024/03/11/trump-says-a-tiktok-ban-would-empower-meta-slams-facebook-as-enemy-of-the-people.html TikTok ban: House vote set for Wednesday morning https://www.axios.com/2024/03/11/tiktok-ban-congr
- トランプ
- アメリカ
- 中国
- 未分類
- gigazine
- 米国
- USA
- world
自作キーボードの聖地、遊舎工房に行ってみたら、そこは沼だった（小寺信良） | テクノエッジ TechnoEdge
- 108 users
- www.techno-edge.net
- テクノロジー
- 2024/03/11
18年間テレビ番組制作者を務めたのち、文筆家として独立。家電から放送機器まで執筆・評論活動を行なう傍ら、子供の教育と保護者活動の合理化・IT化に取り組む。一般社団法人「インターネットユーザー協会」代表理事。もういい加減にしろよと読者から怒られかねないのだが、まだまだキーボードの話である。 KeychronのK11 Proを購入し、散々いじくり回していたわけだが、まあさすがに自作までは時間ないし、キーボード改造もここまでかなと思っていた。ところが先日、PFUのHHKB Studioのお話を聞く機会があり、1995年当時の秋葉原の話などが出て、懐かしく思い出した。この記事はまもなくITmedia MONOistに掲載されると思うので、お楽しみにしていただきたい。そのインタビューの中で、秋葉原のキーボード専門店「遊舎工房」の話が出て、そういえばまだ一度も行ったことないなと気づいた。だいたいこ
「米国がAI市場も支配する」という構図を阻むフランス新興企業の挑戦 | パリ拠点の「ミストラルAI」がシリコンバレーの巨人に挑む
- 23 users
- courrier.jp
- テクノロジー
- 2024/03/11
昨年の今ごろ、アーサー・メンシュ氏は30歳で、まだ米グーグルの傘下部門に勤めていた。当時は人工知能（AI）がSF以上のものとして人々の意識に定着し始めたころだった。それ以降、人間のような会話だけでなく推論さえもできる生成AIは、ここ数十年で最も話題となった技術的ブレークスルー（画期的発明）となった。そして、メンシュ氏がグーグル退職後に立ち上げたスタートアップ企業「ミストラルAI」は、設立から9ヵ月で評価額が20億ドル（約3000億円）強に達している。こうした変化の速さは、高度なAIシステムの構築および商業化に向けた活動を取り巻く熱狂──そして恐怖──を反映している。
- AI
- あとで読む
FPGAに学習済みニューラルネットワークを実装して推論を実行する
- 2 users
- monoist.itmedia.co.jp
- テクノロジー
- 2024/03/11
FPGAに学習済みニューラルネットワークを実装して推論を実行する：FPGAにニューラルネットワークを実装する（3）（1/3 ページ） FPGAにニューラルネットワークを実装するプロセスを学ぶ本連載。第3回では、PC上で生成した学習済みニューラルネットワークをFPGAに実装して推論を実行する。はじめに前回は、ニューラルネットワークの基本であるホップフィールドネットワークについて押さえつつPC上で学習済みデータを生成しました。今回はいよいよ、この学習済みデータをFPGAに渡して推論を行わせてみます。 ⇒連載「FPGAにニューラルネットワークを実装する」バックナンバーはこちら学習済みデータの生成今回使用する、学習済みデータをFPGAに渡すためのプログラム「makelinks.c」は以下のリポジトリから参照できます。リストに示す行番号は、執筆時にリポジトリにアップロードした時のもので、その