ディープラーニングの人気記事 174件

1 - 40 件 / 174件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ディープラーニングの検索結果1 - 40 件 / 174件

20230614_「ChatGPTについて調べてくれ」と社長から特命を受けた人のためのChatGPT概論(40min版)
- 1556 users
- speakerdeck.com/doradora09
- テクノロジー
- 2023/06/15
https://forest.f2ff.jp/introduction/7866?project_id=20230601
- ChatGPT
- あとで読む
- AI
- 機械学習
- 人工知能
- プログラミング
- pdf
- GPT
- ソフトウェア
- まとめ
LLMの現在 - Speaker Deck
- 1029 users
- speakerdeck.com/pfn
- テクノロジー
- 2024/03/29
今のLLMを取り巻く状況について紹介します。
- LLM
- AI
- あとで読む
- 機械学習
- 人工知能
- ChatGPT
- 文化
- 資料
- 生成AI
- IT
Bard が日本語に対応
- 642 users
- blog.google
- テクノロジー
- 2023/05/11
Bard は、ジェネレーティブ AI を活用してユーザーをサポートする Google の試験運用中のサービスです。旅行プランの案を出したり、ブログ記事の構成案を作成したりと、英語での公開から 2 か月弱の間に、すでに多くのユーザーに様々な方法でお使いいただいています。そして、本日より Bard が日本語でも利用できるようになりました。「おいしい卵焼きを作るためのコツを教えて」や「夏休みの自由研究のアイデアを出して」など、創造性と生産性を高めるパートナーとして、 bard.google.com から、Bard をぜひお試しください。 Bard とは Bard は、Google の大規模言語モデル（ LLM : Large Language Model ）である PaLM 2 を利用しています。LLM は言語のパターンを拾い上げること、それを使って文章の中で次に来る確率の高い単語を予測する
- AI
- google
- あとで読む
- Bard
- 人工知能
- ChatGPT
- webサービス
- LLM
- 日本語
- 文章生成AI
エンジニア・データ分析職の方々にお薦めしたい、LLM時代に不可欠な教養が身に付くテキスト3選 - 渋谷駅前で働くデータサイエンティストのブログ
- 589 users
- tjo.hatenablog.com
- テクノロジー
- 2023/07/02
（『IT Text 自然語処理の基礎』より） 3ヶ月ほど前に空前のLLMブームについて概観する記事を書きましたが、それ以降も世間のLLMに対する狂騒ぶりは収まるどころかますます拍車がかかるという有様で、あまつさえ僕自身の仕事における日常業務にもじわじわと影響が及びつつあり、今後も良きにつけ悪しきにつけLLMと共生し続ける必要がありそうだと感じている今日この頃です。そんな猫も杓子もLLMに群がるが如き空前のブームを受けて、エンジニアやデータ分析職の方々の中には「LLMに興味はあるんだけど世の中にあまりにも多くのLLM関連コンテンツが溢れ返っていて何から手をつけたら良いのか分からない」という向きもあるように見受けられます。そこで、僕も断じてLLM以下生成AIの専門家などではないのですが、個人的に「このテキストを読めばLLM時代を生き抜くことが出来そうだ」と感じた書籍を、全くの独断と偏見で3冊
- LLM
- あとで読む
- 機械学習
- 学習
- エンジニア
- AI
- 自然言語処理
- データ
- 本
- 勉強
控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
- 570 users
- ascii.jp
- テクノロジー
- 2024/02/16
OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com
- AI
- あとで読む
- 動画
- OpenAI
- 人工知能
- webサービス
- これはすごい
- プロンプト
- 技術
- 映像
Sakana AI
- 568 users
- sakana.ai
- テクノロジー
- 2024/03/21
概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes （モデルマージの進化的最適化）」を公開しました。このリリースの要点は以下の通りです。進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合（マージ）して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既
- AI
- あとで読む
- LLM
- アルゴリズム
- 人工知能
- 開発
- 日本語
- 機械学習
- deeplearning
- 学び
中学生でもわかる深層学習
- 559 users
- speakerdeck.com/e869120
- テクノロジー
- 2024/03/29
第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-)
- 機械学習
- あとで読む
- AI
- deeplearning
- 勉強
- 学習
- 人工知能
- 言語
- 深層学習
- study
AIはどのような仕事ができるようになったのか？ChatGPTで変わる「優秀な人材」
- 547 users
- tokoroten.medium.com
- テクノロジー
- 2023/08/17
この図はざっくりと3つの領域に分かれます。まず左下が従来のプログラミングの領域です。これは簡単に言うと「プログラムは間違ってはいけない定形な仕事を奪う」ということです。次にその上の士業が責任を取る領域です。これは「責任」を取る人がいないと成立しない仕事です。ミスが発生した際に罰則を与えるという形で、ミスの発生を防いでいます。最後に右側のホワイトカラーの仕事の領域です。ホワイトカラーの仕事は入出力が不定形であり、作業フローも非定型であったりします。そのため、多少のミスはあっても仕方ないという前提の上で仕事が行われています。機械学習がビジネスに組み込まれるにつれ、ホワイトカラーの仕事領域はそれらによって少しずつ代替されつつあります。その図がこちらになります。ホワイトカラーの担っていた領域は、表データの機械学習（重回帰や、Lasso回帰、SVM、RandomForest、LightGBMなど
- AI
- ChatGPT
- あとで読む
- 仕事
- LLM
- 人工知能
- 機械学習
- 人材
- 学習
- work
画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)
- 512 users
- ascii.jp
- テクノロジー
- 2024/03/11
2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について（素案）」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント（パブコメ）」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について（素案）令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。文化庁文化審議会著作権分科会法制度小委員会（第7回）パブコメへの反応は「素案の内容周知」発表物から議論を集めたのが発表資料に「パブコメの結果」が追加
- AI
- 著作権
- あとで読む
- 人工知能
- copyright
- law
- 画像生成
- 画像
- イラスト
- 議論
サイバーエージェント、最大68億パラメータの日本語LLM（大規模言語モデル）を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―
- 451 users
- www.cyberagent.co.jp
- テクノロジー
- 2023/05/17
株式会社サイバーエージェント（本社：東京都渋谷区、代表取締役：藤田晋、東証プライム市場：証券コード4751）は、最大68億パラメータの日本語LLM（Large Language Model、大規模言語モデル）を一般公開したことをお知らせいたします。近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および日本文化に強いLLMは少ない状況です。 ■最大68億パラメータの日本語LLM（大規模言語モデル）の公開についてこうした背景のもと、当社は日本語LLMの開発に取り組んでおり、このたび一部モデルをHugging Face Hubにて公開いたしました。公開されたモデルはオープンな日本語データ※2で学習したもので
- AI
- あとで読む
- LLM
- 日本語
- ChatGPT
- 学習
- 開発
- 人工知能
- 機械学習
- サイバーエージェント
Winnyの金子さんのED法について | やねうら王公式サイト
- 387 users
- yaneuraou.yaneu.com
- テクノロジー
- 2024/04/21
Winnyの金子勇さんが考案された機械学習アルゴリズムED法を再現して実装した人がいていま話題になっている。『Winny』の金子勇さんの失われたED法を求めて…いたら見つかりました https://qiita.com/kanekanekaneko/items/901ee2837401750dfdad いまから書くことは私の記憶頼りなので間違ってたらコメント欄で教えて欲しい。 1998年ごろだと思うのだが、私はWinnyの金子勇さんのホームページの熱心な読者だった。(ページも全部保存してたので私のHDDを漁れば出てくると思うが、すぐには出せない。) Winnyのβ版が発表されたのが2002年なのでそれよりはずいぶん前である。当時、金子さんはNekoFightという3D格闘ゲームを公開されていた。そのゲームには、自動的に対戦から学習するAIが搭載されていた。当時の金子さんのホームページの
- AI
- あとで読む
- algorithm
- 機械学習
- 人工知能
- winny
- 金子勇
- 技術
- 学習
- network
LLMを理解する一歩として「ゼロから作るDeep Learning」をやった - $shibayu36->blog;
- 338 users
- blog.shibayu36.org
- テクノロジー
- 2023/05/23
LLM、GPT界隈を追いかけていて、GPTの仕組みと限界についての考察（2.1） - conceptualizationという記事を見かけた。これを見たとき、「どういうことか全然理解できない」という気持ちになった。また、その他LLMの解説記事を理解できないことが多く、自分の機械学習知識不足が明確になった。理解できなかったことは悔しいし、LLMやChatGPTをうまく使いこなすには最低限どのような原理で動いているか理解したいと感じた。そこで一歩目として「ゼロから作るDeep Learning」を完走した。ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者:斎藤康毅オライリージャパンAmazon 知識なしからはじめたので時間はかかったが、次のように進めていった。自分もコードを写経しながら読むレポジトリは https://github.co
OpenAI Cookbook
- 312 users
- cookbook.openai.com
- テクノロジー
- 2023/09/23
Processing and narrating a video with GPT's visual capabilities and the TTS API
- ChatGPT
- AI
- あとで読む
- LLM
- OpenAI
- GPT
- 学習
- Python
- Deep Learning
- プログラミング
日本最強ユニコーンPreferred Networks、損失30億円超第9期決算 | 自動運転ラボ
- 275 users
- jidounten-lab.com
- テクノロジー
- 2023/10/07
出典：官報（※クリックorタップすると拡大できます）日本を代表するユニコーン企業で、自動運転関連技術の開発も手掛けるAI（人工知能）開発企業の株式会社Preferred Networks（本社：東京都千代田区／代表取締役CEO：西川徹）。同社の第9期決算公告（2022年2月〜2023年1月）が、このほど官報に掲載された。第9期は売上高が76億5,500万円、当期純損失は30億6,600万円であった。これと同じタイミングで、同社は新設分割により、生成AI事業に関する新子会社「Preferred Elements」を2023年11月1日に設立することを発表した。2021年11月には、自律移動ロボット事業を手掛ける「Preferred Robotics」も新設分割により設立している。過去の新設分割の経緯があるため、同社の決算を過去の決算と単純に比較はしにくいが、参考のために記載すると、第7
- ai
- あとで読む
- 技術
- 企業
- 人工知能
- 日本
- 開発
- 機械学習
- 深層学習
「英語は新しいプログラミング言語であり、生成的AIは新しいコンパイラだ」。英語対応のためのSDK「English SDK for Apache Spark」をデータブリックスが発表
- 231 users
- www.publickey1.jp
- テクノロジー
- 2023/07/04
「英語は新しいプログラミング言語であり、生成的AIは新しいコンパイラだ」。英語対応のためのSDK「English SDK for Apache Spark」をデータブリックスが発表 Apache Sparkなどの開発で知られるデータブリックス社は、同社が主催したイベント「DATA+AI Summit 2023 by Databricks」で、英語をApache Sparkの問い合わせ言語にできるSDK「English SDK for Apache Spark」を発表しました。英語は新しいプログラミング言語である Databricks共同創業者兼チーフアーキテクト Reynold Xin氏。英語は新しいプログラミング言語であり、生成的AIは新しいコンパイラであり、Pythonは新しいバイトコードだ。これが何を意味するのか。多くの方々がChatGPTを使ってSparkの問い合わせコードを
【書評】Pythonによる時系列予測 | DevelopersIO
- 217 users
- dev.classmethod.jp
- テクノロジー
- 2024/01/01
こんちには。データアナリティクス事業本部機械学習チームの中村(nokomoro3)です。冬休みの個人的課題図書(自習)として「Pythonによる時系列予測」を読み終えましたので、感想と振り返りを書いておこうと思います。書籍情報以下の書籍になります。 Pythonによる時系列予測 | マイナビブックス発売 : 2023年10月翻訳本であり原著は以下となります Time Series Forecasting in Python 発売 : 2022年08月概要概要として本書に記載されていることと、記載されてないことを紹介します。記載されていること（感想含む）記載されていることは以下のようになっています。時系列タスクの説明トレンド、季節性、残差という3成分に分けられることの説明ランダムウォークという解けない問題の定義統計モデル MA、AR、ARMA、SARIMA、SA
オープンなLLMをDockerで動かす
- 214 users
- zenn.dev/karaage0703
- テクノロジー
- 2023/05/17
次々と発表されるオープンな日本語大規模モデルどうなっているの？？という感じですよね。我らがnpakaさんは、さっそくGoogle Colabで動かしていらっしゃいます。ただ、Google Colabだと毎回モデルのダウンロードが大変なので、ローカルでDocker使って手軽に動かせるといいな、ということでやってみました。以下GitHubのリポジトリにDockerfileとサンプルプログラムをおいています。チャットっぽいことをできるようにしています。上記で、サイバーエージェントとリンナのLLMが両方動きます。使用環境前提となる環境です。使用しているPCのスペックは以下です。項目内容
- docker
- AI
- LLM
- あとで読む
- 機械学習
- ChatGPT
- 人工知能
- gpu
- オープンソース
ChatGPTに渡す文章の適切な区切り線について検証した記事｜Clirea
- 203 users
- note.com/clirea
- テクノロジー
- 2023/09/04
はじめに大規模言語モデルであるChatGPTに文章を渡す際、適切な区切り線の使用は、情報の正確な伝達や解釈に大いに役立ちます。この記事では、区切り線に適切なものを検証します。区切り線とは？使い方区切り線は文章を区切る時に使用する文字列のことです。例えば下記のようなものです。また、使い方をまとめた記事もあるので参考にしてください。 def test() a = "a" b = "b" c = a + b print(c) ================================　←これが区切り線上記のコードについて教えてください結論先に結論を言うと、4個～16個連続した「-」か「=」もしくは8の倍数の「-」か「=」が区切り線としてはベストでした。 ---- ---------------- -------------------------------- ==== ==
- ChatGPT
- あとで読む
- AI
- GPT
- 文章
- markdown
- 機械学習
- プログラミング
- 人工知能
［速報］Google、責任あるAIを実現するとして、画像にウォーターマークとメタデータの埋め込みを進めると発表。Google I/O 2023
- 200 users
- www.publickey1.jp
- テクノロジー
- 2023/05/11
Googleは5月10日（日本時間5月11日未明）、米カリフォルニア州マウンテンビューで開催中のイベント「Google I/O 2023」で、最新のAI基盤モデル「PaLM 2」を発表しました。 PaLM 2は規模の異なるGecko、Otter、Bison、Unicornの4種類のモデルが用意され、いちばん小さな規模のGeckoはモバイルデバイスでの利用も可能で、オフラインでも動作可能。
- AI
- google
- あとで読む
- 画像
- 画像生成
- 人工知能
- IT
ありがとうディープラーニングおじさん - karaage. [からあげ]
- 174 users
- karaage.hatenadiary.jp
- 政治と経済
- 2023/07/06
最初にその後のディープラーニングおじさんの話です。シンデレラの続きみたいなものなので、読まないほうが夢を壊さないかもしれませんということだけ、ここで注意喚起いたします。この記事、ずっと下書きに入ったまま公開しようか迷っていたのですが、ディープラーニングおじさんのご家族にもご了承いただき、公開することにしました。そこまで拡散は希望していないのですが、特に制限するつもりはありません（できません）。ディープラーニングおじさんとの出会い振り返りディープラーニングおじさん（以下Dおじさん）とは、今だに私のブログでトップのPV数を誇る記事の主役です。上記記事ではあっさり書いていますので、もうちょっと解像度高く思い出しながら振り返ってみたいと思います。そもそもの出会いは、社内で異動した後、たまたま隣の課にDおじさんがいたことからはじまります。Dおじさんは、私より一回り以上上の年齢（50代後半
- AI
- あとで読む
- 仕事
- 人生
【速報】次世代の外観検査！？プロンプトを駆使した異常検知 - Qiita
- 168 users
- qiita.com/shinmura0
- テクノロジー
- 2023/05/24
先日、革新的な画像の異常検知（SAA）が出てきました。何やら革命的な臭いがする... SAMを使った異常検知手法https://t.co/wmwFcbULdq コードはこちらhttps://t.co/3npK3FhnEz pic.twitter.com/JDs30bEJyQ — shinmura0 (@shinmura0) May 22, 2023 本稿では、操作手順 & 触ってみた感想をご報告します。特長本題に入る前に、どこら辺が革新的なのかざっくり説明します。 ※　SAAの詳細は論文をご参照ください。学習データは不要通常、学習（正常）データを数百枚用意しますが、この手法では正常データを必要としません。ドメイン知識を導入できる予め、異常の傾向をプロンプトに入れることにより、異常の特徴をモデルに教えることができます。二点目が特に大きく、今までの異常検知では、積極的に異常の傾
- AI
- あとで読む
- 画像
- アルゴリズム
- 異常検知
- deeplearning
- qiita
- image
- ソフトウェア
- LLM
Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
- 167 users
- zenn.dev/aics
- テクノロジー
- 2023/06/29
TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよ VRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよマイナス適用によって、概念を削除するだけでなく強調することもできたよ一度でも画像生成 AI に触ったことがあると、より楽しんで読めると思います。論文とかどうでもいいから学習方法知りたい！という方は実際に学習してみるへどうぞ！今回作成したものコード: モデルなど: 前提 Stable Diffusion とは、Stability AI らが公開したオープンソースの画像生成 AI であり、テキストによる指示で様々な画像を生成することができる。本来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の
「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード＆デモが公開される
- 165 users
- gigazine.net
- テクノロジー
- 2023/06/27
AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。 GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023) https://github.com/XingangPan/DragGAN Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold https://vcai.mpi-inf.mpg.
- AI
- 人工知能
- あとで読む
- 画像処理
- 写真編集
- 画像
- 機械学習
- techfeed
ニューラルネットワークの中身を分割してAIの動作を分析・制御する試みが成功、ニューロン単位ではなく「特徴」単位にまとめるのがポイント
- 161 users
- gigazine.net
- テクノロジー
- 2023/10/10
GoogleやAmazonが投資するAIスタートアップのAnthropicの研究チームが、ニューラルネットワークがどのように言語や画像を扱っているのかを解き明かす研究において、個々のニューロンを「特徴」と呼ばれる単位にまとめることでニューラルネットワークの中身を解釈しやすくなるという研究結果を発表しました。 Anthropic \ Decomposing Language Models Into Understandable Components https://www.anthropic.com/index/decomposing-language-models-into-understandable-components 大規模言語モデルは多数のニューロンが接続されたニューラルネットワークで、ルールに基づいてプログラミングされるのではなく、多数のデータを元にトレーニングを行うことでタス
- AI
- 人工知能
- あとで読む
- techfeed
- LLM
- Transformer
- 脳
- 機械学習
機械学習と自動微分 (2023)
- 157 users
- speakerdeck.com/itakigawa
- テクノロジー
- 2023/09/27
「最適化法」第15回(ゲストトーク), 2023年1月20日, 同志社大学.
- 機械学習
- あとで読む
- python
- ディープラーニング
- 学習
- 統計解析
- math
- 数学
- 勉強
- AI
ChatGPTを支えた高品質AI作成手法「RLHF」の中身はこんな感じ、面倒なデータ入力・整理はオープンソースでセルフホスト可能なプラットフォーム「Argilla」が便利
- 149 users
- gigazine.net
- テクノロジー
- 2023/06/10
RLHFとは「人間の評価による強化学習」のことで、大規模言語モデルをChatGPTなどの実用レベルに至る品質にまで高めた実績のある手法です。RLHFでは教師データを作成したり、大規模言語モデルの回答を評価したりする際に人間がデータを入力する必要があり、特に複数人で作業する場合にデータの管理が大変になってしまうものですが、そうしたRLHF用データの入力や管理を行ってくれるプラットフォームが「Argilla」です。 Bringing LLM Fine-Tuning and RLHF to Everyone https://argilla.io/blog/argilla-for-llms/ 大規模言語モデルを作成する時の手順を示したのが下の図です。まず大量のテキストを用いて事前学習を行います。こうして作成されたモデルが事前学習済みモデルで、GPTやPaLM、LLaMAなどのモデルがこのカテゴリに
- ChatGPT
- あとで読む
- AI
- 人工知能
- 機械学習
- 文章生成AI
- 学習
- LLM
「一般人おじさんでも初音ミクになって踊れる可能性と未来がある」の動画が凄い技術なんだけど男に戻る瞬間がサブリミナル
- 145 users
- togetter.com
- テクノロジー
- 2023/06/27
バーチャル美少女おじさん珍味 @hanageshinnkenn 美少女になりたいおじさん。ダンスとアニメが好きです。noteには二次元美少女になる方法やAIについて書いてます。最後のゴーヤ祭 / 思春期テロリスト https://t.co/egEMyRn6Yc
- AI
- togetter
- 動画
- 技術
- あとで読む
- 初音ミク
LLM Visualization
- 130 users
- bbycroft.net
- テクノロジー
- 2023/12/03
A 3D animated visualization of an LLM with a walkthrough.
【AI動画生成】Animate Anyone 論文解説
- 119 users
- zenn.dev/mattyamonaca
- テクノロジー
- 2023/11/30
はじめに 11月も終わり、今年も残るところあと一か月となりました。今年ももう終わるから今年中に成果を上げとけ！と言わんばかりに最近は新技術の登場が多いです。今回取り上げるのも11月最後の大砲として出てきた新技術、その名もAnimate Anyone Animate Anyoneとはなんぞや文字で説明するより見たほうが早い凄くざっくり説明すると、一枚の絵と動きをボーン動画として入力すると、入力した絵がボーン動画と同じ動きをしてくれるよ！というもの。似たようなものは今までもReferenceOnly × openpose × animatediffとかで出来ましたが、特筆すべきはその精度。動画生成の大敵であるちらつきは一切なく、入力画像にかなり忠実な動画を生成しています。さてこの技術、動画生成にずっと注目している自分としてはいますぐにでも弄り倒したいのですが、残念ながらコードとモ
- AI
- あとで読む
- 動画
- StableDiffusion
- 論文
- 人工知能
- 画像
金子勇さんのED法を実装してMNISTを学習させてみた - Qiita
- 112 users
- qiita.com/pocokhc
- テクノロジー
- 2024/04/20
追記：続きを書きました。はじめに先日以下の記事が投稿され、その斬新な考え方に個人的ながら衝撃を受けました。内容をざっくり言うと、ニューラルネットワークの学習を現在の主流であるBP法（誤差逆伝播法）ではなく、ED法（誤差拡散法）という新しい学習手法を提案しているものです。もし記事の内容が本当ならニューラルネットワークの学習がO(1)でできてしまう事になり、まさしく革命が起きてしまいます。（結論からいうと速度面はそこまででもなかったです（それでも早くなる可能性あり））（ただこの新手法のポテンシャルは革命を起こす可能性は秘めているといっても過言ではありません） ED法に関してネットを探すとインターネットアーカイブに情報が少し残っていました。このページですがED法のサンプルプログラム（C言語）が残っており、このサンプルプログラムをベースにpythonで書き起こしたものが本記事となりま
BitNetから始める量子化入門
- 110 users
- zenn.dev/minux302
- テクノロジー
- 2024/03/03
はじめに BitNet、最近話題になっていますね。そもそも量子化って何？という方もいると思うので、この記事は DeepLearning の量子化から入り、その上で BitNet の触りについて見ていこうと思います。色々とわかってないことがあり、誤読してそうなところはそう書いてるのでご了承ください。図を作るのは面倒だったので、様々な偉大な先人様方の図やスライドを引用させていただきます。量子化 DeepLearning における量子化 DeepLearning の学習・推論は基本 float32 で行います。これを int8 や Nbit に離散化することを量子化といいます。計算に使う値は、モデルの重み、アクティベーション（ReLUとか通した後）、重みの勾配等があります。学習時については一旦置いておいて、この記事では推論における量子化について焦点をあてます。推論時に量子化の対象となる
自作キーボードの聖地、遊舎工房に行ってみたら、そこは沼だった（小寺信良） | テクノエッジ TechnoEdge
- 108 users
- www.techno-edge.net
- テクノロジー
- 2024/03/11
18年間テレビ番組制作者を務めたのち、文筆家として独立。家電から放送機器まで執筆・評論活動を行なう傍ら、子供の教育と保護者活動の合理化・IT化に取り組む。一般社団法人「インターネットユーザー協会」代表理事。もういい加減にしろよと読者から怒られかねないのだが、まだまだキーボードの話である。 KeychronのK11 Proを購入し、散々いじくり回していたわけだが、まあさすがに自作までは時間ないし、キーボード改造もここまでかなと思っていた。ところが先日、PFUのHHKB Studioのお話を聞く機会があり、1995年当時の秋葉原の話などが出て、懐かしく思い出した。この記事はまもなくITmedia MONOistに掲載されると思うので、お楽しみにしていただきたい。そのインタビューの中で、秋葉原のキーボード専門店「遊舎工房」の話が出て、そういえばまだ一度も行ったことないなと気づいた。だいたいこ
大規模モデルを支える分散並列学習のしくみ Part1
- 92 users
- zenn.dev/turing_motors
- テクノロジー
- 2023/06/20
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。自然言語処理分野における大規模深層学習の重要性は日に日に高まっていますが、GPT-3, GPT-4 などのモデルの学習には膨大な計算コストがかかり、容易に学習できなくなっています。実際、モデルサイズが近年急速に大きくなっていることにより、学習に必要な計算量(FLOPs)は以下のように年々膨大になっています。近年の大規模モデルでは、NVIDIA H100 80GB であっても 1 つの GPU では、モデルをのせることすらできません。 Compute Trends Across Three Eras of Machine Learning よりまたScaling Laws によると、大規模なモデルは小さいモデルと比較してより優れた性能を発揮するため、自動
- 機械学習
- LLM
- あとで読む
- GPT
- AI
- Deep Learning
- deeplearning
- GPU
OpenAIのサム・アルトマンCEOが数百兆円という桁外れの資金調達を計画し「半導体業界の再構築」を目指している、すでに孫正義やUAEの有力者と会談しているとの報道も
- 90 users
- gigazine.net
- テクノロジー
- 2024/02/09
ChatGPTなどの高性能AIの開発で知られるOpenAIのサム・アルトマンCEOが、世界の半導体生産能力を拡大するために数百兆円規模の資金調達を計画していることが報じられました。 Sam Altman Seeks Trillions of Dollars to Reshape Business of Chips and AI - WSJ https://www.wsj.com/tech/ai/sam-altman-seeks-trillions-of-dollars-to-reshape-business-of-chips-and-ai-89ab3db0 文章生成AIや画像生成AIなどの開発にはGPUやAI専用チップなどの計算資源が大量に必要です。OpenAIはMicrosoftと協力して大規模なスーパーコンピューターの構築に取り組んでいますが、アルトマンCEOは公の場で「十分なサービス
- OpenAI
- 半導体
- AI
- あとで読む
- business
EV減速の中でもっとも注意すべき政策
- 88 users
- www.itmedia.co.jp
- テクノロジー
- 2024/03/11
EVシフトの減速を示すニュースが次々に発表されている。BMW、GM、フォード、テスラ、リビアン、アップルなど、多くの会社が先行きの見込みをマイナス修正。計画の先延ばしや中止など、現実に応じた修正を余儀なくされている。ただし、こうなるのはずっと前から分かっていたことで、ようやく世間が悪夢から覚めたということになるだろう。「後出しで言うな」という人が出てきそうなので、本連載の過去記事を遡（さかのぼ）ってみた。まあ本人もいったい何時からマルチパスウェイの記事を書き始めたのかよく覚えていないので、一度おさらいしてみたかったのもある。 BEVシフトが限定的であることを最初に明確に書いたのは7年前、2017年5月の「日本車はガラケーと同じ末路をたどるのか？」だ。そしてエンジンはなくならないという主張が同じ年の7月にある。「電動化に向かう時代のエンジン技術」という記事だ。現在の流れに至る原因が欧州
- BEV
- あとで読む
- car
- EV
- 自動車
- politics
- ネタ
【論文解説】OpenAI GPT-4 を理解する
- 83 users
- data-analytics.fun
- テクノロジー
- 2023/04/30
さて、ChatGPT が非常に盛り上がっていますが、2022年11月にリリースされた ChatGPT は GPT-3.5 というモデルがベースになっています。そして、2023年3月にはその後継モデルである GPT-4 がリリースされ、ChatGPT Plus で利用できるようになっています。（月額20$）それ以降も画像データを処理できるようになったり、個人の好みを記憶できるようになったりと色々なアップデータがあってこの先どうなるんだろうと楽しみになりますね。今回は、もともとの GPT-4 についてしっかりと解説したいと思います。ちょっとした対話であれば GPT-3.5 でも GPT-4 でもそこまで大きな差はないように思えますが、GPT-4 に情報抽出や分類問題などのタスクを解かせようとすると、GPT-4 の方がかなり精度が良くなっていることがわかります。ですので、より複雑な利用
- ChatGPT
- AI
- あとで読む
- OpenAI
- 自然言語処理
- 言語
畳み込みの仕組み | Convolution
- 80 users
- www.youtube.com
- テクノロジー
- 2024/01/26
確率から画像処理まで、離散畳み込みと高速フーリエ変換(FFT) 激ムズ数え上げパズルと驚きの解法 https://youtu.be/FR6_JK5thCY フーリエ変換の解説動画 https://youtu.be/fGos3wrKeHY 【注釈】整数のかけ算のアルゴリズムについて、FFTの"straightforward"な適用はO(N * log(n) log(log(n)) )の実行時間になる。log(log(n))の項は小さいが、2019年になってHarvey and van der Hoevenがこの項を取り除くアルゴリズムを発見した。また、O(N^2)を、必要な計算量がN^2と共に大きくなると表現したが、厳密にはこれはTheta(N^2)が意味するところである。 O(N^2)は計算量が高々N^2の定数倍になるという意味で、特に、実行時間がN^2項を持たないが有界であるアル
ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
- 79 users
- tech.drobe.co.jp
- テクノロジー
- 2023/10/17
概要背景・目的実験実験の概要定量評価定性評価おわりに参考文献 DROBEで機械学習エンジニアをしております、藤崎です。概要類似商品検索の基盤となる複数の特徴抽出アルゴリズムについて、DROBEの保有するデータで評価した定量評価によると、画像単体を入力とする ResNet-50（自己教師あり学習）とCLIPの性能が高かった定性評価によって、取り扱うモーダルの違いによる各モデル出力の顕著な差異が確認できた背景・目的小売において、商品の在庫は無数に存在しています。そのため、消費者やサービス提供者が商品に紐づく情報（画像、商品の説明文など）を解釈して、特定の商品と類似したアイテムを人手で行うのは困難です。この課題を解決するために、機械学習手法の活用が注目されています。機械学習を用いた処理の流れは、商品に紐づく情報を適切に「要約」し、 1.で「要約」した商品情
Googleが高精度かつ高速にファイル形式を判別するツール「Magika」公開
- 72 users
- pc.watch.impress.co.jp
- テクノロジー
- 2024/02/21
- google
- magika
- ツール
- python
- deepLearning
- tool
- extension
- あとで読む
NVIDIA新ドライバでStable Diffusionの処理能力が倍に
- 70 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/05/24
- Stable Diffusion
- GPU
- AI
- NVIDIA
- 人工知能
- あとで読む