「Transformer」を検索 - はてなブックマーク

1 - 40 件 / 4972件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Transformerの検索結果1 - 40 件 / 4972件

GPT-3の衝撃 - ディープラーニングブログ
- 1600 users
- deeplearning.hatenablog.com
- テクノロジー
- 2020/07/21
この1週間はGPT-3のユースケースの広さに驚かされる毎日でした．シリコンバレーでは話題騒然ですが日本ではほとんど話題になっていないので，勢いで書くことにしました． GPT-3はOpenAIが開発した言語生成モデルです．名前の由来であるGenerative Pretrained Transformerの通り，自然言語処理で広く使われるTransformerモデルを言語生成タスクで事前学習しています．先月申請すれば誰でもGPT-3を利用できるOpenAI APIが発表され，様々な業種の開発者によって驚くべきデモンストレーションがいくつも公開されています．特に話し言葉からJSXやReactのコードを生成するデモは著名なベンチャーキャピタルから注目を集め，誇大広告気味だと警鐘を鳴らす事態に発展しています． This is mind blowing. With GPT-3, I built
- AI
- 機械学習
- あとで読む
- GPT-3
- deeplearning
- 学習
- NLP
- IT
- 自然言語処理
- api
GPTの仕組みと限界についての考察（１） - conceptualization
- 1517 users
- isobe324649.hatenablog.com
- テクノロジー
- 2023/03/21
GPT4が登場してChatGPTが盛り上がってますね。本記事は、GPT（を支えるTransformerという仕組み）をChatGPTユーザにとって分かりやすく説明し、その能力と限界についての見通しをよくしよう、という趣旨になります。少し長くなりそうなので、全部で記事を3回に分けようと思います。（１）大まかな背景と概要：本記事（２）GPTの能力と可能性：実際の使用例とTransformerの仕組みを踏まえて説明（３）GPTの限界と未来展望：Transformerの仕組みが持つ限界と研究の進展を予想 GPT3と4の違い：トークン長とは何か？まずここから話を始めます。GPT-3は、パラメータ数が750億個（850GBの容量を食う）でトークン長が4097(GPT-3.5)でした。GPT-4は、パラメータ数は非公開でトークン長は32768ですので、ちょうど8倍になります。さて、トーク
- ChatGPT
- AI
- あとで読む
- 機械学習
- GPT
- 研究
- 技術
- 人工知能
- technology
- 考察
最近ローカルLLMがアツいらしい
- 1045 users
- soysoftware.sakura.ne.jp
- テクノロジー
- 2024/05/20
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し
- AI
- LLM
- あとで読む
- ChatGPT
- 機械学習
- 人工知能
- mac
- IT
- API
- GPU
userAgent一覧
- 1032 users
- www.openspc2.org
- 暮らし
- 2005/02/19
ブラウザの判別や携帯の機種判別に利用するためのユーザーエージェント一覧です。ただし、ユーザーエージェントは詐称（偽物）される場合があるため、完全にユーザーエージェントでブラウザなどの判別ができるわけではありません（詐称の方法のページを参照）。ここに掲載されているものは、このサーバーなどに対してアクセスしてきたユーザーエージェント名などを抽出したものなどです。あまりに古いブラウザおよびマイナーなブラウザに関してはアクセスログがないため掲載できていません。 [トップページに戻る] ■iPhone ●iOS Mozilla/5.0 (iPhone; U; CPU like Mac OS X; en) AppleWebKit/420+ (KHTML, like Gecko) Version/3.0 Mobile/1C28 Safari/419.3 ●iOS2 Mozilla/5.0 (iPhone
ChatGPT使い方総まとめ - Qiita
- 1009 users
- qiita.com/sakasegawa
- テクノロジー
- 2022/12/01
こんにちは！sakasegawaです！ ( https://twitter.com/gyakuse ) 今日は今流行のChatGPTについて紹介します！ ChatGPTとは OpenAIが開発するGPT-3(※)というめちゃくちゃすごい言語モデルをベースとしたチャットアプリです。色んな質問にすぐ答えてくれます。この記事ではさまざまな使い方を紹介します。 https://chat.openai.com/ ちなみにGPT-3関連では、noteの以下記事も便利なのでぜひ読んでみてください AIがコミットメッセージ自動生成！神ツール『auto-commit』『commit-autosuggestions』の紹介 ※正確にはGPT-3.5シリーズと呼ばれています ChatGPTの仕組みを考えながらプロンプトを作る手法はこちらに別途まとめています文章質問-応答〜について教えて Wikiped
- AI
- ChatGPT
- あとで読む
- 機械学習
- 文章
- webサービス
- まとめ
- ツール
- Qiita
- GPT
GPT-1→GPT-2→GPT-3→GPT-3.5→ChatGPT→GPT-4までの進化の軌跡と違いをまとめてみた｜スタビジ
- 906 users
- toukei-lab.com
- テクノロジー
- 2023/04/05
当サイト【スタビジ】の本記事では、昨今のAIの進化のきっかけになっているGPTシリーズについてまとめていきたいと思います。GPT-1から始まりGPT-2、GPT-3、そしてChatGPTであるGPT-3.5、GPT-4と進化してきました。この進化の軌跡と違いについて解説していきます。こんにちは！データサイエンティストのウマたん(@statistics1012)です！この記事では最近のAIブームの火付け役になったGPTシリーズについて簡単にまとめていきたいと思います。
- ChatGPT
- AI
- あとで読む
- 学習
- 機械学習
- GPT
- 勉強
- 歴史
- データ
- technology
働きながらアメリカの大学院でCS修士号を取った - k0kubun's blog
- 882 users
- k0kubun.hatenablog.com
- 学び
- 2022/05/16
4年前に会社の福利厚生を使ってスタンフォードの授業を取ってみたら面白く、働きながらでも続けられそうだなという実感を得たので、 2年後、受験を経てジョージア工科大学にリモートで通い始めた。そして先日、ジョージア工科大学からコンピュータサイエンス修士号をいただくことができた。画像の学位記は卒業式イベント用の非公式のもので、1~2か月すると Masterとちゃんと書いてある本物が来るらしい *1 。 After 1 year and 9 months, I graduated from Georgia Tech and got a master's degree in computer science. It was intense to be a student while working full-time, but I learned a lot. pic.twitter.com/J
- 大学
- あとで読む
- 勉強
- education
- アルゴリズム
- CS
- 教育
- アメリカ
- 大学院
- 論文
パナソニックコネクトの｢社内ChatGPT｣全社導入。1カ月使い倒して見えてきた成果とは
- 865 users
- www.businessinsider.jp
- テクノロジー
- 2023/04/12
パナソニックのB2Bソリューション子会社パナソニックコネクトが、国内1万2500人の全従業員にChatGPT相当の機能を備えた、独自の社内AI｢ConnectGPT｣を提供すると公表したことが産業界で注目を集めている。国内大手では｢使用禁止｣を通達する企業もあるなかで、ChatGPT導入事例として先進的だ。さらに、実際に社内への浸透も進んでいるというのが興味深い。日本企業はいかにChatGPTを｢業務｣で使い、生産性を高められるのか。導入から1カ月あまり経った時点のデータをもとに、パナソニックコネクトに可能性を取材した。
自宅作業が多い方にオススメ！IKEA で作った快適自宅オフィス – Zero4Racer PRO Developer's Blog
- 863 users
- www.zero4racer.com
- 暮らし
- 2012/01/25
概観追記:2013/9/16 引っ越して作った新しいオフィスの記事はこちら４畳半のスペースにIKEAで作った！見えるところにものを置かない、快適ホームオフィス空間 | Zero4Racer PRO Developer’s Blog 追記:2015/8/14 さらに改善した新しいオフィスの記事はこちらIKEAの家具で作った！スタンディングで作業できるヘルシーホームオフィス | 先日、IKEAに行って、かねてから作りたかった自宅オフィスを作ることが出来たので出来た結果を備忘をかねて共有します。皆様の自宅オフィス作りに役立てていただければと思います。 iPad と Mac を使って快適に文章を書く環境についても書きました！これは便利！iPadとMacで実現する快適物書き環境 « Zero4Racer PRO Developer’s Blog よろしければご覧ください。リビングにIKEAで作る
- インテリア
- ikea
- 家具
- オフィス
- 生活
- 仕事
- interior
- 開発環境
- 椅子
- あとで読む
松尾研 LLM講座講義コンテンツ | 東京大学松尾研究室 - Matsuo Lab
- 828 users
- weblab.t.u-tokyo.ac.jp
- テクノロジー
- 2023/12/27
松尾研究室が2023年9~10月に東京大学サマースクールで開催した LLM 大規模言語モデル講座のコンテンツを無償公開しています。本講座は約2,000名の受講者が参加し、全7回の講義を実施しました。最終課題としてGPUを使ったコンペティションでは約800名が参加し熱戦を繰り広げました。現在、講義のスライドのみ公開しております。ダウンロードは利用規約を確認の上、下記からダウンロードをお願いいたします。最終更新: 2024年2月10日問題・フィードバック報告フォームはこちら第1回：Overview of Language Models LLMの概要、今後の各回の講義の概要、および日本のLLM開発状況について第2回：Prompting and Augmented Language Model 事前学習済みLLMを追加学習せずに活用する技術（プロンプティング、⽂脈内学習、Augme
- LLM
- あとで読む
- AI
- 学習
- 大学
- IT
- 研究
- 勉強
- コンテンツ
- 自然言語処理
社内勉強会で生成AIについて発表したので70ページの資料を公開する！ - Qiita
- 794 users
- qiita.com/hedgehog051
- テクノロジー
- 2023/06/28
前置き毎週金曜日夕方に行われる社内勉強会にて、先日生成AIについて発表しました。折角なので少し加筆修正した資料を公開します。進化のスピードが早く、一時期食傷気味に陥ってましたが改めて昨今の生成AI関連の基本となるインプットを目指しました。 ※資料内冒頭に記載してますが、AIの専門家ではないので認識や説明に誤りがある可能性があります。当方も勉強中なので、「ここ違うよ」や「これの説明もあるといいんじゃない」など様々なコメント大歓迎です！資料資料目次 AIの基本機械学習について深層学習について機械学習の種類教師あり学習の得意なこと教師あり学習のイメージ教師なし学習の得意なこと教師なし学習のイメージ強化学習の得意なこと生成AIについて生成AIとは生成AIの位置付け生成AI利用例代表的なサービス例日本における盛り上がり生成AI市場規模 AGIとは AGIは近い？
- AI
- あとで読む
- ChatGPT
- 勉強
- 資料
- 機械学習
- 学習
- LLM
- 仕事
- qiita
TechCrunch
- 792 users
- jp.techcrunch.com
- テクノロジー
- 2017/03/03
Apple seems to be finally getting serious about infusing generative AI into its products — both internal and external — after announcing a solitary “Transformer” model-based autocorrec
- aws
- s3
- amazon
- 障害
- あとで読む
- トラブル
- システム
- 事件
- trouble
- 事故
ChatGPTのおさらいと、プログラミングに活用するための第一歩 | gihyo.jp
- 771 users
- gihyo.jp
- テクノロジー
- 2023/03/23
大量の文章から学習することで、多言語を取り扱う能力だけでなく、高度な推論能力まで手に入れました。 GPT-3.5、とりわけその初期モデルのCodexはGitHubに存在する5400万の公開リポジトリから採取された159GBのPythonコードでGPT-3をfine-tuning（微調整）することで生まれました。ChatGPTがとりわけPythonが得意なのはここから来ています。 ChatGPTの学習データを考えることはその能力を発揮させるときに極めて有効です。質問時も以下のように、『⁠涼宮ハルヒの憂鬱』というライトノベル作品について日本語で聞いたときはSOS団の略称を間違えるなどしますが、英語ではほぼ期待通りの回答を見せます。図1 『ハルヒの憂鬱』について日本語で聞いた場合の回答図2 『ハルヒの憂鬱』について英語で聞いた場合の回答知ったかぶりをするChatGPT ところで、ChatG
GPT-4時代のエンジニアの生存戦略 - Qiita
- 699 users
- qiita.com/lazy-kz
- テクノロジー
- 2023/03/28
GPT-4時代のエンジニアの生存戦略 ※ この記事の内容の一部はこちらのイベントでお話したことと重複します。はじめに 2023年3月1日にOpenAI社よりChatGPTのAPIが公開されました。さらに14日にはGPT-4が登場し、その翌々日にはMicrosoft 365 CopilotでGPT-4をOffice製品に搭載することが発表されるなど、AI領域で大きな変化が起きています。変化の速度の速さと変化量の大きさにより、私自身も追いつくのが精一杯な状態です。個人的には、iPhoneの登場時以上の衝撃を受けています。人類の歴史上、過去3回AIブームがありました。Generative AIが4回目のブームになります。そして、特に日本においては顕著なのですが、AIへの過度な期待とそれへの失望の繰り返しがここ数十年にわたって繰り返されてきました。直近だと数年前のDeep Learn
- AI
- あとで読む
- ChatGPT
- エンジニア
- プログラミング
- GPT
- 開発
- 考え方
- programming
- Qiita
ChatGPTの生みの親、サム・アルトマンが語る「AIと検索と資本主義の未来」 | Forbes JAPAN 公式サイト（フォーブスジャパン）
- 696 users
- forbesjapan.com
- テクノロジー
- 2023/02/08
急成長するジェネレーティブAI分野でここ最近、最も注目され、最も議論を呼んでいるスタートアップがサンフランシスコを拠点とする「OpenAI（オープンAI）」だ。フォーブスは、1月中旬に同社の共同創業者でCEOを務めるサム・アルトマンにインタビューを行い、同社の人工知能（AI）チャットボット「ChatGPT」の最新の動向や、AIツールがグーグルの検索ビジネスにもたらす脅威について質問した。 ──ChatGPTの人気ぶりや、収益化の推進、Microsoft（マイクロソフト）との提携などの状況を見ていると、ジェネレーティブAIのカテゴリーは今、転換点に差しかかっているように見えます。あなたの立場から、OpenAIはそのプロセスのどこにいると感じていますか？今は確かにエキサイティングな時期だと思いますが、私としてはこれがまだ、きわめて初期の段階にあることを望んでいます。社会に前向きなインパクトを
- AI
- あとで読む
- ChatGPT
- 社会
- 未来
- 検索
- 技術
- technology
- 言語
- インタビュー
4Gamer.net ― Eee PC発売記念（？）　この小さいマシンでゲームを動かしてみよう――その1：Windows XPを頑張って小さくしてみる（Eee PC）
- 675 users
- www.4gamer.net
- 暮らし
- 2008/01/22
Eee PC発売記念（？）　この小さいマシンでゲームを動かしてみよう――その1：Windows XPを頑張って小さくしてみる編集長：Kazuhisa 派手なところは一切ないが，値段の割には質実剛健。2台目のマシンとして非常にお勧めだ ※第2回：Windows XPを頑張って軽快にしてみる　→　「こちら」 ※第3回：FFXIも完璧！　ついにゲームの起動にトライ　→　「こちら」発表されるやいなや一気に「小さいものフェチ」の心を奪った，ASUSTeK Computer（以下，ASUSTeK）のノートPC「Eee PC」。日本でもついに4万9800円というプライシングで発表され（Windows XP導入済），通信端末にしようとか出先でYouTubeを見よう（？）とかゲームもできるといいなぁとか，色々と心を躍らせている人も多いことだろう。〜この小さいマシンでゲームを動かしてみよう〜・冒頭・
- eeepc
- windows
- pc
- eee pc
- チューニング
- tips
- windows xp
- mobile
- 4gamer
- *tips
コード進行、フレーズ生成、リズム作成…、初心者からプロまで作曲を効率よく行うための高性能・高機能ツール、RapidComposer｜DTMステーション
- 640 users
- www.dtmstation.com
- エンタメ
- 2023/08/24
音楽制作ツールには、Cubase、Studio One、FL Studio…のように汎用性の高いDAWソフトのほかにも、マスタリングに特化したソフトや波形編集に特化したもの、最近ではAI作曲機能が強力なものなどがあります。そうした中、それらとはまたちょっと異なるアプローチで、、作曲という部分に特化した音楽制作ツールもあります。その一つが、ハンガリーのソフトウェアメーカーであるMusicDevelopmentsのRapidComposerというWindowsでもMacでも使えるソフトです。もともと2010年に誕生したこのソフトは、コード進行の作成やフレーズの生成にフォーカスしており、作曲における作業を効率よくこなせて、アイディア出しにも使えるツールとして進化してきた歴史があります。最新バージョンは4.7となっていますが、RapidComposerは国内に代理店がないこともあり、日本のDTM
- DTM
- あとで読む
- 音楽
- 作曲
- ツール
- music
- ソフトウェア
- DAW
- フリーソフト
- 初心者
大規模言語モデルの驚異と脅威
- 639 users
- speakerdeck.com/chokkan
- テクノロジー
- 2023/03/28
2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを（Research Preview版ではあるが）無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転換点となり得ることは、驚異的なことである。本講演では、ChatGPTがベースにしているInstructGPTを中心に、大規模言語モデルやプロンプト、人間のフィードバックによる強化学習などの技術を概観する。また、ChatGPTのような生成型の人工知能が社会やビジネス、学術にもたらす脅威について述べる。 https://aip.riken.jp/sympo/sympo202303/
- AI
- ChatGPT
- あとで読む
- 機械学習
- LLM
- NLP
- 自然言語処理
- GPT
- 言語
- アルゴリズム
iPhone Dev Center 日本語リファレンス
- 620 users
- developer.apple.com
- 暮らし
- 2008/10/30
ウィジェットとライブアクティビティウィジェットがさらに多くの場所で活用できるようになり、パワーアップしました。WidgetKitを使ってインタラクティブな要素やアニメーションによるトランジションに対応すると、ユーザーがウィジェットから直接アクションを実行できます。既存のウィジェットにわずかな変更を加え、iOS 17向けに再ビルドするだけで、iPhoneのスタンバイ画面、iPadのロック画面、Macのデスクトップ上で視覚的に美しく表示させることができます。SwiftUIを使用すると、ウィジェットの色と間隔がコンテキストに合わせて自動調整されるため、複数のプラットフォームで使いやすさが増します。 WidgetKitとActivityKitで構築したライブアクティビティがiPadで利用できるようになり、ユーザーはアプリのアクティビティや情報をロック画面からいつでもリアルタイムで確認できます。
- document
- iphone
- objective-c
- 開発
- development
- apple
- ipad
- reference
- プログラミング
- programming
シンギュラリティは来ない - きしだのHatena
- 592 users
- nowokay.hatenablog.com
- テクノロジー
- 2023/04/19
ChatGPTが思いがけずいろいろなことを人間より賢くやっているのを見てシンギュラリティという言葉を使う人が増えたように思いますが、逆に、シンギュラリティは来ないのではという思いを強くしています。まず、この文章でのシンギュラリティがなにかという話ですが、レイ・カーツワイルが「シンギュラリティは近い」の1章の終わりで「さあ、これが特異点だ」といっている特異点、そのシンギュラリティです。シンギュラリティは近い―人類が生命を超越するとき作者:レイ・カーツワイルNHK出版Amazon この特異点は単にAIが人間より賢くなるというだけではありません。人間より賢くなるだけだと、便利な道具が増えるだけなので、大騒ぎするほどの変化は起きません。人の仕事を奪うといっても、蒸気機関ほどでもないですね。印刷機などと並んで、人の生活を変える転換点にすぎず、ただひとつの点をあらわすシンギュラリティにはなりま
- AI
- あとで読む
- ChatGPT
- 技術
- 人工知能
- LLM
- GPT
- シンギュラリティ
- コンピュータ
- techfeed
エンジニア・データ分析職の方々にお薦めしたい、LLM時代に不可欠な教養が身に付くテキスト3選 - 渋谷駅前で働くデータサイエンティストのブログ
- 590 users
- tjo.hatenablog.com
- テクノロジー
- 2023/07/02
（『IT Text 自然語処理の基礎』より） 3ヶ月ほど前に空前のLLMブームについて概観する記事を書きましたが、それ以降も世間のLLMに対する狂騒ぶりは収まるどころかますます拍車がかかるという有様で、あまつさえ僕自身の仕事における日常業務にもじわじわと影響が及びつつあり、今後も良きにつけ悪しきにつけLLMと共生し続ける必要がありそうだと感じている今日この頃です。そんな猫も杓子もLLMに群がるが如き空前のブームを受けて、エンジニアやデータ分析職の方々の中には「LLMに興味はあるんだけど世の中にあまりにも多くのLLM関連コンテンツが溢れ返っていて何から手をつけたら良いのか分からない」という向きもあるように見受けられます。そこで、僕も断じてLLM以下生成AIの専門家などではないのですが、個人的に「このテキストを読めばLLM時代を生き抜くことが出来そうだ」と感じた書籍を、全くの独断と偏見で3冊
- LLM
- あとで読む
- 機械学習
- 学習
- エンジニア
- AI
- 自然言語処理
- データ
- 本
- 勉強
図解Stable Diffusion
- 586 users
- okuranagaimo.blogspot.com
- テクノロジー
- 2022/10/09
ジェイ・アラマールのブログより。 AIによる画像生成は、(私を含めて)人々の度肝をぬく最新のAIの能力です。テキストの説明から印象的なビジュアルを作り出す能力は、魔法のような品質を持ち、人間がアートを創造する方法の変化を明確に指し示しています。Stable Diffusionのリリースは、高性能(画質だけでなく、速度や比較的低いリソース/メモリ要件という意味での性能)なモデルを一般の人々に提供することになったのは、この開発における明確なマイルストーンです。 AI画像生成を試してみて、その仕組みが気になり始めた方も多いのではないでしょうか。ここでは、Stable Diffusionの仕組みについて優しく紹介します。 Stable Diffusionは、様々な使い方ができる汎用性の高いものです。まず、テキストのみからの画像生成(text2img)に焦点を当てます。上の画像は、テキスト入力と生
- AI
- あとで読む
- 画像
- 機械学習
- Stable Diffusion
- 学習
- イラスト
- 人工知能
- 勉強
- algorithm
AI の次の重要な一歩
- 585 users
- blog.google
- テクノロジー
- 2023/02/07
AI は、Google が現在取り組んでいる中で最も本質的なテクノロジーです。AI は、医師による病気の早期発見の支援や、自国語での情報へのアクセスなど、人々、ビジネス、コミュニティの潜在能力を引き出します。そして、数十億人の生活を大きく改善できる新しい機会を提供します。6 年前から、私たちが Google の方向性を AI 中心に再編し「世界中の情報を整理し、世界中の人がアクセスできて使えるようにする」という Google のミッションを果たす最も重要な方法に AI を据えているのは、これが理由です。以来、私たちは全面的に AI への投資を継続し、Google AI と DeepMind のチームは最先端のテクノロジーを進化させています。現在、AI の計算規模は半年ごとに倍増していますが、それはムーアの法則よりもはるかに早いペースです。同時に、高度なジェネラティブ AI と大規模言語モ
- AI
- google
- あとで読む
- 人工知能
- Bard
- LaMDA
- ChatGPT
- seo
- メディア
深層学習の数理
- 578 users
- www.slideshare.net/trinmu
- テクノロジー
- 2019/08/06
Curriculum Learning （関東CV勉強会）Yoshitaka Ushiku61.6K views•43 slides Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida15.5K views•38 slides
- 機械学習
- あとで読む
- Deep Learning
- AI
- 数学
- DeepLearning
- 学習
- ディープラーニング
- 理論
- DL
東京オリンピックの競技中に映り込んだ「実物大ガンダム」の説明に海外メディアが苦戦
- 556 users
- gigazine.net
- アニメとゲーム
- 2021/08/06
2021年7月から開催されている「東京2020オリンピック」は、新型コロナウイルスの影響で無観客開催となりましたが、競技の様子は世界中に配信されています。そんな中、競技の背景に映り込んだ「ガンダム」の説明にイギリスの公共放送であるBBCなどが苦戦していると、海外メディアが報じています。 Tokyo 2020 Olympics Commentator tries his best to say 'Gundam' https://kotaku.com/olympics-commentator-tries-his-best-to-say-gundam-1847366388 The BBC's Twitter Account Thought Gundam Was A Transformer https://kotaku.com/the-bbc-still-doesnt-know-what-gund
GPTの仕組みと限界についての考察（2.1） - conceptualization
- 555 users
- isobe324649.hatenablog.com
- テクノロジー
- 2023/03/27
全３回のシリーズパート２の本記事では、GPTの能力と可能性をAttention/Transformerの仕組みをふまえて考察します。というつもりでしたが、凄く長くなってしまったのでパート2は以下の3回に分けようと思います。（2.1）各技術の定性的な説明（本記事）（2.2）Transformerのアルゴリズム詳細（2.3）GPTの能力と可能性について 2.1 各技術の定性的な説明自然言語の構造を考えてみるまず我々が使う言語についてちょっと振り返るところから話を始めましょう。文や文章は、おおもとのデータである文字から始まって、単語、文節、句、節、文、文章、さらにその上の意味、という風に階層的な構造を持っていると我々は概念的に認識してますよね。構文の階層そして、各階層や階層間には、文法や語法といった言葉のルールがあります。深層学習はその名の通り、層を深くしたニューラルネットワ
- ChatGPT
- あとで読む
- AI
- 機械学習
- 自然言語処理
- GPT
- 技術
- 学習
- 人工知能
- 科学
【文系でもわかる】ChatGPTのキモ「Transformer」「Attention」のしくみ
- 554 users
- www.sbbit.jp
- テクノロジー
- 2023/09/27
第1回は、さまざまなタスクをこなす万能型ジェネレーティブAIツール「ChatGPT」の性能の鍵を握る「トークン長（GPTが文脈を意識できる過去の単語数）」やGPTの歴史的経緯について解説しました。第2回はGPTを支える自然言語処理の分野で使用される深層学習モデル「Transformer」とその根幹となる「Attention機構（そのタスクにおいてどの単語の重要度が高く、注目すべきか決める仕組み）」についてです。TransformerとAttention機構の仕組みを定性的に把握し、それを踏まえてGPTの能力と可能性について考察したいと思います。テクノロジー領域に明るくない人でもわかる記事を目指します。
- ChatGPT
- あとで読む
- AI
- 機械学習
- 文章生成AI
- GPT
- 人工知能
- 学習
- techfeed
- 考察
ChatGPTなどの大規模言語モデルはどんな理論で成立したのか？重要論文24個まとめ
- 549 users
- gigazine.net
- テクノロジー
- 2023/06/04
2022年11月にChatGPTが公開され、たった1週間で100万ユーザーを超えたのをきっかけに、GoogleのBardやMicrosoftのBing AI Chatなど、大規模言語モデルを利用したチャットAIが続々とリリースされています。チャットAIを研究しているセバスティアン・ラシュカさんが、チャットAIが実用化されるまでの研究の軌跡を重要な論文24個に絞って要約しています。 Understanding Large Language Models - by Sebastian Raschka https://magazine.sebastianraschka.com/p/understanding-large-language-models ◆目次・主要なアーキテクチャとタスク・スケーリングと効率性の向上・言語モデルを意図した方向へ誘導する・人間のフィードバックによる強化学習(
- AI
- あとで読む
- ChatGPT
- LLM
- 論文
- 人工知能
- 機械学習
- GPT
- まとめ
- 文章生成AI
30分で完全理解するTransformerの世界
- 547 users
- zenn.dev/zenkigen_tech
- テクノロジー
- 2023/02/14
はじめに初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。深層学習界隈では、2017年に衝撃的なタイトル（Attention Is All You Need）の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま
- 機械学習
- あとで読む
- Transformer
- AI
- 学習
- 自然言語処理
- 勉強
- algorithm
- deeplearning
- ChatGPT
GWに徹底理解！GPTの仕組みをめちゃくちゃ分かりやすく解説する無料動画公開 | Ledge.ai
- 545 users
- ledge.ai
- テクノロジー
- 2024/04/28
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- AI
- あとで読む
- ChatGPT
- GPT
- 動画
- ツール
- 便利
- 勉強
- 無料
- IT
小粋空間: Movable Type プラグイン一覧
- 534 users
- www.koikikukan.com
- 暮らし
- 2006/04/19
Movable Type 日本語環境でよく利用されていると思われる MovableType プラグインの一覧です。海外サイトについては Googleで「Movable プラグイン」で検索した結果より、国内サイトは私が把握しているプラグイン作成者のサイトと Google 検索結果から抽出しています。Movable Type Plugins Directory からの抽出は行っていません。また国内サイトのプラグインの概要は、配布サイトに掲載されている文言を引用させて頂いてます。 2010.05.01 MT5版のプラグイン一覧を公開しました。 2007.09.10 MT4版のプラグイン一覧を公開しました。本エントリーでのMT4版のプラグイン情報追加は終了します。注意事項プラグインに関するコメント等の主観的要素は含まないようにしています。プラグインの適用についてはご自身の判断で行ってくださ
- movabletype
- Movable Type
- mt
- plugin
- プラグイン
- blog
- まとめ
- tool
- web
- ブログ
機械学習の精度と売上の関係
- 533 users
- www.slideshare.net/TokorotenNakayama
- テクノロジー
- 2018/04/07
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説！ - Qiita
- 516 users
- qiita.com/omiita
- テクノロジー
- 2022/12/05
追記: U-Netの中間層は常にSelf-Attentionとなります。ご指摘いただきました。ありがとうございます。（コード）オミータです。ツイッターで人工知能のことや他媒体の記事などを紹介しています。 @omiita_atiimoもご覧ください！世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説！未来都市にたたずむサンタクロース（Stable Diffusionで生成） 2022年8月、世界に大きな衝撃が走りました。それは、Stable Diffusionの公開です。Stable Diffusionは、テキストを受け取るとそれに沿った画像を出力してくれるモデルです1。Stable Diffsuionは10億個近いパラメータ数をもち、およそ20億個の画像とテキストのペア（LAION-2B）で学習されています。これにより、Stable Diffusionは入
- AI
- あとで読む
- 機械学習
- Stable Diffusion
- 画像
- StableDiffusion
- 学習
- 勉強
- イラスト
- 人工知能
メンヘラちゃんと学ぶディープラーニング最新論文 - ディープラーニングブログ
- 515 users
- deeplearning.hatenablog.com
- テクノロジー
- 2018/11/24
メンヘラちゃんがディープラーニングの最新論文をバリバリ語ってくれるシリーズです．Twitterに投稿したスライドをまとめました．サムネ画像スライド内のテキスト抽出（検索エンジン用）メンヘラちゃんと学ぶディープラーニング最新論文製作: Ryobot はじめに作者 • Ryobot (りょぼっと) • NAIST修士2年.RIKEN AIP勤務 (2017/7~) • チャットボットの個性と多様性の研究をしています • Twitter@_Ryobot でお気に入り論文を紹介していますスライドの概要 • メンヘラちゃんが最新論文をバリバリ語ってくれます • 分野は主に自然言語処理 (機械翻訳と言語理解) です • Twitter で投稿したスライドのまとめですメンヘラちゃん • ジョイネット様制作のLINEスタンプです • 作者様がフリー素
最近話題になった音楽生成AI まとめ｜npaka
- 507 users
- note.com/npaka
- テクノロジー
- 2022/11/05
最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod
- AI
- あとで読む
- 音楽
- DTM
- music
- 人工知能
- 機械学習
- audio
- note
- 作曲
GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
- 506 users
- nowokay.hatenablog.com
- テクノロジー
- 2023/04/25
やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。まず理論的な概要。機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思います。最初は数式が多いのだけど、Σをfor文だと思いつつ、定義が説明文中に埋まってるPerlよりたちが悪い記号主体言語だと思えば読めるけどめんどくさいので飛ばしても問題ないと思います。深層学習からマルチモーダル情報処理へ (AI/データサイエンスライブラリ“基礎から応用へ” 3) 作者:中山英樹,二反田篤史,田村晃裕,井上中順,牛久祥孝サイエンス社Amazon で、もういきなり作る。トークナイザーから全部つくっていきます。TensorFlowでBERTをつくってGPT2をつくる
- GPT
- あとで読む
- ChatGPT
- AI
- 本
- 学習
- 人工知能
- 文章生成AI
- ライブラリ
- Transformer
やはり予想を超えてこなかったGPT-4と、GPUの未来、ホビイストへの手紙
- 492 users
- wirelesswire.jp
- テクノロジー
- 2023/03/16
やはり予想を超えてこなかったGPT-4と、GPUの未来、ホビイストへの手紙 2023.03.16 Updated by Ryo Shimizu on March 16, 2023, 08:00 am JST 3月14日の早朝、GPT-4が公開され、筆者は早速試した。その後、開けて3月15日の早朝、APIも部分的に解放され、筆者はそれも試した。その上で、先週書いた記事の内容についての確信が深まった。やはり、GPT-4は期待を超えてはこなかった。 GPT-4は、ChatGPT Plusに入会すると誰でもすぐに使うことができる。APIだけは招待制だが、それも筆者と同じくらいのタイミングでアンロックされた方も少なくないのではないか。 100倍規模のパラメータがあっても、アプローチには限界があるのである。また、ChatGPTが注目を集めたことで、これまで下火になっていた他の大規模言語モデル(
- AI
- あとで読む
- ChatGPT
- 人工知能
- GPU
- 機械学習
- GPT
- 技術
- コンピュータ
- GPT-4
Self-Attentionを全面的に使った新時代の画像認識モデルを解説！ - Qiita
- 485 users
- qiita.com/omiita
- テクノロジー
- 2020/08/31
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします！(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
- 451 users
- euske.github.io
- テクノロジー
- 2023/02/26
(数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transformer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transformer を参照のこと。日本語ではこの解説がわかり
驚異の1ビットLLMを試す。果たして本当に学習できるのか?｜shi3z
- 440 users
- note.com/shi3zblog
- テクノロジー
- 2024/02/29
昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。 BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジかよ。 https://arxiv.org/pdf/2402.17764.pdf ということで早速試してみることにした。オフィシャルの実装は公開されていないが、そもそも1ビット(と言っていいのかわからない,-1,0,1の三状態を持つからだ。論文著者はlog2(3)で1.58ビットという主張をしている)量子化のアルゴリズム自体の研究の歴史は古いので、BitNetによるTransformerの野良実装
- LLM
- AI
- あとで読む
- BitNet
- 機械学習
- 学習
- 人工知能
- 技術
- Microsoft
- 研究