[B! ai] r-westのブックマーク

GWに徹底理解！GPTの仕組みをめちゃくちゃ分かりやすく解説する無料動画公開 | Ledge.ai

サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。

r-west 2024/04/29

リンク

中学生でもわかる深層学習

第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-)

r-west 2024/03/30

リンク

LLMの現在 - Speaker Deck

今のLLMを取り巻く状況について紹介します。

r-west 2024/03/30

リンク

高木浩光＠自宅の日記 - Claude 3に例の「読了目安2時間」記事を解説させてみた

■ Claude 3に例の「読了目安2時間」記事を解説させてみた Anthropicの先日出たばかりのClaude 3（Opus）が、ChatGPTのGPT-4を超えてきたと聞いて、自分の原稿を解説させてみたところ、確かに革新的な進歩が見られる。もはや内容を「理解」しているようにしか見えない。GPT-4では、昨年11月に試した時には、そうは見えず、優れた文章読解補助ツールという感じでしかなかった。一昨年のCafe JILIS「高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱」は、発表した当時、長すぎて読めないから誰か要約してという悲鳴があがっていた。その後、ChatGPTの登場で、その要約能力に期待されたが、冒頭のところしか要約してくれなかったり、薄い論点リストが出てくるだけで、その期待に応えられるものではなかった。もっとも、GPT-4でも、質問力があ

r-west 2024/03/12

リンク

RAGの性能を改善するための8つの戦略 | Fintan

近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ

r-west 2024/02/09

リンク

1つのGPU／CPUで推論可能な超軽量LLM「tsuzumi」を24年3月から提供へ

NTTは2023年11月、同社が独自開発した大規模言語モデル（LLM）「tsuzumi」を2024年3月から提供開始すると発表した。 tsuzumiのコンセプトについて、NTT 執行役員研究企画部門長の木下真吾氏は「専門知識を持った、パラメーターサイズの小さなLLMの実現だ。tsuzumiは、パラメーターサイズを抑えつつ、言語学習データの質と量を向上させることで、軽量化と専門性を両立した」と語った。専門知識を持った軽量LLM「tsuzumi」 tsuzumiは、パラメーターサイズが6億または70億と軽量でありながら、「世界トップクラス」（同社）の日本語処理性能を持つLLMだ。軽量なため、1つのGPUやCPUで推論動作が可能で、学習やチューニングに必要な時間やコストを軽減できるという。日本語／英語に対応する他、表が含まれる誓約書や契約書といった図表文書の視覚読解など、さまざまな形式にも対

r-west 2024/01/17

リンク

LLM時代の強化学習 - どこから見てもメンダコ

強化学習におけるLLMの活用パターン調査はじめに：実世界における強化学習の課題 LLM×強化学習人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル外部知識にもとづく報酬モデル設計 2. 計画モデルとしてのLLM LLMによるセマンティック計画 LLMによる構造的な探索計画 3. 方策モデルとしてのLLM LLM as 確率方策マルチモーダルLLM as 確率方策参考：GPTアーキテクチャの転用 4. 世界モデルとしてのLLM Language Models Meet World Models (あとで書く) おわりに：VLM as 確率方策に期待はじめに：実世界における強化学習の課題レトロゲームで人間並みのパ

r-west 2023/11/26

リンク

発達障害者向けAIサポートツールgoblin.toolsを紹介｜ﾊﾟﾄﾙ | AI x Biz

こんにちは、パトルです。今回は、米国で話題になったgo blin.toolsを紹介します。 go blin.toolsは、主にニューロダイバーシティ（神経多様性）のある人々が苦労するタスクを手助けするためにデザインされたツールです。フリーランスのソフトウェアエンジニアであるBram De Buyserによって作成・管理されています。ツール自体は英語ですが、日本語入力すれば日本語でも対応できます。シンプルなツールなので英語が読めなくても使うことはできます。 go blin.toolsの概要go blin.toolsには、6種類のツールがあります。簡単に概要を記載します。マジックTODO・・・やりたいことを細かいタスクに分割してくれるフォーマライザー・・・伝えたいことを適切な表現に変えてくれるザ・ジャッジ・・・文章に含まれる感情を説明してくれるエスティメーター・・・タスクにかかる時間を算出

r-west 2023/11/04

リンク

ChatGPT で自分の仕事がどう楽しくなるのかを考えるネタ集 -2023年10月バージョン-

企業・組織に属している方向けの ChatGPT の社会・ビジネスへの影響を考えるお話です。人とComputerの在り方が大きく変わったこれらも交えて。それらが周囲にあふれ出すその日のために、今はしっかりと Prompt の仕方を学んでおきたいものです。そのためのサンプルも幾つか継続して提示しています - とある人の、変わってしまった日常の一部 - なぜ?何が? ChatGPT で変わるのか? - Plugin の可能性 - Code Interpreter の可能性 - Copilot の可能性

r-west 2023/10/20

リンク

エンジニア・データ分析職の方々にお薦めしたい、LLM時代に不可欠な教養が身に付くテキスト3選 - 渋谷駅前で働くデータサイエンティストのブログ

（『IT Text 自然語処理の基礎』より） 3ヶ月ほど前に空前のLLMブームについて概観する記事を書きましたが、それ以降も世間のLLMに対する狂騒ぶりは収まるどころかますます拍車がかかるという有様で、あまつさえ僕自身の仕事における日常業務にもじわじわと影響が及びつつあり、今後も良きにつけ悪しきにつけLLMと共生し続ける必要がありそうだと感じている今日この頃です。そんな猫も杓子もLLMに群がるが如き空前のブームを受けて、エンジニアやデータ分析職の方々の中には「LLMに興味はあるんだけど世の中にあまりにも多くのLLM関連コンテンツが溢れ返っていて何から手をつけたら良いのか分からない」という向きもあるように見受けられます。そこで、僕も断じてLLM以下生成AIの専門家などではないのですが、個人的に「このテキストを読めばLLM時代を生き抜くことが出来そうだ」と感じた書籍を、全くの独断と偏見で3冊

r-west 2023/07/03

リンク

AI 時代のコードの書き方, あるいは Copilot に優しくするプロンプターになる方法

Copilot をオープンベータ直後から長く使っていて、また補助的に ChatGPT も使いながらコードを書いていて、なんとなくコツがわかるようになってきた。自分は生成モデルのことは表面的な理解しかしてない。雑にバックプロパゲーションの実装の写経したり、Transf ormer の解説とかは読んだが、にわかの域を出ていない。あくまで利用者として生成モデルから吸い出したプラクティスになる。基本的に TypeScript と Rust での経験が元になっているが、他の言語にも適用できる話ではあると思う。自分は TypeScript はかなり得意だが、 Rust はあんまり書けるわけではなく、Rust の学習で ChatGPT を頼ろうとして失敗しているというステージ。 Copilot / ChatGPT とどう付き合うかまず、前提として ChatGPT も Copilot も、コード生成

r-west 2023/06/15

リンク

GPTのモデル構造を可視化した｜shi3z

GPTのモデル構造を目で見てみたい! そんな気持ち、わかるでしょ? 技研フリマをやりながら、どうにかこうにか出力したよご覧あれやり方メモ from transf ormers import AutoTokenizer, AutoModelForCausalLM from torchviz import make_dot tokenizer = AutoTokenizer.from_pretrained("gpt2") from transf ormers import pipeline, set_seed generator = pipeline('text-generation', model='gpt2') m= generator.model x= m.generate() y= m.forward(x) image = make_dot(y.log its, params=dict(

r-west 2023/06/11

ai

リンク

GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad

本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。この記事では、GPT-4の登場から執筆日（2023年5月31日時点）までの2ヶ月間で登場した論文を振り返りながら、まとめて紹介していきます。 LLM/ChatGPTの動向オープンソースLLM モデルオープンソースLLMの調整 Adapter、LoRA Instruction Tuning Human Feedback プロンプトエンジニアリングプロンプトエンジニアリングの課題①：プロンプトに大量の情報を入れられないプロンプトエンジニアリングの課題②：複雑なタス

r-west 2023/06/06

ai

リンク

Jupyter AIが出た！試した！！すごい！！！ - Qiita

ターミナルにトークン付きのURLが表示されますので、ブラウザでアクセスします。起動しました。チャットインターフェイス左パネルにチャットのボタンが追加されています。 Welcomeメッセージが表示されます。 language modelとembedding modelを選択します。これで準備完了です。チャットができます。おお！ノートブックについて質問できるただチャットができるだけではありません。ノートブックのセルに対して範囲選択をすると、チャットエリアの下部にInclude selectionとReplace selectionが表示されます。 Include selectionだと選択したコードを含んだ形で質問ができます。すっげー！ (DefaultActor pid=473) (DefaultActor pid=473) (DefaultActor pid=473) >

r-west 2023/06/05

ai
jupyter

リンク

ChatGPTなどの大規模言語モデルはどんな理論で成立したのか？重要論文24個まとめ

2022年11月にChatGPTが公開され、たった1週間で100万ユーザーを超えたのをきっかけに、GoogleのBardやMicrosoftのBing AI Chatなど、大規模言語モデルを利用したチャットAIが続々とリリースされています。チャットAIを研究しているセバスティアン・ラシュカさんが、チャットAIが実用化されるまでの研究の軌跡を重要な論文24個に絞って要約しています。 Understanding Large Language Models - by Sebastian Raschka https://magazine.sebastianraschka.com/p/understanding-large-language-models ◆目次・主要なアーキテクチャとタスク・スケーリングと効率性の向上・言語モデルを意図した方向へ誘導する・人間のフィードバックによる強化学習(

r-west 2023/06/05

リンク

｢ChatGPT一強｣とは限らない?最新AI業界地図

コンテンツブロックが有効であることを検知しました。このサイトを利用するには、コンテンツブロック機能（広告ブロック機能を持つ拡張機能等）を無効にしてページを再読み込みしてください。 ✕

r-west 2023/04/28

ai

リンク

大規模言語モデルを自社でトレーニング＆活用する方法｜mah_lab / 西見公宏

オンラインIDEを提供しているReplitでは自社で大規模言語モデルをトレーニングしているらしく、そのノウハウがブログ記事にまとめられていたので要約してみました。なぜ自社で大規模言語モデルをトレーニングするのか？企業が独自に大規模言語モデル（以下、LLMs）をトレーニングすることを決める理由は、データのプライバシーやセキュリティから、アップデートや改良のコントロールの強化まで様々なものがあるが、Replit社ではカスタマイズ性、依存度の低減、コスト効率に重点を置いている。カスタマイズ性カスタムモデルをトレーニングすることで、GPT-4のような汎用モデルやCodexのようなコードに特化したモデルではカバーしきれないプラットフォーム固有の機能、用語、コンテキストなどといった特定のニーズや要件に合わせてモデルを調整することができる。例えば、Replitで人気の高いJavascript Re

r-west 2023/04/25

リンク

大規模言語モデルの驚異と脅威

2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを（Research Preview版ではあるが）無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転換点となり得ることは、驚異的なことである。本講演では、ChatGPTがベースにしているInstructGPTを中心に、大規模言語モデルやプロンプト、人間のフィードバックによる強化学習などの技術を概観する。また、ChatGPTのような生成型の人工知能が社会やビジネス、学術にもたらす脅威について述べる。 https://aip.riken.jp/sympo/sympo202303/

r-west 2023/03/29

ai

リンク

GPTの仕組みと限界についての考察（１） - conceptualization

GPT4が登場してChatGPTが盛り上がってますね。本記事は、GPT（を支えるTransf ormerという仕組み）をChatGPTユーザにとって分かりやすく説明し、その能力と限界についての見通しをよくしよう、という趣旨になります。少し長くなりそうなので、全部で記事を3回に分けようと思います。（１）大まかな背景と概要：本記事（２）GPTの能力と可能性：実際の使用例とTransf ormerの仕組みを踏まえて説明（３）GPTの限界と未来展望：Transf ormerの仕組みが持つ限界と研究の進展を予想 GPT3と4の違い：トークン長とは何か？まずここから話を始めます。GPT-3は、パラメータ数が750億個（850GBの容量を食う）でトークン長が4097(GPT-3.5)でした。GPT-4は、パラメータ数は非公開でトークン長は32768ですので、ちょうど8倍になります。さて、トーク

r-west 2023/03/28

ai

リンク

ChatGPTの力で｢片付ける気すら起きないほど荒れた部屋｣が楽に綺麗になった話

ChatGPTの力で｢片付ける気すら起きないほど荒れた部屋｣が楽に綺麗になった話2023.03.22 19:30424,217 かみやまたくみ ※この記事は編集部がChatGPTと触れ合った思い出を記録するものです。 2〜3月が非常に忙しく、気づけば我が家は汚部屋状態。めちゃくちゃすぎて掃除にとりかかる気にさえなりません。でも、これをなんとかしないとまともに仕事はできなさそう。そこでふと思いつきました。GPT-4でさらに賢くなった対話型AIサービス｢ChatGPT｣ならなんとかしてくれるのでは？会話ログを載せるとどうしても長くなってしまうので、最初に結論を書きます。すごい楽に掃除が進みました。｢能率的なやり方｣が一瞬で出てくる→やるだけ最初は｢ChatGPTが適切な回答をするために必要な情報が得られるように、私に質問してください｣と伝えました。前提として、自分は掃除が得意なタイプで

r-west 2023/03/23

課金なしのGPT3じゃだめかな…

リンク

はてなブックマーク

タグ

関連タグで絞り込む (43)

aiに関するr-westのブックマーク (47)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス