bluescreenのブックマーク - はてなブックマーク

最近のLLMの学習法のまとめ - SFT・RLHF・RAG｜npaka

最近のLLMの学習法 (SFT・RLHF・RAG) をまとめました。 1. 教師ありファインチューニング (SFT : Supervised Fine-Tuning) 2. 人間のフィードバックからの強化学習 (RLHF : Reinforcement Learning from Human Feedback)

bluescreen 2023/09/08

LLM
勉強

リンク

LLMのファインチューニングで何ができて何ができないのか｜npaka

LLMのファインチューニングで何ができて、何ができないのかまとめました。 1. LLMのファインチューニングLLMのファインチューニングの目的は、「特定のアプリケーションのニーズとデータに基づいて、モデルの出力の品質を向上させること」にあります。 OpenAIのドキュメントには、次のように記述されています。ファインチューニングは、プロンプトに収まるよりも多くの例で学習することで、Few-Shot学習を改善します。一度モデルをファインチューニングすれば、プロンプトにそれほど多くの例を提供する必要がなくなります。これにより、コストを削減し、低レイテンシのリクエストを可能にします。しかし実際には、それよりもかなり複雑です。 LLMには「大量のデータを投げれば自動的に解決する」ような創発的な特性があるため、ファインチューニングもそのように機能すると人々は考えていますが、必ずしもそうではありませ

bluescreen 2023/08/30

LLM
勉強

リンク

Code Llama の概要｜npaka

以下の記事が面白かったので、かるくまとめました。・Introducing Code Llama, a state-of-the-art large language model for coding 1. はじめに「Code Llama」は、コードと自然言語の両方からコードとコードに関する自然言語を生成できる最先端のLLMです。研究および商用利用が可能で、無料で利用できます。「Code Llama」は「Llama 2」ベースで、次の3つのモデルを提供します。・Code Llama : 基本的なコード生成モデル。・Code Llama - Python : Pythonに特化したコード生成モデル。・Code Llama - Instruct : 自然言語の指示を理解できるようにファインチューニングしたモデル。ベンチマークテストではコードタスクにおいて、公的に入手可能な最先端のLL

bluescreen 2023/08/26

リンク

GitHub Copilot Labs の使い方｜npaka

1. GitHub Copilot Labs「GitHub Copilot Labs」は、「GitHub Copilot」の実験的な機能を提供するVSCode拡張です。以下の機能を提供しています。・コードの説明・コードを別の言語に翻訳・コードの編集・読みやすさの向上・型の追加・バグ修正・デバッグコードの追加・削除・コードをステップ毎に説明・コードの堅牢化・コードの分割・ドキュメントの追加・カスタム・テストコードの生成また、「GitHub Copilot Labs」では「GitHub Copilot」とは別の規約が適用されます。より多くの情報を収集する可能性があります。これは、実稼働ではなく、学習を目的として設計されているためになります。 2. GitHub Copilot Labsの開始「GitHub Copilot Labs」の開始手順は、次のとおりです。

bluescreen 2023/07/18

コード
AI

リンク

ローカルLLMの情報まとめ｜npaka

「ローカルLLM」の記事が増えてきたのでまとめました。「Llama 2」ベースのローカルLLMについては、以下でまとめています。

bluescreen 2023/06/11

LLM

リンク

最近話題になった大規模言語モデルまとめ｜npaka

最近話題になった大規模言語モデルをまとめました。 1. クラウドサービス1-1. GPT-4「GPT-4」は、「OpenAI」によって開発された大規模言語モデルです。マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。現在、「ChatGPT Plus」(有料版)で制限付きで利用できる他、ウェイトリストの登録者を対象に「OpenAI API」での利用も開始しています。

bluescreen 2023/03/17

リンク

Stable Diffusion web UI (AUTOMATIC1111) の使い方｜npaka

Stable Diffusion web UI (AUTOMATIC1111) の使い方をまとめました。・Windows 11 ・Stable Diffusion WebUI Docker v1.0.2 ・AUTOMATIC1111 1. AUTOMATIC1111「AUTIMATIC1111」は、「Stable Diffusion」のフォークの1つで、最も豊富な機能が提供されているフォークです。主な特徴は、次のとおりです。・Text-to-Image : 多くのサンプラーとネガティブプロンプトが利用可能。・Image-to-Image : マスキング、トリミング、インペインティング、アウトペインティング、バリエーションが利用可能・GFPGAN、RealESRGAN、LDSR、CodeFormer ・ループバック、プロンプト重み付け、プロンプトマトリックス、X/Yプロット・生成

bluescreen 2022/09/24

リンク

はてなブックマーク

タグ

ブックマーク / note.com/npaka (7)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス