エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
大規模言語モデル(LLM)の概要について | Hakky Handbook
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
大規模言語モデル(LLM)の概要について | Hakky Handbook
大規模言語モデル(LLM)の概要 **大規模言語モデル(LLM, Large Language Model)**は、膨大なデータセ... 大規模言語モデル(LLM)の概要 **大規模言語モデル(LLM, Large Language Model)**は、膨大なデータセットを基に学習した言語モデルのことで、2018 年にBERTのモデルが登場して以来、注目を集めています。 LLM は、与えられた入力から適切な出力を生成する能力を持ち、GPTやBLOOM、LLaMAといった多言語対応のモデルが多いことも特徴です。 大規模言語モデル(LLM)の基本的な仕組み 入力文をベクターに変換(形態素解析などで文をトークンに分割) Encoder(トークンから特徴量を抽出) Decoder(特徴量を基に次のトークンを予測) 入力文に続くトークンの確率を出力 上記の手順を繰り返して、文章が生成されます。 尚、これらのモデルは非常に大規模で、メモリー不足のため一般的なマシンでの実行が難しい場合が多いです。 大規模言語モデル(LLM)ができるこ