lyiaseのブックマーク - はてなブックマーク

【Transformerの基礎】Multi-Head Attentionの仕組み
本記事では、Transf ormerの基礎として、Multi-Head Attentionの仕組みを分かりやすく解説します。本記事の構成は、はじめにTransf ormerおよびTransf ormer Blockについて紹介し、Transf ormerにおけるMulti-Head Attentionの重要性について説明します。その後に、Multi-Head Attentionがどのような仕組みで実現されているのかを説明します。本記事を読めばMulti-Head Attentionについて、概要から計算式に至るまで、ほぼ全てをご理解いただけると思います。解説動画は以下になります。 Transf ormer Transf ormer[1]とは2017年に高精度な機械翻訳モデルとして登場した機械学習モデルです。Transf ormerが提案された論文のタイトルは「Attention Is All You
lyiase 2023/09/07
機械学習

Deep Learning

人工知能
リンク
GPT-1の仕組みを解説！
皆さんこんにちは。近年、画像生成AIやテキスト生成AIなどの多数の生成AIが注目を浴びています。そんなか、2022年の末から2023年の初めにかけて多くの世間を驚かせたテキスト生成AIであるChatGPTはまだ記憶に新しいでしょう。本記事では、そんなChatGPTの技術の元となっているGPTの元祖、GPT-1について解説していきます。 GPT-1の概要 GPT-1とは、OpenAIが2018年に公開した大規模言語モデル（LLM）です。Googleが2017年に発表したTransf ormerと呼ばれる機械学習モデルのデコーダ部分をベースにしたモデルで、BookCorpusと呼ばれる大規模なコーパスで事前学習されました。Transf ormerはエンコーダデコーダの形状をしており、その生成部分に該当するデコーダを事前学習しているため、Generative Pretrained Transf orm
lyiase 2023/09/01
機械学習

Deep Learning

人工知能
リンク
1

はてなブックマーク

タグ

ブックマーク / developers.agirobots.com (2)

お知らせ

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

今週のはてなブックマーク数ランキング（2024年5月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / developers.agirobots.com (2)

【Transformerの基礎】Multi-Head Attentionの仕組み

GPT-1の仕組みを解説！

お知らせ

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

今週のはてなブックマーク数ランキング（2024年5月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス