“Transformerベースのモデル「phi-1」を発表。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット・HumanEvalでGPT-3.5を上回る成績を収めたことが報告されています。”

misshiki のブックマーク 2023/06/23 14:48

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4738293748543760421/comment/misshiki" data-user-id="misshiki" data-entry-url="https://b.hatena.ne.jp/entry/s/gigazine.net/news/20230622-phi-1-large-language-model-microsoft/" data-original-href="https://gigazine.net/news/20230622-phi-1-large-language-model-microsoft/" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fgigazine.net%2Fnews%2F20230622-phi-1-large-language-model-microsoft%2F" data-user-icon="/users/misshiki/profile.png">Microsoftがたった13億のパラメーターでGPT-3.5超えのHumanEval50.6％をたたき出す「phi-1」を発表</a><ul class="comment-tag" style="list-style: none; margin: 0px;"><li style="float: left">[<a href="https://b.hatena.ne.jp/q/Transformer">Transformer</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/Microsoft">Microsoft</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD">人工知能</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86">自然言語処理</a>]</li></ul><br><p style="clear: left">“Transformerベースのモデル「phi-1」を発表。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット・HumanEvalでGPT-3.5を上回る成績を収めたことが報告されています。”</p><a class="datetime" href="https://b.hatena.ne.jp/misshiki/20230623#bookmark-4738293748543760421"><span class="datetime-body">2023/06/23 14:48</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！