[B! ChatGPT] ChatGPTの仕組みを理解する

sotet “セクション”

2023/03/28 リンク

yarumato “自らが意志を持つような返答は、言語モデルが学習の中で自然と自我を持ったのでしょうか？　違います。こう答えてほしいと思うデータセットを「人手で」大量に作り、学習させている。fine tuning、報酬モデル”

2023/03/28 リンク

stealthinu ChatGPTの元となっているInstructGPTでの学習の改善手法について。会話用学習セットと良い回答の点数作って強化学習させる。

2023/03/28 リンク

misshiki “ChatGPTそのものがどのような枠組みの上で成り立っているのかをざっくりと理解できることが本記事のゴール”

2023/03/28 リンク

satosssi HireRooはエンジニアの技術評価のサービスなので、評価をハックできるGPTの出現はかなりの脅威だろうなあ。GPTある世界での技術力の評価手法はどんなのがいいんでしょね（真剣）

2023/03/28 リンク

webnoshiori ふむ

chatgpt

2023/03/28 リンク

monochrome_K2 現状の優秀なチャットAIは人が教え方を工夫することでもたらされているという認識で合っているのかなと思う

AI

2023/03/28 リンク

pazl Ghost in the Shell

2023/03/28 リンク

T-norf OpenAIはGPT3ベースだったと思うけどトークン従量課金でファインチューニング可能なモデル4種類をクラウド提供してるよ。あまり使った報告なくて、どれぐらいの課金でどれぐらいの精度だせるかは、私も知りたいんだけど

2023/03/28 リンク

richmikan 作文する方の説明はあれど、ユーザーの文章を意味を理解する方の説明が見当たらない。

2023/03/28 リンク

AFRO_Beet ネット上からの学習データとfine tuningは赤ちゃんと親の関係に似てるなぁ～！人間の赤ちゃんだって狼に育てられればオオカミ少女になっちゃうもんね！

2023/03/28 リンク

qinmu InstructGPT。

技術

2023/03/28 リンク

natu3kan 学習のさせ方にもコツがいるんだな。そう考えると人力も重要ってことよな。最良の回答になるためのケースの類型をコツコツ教えていくのって。手間をかけるとよくなるのオープンワールドのゲームみある。

AI

2023/03/28 リンク

mayumayu_nimolove 日本人は作るよりも作られたものの分析が得意なのかもな

2023/03/28 リンク

spaciba8443 ]

ChatGPT

2023/03/28 リンク

qpci32siekqd OpenAIのドキュメンタリーに書かれている以外に、実際作る場合を考えるとどうやって学習させてるとか、モデルいくつに分割してるのかとか、そんな強化学習上手く制御出来るのかとか、色々気になってくる

2023/03/28 リンク

sisicom 手順というか組み立てというか

2023/03/28 リンク

shunkeen ヘビーユーザーが頑張ってRMやって、自身の価値観を反映したPPOが作れれば、自分だけのInstructGPT作れそう。なんなら、シナリオライターがひたすら調教すれば、一貫したキャラを保った無限にセリフを出すAIが作れそう。

AI
文章

2023/03/28 リンク

tick2tack 人間らしい回答をする仕組み。Supervised Fine Tuning: 人の手によるデータでの再学習 Reward Modeling: 複数出力に対する評価順位付け Proximal Policy Optimization: 報酬が最大になるよう自律的な変化

2023/03/28 リンク

ussiik1 Step1. Supervised Fine Tuning (SFT) Step2. Reward Modeling (RM) Step3. Proximal Policy Optimization (PPO)

2023/03/28 リンク

odakaho “GPTが自動的に自我を学習の中で獲得したわけではなく、”こう答えてほしいな”と思うようなデータセットを人手で大量に作り、それを言語モデルに学習させている”

2023/03/28 リンク

kiririmode モデルを大きくするよりもfine tuningの方が良質な回答を作る際の寄与が大きい

gpt
ai

2023/03/27 リンク

はてなブックマーク

ChatGPTの仕組みを理解する | HireRoo Tech Blogs

記事へのコメント22件

関連記事

ChatGPTの仕組みを理解する | HireRoo Tech Blogs

ブックマークしたユーザー

同じサイトの新着

プロダクトの理解を深めるためにやってよかったこと、うまくいかなかったこと | HireRoo Tech Blogs

コード品質を評価する仕組みの裏側 | HireRoo Tech Blogs

モノレポ内でのReact Hook Formの責務分離の設計 | HireRoo Tech Blogs

エンジニア採用における評価項目とは？ | HireRoo

いま人気の記事

ドカ食いダイスキ！もちづきさん・第1話

【特集】電源の仕組みはこうだ！理解できれば良し悪しも分かる。これで目指せ電源マイスター

安倍氏、2013年参院選で候補者に現金100万円　「裏金」か | 中国新聞デジタル

退職金ゼロにする奇策が全国自治体で横行　非正規公務員5.8万人、勤務が毎日15分短いだけで「パート扱い」：東京新聞 TOKYO Web

いま人気の記事 - テクノロジー

【特集】電源の仕組みはこうだ！理解できれば良し悪しも分かる。これで目指せ電源マイスター

「情シス担当者がいなくなってサーバーやネットワーク機器を管理する人がいないので皆さんで管理しましょう」→斬新すぎる管理方法だった

「知的単純作業」を自動化する、地に足の着いた大規模言語モデル (LLM) の活用

コンテナイメージなのにブート可能な新技術による「Image mode for Red Hat Enterprise Linux」、Red Hatが発表。レジストリなどのコンテナ関連ツールがそのまま利用可能

新着記事 - テクノロジー

ブルームバーグ「Google Pixelが、Xperiaをほぼ窒息に」 - すまほん!!

Developer Advocate｜全方位的に技術を把握し、自社製品・サービスのファンを増やす

クジラの言語構造、想像以上に人間の言語に近かった

中国語のスマホ標準キーボードアプリでキー入力が盗まれる脆弱性　攻撃対象は“10億人規模”と試算

はてなブックマーク

公式Twitter

はてなのサービス

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

ChatGPTの仕組みを理解する | HireRoo Tech Blogs

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント22件

リンクを埋め込む

プレビュー

関連記事

usersに達しました！

ChatGPTの仕組みを理解する | HireRoo Tech Blogs

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう