サクサク読めて、アプリ限定の機能も多数!
lyiase のブックマーク 2024/01/22 10:47
Self-Rewarding Language Models[あとで読む]2024/01/22 10:47
このブックマークにはスターがありません。 最初のスターをつけてみよう!
arxiv.org2024/01/21
We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human pre...
17 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /
lyiase のブックマーク 2024/01/22 10:47
このブックマークにはスターがありません。
最初のスターをつけてみよう!
Self-Rewarding Language Models
arxiv.org2024/01/21
We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human pre...
17 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /