記事へのコメント4

    • 注目コメント
    • 新着コメント
    ookitasaburou
    ookitasaburou “しかし、RLHFは実在の人間を使うため報酬の支払いでコストがかさんだり、フィードバックを回収するまでに時間がかかるなどの欠点が存在していました。”

    2023/05/25 リンク

    その他
    nisisinjuku
    nisisinjuku 教師いらず。うぇぇ。

    2023/05/25 リンク

    その他
    misshiki
    misshiki “RLHFは人間を使うため報酬支払いコストがかさみ、フィードバック回収に時間がかかる。「AlpacaFarm」は「人間がどんな評価を返すのか」をシミュレートすることで安価&高速にRLHFを進めることができるツール”

    2023/05/25 リンク

    その他
    shunkeen
    shunkeen 字面だけ読むと、「アルパカ牧場(AlpacaFarm)で人間をシミュレートする」って最高にマッドサイエンスだな。/このツールでOSSの日本語LLMをRLHFでファインチューニングする人とか出てくるのかな?

    2023/05/25 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    人間による評価をシミュレートすることで高速&安価にチャットAIの学習を進められるツール「AlpacaFarm」がスタンフォード大学のチームによって作成される

    大規模言語モデルの学習においては、実際の人間による評価をモデルの出力に反映させる「Reinforcement L...

    ブックマークしたユーザー

    • bayaread2023/05/26 bayaread
    • shion2142023/05/26 shion214
    • sakito09022023/05/25 sakito0902
    • ranto3811242023/05/25 ranto381124
    • p-baleine2023/05/25 p-baleine
    • cockatrice0212023/05/25 cockatrice021
    • ookitasaburou2023/05/25 ookitasaburou
    • nisisinjuku2023/05/25 nisisinjuku
    • chopwave2023/05/25 chopwave
    • misshiki2023/05/25 misshiki
    • CLSmooth2023/05/25 CLSmooth
    • kybernetes2023/05/25 kybernetes
    • kns_12342023/05/25 kns_1234
    • shunkeen2023/05/25 shunkeen
    • yamataku132023/05/25 yamataku13
    • s_ryuuki2023/05/25 s_ryuuki
    • lyiase2023/05/25 lyiase
    • asyst2023/05/25 asyst
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事