チューリングテストからMMLUまであまり役に立たないベンチマークが(どうすれば適切に数値化できるかもわからないので)仕方なく指標にされてるのは、まだ強いAIへの道の入口にも立ててないことをよく示していると思う

urandomurandom のブックマーク 2023/12/08 02:27

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

1960年代のチャットボット「ELIZA」がチューリングテストでOpenAIの「GPT-3.5」を破る

    対話相手が機械なのか人間に予想してもらう「チューリングテスト」の結果、「ChatGPT」に使われるOpenAIの言語モデル「GPT-3.5」が1960年代のチャットボット「ELIZA」に敗北したことがわかりました。 [2310.20216...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう