サクサク読めて、アプリ限定の機能も多数!
チューリングテストからMMLUまであまり役に立たないベンチマークが(どうすれば適切に数値化できるかもわからないので)仕方なく指標にされてるのは、まだ強いAIへの道の入口にも立ててないことをよく示していると思う
urandom のブックマーク 2023/12/08 02:27
1960年代のチャットボット「ELIZA」がチューリングテストでOpenAIの「GPT-3.5」を破るチューリングテストからMMLUまであまり役に立たないベンチマークが(どうすれば適切に数値化できるかもわからないので)仕方なく指標にされてるのは、まだ強いAIへの道の入口にも立ててないことをよく示していると思う2023/12/08 02:27
このブックマークにはスターがありません。 最初のスターをつけてみよう!
gigazine.net2023/12/07
対話相手が機械なのか人間に予想してもらう「チューリングテスト」の結果、「ChatGPT」に使われるOpenAIの言語モデル「GPT-3.5」が1960年代のチャットボット「ELIZA」に敗北したことがわかりました。 [2310.20216...
12 人がブックマーク・2 件のコメント
\ コメントが サクサク読める アプリです /
チューリングテストからMMLUまであまり役に立たないベンチマークが(どうすれば適切に数値化できるかもわからないので)仕方なく指標にされてるのは、まだ強いAIへの道の入口にも立ててないことをよく示していると思う
urandom のブックマーク 2023/12/08 02:27
このブックマークにはスターがありません。
最初のスターをつけてみよう!
1960年代のチャットボット「ELIZA」がチューリングテストでOpenAIの「GPT-3.5」を破る
gigazine.net2023/12/07
対話相手が機械なのか人間に予想してもらう「チューリングテスト」の結果、「ChatGPT」に使われるOpenAIの言語モデル「GPT-3.5」が1960年代のチャットボット「ELIZA」に敗北したことがわかりました。 [2310.20216...
12 人がブックマーク・2 件のコメント
\ コメントが サクサク読める アプリです /