[B! ai][llm] Makotsのブックマーク

Makots id:Makots

aiとllmに関するMakotsのブックマーク (2)

日本語に強い大規模言語モデル「Swallow」を公開英語が得意な大規模言語モデルに日本語を教える
要点日本語能力に優れビジネスにも安心して活用できる大規模言語モデルを公開継続事前学習により大規模言語モデルの日本語能力を改善高度な日本語処理が求められる多くの場面で、生成AI 技術の利活用を推進概要東京工業大学（以下、東工大）情報理工学院情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人産業技術総合研究所（以下、産総研）は、日本語能力に優れた生成AIの基盤である大規模言語モデル[用語1]「Swallow」を公開した[参考リンク1]。本モデルは現在公開されている日本語に対応した大規模言語モデルとしては最大規模であり、オープンで商用利用が可能であるため、ビジネスに安心して用いることができる。東工大と産総研の研究チームは、英語の言語理解や対話で高い能力を持つ大規模言語モデル（米Meta社 Llama 2）の日本語能力を拡張することで「Swallow」を構築した
Makots 2023/12/20
ai

llm
リンク
大規模言語モデルの驚異と脅威
2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを（Research Preview版ではあるが）無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転換点となり得ることは、驚異的なことである。本講演では、ChatGPTがベースにしているInstructGPTを中心に、大規模言語モデルやプロンプト、人間のフィードバックによる強化学習などの技術を概観する。また、ChatGPTのような生成型の人工知能が社会やビジネス、学術にもたらす脅威について述べる。 https://aip.riken.jp/sympo/sympo202303/
Makots 2023/03/28
llm

chatgpt

nlp

language

ai

machinelearning

slides
リンク
1