2023年3月14日に発表された大規模自然言語モデル「GPT-4」は既存のモデルに比べて性能が大幅に向上し、さまざまなタスクをより正確にこなせるようになったことが報告されています。そんなGPT-4を使ったテストで、ボットを防ぐために設けられた検証システムをGPT-4が驚くべき方法で突破したことが明らかになりました。 GPT-4 Technical Repor (PDFファイル)https://cdn.openai.com/papers/gpt-4.pdf ChatGPT posed as blind person to pass online anti-bot test https://www.telegraph.co.uk/technology/2023/03/15/chatgpt-posed-blind-person-pass-online-anti-bot-test/ GPT-4を手
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アメリカ合衆国著作権局は、連邦官報に掲載した新しいガイダンス文書のなかで、テキストをAI画像生成モデルに与えて出力された画像は、米国では著作権で保護されないと規定しています。 官報にはMidjourneyやStable Diffusionのような現在のAI画像生成モデルは「プロンプターが何を描かせたいかを特定するが、その指示がどのように出力に反映されるかは機械が決定する」と記されており、わかりやすくいえば絵画の買い手(ユーザー)が、「こんな絵が欲しい」という手紙(テキストプロンプト)を画家(AI)に渡して絵を描かせているのと同じ構図だということです。 もっと言えば、この考え方は画像だけでなく、文章や音楽、映像
OpenAI が大規模言語モデル GPT-4 を正式発表しました。 会話型AIとして話題になった ChatGPT に従来使われてきた GPT-3.5 と比較して、多くの点で劇的に進化しています。例を挙げれば、 画像を扱えるマルチモーダル化。何が映っているか、どんな状況かを認識(例:テーブルに載った食材でレシピを考える、風船の紐を切れば空に飛んでゆくと推論など) 扱えるテキスト量が8倍以上に増加(2万5000ワード超)。より長く詳細な指示を受けたり、長い文章からスタイルを模倣する、従来より長い文章を生成するなど。 知識量および推論能力が大きく向上。米国の大学入試共通テストにあたるSATや弁護士試験など、多数の試験において受験者の上位10%内など人間を超える結果。(GPT-3.5は下位10%の成績) 創造性も向上。たとえば「Aで始まる単語からアルファベット順にZで始まる単語まで、重複なし26個
Google が生成AI (ジェネレーティブAI)を Gmail やドキュメント・スライド・スプレッドシートなど Workspaceアプリ全般に組み込むことを発表しました。 ジェネレーティブAIでできることの例は、 Gmail の下書き、返信、要約、優先順位づけ ドキュメントでのブレインストーミング、校正、執筆、書き直し スライドで自動生成された画像、オーディオ、ビデオを使って、クリエイティブなビジョンを作成する スプレッドシートの自動補完、数式生成、文脈に応じた分類により、元データから洞察や分析につなげる Meet で新しい背景を生成し、会議のメモを作成する Chat で物事を進めるためのワークフローを実現する Google WorkspaceのジェネレーティブAIはテストユーザーに先行して順次提供し、そのあと一般提供を開始する予定。 Googleが公開した動画では、あくまで演出ではある
米Microsoftが現地時間の2月7日、AIを搭載した「新しいBing」検索エンジンを発表、同日より限定プレビュー版の提供が開始された。PC向けからスタートし、モバイル版のプレビューも追って登場した。 「新しいBing」を試すには、順番待ちのリストに参加する必要がある。筆者は発表された3日目ごろに登録したのだが、最近ようやく利用可能となった。多くのテスターはWindowsユーザーだろうが、MacOSでも最新のMicrosoft Edgeをインストールすれば利用できる。検索エンジンのみならず、ブラウザの乗り換えも共用されるわけだが、2020年からMicrosoft EdgeはChromiumベースになっており、拡張機能などもそのまま使えるものが多いことから、使い勝手はそれほど変わらないのではないかと思っている。 チャットによるAIの検索利用と言う点では、米Open AIが22年11月に公開
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米ノースカロライナ州立大学に所属する研究者らが発表した論文「White Phase Intersection Control Through Distributed Coordination: A Mobile Controller Paradigm in a Mixed Traffic Stream」は、交差点内に多くの自動運転車が入ってくると白色が点灯する新しいコンセプトの信号機システムを提案した研究報告である。 従来の信号機システム(青、黄、赤)に加えて、4つ目に白色を配置する。白色が点灯すると、非自動運転車の運転者は、青、黄、赤の交通ルールでは
ChatGPTは舎弟気質? 「高圧的な命令でマルウェア作成など悪用可能」との指摘 犯罪目的の利用に懸念:この頃、セキュリティ界隈で 学術論文やニュース記事の執筆から学生の試験の手助けまで、その多彩さと便利さで話題に事欠かない対話型AIの「ChatGPT」。一方でマルウェアの作成やフィッシング詐欺といった犯罪目的で利用される恐れもあるとして、サイバーセキュリティ企業が警鐘を鳴らしている。 サイバーセキュリティ企業の米CyberArkはChatGPTを利用して、何度も姿を変えながら検出をかわす高度なマルウェアを簡単に作成することができたと伝えた。このマルウェアを使えば、攻撃者が労力もコストもほとんどかけることなく、企業などのセキュリティ対策をかいくぐることが可能だという。 高圧的な命令で、マルウェアを作成するChatGPT どんな質問にも答えてくれると評判のChatGPTだが、ある程度の悪用を
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 マイクロソフトが、ChatGPTで知られるOpenAIのAI言語モデルを統合したBing検索エンジンとEdgeブラウザーを発表しました。 このBingのプレビュー版はすでにBing.comで提供しており、サンプルクエリーなら誰でも試すことが可能です(ただ、自分でさまざまな検索をしたい場合はサインアップして順番待ちリストに並ぶ必要あり)。 まだ限定的な公開ではあるものの、マイクロソフトは今後数週間でこのプレビューを数百万ユーザー規模に拡大していくとし、モバイル版も間もなくプレビューを公開する予定です。 マイクロソフトはAIによって「より優れた検索、より完全な回答、新しいチャット エクスペリエンス、およびコンテン
GoogleのCEOサンダー・ピチャイが、自然な文章で質問に回答するAIサービス『Bard』と、Google検索への組込みを発表しました。 ピチャイ氏によると、BardはGoogleが以前から研究してきたLaMDA (会話アプリケーションのための言語モデル)を元にした「実験的会話型AIサービス」。 Google検索にBardを組み込むことで、複雑なトピックについて文章で概要を答えたり、2つのものを比較したり、複雑な条件にあう答えを返すなど、従来の検索では難しかった答えが出せるようになります。 例のひとつでは、「ジェイムズ・ウェッブ宇宙望遠鏡(JWST)の新発見について、9歳児に話すならどんな内容にすべき?」という問いに対して、 「2023年、JWSTは「グリンピース」という愛称の銀河系を発見しました。小さく、丸く、豆のように緑色だったのでこの名前がつけられました」 「ジェイムズ・ウェッブ宇
ベートーベンの楽曲に「三三七拍子」は入ってる? 音符36万個を学んだAIで調べる「Beethoven Beats」:遊んで学べる「Experiments with Google」(第29回)(1/2 ページ) 「Experiments with Google」は、Googleが人工知能(AI)や拡張現実(AR)といった最新技術の可能性を示すために、実験的な応用例を紹介するショーケースだ。膨大なコンテンツを公開しており、その多くはスマートフォンやPCで試せる。 この連載では、多種多様な応用例の中から興味深いものをピックアップ。実際に遊んだ体験レポートを通して、裏側にあるテクノロジーや技術の活用方法、その目的を解説する。 読者の皆さんも、ぜひ自分の手で試しながらその仕組みを学んでもらえたらうれしい。きっと、最新技術の魅力に気付くはずだ。 ベートーベンの楽曲に親しもう 聴くだけではない楽しみ方
米Microsoftの研究者らは1月5日(現地時間)、人間が話す声の3秒分のデータを与えると、その人のようにテキストを読み上げられるようになるAI「VALL-E」を発表した。GitHubで公開されたサンプルでは、怒りや眠そうな様子などのトーンも追加できている。 Microsoftが「ニューラルコーデック言語モデル」と呼ぶVALL-Eは、米Metaが昨年10月に発表した「EnCodec」に基づいて構築された。分析した人間の声をEnCodecで個別の「トークン」に分割し、トレーニングデータを使ってトークンを生成するという。 VALL-Eの音声合成機能は、やはりMetaが作成した音声ライブラリ「LibriLight」でトレーニングした。このライブラリには7000人以上の人間による6万時間分の英語音声が含まれている。 VALL-EのWebサイトのサンプルの、「Speaker Prompt」は与えら
「AI自動音声でお伝えしています」 ある朝のNHK「おはよう日本」の画面。ニュース映像の右上に、こんな文字が表示されれていて驚いた。音声に違和感がなく、人間のアナウンサーの声だとばかり思っていたからだ。 意識してよく聞けば、イントネーションや“間”がやや不自然だが、流し聞きしているだけでは分からないレベルだ。 場面がスタジオに転換すると、人間のアナウンサーが2人写った。アナウンサーがそこにいるのに、AIがニュースを読んでいたのだ。 「おはよう日本」だけではない。NHKは、平日午後のニュース、ラジオ、Webのニュース番組の一部などでAIによるアナウンスを活用している。 AIアナウンスはどのように作られたのか? 人間のアナがいるのに、なぜわざわざ、AIにニュースを読んでもらうのか? NHKに聞いた。 放送時間ぴったりにニュースが読めるAI AIアナウンスの音声は、NHKが開発した技術だ。気象情
AIを駆使する作家や漫画家、作曲家の苦悩、将棋でAIに勝てなくなった時代に棋士がとった道。最近はこうしたニュースを見ることが増えてきました。その度に筆者は思います。あ、これ読んだわー、と。 AIの登場により起こりうるさまざまなコンフリクトを予見したマンガ、「AIの遺電子」で体験済みのことだったのです。この作品のTVアニメ化が発表されました。全12話。アニメーション制作はマッドハウス、佐藤雄三監督。公開日などの詳細はまだです。 秋田書店「週刊少年チャンピオン」で2015年から連載されていたSFマンガ「AIの遺電子」は基本的に1話16ページの短編。シンギュラリティ後、超高度のAIが作り出したヒューマノイドと人間が共存する世界を描いています。主人公の須堂光は医者ですが、ヒューマノイドを専門としており、医療とAI、ロボットと人間との関わりによって生まれるさまざまなドラマがそれぞれのエピソードに凝縮
Masanori Kusunoki / 楠 正憲 @masanork ChatGPTに大学院の講義で出している課題をやらせてみた。わたしの授業を聞いていないことは明らかで事実誤認も少なからずあるが、講義を聴いていない学生が提出した課題として読むと、まあもっともらしいことを書くとこんな感じになるわなーという水準に達していて、AIに書かせたと見抜くのは無理だな 2022-12-04 11:42:50 Masanori Kusunoki / 楠 正憲 @masanork Q. コレ私が大学院の講義で出した課題で、学生がAIに回答させると困るんだけど、教員として学生が書いたのか、AIが書いたのか、どうやって見分けたらいいかな。ちゃんとした答えが返ってくる者だから、コレじゃ不可を付けることはできないと困っちゃった。 2022-12-04 11:46:29 Masanori Kusunoki / 楠
「なぁAI……人生相談があるんだけど」 なんでも答えてくれる「ChatGPT」に50の質問ぶつけてみた(1/6 ページ) 人生何かといろいろあるわけで、どんな人でもさまざまな悩みを抱えながら日々生きているだろう。誰かに相談できればいいのだが……そんなあなたにちょうどいいAIがある。 怪しいものではない。AI研究機関である米OpenAIが12月1日(現地時間)に、AIチャットbot「ChatGPT」を公開した。現在はテストとして無料提供中。質問すればAIが答えてくれるのだが、これが結構参考になる。 今回はこのAIに「人生相談」「子供の答えにくい質問」「論理クイズ」「数学未解決問題」など、50の質問をしてみた。どんな答えを示してくれるのか見てみよう。 なお、質問内容はフィクションであり、実在の人物、団体などとは一切関係ありません。 「推しの熱愛が発覚してつらい」 AIはどう慰める? まずは人生
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く