Google DeepMindから次世代のマルチモーダル生成AI「Gemini」が発表されました。「GPT-4を圧倒」や「人間の専門家を超えた」などの華々しい評価が発表され、驚くようなデモ動画も公開されました。 断片的な情報が飛び交う中、しっかりと技術レポートを読み解いてみます。 どんな生成AIモデル? 定量的な評価は? 具体例は? Gemini - Technical Report はじめに革新的な技術が登場したとき、技術レポートや論文をしっかりと読むことが、急がば回れの近道です。華々しいデモ動画や断片的な二次情報の記事を読んでも、表層的な情報に踊らされて、技術の真の姿を読み解くことはできません。 Geminiに関しては、オープンソースではなく論文もありませんが、技術レポートが公開されています。しかし、60ページの大作であり、英語で書かれているため、多くの人が読むのをためらうでしょう。
Public Domain Image 破壊的イノベーション(disruptive innovation)の発生には2つの前提条件があり、一つは既存産業が性能過剰(performance oversupply)の状況にあること、もう一つが、後発企業がコスト削減で起こす「市場を創造するイノベーション」に加えて、ニッチ製品のパフォーマンスを向上させる「持続可能なイノベーション」だ。最終的には、新規参入企業のニッチな製品が、既存企業が長年保持してきた主流の市場シェアを侵食し、「破壊的イノベーション」が出現する。 ChatGPT の登場以来、巷では「ジェネレーティブ AI 」がさまざまな業界に与える影響について話題になっているので、今回はジェネレーティブ AI をベースに破壊的イノベーションの概念を拡張し、ジェネレーティブ AI がどのような可能性があるのかについて話したいと思う。 その前に、
OpenAIの対話型AI「ChatGPT」は史上最も急速な成長で「月間1億ユーザー」をわずか2カ月で達成するなど、大いに注目を集めています。それに伴い、GoogleがChatGPTのライバルとなる会話型AI「Bard」を発表したり、中国企業が続々とChatGPT風AIを開発していると報道されている一方で、OpenAIはChatGPTのコードを公開していないためChatGPTを効果的に複製することは難しくなっています。AIのディープラーニングトレーニングを最適化するオープンソースプラットフォームのColossal-AIが、ChatGPTトレーニングプロセスをわずか1.6ギガバイトのGPUメモリで7.73倍高速なトレーニングに再現したと告知し、オープンソースで公開しています。 Open-source replication of ChatGPT implementation process!
Published 2022/12/09 21:01 (JST) Updated 2022/12/10 11:49 (JST) 防衛省が人工知能(AI)技術を使い、交流サイト(SNS)で国内世論を誘導する工作の研究に着手したことが9日、複数の政府関係者への取材で分かった。インターネットで影響力がある「インフルエンサー」が、無意識のうちに同省に有利な情報を発信するように仕向け、防衛政策への支持を広げたり、有事で特定国への敵対心を醸成、国民の反戦・厭戦の機運を払拭したりするネット空間でのトレンドづくりを目標としている。 中国やロシアなどは「情報戦」に活発に取り組む。防衛省は、日本もこの分野の能力獲得が必要だと判断した。改定される安全保障関連3文書にも、情報戦への対処力向上を盛り込む。
世界最大規模の画像掲示板である4chanは、多くの匿名ユーザーによりサブカルチャーから政治まで幅広いトピックの会話が交わされていますが、比較的検閲が緩いため過激な言論やヘイトスピーチの温床にもなっています。YouTuberのYannic Kilcher氏が、4chanの中でも特に物議を醸す「/pol/(Politically Incorrect板、政治的非中立/政治的に正しくない/非ポリコレ板)」から抽出した330万件のスレッドで訓練したAI「GPT-4chan」を作ったところ、過激で人種差別的な発言をまき散らす「ヘイトスピーチマシン」が誕生してしまったとのことです。 This is the worst AI ever - YouTube AI Trained on 4Chan Becomes ‘Hate Speech Machine’ https://www.vice.com/en/ar
要点 最先端機械学習モデル「Vision Transformer」に基づく、新たなレンズレスカメラの画像再構成手法を提案 提案した画像処理技術は高速に高品質な画像を生成できることを実証 小型・低コストかつ高機能であるため、IoT向け画像センシング等への活用に期待 概要 東京工業大学 工学院 情報通信系の潘秀曦(Pan Xiuxi)大学院生(博士後期課程3年)、陈啸(Chen Xiao)大学院生(博士後期課程2年)、武山彩織助教、山口雅浩教授らは、レンズレスカメラの画像処理を高速化し、高品質な画像を取得できる、Vision Transformer(ViT)[用語1]と呼ばれる最先端の機械学習技術を用いた新たな画像再構成手法を開発した。 カメラは通常、焦点の合った画像を撮影するためにレンズを必要とする。現在、IoT[用語2]の普及に伴い、場所を選ばず設置できるコンパクトで高機能な次世代カメラが
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く