タグ

ブックマーク / ascii.jp (53)

  • AIモデル「Gemini」にフォーカスするグーグル。OpenAIよりも有利な点はどこか (1/3)

    「今回はグーグル、えらくフォーカスが絞れているなあ」 米・マウンテンビューのグーグル社に近いイベントスペース・Shoreline Amphitheatreで「Google I/O 2024」の基調講演を聞きながら、筆者はそんなことを考えていた。 Google I/O初日の基調講演は2時間ある。いつもなら複数のテーマに分けて新機能・新製品が発表されることになるのだが、今年ははっきりとした軸が1つあった。それはもちろん「Gemini」だ。 同社のコア技術であるGeminiにフォーカスし、あらゆる製品とサービスにGeminiを活用することを「The Era of Gemini」としてアピールした。 そこで発表された技術にどんな意味があったのか、改めて分析してみよう。 一気にグーグルは「Gemini一色」に Geminiの存在は昨年のGoogle I/Oで公表されたものだ。Google I/O

    AIモデル「Gemini」にフォーカスするグーグル。OpenAIよりも有利な点はどこか (1/3)
  • 15歳の高校生、「日本語能力最強」のAIモデル開発 AITuber向けに設計

    15歳で現役高校生の開発者「Holy-fox/子狐」氏は5月9日、パラメーター数7Bクラスとしては日語能力が最強となる大規模言語モデル(LLM)「ArrowPro-7B-KUJIRA」を公開した。 「AITuberの魂」になることを想定 7Bにおいて日語能力最強のモデル、ArrowPro-7B-KUJIRAができました。Elyza-task100においては約3.8をマークしています!AItuber用途を主眼において設計されています(それ以外もできるよ!) https://t.co/kiywdI5YCs — Holy-fox/子狐 (@Holy_fox_LLM) May 9, 2024 同モデルはMistral系のオープンソースLLM「NTQAI/chatntq-ja-7b-v1.0」をベースに、AITuber(生成AIを使ったバーチャルYouTuber)やAIアシスタントでの利用を想定

    15歳の高校生、「日本語能力最強」のAIモデル開発 AITuber向けに設計
    kappaseijin
    kappaseijin 2024/05/11
    “開発環境は『AMD Ryzen 7 5700X』、『NVIDIA GeForce RTX 4060 Ti 16GB』、32GB DDR4 RAMに、4TB m.2ストレージです” ガチ勢すごい。結果を出すために投資をしていて出来てるの偉いなあ。
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
  • 【自腹レポ】アップル「Vision Pro」をハワイで買った。その美点と価値はどこにあるのか(西田宗千佳) (1/4)

    アップルが開発した初の空間コンピューター「Apple Vision Pro」を、ハワイで購入してきた。 予約までの諸々はすでに「約50万円のアップル「Vision Pro」予約にいたった経緯を解説する」と題した記事を掲載しているが、その時から諸々変化もあって、今は実際にモノを手にしている。 ハワイで実機を手にするまでの経緯と実機写真、そしてファーストインプレッションをお届けしよう。 急遽ハワイへ飛んで発売日にゲット 前回解説した時には、品物は在米の友人宅に送り、そのあと日に送ってもらう予定でいた。 だがその後、「西田さん、ハワイならまだ2月2日に受け取れそうですよ」という悪魔の誘いが、同じく購入を予定しているライターの石川 温さんから聞こえてくる。 発売日当日に手に入って、しかも現地でテストできるならそれに越したことはない。そして、旅の道連れがいるというのも心強い。 というわけで、予約を

    【自腹レポ】アップル「Vision Pro」をハワイで買った。その美点と価値はどこにあるのか(西田宗千佳) (1/4)
  • 【自腹レポ】アップルVision Proの「歴史的価値」はなにかを考える(西田宗千佳) (1/3)

    Vision Proを購入して一週間ほどが経過した。その間筆者は毎日使っている。 SNS上ではVision Proを使った動画がバズる一方で、「結局できることはほかと同じではないか」「過去にも似たようなものはあった」という話が出てくる。 では、Vision Proは、コンピュータの歴史上どう位置付けられるべきなのか? マイクロソフトの「HoloLens」やMeta Quest、果ては初代MacintoshやWindowsのことまで考え、まとめてみよう。 Vision Proがしていることは 「空間にオブジェクトを並べることだけ」だが…… 空間にアプリケーションのウィンドーを浮かべ、それらを並べて空間を活用して作業をする。 極論すれば、Vision Proがやっているのはこれだけだ。 映画は「巨大なウィンドーを空中に配置して楽しむ」ことだし、複数の作業をするのも同様。巨大な恐竜を空中に表示す

    【自腹レポ】アップルVision Proの「歴史的価値」はなにかを考える(西田宗千佳) (1/3)
  • スマホがなかった時代の寵児! ソニー「CLIE」が始まってから終焉を迎えるまで

    ◆持ち歩ける情報処理端末「CLIE」は未来だった 今は国民のほとんどがスマートフォンを持っている時代ですが、2000年頃はまだそんなものはなかった頃、いかに情報処理端末的なガジェットを持ち歩くことを夢みたことか。 確かにケータイをいつも身につけて、単なる通話だけじゃなくて、カメラもついてて音楽も聴けて、ケータイ用に用意されたサイトを見たりショートメッセージくらいはできても、それぞれのクオリティーはまだまだ低くて、なんとももどかしい窮屈さから逃れられませんでした。 その当時、最も処理速度の速いはずのノートパソコンを持ち運ぶのが最善だとわかってはいても、やっぱり重くて大きい。VAIOはあくまでも Windowsという路線に乗っかっているもので、起動するだけで待たされるし、バッテリーもすぐになくなるし、そもそもHDDが壊れるかもしれないというリスクを背負っていたので、気軽に外に持って行くわけには

    スマホがなかった時代の寵児! ソニー「CLIE」が始まってから終焉を迎えるまで
  • AIを活用し音声のみで操作「rabbit r1」カッコいい筐体はTeenage Engineering

    米ベンチャー企業のRabbitは1月9日(現地時間)、ラスベガスで開催されているCES2024において、AIを活用した音声のみで操作できるモバイルアシスタントデバイス「Rabbit r1」を発表した。同社ウェブサイトにて199米ドル(およそ2万8800円)で予約注文受付中。 LAM(大規模アクションモデル)がアプリの操作を学習 2.88インチのタッチスクリーンが配置された筐体は手のひらサイズの正方形。ユニークかつスタイリシュなシンセサイザー「OP-1」で知られるスウェーデンの音楽機器メーカー「Teenage Engineering」がインダストリアルデザインを担当している。

    AIを活用し音声のみで操作「rabbit r1」カッコいい筐体はTeenage Engineering
  • 画像生成AI、フリー時代は終わりに向かう? 有料サービスが目立ちはじめた (1/4)

    クラウドサービスのMidjourney v6で生成し、やはりクラウドサービスのMagnifi AIで高解像度化した画像(筆者作成) 年末になり、画像生成AI技術を応用した、動画生成の研究やサービスが次々に発表になりました。しかし、企業が研究に関わったものは、その多くはコアとなるコードやデータ部分が公開されない傾向が増えつつあります。Stable DiffusionのStability AIも、ついに商用利用の有償化に踏み切りました。一因は開発コストと収益とのバランスにありそうです。 動画生成で話題になった「MagicAnimate」と「AnimateZero」 動画生成技術として大きく話題になったのは、1枚の画像とモーションシーケンスを用意すれば自然なダンスのような動画を作れる「Magic Animate」ですね。 1枚の画像からキャラクターの一貫性を維持した動画を作れるということで、大き

    画像生成AI、フリー時代は終わりに向かう? 有料サービスが目立ちはじめた (1/4)
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
  • 偽名で運用 !? Azureデータセンターの「トリビア」を集めてみた

    世界140カ国以上の地域に100以上配置されているマイクロソフトのデータセンター(DC)。ここで、Microsoft Azureのほか、Office 365、OneDrive、Bingなど同社のクラウドサービスが運用されている。今回は、思わず誰かに話したくなる「Azureデータセンターのトリビア」を集めてみた。教えてくれるのは、マイクロソフトテクノロジーセンター センター長の澤円さんだ(聞き手、アスキー羽野三千世)。 AzureのDCは・・・「知られざる謎の組織」が運用している 澤さん:AzureのDCは“知られざる謎の組織”によって構築、運用されています。この組織は「MCIO(Microsoft Cloud Infrastructure and Operations)」という名称で確かにマイクロソフト社内に存在しているのですが、MCIOに誰が所属しているのかは、社員にも知らされていません

    偽名で運用 !? Azureデータセンターの「トリビア」を集めてみた
  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
    kappaseijin
    kappaseijin 2023/12/04
    “ペイントソフト「Krita」向けに開発された「Generative AI for Krita」”
  • コロナ禍の裏で中国で爆発的に増えたRISC-Vコアの出荷数 RISC-Vプロセッサー遍歴 (1/3)

    2020年以降に爆発的に増えているRISC-Vコアの数。ただし、2025年までに600億個というSemico Researchが出した資料の数字はさすがに無茶な推定だとは思う 米中貿易摩擦の結果、中国の半導体企業がRISC-Vに傾注 2016年後半あたりから、RISC-V FoundationのFoundation Memberは相次いでRISC-Vのコアの開発やRISC-V向けのソフトウェアなどの開発を手がけているが、先にRISC-Vに傾倒し始めたのは中国であった。 中国と米国は2015年頃から不協和音が出ていた。ただオバマ政権時はあまり強硬な手段を取らなかったこともあり、それほど大きな問題にはならなかった。しかし、2017年にトランプ政権に変わり、デカップリング政策を取ったことで急速に関係が悪化する。 BIS(米商務省産業安全保障局)は、特定技術を利用した製品の輸出や移転をする際に認

    コロナ禍の裏で中国で爆発的に増えたRISC-Vコアの出荷数 RISC-Vプロセッサー遍歴 (1/3)
  • 生成AI、学習時の著作権使用料は“支払い義務なし”の可能性が有力に? (1/4)

    11月上旬、岸田首相の生成AIを使って作成されたフェイクニュース動画が問題になりました。 5日、日テレビは自社のニュース番組のロゴが使われてはまずいということで強めに注意を呼びかけましたが、6日、松野博一官房長官は「罪になる場合もあるのでくれぐれも慎んでほしい」と記者会見時に、やや抑制的な物言いをしました。もちろん、フェイクニュースを流すことは、生成AIに関係なく、現行法で刑事罰にも当たる可能性のある行為です。 その後、14日に、YouTubeからAI生成動画に関するガイドラインが出ましたが、そこでも公人のパロディは必ずしも規制対象にするわけではないという方針が出されていました。これはどちらかというと、来年に大統領選を控えたアメリカでフェイク動画拡散の可能性が高まってくるため、事前対策をしているという側面があると思います。 生成AIの登場でフェイクの作成が容易になったとも言われはじめてお

    生成AI、学習時の著作権使用料は“支払い義務なし”の可能性が有力に? (1/4)
  • データセンターの所在地ってやっぱり書いてはいけないのか?

    いろいろなところからマサカリが飛んでくるのはわかっているが、以前から感じていた疑問について書いてみたい。「データセンターの所在地ってやっぱり書いてはいけないのか?」である。だって、ググれば所在地は出てくるんですよ。いろいろ秘密の多いデータセンターだが、インフラ界隈での内輪受けみたいな感じになっていやしませんかね。 実は制約の多いデータセンター取材 ITインフラ系の記者は、たまにデータセンター見学ツアーに招待される。エクイニクスやさくらインターネット、NTTコミュニケーションズなど、私も相当データセンターは見ている方だ。Coltテクノロジー(旧KVH)はシンガポールまで、IIJはコンテナ型データセンターを見に島根まで行っている。IDCフロンティアに至っては北九州も、白河も、府中も見ている。 5月には大阪までデジタルエッジのデータセンターを見にいった。関西のデータセンター事情までいろいろ説明し

    データセンターの所在地ってやっぱり書いてはいけないのか?
  • ゲームの“自動生成”技術がすごいことになっている (1/4)

    いま生成AIが話題になっていますが、AI技術の一つである「プロシージャル生成」の考えも重要です。プロシージャルというのは数式や関数にもとづき3Dコンテンツを生成する手法で、「手続き型」とも言われます。自動的にデータを作り出すという側面から、生成AIとプロシージャル生成は混同されることがありますが、実はまったく違う背景を持つ技術です。Epic Gamesが新たにゲームエンジン「Unreal Engine 5.2」に搭載したプロシージャルコンテンツ生成機能(PCG)は驚くべきものでした。3月のGDCで発表されていたデモマップ「Electric Dream」が6月21日に公開されています。今回はこのデモマップを使って技術を紹介しながら、生成AIとの違いを見ていきます。 お待たせしました! Electric Dreams 環境サンプル プロジェクトを無料公開しました!#UnrealEngine 5

    ゲームの“自動生成”技術がすごいことになっている (1/4)
  • アップル「Vision Pro」それはザッカーバーグが作りたくても作れなかったもの (1/4)

    アップルがWWDC23で発表した「Apple Vision Pro」。ティム・クックCEOはもともとVRではなくARをやるというようなことを言っていたので発表自体に驚きはなかったんですが、問題はどこまで実現してくるんだということでした。結果としてはこれまでの悪いうわさをすべてひっくりかえすような発表だったと感じています。 アップルが何より強いのは自社でハードウェアの設計/製造ができて、OSレベルでソフトウェアの設計ができること。膨大なセンサーを搭載し、それを制御するための「R1」という新型チップを設計することで、VRに起きがちな遅延の問題を乗り越えてきました。 これまでのVR/ARデバイス、たとえばメタの「Quest Pro」のような一体型のタイプにはいくつも限界がありました。OSはAndroidベースだし、チップもパワーが足りないため、思ったとおりに動いてくれずにイラッとしてしまう。メタ

    アップル「Vision Pro」それはザッカーバーグが作りたくても作れなかったもの (1/4)
  • 画像生成AI 速いマシンは世界が違う (1/4)

    「Stable Diffusion」のような画像生成AIは、ゲーム開発の場面で実際に使い物になるのでしょうか。マウスコンピューターのクリエイター向けPC「DAIV」のDAIV DD-I9G90(NVIDIA GeForce RTX 4090搭載)とDAIV DD-I7N60(NVIDIA RTX A6000搭載)を比較しながら、筆者が開発に関わるインディゲーム「Project-GENESIS」での背景のプロトタイプ制作を通じて、その可能性を探りました。画像の出力(生成)速度だけであればRTX 4090に圧倒的に軍配が上がりますが、複数のアプリをまたがった作業をする場合にはVRAM(ビデオメモリ)搭載量が48GBと多いRTX A6000が生産性を高めると考えて良さそうです。コンピュータの世界ではいつの時代も「速さは正義」であることを、画像生成AIを実践で使おうとして改めて痛感しました。 2機

    画像生成AI 速いマシンは世界が違う (1/4)
  • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

    画像生成AIStableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

    画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
  • 99年間使える! 買い切り型クラウドストレージ「pCloud」の多機能超コスパぶりを伝えたい (1/4)

    クラウドストレージは便利だけど 何十年もお金を払い続けられるか心配…… あらゆるファイルのサイズが拡大傾向にある昨今。スマホで撮影した写真は1枚あたり数MB、画面キャプチャなら10MBを超えることも。子どもの成長記録を動画で保存しようものならGB単位でデータが増えていく。 そうしたファイルの保存先として選択されるHDDは、大容量化・低価格化が進んでいる。大量のデータを低コストで保存できるのはうれしい限りだが、使い続けるほどに故障のリスクも増える、つまり大切なデータを失ってしまう可能性が高まる。 ならばNASという選択肢はどうだろう。しかしNAS環境を自分で構築できるほどITリテラシーが豊富な人ばかりとも限らない。いくら大容量HDDが手に入れやすくなったとは言え、多くのファイルを長期間、的確に管理するのはハードルが高い。 というわけで、このところHDDよりも頼りにされているのが「クラウドスト

    99年間使える! 買い切り型クラウドストレージ「pCloud」の多機能超コスパぶりを伝えたい (1/4)
    kappaseijin
    kappaseijin 2023/04/02
    この業界で買い切り生涯永久はお題目だけだろうけど予備はいくらでもあってもいいので自宅NASが面倒い人には良さそう