[B! ai] fashiのブックマーク

GPT-4oに対応した「Copilot」が凄すぎる！ AIが「マインクラフト」の画面を見て会話でアドバイス「Oh no! It's a Zombie！」／【やじうまの杜】

fashi 2024/05/21

ai
chatgpt

リンク

GeminiがYouTube動画を一瞬で要約してくれるようになった（しかも無料） | ライフハッカー・ジャパン

PayPayカードのメリット・デメリット|怖いと言われる理由と評判レビュー。ゴールドと一般どっちがおすすめ?

fashi 2024/05/21

公開リンクとダークモードの設定しかない

ai
google

リンク

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し

fashi 2024/05/20

ai
読み物

リンク

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能 | テクノエッジ TechnoEdge

Googleは5月14日～15日（現地時間）、年次開発者会議イベント Google I/Oを開催しました。スマートフォンのPixel 8aはイベント直前に発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーに身近に感じられそうなのが、有料サービス Gemini Advancedに加わった多数のアップデートでしょう。 Google One AI Premium加入者が利用できるGemini Advancedについて、高性能な Gemini 1.5 Proの解禁など、新機能を発表しています。 Gemini 1.5 Proが利用可能にまず大きなところでは、最新のAIモデル「Gemini 1.5 Pro」が、日本語を含む35以上の言語・150か国以上において、Gemini Advancedで利用可能となります。 Gemini 1.5 Pro自体は2月に発表されており、開

fashi 2024/05/18

AI
google

リンク

パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現

fashi 2024/05/15

リンク

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」？ | テクノエッジ TechnoEdge

問題の部分は、動画開始後1分を過ぎたあたり。レトロなフィルムカメラを手に持つ青年が、「なんでレバーが最後まで動かないの？」と質問したところ、GoogleのAIは即座にいくつかの回答を提示し、最後に最も最適と思われる答えを強調表示しました。ところが、その強調された答えは「裏蓋を開けて、そっとフィルムを取り出す」というものでした。もし、フィルムカメラ世代の人々やカメラ好きな人々がこの答えを示されたなら、きっと慌てることでしょう。 (▲画像：「裏蓋を開けてそっとフィルムを取り出す」回答をハイライト。) 手巻き式のカメラでフィルム巻き上げレバーが途中で止まるようになったら、それはいま使っているフィルムカートリッジの撮影可能枚数が終了したことを意味します。そうなった場合は、カメラ内にあるフィルムをカートリッジ内に完全に巻き戻してから取り出し、現像にまわすというのが正しい手順です。ところがGoo

fashi 2024/05/15

ai

リンク

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

fashi 2024/05/13

「RTX A6000（GDDR6 48GB）搭載PCでやっと動作しました」何はなくともVRAM

ai

リンク

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.

fashi 2024/05/13

ai

リンク

結局ChatGPTとGemini、Claudeのどれを使えばいい? 色々比較した

fashi 2024/05/09

ai
chatgpt

リンク

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集 | テクノエッジ TechnoEdge

こうした動きと並行して、OpenAIは一部の映像クリエイターにSoraを試用してもらい、その作品を積極的に公開しています。中でも僕が注目したのは、「パンクロック・ピクサー」の異名を持つshy kidsというカナダの映像プロダクションが制作した「Air Head」です。これは頭が黄色い風船で出来ている主人公が、自転車に乗ったり、サボテンだらけの通路を歩いたり、風に飛ばされた頭を胴体が追いかけるといった内容の、アイデアに満ちていてAI生成動画の可能性を示す1分21秒の小品でした。ところが、4月半ばにfx guideというオンラインメディアがshy kidsを取材して、Soraの実際の使用感を語った”Actually Using SORA”という記事を掲載したのです。それによると、Soraも他の動画生成AIと同じく、どのような映像が生成されるかはスロットマシン（昨今の日本風にいえば、ガチャ）の

fashi 2024/05/07

ai

リンク

AI性能を重視したIntel第14世代SoC「Core Ultra」に搭載されたNPUの性能とは？

Intelが2023年12月に正式発表した第14世代CoreプラットフォームのノートPC向けプロセッサ「Core Ultra」は、2023年9月に発表されたMeteor Lakeアーキテクチャがベースになっています。そんなCore UltraにはAI処理に特化したニューラルプロセッシングユニット(NPU)が搭載されており、このNPUについて海外メディアのChips and Cheeseが解説しています。 Intel Meteor Lake’s NPU – Chips and Cheese https://chipsandcheese.com/2024/04/22/intel-meteor-lakes-npu/ Core Ultraに搭載されたNPUは「NPU 3720」と呼ばれています。そんなNPU 3720には2つのニューラルコンピューティングエンジン(NCE)タイルが搭載されており、こ

fashi 2024/05/06

「NPUでStable Diffusionを実行するのは、フラストレーションがたまります」 iGPUより遅いんだ…

リンク

すがやみつる先生が生成AIを使ったことでAIを憂う人たちから大量の質問が殺到する→質問に丁寧に返答、ベテラン漫画家が話す「模倣について」の考え方がためになる

すがやみつる @msugaya 私も試してみました。プロンプトは、以下のとおりです。＊＊＊＊＊『ゲームセンターあらし』というタイトルのマンガがありますが、このマンガに関係なく、タイトルだけのイメージから、美少女がゲームセンターで激しくゲームをプレイする絵を、マンガタッチで描いてください。＊＊＊＊＊こちらの方が年齢が高そうですね(^_^)。 ChatGPT経由でDALL-E3に描いてもらいました。 2024-04-30 22:26:48 ジロー @i9r82k こんこんばんばん本日夜便は、ゲームセンターあらしより「ゲームセンターあらし」ですゲーセンというか、カラオケじゃないか？黒髪ショートカットって意外に珍しい気がするなんか悪友というか、腹を割って話せる関係っぽい感じがします＃画像生成AI ＃美少女 pic.twitter.com/8SF9NJb1QR 2024-04-30

fashi 2024/05/05

リンク

Google、新AIアシスタント Gemini モバイルアプリを日本でも提供開始。Googleアシスタントを置き換え | テクノエッジ TechnoEdge

Googleは4月30日（現地時間）、生成AIサービス Geminiモバイルアプリの提供地域を拡大すると発表しました。日本でもAndroidではGoogle Playストアからダウンロードが可能。iOSの場合は専用アプリはなく、Googleアプリからのアクセスとなります。発表は4月30日でしたが、実際には1週間ほど前にはGoogle Playストアからダウンロードできていました。また、一部のAndroid端末では、2月末からGoogleアシスタントを置き換える形でGeminiが利用可能になっていました。なお、アプリ版でも初回起動時にGoogleアシスタントからの切り替えを求められるので、アプリでGeminiを利用し、音声アシスタントとしてGoogleアシスタントを使い続けるということはできないようです。

fashi 2024/05/05

アシスタントやChromeのアドレスバーに実装されるのは本気度高いなと思ったが日本語文字化けで片手落ち / 3日で直ってた

google
ai

リンク

拡散モデルを用いた2Dバーチャル試着技術について - BASEプロダクトチームブログ

はじめにこんにちは。BASEのデータ分析チーム（Data Strategy Team）で不正対策を行ったり、機械学習モデルを触ったりしている竹内です。先日チーム内の論文読み会でニューラルネットを用いた画像合成によるバーチャル試着技術というトピックに触れる機会があったので、その最近のトレンドについて改めてブログという形でまとめてみました。バーチャル試着は画像生成モデルの実用的なユースケースの一つとして今現在データセットの拡充やアーキテクチャの検証が進んでいる分野の一つであり、個人的には非常にアツいトピックだと感じています。バーチャル試着とはバーチャル試着（Virtual Try On）とは、ある人物がある衣服を着用した状態を画像や3Dモデルなどの情報をもとに仮想的に実現し、どのように見えるか可視化する技術のことです。ネットショップの普及により、店頭に出向かずともPCやスマートフォ

fashi 2024/05/03

AI

リンク

Yahoo!検索、検索結果に生成AIの回答を表示

fashi 2024/05/02

ai

リンク

GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応

fashi 2024/05/02

ai
videocard

リンク

ゴミ出しの問い合わせにＡＩが架空の部署案内、正答率は目標に届かず「市民向けには時期尚早」

【読売新聞】　瀬戸内海に面し、製造業や農業が盛んな香川県三豊（みとよ）市。環境衛生課課長補佐の岡崎英司さん（５１）は昨年１１月、役所のパソコン画面を見て、嘆息した。視線の先には、実証実験中の対話型ＡＩ（人工知能）サービス

fashi 2024/05/01

ai

リンク

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した（CloseBox） | テクノエッジ TechnoEdge

10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。

fashi 2024/04/30

ai

リンク

GitHub、「Copilot Workspace」テクニカルプレビューを開始。ほとんど全ての開発工程をAIで自動化

GitHub、「Copilot Workspace」テクニカルプレビューを開始。ほとんど全ての開発工程をAIで自動化テクニカルプレビューは上記のCopilot Workspaceのページからウェイトリストボタンをクリックして申し込みます。 Copilot Workspaceはほとんど全ての工程を自動化 Copilot Workspaceは、自然言語で書かれたIssue（課題）を基に、Copilotが仕様案と実装計画を示し、コーディングや既存のコードの修正を行い、ビルドをしてエラーがあればデバッグも行うという、プログラミングのほとんど全ての工程をCopilotが自動的に実行してくれる、というものです。人間は各工程でCopilotから示される内容を必要に応じて修正するか、そのまま見守ることになります。 GitHub CEOのThomas Dohmke（トーマス・ドムケ）氏は、Copilot

fashi 2024/04/30

ai

リンク

はてなブックマーク

タグ

関連タグで絞り込む (42)

aiに関するfashiのブックマーク (264)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス