[B! AI] minamishinjiのブックマーク

【笠原一輝のユビキタス情報局】 40TOPS以上のNPUが必要な「Copilot+ PC」を策定したMicrosoftの真の目的

minamishinji 2024/05/27

なるほどなぁ。

リンク

【笠原一輝のユビキタス情報局】 Copilot+ PCとしてハードウェアが大きく進化した新Surface Pro/Laptop

minamishinji 2024/05/25

もう少し待つけど、またPCハードが面白い時代になってきたね。

リンク

「GPT-4o」の声、スカーレット・ヨハンソン激似に本人激怒　「アルトマン氏のオファー断った」ため似た声優で再現か

「ショックを受け、怒り、信じられない思いだった」米OpenAIの生成AI「GPT-4o（フォーオー）」に使われている声の一つ「Sky」が、俳優のスカーレット・ヨハンソン氏にそっくりだと話題になった件をめぐり、同氏が代理人を通じて声明を発表した。声明によると同氏は、OpenAIのサム・アルトマンCEOから「声を提供してほしい」というオファーを受け、断ったにも関わらず、そっくりな声がAIに採用され怒りを覚えたという。ヨハンソン氏は対応のため弁護士を雇わざるを得なかったとし、「透明性の高い解決と、個人の権利を保護するための適切な法律の制定」への期待も述べている。

minamishinji 2024/05/21

最近のOpenAI、なんか変なニュースが多すぎ。

リンク

OpenAIのAI危険対策チームトップが「限界に達し」退社　「安全確保が後回しになっている」

米OpenAIで人間よりもはるかに賢いAI「Superintelligence」（超知能）の制御を目指して昨年結成されたSuperalignmentチームのトップ、ヤン・ライケ氏は5月17日（現地時間）、退社するとXで発表した。「私がOpenAIに参加したのは、ここが超知能の研究を行うのに世界で最適だと思ったからだ。だが、OpenAIの幹部チームと中核的優先事項についてずっと同意できず、限界点に達した」という。 Superalignmentチームはライケ氏と、共同創業者でチーフサイエンティストのイリヤ・サツケバー氏が率いてきた。サツケバー氏は14日に退社を発表している。ライケ氏は、「超知能の構築は本質的に危険な取り組み」であり、「OpenAIは人類全体に大きな責任を担っている」が、「安全性が輝かしい製品の開発より後回しになっている」と警鐘を鳴らす。 OpenAIは昨年2月、AGI（Ar

minamishinji 2024/05/18

リンク

1000億パラメータのLLM、AIスタートアップが公開　フルスクラッチで開発　「ハルシネーションを大幅抑止」

AIスタートアップ企業のストックマーク（東京都港区）は5月16日、1000億パラメータ規模の大規模言語モデル（LLM）を開発したと発表した。「Stockmark-LLM-100b」と名付けられたこのLMは、同社がフルスクラッチで開発したものでハルシネーション（AIがもっともらしいうそをつく現象）を大幅に抑えているのが特徴という。同社は「公開されている既存のLLMモデルを用いずに、当社がフルスクラッチで開発した独自のLLM」と説明。独自に収集したビジネスドメインの日本語データを中心に事前学習させているため、日本語やビジネスドメイン、最新の時事話題に精通しているとしている。ハルシネーションを抑えるため、答えられない質問には無理に回答せず「分からない」と答えるという。同社は「厳密さが求められるビジネスシーンにおいても信頼して活用できるモデルの開発に成功した」とし、独自LLMの性能をアピールし

minamishinji 2024/05/17

リンク

Google I/Oで明かされたAndroidの進化　日本で「Googleメッセージ」開始、RCS対応でKDDIと連携

Google I/Oで明かされたAndroidの進化　日本で「Googleメッセージ」開始、RCS対応でKDDIと連携（1/2 ページ） Googleは、5月14日から15日（現地時間）に渡り、米カリフォルニア州マウンテンビューで、開発者向けイベントの「Google I/O」を開催している。14日の基調講演では、同社CEOのスンダー・ピチャイ氏ら幹部が登壇。生成AIモデルGeminiの最新版である「Gemini 1.5 Pro」や、高速版の「Gemini 1.5 Flash」を発表するとともに、Google DeepMindが開発中のAIエージェント「Project Astra（アストラ）」を披露した。

minamishinji 2024/05/17

どちらかというとGoogleのイベントにOpenAIが発表をぶつけてきたんだよね。 | “OpenAIがマルチモーダルに対応した「GPT-4o」を発表しているが、それに真っ向から対抗した格好”

リンク

Google I/O 2024基調講演まとめ　AI一色、GPT-4oのような機能も

基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。生成AI搭載検索エンジン「AI Overview」（旧SGE）「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」（SGE）を改称し、改善したもの。詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。マルチステップリーゾニング（多段階推論）で、1つの質問で複数ステップの結果を提示する。例として、ピラティスにつ

minamishinji 2024/05/16

我が家のNest Hubはお役御免かな…

ai
google

リンク

米Google、大規模言語モデル「Gemini 1.5 Flash」発表　1.5 Proの軽量版　きょうから利用可能

米Googleは5月14日（現地時間）、大規模言語モデル（LLM）「Gemini 1.5 Flash」を発表した。「Gemini 1.5 Pro」を改良した軽量モデルで、低レイテンシとコストが最も重要なタスク向けに調整されているという。同日からGoogleが提供する開発者向け環境I「Google AI Studio」と「Vertex AI」で最大100万トークンを利用できる。関連記事米Google、動画生成AI「Veo」発表　テキストから60秒超え動画を作成　サンプルも多数公開米Googleは、動画生成AI「Veo」を発表した。 Google、オープンな生成AIモデル「Gemma」公開　商用利用OK、Geminiと同じ技術の軽量LLM 米Googleは、大規模言語モデル（LLM）「Gemma」を公開した。同社が開発するLLM「Gemini」に使ったのと同じ技術を活用して開発した軽量版

minamishinji 2024/05/15

Google AI Studio / Vertex AI が気になる。

リンク

米Google、「プロジェクトアストラ」を発表　スマホに映したモノをAIが“即解説”　ユーザーからは「超クール」と期待の声

米Google傘下のGoogle DeepMindと米Googleは5月14日（現地時間）、AIアシスタントに関するプロジェクト「Project Astra」を発表した。「日常生活で本当に役立つ未来のAIアシスタントの構築を目指したプロジェクト」と紹介し、デモ動画を公開。スマートフォンでリアルタイムに撮影した物体について説明を求めると、AIがスムーズに回答する様子が映っている。動画内では「Tell me when you see sometihng that makes sound.」（音が出るものを見たら教えて）と人が指示し、周りをスマホで撮影すると、米Googleの生成AI「Gemini」が「I see a speaker , which makes sound.」（音が出るスピーカーが見える）と答え、スピーカーがあることを説明する様子が確認できる。その後、スマホに映ったスピーカー

minamishinji 2024/05/15

リンク

［速報］Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

［速報］Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

minamishinji 2024/05/15

リンク

GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→｢ついにコーダーが恐怖を感じる時が来たか｣

kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません．思いついたことをつぶやきます．人生を楽しく生きよう（New!） kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

minamishinji 2024/05/15

作り込みを指示し続けたらある程度複雑な者もできるんだろうなぁ。プログラミングはなくならないけど概念が変わってくる感じ。

リンク

中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当？実際に試してみた - はやぽんログ！

インターネット上である投稿が話題だ。それは特定の中国メーカーのスマートフォンでかつ、特定の場面で「消しゴムマジック」に準ずる機能を利用しようとすると「利用できない」というものだ。その場面とは、北京にある天安門広場だ。北京の有名な観光地であるとともに、中国の歴史的な行事などで幾度も舞台になった場所だ。過去に天安門事件が起こった場所でもあることから、反政府的なデモを防ぐ目的で多くの警備兵が配置されていることでも知られる。前述の反政府的なデモ防ぐ目的から、インターネット上でも、検閲が厳しい場所としても知られている。中国のネットユーザが天安門広場に飾られる毛沢東氏の肖像画を消した画像でも投稿してしまえば、そのアカウントはあっという間に凍結されてしまう。今回フォロワーのなしみるく様よりこの2枚の写真を提供いただきました。 @Hayaponlog お疲れ様です🙏 Huawei機で天安門の写真で

minamishinji 2024/05/15

知らなかった…いろんな国でやってみてほしいかも。

リンク

「GPT-4o」発表　頭一つ抜けた性能をChatGPT無料版にも展開　音声と視覚を備えて“自然な対話”可能に【追記済】

米OpenAIは5月13日（米国時間）、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

minamishinji 2024/05/14

マネタイズ大丈夫なのかな…

リンク

「GPT-4o」発表　人のように音声・画像・テキストで高速応答

minamishinji 2024/05/14

リンク

Hello GPT-4o

GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat

minamishinji 2024/05/14

リンク

結局ChatGPTとGemini、Claudeのどれを使えばいい? 色々比較した

minamishinji 2024/05/09

リンク

【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】　ちもろぐ

月額料金なし、無制限の生成枚数でAIイラストをガシガシ描くなら、Stable Diffusionをローカル環境にインストールする「AUTOMATIC1111版Stable Diffusion WebUI」が必要です。しかし、ローカル版AIイラストはグラフィックボードも必須です。 VRAM容量が多くないとダメ RTX 4000シリーズが良い Radeonは絶対にNG などなど･･･。いろいろな情報が飛び交っていますが実際のところはどうなのか？やかもちグラフィックボードをなぜか40枚ほど所有している筆者が、実際にStable Diffusionを動かして徹底的に検証します。（公開：2023/3/8 | 更新：2024/4/3）この記事の目次 Toggle AIイラスト（Stable Diffusion）におすすめなグラボを検証検証方法：AIイラストの生成速度をテストする AIイラスト

minamishinji 2024/05/09

リンク

ゴミ出しの問い合わせにＡＩが架空の部署案内、正答率は目標に届かず「市民向けには時期尚早」

【読売新聞】　瀬戸内海に面し、製造業や農業が盛んな香川県三豊（みとよ）市。環境衛生課課長補佐の岡崎英司さん（５１）は昨年１１月、役所のパソコン画面を見て、嘆息した。視線の先には、実証実験中の対話型ＡＩ（人工知能）サービス

minamishinji 2024/05/01

けっこう手間がかかって頻度も高い仕事の代替がしたいという意味ではよくわかる。リストで出し方が書かれてることは多いけど、意外にうまく検索が引っかからないんだよね…

リンク

Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に

米Metaは4月18日（現地時間）、オープンソースのLLMの最新版「Llama 3」を発表した。80億パラメータと700億パラメータの2モデルで、いずれもほぼすべての主要クラウドサービス（AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake）で間もなく利用可能になる。昨年リリースの先代「Llama 2」にも700億パラメータモデルはあったが、Llama 3は4000億パラメータの高密度モデル（こちらはまだ公開されていない）のトレーニングも継続中だとマーク・ザッカーバーグCEOは語った。トレーニングデータセットは、Llama 2よりも7倍大きく、4倍のコードが含まれている。英語以外での利用に備えるため、データセットの5％以上が非英語データで構成されて

minamishinji 2024/04/19

いいねぇ。

メタ
ai

リンク

ASMLが37%減益　1〜3月、最先端半導体向け販売低迷 - 日本経済新聞

【ローマ=湯前宗太郎】オランダの半導体製造装置大手、ASMLホールディングが17日発表した2024年1〜3月期決算は、純利益が前年同期比37%減の12億2300万ユーロ（約2000億円）だった。最先端半導体の量産に必要となる、極端紫外線（EUV）露光装置の販売低迷が響いた。需要の縮小により新規受注も低迷した。売上高は22%減の52億9000万ユーロだった。装置売上高で全体の約半分を占める、EU

minamishinji 2024/04/18

おっと。半導体市況の判断材料として。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (122)

AIに関するminamishinjiのブックマーク (315)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス