[B! ai] John_Kawanishiのブックマーク

【特集】知っ得！企業トップのAI活用法。日本マイクロソフト社長のCopilotの使い方がすごく勉強になる

John_Kawanishi 2024/05/28

microsoft
AI

リンク

Microsoft、「AI Toolkit for VS Code」を発表／既存の「Windows AI Studio」をクロスプラットフォーム拡充、発展させる

John_Kawanishi 2024/05/27

microsoft
AI

リンク

5月13日（現地時間）に米OpenAIが「GPT-4o」を発表したかと思えば、翌日のGoogle I/Oでは「Gemini 1.5 Pro」のアップデートと「Gemini 1.5 Flash」のリリースを発表するなど、AI業界がにわかに活気づいている。その他生成AIでも画像、音楽、動画といった分野で次々に画期的な機能が実装され、多くの人がその恩恵に預かろうという直前まで来ている。ただそれを横目に、AIの活用が十分になされていないのではないかと思われる分野が、「日本語入力」だ。OS標準の入力変換エンジン以外にも、Google日本語入力やATOKといった選択肢もあるが、AIの華々しい進化の恩恵にあずかっているようには思えない。「AIが自然な言葉で受け答え」も結構だが、まずは同音異義語の正しい選択や誤変換はどうにかならないのか。まだ組み込まれるのはこれからだと思いたいが、AIが組み込まれた

John_Kawanishi 2024/05/26

AI
文章術

リンク

MicrosoftのBing、Copilot、Copilot in Windows、復旧

米Microsoftは5月24日午後1時過ぎ（米東部時間）、前日早朝からアクセスできなくなっていたMicrosoft Copilotサービスが復旧したとXアカウントでポストした。原因についての説明はない。「緩和策は完了しており、稼働状況監視により、すべてのCopilot機能が期待通り動作していることが確認されている」としている。この障害は、主にアジアと欧州のユーザーに影響を与えた。Bing.comや、BingのAPIを使っているDuckDuckGoも使えなくなっていた。 Bing検索を採用している米OpenAIのChatGPTでも一時検索機能が使えなくなっていたが、ステータスページでは、24日の午後2時（米太平洋時間、東部時間では24日の午後5時）には「すべてのサービスが正常に動作している」となっている。関連記事 MicrosoftのBingやCopilotが一時的にダウン　Chat

John_Kawanishi 2024/05/25

リンク

フロアを沸かせるAI動画、絶対無理そうな人たちがフロアを沸かせまくるww

John_Kawanishi 2024/05/25

AI
動画

リンク

MicroSoftからWindowsの次世代verの詳細と対応するPCの発表がありました

John_Kawanishi 2024/05/24

AI
PC

リンク

フェスを沸かす〇〇の元ネタについて解説

John_Kawanishi 2024/05/24

リンク

【笠原一輝のユビキタス情報局】 Copilot+ PCとしてハードウェアが大きく進化した新Surface Pro/Laptop

John_Kawanishi 2024/05/24

リンク

スカーレット・ヨハンソン、自分そっくりの声をChatGPTに使われ激怒。利用停止に

John_Kawanishi 2024/05/23

AI

リンク

PCの新時代　マイクロソフトが新ブランド「Copilot+ PC」新型Surfaceも

John_Kawanishi 2024/05/22

リンク

「GPT-4o」の声、スカーレット・ヨハンソン激似に本人激怒　「アルトマン氏のオファー断った」ため似た声優で再現か

「ショックを受け、怒り、信じられない思いだった」米OpenAIの生成AI「GPT-4o（フォーオー）」に使われている声の一つ「Sky」が、俳優のスカーレット・ヨハンソン氏にそっくりだと話題になった件をめぐり、同氏が代理人を通じて声明を発表した。声明によると同氏は、OpenAIのサム・アルトマンCEOから「声を提供してほしい」というオファーを受け、断ったにも関わらず、そっくりな声がAIに採用され怒りを覚えたという。ヨハンソン氏は対応のため弁護士を雇わざるを得なかったとし、「透明性の高い解決と、個人の権利を保護するための適切な法律の制定」への期待も述べている。

John_Kawanishi 2024/05/21

本人じゃなくて別の声優さんから学習したものなら咎められないのか？ボイロボイボ等合成音声界隈も人ごとじゃないしつい先日も音声そのものじゃないけど立ち絵の絵柄は著作権の範疇か否かなんとかで揉めたしなぁ

リンク

Power Apps & GPT-4oを使って超高速で画像解析アプリを作る！ - Qiita

GPT-4o凄すぎる！！出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました！あらためて記事を出してくださったことに感謝いたします！まずは初弾！ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法を書いていきます！まずは見た目（Power Apps）から！まずはPower Appsでサクっと画面を作ります！ PowerPoint感覚で作れることが強みですからね！最低限のもので構成しています。画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo

John_Kawanishi 2024/05/20

画像
AI

リンク

自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表

入力してテキストに応じて高解像度の動画を出力する生成AI「Veo」を、Googleが「Google I/O 2024」で発表しました。 Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools https://blog.google/techno logy/ai/google-generative-ai-veo-imagen-3/ 発表があったのは基調講演の33分53秒あたりから。Google DeepMindのデミス・ハサビス氏が解説しています。 Google Keynote (Google I/O ‘24) - YouTube Googleによれば、Veoは自然言語と視覚的な意味情報を深く理解することにより、たとえば「タイムラプス」や「空撮映像」といったプロンプトを入力すれば、それぞれ意図したような映像を作成してく

John_Kawanishi 2024/05/16

AI
動画

リンク

怒る客の声、AIで穏やかに　ソフトバンクがカスハラ対策 - 日本経済新聞

ソフトバンクは15日、人工知能（AI）で客の通話音声を穏やかなトーンに変換する技術の事業化を目指すと発表した。顧客による迷惑行為「カスタマーハラスメント（カスハラ）」に対する取り組みの一環で、コールセンターの電話対応業務に利用する。2025年度中の事業化に向けて、東京大学と研究開発や検証を進める。ソフトバンクの新規事業提案制度「ソフトバンクイノベンチャー」から生まれた。電話口で怒鳴るなどの迷惑

John_Kawanishi 2024/05/16

AI

リンク

gpt-4oを試す

GPT-4o テキスト、オーディオ、ビデオの入力を扱い、テキスト、オーディオ、イメージの出力が可能。 GPT-4o以前では、ChatGPTのボイスモードが3つの異なるモデルを使用していた。 GPT-4oはこれらの機能を一つのモデルに統合し、テキスト、ビジュアル、オーディオの各入力を同一のニューラルネットワークで処理する。現在のAPIの能力現在のAPIは、テキスト、イメージの入力とテキストの出力をサポート追加のモダリティ（例えばオーディオ）は現時点（2024/5/14）では使えない。近日導入される予定 Colaboratoryで動かしてみるインストール

John_Kawanishi 2024/05/16

AI

リンク

［速報］Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

［速報］Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

John_Kawanishi 2024/05/15

Google
AI

リンク

「GPT-4o」発表。人間と同じ速度で会話可能。利用料は半額に

John_Kawanishi 2024/05/14

AI

リンク

GPT-4o の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

John_Kawanishi 2024/05/14

AI

リンク

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

John_Kawanishi 2024/05/10

画像
AI

リンク

はてなブックマーク

タグ

関連タグで絞り込む (167)

aiに関するJohn_Kawanishiのブックマーク (1,248)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス