並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 28 件 / 28件

新着順 人気順

音声認識の検索結果1 - 28 件 / 28件

  • 噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想|shi3z

    最近にわかに話題のLLMツール「Dify」を僕も使ってみた。 いいところと「?」となったところがあったので纏めておく Difyとは、GUIでワークフローを組むことができるLLM-OPSツールだ。 ComfyUIのようにワークフローが組めたり、GPTsのように自分専用のアシスタントを作れたりできる。 特に、OpenAIのGPTシリーズとAnthropicのClaude-3、そしてCohereのCommand-R+なんかを組み合わせて色々できるところは良いところだと思う。また、ローカルLLMにも対応しているので、企業内でのチャットボットを作るんだったらGPTsよりこっちの方がいいだろう。 元々色々なテンプレートが用意されているが、テンプレだけ使うとGPTsっぽいものを作れる(それだってすごいことだが)。テンプレを改造するだけでも欲しいものが作れる人はいるし、ここはノーコード環境と言える テンプ

      噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想|shi3z
    • OpenAI、次世代AIモデル「GPT-4o」を発表

      日本時間2024年5月14日未明、OpenAIは新たなフラッグシップモデル「GPT-4o」を発表しました。このモデルは、音声、視覚、テキストのリアルタイム処理を可能とし、従来のAIモデルを大きく上回る性能を誇ります。OpenAIのCTOであるミラ・ムクティ氏は、「GPT-4oは、人間とマシンのインタラクションの未来を大きく変える一歩です。このモデルにより、コラボレーションがはるかに自然で簡単になります」と述べました。 「GPT-4o」の主な特徴を以下にまとめました。 他のモデルを凌駕する性能 GPT-4oは、OpenAIの以前のモデルであるGPT-4 Turboや、ライバル会社のClaude 3 Opusなどの大規模言語モデルと比較して、頭ひとつ抜けた性能向上を実現しました。サム・アルトマンCEOは、今年4月に "Chatbot Arena" でgpt2というコードネームでテストされていた

        OpenAI、次世代AIモデル「GPT-4o」を発表
      • 財務分析・株価予測・稟議書作成… AIプロフェッショナル組織のリーダーが語る、生成AI活用法

        ChatGPTは株価予測ができる 森正弥氏:こんな使い方もありますみたいなところで、大企業でもいろいろ進んでいるのは財務分析で、「財務データを入れて分析して」と言うと……ちょっと(スライドの)真ん中の文字が小さくて見えにくいですが、一般的な財務分析をしてくれます。 ちょっとインパクトがあったのが、ChatGPTは株価予測ができるという話ですね。これは普通にAIやマシンラーニングをやられている方からすると、「おいおい、それは言い過ぎだろう」と思ったりするわけですが、この論文の中身を読んだり、あるいは株価予測を業務としてやっている方からすると「まぁ、そうだよね」と思うところがある。 それは何かというと、株価予測だけじゃなくて金利の予測とか、そのマーケットの予測とか、あるいは原材料の価格予測でも共通の話です。基本的に今のデータからマシンラーニングの予測モデルを作って予測していきます。過去データか

          財務分析・株価予測・稟議書作成… AIプロフェッショナル組織のリーダーが語る、生成AI活用法
        • AppleはGoogleから約40人のAI専門家を引き抜いてスイス・チューリッヒに極秘研究所「Vision Lab」を開設している

          近年のAppleでは、オープンソースの言語モデル「OpenELM」やマルチモーダル大規模言語モデル「Ferret-UI」などのAI関連製品の開発が精力的に行われています。そんなAppleではGoogleから少なくとも36人ものAI専門家を引き抜き、スイス・チューリッヒにAIモデルや製品を開発する研究所を設立していることが報告されています。 Apple targets Google staff to build artificial intelligence team https://www.ft.com/content/87054a60-dc4d-4238-a4b9-93ab48f22f56 Apple Hired Dozens of AI Experts From Google for a Secretive Zurich Research Lab - MacRumors https:/

            AppleはGoogleから約40人のAI専門家を引き抜いてスイス・チューリッヒに極秘研究所「Vision Lab」を開設している
          • CHI2024を振り返って

            ヒューマンコンピュータインタラクション研究のトップカンファレンスであるACM CHI2024がハワイで開催された (5/11–5/16)。会議に出た感想を残しておく。 AIの席巻ある程度予想はしていたがAI、LLMと人間とのインタラクションをトピックにした発表が激増していた。CHIはパラレルセッションで、同時に20セッションぐらいが並行して発表が行われている。同時刻に開催される複数のセッションタイトルにAIやLLMが入っていて、もはやすべてを見るのが不可能な状態になっていた。 AIと銘打っていないセッションでも、要素技術として機械学習を使っているものは多いので、体感では半分以上の研究発表が何等かの意味でAIを使っている感じだった。少し前までは機械学習としってもSVMやCNN、LSTMぐらいでtransformersを使っていたら新しいね、ぐらいだったのだが、LLMが状況を変えていて「誰でも

              CHI2024を振り返って
            • 【まるで魔法】GPT-4o(オムニ)が登場。ChatGPTアップデートまとめ|ChatGPT研究所

              5月14日、日本時間深夜2時よりOpenAIのイベントが開催されました。 イベントの内容は、AIの新しい時代の幕開けを予感させる衝撃的な発表となりました。 注目すべきは、 最新モデル「GPT-4o」の登場 無料ユーザーへの解放 の二つです。 これにより、より多くのユーザーが高度なAIを手軽に利用できるようになります。 今回は、このOpenAIの最新アップデートの内容を詳しく解説していきます! 新しく発表されたGPT-4oとは?5月14日のイベントで発表された最新モデル「GPT-4o」(oはomniの略:【omniは「全ての」を意味する】)は、音声、視覚、テキストをリアルタイムで処理できる新しいAIモデルです。これにより、より自然な人間とAIの対話が可能になりました。 主な特徴マルチモーダル対応:テキスト、音声、画像の組み合わせを入力として受け取り、同様に多様な形式の出力を生成可能。 高速応

                【まるで魔法】GPT-4o(オムニ)が登場。ChatGPTアップデートまとめ|ChatGPT研究所
              • ストレスフリーで字幕が見られる?「ぴったり字幕」開発の舞台裏|NHK広報局

                「あれ、なんか字幕が読みにくいな…」 ガヤガヤと人でにぎわう昼どきの社員食堂。 日替わり定食を食べながらぼんやりとニュースを眺めていたある日、ふと違和感を覚えました。 生放送のニュース番組。すらすらとしゃべるアナウンサーの声に、少し遅れて表示される字幕…。 みなさんはふだん、テレビを字幕付きで見たことはありますか? テレビ番組表に「字」と書いてあったり、番組の開始直後に「字幕放送」と告知テロップが出たりするので、ご存じの方もいるでしょうか。 ドラマなどの収録番組は、あらかじめ制作過程で字幕を作ることができるので、番組内容と字幕の表示タイミングがきちんと合っています。 一方、ニュースなどの生放送番組(以下、生番組)の場合、アナウンサーや出演者が話すことばが事前に決まっていないため、実際に話されたことばを人が文字起こしして字幕を制作します。 そのため、どうしても数秒から数十秒の作業時間がかかっ

                  ストレスフリーで字幕が見られる?「ぴったり字幕」開発の舞台裏|NHK広報局
                • 【2024年版】デザインに使えるAIツールまとめ(レビュー付き)|Goodpatch Blog グッドパッチブログ

                  2022年11月のChatGPTの登場を機に、2023年〜2024年にかけてジェネレーティブAIの普及がさらに加速しています。 OpenAIをはじめ、Microsoft、Google、Meta、Adobeなどあらゆるテック企業から毎日のようにAI関連のニュースが届くようになりました。 Goodpatch Blogでは、2023年4月に「【2023年版】デザインに使えるAIツールまとめ(レビュー付き)」としてさまざまなサービスを紹介しましたが、この1年で新たなツールが次々とリリースされ、状況が大きく変わりました。 そこで、今回はデザインに使えるAIツールの「2024年版」をご紹介します。デザインの作業をざっくり「考える」「作る」「伝える」の3つに分け、さらにその中でAIに手伝ってもらえそうな10の工程について、便利で使えそうなAIツールを調べました。使ってみた感想(レビュー)も記載しましたの

                    【2024年版】デザインに使えるAIツールまとめ(レビュー付き)|Goodpatch Blog グッドパッチブログ
                  • CopilotとChatGPTの違いを徹底解説!得意なこと・料金・導入方法など | ライフハッカー・ジャパン

                    できること・得意なこととは?CopilotとChatGPTは、特に有料版に関しては得意なことに大きな違いが生まれます。 Copilotの有料版「Copilot Pro」はOfficeアプリ(Word・Excel・PowerPoint・Outlookなど)と連動して生成AIの機能を利用できることが大きな特長。文章の作成や要約、グラフ・表・メール作成の際に活用できるため、ビジネスの業務効率を向上することを得意とします。 ただし、Officeアプリと連携するには、Copilot Proのライセンス料とは別にMicrosoft 365 Personal(年額1万4900円)、Microsoft 365 Family(年額2万1000円)のサブスクリプション料金を支払う必要があります。 そのため、ブレインストーミングや壁打ちの用途が主でOffice製品を使わない場合は割高に感じる可能性があるでしょう

                      CopilotとChatGPTの違いを徹底解説!得意なこと・料金・導入方法など | ライフハッカー・ジャパン
                    • iPhoneやiPadを「目で操作」可能に Apple、24年後半にアクセシビリティー機能を複数追加

                      米Appleは5月15日(現地時間)、2024年後半に登場する新しいアクセシビリティー機能を発表した。身体障害のあるユーザーがiPhone/iPadを目で操作できる「Eye Tracking」や、聴覚障害のあるユーザーに向けた新しい音楽体験「Music Haptics」、音声認識機能の強化や、乗り物酔いを軽減する「Vehicle Motion Cues」などを含む。 iPhone/iPadを目で操作できるEye Trackingは、iPhoneとiPadのフロントカメラを使用し、目の動きをトラッキング。アイコンやボタンなどの上にポインターを一定時間置くとアクションを実行する「Dwell Control」により、物理ボタン、スワイプ、その他のジェスチャーなどの操作が可能。iOS/iPadOSのアプリで利用でき、追加のハードウェアやアクセサリーは必要ないという。 Music Hapticsは耳

                        iPhoneやiPadを「目で操作」可能に Apple、24年後半にアクセシビリティー機能を複数追加
                      • AIに予算20万円以下でピラーレスケースのビジネスPCを組んでもらって分かったこと

                        ゴールデンウィークの連休に、新しいPCを一式組んでみようという人も多いのではないだろうか。厳しい円安が継続する中で、なかなかPCパーツを購入するタイミングが難しいが、思い立ったら吉日だ。 前回は予算30万円でゲーミングデスクトップPCを生成AIに聞いたが、今回は自作PCではやっているピラーレスケース(角に支柱がなく、内部システムを見ることができるケース)をベースにしたビジネスPCを組んでもらった。 →AIに予算30万円以下でゲーミングPCを組んでもらって分かったこと 手元にPCやスマホさえあれば、時間も場所も問わずいつでも回答してくれるエージェントに投げかけた質問は下記の通りだ。プロンプト(呪文)や問い合わせるタイミングなどによって回答は一定ではないので参考程度に見てほしい。 あなたはPCショップ専門店の店員です。 税込みの予算20万円以内で最新のビジネスPCを作ってください。 必ずピラー

                          AIに予算20万円以下でピラーレスケースのビジネスPCを組んでもらって分かったこと
                        • Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp

                          Apple⁠⁠、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も Appleは2024年5月15日、ハンディキャップのあるユーザがiPhoneやiPadなどを操作する際に助けとなる、2024年後半に登場予定の新しいアクセシビリティ機能を発表した。毎年5月の第3木曜日(今年は5月16日)に開催される、世界中でアクセシビリティについて話し合い、考え、学ぶことを目的とした一日「Global Accessibility Awareness Day(GAAD⁠)⁠」に合わせて発表されたもの。 Apple announces new accessibility features, including Eye Tracking -Apple アイ⁠・トラッキングがiPadとiPhoneで利用可能に 人工知能を活用したアイ・トラッキングにより、目だけでiPad

                            Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp
                          • NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開

                            NVIDIAが、AIチャットボット「ChatRTX」でサポートするLLMを追加して画像検索機能の改善や音声認識機能の追加を行ったことを発表しました。 Build a Custom LLM with ChatRTX | NVIDIA https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/ ChatRTX Adds New AI Models and Features | NVIDIA Blog https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/ Nvidia’s AI chatbot now supports Google’s Gemma model, voice queries, and more - The Verge https://www.theverge.com/2024/5/1/

                              NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開
                            • 陸王 辛みそラーメン - g13longkillの飯(ラーメン・居酒屋)

                              走っていて面白くなければ......... 私は嫌.......。 燃費が良い、安い、広い等数をあげればきりがないであろうが、個々人に 「車を購入するにあたっての定義」 のようなものは存在するであろう。 それは当然、現在のその人間の立ち位置から詳細に算出され、希望にあった、もしくはそれに近いモノを探し出すということになるだろう。 腰痛野郎の私は、これまでの車でもまぁ別に良かったのだが、息子が生まれ、チャイルドシート問題が出てくると話が変わってくる。 ちょうど走行距離も20万kmに差し掛かるこのタイミングで購入を決意した私。 いろんな折り合いを付け決定し、先日が納車日。 なるほど........チャイルドシートは大丈夫。 坐骨神経痛の私にもナイスな運転席....。 しかし‥‥‥‥だ。 私は数年で浦島太郎になってしまったのだろうか.......。 昨今の車....... ボタンが多すぎて分かり

                                陸王 辛みそラーメン - g13longkillの飯(ラーメン・居酒屋)
                              • 【プロンプトあり】 Create.xyzで本格的なWebサイト制作をしてみよう|ChatGPT研究所

                                本記事は、実践的にCreate.xyzを用いてサイトを作成する方法を具体例とともに紹介していきます! 最近追加されたCommand R+やDALLE-3などのAPI Integrationの内容の解説もしていきます。 デモでは自社HPを作り、問い合わせフォームの内容を専用データベースに保存する方法をご紹介します。 Create.xyzで出来ることCreateを使うと、自然言語でサイトの外見や機能を記述するだけで、AIがコーディングを自動で行ってくれます。 プロンプトテクニックとして、デザインやレイアウトを具体的に指定することも重要です。 基本的な作り方については、以下の記事で解説しているので、ぜひこちらもご覧ください!⬇️ と言っても、一から十まで仕様書を書くことは初心者の場合大変なので、今回の記事にはCreateで作成できるサイトの設計書を書いてくれるGPTsとそのプロンプトを記載してあ

                                  【プロンプトあり】 Create.xyzで本格的なWebサイト制作をしてみよう|ChatGPT研究所
                                • Faster WhisperとAWS SageMakerを活用してGPUでの高速文字起こしエンドポイントを構築する

                                  概要 最近の音声認識技術の進歩はすごいですね! 特にOpenAIの最新モデルであるWhisper large-v3は、日本語の音声データでもかなりの高精度で文字起こしを行うことができ、APIも公開されています。 ただし簡単に使用でき汎用性も高い一方で、大量に使用する場合の高コストやプライバシーの懸念もあるため、ローカル環境で効率よく高精度な文字起こしを実現するモデルが多数開発されています。 今回は、その中でもGPUを使用した高速推論が可能な「Faster Whisper」を用いて、AWS SageMakerでカスタム文字起こしエンドポイントを構築してみたので、手順を解説していきたいと思います。 実装コードは以下のリポジトリにあります。 順番通りJupyterNotebookを実行すると問題なく動作するはずです。 Faster Whisperとは Faster WhisperはOpenAIの

                                    Faster WhisperとAWS SageMakerを活用してGPUでの高速文字起こしエンドポイントを構築する
                                  • GPT-4o、Azureの生成AIサービスでも体験可能に

                                    5月13日(米国時間)に米OpenAIが発表した、生成AI「GPT」シリーズの新たなモデル「GPT-4o」。クラウドサービス「Microsoft Azure」を使い、API経由でGPTシリーズにアクセスできる「Azure OpenAI Service」でも、すでに試用可能となっている。 Azure OpenAI Serviceでは、プレビュー版として米国リージョンの一部でGPT-4oを提供。Web開発環境「Azure OpenAI Studio」で機能を試すことができ、現時点でテキスト・画像の入力に対応。動画や音声の入力機能は今後追加するという。 関連記事 マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応 米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenAI Se

                                      GPT-4o、Azureの生成AIサービスでも体験可能に
                                    • Apple、iPhone/iPad用アイトラッキングやミュージック・ハプティクスを含む、今年後半に登場する新しいアクセシビリティ機能を発表 | NEWS | Mac OTAKARA

                                      ※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。 Appleが、身体障がいのあるユーザーがiPhoneやiPadを目で操作する方法であるアイトラッキングを含む、今年後半に登場する新しいアクセシビリティ機能を発表しています。 さらに、Music Hapticsは、耳の不自由なユーザがiPhoneのTaptic Engineを使って音楽を体験できる新しい方法を提供し、Vocal Shortcutsは、ユーザがカスタムサウンドを出すことでタスクを実行できるようにします。 これらの機能は、Appleのハードウェアとソフトウェアの力を組み合わせ、Appleシリコン、人工知能、機械学習を活用し、すべての人のための製品を設計するというAppleの数十年にわたる取り組みをさらに推し進めるものです。 Tim Cook CEO

                                        Apple、iPhone/iPad用アイトラッキングやミュージック・ハプティクスを含む、今年後半に登場する新しいアクセシビリティ機能を発表 | NEWS | Mac OTAKARA
                                      • 音声で手軽に登録するToDoリストのシステムをつくる - Qiita

                                        ToDoリストって仕事なら多少面倒でもやるんだけど、 プライベートのちょっとした買いものリストのメモとか、割引券やポイントの有効期限とか、 家庭内でやらないといけないことのToDoリストって、登録すること自体が面倒で結構忘れそうになります。 そこで音声なら即座に手軽に管理できるのではと思い作ってみました。 完成品 古いタブレットPCにNotionのTodoリストをブラウザで表示しています。 この白い箱自体がボタンになっており、Arduino経由でタブレットPCのマイクを起動し録音します。 録音されたデータは音声認識をして、Notionにタスクが追加されます。 このシステムをリビングとかに置いたら、誰でも気軽に登録できます。 Notion APIの準備 Secret Key を作成する こちらからインテグレーションを作成するとAPIで使うシークレットキーが作成できます。 https://ww

                                          音声で手軽に登録するToDoリストのシステムをつくる - Qiita
                                        • GPT-4oを使って手書きの図からHTMLを出してもらった件

                                          驚異のGPT-4o はじめにこんにちは。ネクストビートでエンジニアをしている水島です。 今回は、5月14日(火)にOpenAI社によって発表された、新しいモデルGPT-4oについての紹介記事となります。 既にXなどをはじめ多方面でその驚くべき能力が知られ始めているGPT-4oですが、筆者も昨日に試してあまりの凄さに驚いてばかりです。ちなみに昨日意図せずバズったポストの著者でもあります。 GPT-4oはOpenAIが従来から提供してきたGPT-4-Turboの後継とも言えるモデルです。5月14日(火)のデモで発表された内容ではリアルタイムでの音声認識・応答などが目玉になっていましたが、こちらはまだ未公開です(数週間以内には提供されるようですが)。ですので、今回は即日リリースされたチャットボットとしてのGPT-4oの話になります。 GPT-4oについてはこの記事を読まれている皆さんも色々試され

                                            GPT-4oを使って手書きの図からHTMLを出してもらった件
                                          • 動画要約をChatGPTに任せる!ChatGPT搭載のChrome拡張機能3選

                                            「ChatGPT利用実態」によると、「ChatGPTをどの様な用途で利用していますか?」というアンケートで「アイデア提案」が全体の35%、「データの収集」が24%となっています。 そのため、多くの方がWebページでのコンテンツからアイデアやデータを収集したいのがわかります。 しかし、ChatGPTはテキストが主体のため、動画を文字にして要約する機能がありません。 そこで今回は、動画の要約ができるChatGPTのChrome拡張機能を3選紹介します。 動画コンテンツからのアイデアやデータを要約して確認したい方は、ぜひ参考にしてください。 ChatGPTの標準機能では動画の要約はできないChatGPTの標準機能では、動画コンテンツの直接的な要約はできません。理由は、ChatGPTがテキストベースの情報処理に特化しているためです。 動画や音声の非テキストメディアを解析するには、特定のAIモデルや

                                              動画要約をChatGPTに任せる!ChatGPT搭載のChrome拡張機能3選
                                            • 第178回 画期的な動画生成AIの「Sora」「Veo」の登場を導いた新技術と、これから私たちが向き合うべき生成AIの課題 | gihyo.jp

                                              いま、見ておきたいウェブサイト 第178回画期的な動画生成AIの「Sora」「Veo」の登場を導いた新技術と⁠⁠、これから私たちが向き合うべき生成AIの課題 2024年2月15日、OpenAIは動画生成AIモデル「Sora」を発表しました。わずか数秒の動画を生成するために試行錯誤が続く中、テキストから約1分の動画が生成できるAIモデルの発表は、多方面で大きな反響を呼びました。 図1 OpenAIが発表した、動画生成AIモデル「Sora」のウェブサイト。ユーザーがテキストで要求したものが何か、それらがどのように存在するのかも理解して、動画を生成するAIモデル 5月14日には、Google DeepMindからも、動画生成AI「Veo」が発表されました。こちらも「Sora」同様に、1分以上の動画が生成できるAIモデルとして注目を集めています。 図2 Google DeepMindが発表した、動

                                                第178回 画期的な動画生成AIの「Sora」「Veo」の登場を導いた新技術と、これから私たちが向き合うべき生成AIの課題 | gihyo.jp
                                              • 英語ができないのに海外赴任が決まった!そんな時どうする? | ロジカル英語ナビ

                                                海外駐在員は英語力のある人が選ばれることが多いですが、中には英語ができないのに海外駐在員に選ばれた!という人もいます。 ただでさえ不測の事態が起こりがちな海外、そこに英語が話せないまま住むことを想像すると、あなたの身の回りに起こることに対応できるのか不安になりますよね。 そこでこの記事では、海外駐在生活で英語ができないとどのような場面で困るか、また実際に赴任するまでの間にどのような準備をすれば良いかについて解説します。 ドイツ駐在生活を始めて4カ月の僕が実際に経験した目線で書いた記事なので、英語ができないのに海外赴任が決まった人や決まりそうな予兆を感じる人、海外赴任に興味がある人はぜひ参考にしてくださいね! このブログの管理人はこんな人 かがくけいのおとこ 英語を使って海外顧客相手に仕事する日系企業サラリーマン もともと純ジャパ・海外経験なし、社畜生活で不眠症を経験 自分を変えるべく独学で

                                                  英語ができないのに海外赴任が決まった!そんな時どうする? | ロジカル英語ナビ
                                                • GPT-4o のマルチモーダル機能をさっそく試す - Qiita

                                                  1. この記事の内容 OpanAI から 2024.5.15 に新しい大規模言語モデル「GPT-4o」が出たので、以前書いた「GPT-4V に入門してみる」記事と同様の検証をもう一回 GPT-4o でやってみて比較する記事となります 結論から言うと「GPT-4oが圧倒的に強い」です。(わかり切った話ですみません) 2. GPT-4o とは? すでに大量のニュース記事が出ていますので細かく紹介しませんが、以下の公式サイトを貼っておきます。 2-1. 料金 こちらのページを参照されたし 2-2. どのくらいの時点までの知識があるのか? 勿論上にある通りオフィシャルには2023年10月までなのですが、実際どのくらい最近のことまで答えられるのか聞いてみました。 最近の情報まで含めてめちゃくちゃ正確な回答です。いつの間にかWeb検索した情報を踏まえて回答するようになっていました。ハルシオン防止のため

                                                    GPT-4o のマルチモーダル機能をさっそく試す - Qiita
                                                  • 面白いギミックのあるサイト8選!見ているだけで楽しいホームページを紹介 | センタード

                                                    面白いギミックのあるサイトによる効果 面白いギミックのあるサイトは、ユーザーの関心を引きつけ、ホームページへの訪問を楽しい体験に変えることができます。 さらに、面白いギミックをホームページに取り入れることで、ユーザーの滞在時間を延ばし、リピートのアクセスを促す場合もあります。 ギミックはブランドの性格を示し、ユーザーとの強いつながりを作るのに役立ちます。 面白いギミックのコンテンツ例 3Dモデルを用いたユーザーが動かせる商品の紹介 ゲーム要素を取り入れたユーザー参加型のコンテンツ AR(拡張現実)を利用した仮想体験 ユーザーの操作に反応する動的な背景デザイン 音声認識を活用した検索やナビゲーション ユーザーの行動に合わせて変化するイラスト 物語型のコンテンツでサイトをナビゲートする体験 ユーザーの位置情報を利用した地域特化型の情報提供 VR(仮想現実)を用いた360度のパノラマビュー Wo

                                                      面白いギミックのあるサイト8選!見ているだけで楽しいホームページを紹介 | センタード
                                                    • 【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート

                                                      ■2024年5月14日にOpenAI社からGPT-4o(oはomni「全て」の略)がリリースされた.この日はGoogleが大規模アップデートを発表する日でもあったが,GPT-4oのその性能と無料開放されたことから完全に霞んでしまったようである(Googleアップデートもかなりのものなので後日別の記事でまとめる).OpenAIは1ヵ月前にGPT-4-turbo-2024-04-09をリリースしてかなり精度アップしていたが,今回はそれを大きく上回るマルチモーダルな大幅アップデートである.Hello, GPT-4o. OpenAI 2024 May 13 https://openai.com/index/hello-gpt-4o/ ■実は,このGPT-4oは事前公開されていた.多数のAIチャットボットを比較できるChatBot Arenaに,4月30日に突然GPT2-chatbotなるものが1日

                                                        【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート
                                                      • GPT-4oとは?ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説

                                                        ※価格は全て100万トークン辺りの金額 詳細な料金プランはOpenAIの公式サイト内で確認できます。 OpenAI API price OpenAI ChatGPT アップデートの新機能 GPT-4oでは、さまざまな新機能が追加され、ユーザーエクスペリエンスが大幅に向上しています。 以下に主な新機能を紹介します。 音声モードの向上 新しい音声モードでは、音声認識精度が向上し、より自然な音声応答が可能となりました。これにより、音声アシスタントやカスタマーサポートなどのアプリケーションでの利用が一層便利になります。 画像生成機能の進化 GPT-4oは、画像生成機能も強化されています。これにより、テキストから高品質な画像を生成する能力が向上し、デザインやコンテンツ制作において革新的なツールとなっています。 GPT-4oモデルの評価と性能 GPT-4oの性能は従来のモデルと比べて大幅に向上していま

                                                          GPT-4oとは?ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説
                                                        • 全Chromebookに搭載。表情や顔の動きでマウス&キーボード操作が可能に

                                                          全Chromebookに搭載。表情や顔の動きでマウス&キーボード操作が可能に2024.05.22 19:30 湯木進悟 もはやチープなパソコンではない! Chromebook、どんなイメージがありますか? 最近は学校で子どもたちが使う機会も増えています。ですが、どうしても低価格のPCもどきという、ネガティブな印象を抱きがち。いまChromebookはパワーアップした仕様へと進化し、デビュー当時とは大きく異なってきました。 全モデルに顔操作を搭載へ話題のAI尽くしだった、今年のGoogle(グーグル)の開発者向けカンファレンスGoogle I/O。このほどAndroid Centralは、そこで発表されたChromebook向けの「Project Gameface」なる新機能について報じました。Chromebookに標準で備わっているフロントカメラで、ユーザーの顔の表情や動きを認識し、手を使

                                                            全Chromebookに搭載。表情や顔の動きでマウス&キーボード操作が可能に
                                                          1