並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 11 件 / 11件

新着順 人気順

audioの検索結果1 - 11 件 / 11件

  • Hello GPT-4o

    GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat

      Hello GPT-4o
    • 音質改善キタか!? Android 14の「ロスレスUSBオーディオ対応」調べた【藤本健のDigital Audio Laboratory】

        音質改善キタか!? Android 14の「ロスレスUSBオーディオ対応」調べた【藤本健のDigital Audio Laboratory】
      • リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita

        概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。 使用している映像は以下でまとめられています。 非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。 今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ 以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。 現状のGPT-4o APIの制限 動画はそのままアップロードできません これは将来的にもできるとされてい

          リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita
        • グレイトフル・デッドの音響エンジニアが開発した600以上のスピーカーで構成される超巨大サウンド・システム「ウォール・オブ・サウンド」とは?

          1965年から活躍したロックバンド「グレイトフル・デッド」の「自分たちの歌が観客の声に消されて聞こえない」という悩みを受け、音響エンジニアが開発したというサウンド・システム「ウォール・オブ・サウンド」について、音響工学教育を手がけるオーディオアカデミーが解説しました。 The Grateful Dead’s Wall of Sound - Audio Academy Audio Legends https://audioacademy.in/the-grateful-deads-wall-of-sound/ グレイトフル・デッドが活躍していた当時は、ライブ会場における音響の課題が積み上がっていた時代だったといいます。ロックコンサートの規模が拡大するにつれて観客の数も増え、声援が大きくなっていったため、低ワットのギターやアンプがほとんど聞こえない環境ができあがっていたのです。 1965年、L

            グレイトフル・デッドの音響エンジニアが開発した600以上のスピーカーで構成される超巨大サウンド・システム「ウォール・オブ・サウンド」とは?
          • OpenAI が新たな無料モデル GPT-4o とデスクトップ版 ChatGPT を発表ーーアプリはまるで人間と会話するような反応速度に - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

            本日、OpenAIの最高技術責任者(CTO)であるMira Murati(ミラ・ムラティ)氏は、Spring Updatesイベントで、新しい強力なマルチモーダル基礎大規模言語モデル(LLM)であるGPT-4o(GPT-4 Omniの略)を発表した。これは今後数週間で全ての無料ChatGPTユーザーに提供され、MacOS用のChatGPTデスクトップアプリ(後にWindows向けも)も発表された。これにより、ユーザーはウェブやモバイルアプリ外でもアクセス可能になる。 「GPT-4oは音声、テキスト、ビジョンを統合して推論する」とMurati氏は述べた。これは、ChatGPTスマートフォンアプリでユーザーが撮影したリアルタイム動画を受け入れ分析する機能も含まれるが、この機能はまだ一般公開されていない。 「まるで魔法のよう。素晴らしいことですが、私たちはその神秘性を取り除き、みなさんにそれを試

              OpenAI が新たな無料モデル GPT-4o とデスクトップ版 ChatGPT を発表ーーアプリはまるで人間と会話するような反応速度に - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
            • GPT-4o紹介ビデオの文字起こし(英語と日本語訳の全文)|IT navi

              5月13日(日本時間5月14日未明)にOpenAIが発表したGPT-4oの紹介ビデオ「Introducing GPT-4o」の文字起こしとその日本語訳です。 〇 日本語訳 [拍手] MIRA MURATI: みなさん、こんにちは。ありがとうございます。今日はここにいてくれてうれしいです。今日は3つのことについて話します。それだけです。まず、製品を真に利用可能かつ広く利用可能にすることがなぜ私たちにとって重要なのかについてお話しします。そして、摩擦を減らす方法を常に探しています。どこにいてもChatGPTを使えるようにするためです。今日はChatGPTのデスクトップ版をリリースし、使いやすく、より自然にするための改善を行います。 しかし、今日の大ニュースは、新しいフラッグシップモデルを発表することです。これをGPT-4oと呼んでいます。GPT-4oの一番の特徴は、無料ユーザーを含むすべての人

                GPT-4o紹介ビデオの文字起こし(英語と日本語訳の全文)|IT navi
              • Introduction to gpt-4o | OpenAI Cookbook

                GPT-4o ("o" for "omni") is designed to handle a combination of text, audio, and video inputs, and can generate outputs in text, audio, and image formats. Background Before GPT-4o, users could interact with ChatGPT using Voice Mode, which operated with three separate models. GPT-4o will integrate these capabilities into a single model that's trained across text, vision, and audio. This unified appr

                  Introduction to gpt-4o | OpenAI Cookbook
                • WebKit Features in Safari 17.5

                  Happy May! It’s time for another release of Safari — our third significant update of 2024. With just a month until WWDC24 and the unveiling of what’s coming later this year, we are happy to get these 7 features and 22 bug fixes into the hands of your users today. CSS There are several exciting new CSS features in Safari 17.5, including text-wrap: balance, the light-dark() color function, and @star

                    WebKit Features in Safari 17.5
                  • Openterface Mini-KVM

                    This KVM-over-USB solution offers you a lightweight, speedy and seamless control, enabling you to operate a headless computer directly from your laptop or desktop computer. It eliminates the hassle of additional keyboards, mice, monitors or complex network configurations in a stylish manner, simplifying your setup and significantly enhancing your workflow when managing headless devices. A Versatil

                      Openterface Mini-KVM
                    • Emoji history: the missing years  ⌘I  Get Info

                      During my research into vintage Japanese drawing software, I came across some devices that had built in sketch or handwritten memo functions. I bought a couple of them to see if they did anything cool or interesting. These sorts of devices are pre-internet, so there’s not much about them online, and they can’t be emulated, so the only way to find out what they do is to get first hand experience by

                      • ミト(クラムボン)が語る満島ひかり「ELECTRIC PROPHET」〜TM NETWORK TRIBUTE - サンレコ 〜音楽制作と音響のすべてを届けるメディア

                        『TM NETWORK TRIBUTE ALBUM -40th CELEBRATION-』で、初期TMのテーマ曲とも言える「ELECTRIC PROPHET(電気じかけの予言者)」は、満島ひかりが歌唱。はかなくも美しい「エレプロ」の新しい形を、プロデューサーとして満島と示してくれたのは、FANKSとしても知られるクラムボンのミトだ。その世界をどのように紡いだのかを、ミトに聞いた。 ※このインタビューは5月25日発売の『サウンド&レコーディング・マガジン2024年7月号』掲載のものに先駆けて、ロングバージョンとしてお届けします Text : iori matsumoto TM NETWORK アンドロイドの満島さんがポツンとその舞台で歌う −TM NETWORKのトリビュートに、満島ひかりさんが歌う「エレプロ」が収録されると聞いて、どなたがプロデュースするのかと思ったらミトさんだと知りました

                          ミト(クラムボン)が語る満島ひかり「ELECTRIC PROPHET」〜TM NETWORK TRIBUTE - サンレコ 〜音楽制作と音響のすべてを届けるメディア
                        1