並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 119件

新着順 人気順

Audioの検索結果1 - 40 件 / 119件

  • 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan

    Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。 Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。 StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、St

      音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan
    • 禁断の“iPhoneステレオ録音”が実現。100円アプリ「ステレオマイク」が面白い【藤本健のDigital Audio Laboratory】

        禁断の“iPhoneステレオ録音”が実現。100円アプリ「ステレオマイク」が面白い【藤本健のDigital Audio Laboratory】
      • Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に

          Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に
        • オーディオ信号測定もできる。KORGオシロスコープキットが超便利だった【藤本健のDigital Audio Laboratory】

            オーディオ信号測定もできる。KORGオシロスコープキットが超便利だった【藤本健のDigital Audio Laboratory】
          • The Beatles - Now And Then (Official Audio)

            Now and Then's eventful journey to fruition took place over five decades and is the product of conversations and collaborations between the four Beatles that go on to this day. The long mythologised John Lennon demo was first worked on in February 1995 by Paul, George and Ringo as part of The Beatles Anthology project but it remained unfinished, partly because of the impossible technological chall

              The Beatles - Now And Then (Official Audio)
            • 電気グルーヴ32周年の歌(Official Audio / 試聴用動画)

              Download / Streaming : https://lnk.to/06Elu6Ic 電気グルーヴ35周年ツアー “3594” https://www.denkigroove.com/information/393 2024年 9/14(土)Zepp Osaka Bayside 9/15(日)Zepp Nagoya 9/20(金)Zepp Haneda(TOKYO) 9/21(土)Zepp Haneda(TOKYO) ▼DENKI GROOVE ONLINE STORE https://store.denkigroove.com/ ▼DENKI GROOVE SNS: Twitter https://twitter.com/denki_groove_ Instagram https://www.instagram.com/denkigroove_official/ Face

                電気グルーヴ32周年の歌(Official Audio / 試聴用動画)
              • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

                こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

                  Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
                • “オカルト退治”から感謝1000回。誕生秘話からお叱りネタまで雑談した【藤本健のDigital Audio Laboratory】

                    “オカルト退治”から感謝1000回。誕生秘話からお叱りネタまで雑談した【藤本健のDigital Audio Laboratory】
                  • 手のひら1台で超立体!? 独自サラウンド技術のスピーカー「pavé」って何だ【藤本健のDigital Audio Laboratory】

                      手のひら1台で超立体!? 独自サラウンド技術のスピーカー「pavé」って何だ【藤本健のDigital Audio Laboratory】
                    • 見えたぜオーディオの“ジッター”。PCMレコーダーを使った東大開発の測定方法とは【藤本健のDigital Audio Laboratory】

                        見えたぜオーディオの“ジッター”。PCMレコーダーを使った東大開発の測定方法とは【藤本健のDigital Audio Laboratory】
                      • 音質改善キタか!? Android 14の「ロスレスUSBオーディオ対応」調べた【藤本健のDigital Audio Laboratory】

                          音質改善キタか!? Android 14の「ロスレスUSBオーディオ対応」調べた【藤本健のDigital Audio Laboratory】
                        • 文章で指示するだけで音楽を作れる音楽生成AI「Stable Audio 2.0」が登場したので使ってみた

                          画像生成AI「Stable Diffusion」の開発元として知られるStability AIが音楽生成AI 「Stable Audio 2.0」を公開しました。すでに日本からも利用可能になっていたので、実際にStable Audio 2.0を使って音楽を生成する手順をまとめてみました。 Stable Audio 2.0 のご紹介 — Stability AI Japan https://ja.stability.ai/blog/stable-audio-20 ◆Stable Audio 2.0で作れる音楽の例 Stable Audio 2.0はテキストで指示するだけで音楽を生成できるAIです。以下のムービーを再生すると、「Cinematic Synthwave(映画風のシンセウェイヴ)」というプロンプトで生成した音楽の例を聴けます。 Stable Audio 2.0 - YouTube

                            文章で指示するだけで音楽を作れる音楽生成AI「Stable Audio 2.0」が登場したので使ってみた
                          • ついに完成、“究極のポータブルオーディオシステム”Brise Audio「FUGAKU」の衝撃[Sponsored]

                              ついに完成、“究極のポータブルオーディオシステム”Brise Audio「FUGAKU」の衝撃[Sponsored]
                            • 音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)

                              著作権侵害を未然に防ぐ機能も持つ 昨年紹介した音楽生成AI「Stable Audio」が「Stable Audio 2.0」となり大きく進化した。 生成AIがブレイクするきっかけを作った画像生成AI「Stable Diffusion」を開発したStability AIによる音楽生成AIだ。2023年8月にバージョン 1.0をリリースした際にはこの連載でも紹介した。グーグルの「MusicLM」のようにプロンプトを与えることで、音楽を作り出す音楽生成AIで、Stable Diffusionのようにステップを経て徐々に生成が完了する“拡散モデル”を使用しているのが特徴だ。Stable Audio 2.0では、モデルが新しくなったのが最大の改良点だ。ある入力に対応して生成される出力に関して、生成のルールやパターンを決めるのがモデルである。つまり、知識やアルゴリズムを持つ中核部分が改良されたことにな

                                音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)
                              • 「消費者の目線」大事に“音が良くて安い”。FX-AUDIO-に行ってみた

                                  「消費者の目線」大事に“音が良くて安い”。FX-AUDIO-に行ってみた
                                • 電気グルーヴ34周年の歌(Official Audio / 試聴用動画)

                                  Download / Streaming : https://lnk.to/06Elu6Ic 電気グルーヴ35周年ツアー “3594” https://www.denkigroove.com/information/393 2024年 9/14(土)Zepp Osaka Bayside 9/15(日)Zepp Nagoya 9/20(金)Zepp Haneda(TOKYO) 9/21(土)Zepp Haneda(TOKYO) ▼DENKI GROOVE ONLINE STORE https://store.denkigroove.com/ ▼DENKI GROOVE SNS: Twitter https://twitter.com/denki_groove_ Instagram https://www.instagram.com/denkigroove_official/ Face

                                    電気グルーヴ34周年の歌(Official Audio / 試聴用動画)
                                  • テキストで指定した音楽を自動で生成するAI「Stable Audio」が登場

                                    画像生成AI「Stable Diffusion」の開発で知られるAI開発企業のStability AIが音楽生成AI「Stable Audio」をリリースしました。Stable Audioを使えば文章で指示するだけで音楽を生成できるとのこと。ただし、記事作成時点ではアクセス過多によって音楽生成が失敗する状況に陥っています。 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan https://ja.stability.ai/blog/stable-audio Stable Audioは生成したい音楽に含まれる要素をテキストで入力するだけで音楽を生成できるAIアプリです。「Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw

                                      テキストで指定した音楽を自動で生成するAI「Stable Audio」が登場
                                    • 2万円を切る、Steinbergのお手頃USB-Cオーディオ「IXO12/22」実力検証!【藤本健のDigital Audio Laboratory】

                                        2万円を切る、Steinbergのお手頃USB-Cオーディオ「IXO12/22」実力検証!【藤本健のDigital Audio Laboratory】
                                      • 「foobar2000」がバージョン2に。ASIOやDSD再生どうなった?【藤本健のDigital Audio Laboratory】

                                          「foobar2000」がバージョン2に。ASIOやDSD再生どうなった?【藤本健のDigital Audio Laboratory】
                                        • LE Audioでもハイレゾ伝送へ。次世代Bluetoothの新機能公開

                                            LE Audioでもハイレゾ伝送へ。次世代Bluetoothの新機能公開
                                          • 【レビュー】 数千円で買えるオーディオアクセサリ、FX-AUDIO-「Petit Tank LE」使ってみた

                                              【レビュー】 数千円で買えるオーディオアクセサリ、FX-AUDIO-「Petit Tank LE」使ってみた
                                            • Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に

                                              画像生成AI「Stable Diffusion」で知られる英Stability AIは4月3日(現地時間)、テキストで作曲できる生成AI「Stable Audio 2.0」を発表した。Stable AudioのWebサイトにログインすることで無料で利用できる他、間もなくStable Audio APIでも利用できるようになる見込みだ。 Stable Audioは、同社が昨年9月に発表した音楽生成AI。リリース当初の無料版では44.1kHzで最長45秒のトラックしか生成できなかったが、バージョンアップで最長3分のフルトラックの音楽を生成できるようになった。 テキストからだけでなく、音声からも作曲できる。オーディオサンプルをアップロードし、自然言語のプロンプトでサンプルをアレンジできる。 無料では、3分の音楽を20曲まで作れる。作った音楽を入力オーディオとして利用することもできる。 旧版同様に

                                                Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に
                                              • テキストプロンプトから音楽やサウンドを生成できる「Stable Audio」公開 商用利用も可

                                                英Stability AIは9月13日(現地時間)、音楽やサウンドの生成に使えるAIモデル「Stable Audio」を発表した。テキストプロンプトから高品質な音楽とサウンドエフェクトを生成できるという。 45秒までのトラックを生成してダウンロードできる無料版(月間20トラックまで)と、商用利用も可能な90秒のトラックを生成するサブスクリプションプラン(11.99米ドル、月間500トラックまで)、企業向け(要問い合わせ)を用意している。 Stable AudioのWebサイトにアクセスすると、「Trance, Ibiza, Beach, Sun, 4 AM, Progressive, Synthesizer, 909, Dramatic Chords, Choir, Euphoric, Nostalgic, Dynamic, Flowing」というテキストプロンプトで生成された音楽を視聴で

                                                  テキストプロンプトから音楽やサウンドを生成できる「Stable Audio」公開 商用利用も可
                                                • 武田砂鉄と考える、音楽とウェルビーイング——「メタルはどんな時もどんな気持ちにも対応してくれる」 - Always Listening by Audio-Technica(オーディオテクニカ)

                                                  ウェルネス | 2023.09.18 Mon 武田砂鉄と考える、 音楽とウェルビーイング ——「メタルはどんな時も どんな気持ちにも対応してくれる」 「音楽とウェルビーイング」と聞いた時、あなたは何を思い浮かべるだろうか? ヒーリングミュージックにアンビエント、あるいはバラード曲? それともクラシック音楽? そういった「穏やかな」ジャンルの音楽を連想する方は多いかもしれないが、実は全く異なるジャンルの音楽からウェルビーイングを考えることもできる。 今回、お話を伺ったのはライター/ラジオパーソナリティの武田砂鉄さん。 鋭い視点の論評で知られる武田さんは、「メタルは人を救う!」とまで公言するほどのメタル好きでもある。 ウェルビーイングとは一見縁のなさそうな音楽だからこそ、一歩俯瞰した目線での興味深い意見が次々と出てくることに。 武田さんの柔軟な発想に触れ、凝り固まった思考がほぐされていくような

                                                    武田砂鉄と考える、音楽とウェルビーイング——「メタルはどんな時もどんな気持ちにも対応してくれる」 - Always Listening by Audio-Technica(オーディオテクニカ)
                                                  • OpenAIのAudio Transcription APIで遊んだ - Lambdaカクテル

                                                    最近OpenAIがオーディオ系のAPIをいくつか出していた。といってもけっこう前の話だ。 そんな中、最近OpenAIが色々なサービスを展開している。自分も触って習熟しておいたほうが、面白いアイデアを思い付いたときにすぐにプロダクトを作れて役に立つはずだ。そういうわけで色々APIを見ていたところ、その中でも面白そうだった書き起こしAPIを使うことにした。自分が喋った内容を書き起こしてもらいたい。上手くいくだろうか?ボソボソ喋るオタクボイスでも? openai.itshinan.jp このAPIを使うと、オーディオ音声(wavとかflacとか色々な入力形式を使える)から各言語の書き起こしをやってくれる。イクゾー 素材音声 小銭を払う Scalaから呼び出す 所見 まとめ 素材音声 今回用意した自分の音声はこれ。過去の自分の記事の内容の一部をボソボソ読み上げている。お世辞にも上手ではないし、AP

                                                      OpenAIのAudio Transcription APIで遊んだ - Lambdaカクテル
                                                    • YMO楽器セットの再現も。VRイベント「電子楽器の創造展」に飛び込んだ【藤本健のDigital Audio Laboratory】

                                                        YMO楽器セットの再現も。VRイベント「電子楽器の創造展」に飛び込んだ【藤本健のDigital Audio Laboratory】
                                                      • 半世紀ぶりにNEC「TK-80」が蘇る!? 互換キットで音を出してみた。前編【藤本健のDigital Audio Laboratory】

                                                          半世紀ぶりにNEC「TK-80」が蘇る!? 互換キットで音を出してみた。前編【藤本健のDigital Audio Laboratory】
                                                        • 【レビュー】 4万円台でAtmos天井反射、“学生でも買える”ガチなサウンドバーPolk Audio「Signa S4」

                                                            【レビュー】 4万円台でAtmos天井反射、“学生でも買える”ガチなサウンドバーPolk Audio「Signa S4」
                                                          • 生成AIがプロンプトから音楽・効果音を創造! Stability AIが「Stable Audio」を公開/無料で45秒までの音声を生成、ドラムトラックやバンドサウンドから環境音までカバー

                                                              生成AIがプロンプトから音楽・効果音を創造! Stability AIが「Stable Audio」を公開/無料で45秒までの音声を生成、ドラムトラックやバンドサウンドから環境音までカバー
                                                            • ライブ丸ごとWAV保存!? ヤマハの世界初“ライブ真空パック”システムが凄い【藤本健のDigital Audio Laboratory】

                                                                ライブ丸ごとWAV保存!? ヤマハの世界初“ライブ真空パック”システムが凄い【藤本健のDigital Audio Laboratory】
                                                              • GitHub - facebookresearch/audiocraft: Audiocraft is a library for audio processing and generation with deep learning. It features the state-of-the-art EnCodec audio compressor / tokenizer, along with MusicGen, a simple and controllable music generation LM

                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                  GitHub - facebookresearch/audiocraft: Audiocraft is a library for audio processing and generation with deep learning. It features the state-of-the-art EnCodec audio compressor / tokenizer, along with MusicGen, a simple and controllable music generation LM
                                                                • Stable Diffusion開発元によるAI音楽生成サービス「Stable Audio」の可能性(CloseBox) | テクノエッジ TechnoEdge

                                                                  画像生成AIのStable Diffusionを開発したことで知られる英国企業Stability AIが9月13日、音楽生成AIサービス「Stable Audio」を開始しました。 作りたいサウンドをテキストで記述すると、それに従って高品質な音が生成されるというサービス。いわばサウンド版Stable Diffusionです。 このニュースをStability AIのXへのポストで知ってすぐに(20分は経っていない)アカウントを作って試してみたのですが、4つ目のプロンプトを生成しようとしたところであまりの人気でサイトがダウン。それ以降はまともにアクセスができない状況です。 ▲たまに画面も出現するが、生成はできない じっくり使ってからレポートしようと考えていたのですが、まだアクセスできないので、ちょっとだけ試してみたことから、その可能性を探っていきたいと思います。 無料含む3つのプランStab

                                                                    Stable Diffusion開発元によるAI音楽生成サービス「Stable Audio」の可能性(CloseBox) | テクノエッジ TechnoEdge
                                                                  • MPEG-H・Atmos・AURO揃い踏み。次世代放送の空間オーディオ聴き比べ実験【藤本健のDigital Audio Laboratory】

                                                                      MPEG-H・Atmos・AURO揃い踏み。次世代放送の空間オーディオ聴き比べ実験【藤本健のDigital Audio Laboratory】
                                                                    • Universal Audioが音に色付けするユニークなプラグイン、Verve Analog Machinesを発表。Essential版を4月30日まで無料配布中!|DTMステーション

                                                                      プロ御用達のハードウェア・ソフトウェアメーカーとして幅広い製品展開をしている米Universal Audio。超パワフルなDSPを搭載するオーディオインターフェイスであり、ある意味スタジオそのものともいえるApolloシリーズはプロの世界で絶大な信頼を得ており、世界中で使われています。その大きな理由はUAD-2というプラットフォームにのっとったプラグインを使うことで、ビンテージ機材そのもののサウンドを手軽に得られるからでもありました。ここ数年でそのUAD-2プラグインの多くがDSPを使わずにCPUだけで動くネイティブ環境で動くようになったことは、これまでも何度か記事で紹介してきたとおりです。 そうした中、Universal Audioがまた面白い仕掛けを打ち出してきたのです。それは同じネイティブ環境で動くプラグインでありながら、ビンテージ機材を復刻させるというのとは異なる方向のプラグインの

                                                                        Universal Audioが音に色付けするユニークなプラグイン、Verve Analog Machinesを発表。Essential版を4月30日まで無料配布中!|DTMステーション
                                                                      • Stable Audio - Generative AI for music & sound fx

                                                                        Start generating music for free. No credit card needed. Try it out Trance, Ibiza, Beach, Sun, 4 AM, Progressive, Synthesizer, 909, Dramatic Chords, Choir, Euphoric, Nostalgic, Dynamic, Flowing Trance, Ibiza, Beach, Sun, 4 AM, Progressive, Synthesizer, 909, Dramatic Chords, Choir, Euphoric, Nostalgic, Dynamic, Flowing

                                                                        • 最新Bluetoothのブロードキャスト機能を体験! LE Audioでサイレント阿波踊り【藤本健のDigital Audio Laboratory】

                                                                            最新Bluetoothのブロードキャスト機能を体験! LE Audioでサイレント阿波踊り【藤本健のDigital Audio Laboratory】
                                                                          • 「Steam Audio」がオープンソース化。UnityやUEに統合できる、ゲームやVRアプリ用の空間オーディオツール

                                                                            Valveの空間オーディオソリューション「Steam Audio」がオープンソース化 同ツールはUnityやUnreal Engine、FMOD Studioへの統合をサポート 今後もバグ修正や新機能のリリースは継続されるとのこと

                                                                              「Steam Audio」がオープンソース化。UnityやUEに統合できる、ゲームやVRアプリ用の空間オーディオツール
                                                                            • PCレスのワンオペ配信に超便利! 1080p×3ch同時配信・録画の「LiveShell W」を導入した【藤本健のDigital Audio Laboratory】

                                                                                PCレスのワンオペ配信に超便利! 1080p×3ch同時配信・録画の「LiveShell W」を導入した【藤本健のDigital Audio Laboratory】
                                                                              • 【レビュー】 5万円以下で超本格重低音、Polk Audioサブウーファを試す。驚異“3台鳴らし”も

                                                                                  【レビュー】 5万円以下で超本格重低音、Polk Audioサブウーファを試す。驚異“3台鳴らし”も
                                                                                • AudioCraft: A simple one-stop shop for audio modeling

                                                                                  AudioCraft consists of three models: MusicGen, AudioGen, and EnCodec. MusicGen, which was trained with Meta-owned and specifically licensed music, generates music from text-based user inputs, while AudioGen, which was trained on public sound effects, generates audio from text-based user inputs. Today, we’re excited to release an improved version of our EnCodec decoder, which allows for higher qual

                                                                                    AudioCraft: A simple one-stop shop for audio modeling