並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 471件

新着順 人気順

audioの検索結果1 - 40 件 / 471件

  • GPT-4o の概要|npaka

    以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

      GPT-4o の概要|npaka
    • 髪の毛ほど薄いのに音を75%カット!MIT開発の「革新的防音カーテン」 - ナゾロジー

      「夜中に聞こえてくる音で眠れず、イライラする」など、騒音問題に頭を悩ませている人は少なくありません。 逆に、隣部屋が音に敏感な人で、自分が立てる音に細心の注意を払いながらビクビク生活している人もいるでしょう。 最近では、趣味や仕事のために、頻繁にビデオ会議をしたり、ライブ配信を行ったりする人も増えてきました。 しかし、防音シートを部屋中に張り付けたり、部屋の中に防音室を導入したりするのは簡単ではありません。 この度、アメリカのマサチューセッツ工科大学(MIT)に所属するヨエル・フィンク氏ら研究チームは、髪の毛ほどの薄さの布地で音を最大75%軽減できる防音カーテンを開発しました。 彼らはその特殊なカーテンを用いて、「逆位相による音の打ち消し」や「布地の振動を抑えて音を反射する」ことが可能だと述べています。 研究の詳細は、2024年4月1日付の科学誌『Advanced Materials』に掲

        髪の毛ほど薄いのに音を75%カット!MIT開発の「革新的防音カーテン」 - ナゾロジー
      • 野外スタジアムでのライブの音出しのこと - WASTE OF POPS 80s-90s

        adoさんの国立競技場でのライブの一部席で音響が大変に悪かったという話が出ていまして、その中で周囲の住民が「騒音」に対して近年特に態度が厳しくなっているからという推測もされておりまして。 そもそも国立競技場でライブの類を開催することは相当にハードルが高いというのは、改築前の国立競技場でライブを開催したことがあるのはSMAP・ドリカム・嵐・ラルク・ももクロ・AKB48のみということからもわかります。 改築後に至っては通常の有人公演を行ったのはadoさんの前には永ちゃんのみで。 野外でのライブのPA仕事は非常にしんどいという話も割とよく聞きます。 基本的なところ以外はおよそその場での経験則の積み重ねの賜物だということですので、過去にほとんど事例がない国立競技場で、かつこれまで以上に厳しい制限の下で、となるとそりゃ大変でしょう。 とはいえ安い席でも1万円となれば、観客だって文句の一つも言いたくな

          野外スタジアムでのライブの音出しのこと - WASTE OF POPS 80s-90s
        • “音を着る”メガネ 「HUAWEI Eyewear 2」が外せない【いつモノコト】

            “音を着る”メガネ 「HUAWEI Eyewear 2」が外せない【いつモノコト】
          • 「まず謝罪しろよ」Ado、国立競技場ライブで「音響ゴミすぎ」批判…「しかと受け止めて」お詫びなしの “幕引き” 画策 - Smart FLASH/スマフラ[光文社週刊誌]

            「まず謝罪しろよ」Ado、国立競技場ライブで「音響ゴミすぎ」批判…「しかと受け止めて」お詫びなしの “幕引き” 画策 エンタメ・アイドル 投稿日:2024.04.30 17:21FLASH編集部 歌手のAdoが4月27・28日、東京・国立競技場で女性ソロアーティストで初となるワンマンライブ「Ado SPECIAL LIVE 2024『心臓』」を開催した。同ライブは2月にチケットが一般販売されると即完売、2日で14万人以上が動員される巨大イベントとなった。 コスプレイヤー・火将ロシエルは、29日までにインスタグラムを更新し、ライブに参戦したことを報告。《パフォーマンス最高に最強でした…!!!》と記した。Xではこうした感激の声があふれているのだが……しかし、一部で大きな不満が出ているのだ。 【関連記事:『ONE PIECE FILM RED』興収絶好調の裏でレビュー大荒れ「Adoの歌唱シーンに

              「まず謝罪しろよ」Ado、国立競技場ライブで「音響ゴミすぎ」批判…「しかと受け止めて」お詫びなしの “幕引き” 画策 - Smart FLASH/スマフラ[光文社週刊誌]
            • 国立競技場で行われたAdoさんのライブに行ったら「音響がトラウマレベルの酷さ」だった「まだ設計のノウハウが蓄積されてないのかも」

              Ado @ado1024imokenp アドです。niconico:nicovideo.jp/mylist/58569901 YouTube : youtube.com/c/Ado1024 イラストは「#Adoart」DMは事務所が管理しています。contact→ cloud9pro.co.jp/contact/ …o-dokidokihimitsukichi-daigakuimo.com Ado @ado1024imokenp 「心臓」2日間ありがとうございました。 SPECIAL guestにB’z松本孝弘さんにお越しくださいまして、「DIGNITY」を一緒に歌わせていただきました。 そして、初音ミクさんとも歌わせていただきました。 歌わせていただいたのは まふまふさんによる書き下ろし 「桜日和とタイムマシン」 でした。 大きな景色を一緒に作ってくださりありがとうございました。皆さんの

                国立競技場で行われたAdoさんのライブに行ったら「音響がトラウマレベルの酷さ」だった「まだ設計のノウハウが蓄積されてないのかも」
              • 「歌声きこえん」「ダントツでクソ会場」Ado 国立競技場ライブの音響に非難殺到 | 女性自身

                4月27日、28日に歌い手のAdo(21)が女性ソロアーティストとして史上初となる東京・国立競技場でのワンマンライブ「心臓」を開催。同ライブは2月にチケットの一般発売を開始すると即完売し、14万人以上の観客を動員した。 ライブ終了直後、Xでは《#Adoちゃん》《#Ado民》《#Ado心臓》などAdo関連のハッシュタグがトレンド入り。大きな話題を呼んだ一方で、ライブに行った観客からはこんな声も……。 《Ado様はとにかく今日もエグかったのだが、国立競技場が今まで行った会場の中でダントツでクソ会場だった 演出最高だったのに音響がゴミ過ぎる》 《休んでて気分が沈んでて、Adoのライブで元気になろうと思ったけど、国立競技場のスタンドの音響がクソ過ぎてマジで泣きそうになった。ショコラカタブラ、クラクラはAdoが歌い始めるまで何の曲やってるのか分からなかった。変に反響してて、低音以外聞き取れないとか普

                  「歌声きこえん」「ダントツでクソ会場」Ado 国立競技場ライブの音響に非難殺到 | 女性自身
                • 宇多田ヒカル「First Love」CDを80枚以上購入したら、J-WAVEの番組に呼ばれました

                    宇多田ヒカル「First Love」CDを80枚以上購入したら、J-WAVEの番組に呼ばれました
                  • レコードの「原盤」、製造するのは世界でただ1社…日本ののどかな村の一企業

                    【読売新聞】 [New門]は、旬のニュースを記者が解き明かすコーナーです。今回のテーマは「レコード生産」。 レコード人気が再燃する中、レコードの生産に必要な「ラッカー盤」を製造する企業「パブリックレコード」(長野県宮田村)が注目を集

                      レコードの「原盤」、製造するのは世界でただ1社…日本ののどかな村の一企業
                    • ロスレスとMP3ってどのくらい差があるんだ? 専門家に聞いてみた

                      ロスレスとMP3ってどのくらい差があるんだ? 専門家に聞いてみた2024.04.12 19:0059,149 Maxwell Zeff - Gizmodo US [原文] ( そうこ ) 「音楽聴くなら絶対ロスレス音源がいいよ? MP3より音がいいから」なんて、一度は聞いたことがあるようなセリフです。 データ容量をギュっと縮めた圧縮音源であるMP3。データ圧縮時の劣化を最小限に留めた、または圧縮していないロスレス音源。 なるべくロスがない方がサウンドクオリティがいいのは事実です。ロスレスがアーティストが意図する生の音に近いのも事実です。…事実なのですが、やっぱり言わずにはいられません。 その音、聴き分けられるの? 圧縮音源とロスレスの差って、フツーの人が聴いてもわかるのかい? 少々古い話で恐縮ですが、2014年に米Gizmodoが読者アンケートをとっていました。質問は「ロスレス音源とMP3

                        ロスレスとMP3ってどのくらい差があるんだ? 専門家に聞いてみた
                      • CD-Rの寿命が20年くらいなんだけど、そろそろ00年代に買った同人CDがやばい→いつのまにか失われてゆくデジタルデータ

                        ろんず @athlonz CD-Rの寿命が20年くらいなんだけど、そろそろ00年代に買った同人CDがやばい デジタル配信されていない曲、再販もない、そもそも作者が行方不明 もはやこの手元にあるやつだけが最後 2024-04-11 12:58:13

                          CD-Rの寿命が20年くらいなんだけど、そろそろ00年代に買った同人CDがやばい→いつのまにか失われてゆくデジタルデータ
                        • Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に

                            Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に
                          • なぜCDはプレスで音が変わるのか? キーパーソンに突撃取材~ヒカル伝説完結編

                              なぜCDはプレスで音が変わるのか? キーパーソンに突撃取材~ヒカル伝説完結編
                            • 長年の悩みだったギターアンプのノイズが「マイ電柱」で直った件 - give IT a try

                              はじめに 僕は趣味でよくギター(エレキギター)を弾きます。 ですが、長年ずっと困っていたことがありました。 それはギターアンプのノイズです。 多かれ少なかれ、エレキギターを弾くときはアンプからノイズが出るものです。 しかし、僕の家のギターアンプからは明らかに異常な「キーン」というノイズが出ます。 実際どんな音なのかは以下の動画で確認できます。(うるさいのでボリュームには気を付けて!) www.youtube.com このノイズは以下のような特徴があります。 5〜6年前から急に発生し始めた 常時ノイズが出るわけではなく、たまに発生する ノイズが鳴り始めると鳴ったり止んだりを繰り返す ギターを変えても、アンプを変えても同じようにノイズが出る(なので、ギターやアンプの問題とは考えにくい) ギターを全くつないでいない状態でもノイズが出る(なので、ギターのピックアップがノイズを拾っているわけではない

                                長年の悩みだったギターアンプのノイズが「マイ電柱」で直った件 - give IT a try
                              • 宇多田ヒカル「First Love」都市伝説は実在した! CDはプレスで音が変わる

                                  宇多田ヒカル「First Love」都市伝説は実在した! CDはプレスで音が変わる
                                • 初心者向け有線イヤホンまとめ(2024/03) - 花見川の日記

                                  kanose.hateblo.jp 加野瀬さんの中華イヤホンおすすめ記事に「ナイスエントリ!AIYIMA H2 miniもいいよ!!」とブコメ付けてたら、「花見川さんも書きましょう!」と言われたので書かざるをえまい。 AIYIMA H2 miniを知らなかったので紹介しておきます! あと、スペシャルサンクス的に花見川さんの名前入れるのを忘れてました。花見川さんもぜひお勧めイヤホン記事を書いて欲しいですよ— 加野瀬未友 (@kanose) 2024年3月28日 はじめに DAISO 7301 ¥550 DAISO本気の初代ハイレゾ DAISO 6071 ¥550 中高音と解像度に寄せた二代目ハイレゾ DAISO イヤーピース TinHifi C2 ¥3650 丁寧で迫力ある低音と絶妙な音のバランス TRN Conch ¥3950 高解像度+広い音場 TRN「備品全部入れてみた」 TRN TA

                                    初心者向け有線イヤホンまとめ(2024/03) - 花見川の日記
                                  • ワイヤレスイヤホンの価格帯別選び方 - ARTIFACT@はてブロ

                                    今使っているワイヤレスイヤホンのEdifier NeoBuds Proが2021年に出た製品でちょっと古めになったので新しいのが欲しいと思い、情報収集をしていた。入門記事で、あまり触れられていないことがあったのでまとめておきたい。 現在、Amazon新生活セールFINALでセール価格になっている製品が多いので、気になる製品は価格をチェックして欲しい。 LDAC接続は再生時間が短くなる ワイヤレスイヤホンの再生時間は初心者にはわかりにくい。10時間以上の再生をうたうものはバッテリーケースを使っての充電を含めての場合を言っているものがほとんどだ。*1更にイヤホン本体のみの再生時間はノイズキャンセルON/OFFと使うCODECによって変わってくる。 「LDAC接続は高音質」みたいなことはよく書かれるのだが、この再生時間がかなり短くなることについては触れられていないことが多くて罠だ。ハイレゾのCO

                                      ワイヤレスイヤホンの価格帯別選び方 - ARTIFACT@はてブロ
                                    • 1000円台前半で楽しく音楽が聞ける中華イヤホンのKZ EDX Lite(現在10%OFFセール中) - ARTIFACT@はてブロ

                                      据置オーディオ趣味を再開して以来、以前のようにイヤホンなどのポータブルオーディオに関しては、まったく熱意がなくなっていた。移動中は音が聴ければいいという割り切りで、DAPやスマホをワイヤレスイヤホンで聴いていた。ところが、久しぶりに手元にある中国メーカーが出している有線イヤホン(俗称:中華イヤホン)で聴いてみると、ワイヤレスイヤホンよりずいぶん音質がいい。最後にイヤホンを買ったのは2021年だったが、これをきっかけに中華イヤホンへの興味が再開した。*1 最終的にLETSHUOER S12 Pro*2という定価2.5万円のイヤホンがセールで2万円だったので買うという、見事な中華イヤホン沼に落ちたのであった。 自作PCのようにカスタマイズが楽しめる中華イヤホン 中華イヤホンの魅力として、カスタマイズの自由度が上げられる。イヤーピースの変更はカナル型ならどれでもできるが、ケーブル変更が手軽にでき

                                        1000円台前半で楽しく音楽が聞ける中華イヤホンのKZ EDX Lite(現在10%OFFセール中) - ARTIFACT@はてブロ
                                      • なぜ「でっかいCDラジカセ」が売れているのか たまに止まる理由

                                        カセットテープの魅力とは何か。若い人にとっては「使ったことがないので、よく分からないなあ。デジタル音源にはない良さがあるとか?」などと思われたかもしれないが、ほかにもある。例えば、自分だけのテープをつくれることだ。 好きなアーティストの好きな曲だけを集めたり、デート用にラブソングだけを録音したり。そんな思い出たっぷりのテープをいまも大切に保管している人もそこそこいるかもしれない。しかし、持っていてもここから前に進めない。久しぶりに聴いてみたいけれど、「ハードがない」という問題があるのだ。 ラジカセを買うために家電量販店に足を運ぶと、数千円のモノがたくさん並んでいる。しかく「せっかく買うんだからちょっといいモノがほしいよな」「若いころに使っていた、あんな機能もこんな機能も使ってみたいな」といった人にとってはやや物足りないのだ。 大切なオリジナルテープを聴きたい――。好きなアーティストの曲をテ

                                          なぜ「でっかいCDラジカセ」が売れているのか たまに止まる理由
                                        • 【無料】台湾で収録された自然環境音ライブラリ、99Sounds「Nature Sounds」無償配布開始! | Computer Music Japan

                                          Nature Soundsには、ロイヤリティーフリーのネイチャー・フィールド・レコーディングが以下のカテゴリーで収録されています: 動物、森、雨、水、風。 最も人気のあるRain SoundsとWater Soundsライブラリに追加するのに最適な音源です。新しいNature Soundsは、よりバラエティに富んだサウンドを提供し、サウンドデザイン、映画、ソーシャルメディア、音楽制作に最適です。 Free To Use Soundsの友人が台湾で録音し、99Soundsの訪問者に無料でダウンロード提供しています。 Free To Use Soundsのウェブサイトでは、世界中の様々な場所で録音されたフィールドレコーディングをご覧いただけます。 Nature Soundsには、24ビットWAVフォーマット(192kHz、ステレオ)の音声が83曲収録されています。 ダウンロードサイズは2.9G

                                            【無料】台湾で収録された自然環境音ライブラリ、99Sounds「Nature Sounds」無償配布開始! | Computer Music Japan
                                          • 「テレビの音がデカい!」を解決する、ミライスピーカー・ミニの技術【小寺信良の週刊 Electric Zooma!】

                                              「テレビの音がデカい!」を解決する、ミライスピーカー・ミニの技術【小寺信良の週刊 Electric Zooma!】
                                            • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

                                              こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

                                                Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
                                              • デジタルガジェットのレビュー評価でサクラチェッカーを鵜呑みにしないで! - ARTIFACT@はてブロ

                                                Amazoでセールが行われるたびに、サクラチェッカーの使用を勧める人が多いが、自分はこれに疑問を感じる。レビューのサクラ度が高いと表示される製品の中に、良い製品が多数あるからだ。 オーディオを中心に中華製品をよく買っているのだが、サクラチェッカーを使ったことがなかった。なぜなら中華製品だと、どれも高いサクラ度表示が出るので、それを信じたら何も買えない。 無名メーカーならともかく、知名度があり評価の高い製品を出している中国系オーディオメーカーで検索してみたら、EarFunやEdifier、SOUNDPEATSといったメーカーは軒並みサクラチェッカーではサクラ度99%という結が出てくる。各社日本の販売代理店や支社があるが、いまだに怪しい中華メーカー扱いなのだろうか。かわりにFunLogy(※生産は中国だけど日本企業)やAnkerはなんとサクラ度0%であった。 各メーカーのサクラチェッカー検索結

                                                  デジタルガジェットのレビュー評価でサクラチェッカーを鵜呑みにしないで! - ARTIFACT@はてブロ
                                                • カンファレンス登壇者・スタッフにこそ知ってほしいマイクの使い方 - Diary of a Perpetual Student

                                                  オフラインの技術カンファレンス・イベントも徐々に復活し賑わいを見せつつある今日この頃、いかがお過ごしでしょうか。 多くの聴衆に等しく声を届けるための道具「マイク」はカンファレンスに欠かせないものとなっています。 普段はアプリケーションエンジニアとして働きつつ、休日にPAエンジニアやステージマネージャーをやっている身から、来場者が発表やコンテンツに集中できるようなマイクの扱い方を簡単にご紹介します。 叩かない 声の出る方向とマイクの位置・向きを合わせる グリル部分を掴まない ある程度の声量で喋る 叩かない マイクを叩くと低い「ブォンブォン」という不愉快な音が発生するのはもちろん、スピーカーなどの機材が壊れる原因につながります。もちろん意図的に叩いている人はいないと思うのですが、以下のようなケースでつい叩いてしまう人を見かけます: 拍手をする、拍手を煽る際にマイクを持ちながら手を叩く マイクが

                                                    カンファレンス登壇者・スタッフにこそ知ってほしいマイクの使い方 - Diary of a Perpetual Student
                                                  • ガードレールにイヤホンをつないでラジオを聞く

                                                    そこらへんの金網でラジオが聞けた、という記憶 一部のAMラジオ局が今月から暫定的に止まる、というニュースを聞いて思い出したのだ。 以前こどもとゲルマニウムラジオを手作りしたときに、うまく聞こえなくて送信所の近くまで行ったら聞こえたことがあった。で、試しにイヤホンをそこらへんの金網に直接つけてみたらそれでも聞こえたのだ。なんだこれでいいじゃん、となった記憶がある。 この機に、それが本当だったのか試してみたい。 思い出の場所に行く さっそく現地にやってきた。 埼玉県川口市にある、文化放送のラジオ送信所だ。駅から30分歩いてやってきた。 記憶では、ここに見えているあらゆる金属にイヤホンをくっつけたらラジオが聞こえたのだ。金網とか、ガードレールとか。 ちなみにくっつけるイヤホンはこんなやつだ。 クリスタルイヤホンといいます 弱い電流でもうまく音に変換してくれるイヤホンだ。両端がクリップになっている

                                                      ガードレールにイヤホンをつないでラジオを聞く
                                                    • 「マイクケーブル8の字巻きグランプリ」決戦の模様をNHKでオンエア

                                                      × 6630 この記事に関するナタリー公式アカウントの投稿が、SNS上でシェア / いいねされた数の合計です。 1781 4411 438 シェア

                                                        「マイクケーブル8の字巻きグランプリ」決戦の模様をNHKでオンエア
                                                      • 「マイクケーブル8の字巻きグランプリ」NHK総合で2月23日18時

                                                          「マイクケーブル8の字巻きグランプリ」NHK総合で2月23日18時
                                                        • オーテク、小型で2万円切るUSBオーディオミキサー。マイク設計者が監修

                                                            オーテク、小型で2万円切るUSBオーディオミキサー。マイク設計者が監修
                                                          • FIIOが“アナログ・カセットプレーヤー”開発。『復刻シリーズ』第1弾

                                                              FIIOが“アナログ・カセットプレーヤー”開発。『復刻シリーズ』第1弾
                                                            • ソニーのロングセラーモニターヘッドホン「MDR-CD900ST」についての私見|三國浩平/作編曲家、レコーディングエンジニア

                                                              レコーディング、ミキシング、マスタリング、歌ってみたや演奏してみたなどなにかしらの形で音楽制作やDTMに携わったことがある人なら必ず一度は耳にしたことがあるソニーのロングセラーモニターヘッドホン「MDR-CD900ST」。 「業界標準」だとか「プロがみんな使ってる」とかそんな評判を聞いて試してみたら「あれ、こんなもん……?」と思った方も多くいると思います(笑)そんな900STについて、個人的に思っていることを以下にまとめました。 元々はソニーのスタジオだけで使われていた今ではサウンドハウスをはじめ、いろんなお店で普通に買うことができますが元々はソニーのスタジオで使うヘッドホンとして開発され、ソニーのスタジオ以外では手に入ることもできなかったそうです。 その後、1989年(平成元年!)に法人向け販売が始まり、1995年に家庭向け販売もスタートしたそうです。 ほんとに業界標準で、プロもみんな使

                                                                ソニーのロングセラーモニターヘッドホン「MDR-CD900ST」についての私見|三國浩平/作編曲家、レコーディングエンジニア
                                                              • SoundCloudみたいなサービスを個人で開発した

                                                                サービス概要 タイトル通り、現状はSoundCloudみたいに自分の作った曲を投稿できるサービスです。 現在実装されている機能は以下の通りです。 楽曲投稿 アルバム ランキング メッセージ(DM) フォローとフィード(タイムライン) いいねとブックマーク タグ・キーワードによる検索 このようにとりあえずSoundCloudのような楽曲投稿サービスとしての機能は最低限備えていますが、ゆくゆくはミュージシャンの活動拠点になることを目指しています。というのは、例えばYouTubeへの投稿や各種サブスク配信へのリンク、またライブなどイベントへの参加日程など、活動の実績/予定などがすべて1ページでわかるようにしたいと思っています。 また、ミュージシャン同士の交流/発見の場にしていきたいです。バンドメンバーや演奏を依頼する相手を見つけるのに適した場所はあまりありません(いわゆるメン募サイトは機能不全だ

                                                                  SoundCloudみたいなサービスを個人で開発した
                                                                • superwhisperでの音声入力を試す

                                                                  superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある 日本語で喋って英語に翻訳してくれる機能もある オフライン対応 有料: サブスク と 買い切り の2種類のプランがある 無料で15分のトライアル、その後は選べるモデルが制限される 公式サイトのデモをみると、かなり早く喋っても認識してくれるのがわかります。 大抵の人にとっては、多分文字入力するよりしゃべったほうが早いぐらいの入力速度が出ると思います。 superwhisper 長文はそこまで得意じゃないけど、1行とか2行ぐらいの文章はかなり

                                                                    superwhisperでの音声入力を試す
                                                                  • ヨーロッパ映画の日本版DVDは音程が変わっちゃってる!! | Jazz Maffia BLOG

                                                                    ブログでの記述にPAL方式は1秒25コマとありますが、実際は1コマ内に奇数列と偶数列で違う2枚分の絵が存在するので、秒50枚の絵を表示しています。専門用語を使うと25フレーム、50フィールドと言います。詳しくはググってください。 日本のNTSC方式では秒30フレーム、60フィールドとなります。 60コマの絵が使えるので、フィルム24枚の絵を60コマに振り分けていくことでテレビ放送に対応させています。具体的には11/222/33/444…と、フィルムのコマを2フィールドと3フィールドずつ順番に振り分けます。そうすることで、視覚上さほど気にならないレベルで24コマのフィルムを60フィールドに振り分けることが出来ます。 ではPAL方式ではどうかというと、50フィールドでは違和感無くフィルムの24コマを振り分けることが出来ません。この問題を解決するには2つの方法があり、ひとつはブログでもご指摘され

                                                                      ヨーロッパ映画の日本版DVDは音程が変わっちゃってる!! | Jazz Maffia BLOG
                                                                    • 今、CDが新しい。全能感がすごい! バランス出力ポータブルCDプレーヤー、SHANLING「EC Mini」【小寺信良の週刊 Electric Zooma!】

                                                                        今、CDが新しい。全能感がすごい! バランス出力ポータブルCDプレーヤー、SHANLING「EC Mini」【小寺信良の週刊 Electric Zooma!】
                                                                      • 他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム 明治大が開発

                                                                        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 明治大学の渡邊研究室に所属する研究者らが発表した論文「WhisperCast: ヘッドフォン装着者だけが聴取可能な音を再生する磁気誘導を利用した手法の検討」は、ヘッドフォンやイヤフォンを装着している人のみが聞こえる音声や音楽を外部から挿入するシステムを提案した研究報告である。 このシステムは、磁気誘導を用いて、ヘッドフォンやイヤフォン内の振動板を直接鳴動させ、装着者だけが聴取できる音を生成する。WhisperCastのハードウェア構成には、空芯コイルとアンプを含んでいる。 具体的なプロセスとして、コンピュータが任意の波形(通知音や好きな音楽

                                                                          他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム 明治大が開発
                                                                        • 進化した、“叫んでも声が漏れない”防音マイク。Shiftall「mutalk 2」

                                                                            進化した、“叫んでも声が漏れない”防音マイク。Shiftall「mutalk 2」
                                                                          • 【プレイバック2023】「オーディオ入門に最高じゃん」というモデルが沢山登場した1年 by 編集部 山崎

                                                                              【プレイバック2023】「オーディオ入門に最高じゃん」というモデルが沢山登場した1年 by 編集部 山崎
                                                                            • 賃貸マンションで「防音ブース」をDIYでつくってみた - マンションと暮せば by SUUMO

                                                                              はじめまして。リノベーションデザイナーをしているフジイです。 妻の「狭くてもいいので防音室が欲しい」という一言がきっかけで、約1週間かけて自宅の賃貸マンションに防音室をDIYしました。仕組みさえ分かれば、DIY初心者の方でも比較的簡単に、既製品の約5分の1の予算で製作できるので、時間と根性さえあればとてもコスパのいいDIYです。 「防音室」と言ってしまえばニッチですが、「お隣との防音壁」や「お篭もり用の小さなブース」としても汎用的に使えるアイデアです。 自宅に録音ブースが欲しい人はもちろん、自宅で仕事や作業をする人やビデオミーティングが多い人、お篭もりスペースが欲しい人の一助になればうれしいです。 防音ブースをDIYするキッカケ 2017年に結婚した妻と都内のマンションで生活をしていました。僕はフリーのリノベーション・住宅デザイナー、妻はソロのシンガーでナレーションなどの声を使った仕事を生

                                                                                賃貸マンションで「防音ブース」をDIYでつくってみた - マンションと暮せば by SUUMO
                                                                              • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox) | テクノエッジ TechnoEdge

                                                                                歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」。音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。 いい感じの音楽が出るまでガチャを引けばいいのですが、Sunoを効率化のために使いたい、アイデア出しのために利用したいんだけど、出力された音楽をいちいち手弾きで入力するのもだるい、という話です。 今回はこの解決策をご紹介しようと思います。詳しい人ならご承知のことと思いますが、改めて。 以前のコラムで紹介したように、例えばLogic ProのFlexPitchのようなピッチエディターを使えば、単音のオーディオファイルからMIDIデータを取り出すことは可能です。 実際、筆者はUVR5という音源分離ツールを使って取り出したBassトラックをFlexPitchによってピアノロール表示し、それを改めてMIDIデータとして打ち込むというのをやっ

                                                                                  AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox) | テクノエッジ TechnoEdge
                                                                                • AIによる楽器サウンド合成システム、Melisma(β)が爆誕。サンプリングでは不可能だったリアルさを実現|DTMステーション

                                                                                  12月8日に、またDTMの世界に新たな扉が開かれました。これまでもSynthesizer VをはじめとするAIを使った歌声合成のソフトはありましたが、今回誕生したMelisma(メリスマ)は、ヴァイオリンやオーボエ、チェロ……といった楽器を合成するシステムのβテスト版。もちろん、こうした楽器を再現するソフトとしては、これまでサンプリングを使った音源が数多くあり、まさにリアルな音で演奏できていました。でもサンプリングだと、たとえばタイやスラーでつないだ長い音符などとなると、どうしても限界があったし、ピチカート、トリル、フォール…といったアーティキュレーションでも表現の範囲が限られていました。 このMelisma(β)では、実際の演奏をディープラーニングしたものを元に演奏音を合成する、いわゆる生成AIのシステムで、サンプリングでは不可能だったリアルな演奏サウンドを作り出すことができるのが最大の

                                                                                    AIによる楽器サウンド合成システム、Melisma(β)が爆誕。サンプリングでは不可能だったリアルさを実現|DTMステーション